Was ist die Speech Synthesis Markup Language (SSML)? Verwendung in Text-to-Speech-Software und Liste der wichtigsten Codes.
26. Januar 2026
Hallo, vielen Dank, dass Sie Ondoku nutzen.
In diesem Artikel stellen wir Ihnen SSML vor.
Vielleicht erscheinen Ihnen einige Fachbegriffe anfangs etwas schwierig, aber wenn Sie wissen, wie man SSML verwendet, können Sie Ondoku noch effektiver nutzen.
Wir werden es leicht verständlich erklären, also schauen Sie es sich bitte an.
Was ist SSML?
SSML ist eine Sprach-Markup-Sprache (Speech Synthesis Markup Language).
Eine „Markup-Sprache“ ist eine Sprache, die wie HTML die Struktur (Rolle) für jeden Teil eines Textes definiert.
Durch das Schreiben von SSML-Code können Sie die Sprachausgabe von Ondoku komfortabler steuern.
Derzeit werden für alle Sprachen nur die folgenden zwei Arten von SSML-Codes unterstützt:
Andere Codes können je nach Sprache oder Stimmentyp eventuell nicht verwendet werden. Bitte haben Sie dafür Verständnis.
So verwenden Sie SSML in Ondoku
Die Verwendung von SSML in Ondoku ist sehr einfach.
Geben Sie den SSML-Code direkt in das Textfeld von Ondoku ein.
Dann wird SSML automatisch angewendet.
Sie können SSML verwenden, indem Sie einfach
am Anfang und Ende des Textes einfügen.
Vergessen Sie bitte nicht, diesen Code einzufügen! Ohne den
Fügen Sie diesen Code unbedingt am Anfang und Ende des Textes ein, den Sie vorlesen lassen möchten.
Beispiel
Fügen Sie hier den Text ein, den Sie vorlesen lassen möchten
Der Break-Time-Code ist, wie der Name schon sagt, ein Code zum Erstellen von Pausen.
Geben Sie den Code dort ein, wo Sie eine Pause einfügen möchten, und ersetzen Sie den Teil „○○“ durch die gewünschte Zahl.
Wenn Sie Text in Ondoku normal vorlesen lassen, werden Pausen manchmal nicht genau so eingefügt, wie Sie es sich vorstellen.
In solchen Fällen ist dieser Code nützlich.
Zum Beispiel:
Geben wir diesen Code an der Stelle ein, an der eine Pause entstehen soll.
Ich möchte beim Vorlesen dieses Satzes eine kurze Pausemachen
Sie werden sehen, dass an der Stelle, an der der Code eingefügt wurde, eine kurze Pause eingelegt wird, bevor das Vorlesen fortgesetzt wird.
※ 1000ms = 1 Sekunde
Indem Sie die Zahl vor „ms“ oder „s“ ändern, können Sie die Länge der „Pause“ ganz nach Belieben anpassen.
- 200ms = 0,200 Sekunden
- 500ms = 0,500 Sekunden
- 1000ms = 1,000 Sekunde
- 2000ms = 2,000 Sekunden
- 3s = 3 Sekunden usw.
Hinweise zur Verwendung von
Das Verhalten beim Einfügen eines
Beispiel:
Ich möchte am Anfang eine Pause von 5 Sekunden machen
↑ Eine solche Verwendung ist technisch nicht möglich.
Zudem liegt die Obergrenze für die Pausenlänge bei 10 Sekunden (10.000 ms, 10 s).
Wenn Sie eine längere Zeit einstellen, wird sie auf 10 Sekunden abgerundet.
〇〇
Dieses Tag wird verwendet, um bei der mehrsprachigen Sprachausgabe mit den Multilingual-Stimmen von Ondoku die Sprache für einzelne Textabschnitte festzulegen.
Es wird verwendet, wenn die Aussprache falsch ist oder wenn im Text viele Sprachen vorkommen und diese nicht automatisch unterschieden werden können.
„Guten Tag“ heißt auf Japanisch „Konnichiwa“, auf EnglischHello ,
auf FranzösischBonjour ,
auf DeutschGuten Tag ,
und auf Chinesisch你好 .
Die Verwendung des
○○
Der Text im Teil „○○“ wird mit einem „Piep“-Ton (Zensurton) wiedergegeben.
Ein spielerischer Code. Die Zeichen in dem Teil, der von diesem Code umschlossen wird, werden durch einen Piep-Ton ersetzt.
Dieses Wort istzensiert .
○○
Beim Vorlesen des Alphabets wird jedes Zeichen einzeln buchstabiert (Spelling-out).
The spelling of hello isHello
Bitte beachten Sie jedoch, dass dieser SSML-Code bei einigen Stimmen zu Fehlern führen kann. Verwendung auf eigene Verantwortung.
Japanisch: Nanami
Englisch (USA): en-US-A
○○
Ein Code, mit dem man die Aussprache (Lesehilfe) festlegen kann.
Bei der Sprachausgabe von Texten kann es manchmal zu unerwarteten Aussprachen kommen.
Wenn zum Beispiel das japanische Wort „一行“ als „ichiyuki“ ausgesprochen wird, kann man durch Angabe der Lesehilfe „ichigyou“ sicherstellen, dass es korrekt ausgesprochen wird.
Geben Sie im Code für „○○“ das Wort und für „◇◇“ die gewünschte Aussprache ein.
Nicht „ichiyuki“, sondern 一行 wird korrekt gelesen.
○○
Mit diesem Code können Sie die umschlossenen Wörter betont vorlesen lassen.
Mit diesem Code kann man Wörterbetonen .
○○
Prosodie (prosody/Rhythmus) ist ein Oberbegriff für die akustischen Merkmale einer Sprache beim natürlichen Sprechen, wie zum Beispiel:
- Tonhöhenverlauf
- Sprechpausen
- Länge und Betonung usw.
Mit diesem Code können Sie die folgenden drei Parameter anpassen:
- rate (Geschwindigkeit)
Anpassungscodes: „x-slow“, „slow“, „medium“, „fast“, „x-fast“, „default“ - pitch (Tonhöhe)
Anpassungscodes: „x-low“, „low“, „medium“, „high“, „x-high“, „default“ - volume (Lautstärke)
Anpassungscodes: „silent“, „x-soft“, „soft“, „medium“, „loud“, „x-loud“, „default“
Ich spreche schnell.
Ich spreche mit hoher Stimme.
Ich spreche laut.
Ich spreche langsam und mit tiefer Stimme.
Ich spreche schnell, mit hoher Stimme und in normaler Lautstärke.
Möchten Sie Ondoku durch die Nutzung von SSML noch komfortabler verwenden?
Wie Sie sehen, können Sie Ondoku durch den Einsatz von SSML noch effektiver nutzen!
Nutzen Sie die realistischen und gut verständlichen Stimmen von Ondoku für eine noch breitere Palette von Anwendungen wie Videoproduktionen oder Präsentationen.
■ KI-Sprachsynthesesoftware „Ondoku“
„Ondoku“ ist ein Online-Text-to-Speech-Tool, das ohne Anfangskosten genutzt werden kann.
- Unterstützt etwa 50 Sprachen, darunter Japanisch, Englisch, Chinesisch, Koreanisch, Spanisch, Französisch und Deutsch.
- Verfügbar sowohl vom PC als auch vom Smartphone
- Geeignet für Business, Bildung, Unterhaltung usw.
- Keine Installation erforderlich, kann sofort über Ihren Browser verwendet werden
- Unterstützt auch das Auslesen von Bildern
Um es zu verwenden, geben Sie einfach Text ein oder laden Sie eine Datei von der Website hoch. Erstellen Sie in Sekundenschnelle natürliche Klangdateien. Sie können die Sprachsynthese für bis zu 5.000 Zeichen kostenlos nutzen, also probieren Sie es bitte zuerst aus.
Email: ondoku3.com@gmail.com
Text-zu-Sprache-Software Ondoku.Es ist eine kostenlose Text-to-Speech-Anwendung ohne Installation. Wenn Sie sich kostenlos registrieren, können Sie jeden Monat bis zu 5000 Zeichen kostenlos erhalten. Registrieren Sie sich jetzt kostenlos