Was ist die Speech Synthesis Markup Language (SSML)? Verwendung in Text-to-Speech-Software und Liste der wichtigsten Codes.

26. Januar 2026

Was ist die Speech Synthesis Markup Language (SSML)? Verwendung in Text-to-Speech-Software und Liste der wichtigsten Codes.

Hallo, vielen Dank, dass Sie Ondoku nutzen.

In diesem Artikel stellen wir Ihnen SSML vor.

Vielleicht erscheinen Ihnen einige Fachbegriffe anfangs etwas schwierig, aber wenn Sie wissen, wie man SSML verwendet, können Sie Ondoku noch effektiver nutzen.

Wir werden es leicht verständlich erklären, also schauen Sie es sich bitte an.

Was ist SSML?

SSML ist eine Sprach-Markup-Sprache (Speech Synthesis Markup Language).

Eine „Markup-Sprache“ ist eine Sprache, die wie HTML die Struktur (Rolle) für jeden Teil eines Textes definiert.

Durch das Schreiben von SSML-Code können Sie die Sprachausgabe von Ondoku komfortabler steuern.

Derzeit werden für alle Sprachen nur die folgenden zwei Arten von SSML-Codes unterstützt:

Andere Codes können je nach Sprache oder Stimmentyp eventuell nicht verwendet werden. Bitte haben Sie dafür Verständnis.

So verwenden Sie SSML in Ondoku

Die Verwendung von SSML in Ondoku ist sehr einfach.

Geben Sie den SSML-Code direkt in das Textfeld von Ondoku ein.

Dann wird SSML automatisch angewendet.

Sie können SSML verwenden, indem Sie einfach

am Anfang und Ende des Textes einfügen.

Vergessen Sie bitte nicht, diesen Code einzufügen! Ohne den -Code wird SSML nicht angewendet.

ist der notwendige Code, um SSML zu aktivieren.

Fügen Sie diesen Code unbedingt am Anfang und Ende des Textes ein, den Sie vorlesen lassen möchten.

Beispiel

Fügen Sie hier den Text ein, den Sie vorlesen lassen möchten

Der Break-Time-Code ist, wie der Name schon sagt, ein Code zum Erstellen von Pausen.

Geben Sie den Code dort ein, wo Sie eine Pause einfügen möchten, und ersetzen Sie den Teil „○○“ durch die gewünschte Zahl.

Wenn Sie Text in Ondoku normal vorlesen lassen, werden Pausen manchmal nicht genau so eingefügt, wie Sie es sich vorstellen.

In solchen Fällen ist dieser Code nützlich.

Zum Beispiel:

Geben wir diesen Code an der Stelle ein, an der eine Pause entstehen soll.


Ich möchte beim Vorlesen dieses Satzes eine kurze Pause machen

Sie werden sehen, dass an der Stelle, an der der Code eingefügt wurde, eine kurze Pause eingelegt wird, bevor das Vorlesen fortgesetzt wird.

※ 1000ms = 1 Sekunde

Indem Sie die Zahl vor „ms“ oder „s“ ändern, können Sie die Länge der „Pause“ ganz nach Belieben anpassen.

  • 200ms = 0,200 Sekunden
  • 500ms = 0,500 Sekunden
  • 1000ms = 1,000 Sekunde
  • 2000ms = 2,000 Sekunden
  • 3s = 3 Sekunden usw.

Hinweise zur Verwendung von

Das Verhalten beim Einfügen eines -Tags am Anfang des gesamten Textes variiert je nach Stimme, und die Funktion kann nicht garantiert werden.

Beispiel: Ich möchte am Anfang eine Pause von 5 Sekunden machen

↑ Eine solche Verwendung ist technisch nicht möglich.

Zudem liegt die Obergrenze für die Pausenlänge bei 10 Sekunden (10.000 ms, 10 s).

Wenn Sie eine längere Zeit einstellen, wird sie auf 10 Sekunden abgerundet.

タグの使い方については、こちらの記事でも解説しています。

〇〇

Dieses Tag wird verwendet, um bei der mehrsprachigen Sprachausgabe mit den Multilingual-Stimmen von Ondoku die Sprache für einzelne Textabschnitte festzulegen.

Es wird verwendet, wenn die Aussprache falsch ist oder wenn im Text viele Sprachen vorkommen und diese nicht automatisch unterschieden werden können.


„Guten Tag“ heißt auf Japanisch „Konnichiwa“, auf Englisch Hello,
auf Französisch Bonjour,
auf Deutsch Guten Tag,
und auf Chinesisch 你好.

Die Verwendung des -Tags wird in diesem Artikel ausführlich erklärt.

○○

Der Text im Teil „○○“ wird mit einem „Piep“-Ton (Zensurton) wiedergegeben.

Ein spielerischer Code. Die Zeichen in dem Teil, der von diesem Code umschlossen wird, werden durch einen Piep-Ton ersetzt.


Dieses Wort ist zensiert.

○○

Beim Vorlesen des Alphabets wird jedes Zeichen einzeln buchstabiert (Spelling-out).


The spelling of hello isHello

Bitte beachten Sie jedoch, dass dieser SSML-Code bei einigen Stimmen zu Fehlern führen kann. Verwendung auf eigene Verantwortung.

Japanisch: Nanami

Englisch (USA): en-US-A

○○

Ein Code, mit dem man die Aussprache (Lesehilfe) festlegen kann.

Bei der Sprachausgabe von Texten kann es manchmal zu unerwarteten Aussprachen kommen.

Wenn zum Beispiel das japanische Wort „一行“ als „ichiyuki“ ausgesprochen wird, kann man durch Angabe der Lesehilfe „ichigyou“ sicherstellen, dass es korrekt ausgesprochen wird.

Geben Sie im Code für „○○“ das Wort und für „◇◇“ die gewünschte Aussprache ein.


Nicht „ichiyuki“, sondern 一行 wird korrekt gelesen.

○○

Mit diesem Code können Sie die umschlossenen Wörter betont vorlesen lassen.


Mit diesem Code kann man Wörter betonen.

○○

Prosodie (prosody/Rhythmus) ist ein Oberbegriff für die akustischen Merkmale einer Sprache beim natürlichen Sprechen, wie zum Beispiel:

  • Tonhöhenverlauf
  • Sprechpausen
  • Länge und Betonung usw.

Mit diesem Code können Sie die folgenden drei Parameter anpassen:

  • rate (Geschwindigkeit)
    Anpassungscodes: „x-slow“, „slow“, „medium“, „fast“, „x-fast“, „default“
  • pitch (Tonhöhe)
    Anpassungscodes: „x-low“, „low“, „medium“, „high“, „x-high“, „default“
  • volume (Lautstärke)
    Anpassungscodes: „silent“, „x-soft“, „soft“, „medium“, „loud“, „x-loud“, „default“


Ich spreche schnell.
Ich spreche mit hoher Stimme.
Ich spreche laut.
Ich spreche langsam und mit tiefer Stimme.
Ich spreche schnell, mit hoher Stimme und in normaler Lautstärke.

Möchten Sie Ondoku durch die Nutzung von SSML noch komfortabler verwenden?

Wie Sie sehen, können Sie Ondoku durch den Einsatz von SSML noch effektiver nutzen!

Nutzen Sie die realistischen und gut verständlichen Stimmen von Ondoku für eine noch breitere Palette von Anwendungen wie Videoproduktionen oder Präsentationen.

■ KI-Sprachsynthesesoftware „Ondoku“

„Ondoku“ ist ein Online-Text-to-Speech-Tool, das ohne Anfangskosten genutzt werden kann.

  • Unterstützt etwa 50 Sprachen, darunter Japanisch, Englisch, Chinesisch, Koreanisch, Spanisch, Französisch und Deutsch.
  • Verfügbar sowohl vom PC als auch vom Smartphone
  • Geeignet für Business, Bildung, Unterhaltung usw.
  • Keine Installation erforderlich, kann sofort über Ihren Browser verwendet werden
  • Unterstützt auch das Auslesen von Bildern

Um es zu verwenden, geben Sie einfach Text ein oder laden Sie eine Datei von der Website hoch. Erstellen Sie in Sekundenschnelle natürliche Klangdateien. Sie können die Sprachsynthese für bis zu 5.000 Zeichen kostenlos nutzen, also probieren Sie es bitte zuerst aus.

Die Text-to-Speech-Software „Ondoku“ kann jeden Monat 5000 Zeichen mit KI-Stimme kostenlos vorlesen. Sie können MP3s problemlos herunterladen und auch eine kommerzielle Nutzung ist möglich. Wenn Sie sich kostenlos anmelden, können Sie bis zu 5.000 Zeichen pro Monat kostenlos von Text in Sprache umwandeln. Probieren Sie Ondoku jetzt aus.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Ähnlicher Artikel.

Text-zu-Sprache-Software Ondoku.Es ist eine kostenlose Text-to-Speech-Anwendung ohne Installation. Wenn Sie sich kostenlos registrieren, können Sie jeden Monat bis zu 5000 Zeichen kostenlos erhalten. Registrieren Sie sich jetzt kostenlos