Wat is Speech Synthesis Markup Language (SSML)? Hoe het te gebruiken in tekst-naar-spraak-software en de lijst met belangrijke code.

17 april 2024

Wat is Speech Synthesis Markup Language (SSML)? Hoe het te gebruiken in tekst-naar-spraak-software en de lijst met belangrijke code.


Hallo, welkom op de Ondoku-website.

Vandaag willen we SSML introduceren.

U vindt het misschien moeilijk omdat er enkele technische termen zijn.

Als je het echter weet, zal het een enorm verschil maken in de manier waarop je Ondoku gebruikt.

Lees het alstublieft door, want we proberen het gemakkelijk te begrijpen.

Wat is SSML?

Allereerst staat SSML voor Speech Synthesis Markup Language.

Het is vergelijkbaar met HTML.

Door deze SSML-code te schrijven, kunt u de spraak van Ondoku verder besturen.

SSML gebruiken met Ondoku

Het is heel gemakkelijk om SSML te gebruiken in Ondoku.

Voer de SSML-code rechtstreeks in het tekstvak Ondoku in.

De SSML wordt automatisch toegepast.

Zorg ervoor dat u

<speak> </speak>

aan het begin en aan het einde van de code! Zonder de code <speak> wordt SSML niet toegepast.

<speak> </speak>

Zoals eerder vermeld, is dit de code om SSML te activeren.

Zorg ervoor dat u deze code toevoegt aan het begin en einde van de tekst die u naar spraak wilt converteren.

Voorbeeld

<speak> Voer hier de tekst in die u van tekst naar spraak wilt converteren </speak>

<break time = "○○ ms" />

Zoals de naam al aangeeft, is de pauzetijdcode een code om een pauze in te lassen.

Voer de code in waar u een pauzetijd wilt invoegen en vervang de ○○ door het nummer dat u leuk vindt.

De spraak die door Ondoku wordt gegenereerd, heeft geen "pauze" tenzij gespecificeerd.

U kunt een pauze inlassen tussen haakjes of leestekens, maar deze pauzes zijn mogelijk niet naar wens ingesteld.

Vooral als u een pauze van meer dan 2 seconden nodig heeft, zal deze moeilijker te controleren zijn.

Als u echter binnenkomt

<break time = "1000ms" />

naar de plek waar je een pauze wilt inlassen,

<spreken>
Ik wil wat pauze <break time = "1000ms" /> wanneer ik deze zin lees.
</speak>

je hoort een pauze in het midden van de zin.

* 1000 ms = 1 seconde

U kunt het nummer vóór ms of s vrij wijzigen om de lengte van de pauze te regelen.

200ms = 0.200 seconden
500ms = 0,500 seconden
1000ms = 1.000 seconden
2000ms = 2.000 seconden
3s = 3 seconden
10s = 10 seconden etc.

<say-as interpret-as = "expletive"> ○○ </say-as>

Met deze code wordt de tekst in de ○○ afgespeeld met een pieptoon voor piepcensor.

Het is een soort speelse code. De tekst in deze code wordt vervangen door een piepgeluid.

<spreken>
Dit woord is <say-as interpret-as = "expletive"> beperkt </say-as>
</speak>

<sub alias = "◇◇"> ○○ </sub>

Het is een code waarmee je de uitspraak kunt aangeven.

Als u tekst-naar-spraak-conversie gebruikt, hoort u soms een woord op een onverwachte manier uitgesproken.

U kunt de software bijvoorbeeld het woord "一行", één regel, laten uitspreken als "Ichigyo", terwijl het systeem het uitspreekt als "Ichiyuki".

Voer voor de code de kanji in voor ○○ en de uitspraak voor ◇◇.

<spreken>
Spreek correct uit als <sub alias = "Ichigyo"> 一行 </sub> in plaats van Ichiyuki
</speak>

<emphasis> ○○ </emphasis>

U kunt de tekst in de code in de toespraak benadrukken.

<spreken>
Deze code <emphasis> benadrukt tekst </emphasis>
</speak>

<prosody> ○○ </prosody>

Prosody is een taalkundige term die de regels van natuurlijk gesproken Engels beschrijft, inclusief

  • Intonatie (stijgende en dalende toonhoogte)
  • Positie van pauze
  • Lengte van geluid en spanning, etc.

Met deze codes kun je de volgende 3 elementen van prosodie aanpassen:

  • Tarief (tarief, snelheid)
    Code: "x-slow" "slow" "medium" "fast" "x-fast" "default"
  • Kampeerplaats (toonhoogte, hoogte)
    Code: "x-low" "low" "medium" "high" "x-high" "standaard"
  • Volume (volume, grootte)
    Code: "stil" "x-soft" "zacht" "gemiddeld" "luid" "x-luid" "standaard"

<spreken>
<prosody rate = "fast"> Spreek snel. </prosody>
<prosody pitch = "high"> Spreek op hoge toon. </prosody>
<prosody volume = "loud"> Spreek luid. </prosody>
<prosody rate = "slow" pitch = "x-low"> Spreek langzaam en met een lage stem. </prosody>
<prosody rate = "fast" pitch = "high" volume = "medium"> Spreek snel, met hoge stem en met normaal volume. </prosody>
</speak>

Tekst-naar-spraaksoftware "Ondoku" kan elke maand 5000 tekens gratis voorlezen met AI-stem. MP3's kun je eenvoudig downloaden en commercieel gebruik is ook mogelijk. Als u zich gratis aanmeldt, kunt u maandelijks maximaal 5.000 tekens gratis omzetten van tekst naar spraak. Probeer Ondoku nu.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Gerelateerd artikel