Hvad er talesyntesemarkup-sprog (SSML)? Sådan bruges det i tekst-til-tale-software og listen over hovedkoder.

17. april 2024

Hvad er talesyntesemarkup-sprog (SSML)? Sådan bruges det i tekst-til-tale-software og listen over hovedkoder.


Hej, velkommen til Ondoku websted.

I dag vil vi gerne introducere SSML.

Du kan have det vanskeligt, da der er nogle tekniske termer.

Men hvis du ved det, vil det gøre en enorm forskel i den måde, du bruger Ondoku på.

Læs det igennem, mens vi prøver at gøre det let at forstå.

Hvad er SSML?

Først og fremmest står SSML for Speech Synthesis Markup Language.

Det ligner HTML.

Ved at skrive denne SSML-kode kan du kontrollere Ondokus tale yderligere.

Sådan bruges SSML med Ondoku

Det er meget let at bruge SSML i Ondoku.

Indtast SSML-koden direkte i Ondoku-tekstfeltet.

SSML anvendes automatisk.

Sørg for at medtage

<Tale> </ speak>

i begyndelsen og slutningen af koden! Uden koden <tale> vil SSML ikke blive anvendt.

<Tale> </ speak>

Som nævnt tidligere er dette koden til at aktivere SSML.

Sørg for at medtage denne kode i begyndelsen og slutningen af den tekst, du vil konvertere til tale.

Eksempel

<tale> Indtast teksten, du vil konvertere fra tekst til tale her </speak>

<break time = "○○ ms" />

Som navnet antyder er pausetidskoden en kode til oprettelse af en pause.

Indtast koden, hvor du vil indsætte en pausetid, og erstatt ○○ med det nummer, du kan lide.

Den tale, der genereres af Ondoku, vil ikke have "pause", medmindre det er angivet.

Du kan lave noget pausetid med parenteser eller punktuationer, men disse pauser indstilles muligvis ikke, som du vil.

Især hvis du har brug for pausetid på mere end 2 sekunder, vil det være vanskeligere at kontrollere.

Men hvis du indtaster

<break time = "1000ms" />

til det sted, hvor du vil sætte en pause,

<Tale>
Jeg vil have noget pausetid <break time = "1000ms" /> når jeg læser denne sætning.
</ Speak>

du vil høre noget brud midt i sætningen.

* 1000 ms = 1 sekund

Du kan ændre antallet inden ms eller s frit for at kontrollere pausens længde.

200ms = 0,200 sekunder
500ms = 0,500 sekunder
1000 ms = 1.000 sekunder
2000ms = 2.000 sekunder
3s = 3 sekunder
10s = 10 sekunder osv.

<say-as interpret-as = "expletive"> ○○ </say-as>

Med denne kode spilles teksten i ○○ med en bip-lyd til bip-censur.

Det er en slags legende kode. Teksten vedlagt i denne kode erstattes med biplyd.

<Tale>
Dette ord er <say-as interpret-as = "expletive"> begrænset </say-as>
</ Speak>

<sub alias = "◇◇"> ○○ </sub>

Det er en kode, der giver dig mulighed for at indikere udtale.

Undertiden når du bruger tekst til tale-konvertering, kan du høre et ord talt på en uventet måde.

For eksempel kan du få softwaren til at udtale ordet "一行," en linje som "Ichigyo", mens systemet udtaler det som "Ichiyuki".

For koden skal du indtaste kanji for ○○ og udtalen for ◇◇.

<Tale>
Udtal korrekt som <sub alias = "Ichigyo"> 一行 </sub> i stedet for Ichiyuki
</ Speak>

<Emphasis> ○○ </ emphasis>

Du kan fremhæve teksten vedlagt i koden i talen.

<Tale>
Denne kode vil understrege tekst </emphasis>
</ Speak>

<Prosodi> ○○ </ prosodi>

Prosody er et sprogligt udtryk, der beskriver reglerne for naturligt talt engelsk, herunder

  • Intonation (stigende og faldende tonehøjde)
  • Pausens placering
  • Længde på lyd og stress osv.

Med disse koder kan du justere følgende 3 elementer af prosody:

  • Rate (rate, speed)
    Kode: "x-langsom" "langsom" "medium" "hurtig" "x-hurtig" "standard"
  • Pitch (tonehøjde, højde)
    Kode: "x-lav" "lav" "mellem" "høj" "x-høj" "standard"
  • Volumen (lydstyrke, størrelse)
    Kode: "lydløs" "x-blød" "blød" "mellem" "høj" "x-høj" "standard"

<Tale>
<prosody rate = "fast"> Tal hurtigt. </ Prosody>
<prosody pitch = "high"> Tal med en høj tonehøjde. </ Prosody>
<prosody volume = "loud"> Tal højt. </ Prosody>
<prosody rate = "slow" pitch = "x-low"> Tal langsomt og med en lav tonehøjde. </ Prosody>
<prosody rate = "fast" pitch = "high" volume = "medium"> Tal hurtigt, i en høj tonehøjde og i normal lydstyrke. </ Prosody>
</ Speak>

Tekst-til-tale-software "Ondoku" kan læse 5000 tegn hver måned med AI-stemme gratis. Du kan nemt downloade MP3'er og kommerciel brug er også mulig. Hvis du tilmelder dig gratis, kan du konvertere op til 5.000 tegn om måneden gratis fra tekst til tale. Prøv Ondoku nu.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Relateret artikel