Hva er talesyntese-markeringsspråk (SSML)? Hvordan bruke den i tekst-til-tale-programvare og listen over hovedkoder.

17. april 2024

Hva er talesyntese-markeringsspråk (SSML)? Hvordan bruke den i tekst-til-tale-programvare og listen over hovedkoder.


Hei, velkommen til Ondoku nettsted.

I dag ønsker vi å introdusere SSML.

Du kan synes det er vanskelig siden det er noen tekniske termer.

Hvis du vet det, vil det imidlertid utgjøre en enorm forskjell i måten du bruker Ondoku på.

Les den gjennom mens vi prøver å gjøre det enkelt å forstå.

Hva er SSML?

Først av alt står SSML for Speech Synthesis Markup Language.

Det ligner på HTML.

Ved å skrive denne SSML-koden kan du kontrollere Ondokus tale ytterligere.

Hvordan bruke SSML med Ondoku

Det er veldig enkelt å bruke SSML i Ondoku.

Skriv inn SSML-koden direkte i Ondoku-tekstboksen.

SSML blir brukt automatisk.

Sørg for å ta med

<tale> </speak>

i begynnelsen og på slutten av koden! Uten koden <tale> vil ikke SSML bli brukt.

<tale> </speak>

Som nevnt tidligere, er dette koden for å aktivere SSML.

Sørg for å ta med denne koden i begynnelsen og slutten av teksten du vil konvertere til tale.

Eksempel

<tale> Skriv inn teksten du vil konvertere fra tekst til tale her </speak>

<break time = "○○ ms" />

Som navnet tilsier er bruddtidskoden en kode for å lage en pause.

Skriv inn koden der du vil sette inn en pausetid, og erstatt ○○ med nummeret du liker.

Talen generert av Ondoku vil ikke ha "pause" med mindre det er spesifisert.

Du kan lage litt pausetid med parenteser eller tegnsettinger, men disse pausene er kanskje ikke angitt som du vil.

Spesielt hvis du trenger bruddtid på mer enn 2 sekunder, vil det være vanskeligere å kontrollere.

Imidlertid, hvis du går inn

<break time = "1000ms" />

til stedet der du vil sette en pause,

<tale>
Jeg vil ha litt pausetid <break time = "1000ms" /> når jeg leser denne setningen.
</speak>

du vil høre noe brudd midt i setningen.

* 1000 ms = 1 sekund

Du kan endre nummeret før ms eller s fritt for å kontrollere lengden på pausen.

200ms = 0,200 sekunder
500ms = 0,500 sekunder
1000 ms = 1.000 sekunder
2000 ms = 2.000 sekunder
3s = 3 sekunder
10s = 10 sekunder osv.

<say-as interpret-as = "expletive"> ○○ </say-as>

Med denne koden blir teksten i ○○ spilt med en pipelyd for pipesensur.

Det er en slags leken kode. Teksten vedlagt i denne koden vil erstattes med pipelyd.

<tale>
Dette ordet er <say-as interpret-as = "expletive"> begrenset </say-as>
</speak>

<sub alias = "◇◇"> ○○ </sub>

Det er en kode som lar deg indikere uttale.

Noen ganger når du bruker tekst-til-tale-konvertering, kan du høre et ord som blir talt på en uventet måte.

For eksempel kan du få programvaren til å uttale ordet "一行", en linje, som "Ichigyo", mens systemet uttaler det som "Ichiyuki".

For koden angir du kanji for ○○ og uttalen for ◇◇.

<tale>
Riktig uttale som <sub alias = "Ichigyo"> 一行 </sub> i stedet for Ichiyuki
</speak>

<vekt> ○○ </emphasis>

Du kan legge vekt på teksten vedlagt i koden i talen.

<tale>
Denne koden vil <understreke> understreke tekst </emphasis>
</speak>

<prosody> ○○ </prosody>

Prosody er et språklig begrep som beskriver reglene for naturlig muntlig engelsk, inkludert

  • Intonasjon (stigende og fallende stigning)
  • Posisjonens plassering
  • Lengde på lyd og stress osv.

Med disse kodene kan du justere følgende tre elementer av prosody:

  • Rate (rate, speed)
    Kode: "x-sakte" "sakte" "middels" "rask" "x-rask" "standard"
  • Pitch (tonehøyde, høyde)
    Kode: "x-lav" "lav" "middels" "høy" "x-høy" "standard"
  • Volum (volum, størrelse)
    Kode: "stille" "x-myk" "myk" "middels" "høyt" "x-høy" "standard"

<tale>
<prosody rate = "fast"> Snakk raskt. </prosody>
<prosody pitch = "high"> Snakk med høy stemme. </prosody>
<prosody volume = "loud"> Snakk høyt. </prosody>
<prosody rate = "slow" pitch = "x-low"> Snakk sakte og med en lav tonehøyde. </prosody>
<prosody rate = "fast" pitch = "high" volume = "medium"> Snakk raskt, med høy tonehøyde og i normalt volum. </prosody>
</speak>

Tekst-til-tale-programvaren "Ondoku" kan lese opp 5000 tegn hver måned med AI-stemme gratis. Du kan enkelt laste ned MP3-er og kommersiell bruk er også mulig. Hvis du registrerer deg gratis, kan du konvertere opptil 5000 tegn per måned gratis fra tekst til tale. Prøv Ondoku nå.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Relatert artikkel