Mi a Speech Synthesis Markup Language (SSML)? Hogyan lehet használni a szöveg-beszéd szoftverben és a fő kódok listájában.

2024. április 17.

Mi a Speech Synthesis Markup Language (SSML)? Hogyan lehet használni a szöveg-beszéd szoftverben és a fő kódok listájában.


Üdvözlet, üdvözlöm az Ondoku webhelyen.

Ma szeretnénk bemutatni az SSML-t.

Lehet, hogy nehéz, mivel vannak technikai kifejezések.

Ha azonban tudod, ez hatalmas különbséget fog gyakorolni az Ondoku használatában.

Kérjük, olvassa át ezt, mivel megpróbáljuk könnyebben megérteni.

Mi az SSML?

Mindenekelőtt az SSML a Speech Synthesis Markup Language kifejezést jelenti.

Hasonló a HTML-hez.

Az SSML kód írásával tovább irányíthatja az Ondoku beszédét.

Hogyan kell használni az SSML-t az Ondoku-val

Az OML-ban az SSML használata nagyon egyszerű.

Kérjük, közvetlenül írja be az SSML kódot az Ondoku szövegmezőbe.

Az SSML automatikusan alkalmazásra kerül.

Ügyeljen arra, hogy tartalmazza

<speak> </speak>

a kód elején és végén! A <speak> kód nélkül az SSML nem lesz alkalmazva.

<speak> </speak>

Mint korábban említettük, ez a kód az SSML aktiválásához.

Ne felejtse el ezt a kódot a beszédre konvertálni kívánt szöveg elejére és végére.

Példa

<speak> Írja ide a szövegről beszédre konvertálni kívánt szöveget </speak>

<break time = "○○ ms" />

Ahogy a neve is sugallja, a szünet időkód egy szünet elvégzésére szolgáló kód.

Írja be azt a kódot, ahová szüneteltetési időt szeretne beszúrni, és cserélje le a ○○ betűt a kívánt számra.

Az Ondoku által generált beszédben nincs szünet, hacsak nincs megadva.

Csinálhat némi szünetet zárójelekkel vagy írásjelekkel, de előfordulhat, hogy ezeket a szüneteket nem állítja be a kívánt módon.

Különösen akkor, ha 2 másodpercnél hosszabb szünetet igényel, ezt nehezebb irányítani.

Ha azonban belépsz

<szünet ideje = "1000 ms" />

arra a helyre, ahol szünetet szeretne tenni,

<beszéd>
Szeretnék némi szünetet <break time = "1000 ms" />, amikor ezt a mondatot elolvassa.
</speak>

hallani fog egy mondatot a mondat közepén.

* 1000 ms = 1 másodperc

A szünet hosszát az ms vagy s előtt szabadon módosíthatja.

200 ms = 0,200 másodperc
500 ms = 0,500 másodperc
1000 ms = 1,000 másodperc
2000 ms = 2 000 másodperc
3s = 3 másodperc
10 s = 10 másodperc stb.

<mondjuk-értelmezzük = = "kiváló"> ○○ </say-as>

Ezzel a kóddal a ○○ szövegben egy sípolás hallható a sípoló cenzúrához.

Ez egyfajta játékos kód. Az ennek a kódnak a mellékelt szöveget csipogó hang váltja fel.

<beszéd>
Ez a szó <mond-as interpret-as = "expletive"> korlátozott </say-as>
</speak>

<sub alias = "◇◇"> ○○ </sub>

Ez egy olyan kód, amely lehetővé teszi a kiejtés jelzését.

Időnként, amikor szövegről beszédre konvertálást használ, hallhat egy szót váratlanul beszélt módon.

Például megteheti a szoftvernek, hogy az "" "szót egy sorban" Ichigyo "-ként ejtse, míg a rendszer ezt" Ichiyuki "-ként ejtse.

A kód megadásához írja be az ○○ kandzsi és ◇◇ kiejtését.

<beszéd>
Helyesen ejtsd: <sub alias = "Ichigyo"> 一行 </sub> az Ichiyuki helyett
</speak>

<emphasis> ○○ </emphasis>

Hangsúlyozhatja a kódban szereplő szöveget a beszédben.

<beszéd>
Ez a kód <emphasis> hangsúlyozza a szöveget </emphasis>
</speak>

<prosody> ○○ </prosody>

A proszódia olyan nyelvi kifejezés, amely leírja a természetes beszélt angol nyelv szabályait, ideértve a

  • Intonálás (emelkedő és csökkenő hangmagasság)
  • A szünet helye
  • A hang és a stressz hossza stb.

Ezekkel a kódokkal módosíthatja a proszódiának a következő 3 elemét:

  • Sebesség (sebesség)
    Kód: "x-slow" "lassú" "közepes" "gyors" "x-gyors" "alapértelmezett"
  • Pitch (hangmagasság, magasság)
    Kód: "x-alacsony" "alacsony" "közepes" "magas" "x-magas" "alapértelmezett"
  • Hangerő (hangerő, méret)
    Kód: "csendes" "x-puha" "puha" "közepes" "hangos" "x-hangos" "alapértelmezett"

<beszéd>
<prosody rate = "fast"> Beszéljen gyorsan. </prosody>
<prosody pitch = "high"> Beszéljen magas hangon. </prosody>
<prosody volume = "hangos"> Beszéljen hangosan. </prosody>
<prosody rate = "slow" pitch = "x-low"> Beszéljen lassan és alacsony hangon. </prosody>
<prosody rate = "gyors" hangmagasság = "nagy" hangerő = "közepes"> Beszéljen gyorsan, magas hangon és normál hangerőn. </prosody>
</speak>

■ „Ondoku” mesterséges intelligencia beszédszintézis szoftver

Az "Ondoku" egy online szövegfelolvasó eszköz, amely kezdeti költség nélkül használható.

  • Körülbelül 50 nyelvet támogat, beleértve a japán, angol, kínai, koreai, spanyol, francia és német nyelvet.
  • Számítógépről és okostelefonról is elérhető
  • Alkalmas üzleti, oktatási, szórakozási stb.
  • Nincs szükség telepítésre, azonnal használható a böngészőből
  • A képekből való kiolvasást is támogatja

Használatához egyszerűen írjon be szöveget, vagy töltsön fel egy fájlt a webhelyről. Természetes hangfájlokat generál másodpercek alatt. A beszédszintézist 5000 karakter erejéig ingyenesen használhatja, ezért kérjük, először próbálja ki.

Az Ondoku szövegfelolvasó szoftver havonta 5000 karaktert tud kiolvasni mesterséges intelligencia hangjával ingyenesen. Könnyedén letölthet MP3-at, és kereskedelmi használatra is lehetőség nyílik. Ha ingyenesen regisztrál, havonta akár 5000 karaktert is ingyenesen konvertálhat szövegből beszéddé. Próbálja ki az Ondokut most.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Kapcsolódó cikk