Mi a Speech Synthesis Markup Language (SSML)? Hogyan lehet használni a szöveg-beszéd szoftverben és a fő kódok listájában.
2024. április 17.
Üdvözlet, üdvözlöm az Ondoku webhelyen.
Ma szeretnénk bemutatni az SSML-t.
Lehet, hogy nehéz, mivel vannak technikai kifejezések.
Ha azonban tudod, ez hatalmas különbséget fog gyakorolni az Ondoku használatában.
Kérjük, olvassa át ezt, mivel megpróbáljuk könnyebben megérteni.
Mi az SSML?
Mindenekelőtt az SSML a Speech Synthesis Markup Language kifejezést jelenti.
Hasonló a HTML-hez.
Az SSML kód írásával tovább irányíthatja az Ondoku beszédét.
Hogyan kell használni az SSML-t az Ondoku-val
Az OML-ban az SSML használata nagyon egyszerű.
Kérjük, közvetlenül írja be az SSML kódot az Ondoku szövegmezőbe.
Az SSML automatikusan alkalmazásra kerül.
Ügyeljen arra, hogy tartalmazza
<speak> </speak>
a kód elején és végén! A <speak> kód nélkül az SSML nem lesz alkalmazva.
<speak> </speak>
Mint korábban említettük, ez a kód az SSML aktiválásához.
Ne felejtse el ezt a kódot a beszédre konvertálni kívánt szöveg elejére és végére.
Példa
<speak> Írja ide a szövegről beszédre konvertálni kívánt szöveget </speak>
<break time = "○○ ms" />
Ahogy a neve is sugallja, a szünet időkód egy szünet elvégzésére szolgáló kód.
Írja be azt a kódot, ahová szüneteltetési időt szeretne beszúrni, és cserélje le a ○○ betűt a kívánt számra.
Az Ondoku által generált beszédben nincs szünet, hacsak nincs megadva.
Csinálhat némi szünetet zárójelekkel vagy írásjelekkel, de előfordulhat, hogy ezeket a szüneteket nem állítja be a kívánt módon.
Különösen akkor, ha 2 másodpercnél hosszabb szünetet igényel, ezt nehezebb irányítani.
Ha azonban belépsz
<szünet ideje = "1000 ms" />
arra a helyre, ahol szünetet szeretne tenni,
<beszéd>
Szeretnék némi szünetet <break time = "1000 ms" />, amikor ezt a mondatot elolvassa.
</speak>
hallani fog egy mondatot a mondat közepén.
* 1000 ms = 1 másodperc
A szünet hosszát az ms vagy s előtt szabadon módosíthatja.
200 ms = 0,200 másodperc
500 ms = 0,500 másodperc
1000 ms = 1,000 másodperc
2000 ms = 2 000 másodperc
3s = 3 másodperc
10 s = 10 másodperc stb.
<mondjuk-értelmezzük = = "kiváló"> ○○ </say-as>
Ezzel a kóddal a ○○ szövegben egy sípolás hallható a sípoló cenzúrához.
Ez egyfajta játékos kód. Az ennek a kódnak a mellékelt szöveget csipogó hang váltja fel.
<beszéd>
Ez a szó <mond-as interpret-as = "expletive"> korlátozott </say-as>
</speak>
<sub alias = "◇◇"> ○○ </sub>
Ez egy olyan kód, amely lehetővé teszi a kiejtés jelzését.
Időnként, amikor szövegről beszédre konvertálást használ, hallhat egy szót váratlanul beszélt módon.
Például megteheti a szoftvernek, hogy az "" "szót egy sorban" Ichigyo "-ként ejtse, míg a rendszer ezt" Ichiyuki "-ként ejtse.
A kód megadásához írja be az ○○ kandzsi és ◇◇ kiejtését.
<beszéd>
Helyesen ejtsd: <sub alias = "Ichigyo"> 一行 </sub> az Ichiyuki helyett
</speak>
<emphasis> ○○ </emphasis>
Hangsúlyozhatja a kódban szereplő szöveget a beszédben.
<beszéd>
Ez a kód <emphasis> hangsúlyozza a szöveget </emphasis>
</speak>
<prosody> ○○ </prosody>
A proszódia olyan nyelvi kifejezés, amely leírja a természetes beszélt angol nyelv szabályait, ideértve a
- Intonálás (emelkedő és csökkenő hangmagasság)
- A szünet helye
- A hang és a stressz hossza stb.
Ezekkel a kódokkal módosíthatja a proszódiának a következő 3 elemét:
- Sebesség (sebesség)
Kód: "x-slow" "lassú" "közepes" "gyors" "x-gyors" "alapértelmezett" - Pitch (hangmagasság, magasság)
Kód: "x-alacsony" "alacsony" "közepes" "magas" "x-magas" "alapértelmezett" - Hangerő (hangerő, méret)
Kód: "csendes" "x-puha" "puha" "közepes" "hangos" "x-hangos" "alapértelmezett"
<beszéd>
<prosody rate = "fast"> Beszéljen gyorsan. </prosody>
<prosody pitch = "high"> Beszéljen magas hangon. </prosody>
<prosody volume = "hangos"> Beszéljen hangosan. </prosody>
<prosody rate = "slow" pitch = "x-low"> Beszéljen lassan és alacsony hangon. </prosody>
<prosody rate = "gyors" hangmagasság = "nagy" hangerő = "közepes"> Beszéljen gyorsan, magas hangon és normál hangerőn. </prosody>
</speak>
■ „Ondoku” mesterséges intelligencia beszédszintézis szoftver
Az "Ondoku" egy online szövegfelolvasó eszköz, amely kezdeti költség nélkül használható.
- Körülbelül 50 nyelvet támogat, beleértve a japán, angol, kínai, koreai, spanyol, francia és német nyelvet.
- Számítógépről és okostelefonról is elérhető
- Alkalmas üzleti, oktatási, szórakozási stb.
- Nincs szükség telepítésre, azonnal használható a böngészőből
- A képekből való kiolvasást is támogatja
Használatához egyszerűen írjon be szöveget, vagy töltsön fel egy fájlt a webhelyről. Természetes hangfájlokat generál másodpercek alatt. A beszédszintézist 5000 karakter erejéig ingyenesen használhatja, ezért kérjük, először próbálja ki.
Email: ondoku3.com@gmail.com
Szövegolvasó szoftver Ondoku. Ez egy szöveg-beszéd szolgáltatás, amely nem igényel telepítést, és bárki ingyenesen felhasználhatja. Ha ingyenesen regisztrál, havonta legfeljebb 5000 karaktert kaphat ingyen. Regisztráljon most ingyen