Mi az a SSML (Speech Synthesis Markup Language)? Használata szövegfelolvasó szoftverekben és a főbb kódok listája.
2026. január 19.
Üdvözöljük, köszönjük, hogy folyamatosan az Ondoku szolgáltatását használja.
Ebben a cikkben az SSML-ről lesz szó.
Lehet, hogy némi szakkifejezés miatt bonyolultnak tűnik, de az SSML használatának ismeretével még kényelmesebben kihasználhatja az Ondoku lehetőségeit.
Mivel közérthetően magyarázzuk el, kérjük, tekintse meg.
Mi az az SSML?
Az SSML az egyik beszédjelölő nyelv (speech markup language).
A „jelölőnyelv” olyan nyelv, amely – a HTML-hez hasonlóan – meghatározza a szövegrészek szerkezetét (szerepét).
SSML-kódok írásával még praktikusabban vezérelheti az Ondoku beszédhangját.
Jelenleg az összes nyelv által támogatott SSML-kódok a következők:
Csak ez a két típusú kód érhető el. A többi kód a nyelvtől vagy a hang típusától függően nem használható. Kérjük, vegye ezt figyelembe.
Hogyan használjuk az SSML-t az Ondoku felületén?
Az SSML használata az Ondoku-ban nagyon egyszerű.
Kérjük, írja be az SSML-kódot közvetlenül az Ondoku szövegdobozába.
Ekkor az SSML automatikusan alkalmazásra kerül.
A mondat elejére és végére
beillesztésével már használhatja is az SSML-t.
Ne felejtse el beilleszteni ezt a kódot! Ha a
A
Mindenképpen illessze ezt a kódot a felolvasni kívánt szöveg elejére és végére.
Példa
Ide írja a felolvasni kívánt szöveget
A szünet (break time) kódja, ahogy a neve is sugallja, a szünetek létrehozására szolgáló kód.
Írja be a kódot oda, ahol szünetet szeretne tartani, és cserélje ki a ○○ részt a kívánt számra.
Amikor az Ondoku-val normál módon olvastat fel, előfordulhat, hogy a szünetek nem úgy alakulnak, ahogy szeretné.
Ilyenkor hasznos ez a kód.
Például,
illesszük be a következő kódot oda, ahol szünetet szeretnénk hagyni.
Szeretnék egy kisszünetet tartani a mondat felolvasásakor.
Látható, hogy a kód beillesztésének helyén a hang vesz egy lélegzetet, majd folytatja a felolvasást.
※ 1000ms=1 másodperc
Az ms vagy s előtti szám megváltoztatásával tetszés szerint módosíthatja a „szünet” hosszát.
- 200ms = 0.200 másodperc
- 500ms = 0.500 másodperc
- 1000ms = 1.000 másodperc
- 2000ms = 2.000 másodperc
- 3s = 3 másodperc stb.
Fontos tudnivalók a használatáról
Ha a
Példa:
5 másodperces szünetet szeretnék tartani az elején
↑ Ez a fajta használat a specifikációk miatt nem lehetséges.
Ezenkívül a szünet maximális hossza 10 másodperc (10000ms, 10s).
Ennél hosszabb idő beállítása esetén az érték 10 másodpercre lesz kerekítve.
A
〇〇
Ez a tag arra szolgál, hogy megadja a nyelvet az egyes szövegrészekhez, amikor az Ondoku többnyelvű (Multilingual) hangját használja.
Akkor használandó, ha a kiejtés hibás, vagy ha a szövegben sok nyelv szerepel, és azokat nem lehet automatikusan felismerni.
A japán 'konnichiwa' angolulHello ,
franciáulBonjour ,
németülGuten Tag ,
kínaiul你好 .
A
○○
A ○○ részben lévő szöveget egy „bíp” hanggal, cenzúrázott (síp) hangként játssza le.
Ez egy kis játékosságot vivő kód. A kóddal körülvett szöveg sípoló hangra cserélődik.
Ez a szócenzúrázott .
○○
Az ábécé betűinek felolvasásakor betűzi azokat (egyesével olvassa fel a karaktereket).
The spelling of hello isHello
Azonban bizonyos hangoknál ez az SSML hibát okozhat. Kérjük, vegye ezt figyelembe a használatkor.
Japán: Nanami
Angol (USA): en-US-A
○○
Ez a kód lehetővé teszi a fonetikus olvasat megadását.
A szövegfelolvasás során néha váratlan kiejtések fordulhatnak elő.
Például, ha a „一行” szót hibásan ejtené ki, az olvasat megadásával biztosíthatja a helyes kiejtést.
A kódban a ○○ helyére írja a karaktert, a ◇◇ helyére pedig az olvasatot.
Helyesen olvassa: 一行.
○○
A kóddal körülvett szöveget hangsúlyosan lehet felolvastatni.
Ezzel a kóddalhangsúlyozni lehet.
○○
A prozódia (ritmus és dallam) a természetes beszéd során jelentkező:
- hangmagasság változása
- szünetek helye
- hosszúság, hangerő stb.
nyelvi jellemzők összefoglaló neve.
Ezzel a kóddal a következőket lehet beállítani:
- rate (sebesség)
Beállító kódok: „x-slow”, „slow”, „medium”, „fast”, „x-fast”, „default” - pitch (hangmagasság)
Beállító kódok: „x-low”, „low”, „medium”, „high”, „x-high”, „default” - volume (hangerő)
Beállító kódok: „silent”, „x-soft”, „soft”, „medium”, „loud”, „x-loud”, „default”
Ezt a három típust lehet szabályozni.
Gyorsan beszélek.
Magas hangon beszélek.
Hangosan beszélek.
Lassan és mély hangon beszélek.
Gyorsan, magas hangon és közepes hangerővel beszélek.
Szeretné kihasználni az SSML előnyeit az Ondoku még kényelmesebb használatához?
Ahogy látható, az SSML használatával még praktikusabbá teheti az Ondoku-t!
Szeretné még szélesebb körben használni az Ondoku élethű és jól érthető hangját videókészítéshez, prezentációkhoz vagy más célokra?
■ „Ondoku” mesterséges intelligencia beszédszintézis szoftver
Az "Ondoku" egy online szövegfelolvasó eszköz, amely kezdeti költség nélkül használható.
- Körülbelül 50 nyelvet támogat, beleértve a japán, angol, kínai, koreai, spanyol, francia és német nyelvet.
- Számítógépről és okostelefonról is elérhető
- Alkalmas üzleti, oktatási, szórakozási stb.
- Nincs szükség telepítésre, azonnal használható a böngészőből
- A képekből való kiolvasást is támogatja
Használatához egyszerűen írjon be szöveget, vagy töltsön fel egy fájlt a webhelyről. Természetes hangfájlokat generál másodpercek alatt. A beszédszintézist 5000 karakter erejéig ingyenesen használhatja, ezért kérjük, először próbálja ki.
Email: ondoku3.com@gmail.com
Szövegolvasó szoftver Ondoku. Ez egy szöveg-beszéd szolgáltatás, amely nem igényel telepítést, és bárki ingyenesen felhasználhatja. Ha ingyenesen regisztrál, havonta legfeljebb 5000 karaktert kaphat ingyen. Regisztráljon most ingyen