Co je jazyk pro syntézu řeči (SSML)? Jak je používat v softwaru převodu textu na řeč a seznamu hlavních kódů.

17. dubna 2024

Co je jazyk pro syntézu řeči (SSML)? Jak je používat v softwaru převodu textu na řeč a seznamu hlavních kódů.


Dobrý den, vítejte na webových stránkách Ondoku.

Dnes bychom rádi představili SSML.

Může to být obtížné, protože existují určité technické termíny.

Pokud to však víte, bude to ve způsobu, jakým používáte Ondoku, obrovský rozdíl.

Přečtěte si to, když se snažíme, aby bylo snadné porozumět.

Co je SSML?

Zaprvé, SSML je zkratka pro značkovací jazyk pro syntézu řeči.

Je to podobné HTML.

Napsáním tohoto kódu SSML můžete dále ovládat řeč Ondoku.

Jak používat SSML s Ondoku

Je velmi snadné používat SSML v Ondoku.

Do textového pole Ondoku zadejte přímo kód SSML.

SSML se použije automaticky.

Nezapomeňte zahrnout

<speak> </speak>

na začátku a na konci kódu! Bez kódu <speak> nebude SSML použit.

<speak> </speak>

Jak bylo uvedeno výše, jedná se o kód pro aktivaci SSML.

Nezapomeňte zahrnout tento kód na začátek a na konec textu, který chcete převést na řeč.

Příklad

<speak> Sem zadejte text, který chcete převést z textu na řeč </speak>

<doba přestávky = "○○ ms" />

Jak název napovídá, kód doby přestávky je kód pro provedení pauzy.

Zadejte kód, do kterého chcete vložit čas přerušení, a nahraďte ○○ číslem, které se vám líbí.

Řeč generovaný Ondoku nebude mít "pauzu", pokud není uvedeno.

S hranatými závorkami nebo interpunkcemi si můžete udělat přestávku, ale tyto pauzy nemusí být nastaveny tak, jak chcete.

Zejména pokud potřebujete dobu přestávky delší než 2 sekundy, bude obtížnější jej ovládat.

Pokud však zadáte

<doba přestávky = "1000 ms" />

na místo, kam chcete dát pauzu,

<speak>
Chci nějaký čas na přestávku <čas na přestávku = "1000 ms" /> při čtení této věty.
</speak>

uprostřed věty uslyšíte přestávku.

* 1 000 ms = 1 sekunda

Můžete změnit číslo před ms nebo s volně, abyste mohli řídit délku pauzy.

200ms = 0,200 sekund
500ms = 0,500 sekund
1 000 ms = 1 000 sekund
2000ms = 2 000 sekund
3s = 3 sekundy
10 s = 10 sekund atd.

<say-as interpret-as = "expletive"> ○○ </say-as>

S tímto kódem bude text v ○○ přehráván se zvukovým signálem pro cenzor pípání.

Je to druh hravého kódu. Text uvedený v tomto kódu bude nahrazen zvukovým signálem.

<speak>
Toto slovo je omezeno <say-as interpret-as = "expletive"> </say-as>
</speak>

<sub alias = "◇◇"> ○○ </sub>

Je to kód, který vám umožní označit výslovnost.

Někdy, když používáte převod z převodu textu na řeč, můžete slyšet slovo mluvené neočekávaným způsobem.

Například můžete nastavit, aby software vyslovil slovo „一行“, jeden řádek, jako „Ichigyo“, zatímco systém jej vysloví jako „Ichiyuki“.

Jako kód zadejte kanji pro ○○ a výslovnost pro ◇◇.

<speak>
Správně vyslovte jako <sub alias = "Ichigyo"> 一行 </sub> místo Ichiyuki
</speak>

<emphasis> ○○ </emphasis>

Můžete zdůraznit text uzavřený v kódu v řeči.

<speak>
Tento kód bude zdůrazňovat text </emphasis>
</speak>

<prosody> ○○ </prosody>

Prosody je lingvistický termín, který popisuje pravidla přirozené mluvené angličtiny, včetně

  • Intonace (stoupající a klesající hřiště)
  • Pozice pauzy
  • Délka zvuku a stresu atd.

Pomocí těchto kódů můžete upravit následující 3 prvky prozodie:

  • Míra (rychlost, rychlost)
    Kód: "x-slow" "slow" "medium" "fast" "x-fast" "default"
  • Výška (výška, výška)
    Kód: "x-low" "low" "medium" "high" "x-high" "default"
  • Objem (objem, velikost)
    Kód: "tichý" "x-měkký" "měkký" "střední" "hlasitý" "x-hlasitý" "výchozí"

<speak>
<prosody rate = "fast"> Mluvte rychle. </prosody>
<prosody pitch = "high"> Mluvte vysokým hlasem. </prosody>
<prosody volume = "hlasitě"> Mluvte nahlas. </prosody>
<prosody rate = "slow" pitch = "x-low"> Mluvte pomalu a nízkým tónem. </prosody>
<prosody rate = "fast" pitch = "high" volume = "medium"> Mluvte rychle, vysokým hlasem a v normální hlasitosti. </prosody>
</speak>

■ Software pro syntézu řeči AI „Ondoku“

„Ondoku“ je online nástroj pro převod textu na řeč, který lze používat bez počátečních nákladů.

  • Podporuje přibližně 50 jazyků včetně japonštiny, angličtiny, čínštiny, korejštiny, španělštiny, francouzštiny a němčiny.
  • Dostupné z PC i smartphonu
  • Vhodné pro podnikání, vzdělávání, zábavu atd.
  • Není nutná žádná instalace, lze jej použít okamžitě z vašeho prohlížeče
  • Podporuje také čtení z obrázků

Chcete-li jej použít, jednoduše zadejte text nebo nahrajte soubor z webu. Vytvářejte přirozené zvukové soubory během několika sekund. Syntézu řeči můžete použít zdarma až pro 5 000 znaků, proto ji nejprve vyzkoušejte.

Software pro převod textu na řeč „Ondoku“ dokáže každý měsíc přečíst 5 000 znaků pomocí hlasu AI zdarma. Můžete si snadno stáhnout MP3 a možné je i komerční využití. Pokud se zaregistrujete zdarma, můžete zdarma převést až 5 000 znaků za měsíc z textu na řeč. Vyzkoušejte Ondoku nyní.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Související článek