Co to jest język SSML (Speech Synthesis Markup Language)? Jak go używać w oprogramowaniu do zamiany tekstu na mowę i listę głównych kodów.

17 kwietnia 2024

Co to jest język SSML (Speech Synthesis Markup Language)? Jak go używać w oprogramowaniu do zamiany tekstu na mowę i listę głównych kodów.


Witam, witamy na stronie Ondoku.

Dziś chcielibyśmy przedstawić SSML.

Może to być trudne, ponieważ istnieją pewne terminy techniczne.

Jeśli jednak o tym wiesz, będzie to miało ogromny wpływ na sposób korzystania z Ondoku.

Prosimy o przeczytanie go, starając się, aby był łatwy do zrozumienia.

Co to jest SSML?

Przede wszystkim SSML to skrót od Speech Synthesis Markup Language.

Jest podobny do HTML.

Pisząc ten kod SSML, możesz dalej kontrolować mowę Ondoku.

Jak używać SSML z Ondoku

Używanie SSML w Ondoku jest bardzo łatwe.

Wprowadź kod SSML bezpośrednio w polu tekstowym Ondoku.

SSML zostanie zastosowany automatycznie.

Pamiętaj, aby dołączyć

<speak> </speak>

na początku i na końcu kodu! Bez kodu <speak>, SSML nie zostanie zastosowane.

<speak> </speak>

Jak wspomniano wcześniej, jest to kod do aktywacji SSML.

Pamiętaj, aby umieścić ten kod na początku i na końcu tekstu, który chcesz przekonwertować na mowę.

Przykład

<speak> Wpisz tutaj tekst, który chcesz przekonwertować z tekstu na mowę </speak>

<break time = "○○ ms" />

Jak sama nazwa wskazuje, kod czasu przerwy jest kodem do robienia pauzy.

Wprowadź kod, w którym chcesz wstawić czas przerwy, i zastąp ○○ liczbą, którą lubisz.

Mowa wygenerowana przez Ondoku nie będzie miała „pauzy”, chyba że określono inaczej.

Możesz zrobić trochę przerwy za pomocą nawiasów lub znaków interpunkcyjnych, ale te przerwy mogą nie być ustawione tak, jak chcesz.

Szczególnie jeśli potrzebujesz przerwy dłuższej niż 2 sekundy, trudniej będzie ją kontrolować.

Jeśli jednak wejdziesz

<break time = "1000ms" />

do miejsca, w którym chcesz zrobić przerwę,

<speak>
Chcę trochę przerwy <break time = "1000ms" /> podczas czytania tego zdania.
</speak>

usłyszysz przerwę w środku zdania.

* 1000 ms = 1 sekunda

Możesz dowolnie zmieniać liczbę przed ms lub s, aby kontrolować długość pauzy.

200 ms = 0,200 sekund
500 ms = 0,500 sekundy
1000 ms = 1000 sekund
2000 ms = 2000 sekund
3 s = 3 sekundy
10s = 10 sekund itd.

<say-as interpret-as = "expletive"> ○○ </say-as>

Z tym kodem, tekst ○○ będzie odtwarzany z sygnałem dźwiękowym dla cenzora.

To rodzaj zabawnego kodu. Tekst zawarty w tym kodzie zostanie zastąpiony sygnałem dźwiękowym.

<speak>
To słowo jest <say-as interpret-as = "expletive"> ograniczone </say-as>
</speak>

<sub alias = "◇◇"> ○○ </sub>

Jest to kod, który pozwala wskazać wymowę.

Czasami, gdy używasz konwersji tekstu na mowę, możesz usłyszeć słowo wypowiedziane w nieoczekiwany sposób.

Na przykład, możesz sprawić, by oprogramowanie wymawiało słowo „一行” w jednej linii jako „Ichigyo”, podczas gdy system wymawia je jako „Ichiyuki”.

Jako kod wprowadź kanji dla ○○ i wymowę dla ◇◇.

<speak>
Poprawnie wymawiaj jako <sub alias = "Ichigyo"> 一行 </sub> zamiast Ichiyuki
</speak>

<emphasis> ○○ </emphasis>

Możesz podkreślić tekst zawarty w kodzie w mowie.

<speak>
Ten kod <emphasis> podkreśla tekst </emphasis>
</speak>

<prosody> ○○ </prosody>

Prozodia to termin językowy, który opisuje zasady naturalnego mówionego języka angielskiego, w tym

  • Intonacja (wysokość wznosząca i opadająca)
  • Pozycja pauzy
  • Długość dźwięku i stres itp.

Za pomocą tych kodów możesz dostosować następujące 3 elementy prozodii:

  • Stawka (stawka, prędkość)
    Kod: „x-wolno” „wolno” „średnio” „szybko” „x-szybko” „domyślnie”
  • Skok (podziałka, wysokość)
    Kod: „x-niski” „niski” „średni” „wysoki” „x-wysoki” „domyślny”
  • Objętość (objętość, rozmiar)
    Kod: „cicho” „x-cicho” „cicho” „średnio” „głośno” „x-głośno” „domyślnie”

<speak>
<prosody rate = "fast"> Mów szybko. </prosody>
<prosody pitch = "high"> Mów wysokim głosem. </prosody>
<prosody volume = "loud"> Mów głośno. </prosody>
<prosody rate = "slow" pitch = "x-low"> Mów powoli i niskim tonem. </prosody>
<prosody rate = "fast" pitch = "high" volume = "medium"> Mów szybko, wysokim tonem i normalną głośnością. </prosody>
</speak>

■ Oprogramowanie do syntezy mowy AI „Ondoku”

„Ondoku” to internetowe narzędzie do zamiany tekstu na mowę, z którego można korzystać bez żadnych kosztów początkowych.

  • Obsługuje około 50 języków, w tym japoński, angielski, chiński, koreański, hiszpański, francuski i niemiecki.
  • Dostępne zarówno z komputera, jak i smartfona
  • Nadaje się do biznesu, edukacji, rozrywki itp.
  • Nie wymaga instalacji, można z niej korzystać bezpośrednio w przeglądarce
  • Obsługuje również odczyt z obrazów

Aby z niego skorzystać, wystarczy wpisać tekst lub przesłać plik ze strony. Generuj naturalne pliki dźwiękowe w ciągu kilku sekund. Możesz bezpłatnie używać syntezy mowy do 5000 znaków, więc wypróbuj ją najpierw.

Oprogramowanie do zamiany tekstu na mowę „Ondoku” może bezpłatnie odczytywać 5000 znaków miesięcznie za pomocą głosu AI. Możesz łatwo pobierać pliki MP3 i komercyjne wykorzystanie jest również możliwe. Jeśli zarejestrujesz się bezpłatnie, możesz bezpłatnie przekonwertować do 5000 znaków miesięcznie z tekstu na mowę. Wypróbuj Ondoku już teraz.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Powiązany artykuł