Co to jest język SSML (Speech Synthesis Markup Language)? Jak go używać w oprogramowaniu do zamiany tekstu na mowę i listę głównych kodów.

21 czerwca 2025

Witam, witamy na stronie Ondoku.

Dziś chcielibyśmy przedstawić SSML.

Może to być trudne, ponieważ istnieją pewne terminy techniczne.

Jeśli jednak o tym wiesz, będzie to miało ogromny wpływ na sposób korzystania z Ondoku.

Prosimy o przeczytanie go, starając się, aby był łatwy do zrozumienia.

Co to jest SSML?

Przede wszystkim SSML to skrót od Speech Synthesis Markup Language.

Jest podobny do HTML.

Pisząc ten kod SSML, możesz dalej kontrolować mowę Ondoku.

Jak używać SSML z Ondoku

Używanie SSML w Ondoku jest bardzo łatwe.

Wprowadź kod SSML bezpośrednio w polu tekstowym Ondoku.

SSML zostanie zastosowany automatycznie.

Pamiętaj, aby dołączyć

<speak> </speak>

na początku i na końcu kodu! Bez kodu <speak>, SSML nie zostanie zastosowane.

<speak> </speak>

Jak wspomniano wcześniej, jest to kod do aktywacji SSML.

Pamiętaj, aby umieścić ten kod na początku i na końcu tekstu, który chcesz przekonwertować na mowę.

Przykład

<speak> Wpisz tutaj tekst, który chcesz przekonwertować z tekstu na mowę </speak>

<break time = "○○ ms" />

Jak sama nazwa wskazuje, kod czasu przerwy jest kodem do robienia pauzy.

Wprowadź kod, w którym chcesz wstawić czas przerwy, i zastąp ○○ liczbą, którą lubisz.

Mowa wygenerowana przez Ondoku nie będzie miała „pauzy”, chyba że określono inaczej.

Możesz zrobić trochę przerwy za pomocą nawiasów lub znaków interpunkcyjnych, ale te przerwy mogą nie być ustawione tak, jak chcesz.

Szczególnie jeśli potrzebujesz przerwy dłuższej niż 2 sekundy, trudniej będzie ją kontrolować.

Jeśli jednak wejdziesz

<break time = "1000ms" />

do miejsca, w którym chcesz zrobić przerwę,

<speak>
Chcę trochę przerwy <break time = "1000ms" /> podczas czytania tego zdania.
</speak>

usłyszysz przerwę w środku zdania.

* 1000 ms = 1 sekunda

Możesz dowolnie zmieniać liczbę przed ms lub s, aby kontrolować długość pauzy.

200 ms = 0,200 sekund
500 ms = 0,500 sekundy
1000 ms = 1000 sekund
2000 ms = 2000 sekund
3 s = 3 sekundy
10s = 10 sekund itd.

<say-as interpret-as = "expletive"> ○○ </say-as>

Z tym kodem, tekst ○○ będzie odtwarzany z sygnałem dźwiękowym dla cenzora.

To rodzaj zabawnego kodu. Tekst zawarty w tym kodzie zostanie zastąpiony sygnałem dźwiękowym.

<speak>
To słowo jest <say-as interpret-as = "expletive"> ograniczone </say-as>
</speak>

<sub alias = "◇◇"> ○○ </sub>

Jest to kod, który pozwala wskazać wymowę.

Czasami, gdy używasz konwersji tekstu na mowę, możesz usłyszeć słowo wypowiedziane w nieoczekiwany sposób.

Na przykład, możesz sprawić, by oprogramowanie wymawiało słowo „一行” w jednej linii jako „Ichigyo”, podczas gdy system wymawia je jako „Ichiyuki”.

Jako kod wprowadź kanji dla ○○ i wymowę dla ◇◇.

<speak>
Poprawnie wymawiaj jako <sub alias = "Ichigyo"> 一行 </sub> zamiast Ichiyuki
</speak>

<emphasis> ○○ </emphasis>

Możesz podkreślić tekst zawarty w kodzie w mowie.

<speak>
Ten kod <emphasis> podkreśla tekst </emphasis>
</speak>

<prosody> ○○ </prosody>

Prozodia to termin językowy, który opisuje zasady naturalnego mówionego języka angielskiego, w tym

Intonacja (wysokość wznosząca i opadająca)
Pozycja pauzy
Długość dźwięku i stres itp.

Za pomocą tych kodów możesz dostosować następujące 3 elementy prozodii:

Stawka (stawka, prędkość)
Kod: „x-wolno” „wolno” „średnio” „szybko” „x-szybko” „domyślnie”
Skok (podziałka, wysokość)
Kod: „x-niski” „niski” „średni” „wysoki” „x-wysoki” „domyślny”
Objętość (objętość, rozmiar)
Kod: „cicho” „x-cicho” „cicho” „średnio” „głośno” „x-głośno” „domyślnie”

<speak>
<prosody rate = "fast"> Mów szybko. </prosody>
<prosody pitch = "high"> Mów wysokim głosem. </prosody>
<prosody volume = "loud"> Mów głośno. </prosody>
<prosody rate = "slow" pitch = "x-low"> Mów powoli i niskim tonem. </prosody>
<prosody rate = "fast" pitch = "high" volume = "medium"> Mów szybko, wysokim tonem i normalną głośnością. </prosody>
</speak>

■ Oprogramowanie do syntezy mowy AI „Ondoku”

„Ondoku” to internetowe narzędzie do zamiany tekstu na mowę, z którego można korzystać bez żadnych kosztów początkowych.

Obsługuje około 50 języków, w tym japoński, angielski, chiński, koreański, hiszpański, francuski i niemiecki.
Dostępne zarówno z komputera, jak i smartfona
Nadaje się do biznesu, edukacji, rozrywki itp.
Nie wymaga instalacji, można z niej korzystać bezpośrednio w przeglądarce
Obsługuje również odczyt z obrazów

Aby z niego skorzystać, wystarczy wpisać tekst lub przesłać plik ze strony. Generuj naturalne pliki dźwiękowe w ciągu kilku sekund. Możesz bezpłatnie używać syntezy mowy do 5000 znaków, więc wypróbuj ją najpierw.

Przekonwertuj teraz tekst na dźwięk

Oprogramowanie do zamiany tekstu na mowę „Ondoku” może bezpłatnie odczytywać 5000 znaków miesięcznie za pomocą głosu AI. Możesz łatwo pobierać pliki MP3 i komercyjne wykorzystanie jest również możliwe. Jeśli zarejestrujesz się bezpłatnie, możesz bezpłatnie przekonwertować do 5000 znaków miesięcznie z tekstu na mowę. Wypróbuj Ondoku już teraz.

HP: ondoku3.com
Email: ondoku3.com@gmail.com

←Poprzedni artykuł | Następny artykuł→

Powiązany artykuł

Zwiększmy satysfakcję klientów, korzystając z przykładów czytania na głos oprogramowania

Udostępniono nową funkcję: teraz można odczytać litery na obrazie! Oprogramowanie do zamiany tekstu…

[Prośba o odpowiedź do Ondoku] Proszę nie liczyć znaków po poprawieniu.

Błąd Ondoku „Nie można odczytać zdań z emotikonami”

Jak korzystać z oprogramowania do zamiany tekstu na mowę Ondoku, metody rejestracji członków i wygo…

Typowe błędy i obejścia podczas korzystania z języka znaczników mowy (SSML)

Ondoku

Oprogramowanie do czytania tekstu Ondoku. Jest to usługa zamiany tekstu na mowę, która nie wymaga instalacji i może być używana przez każdego za darmo. Jeśli zarejestrujesz się za darmo, co miesiąc możesz otrzymać do 5000 znaków za darmo. Zarejestruj się teraz za darmo

Nowe artykuły

[Bezpłatnie] Jeśli chcesz wdrożyć system naprowadzania telefonicznego, polecamy aplikację AI! Wskaz…

Popularne artykuły