Czym jest język znaczników mowy (SSML). Jak go używać w oprogramowaniu do syntezy mowy i lista głównych kodów.

26 stycznia 2026

Czym jest język znaczników mowy (SSML). Jak go używać w oprogramowaniu do syntezy mowy i lista głównych kodów.

Witaj, dziękujemy za regularne korzystanie z Ondoku.

W tym artykule przedstawimy SSML.

Może się to wydawać nieco trudne ze względu na terminologię techniczną, ale poznanie sposobu korzystania z SSML pozwoli Ci na jeszcze wygodniejsze korzystanie z Ondoku.

Wyjaśnimy to w prosty sposób, więc zachęcamy do lektury.

Czym jest SSML

SSML to jeden z języków znaczników mowy (Speech Synthesis Markup Language).

„Język znaczników” to język, który – podobnie jak HTML – definiuje strukturę (rolę) poszczególnych części tekstu.

Pisząc kod SSML, możesz w wygodniejszy sposób kontrolować wymowę Ondoku.

Obecnie kody SSML obsługiwane we wszystkich językach to:

Są to jedyne dwa rodzaje kodów. Inne kody mogą nie być dostępne w zależności od języka lub rodzaju głosu. Prosimy o wyrozumiałość.

Jak używać SSML w Ondoku

Korzystanie z SSML w Ondoku jest bardzo proste.

Wpisz kod SSML bezpośrednio w polu tekstowym Ondoku.

Wtedy SSML zostanie zastosowany automatycznie.

Wystarczy wstawić na początku i na końcu tekstu:

aby móc korzystać z SSML.

Pamiętaj, aby nie zapomnieć o tym kodzie! Bez kodu SSML nie zostanie zastosowany.

to kod niezbędny do aktywacji SSML.

Wstaw ten kod obowiązkowo na początku i na końcu tekstu, który chcesz przeczytać.

Przykład

Tutaj wpisz tekst, który chcesz przeczytać

Kod break time, jak sama nazwa wskazuje, jest kodem służącym do tworzenia pauz.

Wpisz kod w miejscu, w którym chcesz wstawić pauzę, i zastąp ○○ wybraną liczbą.

Podczas zwykłego czytania w Ondoku zdarza się, że odstępy nie pojawiają się tak, jak byśmy tego oczekiwali.

W takich sytuacjach ten kod jest bardzo pomocny.

Na przykład,

spróbujmy wstawić ten kod tam, gdzie chcemy zrobić przerwę.


Podczas czytania tego zdania chcę zrobić krótkąpauzę

Możesz zauważyć, że w miejscu wstawienia kodu następuje chwila oddechu przed dalszym czytaniem.

※ 1000ms = 1 sekunda

Zmieniając liczbę przed ms lub s, możesz dowolnie regulować długość „pauzy”.

  • 200ms = 0,200 sekundy
  • 500ms = 0,500 sekundy
  • 1000ms = 1,000 sekundy
  • 2000ms = 2,000 sekundy
  • 3s = 3 sekundy itd.

Uwagi dotyczące używania

Działanie po wstawieniu tagu na samym początku całego tekstu różni się w zależności od głosu i nie możemy zagwarantować jego poprawnego działania.

Przykład: Chcę zrobić 5 sekund przerwy na początku

↑ Takie użycie jest niemożliwe ze względu na specyfikację.

Dodatkowo, maksymalna długość pauzy wynosi 10 sekund (10000ms, 10s).

Jeśli ustawisz czas dłuższy niż ten, zostanie on skrócony do 10 sekund.

Sposób użycia tagu został również wyjaśniony w tym artykule.

〇〇

Ten tag służy do określania języka poszczególnych części tekstu podczas korzystania z głosów wielojęzycznych (Multilingual) w Ondoku.

Używa się go, gdy wymowa jest błędna lub gdy w tekście występuje wiele języków i system nie może ich rozróżnić.


Japońskie „konnichiwa” to po angielsku Hello,
po francusku Bonjour,
po niemiecku Guten Tag,
a po chińsku 你好.

Sposób użycia tagu został szczegółowo wyjaśniony w tym artykule.

○○

Tekst w miejscu ○○ zostanie odtworzony jako dźwięk cenzury „piiii”.

To kod z odrobiną poczucia humoru. Znaki otoczone tym kodem zostaną zastąpione dźwiękiem „pi”.


To słowo jest zakazane

○○

Podczas czytania alfabetu litery będą literowane (odczytywane każda z osobna).


Pisownia słowa hello to Hello

Należy jednak pamiętać, że ten SSML może powodować błędy w przypadku niektórych głosów. Prosimy o korzystanie z niego z tą świadomością.

Japoński: Nanami

Angielski (USA): en-US-A

○○

Kod umożliwiający nadanie czytania (aliasu).

Podczas czytania tekstu czasami zdarza się nieoczekiwana wymowa.

Na przykład, jeśli słowo „一行” zostanie wymówione jako „ichiyuki”, nadanie aliasu „ichigyou” pozwoli na bezbłędną wymowę.

W kodzie wpisz znaki kanji w miejscu ○○, a sposób czytania w miejscu ◇◇.


Czytaj poprawnie jako 一行, a nie ichiyuki

○○

Możesz sprawić, że tekst otoczony kodem zostanie przeczytany z naciskiem (zaakcentowany).


Ten kod pozwala na podkreślenie słów

○○

Prozodia (prosody) to ogólne określenie cech dźwiękowych języka podczas naturalnego mówienia, takich jak:

  • Wznoszenie i opadanie tonu
  • Miejsca przerw
  • Długość i siła akcentu itp.

Za pomocą tego kodu można regulować trzy parametry:

  • rate (tempo, szybkość)
    Kody regulacji: „x-slow”, „slow”, „medium”, „fast”, „x-fast”, „default”
  • pitch (wysokość tonu)
    Kody regulacji: „x-low”, „low”, „medium”, „high”, „x-high”, „default”
  • volume (głośność)
    Kody regulacji: „silent”, „x-soft”, „soft”, „medium”, „loud”, „x-loud”, „default”


Mówię szybko.
Mówię wysokim głosem.
Mówię głośno.
Mówię powoli i niskim głosem.
Mówię szybko, wysokim głosem, z normalną głośnością.

Może warto zacząć korzystać z SSML, aby jeszcze lepiej używać Ondoku?

Jak widzisz, wykorzystanie SSML pozwala na jeszcze wygodniejsze korzystanie z Ondoku!

Może warto jeszcze szerzej wykorzystać realistyczny i wyraźny głos Ondoku w produkcji filmów czy prezentacjach?

■ Oprogramowanie do syntezy mowy AI „Ondoku”

„Ondoku” to internetowe narzędzie do zamiany tekstu na mowę, z którego można korzystać bez żadnych kosztów początkowych.

  • Obsługuje około 50 języków, w tym japoński, angielski, chiński, koreański, hiszpański, francuski i niemiecki.
  • Dostępne zarówno z komputera, jak i smartfona
  • Nadaje się do biznesu, edukacji, rozrywki itp.
  • Nie wymaga instalacji, można z niej korzystać bezpośrednio w przeglądarce
  • Obsługuje również odczyt z obrazów

Aby z niego skorzystać, wystarczy wpisać tekst lub przesłać plik ze strony. Generuj naturalne pliki dźwiękowe w ciągu kilku sekund. Możesz bezpłatnie używać syntezy mowy do 5000 znaków, więc wypróbuj ją najpierw.

Oprogramowanie do zamiany tekstu na mowę „Ondoku” może bezpłatnie odczytywać 5000 znaków miesięcznie za pomocą głosu AI. Możesz łatwo pobierać pliki MP3 i komercyjne wykorzystanie jest również możliwe. Jeśli zarejestrujesz się bezpłatnie, możesz bezpłatnie przekonwertować do 5000 znaków miesięcznie z tekstu na mowę. Wypróbuj Ondoku już teraz.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Powiązany artykuł