Co to jest język SSML (Speech Synthesis Markup Language)? Jak go używać w oprogramowaniu do zamiany tekstu na mowę i listę głównych kodów.
17 kwietnia 2024
Witam, witamy na stronie Ondoku.
Dziś chcielibyśmy przedstawić SSML.
Może to być trudne, ponieważ istnieją pewne terminy techniczne.
Jeśli jednak o tym wiesz, będzie to miało ogromny wpływ na sposób korzystania z Ondoku.
Prosimy o przeczytanie go, starając się, aby był łatwy do zrozumienia.
Co to jest SSML?
Przede wszystkim SSML to skrót od Speech Synthesis Markup Language.
Jest podobny do HTML.
Pisząc ten kod SSML, możesz dalej kontrolować mowę Ondoku.
Jak używać SSML z Ondoku
Używanie SSML w Ondoku jest bardzo łatwe.
Wprowadź kod SSML bezpośrednio w polu tekstowym Ondoku.
SSML zostanie zastosowany automatycznie.
Pamiętaj, aby dołączyć
<speak> </speak>
na początku i na końcu kodu! Bez kodu <speak>, SSML nie zostanie zastosowane.
<speak> </speak>
Jak wspomniano wcześniej, jest to kod do aktywacji SSML.
Pamiętaj, aby umieścić ten kod na początku i na końcu tekstu, który chcesz przekonwertować na mowę.
Przykład
<speak> Wpisz tutaj tekst, który chcesz przekonwertować z tekstu na mowę </speak>
<break time = "○○ ms" />
Jak sama nazwa wskazuje, kod czasu przerwy jest kodem do robienia pauzy.
Wprowadź kod, w którym chcesz wstawić czas przerwy, i zastąp ○○ liczbą, którą lubisz.
Mowa wygenerowana przez Ondoku nie będzie miała „pauzy”, chyba że określono inaczej.
Możesz zrobić trochę przerwy za pomocą nawiasów lub znaków interpunkcyjnych, ale te przerwy mogą nie być ustawione tak, jak chcesz.
Szczególnie jeśli potrzebujesz przerwy dłuższej niż 2 sekundy, trudniej będzie ją kontrolować.
Jeśli jednak wejdziesz
<break time = "1000ms" />
do miejsca, w którym chcesz zrobić przerwę,
<speak>
Chcę trochę przerwy <break time = "1000ms" /> podczas czytania tego zdania.
</speak>
usłyszysz przerwę w środku zdania.
* 1000 ms = 1 sekunda
Możesz dowolnie zmieniać liczbę przed ms lub s, aby kontrolować długość pauzy.
200 ms = 0,200 sekund
500 ms = 0,500 sekundy
1000 ms = 1000 sekund
2000 ms = 2000 sekund
3 s = 3 sekundy
10s = 10 sekund itd.
<say-as interpret-as = "expletive"> ○○ </say-as>
Z tym kodem, tekst ○○ będzie odtwarzany z sygnałem dźwiękowym dla cenzora.
To rodzaj zabawnego kodu. Tekst zawarty w tym kodzie zostanie zastąpiony sygnałem dźwiękowym.
<speak>
To słowo jest <say-as interpret-as = "expletive"> ograniczone </say-as>
</speak>
<sub alias = "◇◇"> ○○ </sub>
Jest to kod, który pozwala wskazać wymowę.
Czasami, gdy używasz konwersji tekstu na mowę, możesz usłyszeć słowo wypowiedziane w nieoczekiwany sposób.
Na przykład, możesz sprawić, by oprogramowanie wymawiało słowo „一行” w jednej linii jako „Ichigyo”, podczas gdy system wymawia je jako „Ichiyuki”.
Jako kod wprowadź kanji dla ○○ i wymowę dla ◇◇.
<speak>
Poprawnie wymawiaj jako <sub alias = "Ichigyo"> 一行 </sub> zamiast Ichiyuki
</speak>
<emphasis> ○○ </emphasis>
Możesz podkreślić tekst zawarty w kodzie w mowie.
<speak>
Ten kod <emphasis> podkreśla tekst </emphasis>
</speak>
<prosody> ○○ </prosody>
Prozodia to termin językowy, który opisuje zasady naturalnego mówionego języka angielskiego, w tym
- Intonacja (wysokość wznosząca i opadająca)
- Pozycja pauzy
- Długość dźwięku i stres itp.
Za pomocą tych kodów możesz dostosować następujące 3 elementy prozodii:
- Stawka (stawka, prędkość)
Kod: „x-wolno” „wolno” „średnio” „szybko” „x-szybko” „domyślnie” - Skok (podziałka, wysokość)
Kod: „x-niski” „niski” „średni” „wysoki” „x-wysoki” „domyślny” - Objętość (objętość, rozmiar)
Kod: „cicho” „x-cicho” „cicho” „średnio” „głośno” „x-głośno” „domyślnie”
<speak>
<prosody rate = "fast"> Mów szybko. </prosody>
<prosody pitch = "high"> Mów wysokim głosem. </prosody>
<prosody volume = "loud"> Mów głośno. </prosody>
<prosody rate = "slow" pitch = "x-low"> Mów powoli i niskim tonem. </prosody>
<prosody rate = "fast" pitch = "high" volume = "medium"> Mów szybko, wysokim tonem i normalną głośnością. </prosody>
</speak>
■ Oprogramowanie do syntezy mowy AI „Ondoku”
„Ondoku” to internetowe narzędzie do zamiany tekstu na mowę, z którego można korzystać bez żadnych kosztów początkowych.
- Obsługuje około 50 języków, w tym japoński, angielski, chiński, koreański, hiszpański, francuski i niemiecki.
- Dostępne zarówno z komputera, jak i smartfona
- Nadaje się do biznesu, edukacji, rozrywki itp.
- Nie wymaga instalacji, można z niej korzystać bezpośrednio w przeglądarce
- Obsługuje również odczyt z obrazów
Aby z niego skorzystać, wystarczy wpisać tekst lub przesłać plik ze strony. Generuj naturalne pliki dźwiękowe w ciągu kilku sekund. Możesz bezpłatnie używać syntezy mowy do 5000 znaków, więc wypróbuj ją najpierw.
Email: ondoku3.com@gmail.com
Oprogramowanie do czytania tekstu Ondoku. Jest to usługa zamiany tekstu na mowę, która nie wymaga instalacji i może być używana przez każdego za darmo. Jeśli zarejestrujesz się za darmo, co miesiąc możesz otrzymać do 5000 znaków za darmo. Zarejestruj się teraz za darmo