Apa itu Speech Synthesis Markup Language (SSML)? Cara menggunakannya dalam perangkat lunak text-to-speech dan daftar kode utama.

17 April 2024

Apa itu Speech Synthesis Markup Language (SSML)? Cara menggunakannya dalam perangkat lunak text-to-speech dan daftar kode utama.


Halo, selamat datang di situs Ondoku.

Hari ini, kami ingin memperkenalkan SSML.

Anda mungkin merasa kesulitan karena ada beberapa istilah teknis.

Namun, jika Anda mengetahuinya, itu akan membuat perbedaan besar dalam cara Anda menggunakan Ondoku.

Harap baca terus selagi kami mencoba membuatnya mudah dimengerti.

Apa itu SSML?

Pertama-tama, SSML adalah singkatan dari Speech Synthesis Markup Language.

Ini mirip dengan HTML.

Dengan menulis kode SSML ini, Anda dapat lebih mengontrol ucapan Ondoku.

Cara menggunakan SSML dengan Ondoku

Sangat mudah menggunakan SSML di Ondoku.

Silakan langsung memasukkan kode SSML ke dalam kotak teks Ondoku.

SSML akan diterapkan secara otomatis.

Pastikan untuk memasukkan

<speak> </speak>

di awal dan di akhir kode! Tanpa kode <speak>, SSML tidak akan diterapkan.

<speak> </speak>

Seperti yang disebutkan sebelumnya, ini adalah kode untuk mengaktifkan SSML.

Pastikan untuk memasukkan kode ini di awal dan akhir teks yang ingin Anda ubah menjadi ucapan.

Contoh

<speak> Masukkan teks yang ingin Anda ubah dari teks ke ucapan di sini </speak>

<waktu istirahat = "○○ md" />

Sesuai dengan namanya, kode break time merupakan kode untuk melakukan pause.

Masukkan kode tempat Anda ingin memasukkan waktu istirahat, dan ganti ○○ dengan nomor yang Anda suka.

Pidato yang dihasilkan oleh Ondoku tidak akan memiliki "jeda" kecuali ditentukan.

Anda dapat meluangkan waktu istirahat dengan tanda kurung atau tanda baca, tetapi jeda ini mungkin tidak disetel seperti yang Anda inginkan.

Apalagi jika membutuhkan waktu istirahat lebih dari 2 detik akan lebih sulit untuk dikendalikan.

Namun, jika Anda masuk

<waktu istirahat = "1000ms" />

ke tempat di mana Anda ingin berhenti sejenak,

<speak>
Saya ingin waktu istirahat <break time = "1000ms" /> saat membaca kalimat ini.
</speak>

Anda akan mendengar beberapa jeda di tengah kalimat.

* 1000 ms = 1 detik

Anda dapat mengubah angka sebelum ms atau s dengan bebas untuk mengontrol lamanya jeda.

200ms = 0,200 detik
500ms = 0,500 detik
1000ms = 1.000 detik
2000ms = 2.000 detik
3s = 3 detik
10s = 10 detik dll.

<say-as interpret-as = "expletive"> ○○ </say-as>

Dengan kode ini, teks dalam ○○ akan diputar dengan suara bip untuk sensor tidur.

Ini semacam kode yang menyenangkan. Teks yang dilampirkan dalam kode ini akan diganti dengan suara bip.

<speak>
Kata ini <say-as interpret-as = "expletive"> dibatasi </say-as>
</speak>

<sub alias = "◇◇"> ○○ </sub>

Ini adalah kode yang memungkinkan Anda untuk menunjukkan pengucapan.

Terkadang saat Anda menggunakan konversi teks ke ucapan, Anda mungkin mendengar kata yang diucapkan dengan cara yang tidak terduga.

Misalnya, Anda dapat membuat perangkat lunak mengucapkan kata "一行," satu baris, sebagai "Ichigyo", sedangkan sistem mengucapkannya sebagai "Ichiyuki".

Untuk kodenya, masukkan kanji untuk ○○ dan pengucapan untuk ◇◇.

<speak>
Ucapkan dengan benar sebagai <sub alias = "Ichigyo"> 一行 </sub> alih-alih Ichiyuki
</speak>

<emphasis> ○○ </emphasis>

Anda dapat menekankan teks yang diapit kode dalam pidato.

<speak>
Kode ini akan <emphasis> menekankan teks </emphasis>
</speak>

<prosody> ○○ </prosody>

Prosodi adalah istilah linguistik yang menggambarkan aturan bahasa Inggris lisan alami, termasuk

  • Intonasi (nada naik dan turun)
  • Posisi jeda
  • Panjang suara dan tekanan, dll.

Dengan kode-kode ini, Anda dapat menyesuaikan 3 elemen prosodi berikut:

  • Tarif (tarif, kecepatan)
    Kode: "x-slow" "slow" "sedang" "fast" "x-fast" "default"
  • Pitch (nada, tinggi)
    Kode: "x-rendah" "rendah" "sedang" "tinggi" "x-tinggi" "default"
  • Volume (volume, ukuran)
    Kode: "silent" "x-soft" "soft" "sedang" "keras" "x-keras" "default"

<speak>
<prosody rate = "fast"> Bicaralah dengan cepat. </prosody>
<prosody pitch = "high"> Bicaralah dengan suara nada tinggi. </prosody>
<prosody volume = "loud"> Bicaralah dengan keras. </prosody>
<prosody rate = "slow" pitch = "x-low"> Bicaralah perlahan dan dengan suara nada rendah. </prosody>
<prosody rate = "fast" pitch = "high" volume = "medium"> Bicaralah dengan cepat, dengan suara nada tinggi, dan volume normal. </prosody>
</speak>

Perangkat lunak text-to-speech "Ondoku" dapat membacakan 5000 karakter setiap bulan dengan suara AI secara gratis. Anda dapat dengan mudah mengunduh MP3 dan penggunaan komersial juga dimungkinkan. Jika Anda mendaftar secara gratis, Anda dapat mengonversi hingga 5.000 karakter per bulan secara gratis dari teks ke ucapan. Coba Ondoku sekarang.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Artikel yang berkaitan