Konuşma Sentezi Biçimlendirme Dili (SSML) nedir? Metinden konuşmaya yazılımında nasıl kullanılır ve ana kod listesi.

17 Nisan 2024

Konuşma Sentezi Biçimlendirme Dili (SSML) nedir? Metinden konuşmaya yazılımında nasıl kullanılır ve ana kod listesi.


Merhaba, Ondoku web sitesine hoş geldiniz.

Bugün SSML'yi tanıtmak istiyoruz.

Bazı teknik terimler olduğu için bunu zor bulabilirsiniz.

Bununla birlikte, eğer bilirseniz, Ondoku'yu kullanma şeklinizde büyük bir fark yaratacaktır.

Anlaşılmasını kolaylaştırmaya çalışırken lütfen baştan sona okuyun.

SSML nedir?

Her şeyden önce, SSML Konuşma Sentezi Biçimlendirme Dili anlamına gelir.

HTML'ye benzer.

Bu SSML kodunu yazarak, Ondoku'nun konuşmasını daha fazla kontrol edebilirsiniz.

Ondoku ile SSML nasıl kullanılır

Ondoku'da SSML'yi kullanmak çok kolaydır.

Lütfen SSML kodunu doğrudan Ondoku metin kutusuna girin.

SSML otomatik olarak uygulanacaktır.

Eklediğinizden emin olun

<speak> </speak>

kodun başında ve sonunda! <speak> kodu olmadan SSML uygulanmayacaktır.

<speak> </speak>

Daha önce belirtildiği gibi, bu, SSML'yi etkinleştirmek için kullanılan koddur.

Bu kodu konuşmaya dönüştürmek istediğiniz metnin başına ve sonuna eklediğinizden emin olun.

Misal

<speak> Metinden konuşmaya dönüştürmek istediğiniz metni buraya girin </speak>

<mola süresi = "○○ ms" />

Adından da anlaşılacağı gibi, mola zamanı kodu bir duraklama yapmak için bir koddur.

Bir mola zamanı eklemek istediğiniz kodu girin ve ○○ yerine istediğiniz sayıyı yazın.

Ondoku tarafından üretilen konuşma, belirtilmedikçe "duraklatılmayacaktır".

Köşeli parantez veya noktalama işaretleriyle biraz ara verebilirsiniz, ancak bu duraklamalar istediğiniz gibi ayarlanmayabilir.

Özellikle 2 saniyeden fazla mola süresine ihtiyacınız varsa kontrol etmeniz daha zor olacaktır.

Ancak, girerseniz

<mola zamanı = "1000 ms" />

Duraklatmak istediğiniz yere,

<speak>
Bu cümleyi okurken biraz mola zamanı <break time = "1000ms" /> istiyorum.
</speak>

cümlenin ortasında biraz ara duyacaksın.

* 1000 ms = 1 saniye

Duraklamanın uzunluğunu kontrol etmek için sayıyı ms veya s'den önce serbestçe değiştirebilirsiniz.

200ms = 0.200 saniye
500ms = 0.500 saniye
1000ms = 1.000 saniye
2000ms = 2.000 saniye
3s = 3 saniye
10s = 10 saniye vb.

<say-as comment-as = "expletive"> ○○ </say-as>

Bu kodla, ○○ içindeki metin, bip sansürü için bir bip sesi ile çalınacaktır.

Bu bir tür eğlenceli kod. Bu kodun içerdiği metin, bip sesi ile değiştirilecektir.

<speak>
Bu kelime <say-as comment-as = "expletive"> kısıtlanmıştır </say-as>
</speak>

<sub alias = "◇◇"> ○○ </sub>

Telaffuz belirtmenizi sağlayan bir koddur.

Bazen metinden sese dönüştürmeyi kullandığınızda, beklenmedik bir şekilde söylenen bir kelime duyabilirsiniz.

Örneğin, yazılımın "一行" kelimesini tek satırlık "Ichigyo" olarak telaffuz etmesini, sistemin ise "Ichiyuki" olarak telaffuz etmesini sağlayabilirsiniz.

Kod için, ○○ için kanji ve ◇◇ için telaffuzu girin.

<speak>
Ichiyuki yerine doğru bir şekilde <sub alias = "Ichigyo"> 一行 </sub> olarak telaffuz edin
</speak>

<emphasis> ○○ </emphasis>

Konuşmada kodun içerdiği metni vurgulayabilirsiniz.

<speak>
Bu kod <emphasis> metni vurgulayacaktır </emphasis>
</speak>

<prosody> ○○ </prosody>

Aruz, doğal konuşma İngilizcesinin kurallarını tanımlayan dilsel bir terimdir.

  • Tonlama (yükselen ve düşen perde)
  • Duraklama konumu
  • Sesin uzunluğu ve stres vb.

Bu kodlarla, aşağıdaki 3 aruz unsurunu ayarlayabilirsiniz:

  • Oran (oran, hız)
    Kod: "x-yavaş" "yavaş" "orta" "hızlı" "x-hızlı" "varsayılan"
  • Pitch (adım, yükseklik)
    Kod: "x-düşük" "düşük" "orta" "yüksek" "x-yüksek" "varsayılan"
  • Hacim (hacim, boyut)
    Kod: "sessiz" "x-soft" "yumuşak" "orta" "yüksek" "x-yüksek" "varsayılan"

<speak>
<prosody rate = "hızlı"> Hızlı konuşun. </prosody>
<prosody pitch = "high"> Tiz bir sesle konuşun. </prosody>
<prosody volume = "yüksek sesle"> Yüksek sesle konuşun. </prosody>
<prosody rate = "slow" pitch = "x-low"> Yavaşça ve alçak bir sesle konuşun. </prosody>
<prosody rate = "fast" pitch = "high" volume = "medium"> Hızlı, tiz bir sesle ve normal ses seviyesinde konuşun. </prosody>
</speak>

■ AI konuşma sentezi yazılımı “Ondoku”

"Ondoku", hiçbir başlangıç maliyeti olmaksızın kullanılabilecek çevrimiçi bir metin-konuşma aracıdır.

  • Japonca, İngilizce, Çince, Korece, İspanyolca, Fransızca ve Almanca dahil olmak üzere yaklaşık 50 dili destekler.
  • Hem PC'den hem de akıllı telefondan kullanılabilir
  • İş, eğitim, eğlence vb. için uygundur.
  • Kurulum gerektirmez, tarayıcınızdan hemen kullanılabilir
  • Ayrıca görüntülerden okumayı da destekler

Kullanmak için metni girmeniz veya siteden bir dosya yüklemeniz yeterlidir. Saniyeler içinde doğal ses dosyaları oluşturun. Konuşma sentezini 5.000 karaktere kadar ücretsiz olarak kullanabilirsiniz, bu yüzden lütfen önce deneyin.

Metin okuma yazılımı "Ondoku", AI sesle ücretsiz olarak her ay 5000 karakter okuyabilir. MP3'leri kolayca indirebilir ve ticari kullanım da mümkündür. Ücretsiz kaydolursanız ayda 5.000'e kadar karakteri ücretsiz olarak metinden konuşmaya dönüştürebilirsiniz. Ondoku'yu şimdi deneyin.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
İlgili makaleler