什么是语音合成标记语言(SSML)?在语音朗读软件中的使用方法与主要代码列表。
2024年4月17日
大家好,我是Ondoku。
此次介绍的是SSML。
由于会出现一些专业术语,可能会感觉有些难。
但如果了解的话,Ondoku的使用方式也将产生巨大变化。
接下来将进行通俗易懂的说明,敬请阅读。
什么是SSML?
首先,SSML指的是语音合成标记语言。
种类与HTML类似。
通过编写这种SSML代码,可以进一步控制Ondoku的语音。
在Ondoku中使用SSML的方法
在Ondoku中使用SSML非常容易。
请直接在Ondoku文本框中输入SSML代码。
SSML将自动应用。
别忘记在文章的开头和结尾输入代码
<speak> </ speak>
没有代码<speak>,将不会应用SSML。
<speak> </ speak>
如前所述,这是激活SSML的代码。
请确保在要转换为语音的文本的开头和结尾处都包含此代码。
例
<speak>在此处输入要从文本转换为语音的文本</ speak>
<break time =“○○ms” />
顾名思义,break time代码是用于添加间隔的代码。
在需要添加间隔的地方输入代码,○○的部分请用喜好的数字替换。
Ondoku通常在朗读中没有“间隔”。
还有添加方括号或标点符号的方法,但可能无法根据需要设置间隔。
如果要2秒以上的间隔,就会更加难以控制。
但如果输入代码
<break time =“ 1000ms” />
到您想停顿的地方,
<speak>
阅读本文时,要做一点间隔<break time =“ 1000ms” />。
</ speak>
于是,就会在朗读中加上停顿。
* 1000ms= 1秒
通过更改ms或s之前的数字,“间隔”的长度可以自由变换。
200ms = 0.200秒
500ms = 0.500秒
1000ms = 1.000秒
2000ms = 2.000秒
3s= 3秒
10s= 10秒,依此类推。
<say-as interpret-as =“ expletive”>○○</ say-as>
○○部分的文章将以“哔哔”的禁止音效进行播放。
这是一种好玩的代码。用此代码包围的文本将被蜂鸣声代替。
<speak>
这个词<say-as interpret-as =“ expletive”>禁止播放</ say-as>
</ speak>
<sub alias =“◇◇”>○○</ sub>
这是可以指示音标的代码。
语音朗读时常会读出意想不到的发音。
比如,将“一行”的错误发音“ Ichiyuki”标注音标“ Ichigyo”,使发音得到纠正。
代码中○○输入汉字,◇◇输入音标。
<speak>
正确发音为<sub alias =“ Ichigyo”>一行</ sub>,而不是Ichiyuki
</ speak>
<emphasis>○○</emphasis>
代码包围的文字可以在朗读时被强调。
<speak>
这段代码会<emphasis>强调</ emphasis>
</ speak>
<prosody>○○</ prosody>
prosody(韵律)指的是在说自然的英语时,
- 音调的高低
- 停顿位置
- 声音的长度和强弱等
表示这些语言发音特点的总称。
使用这个代码可以调整以下三个内容:
- rate(频率,速度)
调整代码:“ x-slow”“ slow”“ medium”“ fast”“ x-fast”“ default” - pitch(音调,音高)
调整代码:“ x-low”“ low”“中”“ high”“ x-high”“default”
- volume(音量,大小)
调整代码:“silent”“ x-soft”“ soft”“ medium”“ loud”“ x-loud”“ default”
<speak>
<prosody rate =“ fast”>说话快。 </ prosody>
<prosody pitch =“ high”>高音调说话。 </ prosody>
<prosody volume =“ loud”>大声说话。 </ prosody>
<prosody rate =“ slow” pitch =“ x-low”>缓慢低沉地说话。 </ prosody>
<prosody rate =“ fast” pitch =“ high” volume =“ medium”>快速、高音调且正常音量说话。 </ prosody>
</ speak>
■ AI语音合成软件“Ondoku”
“Ondoku”是一种在线文本转语音工具,无需初始费用即可使用。
- 支持日语、英语、中文、韩语、西班牙语、法语、德语等约50种语言。
- PC 和智能手机均可使用
- 适用于商务、教育、娱乐等。
- 无需安装,可从浏览器立即使用
- 还支持从图像中读出
要使用它,只需输入文本或从网站上传文件即可。 在几秒钟内生成自然的声音文件。 您可以免费使用最多 5,000 个字符的语音合成,因此请先尝试一下。
Email: ondoku3.com@gmail.com