什么是语音标记语言(SSML)。在文本转语音软件中的用法及主要代码一览。

2026年1月19日

什么是语音标记语言(SSML)。在文本转语音软件中的用法及主要代码一览。

您好,感谢您一直以来使用Ondoku。

本篇文章将为您介绍SSML

虽然文中会涉及一些专业术语,可能会让您觉得有些深奥,但了解 SSML 的用法能让您更方便地使用 Ondoku。

我们将进行简单易懂的讲解,请务必查看。

什么是 SSML

SSML语音标记语言的一种。

“标记语言”与 HTML 类似,是为文本的各个部分定义结构(作用)的语言。

通过编写 SSML 代码,您可以更方便地控制 Ondoku 的发音

目前,所有语言都支持的 SSML 代码仅有

这 2 种代码。其他代码根据语言或语音类型的不同可能无法使用。敬请谅解。

在 Ondoku 中使用 SSML 的方法

在 Ondoku 中使用 SSML 非常简单。

请直接在 Ondoku 的文本框中输入 SSML 代码。

之后 SSML 会自动应用。

只需在文章的开头和结尾插入

即可使用 SSML。

请不要忘记添加此代码!如果没有 代码,SSML 将不会生效。

是启用 SSML 所需的代码。

请务必在想要朗读的文本开头和结尾放入此代码。

示例

请在这里输入想要朗读的文本

停顿(Break Time)代码正如其名,是用于制造间隙的代码

在想要加入停顿的地方输入代码,并将 ○○ 部分替换为喜欢的数字。

在 Ondoku 中进行普通朗读时,有时停顿可能不会如您预期的那样出现。

在这种情况下,该代码就能派上用场。

例如,

让我们在想要加入停顿的地方插入上述代码。


在朗读这段文字时想稍微停顿一下

这样您就可以发现,在插入代码的位置会稍作停顿,然后再继续朗读。

※ 1000ms = 1秒

通过更改 ms 或 s 前面的数字,您可以自由地改变“间隙”的长度。

  • 200ms = 0.200秒
  • 500ms = 0.500秒
  • 1000ms = 1.000秒
  • 2000ms = 2.000秒
  • 3s = 3秒 等

使用 时的注意事项

在整篇文章的最开头插入 标签时的运行效果因语音而异,无法保证正常运行。

例:想在开头制造5秒的间隙

↑ 根据规格,无法进行此类使用。

此外,间隙长度的上限为 10 秒(10000ms,10s)

如果设置更长的时间,将被缩减为 10 秒。

关于 标签的使用方法,也可参考这篇文章。

〇〇

此标签用于在 Ondoku 的多语言语音(Multilingual)进行多语言朗读时,为文本的各个部分指定语言。

当出现读错的情况,或者文章中使用了多种语言无法辨别时使用。


日语的“こんにちは”,在英语中是Hello
法语中是Bonjour
德语中是Guten Tag
中文则是你好

关于 标签的使用方法,在下篇文章中有详细讲解。

○○

将 ○○ 部分的文章以“哔——”的放送禁止音(消音)播放。

这是一个带点趣味性的代码。被该代码包围部分的文字将替换为“哔”的声音。


这个词是禁止播出

○○

在朗读字母时,会按字符逐一拼读(Spell out)。


The spelling of hello isHello

但是,某些语音可能会导致此 SSML 报错。请在知悉的前提下使用。

日语:Nanami

英语(USA):en-US-A

○○

这是一个可以为文字添加注音的代码。

在文章朗读中,有时会出现出人意料的读音。

例如,当“一行”被误读为“いちゆき”时,通过添加注音“いちぎょう”,就可以实现准确发音。

在代码中,请在 ○○ 处输入汉字,在 ◇◇ 处输入注音。


不是一行,而是正确读作一行

○○

可以强调被代码包围的文字并进行朗读。


此代码可以实现强调

○○

韵律(prosody)是指在说自然英语时的:

  • 声音的起伏
  • 停顿位置
  • 长度和强弱等,

是描述语言声音特征的总称。

通过此代码可以调整的内容有:

  • rate(语速、快慢)
    调整代码:「x-slow」「slow」「medium」「fast」「x-fast」「default」
  • pitch(音高、高低)
    调整代码:「x-low」「low」「medium」「high」「x-high」「default」
  • volume(音量、大小)
    调整代码:「silent」「x-soft」「soft」「medium」「loud」「x-loud」「default」

这 3 种属性。


用快语速说话。
用高音调说话。
用大声音说话。
用缓慢且低沉的声音说话。
用快速、高音调、中等音量说话。

想尝试通过活用 SSML 让 Ondoku 变得更方便吗?

就像这样,活用 SSML 可以让 Ondoku 使用起来更加便利!

无论是视频制作还是演示文稿,想不想在更广泛的场景中活用 Ondoku 真实且易听的语音呢?

■ AI语音合成软件“Ondoku”

“Ondoku”是一种在线文本转语音工具,无需初始费用即可使用。

  • 支持日语、英语、中文、韩语、西班牙语、法语、德语等约50种语言。
  • PC 和智能手机均可使用
  • 适用于商务、教育、娱乐等。
  • 无需安装,可从浏览器立即使用
  • 还支持从图像中读出

要使用它,只需输入文本或从网站上传文件即可。 在几秒钟内生成自然的声音文件。 您可以免费使用最多 5,000 个字符的语音合成,因此请先尝试一下。

文字转语音软件“Ondoku”每月可免费朗读5000个汉字AI语音。 您可以轻松下载 MP3,也可以用于商业用途。 如果您免费注册,每月可以免费将最多 5,000 个字符从文本转换为语音。 立即尝试 Ondoku。
HP: ondoku3.com
Email: ondoku3.com@gmail.com
|
相关文章

语音朗读软件Ondoku。这是一种无需安装,任何人都可以免费使用的语音朗读服务。 如果您免费注册,每月最多可以免费获得 5000 个字符。 现在免费注册