[免费/付费]各公司的语音合成引擎汇总。各个软件都在使用哪个引擎
2021年1月17日
如今已经有众多的语音朗读软件发布于世。
但有时听到语音朗读软件的语音时,
会觉得“嗯?这个语调听起来不是和其他软件一样吗?”
实际上,语音朗读软件里是需要基础的语音合成引擎的。
因此,即使软件名称不同,如果语音合成引擎相同,则语调也相同。
这次,将分别介绍可免费使用的语音合成引擎和付费使用的语音合成引擎。
也许会有类似“啊,那款软件使用的是这个合成引擎!”这样的恍然大悟。
敬请阅读!
可以免费使用的语音合成引擎
免费的语音朗读软件主要有
- AquesTalk
- Open JTalk
这些使用的是语音合成词库引擎。
AquesTalk
AquesTalk由AQUEST株式会社开发。
通常所说的用“舒缓”语调朗读的软件
都是由“ Aques Talk”制作的。
有代表性的就是BouyomiChan和SoftTalk。
由于可以轻易从文本创建合成语音,因此可用于从个人到商业产品的各种情况。
除了SoftTalk和BouyomiChan等基础使用外,还用于采样UTAU默认语音。此外,还用于电话等家用电器的应答语音。AquesTalk于2006年5月25日首次发布。开发周期不到两年。 (AquesTalk公布)
声源不通过采集,而是是通过手动操作参数制作的,并非真人的逼真合成语音。2010年1月,AquesTalk的后继版本AquesTalk 2exit发布。
它支持多种平台,包括Windows,Mac OS X,WinCE,iPhone和Android等智能手机。最近,还出现了一种称为AquesTalk pico的独立微晶片(硬件)。出处: Nico Nico大百科
API使用授权和开发词库单独出售。
有关详情请访问公司网站。
OpenJTalk
OpenJTalk是名古屋工业大学的德田・李研究室研发的日语文本语音合成系统。
它是在修改BSD授权基础上发行的开源软件。
“ Open JTalk”被用于textalk。要是体验一下的话,也许会有“曾经听过”的感觉。
付费使用的语音合成引擎
付费的语音合成引擎中
- IBM:Watson Text to Speech
- Google:Text to Speec
- 亚马逊:Polly
- 微软:SAPI5
都很有名。
它们提供诸如可以免费使用数万字符等诱人的付费方案。
上述软件在官网上提供试用版等内容,可以播放和收听语音。
语音合成引擎的难度很高
这次介绍了语音合成引擎。
通过使用语音合成引擎,可以自己制作语音朗读软件,也可以依照个人喜好对语音朗读软件进行加工。
但如果要实际使用的话,由于它是由API提供的,如果不懂编程的话就很难进行设置 。
API是“应用程序编程接口(Application Programming Interface)”的缩写,表示“用于某种专项功能,并可以共享的程序”或“共享软件功能的机制”。如果将常用功能设置为API,则无需从头开始编程。您可以根据需要使用API以进行有效开发。
对于Web API,该程序在Web上公开,并且可从外部调取使用。 Web API已在各个领域发布,其中许多都可以免费使用。
例如,如果以API的形式从其他公司的网站上获取最新信息,则可向自己的网站或应用程序中添加新功能和改善服务。近年来,智能手机应用程序所需的级别提高,因此在应用程序开发中使用Web API成为普遍情况。
报价来源: internet academy
提供付费版本文本阅读软件的公司会开了自己的语音合成引擎,或者是正在使用此次介绍的付费语音合成引擎。
“说到底,能做出语音合成引擎不就行了吗?”
也许您会这么想,但这并不容易。
这是需要大量的的研究人员、开发人员和资金,过程繁琐的工作。
至少对于个人而言这很困难,建议以公司或研究机构的规模来从事。
因此,如果感觉使用API困难的话,使用付费的语音朗读软件会更直观易懂,操作方便。
语音朗读软件如今从免费到付费,已经发布了很多的种类。
相信一定可以找到您喜欢的软件。
这篇文章中有详细汇总,敬请阅读!
语音朗读软件推荐汇总。也可商用的7种选择[免费和付费]
希望本文对您有所帮助。
下次再见。
■ AI语音合成软件“Ondoku”
“Ondoku”是一种在线文本转语音工具,无需初始费用即可使用。
- 支持日语、英语、中文、韩语、西班牙语、法语、德语等约50种语言。
- PC 和智能手机均可使用
- 适用于商务、教育、娱乐等。
- 无需安装,可从浏览器立即使用
- 还支持从图像中读出
要使用它,只需输入文本或从网站上传文件即可。 在几秒钟内生成自然的声音文件。 您可以免费使用最多 5,000 个字符的语音合成,因此请先尝试一下。
Email: ondoku3.com@gmail.com