【無料・有料】 各社の音声合成エンジンまとめ。どのソフトがどのエンジンを使ってるのか
2021年1月17日
今日では多くの音声読み上げソフトが世に発表されています。
ですが、音声読み上げソフトの音声を聞いてみると
「あれ?この声色、他のソフトと同じじゃないかな?」というものがあります。
実は、音声読み上げソフトにはベースとなる音声合成エンジンが必要なのです。
なので、ソフト名は違っても音声合成エンジンが同じであれば声色は同じです。
今回は、無料で使用することができる音声合成エンジン、有料で使用できる音声合成エンジンをそれぞれ紹介していきます。
「あ、あのソフトはこの合成エンジンを使っていたんだ!」と思うようなネタバレも。
ぜひ、楽しみにしてくださいね!
無料で使用できる音声合成エンジン
フリーの音声読み上げソフトは主に、
- AquesTalk(アクエストーク)
- Open JTalk(オープンジェートーク)
という音声合成ライブラリ・エンジンが使われています。
AquesTalk(アクエストーク)
株式会社AQUESTが開発している、AquesTalk。
俗にいう「ゆっくり」と呼ばれる声色で読み上げる事ができるソフトは、
すべて「AquesTalk」で作られています。
代表的なものでいえば、棒読みちゃんやソフトークです。
テキストから簡単に合成音声が作成できるため、個人利用から商業製品まで様々な場面で利用されている。
SofTalkや棒読みちゃん等のベースで使用されている他、UTAUデフォルトの音声にもサンプリングで利用されている。更には電話機などの家電製品の案内音声としても使われている。AquesTalkが最初に公開されたのは2006年5月25日。開発期間は2年弱とのこと。(AquesTalk 公開exit)
音源は収録によらず手作業でパラメータを操作して作られている、まさしく中の人のいない生粋の合成音声である。2010年1月AquesTalkの後継バージョン、AquesTalk2exitが発表された。
Windows、Mac OS XやWinCE、iPhone、Androidなどスマートフォンを含めた幅広いプラットフォームに対応している。最近ではAquesTalk picoなる独立したマイクロチップ(ハードウェア)まで登場した。引用元:ニコニコ大百科
APIの使用ライセンスや開発用ライブラリは別途販売されていたりします。
詳しくは会社HPを確認してみましょう。
Open JTalk(オープンジェートーク)
Open JTalkは名古屋工業大学徳田・李研究室で開発された、日本語テキスト音声合成システムです。
修正BSDライセンスの元で配布されている、オープンソースです。
「Open JTalk」はテキストークで使用されています。一度聞いてみると「聞いたことある」となるかもしれません。
有料で使用できる音声合成エンジン
有料の音声合成エンジンは
- IBM:Watson Text to Speech
- Google:Text to Speech
- Amazon:Polly
- Microsoft:SAPI5
などが有名です。
料金は数万文字までは無料など、魅力的なプランがたくさんあります。
上記のものは、デモなどはHP上で提供されており、再生して音声を聞くことはできます。
音声合成エンジンは難易度が高い
今回は音声合成エンジンを紹介しました。
音声合成エンジンを使うことで、自分自身で音声読み上げソフトを作ったり、好みにカスタマイズした音声読み上げソフトに仕上げることができます。
ですが、実際に使用しようとするとAPIで提供されているため、プログラミングができないと設定が難しいです。
APIとは「Application Programming Interface(アプリケーション・プログラミング・インターフェイス)」の略語であり、「ある1つの機能に特化したプログラムで共有可能なもの」や「ソフトウェアの機能を共有する仕組み」のことです。よく使う機能がAPIとして用意されていれば、わざわざ一からプログラムを組む必要はありません。必要に応じてAPIを利用し、効率的に開発を進められます。
Web APIの場合、プログラムはWeb上に公開され、外部から呼び出して利用します。さまざまな分野でWeb APIが公開されていますが、Web APIの多くは無料で利用が可能です。
例えば、APIで他社サイトから最新情報を取得できれば、自分のWebサイトやアプリに新たな機能を追加し、サービスを向上させることができます。近年はスマホアプリに求められるレベルも高くなっているため、アプリ開発においてWeb APIを利用するケースが一般的になっています。
引用元:internet academy
音声読み上げソフトを有料版で提供している会社は、各社独自に音声合成エンジンを開発していたり、今回紹介した有料の音声合成エンジンを使用しています。
「そもそも、音声合成エンジンを作ればいいんじゃない?」
と思うかもしれません、ですが、これは簡単なことではありません。
たくさんの研究者と、開発者、お金が必要な大変なプロセスが必要な作業になるでしょう。
少なくとも、個人では難しく、会社や研究機関規模ですることをオススメします。
なので、APIの使用が難しいと感じる場合、有料の音声読み上げソフトを使用する方が直感的にわかりやすく、扱いやすいです。
音声読み上げソフトは無料のものから有料のものまで、今日では多くの種類のソフトが世に発表されています。
あなたのお気に入りのソフトもきっと見つかると思います。
こちらの記事で詳しくまとめているので、ぜひ、チェックしてみてくださいね!
音声読み上げソフトのオススメまとめ。7選【無料・有料】
この記事があなたのお役に立てることを願っています。
それでは、また会えるのを楽しみにしています。
■ AI音声合成ソフト『音読さん』
『音読さん』は初期費用ゼロで利用できるオンラインテキスト読み上げツールです。
- 日本語、英語、中国語、韓国語、スペイン語、フランス語、ドイツ語など約50の言語に対応
- パソコン・スマホどちらからも利用可能
- ビジネス・教育・エンターテインメントなどの用途に対応
- インストール不要でブラウザから即利用可能
- 画像からの読み上げにも対応
利用方法はサイトからテキストを入力するかファイルをアップロードするだけ。 数秒で自然な音声ファイルが生成されます。 5,000文字までの音声合成なら無料で利用できますので、まずは一度お試しください。
Email: ondoku3.com@gmail.com