[무료 · 유료] 업체별 음성 합성 엔진 정리. 어떤 소프트웨어가 어떤 엔진을 사용하고 있는지

2021년 1월 17일

[무료 · 유료] 업체별 음성 합성 엔진 정리. 어떤 소프트웨어가 어떤 엔진을 사용하고 있는지

오늘날 많은 문자 음성 변환 소프트웨어가 세상에 발표되고 있습니다.

하지만, 이런 소프트웨어의 음성을 들어보면 

"어? 이 목소리 다른 소프트웨어와 같은거 아냐?"라는 느낌을 받을 때가 있습니다. 

사실 문자 음성 변환 소프트웨어에는 기반이 되는 음성 합성 엔진이 필요합니다.

그러므로 소프트웨어 이름은 달라도 음성 합성 엔진이 같으면 목소리는 동일합니다.

이번에는 무료로 사용할 수 있는 음성 합성 엔진과 유료로 사용할 수 있는 음성 합성 엔진을 각각 소개하겠습니다.

"그 소프트웨어는 이 합성 엔진을 사용하여 있었구나!"라고 알 수 있는 스포일러를 포함하였습니다. 

꼭 기대 해주세요!

무료로 사용할 수있는 음성 합성 엔진

무료로 사용할 수있는 음성 합성 엔진

무료 문자 음성 변환 소프트웨어에는 주로

  • AquesTalk (아쿠에스토크)
  • Open JTalk (오픈 제이 토크)

와 같은 음성 합성 라이브러리 엔진이 사용되고 있습니다.

AquesTalk (아쿠에스토크)

주식회사 AQUEST가 개발한 AquesTalk.

흔한 말로 '느린' 음성으로 읽어주는 소프트웨어는
모두 'AquesTalk'로 만들었습니다. 

대표적으로 말하면, 보우요미짱과 소프트토크입니다.

텍스트에서 쉽게 합성 음성을 생성 할 수 있기 때문에 개인 용도로 상업적 제품까지 다양한 경우에 이용되고있다.
SofTalk과 보우요미짱 소프트웨어의 베이스로 사용되는 것 외에 UTAU 기본 음성 샘플링에 이용되고있다. 더욱이 전화기 등 가전 제품의 안내 음성으로도 사용되고있다.

AquesTalk이 처음 공개 된 것은 2006 년 5 월 25 일. 개발 기간은 2 년 미만. (AquesTalk 공개 exit)
음원수록에  의지 하지 않고 수동으로 매개 변수를 조작해 만들어진 그야말로 사람 목소리가 아닌 순수한 합성 음성이다. 

2010 년 1 월 AquesTalk의 후속 버전 AquesTalk2exit가 발표되었다.
Windows, Mac OS X 및 WinCE iPhone, Android 등 스마트 폰을 포함한 다양한 플랫폼에 대응하고있다. 최근 AquesTalk pico라는 독립적인 마이크로칩 (하드웨어)까지 등장했다.

인용 출처 : 니코 니코 대백과

API 사용 라이선스와 개발용 라이브러리는 별도 판매되고 있습니다. 

자세한 내용은 회사 HP를 확인해 봅시다.

AquestTalk

Open JTalk (오픈 제이 토크)

Open JTalk은 나고야 공업 대학 도쿠다 · 이 연구실에서 개발된 일본어 텍스트 음성 합성 시스템입니다.

수정 BSD 라이선스하에서 배포되는 오픈 소스입니다.

"Open JTalk"는 테키스토크에서 사용되고 있습니다. 한 번 들어 보면 "들어본적 있는 음성"일지도 모릅니다.  

Open JTalk

유료로 사용할 수있는 음성 합성 엔진

유료로 사용할 수있는 음성 합성 엔진

유료 음성 합성 엔진

  • IBM : Watson Text to Speech
  • Google : Text to Speech
  • Amazon : Polly
  • Microsoft : SAPI5

등이 유명합니다.

요금은 수 만 문자까지는 무료 등 매력적인 플랜이 많이 있습니다.

위의 엔진들의 데모는 HP에서 제공되며, 재생하여 들을 수 있습니다. 

음성 합성 엔진은 난이도가 높다

이번에는 음성 합성 엔진을 소개했습니다.

음성 합성 엔진을 사용하여 자신의 문자 음성 변환 소프트웨어를 만들거나 취향에 맞줘 리폼한 소프트웨어를 완성할 수 있습니다. 

하지만 실제로 사용하려고하면 API로 제공되고 있기 때문에 프로그래밍을 하지 못하면 설정이 어렵습니다.

API 란 "Application Programming Interface (애플리케이션 프로그래밍 인터페이스)"의 약자이며, "하나의 기능에 특화 한 프로그램에서 공유 할 수있는 것"과 "소프트웨어의 기능을 공유하는 방법"입니다. 자주 사용하는 기능이 API로 준비되어 있으면, 일부러 처음부터 프로그램을 짤 필요는 없습니다. 필요에 따라 API를 이용하여 효율적으로 개발할 수 있습니다. 

Web API의 경우, 프로그램은 Web 상에 공개되어 외부에서 호출하여 사용할 수 있습니다. 다양한 분야에서 Web API가 공개되어 있습니다만, Web API의 대부분은 무료로 이용이 가능합니다.

예를 들어, API로 타사 사이트에서 최신 정보를 얻을 수 있다면, 자신의 Web 사이트나 어플리케이션에 새로운 기능을 추가하여 서비스를 향상시킬 수 있습니다. 최근에는 스마트폰 어플에 요구되는 수준도 높아지고 있기 때문에 어플리케이션 개발에서 Web API를 사용하는 경우가 일반적입니다. 

출처 : internet academy

문자 음성 변환 소프트웨어를 유료로 제공하고있는 회사는 회사 자체 음성 합성 엔진을 개발하고 있고, 이번에 소개 드린 유료 음성 합성 엔진을 사용하고 있습니다.

"처음부터 음성 합성 엔진을 만들면 되지 않을까?" 라고 

생각할 수도 있지만, 이것은 쉬운 일이 아닙니다.

많은 연구자와 개발자, 돈이 필요한 대단히 큰 작업이 될 것입니다. 

적어도 개인으로 하기에는 어렵고, 회사나 연구 기관 규모로하는 것을 추천합니다.

그래서 API 사용이 어렵다고 느낀다면 유료 문자 음성 변환 소프트웨어를 사용하는 것이 더욱 직관적으로 알기 쉽고 다루기 편합니다. 

문자 음성 변환 소프트웨어는 무료에서 유료에 이르기까지 오늘날 많은 종류가 세상에 발표되고 있습니다.

여러분께서도 마음에 드는 소프트웨어를 꼭 찾으실 수 있습니다. 

아래의 포스팅에서 자세히 정리하였으므로 꼭 체크해주세요!

문자 음성 변환 소프트웨어 추천리스트 7가지 [무료 · 유료]

이 기사가 여러분께 도움이 되었으면 좋겠습니다. 

그럼 다시 만나기를 기대하고 있겠습니다. 

■ AI 음성 합성 소프트웨어 「Ondoku」

Ondoku는 초기 비용 0으로 사용할 수 있는 온라인 텍스트 음성 변환 도구입니다.

  • 일본어, 영어, 중국어, 한국어, 스페인어, 프랑스어, 독일어 등 약 50개 언어에 대응
  • PC·스마트폰 어느쪽에서도 이용 가능
  • 비즈니스·교육·엔터테인먼트 등의 용도에 대응
  • 설치가 필요없고 브라우저에서 즉시 사용 가능
  • 화상으로부터의 독해에도 대응

이용 방법은 사이트에서 텍스트를 입력하거나 파일을 업로드할 뿐. 몇 초 안에 자연스러운 오디오 파일이 생성됩니다. 5,000자까지의 음성 합성이라면 무료로 이용할 수 있으므로, 우선은 한번 시험해 주세요.

문장 독서 소프트웨어 "Ondoku"는 무료로 매월 5000자를 AI 음성으로 읽을 수 있습니다. MP3를 쉽게 다운로드할 수 있어 상용 이용도 가능합니다. 무료 등록을 하면 매월 5000자까지 무료로 텍스트를 음성으로 변환할 수 있습니다. 지금 Ondoku를 사용해보십시오.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
관련 기사