【무료·유료】 각사의 음성 합성 엔진 정리. 어떤 소프트웨어가 어떤 엔진을 사용하는지 소개
2026년 1월 26일
현재, 많은 텍스트 읽어주기 소프트웨어가 발표되고 있습니다.
하지만, 텍스트 읽어주기 소프트웨어의 음성을 들어보면 "어라? 이 목소리, 다른 소프트웨어와 같지 않나?"라고 느낄 때가 있습니다.
사실, 텍스트 읽어주기 소프트웨어에는 베이스가 되는 음성 합성 엔진이 필요합니다.
그래서 소프트웨어 이름은 달라도 음성 합성 엔진이 같다면 목소리는 같습니다.
이번에는 무료로 사용할 수 있는 음성 합성 엔진과 유료로 사용할 수 있는 음성 합성 엔진을 각각 소개해 드리겠습니다.
"아, 저 소프트웨어는 이 합성 엔진을 사용하고 있었구나!"라고 생각할 만한 정보도 있습니다.
꼭 확인해 보세요!
무료로 사용할 수 있는 음성 합성 엔진

무료 텍스트 읽어주기 소프트웨어는 주로,
- AquesTalk(아퀘스토크)
- Open JTalk(오픈제이토크)
라는 음성 합성 라이브러리·음성 엔진이 사용되고 있습니다.
AquesTalk(아퀘스토크)
주식회사 AQUEST가 개발하고 있는 AquesTalk은 '유쿠리 보이스', '보요미 보이스'로 알려져 있습니다.
흔히 '유쿠리'라고 불리는 목소리로 읽어줄 수 있는 소프트웨어는 모두 'AquesTalk'을 채택하고 있습니다.
대표적인 것으로는 보요미쨩이나 소프트워크(SofTalk)가 있습니다.
텍스트에서 간단하게 합성 음성을 생성할 수 있어, 개인 이용부터 상업 제품까지 다양한 분야에서 이용되고 있다.
SofTalk이나 보요미쨩 등의 베이스로 사용되고 있는 것 외에도, UTAU 기본 음성에도 샘플링으로 이용되고 있다. 나아가 전화기 등의 가전제품 안내 음성으로도 사용되고 있다.AquesTalk이 처음 공개된 것은 2006년 5월 25일. 개발 기간은 2년 미만이라고 한다. (AquesTalk 공개 exit)
음원은 녹음에 의존하지 않고 수작업으로 파라미터를 조작하여 만들어진, 그야말로 성우가 없는 순수한 합성 음성이다.2010년 1월 AquesTalk의 후속 버전인 AquesTalk2 exit가 발표되었다.
Windows, Mac OS X 및 WinCE, iPhone, Android 등 스마트폰을 포함한 폭넓은 플랫폼에 대응하고 있다. 최근에는 AquesTalk pico라는 독립된 마이크로칩(하드웨어)까지 등장했다.출처: 니코니코 대백과
API 사용 라이선스나 개발용 라이브러리가 제공되고 있어, 프로그래밍 기술이 있다면 다양한 용도로 사용 가능합니다.
자세한 내용은 회사 홈페이지를 확인해 보세요.
유쿠리 보이스에 대해서는 이 기사에서도 해설하고 있습니다.
【2025년 최신】유쿠리 보이스·보요미 소프트 추천 5선|PC 및 스마트폰 앱 완전 비교|텍스트 읽어주기 소프트웨어 Ondoku
영상 제작이나 게임 실황에 최적인 유쿠리 보이스·보요미 소프트를 엄선하여 소개. PC부터 스마트폰까지, 2025년 최신 앱으로 누구나 쉽게 고품질 음성을 만드는 방법을 해설합니다.
Open JTalk(オープンジェートーク)
Open JTalk은 나고야 공업 대학 토쿠다·리 연구실에서 개발된 일본어 텍스트 음성 합성 시스템입니다.
수정 BSD 라이선스에 따라 배포되는 오픈 소스입니다.
'Open JTalk'은 테키스토크(Textalk)에서 사용되고 있습니다. 한 번 들어보시면 "들어본 적 있다"고 느끼실지도 모릅니다.
유료로 사용할 수 있는 음성 합성 엔진

유료 음성 합성 엔진은
- IBM:Watson Text to Speech
- Google:Text to Speech
- Amazon:Polly
- Microsoft:SAPI5
등이 유명합니다.
수만 자까지 무료 등 매력적인 플랜이 많이 있습니다.
위의 유료 음성 합성 엔진은 홈페이지에서 데모가 제공되고 있어, 재생하여 음성을 들어볼 수 있습니다.
음성 합성 엔진은 난이도가 높다
이번에는 음성 합성 엔진에 대해 소개했습니다.
음성 합성 엔진을 사용하면 직접 텍스트 읽어주기 소프트웨어를 만들거나, 취향에 맞게 커스터마이징한 텍스트 읽어주기 소프트웨어로 완성할 수 있습니다.
하지만 실제로 사용하려고 할 경우, API로 제공되기 때문에 프로그래밍을 할 수 없으면 설정이 어렵습니다.
API란 'Application Programming Interface(애플리케이션 프로그래밍 인터페이스)'의 약어이며, '어느 한 기능에 특화된 프로그램으로 공유 가능한 것'이나 '소프트웨어의 기능을 공유하는 메커니즘'을 말합니다. 자주 사용하는 기능이 API로 준비되어 있으면 굳이 처음부터 프로그램을 짤 필요가 없습니다. 필요에 따라 API를 이용해 효율적으로 개발을 진행할 수 있습니다.
Web API의 경우 프로그램은 웹상에 공개되어 외부에서 호출하여 이용합니다. 다양한 분야에서 Web API가 공개되어 있는데, Web API의 상당수는 무료로 이용이 가능합니다.
예를 들어, API로 타사 사이트에서 최신 정보를 가져올 수 있다면 자신의 웹사이트나 앱에 새로운 기능을 추가하여 서비스를 향상시킬 수 있습니다. 최근에는 스마트폰 앱에 요구되는 수준도 높아지고 있기 때문에 앱 개발에서 Web API를 이용하는 경우가 일반화되고 있습니다.
출처: internet academy
텍스트 읽어주기 소프트웨어를 유료 버전으로 제공하는 회사는 각사 독자적으로 음성 합성 엔진을 개발하거나, 이번에 소개한 유료 음성 합성 엔진을 사용하고 있습니다.
"애초에 음성 합성 엔진을 만들면 되는 거 아니야?"
라고 생각할 수도 있지만, 이것은 간단한 일이 아닙니다.
수많은 연구자와 개발자, 자금이 필요한 고된 프로세스가 필요한 작업이 될 것입니다.
적어도 개인으로서는 어렵고, 회사나 연구 기관 정도의 규모가 아니면 현실적이지 않습니다.
따라서 API 사용이 어렵게 느껴지는 경우, 유료 텍스트 읽어주기 소프트웨어를 사용하는 것이 직관적으로 이해하기 쉽고 다루기 편리합니다.
무료부터 유료까지 많은 종류의 텍스트 읽어주기 소프트웨어가 발표되고 있습니다.
당신이 마음에 들어 하는 소프트웨어도 분명 찾을 수 있을 것입니다.
이 기사에서 자세히 정리해 두었으니 꼭 체크해 보세요!
【2025년 최신】추천 텍스트 읽어주기 소프트웨어 10선! 상업적 이용 가능한 무료 소프트웨어도 소개|텍스트 읽어주기 소프트웨어 Ondoku
텍스트 읽어주기 소프트웨어 추천 비교! 설치가 필요 없는 브라우저형부터 고기능 데스크톱형까지, 무료·프리로 상업적 이용이 가능한 툴을 포함해 엄선하여 소개.
이 기사가 여러분께 도움이 되기를 바랍니다.
그럼, 다음에 또 만날 수 있기를 기대하겠습니다.
■ AI 음성 합성 소프트웨어 「Ondoku」
Ondoku는 초기 비용 0으로 사용할 수 있는 온라인 텍스트 음성 변환 도구입니다.
- 일본어, 영어, 중국어, 한국어, 스페인어, 프랑스어, 독일어 등 약 50개 언어에 대응
- PC·스마트폰 어느쪽에서도 이용 가능
- 비즈니스·교육·엔터테인먼트 등의 용도에 대응
- 설치가 필요없고 브라우저에서 즉시 사용 가능
- 화상으로부터의 독해에도 대응
이용 방법은 사이트에서 텍스트를 입력하거나 파일을 업로드할 뿐. 몇 초 안에 자연스러운 오디오 파일이 생성됩니다. 5,000자까지의 음성 합성이라면 무료로 이용할 수 있으므로, 우선은 한번 시험해 주세요.
Email: ondoku3.com@gmail.com
텍스트 음성 변환 소프트웨어 Ondoku. 설치할 필요 없이 누구나 무료로 이용할 수 있는 텍스트 음성 변환 서비스입니다. 무료 등록을 하면 매월 5000자까지 무료로 할 수 있습니다 지금 무료 등록