[정리] 문장이나 텍스트를 가장 사람의 목소리처럼 읽어주는 문자 음성 변환 소프트웨어는 어느 것인지 비교해 보았다

2020년 10월 1일

안녕하세요, Ondoku입니다.

문장 음성 변환 소프트웨어를 찾을 때 가장 걱정되는 것은 무엇인가요?

  1. 무료인지 유료인지
  2. 사람이 읽는 것 처럼 읽을 수 있을지 
  3. 속도와 높낮이를 조정이 가능한지 

등 크게 신경 쓰이는 부분은 이 3 가지입니다.

 "실제 사람이 읽는 것처럼 읽을 수 있을까"는 음성을 청취하는 입장에서 매우 중요한 과제입니다. 

계속 진화되고 있는 문자 음성 변환 소프트웨어 산업.

이번에는

  • 일본어 대응 
  • 목소리 조정이 가능

라는 조건에서 어떤 문자 음성 변환 소프트웨어가 가장 사람과 비슷하게 읽어주는지를 조사했습니다. 

유명한 문자 음성 변환 소프트웨어

문자 음성 변환 소프트웨어를 살펴보면 상당히 많은 소프트웨어가 있는 것을 알 수 있습니다.

다만, 자세히 살펴 보면 소프트는 달라도 내장된 음성 합성 엔진이 동일한 경우는 비교적 흔히 있습니다.

예) 보우요미짱과 소프트 토크는 음성 합성 엔진이 동일

음성 합성 엔진이 같으면 음질도 같으므로 이번 검증에서는 소프트는 달라도 동일한 것으로 간주하겠습니다. 

유료 문자 음성 변환 소프트웨어

  • AI 토크
  • VOICEROID
  • 이치타로 (문서 작성 소프트웨어)

무료 문자 음성 변환 소프트웨어

  • 테키스토크
  • SoftTalk (소프트토크)
  • 보우요미짱
  • 코에스테이션
  • Ondoku

문자 음성 변환 소프트웨어의 목소리 기준

텍스트를 얼마나 실제 사람이 읽는 것처럼 느끼는지에 대한 기준은 사람마다 다릅니다.

  • 감정 풍부하게 실어서 읽는가  
  • 간격을 확실히 주면서 억양을 넣어 말하는가 
  • 감탄문이나 호흡을 넣어서 말하는가 

어떤 기준이 있어야 리얼하게 느낄지 

그것은 사람마다 다릅니다. 

이번에는 실제 사람이 읽는 것처럼 느껴지는 기준으로 

적당히 간격을 주면서 억양에 위화감 없이 술술 읽어내려 가는지

에 중점을 두고 비교하겠습니다. 

왜냐하면 감정을 실어서 말하는 기능은 유료 소프트웨어 밖에 없기 때문입니다.

무료도 비교 대상에 포함하고자 하므로 이번에는 이 기준에서 비교를 해 보겠습니다.

비교 대상이되는 원고

비교를하기 위해서는 문자 음성 변환 소프트웨어에 원고를 읽혀야 합니다. 

이번에는 짧은 원고, 게다가 감정을 실지 않아도 위화감이 없는 기상예보의 원고를 선택했습니다. 

전국의 날씨입니다.
도쿄 등 태평양 쪽은 건조하고 맑은 날씨가 계속됩니다.
감기 예방에 유의합시다.
낮부터 밤 사이에 기온입니다.
전국적으로 1 월 같은 추위가 계속 될 것입니다.

그러면 실제로 문자 음성 변환 소프트웨어에 적용해보겠습니다. 

음성 재생 버튼 (▶)을 클릭하면 재생할 수 있습니다.

테키스토크

 

SoftTalk (소프트토크)와 보우요미짱

Ondoku

음성 어시스턴트 

아나운서 A

아나운서 B

AI 토크

노조미

가호

나나코

세이지

안즈

VOICEROID

VOICEROID + 교마치 세이카

VOICEROID + 도우후쿠 키리탄 

이치타로 (문서 작성 소프트웨어)

코에스테이션은 자신의 목소리에 합성해야 하기 때문에 이번에는 제외했습니다.

또한 제가 이치타로를 소유하고 있지 않기 때문에 음성 합성이 아니라 음성으로 들어주십시오. 

무료로 사용이 가능한 문자 음성 변환 소프트웨어 중에서 실제 사람이 목소리와 비슷한건 

  1. Ondoku
  2. 테키스토크
  3. 보우요미짱 

테키스토크는 기계 소리 같은 끽끽 한 소리가 신경이 쓰이고 

보우요미짱은 우물거리는 소리가 나므로 

취향이 나눠질거라고 생각됩니다. 

유료로 사용할 수 있는것은 

  1. VOICEROID
  2. AI 토크

순으로 더욱 사람의 목소리와 비슷하게 읽는다는 인상을 받았습니다. 

또한 유료 소프트웨어에는 음성에 감정과 억양을 실는 기능이 있는것도 있습니다. 

이런 선택지가 있으니 음성 이용의 폭이 더욱 넓어 질 것 같습니다. 

어떤 소프트웨어를 사용할지는 여러분의 취향에 달려있습니다. 

이에 만약 상업적 용도도 생각하고 있다면, 각 소프트웨어의 상업적 사용에 대해서 정리한 기사를 참고해주십시오. 

그럼 당신을 만나기를 기대하고 있겠습니다. 

텍스트 음성 변환 소프트웨어 Ondoku입니다. Ondoku에서 무료로 최대 5,000자까지 텍스트를 읽을 수 있습니다. 문장은 고품질의 음성으로 낭독되며 MP3로 다운로드도 할 수 있습니다. 또한, 상업적으로도 이용 가능하니 Ondoku를 이용해 주시길 바랍니다.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
관련 기사