[정리] 문장이나 텍스트를 가장 사람의 목소리처럼 읽어주는 문자 음성 변환 소프트웨어는 어느 것인지 비교해 보았다

2021년 1월 17일

[정리] 문장이나 텍스트를 가장 사람의 목소리처럼 읽어주는 문자 음성 변환 소프트웨어는 어느 것인지 비교해 보았다

안녕하세요, Ondoku입니다.

문장 음성 변환 소프트웨어를 찾을 때 가장 걱정되는 것은 무엇인가요?

  1. 무료인지 유료인지
  2. 사람이 읽는 것 처럼 읽을 수 있을지 
  3. 속도와 높낮이를 조정이 가능한지 

등 크게 신경 쓰이는 부분은 이 3 가지입니다.

 "실제 사람이 읽는 것처럼 읽을 수 있을까"는 음성을 청취하는 입장에서 매우 중요한 과제입니다. 

계속 진화되고 있는 문자 음성 변환 소프트웨어 산업.

이번에는

  • 일본어 대응 
  • 목소리 조정이 가능

라는 조건에서 어떤 문자 음성 변환 소프트웨어가 가장 사람과 비슷하게 읽어주는지를 조사했습니다. 

유명한 문자 음성 변환 소프트웨어

문자 음성 변환 소프트웨어를 살펴보면 상당히 많은 소프트웨어가 있는 것을 알 수 있습니다.

다만, 자세히 살펴 보면 소프트는 달라도 내장된 음성 합성 엔진이 동일한 경우는 비교적 흔히 있습니다.

예) 보우요미짱과 소프트 토크는 음성 합성 엔진이 동일

음성 합성 엔진이 같으면 음질도 같으므로 이번 검증에서는 소프트는 달라도 동일한 것으로 간주하겠습니다. 

유료 문자 음성 변환 소프트웨어

  • AI 토크
  • VOICEROID
  • 이치타로 (문서 작성 소프트웨어)

무료 문자 음성 변환 소프트웨어

  • 테키스토크
  • SoftTalk (소프트토크)
  • 보우요미짱
  • 코에스테이션
  • Ondoku

문자 음성 변환 소프트웨어의 목소리 기준

텍스트를 얼마나 실제 사람이 읽는 것처럼 느끼는지에 대한 기준은 사람마다 다릅니다.

  • 감정 풍부하게 실어서 읽는가  
  • 간격을 확실히 주면서 억양을 넣어 말하는가 
  • 감탄문이나 호흡을 넣어서 말하는가 

어떤 기준이 있어야 리얼하게 느낄지 

그것은 사람마다 다릅니다. 

이번에는 실제 사람이 읽는 것처럼 느껴지는 기준으로 

적당히 간격을 주면서 억양에 위화감 없이 술술 읽어내려 가는지

에 중점을 두고 비교하겠습니다. 

왜냐하면 감정을 실어서 말하는 기능은 유료 소프트웨어 밖에 없기 때문입니다.

무료도 비교 대상에 포함하고자 하므로 이번에는 이 기준에서 비교를 해 보겠습니다.

비교 대상이되는 원고

비교를하기 위해서는 문자 음성 변환 소프트웨어에 원고를 읽혀야 합니다. 

이번에는 짧은 원고, 게다가 감정을 실지 않아도 위화감이 없는 기상예보의 원고를 선택했습니다. 

전국의 날씨입니다.
도쿄 등 태평양 쪽은 건조하고 맑은 날씨가 계속됩니다.
감기 예방에 유의합시다.
낮부터 밤 사이에 기온입니다.
전국적으로 1 월 같은 추위가 계속 될 것입니다.

그러면 실제로 문자 음성 변환 소프트웨어에 적용해보겠습니다. 

음성 재생 버튼 (▶)을 클릭하면 재생할 수 있습니다.

테키스토크

 

SoftTalk (소프트토크)와 보우요미짱

Ondoku

음성 어시스턴트 

아나운서 A

아나운서 B

AI 토크

노조미

가호

나나코

세이지

안즈

VOICEROID

VOICEROID + 교마치 세이카

VOICEROID + 도우후쿠 키리탄 

이치타로 (문서 작성 소프트웨어)

코에스테이션은 자신의 목소리에 합성해야 하기 때문에 이번에는 제외했습니다.

또한 제가 이치타로를 소유하고 있지 않기 때문에 음성 합성이 아니라 음성으로 들어주십시오. 

무료로 사용이 가능한 문자 음성 변환 소프트웨어 중에서 실제 사람이 목소리와 비슷한건 

  1. Ondoku
  2. 테키스토크
  3. 보우요미짱 

테키스토크는 기계 소리 같은 끽끽 한 소리가 신경이 쓰이고 

보우요미짱은 우물거리는 소리가 나므로 

취향이 나눠질거라고 생각됩니다. 

유료로 사용할 수 있는것은 

  1. VOICEROID
  2. AI 토크

순으로 더욱 사람의 목소리와 비슷하게 읽는다는 인상을 받았습니다. 

또한 유료 소프트웨어에는 음성에 감정과 억양을 실는 기능이 있는것도 있습니다. 

이런 선택지가 있으니 음성 이용의 폭이 더욱 넓어 질 것 같습니다. 

어떤 소프트웨어를 사용할지는 여러분의 취향에 달려있습니다. 

이에 만약 상업적 용도도 생각하고 있다면, 각 소프트웨어의 상업적 사용에 대해서 정리한 기사를 참고해주십시오. 

그럼 당신을 만나기를 기대하고 있겠습니다. 

■ AI 음성 합성 소프트웨어 「Ondoku」

Ondoku는 초기 비용 0으로 사용할 수 있는 온라인 텍스트 음성 변환 도구입니다.

  • 일본어, 영어, 중국어, 한국어, 스페인어, 프랑스어, 독일어 등 약 50개 언어에 대응
  • PC·스마트폰 어느쪽에서도 이용 가능
  • 비즈니스·교육·엔터테인먼트 등의 용도에 대응
  • 설치가 필요없고 브라우저에서 즉시 사용 가능
  • 화상으로부터의 독해에도 대응

이용 방법은 사이트에서 텍스트를 입력하거나 파일을 업로드할 뿐. 몇 초 안에 자연스러운 오디오 파일이 생성됩니다. 5,000자까지의 음성 합성이라면 무료로 이용할 수 있으므로, 우선은 한번 시험해 주세요.

문장 독서 소프트웨어 "Ondoku"는 무료로 매월 5000자를 AI 음성으로 읽을 수 있습니다. MP3를 쉽게 다운로드할 수 있어 상용 이용도 가능합니다. 무료 등록을 하면 매월 5000자까지 무료로 텍스트를 음성으로 변환할 수 있습니다. 지금 Ondoku를 사용해보십시오.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
관련 기사