음성 합성 생성 언어 (SSML)란. 문장 음성 변환 소프트웨어에서의 사용법과 주요 코드 목록.

2024년 4월 17일

음성 합성 생성 언어 (SSML)란. 문장 음성 변환 소프트웨어에서의 사용법과 주요 코드 목록.

안녕하세요, Ondoku입니다.

 

이번에는 SSML 대해 소개해 보겠습니다.

전문 용어가 나와서 약간 어렵게 느껴질지도 모릅니다.

하지만 이를 알아두면, Ondoku 사용이 훨씬 다양해집니다.

알기 쉽게 설명할테니 꼭 읽어보세요.

SSML 란

먼저 SSML은 음성 합성 생성 언어입니다.

종류로는 HTML과 같은 것입니다.

이 SSML 코드를 작성하여 Ondoku의 발성을 더욱 제어 할 수 있습니다.

Ondoku에서 SSML를 사용하는 방법

Ondoku에서 SSML을 사용하는 것은 매우 간단합니다.

Ondoku 텍스트 상자에 직접 SSML 코드를 입력하십시오.

그러면 자동으로 SSML이 적용됩니다.

문장의 처음과 끝에

<speak> </ speak>

코드를 넣는것을 잊어버리지 않도록 해주세요!<speak> 코드를 넣지 않으면 SSML은 적용되지 않습니다.

<speak> </ speak>

앞에서 서술했듯이 SSML을 활성화하는 데 필요한 코드입니다.

읽을 텍스트의 처음과 끝에 반드시 이 코드를 넣어주세요.

<speak> 여기에 낭독 할 텍스트를 넣어주세요 </ speak>

<break time = "○○ ms"/>

브레이크 타임 코드는 그 이름 그대로 틈을 만들기위한 코드입니다.

틈을 넣고 싶은 곳에 코드를 입력하고 ○○ 부분을 원하는 숫자로 바꾸십시오.

Ondoku에서는 일반적으로 말할때는 "틈"이 없습니다.

대괄호와 구두점을 넣는 방법도 있지만, 그렇게 하면 생각했던 간격으로 틈을 넣을 수 없습니다.

틈을 2 초 이상 길게하려고 하면 제어 하는 것은 더욱 어렵습니다.

하지만,

<break time = "1000ms"/>

라는 코드를 틈을 주고 싶은 곳에 넣어 봅시다.

<speak>
이 문장을 읽을 때 조금 간격 <break time = "1000ms"/>을 주고 싶다
</ speak>

이러면 '음'하고 간격을 두고 얘기 하는 것을 알 수 있습니다.

※ 1000ms = 1 초

ms 또는 s 앞에있는 숫자를 바꿔면 "틈"의 길이는 자유 자재가 됩니다.

200ms = 0.200 초
500ms = 0.500 초
1000ms = 1.000 초
2000ms = 2.000 초
3s = 3 초
10s = 10 초

<say-as interpret-as = "expletive"> ○○ </ say-as>

○○ 부분의 문장을 "삐"라며 방송 금지 소리로 재생합니다.

약간의 장난스러운 코드네요. 이 코드 둘러싸고 있는 부분의 문자는 '삐'소리로 대체됩니다.

<speak>
이 말은 <say-as interpret-as = "expletive"> 방송 금지 </ say-as>입니다
</ speak>

<sub alias = "◇◇"> ○○ </ sub>

요미가나를 달 수 있는 코드입니다.

음성을 읽을 때 예상과는 다르게 읽어질 수 있습니다.

예를 들어 "一行"을 "이치유키"라고 발음하는 것을 "이치교우"이라고 요미가나를 달아서 제대로 발음 할 수 있습니다.

코드는 ○○에 한자, ◇◇에 요미가나를 입력하십시오.

<speak>
이치유키가 아니라 <sub alias = "이치교우"> 一行 </ sub>이라고 정확하게 읽는다
</ speak>

<emphasis> ○○ </ emphasis>

코드를 사용해 문자를 강조해서 읽을 수 있습니다.

<speak>
이 코드는 <emphasis> 강조 </ emphasis>할 수 있습니다.
</ speak>

<prosody> ○○ </ prosody>

푸로소디(prosody · 운율)는 자연스러게 영어를 말할 때의

  • 음의 오르내림
  • 단락의 위치
  • 길이와 강약 등

언어의 소리의 특징을 나타내는 용어입니다.

이 코드에서 조정할 수있는 것은

  • rate (비율, 속도)
    조정 코드 : "x-slow" "slow" "medium" "fast" "x-fast" "default"
  • pitch (횟수, 높이)
    조정 코드 : "x-low" "low" "medium" "high" "x-high" "default"
  • volume (볼륨, 크기)
    조정 코드 : "silent" "x-soft" "soft" "medium" "loud" "x-loud" "default"

의 세 가지를 조정할 수 있습니다.

<speak>
<prosody rate = "fast"> 빠르게 말한다</ prosody>
<prosody pitch = "high"> 높은 목소리로 말한다. </ prosody>
<prosody volume = "loud"> 큰 목소리로 말한다. </ prosody>
<prosody rate = "slow"pitch = "x-low"> 느리고 낮은 목소리로 말한다. </ prosody>
<prosody rate = "fast"pitch = "high"volume = "medium"> 빠르고 높은 목소리, 보통 크기로 말한다. </ prosody>
</ speak>

■ AI 음성 합성 소프트웨어 「Ondoku」

Ondoku는 초기 비용 0으로 사용할 수 있는 온라인 텍스트 음성 변환 도구입니다.

  • 일본어, 영어, 중국어, 한국어, 스페인어, 프랑스어, 독일어 등 약 50개 언어에 대응
  • PC·스마트폰 어느쪽에서도 이용 가능
  • 비즈니스·교육·엔터테인먼트 등의 용도에 대응
  • 설치가 필요없고 브라우저에서 즉시 사용 가능
  • 화상으로부터의 독해에도 대응

이용 방법은 사이트에서 텍스트를 입력하거나 파일을 업로드할 뿐. 몇 초 안에 자연스러운 오디오 파일이 생성됩니다. 5,000자까지의 음성 합성이라면 무료로 이용할 수 있으므로, 우선은 한번 시험해 주세요.

문장 독서 소프트웨어 "Ondoku"는 무료로 매월 5000자를 AI 음성으로 읽을 수 있습니다. MP3를 쉽게 다운로드할 수 있어 상용 이용도 가능합니다. 무료 등록을 하면 매월 5000자까지 무료로 텍스트를 음성으로 변환할 수 있습니다. 지금 Ondoku를 사용해보십시오.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
관련 기사