Что такое язык разметки синтеза речи (SSML)? Как использовать его в программном обеспечении для преобразования текста в речь и список основного кода.

17 апреля 2024 г.

Что такое язык разметки синтеза речи (SSML)? Как использовать его в программном обеспечении для преобразования текста в речь и список основного кода.


Здравствуйте, добро пожаловать на сайт Ондоку.

Сегодня мы хотели бы представить SSML.

Вы можете столкнуться с трудностями из-за некоторых технических терминов.

Однако, если вы это знаете, это будет иметь огромное значение в том, как вы используете Ondoku.

Пожалуйста, прочтите его, поскольку мы стараемся сделать его легким для понимания.

Что такое SSML?

Прежде всего, SSML означает язык разметки синтеза речи.

Он похож на HTML.

Написав этот код SSML, вы можете дополнительно контролировать речь Ондоку.

Как использовать SSML с Ondoku

Использовать SSML в Ондоку очень просто.

Пожалуйста, введите код SSML непосредственно в текстовое поле Ondoku.

SSML будет применен автоматически.

Не забудьте включить

<speak> </speak>

в начале и в конце кода! Без кода <speak> SSML применяться не будет.

<speak> </speak>

Как упоминалось ранее, это код для активации SSML.

Обязательно включите этот код в начало и конец текста, который вы хотите преобразовать в речь.

пример

<speak> Введите здесь текст, который вы хотите преобразовать из текста в речь </speak>

<break time = "○○ мс" />

Как следует из названия, временной код перерыва - это код для создания паузы.

Введите код, в который вы хотите вставить время перерыва, и замените ○○ желаемым числом.

Речь, сгенерированная Ондоку, не будет иметь "паузы", если не указано иное.

Вы можете сделать паузу при помощи скобок или знаков препинания, но эти паузы могут быть установлены не так, как вы хотите.

Особенно, если вам нужно время перерыва более 2 секунд, его будет сложнее контролировать.

Однако если вы введете

<break time = "1000 мс" />

в то место, где нужно поставить паузу,

<говорить>
Я хочу перерыв <break time = "1000ms" /> при чтении этого предложения.
</speak>

вы услышите паузу в середине предложения.

* 1000 мс = 1 секунда

Вы можете свободно изменять число перед ms или s, чтобы контролировать длину паузы.

200 мс = 0,200 секунды
500 мс = 0,500 секунды
1000 мс = 1.000 секунд
2000 мс = 2.000 секунд
3с = 3 секунды
10 с = 10 секунд и т. Д.

<say-as convert-as = "expletive"> ○○ </say-as>

С помощью этого кода текст в ○○ будет воспроизводиться со звуковым сигналом для звукового сигнала цензора.

Это своего рода шутливый код. Текст, заключенный в этот код, будет заменен звуковым сигналом.

<говорить>
Это слово <say-as толковать-as = "expletive"> запрещено </say-as>
</speak>

<sub alias = "◇◇"> ○○ </sub>

Это код, который позволяет указать произношение.

Иногда, когда вы используете преобразование текста в речь, вы можете услышать слово, произнесенное неожиданным образом.

Например, вы можете заставить программу произносить слово «一行» в одну строку как «Итигё», тогда как система произносит его как «Итиюки».

В качестве кода введите кандзи для ○○ и произношение для ◇◇.

<говорить>
Правильно произносится как <sub alias = "Ichigyo"> 一行 </sub> вместо Ichiyuki
</speak>

<emphasis> ○○ </emphasis>

Вы можете выделить текст, заключенный в код, в речи.

<говорить>
Этот код <emphasis> выделяет текст </emphasis>
</speak>

<prosody> ○○ </prosody>

Просодия - это лингвистический термин, описывающий правила естественного разговорного английского языка, включая

  • Интонация (повышающаяся и понижающаяся высота)
  • Положение паузы
  • Продолжительность звука и ударения и т. Д.

С помощью этих кодов вы можете настроить следующие 3 элемента просодии:

  • Скорость (скорость, скорость)
    Код: "x-slow" "slow" "medium" "fast" "x-fast" "default"
  • Шаг (шаг, высота)
    Код: «x-низкий» «низкий» «средний» «высокий» «x-высокий» «по умолчанию»
  • Объем (объем, размер)
    Код: «тихий» «x-soft» «мягкий» «средний» «громкий» «x-громкий» «по умолчанию»

<говорить>
<prosody rate = "fast"> Говори быстро. </prosody>
<prosody pitch = "high"> Говорите высоким голосом. </prosody>
<prosody volume = "громко"> Говорите громко. </prosody>
<prosody rate = "slow" pitch = "x-low"> Говорите медленно и низким голосом. </prosody>
<prosody rate = "fast" pitch = "high" volume = "medium"> Говорите быстро, высоким голосом и с нормальной громкостью. </prosody>
</speak>

■ Программное обеспечение для синтеза речи с искусственным интеллектом «Ondoku».

«Ондоку» — это онлайн-инструмент для преобразования текста в речь, который можно использовать без каких-либо первоначальных затрат.

  • Поддерживает около 50 языков, включая японский, английский, китайский, корейский, испанский, французский и немецкий.
  • Доступно как с ПК, так и со смартфона
  • Подходит для бизнеса, образования, развлечений и т. д.
  • Установка не требуется, можно использовать сразу из браузера.
  • Также поддерживает чтение изображений

Чтобы им воспользоваться, просто введите текст или загрузите файл с сайта. Создавайте естественные звуковые файлы за считанные секунды. Вы можете бесплатно использовать синтез речи длиной до 5000 символов, поэтому сначала попробуйте.

Программное обеспечение для преобразования текста в речь «Ondoku» может считывать 5000 символов каждый месяц с помощью голоса AI бесплатно. Вы можете легко скачать MP3, а также возможно коммерческое использование. Если вы зарегистрируетесь бесплатно, вы сможете бесплатно конвертировать до 5000 символов в месяц из текста в речь. Попробуйте Ондоку прямо сейчас.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Смежная статья

Программа для чтения текста Ondoku. Это сервис для преобразования текста в речь, который не требует установки и доступный всем для бесплатного использования. Если вы зарегистрируетесь бесплатно, вы сможете получать до 5000 символов бесплатно каждый месяц. Зарегестрируйтесь сейчас бесплатно