Что такое язык разметки синтеза речи (SSML). Способы использования в программах для чтения текста и список основных кодов.

26 января 2026 г.

Что такое язык разметки синтеза речи (SSML). Способы использования в программах для чтения текста и список основных кодов.

Здравствуйте, благодарим вас за то, что вы всегда пользуетесь Ondoku.

В этой статье мы расскажем об SSML.

Может показаться, что это сложно из-за использования некоторых специальных терминов, но знание того, как использовать SSML, позволит вам использовать Ondoku еще более эффективно.

Мы объясним всё простыми словами, поэтому, пожалуйста, ознакомьтесь с материалом.

Что такое SSML

SSML — это один из языков разметки синтеза речи.

«Язык разметки» — это язык, который, подобно HTML, определяет структуру (роль) каждой части текста.

Написание кода SSML позволяет вам более удобно управлять произношением Ondoku.

На данный момент кодами SSML, поддерживаемыми для всех языков, являются только следующие два типа:

Другие коды могут быть недоступны в зависимости от языка или типа голоса. Пожалуйста, примите это во внимание.

Как использовать SSML в Ondoku

Использовать SSML в Ondoku очень просто.

Просто введите код SSML непосредственно в текстовое поле Ondoku.

После этого SSML будет применен автоматически.

Вы можете использовать SSML, просто вставив

в начало и в конец текста.

Не забудьте вставить этот код! Без кода SSML не будет применен.

— это необходимый код для активации SSML.

Обязательно ставьте этот код в начале и в конце текста, который вы хотите озвучить.

Пример

Введите здесь текст, который вы хотите озвучить

Код break time (время паузы), как и следует из названия, — это код для создания пауз.

Введите код в том месте, где вы хотите сделать паузу, и замените «○○» на нужное число.

При обычном чтении в Ondoku паузы могут не всегда соответствовать вашим ожиданиям.

В таких случаях этот код будет очень полезен.

Например,

давайте вставим этот код в то место, где нужна пауза.


Я хочу сделать небольшуюпаузу при чтении этого предложения

Вы заметите, что система делает паузу в месте вставки кода, а затем продолжает чтение.

※ 1000ms = 1 секунда

Изменяя число перед ms или s, вы можете свободно менять длительность паузы.

  • 200ms = 0,200 секунды
  • 500ms = 0,500 секунды
  • 1000ms = 1,000 секунда
  • 2000ms = 2,000 секунды
  • 3s = 3 секунды и т. д.

Меры предосторожности при использовании

Поведение при вставке тега в самое начало всего текста зависит от конкретного голоса, и его работа не гарантируется.

Пример: Я хочу сделать 5-секундную паузу в начале

↑ Такое использование невозможно в силу технических особенностей.

Также максимальная длительность паузы составляет 10 секунд (10000ms, 10s).

Если вы установите более длительное время, оно будет сокращено до 10 секунд.

Использование тега также подробно описано в этой статье.

〇〇

Этот тег используется для указания языка для каждой части текста при многоязычном озвучивании с использованием мультиязычных голосов (Multilingual) в Ondoku.

Он используется, когда произношение неверное или когда в тексте используется много языков и их невозможно определить автоматически.


Японское «konnichiwa» по-английски будет Hello,
по-французски — Bonjour,
по-немецки — Guten Tag,
а по-китайски — 你好.

Использование тега подробно описано в этой статье.

○○

Текст в части «○○» воспроизводится со звуком «пи», имитирующим сигнал цензуры.

Этот код добавляет немного игрового элемента. Слова, заключенные в этот код, будут заменены звуковым сигналом.


Это слово — запрещено к трансляции

○○

При чтении латинского алфавита текст будет произноситься по буквам (spell-out).


The spelling of hello isHello

Однако для некоторых голосов использование этого SSML может привести к ошибке. Пожалуйста, используйте с пониманием этого факта.

Японский: Nanami

Английский (США): en-US-A

○○

Этот код позволяет задать чтение (транскрипцию) для слова.

Иногда при чтении текста слова могут произноситься неожиданным образом.

Например, если слово «一行» (одна строка) произносится неправильно, вы можете указать нужное чтение, чтобы оно гарантированно произносилось верно.

В коде введите иероглифы (или слово) в поле ○○, а чтение — в поле ◇◇.


Читайте правильно: 一行

○○

Вы можете выделить текст, заключенный в этот код, чтобы он произносился с акцентом.


Этот код позволяет сделать акцент

○○

Просодия (prosody, интонация) — это общий термин для характеристик звуков языка при естественной речи, таких как:

  • повышение и понижение тона
  • места пауз
  • длительность и интенсивность и т. д.

С помощью этого кода можно настроить следующие три параметра:

  • rate (темп, скорость)
    Коды настройки: «x-slow», «slow», «medium», «fast», «x-fast», «default»
  • pitch (высота тона)
    Коды настройки: «x-low», «low», «medium», «high», «x-high», «default»
  • volume (громкость)
    Коды настройки: «silent», «x-soft», «soft», «medium», «loud», «x-loud», «default»


Я говорю быстро.
Я говорю высоким голосом.
Я говорю громко.
Я говорю медленно и низким голосом.
Я говорю быстро, высоким голосом и с обычной громкостью.

Почему бы не попробовать использовать Ondoku еще эффективнее с помощью SSML?

Как видите, использование SSML позволяет сделать работу с Ondoku еще удобнее!

Почему бы не расширить область применения реалистичного и разборчивого голоса Ondoku в создании видео, презентациях и многом другом?

■ Программное обеспечение для синтеза речи с искусственным интеллектом «Ondoku».

«Ондоку» — это онлайн-инструмент для преобразования текста в речь, который можно использовать без каких-либо первоначальных затрат.

  • Поддерживает около 50 языков, включая японский, английский, китайский, корейский, испанский, французский и немецкий.
  • Доступно как с ПК, так и со смартфона
  • Подходит для бизнеса, образования, развлечений и т. д.
  • Установка не требуется, можно использовать сразу из браузера.
  • Также поддерживает чтение изображений

Чтобы им воспользоваться, просто введите текст или загрузите файл с сайта. Создавайте естественные звуковые файлы за считанные секунды. Вы можете бесплатно использовать синтез речи длиной до 5000 символов, поэтому сначала попробуйте.

Программное обеспечение для преобразования текста в речь «Ondoku» может считывать 5000 символов каждый месяц с помощью голоса AI бесплатно. Вы можете легко скачать MP3, а также возможно коммерческое использование. Если вы зарегистрируетесь бесплатно, вы сможете бесплатно конвертировать до 5000 символов в месяц из текста в речь. Попробуйте Ондоку прямо сейчас.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Смежная статья

Программа для чтения текста Ondoku. Это сервис для преобразования текста в речь, который не требует установки и доступный всем для бесплатного использования. Если вы зарегистрируетесь бесплатно, вы сможете получать до 5000 символов бесплатно каждый месяц. Зарегестрируйтесь сейчас бесплатно