Как использовать теги SSML в многоязычном озвучивании Ondoku? Использование тега <lang> для мультиязычного голоса

26 января 2026 г.

Как использовать теги SSML в многоязычном озвучивании Ondoku? Использование тега <lang> для мультиязычного голоса


Многоязычное чтение функции Multilingual работает не очень хорошо...
кот

У вас возникли трудности с качественным озвучиванием многоязычных текстов, например, на японском и английском языках?

Функция Multilingual в 『Ondoku』 — это удобная возможность озвучивать многоязычный текст одним типом голоса (диктором).

Поскольку один и тот же голос может читать разные языки, вы можете синтезировать многоязычную речь без ощущения дискомфорта от смены диктора.

Однако,

  • не получается хорошо озвучить текст с использованием большого количества языков;
  • английское произношение звучит как японская катакана;

Бывают случаи, когда AI путается в определении языка и не может правильно его прочитать...

Все в порядке!

В таких ситуациях достаточно использовать «SSML-теги»!

С помощью SSML-тегов вы можете точно указать, какую часть текста на каком языке читать, обеспечивая идеальное переключение.

В этот раз мы объясним, как решить проблему плохого произношения в функции многоязычного чтения 『Ondoku』 с помощью SSML-тегов!

Что можно сделать с помощью многоязычного чтения и SSML-тегов?

Что можно сделать с помощью многоязычного чтения и SSML?

При использовании функции Multilingual (многоязычное чтение) в 『Ondoku』 мы рекомендуем активно применять SSML-теги!

Сочетание функции многоязычного чтения 『Ondoku』 и SSML-тегов позволяет реализовать выражения, которые ранее были невозможны.

Главное преимущество заключается в возможности свободно смешивать и озвучивать несколько языков в одном тексте.

Функция многоязычного чтения Ondoku работает так:

次の英文を聞いてください。My name is Yuki and I'm a high school student.

Если это простое предложение, где легко отличить японскую часть от английской, как в этом примере, AI может успешно определить язык и озвучить его.

Однако в случае со сложными текстами озвучивание может не удаться.

Например, если используется слишком много языков, как в этом примере, AI может неверно определить язык.

Пример использования множества языков:

日本語のこんにちはは、英語ではHello、フランス語ではBonjour、ドイツ語ではGuten Tag、中国語では你好といいます。

Кроме того, при чтении текста, где английский смешан с японским, английская часть иногда произносится с акцентом катаканы.

Пример произношения как на катакане:

バナナは、英語では banana と発音します。

Если озвучивание не получается, можно озвучивать каждый язык отдельно и соединять аудиофайлы, но процесс редактирования очень трудоемок.

Но не волнуйтесь!

В таких случаях использование SSML-тегов обеспечит плавное чтение!

При использовании SSML-тегов для того же текста оба предложения озвучиваются с правильным произношением.


日本語のこんにちはは、英語ではHello
フランス語ではBonjour
ドイツ語ではGuten Tag
中国語では你好といいます。


バナナは、英語では banana と発音します。

Давая AI указания через SSML-теги, например, «отсюда читай на английском» или «отсюда на французском», вы можете создавать аудио с идеальной интонацией, что избавляет от необходимости редактирования и склеивания разных файлов.

Теперь давайте подробно разберем, как использовать SSML!

Как правильно писать тег в SSML? Способ указания языка

Как правильно писать тег <lang> в SSML? Способ указания языка

Использовать SSML-теги очень просто.

Достаточно просто «зажать» нужный текст между тегами.

Как писать тег в SSML для указания языка

Чтобы указать язык с помощью SSML-тегов, сначала заключите весь текст в тег .


Текст, который нужно прочитать

Затем заключите фрагмент, для которого нужно указать язык, в тег .


Текст, который нужно прочитать

В качестве конкретного примера: если вы хотите, чтобы слово «Hello» было прочитано с американским английским произношением, напишите следующее:


Hello

Просто написав так, AI поймет: «Этот фрагмент нужно читать с американским английским произношением».

Если вы хотите переключить язык посреди предложения, просто вставьте этот тег в то место, где вы хотите начать чтение на другом языке.

Что такое языковой код? Базовые знания для переключения языков

Части тега, такие как en-US или ja-JP, называются «языковыми кодами».

Они состоят из комбинации «языка» и «региона». В случае английского языка, американский английский будет «en-US», а британский — «en-GB».

Даже для одного и того же языка использование разных кодов позволяет точно указать акцент и произношение, характерные для конкретной страны.

Основные языковые коды приведены ниже:

Язык Языковой код
Японский ja-JP
Английский (США) en-US
Английский (Великобритания) en-GB
Французский fr-FR
Немецкий de-DE
Испанский es-ES
Итальянский it-IT
Русский ru-RU
Китайский (упрощенный) zh-CN
Корейский ko-KR

Когда вы привыкнете, вы сможете пробовать разные языки, просто меняя эту часть кода.

Однако на первых порах, чтобы избежать ошибок в написании, рекомендуется просто копировать и использовать шаблоны, представленные ниже.

【Копирование разрешено】10 популярных языков! Список шаблонов SSML

Мы собрали теги для основных языков, используемых во всем мире.

Просто скопируйте SSML-тег целиком из этой таблицы и вставьте его в текстовое поле 『Ondoku』, чтобы легко озвучить текст на нескольких языках!

Язык SSML-тег для копирования
Японский Текст здесь
Английский (США) Текст здесь
Английский (Великобритания) Текст здесь
Французский Текст здесь
Немецкий Текст здесь
Испанский Текст здесь
Итальянский Текст здесь
Русский Текст здесь
Китайский (упрощенный) Текст здесь
Корейский Текст здесь

Поскольку коды для американского и британского английского разделены, вы можете четко передать различия в акценте.

Если ошибиться хотя бы в одном символе тега, он не сработает, поэтому рекомендуем копировать их из этой таблицы!

Практика! Примеры использования и способы многоязычного чтения по сценариям

Теперь, когда вы знаете, как писать SSML-теги, давайте рассмотрим конкретные примеры использования и способы, которыми они могут быть полезны в реальных ситуациях!

【Бесплатно】Инструкция по созданию многоязычного аудио в Ondoku

Чтобы создать многоязычное аудио в 『Ondoku』, сначала откройте главную страницу 『Ondoku』.

Ondoku

Для начала введите текст в текстовое поле.

В этот раз мы будем использовать пример предложения, которое трудно прочитать с помощью обычной функции Multilingual, о чем говорилось в начале.

Здесь используются японский, английский, французский, немецкий и китайский языки.

日本語のこんにちはは、英語ではHello、フランス語ではBonjour、ドイツ語ではGuten Tag、中国語では你好といいます。

Далее добавьте SSML-теги к тексту.

В таком тексте, где:

  • Основной текст на японском языке
  • Иностранные языки используются лишь частично

То есть в предложениях, где основной язык четко понятен, достаточно добавить SSML-теги только к тем частям, где используются другие языки.

(Метод на случай, если этот способ не сработает, описан далее в этой статье. Пожалуйста, ознакомьтесь с ним)

В этот раз введите SSML-теги для четырех языков, кроме японского:

  • Английский: Текст здесь
  • Французский: Текст здесь
  • Немецкий: Текст здесь
  • Китайский: Текст здесь

После ввода SSML-тегов текст будет выглядеть так:


日本語のこんにちはは、英語ではHello
フランス語ではBonjour
ドイツ語ではGuten Tag
中国語では你好といいます。

※ Вы также можете сначала ввести SSML-теги в текстовом редакторе (например, в Блокноте), а затем скопировать и вставить их.

При вводе этого содержимого в текстовое поле получится следующее:

Ввод в текстовое поле

Также рекомендуется использовать сервисы генеративного AI для ввода SSML-тегов

собака
Но вводить столько тегов вручную — это слишком утомительно!

Не беспокойтесь!

Используя сервисы генеративного AI, такие как ChatGPT, Gemini или Claude, вы сможете легко расставить SSML-теги!

Способ добавления SSML-тегов с помощью генеративного AI очень прост.

Пожалуйста, добавьте теги lang формата SSML для каждого языка.

(Здесь текст, который вы хотите озвучить)

Дав такое указание, вы сможете автоматически вставить SSML-теги во весь текст.

Вставка SSML-тегов в Gemini

Если вы хотите внести исправления, например: «Я хочу озвучить не на американском английском, а на британском», просто скажите:

Исправьте с американского английского на британский английский.

И AI мгновенно заменит на .

Советы по выбору голоса для многоязычного чтения

Выберите «Multilingual» в списке языков.

Выбор «Multilingual» в списке языков

Затем выберите голос (диктора).

Выбор голоса

Поскольку в этом случае иностранные слова встроены в японский текст, мы выбрали японский голос «Masaru(ja)».

Образцы многоязычных голосов, поддерживающих функцию Multilingual, можно прослушать в этой статье.

Обязательно ознакомьтесь с ней.

Теперь подготовка к озвучиванию завершена.

Подготовка завершена

Нажмите «Озвучить», чтобы начать синтез речи.

Синтез речи завершится всего за несколько секунд.

После завершения обработки экран переключится, и появится аудиоплеер.

Обработка завершена

Таким образом, удалось автоматически определить языки, используемые в тексте, и озвучить их.

На этом процесс озвучивания многоязычного текста с помощью функции Multilingual в 『Ondoku』 завершен!

Нажав «Скачать», вы сможете сохранить аудиофайл в формате MP3.

Функция Multilingual (многоязычное чтение) может быть полезна в самых разных ситуациях: учебные материалы по иностранным языкам, видео для YouTube на зарубежную аудиторию, информационные объявления для иностранных туристов и многое другое.

Почему бы и вам не попробовать создать аудио, используя функцию Multilingual в 『Ondoku』 бесплатно?

Как добавить SSML-теги в текст, где трудно определить основной язык

В примерах, разобранных до этого момента, японский язык был основным, поэтому озвучивание прошло успешно при добавлении тегов к другим частям (английскому, французскому и т. д.).

Однако в текстах, где трудно понять, какой язык является основным (например, в списках слов для изучения языка), AI может не всегда верно определить язык.

В таких случаях добавляйте теги ко всему тексту целиком.

Например,

Список английских слов на тему кулинарии
Кухня Kitchen
Рецепт Recipe
Сковорода Frying pan
Нож Knife
Приправы Seasoning

Если вы хотите озвучить этот текст, сделайте так:


    料理に関する英単語集
    キッチンKitchen
    レシピRecipe
    フライパンFrying pan
    包丁Knife
    調味料Seasoning

Таким образом, озвучивание пройдет успешно, если добавить SSML-теги ко всем частям: и к японским, и к английским.

В функции SSML в Ondoku также можно настраивать паузы в речи!

В предыдущем примере «Списка английских слов на тему кулинарии» на самом деле использовался не только тег , но и SSML-тег .

Это SSML-тег для регулировки пауз в аудио.

Используя этот тег, вы сможете добиться еще более естественного чтения текста в 『Ondoku』.

В этой статье объясняется, как настраивать паузы в речи с помощью SSML-тегов, обязательно ознакомьтесь с ней.

Также общее руководство по использованию SSML-тегов в 『Ondoku』 приведено в этой статье.

Пожалуйста, посмотрите.

Хотите попробовать возможности многоязычного чтения в Ondoku?

В этот раз мы рассказали об SSML-тегах, которые можно использовать для многоязычного чтения в 『Ondoku』.

Просто используя «тег lang», описанный в этой статье, вы сможете значительно расширить сферу применения 『Ondoku』!

  • Добавление английских фраз в закадровый голос для видео на YouTube
  • Создание полноценных учебных материалов для аудирования по английскому или другим иностранным языкам
  • Создание многоязычных объявлений для трансляции в магазинах

В зависимости от ваших идей, вы сможете создавать самый разнообразный многоязычный контент.

Мы надеемся, что 『Ondoku』 будет полезен в вашей деятельности, будь то многоязычный YouTube или объявления в магазинах и учреждениях!

■ Программное обеспечение для синтеза речи с искусственным интеллектом «Ondoku».

«Ондоку» — это онлайн-инструмент для преобразования текста в речь, который можно использовать без каких-либо первоначальных затрат.

  • Поддерживает около 50 языков, включая японский, английский, китайский, корейский, испанский, французский и немецкий.
  • Доступно как с ПК, так и со смартфона
  • Подходит для бизнеса, образования, развлечений и т. д.
  • Установка не требуется, можно использовать сразу из браузера.
  • Также поддерживает чтение изображений

Чтобы им воспользоваться, просто введите текст или загрузите файл с сайта. Создавайте естественные звуковые файлы за считанные секунды. Вы можете бесплатно использовать синтез речи длиной до 5000 символов, поэтому сначала попробуйте.

Программное обеспечение для преобразования текста в речь «Ondoku» может считывать 5000 символов каждый месяц с помощью голоса AI бесплатно. Вы можете легко скачать MP3, а также возможно коммерческое использование. Если вы зарегистрируетесь бесплатно, вы сможете бесплатно конвертировать до 5000 символов в месяц из текста в речь. Попробуйте Ондоку прямо сейчас.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Смежная статья

Программа для чтения текста Ondoku. Это сервис для преобразования текста в речь, который не требует установки и доступный всем для бесплатного использования. Если вы зарегистрируетесь бесплатно, вы сможете получать до 5000 символов бесплатно каждый месяц. Зарегестрируйтесь сейчас бесплатно