O que é Linguagem de Marcação de Voz (SSML). Como usar em softwares de conversão de texto em voz e lista dos principais códigos.

19 de Janeiro de 2026

Olá, obrigado por sempre utilizar o Ondoku.

Neste artigo, apresentaremos o SSML.

Pode parecer um pouco difícil por conta de alguns termos técnicos, mas ao saber como usar o SSML, você poderá utilizar o Ondoku de forma ainda mais conveniente.

Explicaremos de forma fácil de entender, por isso, confira.

O que é SSML

O SSML é uma das linguagens de marcação de voz.

Uma "linguagem de marcação" é uma linguagem que define a estrutura (função) de cada parte do texto, assim como o HTML.

Ao escrever códigos SSML, você pode controlar a pronúncia do Ondoku de forma mais conveniente.

Atualmente, os códigos SSML suportados em todos os idiomas são:

Apenas esses dois tipos de código. Outros códigos podem não estar disponíveis dependendo do idioma ou do tipo de voz. Por favor, esteja ciente disso.

Como usar SSML no Ondoku

Usar SSML no Ondoku é muito fácil.

Insira o código SSML diretamente na caixa de texto do Ondoku.

O SSML será aplicado automaticamente.

Basta inserir

no início e no fim do texto para poder usar o SSML.

Não se esqueça de inserir este código! Se o código não estiver presente, o SSML não será aplicado.

é o código necessário para ativar o SSML.

Certifique-se de colocar este código no início e no fim do texto que deseja ler.

Exemplo

Insira aqui o texto que deseja ler

O código de break time é, como o nome sugere, um código para criar pausas.

Insira o código onde deseja a pausa e substitua a parte ○○ pelo número de sua preferência.

Ao ler normalmente no Ondoku, às vezes a pausa não ocorre conforme o esperado.

Este código é útil nesses momentos.

Por exemplo,

vamos tentar inserir este código onde queremos uma pausa.

Ao ler este texto, quero abrir uma pequena pausa

Desta forma, você notará que ele faz uma pausa na posição onde o código foi inserido antes de continuar a leitura.

※ 1000ms = 1 segundo

Ao alterar o número antes de ms ou s, você pode ajustar livremente a duração da "pausa".

200ms = 0.200 segundos
500ms = 0.500 segundos
1000ms = 1.000 segundo
2000ms = 2.000 segundos
3s = 3 segundos, etc.

Pontos de atenção ao usar

O comportamento ao inserir a tag no início de todo o texto varia dependendo da voz, e o funcionamento não pode ser garantido.

Exemplo: Quero criar uma pausa de 5 segundos no início

↑ Usos como este não são possíveis devido às especificações.

Além disso, o limite máximo da duração da pausa é de 10 segundos (10000ms, 10s).

Se definir um tempo maior que esse, ele será arredondado para 10 segundos.

Sobre como usar a tag , também explicamos neste artigo.

Ondoku: Como ajustar pausas e tempos em branco na leitura 【2 tipos】｜Software de leitura de texto Ondoku

Uma das necessidades dos usuários do Ondoku é "querer abrir um pouco mais de pausa". Se o ajuste for para pequenas pausas, existem dois tipos de métodos: 1. Sinais de pontuação 2. SSML.

〇〇

Esta tag é usada para especificar o idioma de cada parte do texto ao realizar a leitura multilíngue com a voz multilingue (Multilingual) do Ondoku.

Use quando a pronúncia estiver incorreta ou quando houver muitos idiomas no texto e não for possível distingui-los.

日本語のこんにちはは、英語ではHello、
フランス語ではBonjour、
ドイツ語ではGuten Tag、
中国語では你好といいます。

Sobre como usar a tag , explicamos detalhadamente neste artigo.

Como usar tags SSML na leitura multilíngue do Ondoku? Como usar a tag <lang> para voz multilingue｜Software de leitura de texto Ondoku

Como usar tags SSML na leitura multilíngue do Ondoku? Como usar a tag para voz multilingue｜Software de leitura de texto Ondoku

Explicação de como usar tags SSML na função multilíngue do Ondoku. Inclui modelos que podem ser copiados e colados. Ideal para produção de vídeos no YouTube e materiais didáticos de idiomas!

○○

Reproduz o texto na parte ○○ com um som de censura (bipe).

É um código com um pouco de senso de humor. A parte cercada por este código será substituída por um som de bipe.

Esta palavra é proibida

○○

Ao ler o alfabeto, as letras são soletradas (lidas letra por letra).

The spelling of hello isHello

No entanto, este SSML pode resultar em erro em algumas vozes. Por favor, use com ciência disso.

Japonês: Nanami

Inglês (USA): en-US-A

_○○

É um código que permite atribuir uma pronúncia (leitura).

Na leitura de texto, às vezes podem ocorrer pronúncias inesperadas.

Por exemplo, se "一行" for pronunciado como "ichiyuki", ao atribuir a leitura "ichigyou", será possível pronunciar corretamente sem erro.

No código, insira o Kanji em ○○ e a pronúncia em ◇◇.

Ler corretamente como _一行 em vez de 一行

○○

Permite enfatizar a leitura do texto cercado pelo código.

Este código permite enfatizar

○○

Prosódia (prosody) é o termo geral para as características sonoras da linguagem ao falar um inglês natural, tais como:

Aumento e diminuição do som
Posições de pausa
Duração e intensidade, etc.

O que pode ser ajustado com este código são 3 tipos:

rate (ritmo, velocidade)
Códigos de ajuste: "x-slow", "slow", "medium", "fast", "x-fast", "default"
pitch (tom, altura)
Códigos de ajuste: "x-low", "low", "medium", "high", "x-high", "default"
volume (volume, intensidade)
Códigos de ajuste: "silent", "x-soft", "soft", "medium", "loud", "x-loud", "default"

Pode-se ajustar esses 3 tipos.

Falo rápido.
Falo com voz aguda.
Falo em voz alta.
Falo devagar e com voz grave.
Falo rápido, com voz aguda e em volume normal.

Que tal aproveitar o SSML para usar o Ondoku de forma mais conveniente?

Desta forma, ao utilizar o SSML, você pode usar o Ondoku de forma ainda mais prática!

Que tal aplicar as vozes realistas e fáceis de ouvir do Ondoku de forma mais ampla em produções de vídeo, apresentações e muito mais?

■ Software de síntese de voz AI “Ondoku”

"Ondoku" é uma ferramenta online de conversão de texto em fala que pode ser usada sem custo inicial.

Suporta aproximadamente 50 idiomas, incluindo japonês, inglês, chinês, coreano, espanhol, francês e alemão.
Disponível para PC e smartphone
Adequado para negócios, educação, entretenimento, etc.
Não requer instalação, pode ser usado imediatamente no seu navegador
Também suporta leitura de imagens

Para utilizá-lo, basta inserir um texto ou fazer upload de um arquivo do site. Gere arquivos de som naturais em segundos. Você pode usar síntese de voz para até 5.000 caracteres gratuitamente, então experimente primeiro.

Converta texto em áudio agora

O software de conversão de texto em fala "Ondoku" pode ler 5.000 caracteres todos os meses com voz AI gratuitamente. Você pode facilmente baixar MP3s e o uso comercial também é possível. Se você se inscrever gratuitamente, poderá converter até 5.000 caracteres por mês gratuitamente de texto em fala. Experimente o Ondoku agora.

HP: ondoku3.com
Email: ondoku3.com@gmail.com

←Artigo anterior | Artigo seguinte→