O que é Linguagem de Marcação de Voz (SSML). Como usar em softwares de conversão de texto em voz e lista dos principais códigos.
19 de Janeiro de 2026
Olá, obrigado por sempre utilizar o Ondoku.
Neste artigo, apresentaremos o SSML.
Pode parecer um pouco difícil por conta de alguns termos técnicos, mas ao saber como usar o SSML, você poderá utilizar o Ondoku de forma ainda mais conveniente.
Explicaremos de forma fácil de entender, por isso, confira.
O que é SSML
O SSML é uma das linguagens de marcação de voz.
Uma "linguagem de marcação" é uma linguagem que define a estrutura (função) de cada parte do texto, assim como o HTML.
Ao escrever códigos SSML, você pode controlar a pronúncia do Ondoku de forma mais conveniente.
Atualmente, os códigos SSML suportados em todos os idiomas são:
Apenas esses dois tipos de código. Outros códigos podem não estar disponíveis dependendo do idioma ou do tipo de voz. Por favor, esteja ciente disso.
Como usar SSML no Ondoku
Usar SSML no Ondoku é muito fácil.
Insira o código SSML diretamente na caixa de texto do Ondoku.
O SSML será aplicado automaticamente.
Basta inserir
no início e no fim do texto para poder usar o SSML.
Não se esqueça de inserir este código! Se o código
Certifique-se de colocar este código no início e no fim do texto que deseja ler.
Exemplo
Insira aqui o texto que deseja ler
O código de break time é, como o nome sugere, um código para criar pausas.
Insira o código onde deseja a pausa e substitua a parte ○○ pelo número de sua preferência.
Ao ler normalmente no Ondoku, às vezes a pausa não ocorre conforme o esperado.
Este código é útil nesses momentos.
Por exemplo,
vamos tentar inserir este código onde queremos uma pausa.
Ao ler este texto, quero abrir uma pequena pausa
Desta forma, você notará que ele faz uma pausa na posição onde o código foi inserido antes de continuar a leitura.
※ 1000ms = 1 segundo
Ao alterar o número antes de ms ou s, você pode ajustar livremente a duração da "pausa".
- 200ms = 0.200 segundos
- 500ms = 0.500 segundos
- 1000ms = 1.000 segundo
- 2000ms = 2.000 segundos
- 3s = 3 segundos, etc.
Pontos de atenção ao usar
O comportamento ao inserir a tag
Exemplo:
Quero criar uma pausa de 5 segundos no início
↑ Usos como este não são possíveis devido às especificações.
Além disso, o limite máximo da duração da pausa é de 10 segundos (10000ms, 10s).
Se definir um tempo maior que esse, ele será arredondado para 10 segundos.
Sobre como usar a tag
〇〇
Esta tag é usada para especificar o idioma de cada parte do texto ao realizar a leitura multilíngue com a voz multilingue (Multilingual) do Ondoku.
Use quando a pronúncia estiver incorreta ou quando houver muitos idiomas no texto e não for possível distingui-los.
日本語のこんにちはは、英語ではHello 、
フランス語ではBonjour 、
ドイツ語ではGuten Tag 、
中国語では你好 といいます。
Sobre como usar a tag
○○
Reproduz o texto na parte ○○ com um som de censura (bipe).
É um código com um pouco de senso de humor. A parte cercada por este código será substituída por um som de bipe.
Esta palavra éproibida
○○
Ao ler o alfabeto, as letras são soletradas (lidas letra por letra).
The spelling of hello isHello
No entanto, este SSML pode resultar em erro em algumas vozes. Por favor, use com ciência disso.
Japonês: Nanami
Inglês (USA): en-US-A
○○
É um código que permite atribuir uma pronúncia (leitura).
Na leitura de texto, às vezes podem ocorrer pronúncias inesperadas.
Por exemplo, se "一行" for pronunciado como "ichiyuki", ao atribuir a leitura "ichigyou", será possível pronunciar corretamente sem erro.
No código, insira o Kanji em ○○ e a pronúncia em ◇◇.
Ler corretamente como 一行 em vez de 一行
○○
Permite enfatizar a leitura do texto cercado pelo código.
Este código permiteenfatizar
○○
Prosódia (prosody) é o termo geral para as características sonoras da linguagem ao falar um inglês natural, tais como:
- Aumento e diminuição do som
- Posições de pausa
- Duração e intensidade, etc.
O que pode ser ajustado com este código são 3 tipos:
- rate (ritmo, velocidade)
Códigos de ajuste: "x-slow", "slow", "medium", "fast", "x-fast", "default" - pitch (tom, altura)
Códigos de ajuste: "x-low", "low", "medium", "high", "x-high", "default" - volume (volume, intensidade)
Códigos de ajuste: "silent", "x-soft", "soft", "medium", "loud", "x-loud", "default"
Pode-se ajustar esses 3 tipos.
Falo rápido.
Falo com voz aguda.
Falo em voz alta.
Falo devagar e com voz grave.
Falo rápido, com voz aguda e em volume normal.
Que tal aproveitar o SSML para usar o Ondoku de forma mais conveniente?
Desta forma, ao utilizar o SSML, você pode usar o Ondoku de forma ainda mais prática!
Que tal aplicar as vozes realistas e fáceis de ouvir do Ondoku de forma mais ampla em produções de vídeo, apresentações e muito mais?
■ Software de síntese de voz AI “Ondoku”
"Ondoku" é uma ferramenta online de conversão de texto em fala que pode ser usada sem custo inicial.
- Suporta aproximadamente 50 idiomas, incluindo japonês, inglês, chinês, coreano, espanhol, francês e alemão.
- Disponível para PC e smartphone
- Adequado para negócios, educação, entretenimento, etc.
- Não requer instalação, pode ser usado imediatamente no seu navegador
- Também suporta leitura de imagens
Para utilizá-lo, basta inserir um texto ou fazer upload de um arquivo do site. Gere arquivos de som naturais em segundos. Você pode usar síntese de voz para até 5.000 caracteres gratuitamente, então experimente primeiro.
Email: ondoku3.com@gmail.com
Software de leitura de texto Ondoku. É um serviço de conversão de texto em voz que não requer instalação e pode ser usado por qualquer pessoa gratuitamente. Se você se registrar gratuitamente, poderá obter até 5.000 caracteres gratuitamente por mês. Registe-se agora gratuitamente