¿Qué es el lenguaje de marcado de voz (SSML)? Cómo usarlo en software de lectura de texto y lista de los principales códigos.

22 de julio de 2026

Hola, gracias por usar siempre Ondoku.

En este artículo presentaremos el SSML.

Puede que aparezcan algunos términos técnicos y parezca difícil, pero al aprender a usar SSML podrá utilizar Ondoku de forma más conveniente.

Lo explicaremos de forma sencilla, así que por favor eche un vistazo.

¿Qué es SSML?

SSML es un tipo de lenguaje de marcado de voz.

Un "lenguaje de marcado" es un lenguaje que, al igual que el HTML, define la estructura (función) de cada parte del texto.

Al escribir código SSML, puede controlar la locución de Ondoku de manera más conveniente.

Actualmente, los códigos SSML compatibles con todos los idiomas son:

solo estos dos tipos de códigos. Otros códigos no pueden utilizarse dependiendo del idioma o del tipo de voz. Tenga esto en cuenta de antemano.

Cómo usar SSML en Ondoku

Es muy fácil usar SSML en Ondoku.

Introduzca el código SSML directamente en el cuadro de texto de Ondoku.

Entonces, el SSML se aplicará automáticamente.

Puede usar SSML simplemente insertando

al principio y al final del texto.

¡Asegúrese de no olvidar incluir este código! Si no se incluye el código , el SSML no se aplicará.

es el código necesario para habilitar SSML.

Asegúrese de colocar este código al principio y al final del texto que desea leer.

Ejemplo

Introduzca aquí el texto que desea leer

El código de break time es, como su nombre indica, un código para crear pausas.

Introduzca el código donde desee insertar una pausa y sustituya la parte "○○" por el número que prefiera.

Al leer normalmente con Ondoku, es posible que los espacios no se inserten con el intervalo deseado.

Este código es útil en tales casos.

Por ejemplo,

intentemos insertar este código donde queramos una pausa.

Quiero hacer una pequeña pausa al leer este texto

Entonces, podrá notar que hace una pausa en la posición donde se insertó el código antes de continuar leyendo.

※ 1000ms = 1 segundo

Al cambiar el número antes de "ms" o "s", puede cambiar libremente la duración de la "pausa".

200ms = 0.200 segundos
500ms = 0.500 segundos
1000ms = 1.000 segundo
2000ms = 2.000 segundos
3s = 3 segundos, etc.

Precauciones al usar

El comportamiento al insertar la etiqueta al principio de todo el texto varía según la voz y no se puede garantizar su funcionamiento.

Ejemplo: Quiero crear una pausa de 5 segundos al inicio

↑ Este tipo de uso no es posible debido a las especificaciones.

Además, el límite máximo de duración de la pausa es de 10 segundos (10000ms, 10s).

Si se establece un tiempo superior, se redondeará a 10 segundos.

El uso de la etiqueta también se explica en este artículo.

Cómo ajustar las pausas y tiempos de silencio en la locución de Ondoku [2 tipos] | Software de lectura de texto Ondoku

Una de las necesidades de los usuarios de Ondoku es "querer dejar un poco más de espacio". Para ajustar la "pausa", existen dos métodos: 1. Signos de puntuación 2. SSML.

〇〇

Esta etiqueta se utiliza para especificar el idioma de cada parte del texto al realizar una lectura multilingüe (Multilingual) con las voces multilingües de Ondoku.

Se utiliza cuando la pronunciación es incorrecta o cuando no se puede identificar el idioma debido a que se utilizan muchos idiomas en el texto.

"Hola" en japonés se dice Hello en inglés,
Bonjour en francés,
Guten Tag en alemán,
y 你好 en chino.

El uso de la etiqueta se explica detalladamente en este artículo.

¿Cómo usar etiquetas SSML en la lectura multilingüe de Ondoku? Uso de la etiqueta <lang> en voces multilingües | Software de lectura de texto Ondoku

¿Cómo usar etiquetas SSML en la lectura multilingüe de Ondoku? Uso de la etiqueta en voces multilingües | Software de lectura de texto Ondoku

Explicación de cómo usar etiquetas SSML con la función multilingüe de Ondoku. Incluye plantillas que se pueden copiar y pegar. ¡Ideal para videos de YouTube y creación de materiales de enseñanza de idiomas!

○○

Reproduce el texto en la parte ○○ con un sonido de "pitido" de censura.

Es un código con un toque lúdico. Los caracteres en la parte rodeada por este código serán reemplazados por un sonido de pitido.

Esta palabra está prohibida

○○

Al leer el alfabeto, se deletrea cada letra (lectura por deletreo).

The spelling of hello is Hello

Sin embargo, este SSML puede causar errores en algunas voces. Por favor, utilícelo teniendo esto en cuenta.

Japonés: Nanami

Inglés (USA): en-US-A

_○○

Este código permite asignar una lectura fonética.

En la lectura de textos, a veces se producen pronunciaciones inesperadas.

Por ejemplo, si el término "一行" se pronuncia de forma incorrecta, puede asegurar la pronunciación correcta asignando la lectura fonética adecuada.

En el código, introduzca el kanji en ○○ y la lectura en ◇◇.

Lee correctamente como _一行 en lugar de ichiyuki

○○

Permite enfatizar los caracteres rodeados por el código durante la lectura.

Este código permite enfatizar

○○

Prosodia (prosody) es un término general que describe las características del sonido de un idioma al hablar de forma natural, tales como:

Subida y bajada del tono
Posiciones de pausa
Longitud y énfasis, etc.

Con este código puede ajustar los siguientes tres tipos:

rate (velocidad)
Códigos de ajuste: "x-slow", "slow", "medium", "fast", "x-fast", "default"
pitch (tono)
Códigos de ajuste: "x-low", "low", "medium", "high", "x-high", "default"
volume (volumen)
Códigos de ajuste: "silent", "x-soft", "soft", "medium", "loud", "x-loud", "default"

Hablo rápido.
Hablo con voz aguda.
Hablo en voz alta.
Hablo lento y con voz grave.
Hablo rápido, con voz aguda y volumen normal.

¿Por qué no aprovecha SSML para usar Ondoku de forma más conveniente?

¡De esta manera, puede utilizar Ondoku de forma aún más conveniente aprovechando SSML!

¿Por qué no utiliza las voces realistas y claras de Ondoku en una gama más amplia de aplicaciones, como producción de videos o presentaciones?

■ Software de síntesis de voz con IA “Ondoku”

"Ondoku" es una herramienta de conversión de texto a voz en línea que se puede utilizar sin costo inicial.

Admite aproximadamente 50 idiomas, incluidos japonés, inglés, chino, coreano, español, francés y alemán.
Disponible tanto desde PC como desde teléfono inteligente
Adecuado para negocios, educación, entretenimiento, etc.
No requiere instalación, puede usarse inmediatamente desde su navegador
También admite la lectura de imágenes.

Para usarlo, simplemente ingrese texto o cargue un archivo desde el sitio. Genere archivos de sonido naturales en segundos. Puede utilizar la síntesis de voz de hasta 5000 caracteres de forma gratuita, así que pruébelo primero.

El software de texto a voz "Ondoku" puede leer 5000 caracteres cada mes con voz AI de forma gratuita. Puede descargar MP3 fácilmente y también es posible el uso comercial. Si te registras gratis, puedes convertir hasta 5000 caracteres por mes de forma gratuita de texto a voz. Prueba Ondoku ahora.

HP: ondoku3.com
Email: ondoku3.com@gmail.com

←Artículo anterior | Artículo siguiente→