¿Qué es el lenguaje de marcado de voz (SSML)? Cómo usarlo en software de lectura de texto y lista de los principales códigos.
19 de enero de 2026
Hola, gracias por usar siempre Ondoku.
En este artículo presentaremos el SSML.
Puede que aparezcan algunos términos técnicos y parezca difícil, pero al aprender a usar SSML podrá utilizar Ondoku de forma más conveniente.
Lo explicaremos de forma sencilla, así que por favor eche un vistazo.
¿Qué es SSML?
SSML es un tipo de lenguaje de marcado de voz.
Un "lenguaje de marcado" es un lenguaje que, al igual que el HTML, define la estructura (función) de cada parte del texto.
Al escribir código SSML, puede controlar la locución de Ondoku de manera más conveniente.
Actualmente, los códigos SSML compatibles con todos los idiomas son:
solo estos dos tipos de códigos. Otros códigos no pueden utilizarse dependiendo del idioma o del tipo de voz. Tenga esto en cuenta de antemano.
Cómo usar SSML en Ondoku
Es muy fácil usar SSML en Ondoku.
Introduzca el código SSML directamente en el cuadro de texto de Ondoku.
Entonces, el SSML se aplicará automáticamente.
Puede usar SSML simplemente insertando
al principio y al final del texto.
¡Asegúrese de no olvidar incluir este código! Si no se incluye el código
Asegúrese de colocar este código al principio y al final del texto que desea leer.
Ejemplo
Introduzca aquí el texto que desea leer
El código de break time es, como su nombre indica, un código para crear pausas.
Introduzca el código donde desee insertar una pausa y sustituya la parte "○○" por el número que prefiera.
Al leer normalmente con Ondoku, es posible que los espacios no se inserten con el intervalo deseado.
Este código es útil en tales casos.
Por ejemplo,
intentemos insertar este código donde queramos una pausa.
Quiero hacer una pequeña pausa al leer este texto
Entonces, podrá notar que hace una pausa en la posición donde se insertó el código antes de continuar leyendo.
※ 1000ms = 1 segundo
Al cambiar el número antes de "ms" o "s", puede cambiar libremente la duración de la "pausa".
- 200ms = 0.200 segundos
- 500ms = 0.500 segundos
- 1000ms = 1.000 segundo
- 2000ms = 2.000 segundos
- 3s = 3 segundos, etc.
Precauciones al usar
El comportamiento al insertar la etiqueta
Ejemplo:
Quiero crear una pausa de 5 segundos al inicio
↑ Este tipo de uso no es posible debido a las especificaciones.
Además, el límite máximo de duración de la pausa es de 10 segundos (10000ms, 10s).
Si se establece un tiempo superior, se redondeará a 10 segundos.
El uso de la etiqueta
〇〇
Esta etiqueta se utiliza para especificar el idioma de cada parte del texto al realizar una lectura multilingüe (Multilingual) con las voces multilingües de Ondoku.
Se utiliza cuando la pronunciación es incorrecta o cuando no se puede identificar el idioma debido a que se utilizan muchos idiomas en el texto.
"Hola" en japonés se diceHello en inglés,
Bonjour en francés,
Guten Tag en alemán,
y你好 en chino.
El uso de la etiqueta
○○
Reproduce el texto en la parte ○○ con un sonido de "pitido" de censura.
Es un código con un toque lúdico. Los caracteres en la parte rodeada por este código serán reemplazados por un sonido de pitido.
Esta palabra estáprohibida
○○
Al leer el alfabeto, se deletrea cada letra (lectura por deletreo).
The spelling of hello isHello
Sin embargo, este SSML puede causar errores en algunas voces. Por favor, utilícelo teniendo esto en cuenta.
Japonés: Nanami
Inglés (USA): en-US-A
○○
Este código permite asignar una lectura fonética.
En la lectura de textos, a veces se producen pronunciaciones inesperadas.
Por ejemplo, si el término "一行" se pronuncia de forma incorrecta, puede asegurar la pronunciación correcta asignando la lectura fonética adecuada.
En el código, introduzca el kanji en ○○ y la lectura en ◇◇.
Lee correctamente como 一行 en lugar de ichiyuki
○○
Permite enfatizar los caracteres rodeados por el código durante la lectura.
Este código permiteenfatizar
○○
Prosodia (prosody) es un término general que describe las características del sonido de un idioma al hablar de forma natural, tales como:
- Subida y bajada del tono
- Posiciones de pausa
- Longitud y énfasis, etc.
Con este código puede ajustar los siguientes tres tipos:
- rate (velocidad)
Códigos de ajuste: "x-slow", "slow", "medium", "fast", "x-fast", "default" - pitch (tono)
Códigos de ajuste: "x-low", "low", "medium", "high", "x-high", "default" - volume (volumen)
Códigos de ajuste: "silent", "x-soft", "soft", "medium", "loud", "x-loud", "default"
Hablo rápido.
Hablo con voz aguda.
Hablo en voz alta.
Hablo lento y con voz grave.
Hablo rápido, con voz aguda y volumen normal.
¿Por qué no aprovecha SSML para usar Ondoku de forma más conveniente?
¡De esta manera, puede utilizar Ondoku de forma aún más conveniente aprovechando SSML!
¿Por qué no utiliza las voces realistas y claras de Ondoku en una gama más amplia de aplicaciones, como producción de videos o presentaciones?
■ Software de síntesis de voz con IA “Ondoku”
"Ondoku" es una herramienta de conversión de texto a voz en línea que se puede utilizar sin costo inicial.
- Admite aproximadamente 50 idiomas, incluidos japonés, inglés, chino, coreano, español, francés y alemán.
- Disponible tanto desde PC como desde teléfono inteligente
- Adecuado para negocios, educación, entretenimiento, etc.
- No requiere instalación, puede usarse inmediatamente desde su navegador
- También admite la lectura de imágenes.
Para usarlo, simplemente ingrese texto o cargue un archivo desde el sitio. Genere archivos de sonido naturales en segundos. Puede utilizar la síntesis de voz de hasta 5000 caracteres de forma gratuita, así que pruébelo primero.
Email: ondoku3.com@gmail.com
Software de lectura de texto Ondoku. Es un servicio de conversión de texto a voz que no requiere instalación y puede ser utilizado por cualquier persona de forma gratuita. Si te registras gratis, podrás obtener hasta 5000 caracteres gratis cada mes. Regístrese ahora gratis