¡Una guía completa para usar VOICEVOX! Una explicación detallada de las funciones de este software gratuito de síntesis de voz con IA, desde su uso comercial hasta funciones más avanzadas.
17 de junio de 2025


VOICEVOX es un software de síntesis de voz que se puede instalar en PC con Windows, Mac o Linux.
Es la última tecnología de síntesis de voz basada en IA que le permite ingresar texto y generar una voz de lectura, lo que la hace ampliamente utilizada entre los creadores de videos y contenidos.
Otra característica es que se puede leer en voz alta con la voz de "Zundamon", un personaje popular en YouTube y Nico Nico Douga.
Este artículo proporciona información detallada para aquellos que quieran comenzar a utilizar el software de síntesis de voz VOICEVOX, incluidas sus características, cómo instalarlo en Windows, cómo usarlo y puntos a tener en cuenta al usarlo con fines comerciales.
- Estoy pensando en usar VOICEVOX
- ¿Buscas una forma de leer texto en voz alta?
En tales casos, ¿por qué no utilizar este artículo como referencia para encontrar el software de síntesis de voz o el método de lectura perfecto?
[Uso gratuito y comercial permitido] Último servicio de lectura de texto con IA recomendado
Si deseas crear tu propio audio de texto a voz, ¡tenemos un servicio de texto a voz gratuito que te recomendamos!
Este es el último servicio de inteligencia artificial: "Ondoku".
"Ondoku" es un servicio gratuito de conversión de texto a voz.
Se puede utilizar en cualquier entorno, incluidos Windows, Mac y Linux, así como iPhones y teléfonos inteligentes Android.
Es fácil de usar, ¡sólo ingresa el texto!
No necesita instalación y podrá comenzar a usarlo inmediatamente; leerá en voz alta cómodamente independientemente de las especificaciones de su PC.
Además, ¡ "Ondoku" es gratuito y puede usarse con fines comerciales!
¿Por qué no intentar hacer vídeos gratis usando el audio realista y fácil de escuchar de Ondoku ?
¿Qué es el software de síntesis de voz VOICEVOX? Explicación del software de síntesis de voz con IA.
Primero, déjame darte una breve explicación de VOICEVOX.
¿Qué tipo de software de texto a voz con inteligencia artificial es VOICEVOX?
El software de síntesis de voz VOICEVOX es un software de conversión de texto a voz que utiliza tecnología de aprendizaje profundo de IA.
Si ingresa texto en japonés, se leerá con una voz de carácter mediante IA.
VOICEVOX es un software gratuito que también puede utilizarse con fines comerciales.
Sin embargo, el uso comercial requiere el crédito apropiado .
Se pueden utilizar para uso personal, monetización mediante la publicación de vídeos en YouTube o Niconico Video, uso corporativo, etc., pero también debes seguir los términos de uso para personajes como "Zundamon", "Shikoku Metaln" y "Kasukabe Tsumugi".
Tecnología de síntesis de voz de alta calidad mediante IA
La tecnología de síntesis de voz mediante IA ha avanzado muy rápidamente en los últimos años.
VOICEVOX es uno de los programas de software que utiliza tecnología de síntesis de voz con inteligencia artificial y puede leer con una voz más natural que el software de lectura mecánica anterior.
La pantalla de operación le permite ajustar la entonación carácter por carácter y, aunque realizar los ajustes requiere cierto esfuerzo, le permite crear un discurso expresivo.
También tiene una función de expresión emocional , permitiéndote expresar emociones como alegría, ira, tristeza y felicidad a través de cambios en el tono de voz.
Utilizando voces de personajes como "Zundamon", puedes crear contenido de audio que captará el interés del oyente.
Soporte multiplataforma
VOICEVOX es compatible con tres tipos de sistemas operativos: Windows, Mac y Linux .
En particular, el software de síntesis de voz compatible con Linux es raro, lo que lo convierte en una de las pocas opciones para los usuarios que producen vídeos o contenidos de audio en un entorno Linux.
¿Cuáles son las características de VOICEVOX?
Se puede leer en voz alta con muchas voces de personajes.
Una de las características de VOICEVOX es la disponibilidad de una amplia variedad de voces de personajes únicos.
El personaje más famoso es "Zundamon".
Este personaje se proporciona como parte del Proyecto Tohoku Zunko y se caracteriza por su linda voz aguda.
Además de Zundamon, el juego incluye muchos otros personajes, como Shikoku Metaln, Kasukabe Tsumugi y Namioto Ritsu, cada uno con su propia calidad de voz y personalidad únicas.
Cada personaje tiene configuraciones detalladas, que incluyen edad, altura y personalidad, para que puedas elegir un personaje que coincida con la visión del mundo de tu video o contenido .
Dado que VOICEVOX lanza varios personajes a la vez, se clasifican según su período de lanzamiento, como "1.ª generación" y "2.ª generación".
VOICEVOX Nemo sin personajes también lanzado
"VOICEVOX Nemo", lanzado en noviembre de 2023, es una biblioteca de voces sin configuraciones de personajes .
Fue desarrollado teniendo en mente entornos comerciales y educativos y presenta una calidad de voz tranquila que se puede adaptar a una amplia gama de situaciones.
A diferencia de las voces VOICEVOX normales, que tienen un carácter fuerte, esta voz es adecuada para fines más formales, como presentaciones corporativas, contenido educativo y anuncios oficiales.
VOICEVOX Nemo también viene con múltiples calidades de voz, lo que le permite elegir entre voces masculinas y femeninas.
Podrás elegir el audio más adecuado dependiendo del contenido y público objetivo.
Funciones emocionales y personalizables
VOICEVOX tiene una función que te permite reflejar ocho estilos emocionales diferentes en tu voz .
Hay estilos disponibles, como "Dulce", "Lágrima", "Aterrador" y "Susurro", pero los estilos que se pueden usar están determinados por el personaje.
Además, se pueden ajustar los parámetros de la voz como el acento, la entonación y la duración , y estos se pueden ajustar en combinación.
También hay una función que permite cambiar la emoción de partes específicas de una oración o ajustar la forma en que se lee, lo que permite realizar ajustes finos a la expresión.
También puede reducir los errores de lectura utilizando la función de diccionario de acentos para registrar previamente la pronunciación de nombres propios y términos técnicos.
Función de síntesis de voz cantada también disponible
En enero de 2024, se agregó una función de síntesis de voz cantada a VOICEVOX, lo que hizo posible que los personajes canten con sus propias voces.
La función "Zarareo" es compatible con 29 caracteres (a junio de 2025).
La función de zumbido te permite generar voces que hacen que el personaje cante una melodía.
La función "Canción" actualmente sólo es compatible con Namioto Rittsu, pero permite una síntesis de voz más auténtica.
[¡Uso comercial OK!] Software de síntesis de voz con IA recomendado que puedes usar gratis ahora mismo
Para aquellos que buscan software de síntesis de voz, tenemos un método de lectura recomendado .
¡Esta es "Ondoku", una aplicación web de síntesis de voz con IA !
"Ondoku" es un servicio gratuito de síntesis de voz mediante IA.
Dado que es una aplicación web que se puede utilizar desde un navegador, puedes leer fácilmente desde cualquier entorno, incluidos Windows, Mac, Linux y teléfonos inteligentes .
Cree voces de lectura realistas y fáciles de escuchar utilizando la última inteligencia artificial
"Ondoku" es un servicio de texto a voz que sintetiza la voz utilizando la última inteligencia artificial.
Puede generar audio realista y fácil de escuchar que suena como si un narrador o actor de voz real estuviera leyendo el texto.
Hay 16 voces disponibles para leer japonés en "Ondoku".
Disponemos de una amplia gama de voces que se adaptan a distintas situaciones, desde uso comercial hasta uso recreativo, incluyendo voces masculinas, femeninas y infantiles.
Se puede utilizar para una variedad de propósitos, como videos en YouTube, Instagram y TikTok y anuncios de tiendas.
"Ondoku" también puede ajustar el tono y leer conversaciones en múltiples voces .
Puedes generar el audio que quieras y crear un audio atractivo para tus vídeos.
Un servicio de texto a voz que se puede utilizar inmediatamente sin necesidad de instalación
Para utilizar VOICEVOX, debe descargar el software del sitio web oficial e instalarlo.
Para instalar y utilizar el software, necesitará conocimientos de PC, como Windows o Mac.
Además, cuando instales VOICEVOX por primera vez, necesitarás descargar un archivo de aproximadamente 1,5 GB .
- Estás utilizando una PC antigua o de bajo rendimiento.
- Mi conexión a Internet en casa es lenta
- Solo está disponible el anclaje a red
Como puedes ver, a menudo puede resultar difícil instalar VOICEVOX.
¡En tales casos recomendamos "Ondoku" !
Usar "Ondoku" es muy fácil.
"Ondoku" se puede utilizar inmediatamente con un navegador web , por lo que no se requiere ninguna configuración complicada.
Puede crear audio inmediatamente simplemente abriendo la página superior , por lo que incluso los principiantes pueden usarlo con confianza.
No es necesario descargar nada, por lo que puedes generar y descargar el audio mientras instalas VOICEVOX.
"Ondoku" es compatible con varios idiomas. Crea fácilmente vídeos de YouTube para extranjeros.
VOICEVOX es un software de texto a voz para japonés.
Como resultado, leer un texto que contenga una mezcla de palabras extranjeras e inglés puede sonar poco natural.
"Ondoku" admite un total de 48 idiomas, incluidos japonés, inglés, coreano, chino, español y vietnamita.
[Ondoku] Escucha las voces y ejemplos de voces para los idiomas compatibles | Software de texto a voz Ondoku
Aquí presentaremos los idiomas compatibles con Ondoku y un audio de muestra.
También lee idiomas extranjeros de forma natural, lo que lo hace útil para crear contenido multilingüe en YouTube.
También se puede utilizar en una variedad de otras situaciones, como anuncios en idiomas extranjeros en tiendas e instalaciones, contenido educativo multilingüe y materiales de presentación para empresas globales.
Conveniencia para uso comercial
Si utiliza VOICEVOX con fines comerciales, se requiere crédito .
Por esta razón, cuando es difícil dar créditos, como en los anuncios dentro de una tienda, los créditos a menudo se leen en voz alta en el audio, como "Presentado por Kasukabe Tsumugi de VOICEVOX".
Sin embargo, hay ocasiones en las que puede no ser apropiado incluir créditos en los videos oficiales de la empresa o en los videos de presentación de productos, o cuando es difícil incluir créditos debido a limitaciones de diseño.
¡En tales casos recomendamos "Ondoku" !
"Ondoku" está bien para uso comercial y, si usas el plan pago, no es necesario acreditar al usuario.
Puede usarlo libremente para cualquier propósito comercial, como uso comercial, venta de productos, monetización de YouTube, etc.
El plan gratuito permite el uso comercial con solo un crédito, por lo que puedes probarlo gratis primero y luego considerar un plan pago.
¿Por qué no probar primero la versión gratuita "Ondoku"?
Con el servicio gratuito de lectura con inteligencia artificial "Ondoku", ¡no es necesario descargar archivos grandes ni pasar por la molestia de instalarlos!
Siempre que quieras crear una voz, puedes crear una voz de texto a voz ahora mismo usando la última inteligencia artificial.
¿Por qué no probar primero el servicio de lectura de texto con inteligencia artificial de Ondoku ?
Explicación detallada de cómo instalar VOICEVOX [Windows 11]
A continuación, explicaremos cómo instalar y utilizar VOICEVOX .
Para utilizar VOICEVOX, debe descargar e instalar el software desde el sitio web oficial.
Primero, explicaremos el procedimiento de instalación de VOICEVOX usando una PC con Windows como ejemplo.
*La explicación se dará utilizando Windows 11 24H2.
Instrucciones de descarga e instalación de VOICEVOX
Primero, vaya al sitio web oficial de VOICEVOX y descargue el archivo de instalación.
En la pantalla de descarga,
- Windows: versiones de GPU y CPU
- Mac: Intel y Apple Silicon
- Linux: versiones de GPU y CPU
Puedes seleccionar:
Esta vez, seleccione la versión de Windows.
Además, para la versión de Windows puedes elegir entre la versión del instalador y la versión ZIP, pero normalmente está bien descargar la versión del instalador.
*Dependiendo de la configuración de seguridad de Windows o de tu navegador web, la descarga podría estar bloqueada. En ese caso, permite la descarga y guárdala.
Una vez completada la descarga, comience la instalación en Windows 11.
Haga doble clic en el archivo descargado para iniciar el asistente de configuración.
Haga clic en “Siguiente” y el archivo de instalación comenzará a descargarse.
*Estarás descargando un total de aproximadamente 1,5 GB de archivos, por lo que puede llevar algún tiempo dependiendo de tu velocidad de Internet.


El asistente de configuración se reanudará una vez que se complete la descarga.
Seleccione el usuario para la instalación.
Seleccione la carpeta de instalación.
Generalmente se instala en la carpeta Archivos de programa de Windows.
Haga clic en Instalar para comenzar la instalación.
Espere un momento y se completará la instalación.
Iniciar VOICEVOX
Inicie VOICEVOX.
Si marcó "Ejecutar VOICEVOX" al final de la instalación, se iniciará automáticamente cuando se complete la instalación.
También se puede iniciar desde el menú de inicio de Windows o desde un acceso directo en el escritorio.
Configuración inicial de VOICEVOX
La primera vez que inicie VOICEVOX, deberá aceptar los términos de uso.
Si no hay problemas, haga clic en "Aceptar y comenzar a usar".
Se abrirá la pantalla de presentación del personaje adicional, así que haz clic en "Listo".
Se abrirá una pantalla de consentimiento para recopilar datos de uso del software.
Haga clic en Permitir o Denegar.
Los ajustes iniciales ya están completos.
Se abrirá una pantalla de operación donde podrás ingresar texto y escucharlo leer en voz alta.
Uso básico de VOICEVOX
Ahora ha instalado exitosamente VOICEVOX en su PC con Windows.
A continuación, explicaremos el uso básico para convertir texto a voz.
Cómo utilizar las funciones básicas de generación de voz
Cuando abra la pantalla VOICEVOX, verá un ícono de carácter y un campo de entrada de texto.
Haga clic en el campo de entrada de texto (la parte verde subrayada).
La pantalla cambiará a la pantalla de edición.
Escribe tu texto.
Puedes reproducir el audio y comprobar los resultados generados presionando el botón de reproducción en la parte inferior izquierda de la pantalla.
Puede agregar un nuevo campo de entrada de texto haciendo clic en "+" en la pantalla de entrada de texto.
Al hacer clic en el ícono de un personaje, se abrirá el menú de selección de personaje.
De forma predeterminada, se muestra "Shikoku Metal", pero al hacer clic puedes cambiarlo a tu personaje preferido, como "Zundamon" o "Kasukabe Tsumugi".
También puedes crear voces conversacionales asignando diferentes caracteres a diferentes líneas de texto.
Sin embargo, para utilizar esta función de manera efectiva, es necesario comprender las diferencias en las cualidades de voz de cada personaje y elegir la combinación adecuada.
Además, dado que requiere afinar aspectos como el ritmo de la conversación y cómo hacer pausas, lleva tiempo y experiencia acostumbrarse.
Cómo utilizar la función de exportación de voz de VOICEVOX
A continuación, explicaremos cómo utilizar la función de exportación de audio.
Cómo usar "Exportar audio por separado"
Para exportar audio,
Seleccione "Archivo" → "Exportar audio".
Seleccione la carpeta de destino.
Luego, el audio se exportará línea por línea.
Cómo usar "Conectar y exportar audio"
VOICEVOX también le permite conectar archivos de audio y exportarlos.
Cuando seleccione "Archivo" → "Conectar y exportar audio", se abrirá la pantalla para guardar el archivo.
"Conectar y exportar audio"
Introduzca un nombre de archivo y guárdelo.
Cómo utilizar estilos de emociones y ajustes de parámetros
Para un uso avanzado, VOICEVOX también tiene una función que permite cambiar expresiones usando estilos emocionales.
Dependiendo del personaje, los estilos de emoción disponibles incluyen "Normal", "Dulce", "Espinoso", "Sexy", "Susurrante", "Susurrante", "Emocionado" y "Lloroso".
Al cambiar el estilo de la emoción, es posible generar una voz con una impresión completamente diferente incluso con el mismo texto, por lo que es posible utilizar diferentes estilos dependiendo del contenido y la presentación.
Para cambiar el estilo de tus emociones, pasa el mouse sobre ">" en el lado derecho del menú de selección de personajes.
Se mostrarán sus opciones, así que haga clic para seleccionar.
También puede ajustar tres parámetros individualmente: acento, entonación y duración.
Editar acento:
Editar la entonación:
Editar para mayor extensión:
Cada elemento se puede cambiar en la parte inferior izquierda de la pantalla.
Cada sonido se puede ajustar individualmente, lo que permite una pronunciación más realista.
[IMPORTANTE] Respecto al uso comercial de VOICEVOX: Es importante consultar los términos y condiciones
Si utiliza VOICEVOX con fines comerciales, debe prestar atención a los términos y condiciones .
Es necesario comprender correctamente los términos de uso y dar el crédito adecuado .
A partir de aquí explicaremos detalladamente los puntos importantes para utilizar correctamente VOICEVOX con fines comerciales.
Normas básicas de uso comercial
Al utilizar la voz generada por VOICEVOX, se requiere el crédito correspondiente tanto para uso comercial como no comercial .
Al dar crédito, debe quedar claro que se utilizó VOICEVOX y qué personaje se utilizó.
Por ejemplo, si usas la voz de Zundamon, se escribirá como "VOICEVOX: Zundamon", y si usas la voz de Shikoku Metal, se escribirá como "VOICEVOX: Shikoku Metal".
Cuando lo use en un video de YouTube, etc., inclúyalo en la descripción del video o dentro del video.
Cuando la voz sea el único medio de crédito disponible, como llamadas telefónicas, inserte un crédito de audio en el audio, como "Utilizo a Kasukabe Tsumugi de VOICEVOX".
Restricciones de uso de personajes de VOICEVOX
Cada personaje de VOICEVOX tiene diferentes términos de uso.
Algunos personajes tienen restricciones especiales.
Si bien la mayoría de los personajes pueden usarse comercialmente con el crédito correspondiente, algunos personajes tienen restricciones en su uso comercial.
Los personajes relacionados con el Proyecto Tohoku (Zundamon, Tohoku Kiritan, Tohoku Itako, etc.) generalmente pueden usarse con fines comerciales, pero su uso en contenido político o para adultos está prohibido.
Para algunos personajes, puede estar prohibido usarlos en sitios afiliados o como voces de personajes originales.
Si planeas utilizar el personaje con fines comerciales, es importante verificar con anticipación los términos de uso individuales del personaje que planeas utilizar .
Al utilizar imágenes de personajes en vídeos, tenga cuidado con la licencia de la ilustración.
Además, si utiliza imágenes de personajes en vídeos de personajes como "Zundamon", también debe tener en cuenta los términos de uso de las ilustraciones.
Las ilustraciones tienen términos de uso separados de VOICEVOX y los personajes.
También debes consultar previamente las condiciones de uso de las ilustraciones .
La licencia es complicada, por lo que es muy importante consultarla con antelación.
Una cosa a tener especialmente en cuenta al utilizar VOICEVOX con fines comerciales es que cada personaje tiene un sistema de licencia diferente .
Los términos de uso de cada personaje varían mucho, por lo que si utilizas varios personajes, tendrás que comprobar los términos de uso de cada uno individualmente .
Tenga en cuenta en particular que las condiciones de uso de los personajes relacionados con el Proyecto Tohoku son diferentes a las de otros personajes originales.
Además, cuando se agreguen nuevos personajes en el futuro, se pueden establecer diferentes términos de uso.
Si está considerando usarlo en su empresa, es posible que necesite obtener la aprobación del departamento legal, lo que puede llevar algún tiempo antes de poder comenzar a usarlo.
Debido a este complejo sistema de licencias, si desea utilizar el contenido con fines comerciales, como fines empresariales o para monetizar en YouTube, comprobar los términos de uso puede ser una carga importante.
¿Por qué no probar a leer en voz alta gratis con "Ondoku"?
Hasta ahora, hemos explicado en detalle las características de VOICEVOX, cómo instalarlo en Windows y cómo usarlo.
Sin embargo, descargarlas e instalarlas puede llevar mucho tiempo y los términos de uso pueden ser complicados y difíciles de aplicar.
En tales casos, recomendamos "Ondoku", un servicio de síntesis de voz multifuncional y fácil de usar.
"Ondoku" es un servicio gratuito de lectura en línea con inteligencia artificial.
¡Sorprendentemente, puedes sintetizar hasta 5.000 caracteres de texto de forma gratuita con sólo registrar tu dirección de correo electrónico!
Se puede utilizar en Windows, Mac, Linux y teléfonos inteligentes, y se puede utilizar para cualquier propósito, incluidos negocios, educación y entretenimiento.
El uso comercial está bien , ¡así que también puedes monetizarlo en YouTube !
¡También es muy fácil de utilizar!
No requiere instalación y podrás usarlo inmediatamente desde tu navegador, ¡para que puedas crear audio de alta calidad cuando quieras!
Si actualmente estás descargando el archivo de instalación de VOICEVOX, ¿por qué no pruebas "Ondoku" mientras tanto?
Lectura de voz con IA de alta calidad en varios idiomas
¡Las 16 voces japonesas de Ondoku ofrecen una amplia variedad de voces, incluidas voces masculinas, femeninas y infantiles!
Por supuesto, también admite la lectura de conversaciones utilizando múltiples voces .
"Ondoku" admite aproximadamente 50 idiomas, incluidos japonés, inglés, chino, coreano, español, francés y alemán.
[Ondoku] Escucha las voces y ejemplos de voces para los idiomas compatibles | Software de texto a voz Ondoku
Aquí presentaremos los idiomas compatibles con Ondoku y un audio de muestra.
Puedes crear contenido global que te ayudará a aumentar tus visualizaciones de YouTube en todo el mundo .
¡No requiere instalación ni descarga, puedes comenzar a usarlo ahora!
Usar "Ondoku" es muy fácil.
¡Una vez que abras la página superior, simplemente ingresa el texto y presiona el botón de leer en voz alta!
Se generará un archivo de audio con sonido natural en cuestión de segundos.
Puedes utilizar la síntesis de voz para hasta 5.000 caracteres de forma gratuita , así que ¿por qué no pruebas Ondoku ?
¿Por qué no intentar crear voces de lectura realistas utilizando la última inteligencia artificial que es apta para uso comercial?
Este artículo proporciona una explicación detallada de las características de VOICEVOX, cómo instalarlo en Windows y cómo usarlo.
El mayor atractivo de VOICEVOX es que puedes crear vídeos utilizando personajes famosos, incluido "Zundamon".
Sin embargo, hay algunos aspectos de su uso que pueden resultar difíciles, como la descarga, la instalación y las condiciones de uso.
Si desea utilizar la última inteligencia artificial para leer texto en voz alta, también le recomendamos el servicio web "Ondoku".
¿Por qué no intentar crear audio de vídeo con «Ondoku» , que puede usarse inmediatamente sin necesidad de descargarlo?
■ Software de síntesis de voz con IA “Ondoku”
"Ondoku" es una herramienta de conversión de texto a voz en línea que se puede utilizar sin costo inicial.
- Admite aproximadamente 50 idiomas, incluidos japonés, inglés, chino, coreano, español, francés y alemán.
- Disponible tanto desde PC como desde teléfono inteligente
- Adecuado para negocios, educación, entretenimiento, etc.
- No requiere instalación, puede usarse inmediatamente desde su navegador
- También admite la lectura de imágenes.
Para usarlo, simplemente ingrese texto o cargue un archivo desde el sitio. Genere archivos de sonido naturales en segundos. Puede utilizar la síntesis de voz de hasta 5000 caracteres de forma gratuita, así que pruébelo primero.
Email: ondoku3.com@gmail.com
Software de lectura de texto Ondoku. Es un servicio de conversión de texto a voz que no requiere instalación y puede ser utilizado por cualquier persona de forma gratuita. Si te registras gratis, podrás obtener hasta 5000 caracteres gratis cada mes. Regístrese ahora gratis