[Gratuito / Pago] Um resumo do mecanismo de síntese de voz de cada empresa. Qual software usa qual mecanismo

14 de Setembro de 2020

Muitos softwares de leitura de texto foram anunciados hoje.

No entanto, quando ouço a voz do software de conversão de texto em voz,

Há algo como "Hã? Essa voz não é igual a outros softwares?"

Na verdade, o software de conversão de texto em voz requer um mecanismo básico de síntese de voz.

Portanto, mesmo se o nome do software for diferente, se o mecanismo de síntese de voz for o mesmo, a cor da voz também será a mesma.

Desta vez, apresentaremos o motor de síntese de voz que pode ser usado gratuitamente e o motor de síntese de voz que pode ser usado quando adquirido.

Alguns vão perceber, "Oh, aquele software usou este mecanismo de síntese!"

Por favor, aguarde!

Um motor de síntese de voz livre

Um motor de síntese de voz livre

O software gratuito de leitura de frases é principalmente

  • AquesTalk
  • Abra o JTalk

O motor da biblioteca de síntese de voz é usado.

AquesTalk

AquesTalk, desenvolvido por AQUEST, Inc.

O software que pode ler em voz alta na chamada voz "lentamente" é
Tudo feito com "Aques Talk".

Exemplos típicos são leitura stick e conversa suave.

Como é fácil criar voz sintética a partir de texto, ela é usada em uma variedade de situações, desde uso pessoal até produtos comerciais.
Além de ser usado como base para SofTalk e Stick Reading, ele também é usado para amostragem de voz padrão UTAU. Além disso, também é usado como uma voz de orientação para eletrodomésticos, como telefones.

AquesTalk foi lançado pela primeira vez em 25 de maio de 2006. O período de desenvolvimento é de menos de dois anos. (Saída pública AquesTalk)
A fonte de som é uma voz sintética genuína sem nenhum humano dentro, feita operando manualmente os parâmetros sem depender da gravação.

Janeiro de 2010 AquesTalk 2exit, o sucessor do AquesTalk, foi anunciado.
Ele oferece suporte a uma ampla gama de plataformas, incluindo smartphones como Windows, Mac OS X, WinCE, iPhone e Android. Recentemente, um microchip independente (hardware) chamado AquesTalk pico apareceu.

Fonte de citação: Enciclopédia de Nico Nico

Licenças de uso de API e bibliotecas de desenvolvimento são vendidas separadamente.

Para obter detalhes, consulte o site da empresa.

AquestTalk

Abra o JTalk

O Open JTalk é um sistema de síntese de texto para fala em japonês desenvolvido no Nagoya Institute of Technology, Tokuda-Ri Lab.

É um código aberto distribuído sob a licença BSD modificada.

"Abrir JTalk" é usado por livros didáticos. Se você ouvir uma vez e disser "Já ouvi falar".

Abra o JTalk

Motor de síntese de voz que pode ser usado por uma taxa

Motor de síntese de voz que pode ser usado por uma taxa

Motor de síntese de voz pago

  • IBM: Watson Text to Speech
  • Google: Text to Speech
  • Amazon: Polly
  • Microsoft: SAPI5

É famoso.

Existem muitos planos atraentes, como gratuitamente até dezenas de milhares de personagens.

Como acima, demonstrações etc. são fornecidas na HP, e você pode tocar e ouvir o som.

O motor de síntese de voz é muito difícil

Desta vez, apresentei o motor de síntese de voz.

Ao usar o mecanismo de síntese de voz, você pode criar seu próprio software de conversão de texto em voz ou personalizá-lo como desejar.

No entanto, quando você tenta usá- lo, ele é fornecido pela API, por isso é difícil configurá-lo, a menos que você possa programá-lo .

API é uma abreviatura de "Interface de Programação de Aplicativo", que significa "um programa que pode ser compartilhado por um programa especializado para uma determinada função" ou "um mecanismo para compartilhar funções de software". Se as funções usadas com freqüência forem preparadas como APIs, não há necessidade de programar do zero. Você pode usar a API conforme necessário para desenvolver com eficiência.

No caso da API Web, o programa é publicado na Web e usado chamando-o de fora. As APIs da Web são publicadas em vários campos, mas muitos deles estão disponíveis gratuitamente.

Por exemplo, se você pode obter as informações mais recentes de sites de outras empresas usando API, você pode adicionar novas funções ao seu site ou aplicativo e melhorar o serviço. Nos últimos anos, o nível necessário para aplicativos de smartphone aumentou, por isso é comum usar APIs da Web no desenvolvimento de aplicativos.

Fonte de cotação: internet academy

As empresas que oferecem software de leitura de texto em versões pagas desenvolveram seus próprios motores de síntese de voz ou estão usando os motores de síntese de voz pagos introduzidos neste momento.

"Em primeiro lugar, por que não fazer um motor de síntese de voz?"

Você pode pensar, mas esta não é uma tarefa fácil.

Vai precisar de muitos pesquisadores, desenvolvedores, processos laboriosos que exigem dinheiro e trabalho.

No mínimo, é difícil para os indivíduos, e recomendamos que você trabalhe na escala de uma empresa ou instituição de pesquisa.

Portanto, se você achar difícil usar a API, é mais fácil e intuitivo usar um software de leitura de texto pago.

Existem muitos tipos de softwares de conversão de texto em voz disponíveis hoje, de gratuitos a pagos.

Tenho certeza de que você pode encontrar seu software favorito.

Verifique este artigo para mais detalhes!

Resumo recomendado do software de leitura de frases. 7 seleções [gratuito / pago]

Espero que este artigo ajude você.

Estou ansioso para te ver novamente.

É o software de leitura de texto Ondoku. Ondoku pode ler texto de até 5000 caracteres gratuitamente. O texto é lido em voz alta em alta qualidade e pode ser baixado como MP3. Você também pode usá-lo para fins comerciais, então use o Ondoku.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Artigo relacionado

Software de leitura de texto Ondoku. É um serviço de conversão de texto em voz que não requer instalação e pode ser usado por qualquer pessoa gratuitamente.