Qu'est-ce que le langage de balisage de synthèse vocale (SSML)? Comment l'utiliser dans un logiciel de synthèse vocale et la liste des principaux codes.

17 avril 2024

Qu'est-ce que le langage de balisage de synthèse vocale (SSML)? Comment l'utiliser dans un logiciel de synthèse vocale et la liste des principaux codes.


Bonjour, bienvenue sur le site Web d'Ondoku.

Aujourd'hui, nous aimerions vous présenter SSML.

Vous pouvez trouver cela difficile car il existe des termes techniques.

Cependant, si vous le savez, cela fera une énorme différence dans la façon dont vous utilisez Ondoku.

Veuillez le lire attentivement car nous essayons de le rendre facile à comprendre.

Qu'est-ce que SSML?

Tout d'abord, SSML signifie Speech Synthesis Markup Language.

C'est similaire au HTML.

En écrivant ce code SSML, vous pouvez contrôler davantage la parole d'Ondoku.

Comment utiliser SSML avec Ondoku

Il est très facile d'utiliser SSML dans Ondoku.

Veuillez saisir directement le code SSML dans la zone de texte Ondoku.

Le SSML sera appliqué automatiquement.

Assurez-vous d'inclure

<speak> </speak>

au début et à la fin du code! Sans le code <speak>, SSML ne sera pas appliqué.

<speak> </speak>

Comme mentionné précédemment, c'est le code pour activer SSML.

Assurez-vous d'inclure ce code au début et à la fin du texte que vous souhaitez convertir en discours.

Exemple

<speak> Saisissez ici le texte que vous souhaitez convertir du texte en discours </speak>

<temps de pause = "○○ ms" />

Comme son nom l'indique, le code temporel de pause est un code permettant de faire une pause.

Entrez le code où vous souhaitez insérer une pause et remplacez le ○○ par le numéro de votre choix.

Le discours généré par Ondoku n'aura pas de «pause» sauf indication contraire.

Vous pouvez faire une pause avec des crochets ou des ponctuations, mais ces pauses peuvent ne pas être définies comme vous le souhaitez.

Surtout si vous avez besoin d'un temps de pause de plus de 2 secondes, ce sera plus difficile à contrôler.

Cependant, si vous entrez

<temps de pause = "1000ms" />

à l'endroit où vous voulez faire une pause,

<parler>
Je veux un peu de temps de pause <break time = "1000ms" /> lors de la lecture de cette phrase.
</speak>

vous entendrez une pause au milieu de la phrase.

* 1000 ms = 1 seconde

Vous pouvez modifier librement le nombre avant ms ou s afin de contrôler la durée de la pause.

200 ms = 0,200 seconde
500 ms = 0,500 secondes
1000ms = 1.000 secondes
2000ms = 2.000 secondes
3s = 3 secondes
10s = 10 secondes etc.

<say-as interprét-as = "expletive"> ○○ </say-as>

Avec ce code, le texte dans le ○○ sera joué avec un bip sonore pour la censure du bip.

C'est une sorte de code ludique. Le texte inclus dans ce code sera remplacé par un bip.

<parler>
Ce mot est <say-as interprét-as = "expletive"> restreint </say-as>
</speak>

<sub alias = "◇◇"> ○○ </sub>

C'est un code qui vous permet d'indiquer la prononciation.

Parfois, lorsque vous utilisez la conversion de la synthèse vocale, vous pouvez entendre un mot prononcé de manière inattendue.

Par exemple, vous pouvez faire en sorte que le logiciel prononce le mot «一行», sur une ligne, comme «Ichigyo», alors que le système le prononce comme «Ichiyuki».

Pour le code, entrez le kanji pour ○○ et la prononciation pour ◇◇.

<parler>
Prononcez correctement comme <sub alias = "Ichigyo"> 一行 </sub> au lieu de Ichiyuki
</speak>

<emphasis> ○○ </emphasis>

Vous pouvez mettre en valeur le texte inclus dans le code dans le discours.

<parler>
Ce code <emphasis> mettra en valeur le texte </emphasis>
</speak>

<prosody> ○○ </prosody>

La prosodie est un terme linguistique qui décrit les règles de l'anglais parlé naturel, y compris

  • Intonation (hauteur montante et descendante)
  • Position de pause
  • Durée du son et du stress, etc.

Avec ces codes, vous pouvez ajuster les 3 éléments suivants de la prosodie:

  • Taux (taux, vitesse)
    Code: "x-slow" "slow" "medium" "fast" "x-fast" "default"
  • Pas (hauteur, hauteur)
    Code: "x-low" "low" "medium" "high" "x-high" "default"
  • Volume (volume, taille)
    Code: "silent" "x-soft" "soft" "medium" "loud" "x-loud" "default"

<parler>
<prosody rate = "fast"> Parlez vite. </prosody>
<prosody pitch = "high"> Parlez d'une voix aiguë. </prosody>
<prosody volume = "loud"> Parlez fort. </prosody>
<prosody rate = "slow" pitch = "x-low"> Parlez lentement et à voix basse. </prosody>
<prosody rate = "fast" pitch = "high" volume = "medium"> Parlez vite, d'une voix aiguë et à un volume normal. </prosody>
</speak>

Le logiciel de synthèse vocale "Ondoku" peut lire gratuitement 5000 caractères chaque mois avec la voix AI. Vous pouvez facilement télécharger des MP3 et une utilisation commerciale est également possible. Si vous vous inscrivez gratuitement, vous pouvez convertir gratuitement jusqu'à 5 000 caractères par mois du texte en parole. Essayez Ondoku maintenant.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Articles connexes

Logiciel de synthèse vocale Ondoku. Il s'agit d'un service de synthèse vocale qui ne nécessite aucune installation et qui peut être utilisé par n'importe qui gratuitement. Si vous vous inscrivez gratuitement, vous pouvez obtenir jusqu'à 5 000 caractères gratuits chaque mois. Enregistrez-vous gratuitement maintenant