Cos'è lo Speech Synthesis Markup Language (SSML). Come usarlo nei software di sintesi vocale e l'elenco dei codici principali.
26 Gennaio 2026
Ciao, grazie per utilizzare sempre Ondoku.
In questo articolo presenteremo **SSML**.
Potrebbe sembrare difficile a causa di alcuni termini tecnici, ma imparando a usare SSML potrai utilizzare Ondoku in modo ancora più conveniente.
Lo spiegheremo in modo semplice, quindi dai un'occhiata.
Cos'è SSML
SSML è uno dei linguaggi di markup vocale.
Un "linguaggio di markup" è un linguaggio che, proprio come l'HTML, definisce la struttura (il ruolo) per ogni parte del testo.
Scrivendo il codice SSML, puoi controllare la sintesi vocale di Ondoku in modo più comodo.
Attualmente, i codici SSML supportati in tutte le lingue sono solo
questi due tipi di codici. Altri codici potrebbero non essere utilizzabili a seconda della lingua o del tipo di voce. Ti preghiamo di tenerne conto in anticipo.
Come usare SSML su Ondoku
Usare SSML su Ondoku è molto semplice.
Inserisci il codice SSML direttamente nella casella di testo di Ondoku.
In questo modo, SSML verrà applicato automaticamente.
Puoi usare SSML semplicemente inserendo all'inizio e alla fine del testo
.
Assicurati di non dimenticare questo codice! Se il codice
Inserisci sempre questo codice all'inizio e alla fine del testo che desideri leggere.
Esempio
Inserisci qui il testo che desideri leggere
Il codice break time è, come suggerisce il nome, un codice per creare delle pause.
Inserisci il codice dove desideri inserire una pausa e sostituisci la parte ○○ con il numero desiderato.
Quando leggi normalmente con Ondoku, a volte le pause non vengono inserite come desiderato.
Questo codice è utile in questi casi.
Ad esempio,
proviamo a inserire questo codice dove vogliamo inserire una pausa.
Voglio fare una piccola pausadurante la lettura di questa frase
Noterai che farà un respiro nel punto in cui è stato inserito il codice prima di continuare a leggere.
※ 1000ms = 1 secondo
Cambiando il numero prima di ms o s, puoi modificare liberamente la durata della "pausa".
- 200ms = 0.200 secondi
- 500ms = 0.500 secondi
- 1000ms = 1.000 secondo
- 2000ms = 2.000 secondi
- 3s = 3 secondi ecc.
Note sull'uso di
Il comportamento quando si inserisce il tag
Esempio:
Voglio creare una pausa di 5 secondi all'inizio
↑ Per specifiche tecniche, questo tipo di utilizzo non è possibile.
Inoltre, il limite massimo per la durata della pausa è di 10 secondi (10000ms, 10s).
Se viene impostato un tempo superiore, verrà arrotondato a 10 secondi.
L'uso del tag
〇〇
Questo tag viene utilizzato per specificare la lingua per ogni parte del testo durante la lettura multilingue con le voci multilingue (Multilingual) di Ondoku.
Viene utilizzato quando la pronuncia è errata o quando non è possibile distinguere le lingue perché ne vengono usate molte all'interno del testo.
Il "ciao" giapponese si diceHello in inglese,
Bonjour in francese,
Guten Tag in tedesco,
e你好 in cinese.
L'uso del tag
○○
Riproduce il testo nella parte ○○ con un suono "bip" di censura televisiva.
È un codice con un tocco scherzoso. Il testo all'interno di questo codice verrà sostituito da un suono "bip".
Questa parola ècensurata
○○
Quando si legge l'alfabeto, viene fatto lo spelling lettera per lettera.
Lo spelling di hello èHello
Tuttavia, con alcune voci questo SSML potrebbe causare un errore. Ti preghiamo di utilizzarlo tenendone conto.
Giapponese: Nanami
Inglese (USA): en-US-A
○○
È un codice che permette di assegnare una lettura specifica (furigana).
Nella sintesi vocale, a volte la lettura può essere inaspettata.
Ad esempio, se "一行" viene pronunciato come "ichiyuki", assegnando la lettura "ichigyou" sarà possibile pronunciarlo correttamente.
Nel codice, inserisci il kanji in ○○ e la lettura in ◇◇.
Leggere correttamente come 一行 e non come 一行
○○
Puoi enfatizzare la lettura del testo racchiuso nel codice.
Questo codice permette dienfatizzare il testo
○○
La prosodia (prosody) è un termine generale che indica le caratteristiche sonore del linguaggio quando si parla naturalmente, come:
- L'intonazione della voce
- Le posizioni delle pause
- La durata e l'intensità, ecc.
Con questo codice è possibile regolare tre parametri:
- rate (velocità)
Codici di regolazione: "x-slow", "slow", "medium", "fast", "x-fast", "default" - pitch (altezza)
Codici di regolazione: "x-low", "low", "medium", "high", "x-high", "default" - volume (volume)
Codici di regolazione: "silent", "x-soft", "soft", "medium", "loud", "x-loud", "default"
Parlo velocemente.
Parlo con voce alta.
Parlo a voce alta.
Parlo lentamente e con voce bassa.
Parlo velocemente, con voce alta e a volume normale.
Perché non provi a usare Ondoku in modo più comodo sfruttando SSML?
In questo modo, utilizzando SSML, puoi usare Ondoku in modo ancora più vantaggioso!
Che ne dici di sfruttare ancora più ampiamente la voce realistica e chiara di Ondoku per la produzione di video, presentazioni e altro ancora?
■ Software di sintesi vocale AI “Ondoku”
"Ondoku" è uno strumento di sintesi vocale online che può essere utilizzato senza alcun costo iniziale.
- Supporta circa 50 lingue tra cui giapponese, inglese, cinese, coreano, spagnolo, francese e tedesco.
- Disponibile sia da PC che da smartphone
- Adatto per affari, istruzione, intrattenimento, ecc.
- Nessuna installazione richiesta, utilizzabile immediatamente dal tuo browser
- Supporta anche la lettura dalle immagini
Per usarlo è sufficiente inserire del testo o caricare un file dal sito. Genera file audio naturali in pochi secondi. Puoi utilizzare la sintesi vocale per un massimo di 5.000 caratteri gratuitamente, quindi provala prima.
Email: ondoku3.com@gmail.com
Software di sintesi vocale del testo Ondoku. È un servizio di sintesi vocale che non richiede installazione e può essere utilizzato da chiunque gratuitamente. Se ti registri gratuitamente, puoi ottenere fino a 5000 caratteri gratuitamente ogni mese. Registrati adesso gratuitamente