Cos'è lo Speech Synthesis Markup Language (SSML). Come usarlo nei software di sintesi vocale e l'elenco dei codici principali.

26 Gennaio 2026

Cos'è lo Speech Synthesis Markup Language (SSML). Come usarlo nei software di sintesi vocale e l'elenco dei codici principali.

Ciao, grazie per utilizzare sempre Ondoku.

In questo articolo presenteremo **SSML**.

Potrebbe sembrare difficile a causa di alcuni termini tecnici, ma imparando a usare SSML potrai utilizzare Ondoku in modo ancora più conveniente.

Lo spiegheremo in modo semplice, quindi dai un'occhiata.

Cos'è SSML

SSML è uno dei linguaggi di markup vocale.

Un "linguaggio di markup" è un linguaggio che, proprio come l'HTML, definisce la struttura (il ruolo) per ogni parte del testo.

Scrivendo il codice SSML, puoi controllare la sintesi vocale di Ondoku in modo più comodo.

Attualmente, i codici SSML supportati in tutte le lingue sono solo

questi due tipi di codici. Altri codici potrebbero non essere utilizzabili a seconda della lingua o del tipo di voce. Ti preghiamo di tenerne conto in anticipo.

Come usare SSML su Ondoku

Usare SSML su Ondoku è molto semplice.

Inserisci il codice SSML direttamente nella casella di testo di Ondoku.

In questo modo, SSML verrà applicato automaticamente.

Puoi usare SSML semplicemente inserendo all'inizio e alla fine del testo

.

Assicurati di non dimenticare questo codice! Se il codice non è presente, SSML non verrà applicato.

è il codice necessario per abilitare SSML.

Inserisci sempre questo codice all'inizio e alla fine del testo che desideri leggere.

Esempio

Inserisci qui il testo che desideri leggere

Il codice break time è, come suggerisce il nome, un codice per creare delle pause.

Inserisci il codice dove desideri inserire una pausa e sostituisci la parte ○○ con il numero desiderato.

Quando leggi normalmente con Ondoku, a volte le pause non vengono inserite come desiderato.

Questo codice è utile in questi casi.

Ad esempio,

proviamo a inserire questo codice dove vogliamo inserire una pausa.


Voglio fare una piccola pausadurante la lettura di questa frase

Noterai che farà un respiro nel punto in cui è stato inserito il codice prima di continuare a leggere.

※ 1000ms = 1 secondo

Cambiando il numero prima di ms o s, puoi modificare liberamente la durata della "pausa".

  • 200ms = 0.200 secondi
  • 500ms = 0.500 secondi
  • 1000ms = 1.000 secondo
  • 2000ms = 2.000 secondi
  • 3s = 3 secondi ecc.

Note sull'uso di

Il comportamento quando si inserisce il tag all'inizio dell'intero testo varia a seconda della voce e il funzionamento non è garantito.

Esempio: Voglio creare una pausa di 5 secondi all'inizio

↑ Per specifiche tecniche, questo tipo di utilizzo non è possibile.

Inoltre, il limite massimo per la durata della pausa è di 10 secondi (10000ms, 10s).

Se viene impostato un tempo superiore, verrà arrotondato a 10 secondi.

L'uso del tag è spiegato anche in questo articolo.

〇〇

Questo tag viene utilizzato per specificare la lingua per ogni parte del testo durante la lettura multilingue con le voci multilingue (Multilingual) di Ondoku.

Viene utilizzato quando la pronuncia è errata o quando non è possibile distinguere le lingue perché ne vengono usate molte all'interno del testo.


Il "ciao" giapponese si dice Hello in inglese,
Bonjour in francese,
Guten Tag in tedesco,
e 你好 in cinese.

L'uso del tag è spiegato in dettaglio in questo articolo.

○○

Riproduce il testo nella parte ○○ con un suono "bip" di censura televisiva.

È un codice con un tocco scherzoso. Il testo all'interno di questo codice verrà sostituito da un suono "bip".


Questa parola è censurata

○○

Quando si legge l'alfabeto, viene fatto lo spelling lettera per lettera.


Lo spelling di hello è Hello

Tuttavia, con alcune voci questo SSML potrebbe causare un errore. Ti preghiamo di utilizzarlo tenendone conto.

Giapponese: Nanami

Inglese (USA): en-US-A

○○

È un codice che permette di assegnare una lettura specifica (furigana).

Nella sintesi vocale, a volte la lettura può essere inaspettata.

Ad esempio, se "一行" viene pronunciato come "ichiyuki", assegnando la lettura "ichigyou" sarà possibile pronunciarlo correttamente.

Nel codice, inserisci il kanji in ○○ e la lettura in ◇◇.


Leggere correttamente come 一行 e non come 一行

○○

Puoi enfatizzare la lettura del testo racchiuso nel codice.


Questo codice permette di enfatizzare il testo

○○

La prosodia (prosody) è un termine generale che indica le caratteristiche sonore del linguaggio quando si parla naturalmente, come:

  • L'intonazione della voce
  • Le posizioni delle pause
  • La durata e l'intensità, ecc.

Con questo codice è possibile regolare tre parametri:

  • rate (velocità)
    Codici di regolazione: "x-slow", "slow", "medium", "fast", "x-fast", "default"
  • pitch (altezza)
    Codici di regolazione: "x-low", "low", "medium", "high", "x-high", "default"
  • volume (volume)
    Codici di regolazione: "silent", "x-soft", "soft", "medium", "loud", "x-loud", "default"


Parlo velocemente.
Parlo con voce alta.
Parlo a voce alta.
Parlo lentamente e con voce bassa.
Parlo velocemente, con voce alta e a volume normale.

Perché non provi a usare Ondoku in modo più comodo sfruttando SSML?

In questo modo, utilizzando SSML, puoi usare Ondoku in modo ancora più vantaggioso!

Che ne dici di sfruttare ancora più ampiamente la voce realistica e chiara di Ondoku per la produzione di video, presentazioni e altro ancora?

■ Software di sintesi vocale AI “Ondoku”

"Ondoku" è uno strumento di sintesi vocale online che può essere utilizzato senza alcun costo iniziale.

  • Supporta circa 50 lingue tra cui giapponese, inglese, cinese, coreano, spagnolo, francese e tedesco.
  • Disponibile sia da PC che da smartphone
  • Adatto per affari, istruzione, intrattenimento, ecc.
  • Nessuna installazione richiesta, utilizzabile immediatamente dal tuo browser
  • Supporta anche la lettura dalle immagini

Per usarlo è sufficiente inserire del testo o caricare un file dal sito. Genera file audio naturali in pochi secondi. Puoi utilizzare la sintesi vocale per un massimo di 5.000 caratteri gratuitamente, quindi provala prima.

Il software di sintesi vocale "Ondoku" può leggere gratuitamente 5000 caratteri al mese con la voce AI. Puoi facilmente scaricare MP3 ed è anche possibile l'uso commerciale. Se ti iscrivi gratuitamente, puoi convertire gratuitamente fino a 5.000 caratteri al mese dalla sintesi vocale. Prova Ondoku adesso.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Articolo inerente

Software di sintesi vocale del testo Ondoku. È un servizio di sintesi vocale che non richiede installazione e può essere utilizzato da chiunque gratuitamente. Se ti registri gratuitamente, puoi ottenere fino a 5000 caratteri gratuitamente ogni mese. Registrati adesso gratuitamente