Cos'è lo Speech Synthesis Markup Language (SSML). Come usarlo nei software di sintesi vocale e l'elenco dei codici principali.

01 Aprile 2026

Ciao, grazie per utilizzare sempre Ondoku.

In questo articolo presenteremo **SSML**.

Potrebbe sembrare difficile a causa di alcuni termini tecnici, ma imparando a usare SSML potrai utilizzare Ondoku in modo ancora più conveniente.

Lo spiegheremo in modo semplice, quindi dai un'occhiata.

Cos'è SSML

SSML è uno dei linguaggi di markup vocale.

Un "linguaggio di markup" è un linguaggio che, proprio come l'HTML, definisce la struttura (il ruolo) per ogni parte del testo.

Scrivendo il codice SSML, puoi controllare la sintesi vocale di Ondoku in modo più comodo.

Attualmente, i codici SSML supportati in tutte le lingue sono solo

questi due tipi di codici. Altri codici potrebbero non essere utilizzabili a seconda della lingua o del tipo di voce. Ti preghiamo di tenerne conto in anticipo.

Come usare SSML su Ondoku

Usare SSML su Ondoku è molto semplice.

Inserisci il codice SSML direttamente nella casella di testo di Ondoku.

In questo modo, SSML verrà applicato automaticamente.

Puoi usare SSML semplicemente inserendo all'inizio e alla fine del testo

Assicurati di non dimenticare questo codice! Se il codice non è presente, SSML non verrà applicato.

è il codice necessario per abilitare SSML.

Inserisci sempre questo codice all'inizio e alla fine del testo che desideri leggere.

Esempio

Inserisci qui il testo che desideri leggere

Il codice break time è, come suggerisce il nome, un codice per creare delle pause.

Inserisci il codice dove desideri inserire una pausa e sostituisci la parte ○○ con il numero desiderato.

Quando leggi normalmente con Ondoku, a volte le pause non vengono inserite come desiderato.

Questo codice è utile in questi casi.

Ad esempio,

proviamo a inserire questo codice dove vogliamo inserire una pausa.

Voglio fare una piccola pausadurante la lettura di questa frase

Noterai che farà un respiro nel punto in cui è stato inserito il codice prima di continuare a leggere.

※ 1000ms = 1 secondo

Cambiando il numero prima di ms o s, puoi modificare liberamente la durata della "pausa".

200ms = 0.200 secondi
500ms = 0.500 secondi
1000ms = 1.000 secondo
2000ms = 2.000 secondi
3s = 3 secondi ecc.

Note sull'uso di

Il comportamento quando si inserisce il tag all'inizio dell'intero testo varia a seconda della voce e il funzionamento non è garantito.

Esempio: Voglio creare una pausa di 5 secondi all'inizio

↑ Per specifiche tecniche, questo tipo di utilizzo non è possibile.

Inoltre, il limite massimo per la durata della pausa è di 10 secondi (10000ms, 10s).

Se viene impostato un tempo superiore, verrà arrotondato a 10 secondi.

L'uso del tag è spiegato anche in questo articolo.

Come regolare le pause e i tempi di silenzio nella lettura di Ondoku [2 tipi] | Software di sintesi vocale Ondoku

Un'esigenza degli utenti di Ondoku è "vorrei una pausa un po' più lunga". Esistono due tipi di metodi di regolazione per la "pausa": 1. Punteggiatura 2. SSML.

〇〇

Questo tag viene utilizzato per specificare la lingua per ogni parte del testo durante la lettura multilingue con le voci multilingue (Multilingual) di Ondoku.

Viene utilizzato quando la pronuncia è errata o quando non è possibile distinguere le lingue perché ne vengono usate molte all'interno del testo.

Il "ciao" giapponese si dice Hello in inglese,
Bonjour in francese,
Guten Tag in tedesco,
e 你好 in cinese.

L'uso del tag è spiegato in dettaglio in questo articolo.

Qual è il metodo per usare i tag SSML nella lettura multilingue di Ondoku? Come usare il tag <lang> per le voci multilingue | Software di sintesi vocale Ondoku

Qual è il metodo per usare i tag SSML nella lettura multilingue di Ondoku? Come usare il tag per le voci multilingue | Software di sintesi vocale Ondoku

Spiegazione su come utilizzare i tag SSML con la funzione multilingue di Ondoku. Include modelli pronti da copiare e incollare. Ideale per video YouTube e produzione di materiali didattici linguistici!

○○

Riproduce il testo nella parte ○○ con un suono "bip" di censura televisiva.

È un codice con un tocco scherzoso. Il testo all'interno di questo codice verrà sostituito da un suono "bip".

Questa parola è censurata

○○

Quando si legge l'alfabeto, viene fatto lo spelling lettera per lettera.

Lo spelling di hello è Hello

Tuttavia, con alcune voci questo SSML potrebbe causare un errore. Ti preghiamo di utilizzarlo tenendone conto.

Giapponese: Nanami

Inglese (USA): en-US-A

_○○

È un codice che permette di assegnare una lettura specifica (furigana).

Nella sintesi vocale, a volte la lettura può essere inaspettata.

Ad esempio, se "一行" viene pronunciato come "ichiyuki", assegnando la lettura "ichigyou" sarà possibile pronunciarlo correttamente.

Nel codice, inserisci il kanji in ○○ e la lettura in ◇◇.

Leggere correttamente come _一行 e non come 一行

○○

Puoi enfatizzare la lettura del testo racchiuso nel codice.

Questo codice permette di enfatizzare il testo

○○

La prosodia (prosody) è un termine generale che indica le caratteristiche sonore del linguaggio quando si parla naturalmente, come:

L'intonazione della voce
Le posizioni delle pause
La durata e l'intensità, ecc.

Con questo codice è possibile regolare tre parametri:

rate (velocità)
Codici di regolazione: "x-slow", "slow", "medium", "fast", "x-fast", "default"
pitch (altezza)
Codici di regolazione: "x-low", "low", "medium", "high", "x-high", "default"
volume (volume)
Codici di regolazione: "silent", "x-soft", "soft", "medium", "loud", "x-loud", "default"

Parlo velocemente.
Parlo con voce alta.
Parlo a voce alta.
Parlo lentamente e con voce bassa.
Parlo velocemente, con voce alta e a volume normale.

Perché non provi a usare Ondoku in modo più comodo sfruttando SSML?

In questo modo, utilizzando SSML, puoi usare Ondoku in modo ancora più vantaggioso!

Che ne dici di sfruttare ancora più ampiamente la voce realistica e chiara di Ondoku per la produzione di video, presentazioni e altro ancora?

■ Software di sintesi vocale AI “Ondoku”

"Ondoku" è uno strumento di sintesi vocale online che può essere utilizzato senza alcun costo iniziale.

Supporta circa 50 lingue tra cui giapponese, inglese, cinese, coreano, spagnolo, francese e tedesco.
Disponibile sia da PC che da smartphone
Adatto per affari, istruzione, intrattenimento, ecc.
Nessuna installazione richiesta, utilizzabile immediatamente dal tuo browser
Supporta anche la lettura dalle immagini

Per usarlo è sufficiente inserire del testo o caricare un file dal sito. Genera file audio naturali in pochi secondi. Puoi utilizzare la sintesi vocale per un massimo di 5.000 caratteri gratuitamente, quindi provala prima.

Il software di sintesi vocale "Ondoku" può leggere gratuitamente 5000 caratteri al mese con la voce AI. Puoi facilmente scaricare MP3 ed è anche possibile l'uso commerciale. Se ti iscrivi gratuitamente, puoi convertire gratuitamente fino a 5.000 caratteri al mese dalla sintesi vocale. Prova Ondoku adesso.

HP: ondoku3.com
Email: ondoku3.com@gmail.com

←Articolo precedente | Articolo successivo→

Articolo inerente

Errori comuni e soluzioni nell'uso del linguaggio di markup vocale (SSML)

Ondoku text-to-speech: Elenco delle lingue supportate per la lettura

【Da immagine a audio gratuitamente】Come utilizzare la funzione per leggere il testo dalle immagini …

Casi d'uso del software di sintesi vocale. Aumenta la soddisfazione dei clienti con gli strumenti d…

Come usare il software di sintesi vocale Ondoku, metodo di registrazione e funzioni utili

Errore riscontrato in Ondoku: "Le frasi contenenti emoji non possono essere lette"

Ondoku

Software di sintesi vocale del testo Ondoku. È un servizio di sintesi vocale che non richiede installazione e può essere utilizzato da chiunque gratuitamente. Se ti registri gratuitamente, puoi ottenere fino a 5000 caratteri gratuitamente ogni mese. Registrati adesso gratuitamente

Menù

Nuovi articoli

Articoli popolari