Vad är Speech Synthesis Markup Language (SSML)? Hur man använder det i text-till-tal-programvara och en lista över de viktigaste koderna.

26 januari 2026

Vad är Speech Synthesis Markup Language (SSML)? Hur man använder det i text-till-tal-programvara och en lista över de viktigaste koderna.

Hej, tack för att du använder Ondoku.

I den här artikeln kommer vi att introducera SSML.

Det kan kännas lite svårt med vissa tekniska termer, men genom att lära dig hur du använder SSML kommer du att kunna använda Ondoku ännu mer effektivt.

Vi förklarar det på ett enkelt sätt, så ta gärna en titt.

Vad är SSML

SSML är ett av flera markeringsspråk för tal.

Ett "markeringsspråk" är ett språk som definierar strukturen (rollen) för varje del av texten, precis som HTML.

Genom att skriva SSML-kod kan du styra Ondokus tal på ett mer praktiskt sätt.

För närvarande är de SSML-koder som stöds på alla språk endast följande två typer:

Inga andra koder kan användas beroende på språk eller rösttyp. Vänligen notera detta i förväg.

Hur man använder SSML med Ondoku

Det är väldigt enkelt att använda SSML med Ondoku.

Ange SSML-koden direkt i Ondokus textruta.

Då kommer SSML att tillämpas automatiskt.

Du kan använda SSML genom att helt enkelt infoga

i början och slutet av din text.

Glöm inte att inkludera denna kod! SSML kommer inte att tillämpas om -koden saknas.

är den kod som krävs för att aktivera SSML.

Se till att placera denna kod i början och slutet av texten du vill läsa upp.

Exempel

Skriv in texten du vill läsa upp här

Koden för break time är, som namnet antyder, en kod för att skapa pauser.

Ange koden där du vill infoga en paus och ersätt ○○ med det tal du föredrar.

När du läser upp text normalt med Ondoku kan det hända att pauserna inte hamnar precis som du tänkt dig.

Det är då den här koden är användbar.

Låt oss till exempel lägga till koden

där vi vill ha en paus.


När jag läser denna mening vill jag ha en kort paus.

Du kommer då att märka att uppläsningen tar ett andetag på den plats där koden infogades innan den fortsätter.

※ 1000ms = 1 sekund

Genom att ändra siffran framför ms eller s kan du fritt ändra längden på pausen.

  • 200ms = 0,200 sekunder
  • 500ms = 0,500 sekunder
  • 1000ms = 1,000 sekund
  • 2000ms = 2,000 sekunder
  • 3s = 3 sekunder osv.

Observera vid användning av

Beteendet när en -tagg infogas i början av hela texten varierar beroende på röstspecifikationerna, och funktionen kan inte garanteras.

Exempel: Jag vill skapa en paus på 5 sekunder i början

↑ Denna typ av användning är inte möjlig på grund av specifikationerna.

Dessutom är maxlängden för en paus 10 sekunder (10000ms, 10s).

Om du ställer in en längre tid kommer den att avrundas till 10 sekunder.

Hur man använder -taggen förklaras även i denna artikel.

〇〇

Denna tagg används för att ange språk för specifika delar av texten när du använder Ondokus flerspråkiga röst (Multilingual).

Den används när uttalet blir fel eller när många språk används i en text och inte kan identifieras automatiskt.


日本語のこんにちはは、英語ではHello
フランス語ではBonjour
ドイツ語ではGuten Tag
中国語では你好といいます。

Hur man använder -taggen förklaras i detalj i denna artikel.

○○

Texten i ○○-delen kommer att spelas upp som ett "pip"-ljud (censurljud).

Det är en lite lekfull kod. Texten i den del som omges av denna kod kommer att ersättas med ett pipljud.


Detta ord är censurerat.

○○

När alfabetet läses upp kommer det att stavas ut bokstav för bokstav.


The spelling of hello is Hello

Observera dock att denna SSML kan orsaka fel i vissa röster. Använd den med detta i åtanke.

Japanska: Nanami

Engelska (USA): en-US-A

○○

Detta är en kod som gör att du kan ange hur ett ord ska läsas (furigana).

Vid textuppläsning händer det ibland att ord läses upp på ett oväntat sätt.

Till exempel, om "一行" uttalas som "ichiyuki", kan du se till att det uttalas korrekt som "ichigyou" genom att ange läsningen.

I koden anger du kanji i ○○ och läsningen i ◇◇.


Läs korrekt som 一行 istället för ichiyuki.

○○

Du kan betona texten som omges av koden vid uppläsning.


Denna kod kan användas för att betona.

○○

Prosodi (prosody/rytmen) är en samlingsterm för ljudegenskaperna i ett språk, såsom

  • Tonfall (höjning och sänkning)
  • Pauspositioner
  • Längd och betoning osv.

när man talar naturlig engelska.

Det du kan justera med denna kod är:

  • rate (takt, hastighet)
    Justeringskoder: "x-slow", "slow", "medium", "fast", "x-fast", "default"
  • pitch (tonhöjd, höjd)
    Justeringskoder: "x-low", "low", "medium", "high", "x-high", "default"
  • volume (volym, ljudstyrka)
    Justeringskoder: "silent", "x-soft", "soft", "medium", "loud", "x-loud", "default"

Dessa tre typer kan justeras.


Jag pratar snabbt.
Jag pratar med hög röst.
Jag pratar högt.
Jag pratar långsamt och med låg röst.
Jag pratar snabbt, med hög röst och normal volym.

Varför inte använda SSML för att göra Ondoku ännu mer praktiskt?

Som du kan se kan du använda Ondoku ännu mer effektivt genom att använda SSML!

Varför inte använda Ondokus realistiska och lättförståeliga röst för ett ännu bredare utbud av ändamål, som videoproduktion och presentationer?

■ AI-talsyntesprogramvara "Ondoku"

"Ondoku" är ett online-text-till-tal-verktyg som kan användas utan initial kostnad.

  • Stöder cirka 50 språk inklusive japanska, engelska, kinesiska, koreanska, spanska, franska och tyska.
  • Finns både från PC och smartphone
  • Lämplig för affärer, utbildning, underhållning, etc.
  • Ingen installation krävs, kan användas direkt från din webbläsare
  • Stöder även läsning från bilder

För att använda det, skriv bara in text eller ladda upp en fil från webbplatsen. Generera naturliga ljudfiler på några sekunder. Du kan använda talsyntes för upp till 5 000 tecken gratis, så prova det först.

Text-till-tal-mjukvaran "Ondoku" kan läsa upp 5000 tecken varje månad med AI-röst gratis. Du kan enkelt ladda ner MP3-filer och kommersiell användning är också möjlig. Om du registrerar dig gratis kan du konvertera upp till 5 000 tecken per månad gratis från text till tal. Prova Ondoku nu.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Relaterad artikel