Vad är Speech Synthesis Markup Language (SSML)? Hur man använder det i text-till-tal-programvara och en lista över de viktigaste koderna.
26 januari 2026
Hej, tack för att du använder Ondoku.
I den här artikeln kommer vi att introducera SSML.
Det kan kännas lite svårt med vissa tekniska termer, men genom att lära dig hur du använder SSML kommer du att kunna använda Ondoku ännu mer effektivt.
Vi förklarar det på ett enkelt sätt, så ta gärna en titt.
Vad är SSML
SSML är ett av flera markeringsspråk för tal.
Ett "markeringsspråk" är ett språk som definierar strukturen (rollen) för varje del av texten, precis som HTML.
Genom att skriva SSML-kod kan du styra Ondokus tal på ett mer praktiskt sätt.
För närvarande är de SSML-koder som stöds på alla språk endast följande två typer:
Inga andra koder kan användas beroende på språk eller rösttyp. Vänligen notera detta i förväg.
Hur man använder SSML med Ondoku
Det är väldigt enkelt att använda SSML med Ondoku.
Ange SSML-koden direkt i Ondokus textruta.
Då kommer SSML att tillämpas automatiskt.
Du kan använda SSML genom att helt enkelt infoga
i början och slutet av din text.
Glöm inte att inkludera denna kod! SSML kommer inte att tillämpas om
Se till att placera denna kod i början och slutet av texten du vill läsa upp.
Exempel
Skriv in texten du vill läsa upp här
Koden för break time är, som namnet antyder, en kod för att skapa pauser.
Ange koden där du vill infoga en paus och ersätt ○○ med det tal du föredrar.
När du läser upp text normalt med Ondoku kan det hända att pauserna inte hamnar precis som du tänkt dig.
Det är då den här koden är användbar.
Låt oss till exempel lägga till koden
där vi vill ha en paus.
När jag läser denna mening vill jag ha en kortpaus.
Du kommer då att märka att uppläsningen tar ett andetag på den plats där koden infogades innan den fortsätter.
※ 1000ms = 1 sekund
Genom att ändra siffran framför ms eller s kan du fritt ändra längden på pausen.
- 200ms = 0,200 sekunder
- 500ms = 0,500 sekunder
- 1000ms = 1,000 sekund
- 2000ms = 2,000 sekunder
- 3s = 3 sekunder osv.
Observera vid användning av
Beteendet när en
Exempel:
Jag vill skapa en paus på 5 sekunder i början
↑ Denna typ av användning är inte möjlig på grund av specifikationerna.
Dessutom är maxlängden för en paus 10 sekunder (10000ms, 10s).
Om du ställer in en längre tid kommer den att avrundas till 10 sekunder.
Hur man använder
〇〇
Denna tagg används för att ange språk för specifika delar av texten när du använder Ondokus flerspråkiga röst (Multilingual).
Den används när uttalet blir fel eller när många språk används i en text och inte kan identifieras automatiskt.
日本語のこんにちはは、英語ではHello 、
フランス語ではBonjour 、
ドイツ語ではGuten Tag 、
中国語では你好 といいます。
Hur man använder
○○
Texten i ○○-delen kommer att spelas upp som ett "pip"-ljud (censurljud).
Det är en lite lekfull kod. Texten i den del som omges av denna kod kommer att ersättas med ett pipljud.
Detta ord ärcensurerat .
○○
När alfabetet läses upp kommer det att stavas ut bokstav för bokstav.
The spelling of hello isHello
Observera dock att denna SSML kan orsaka fel i vissa röster. Använd den med detta i åtanke.
Japanska: Nanami
Engelska (USA): en-US-A
○○
Detta är en kod som gör att du kan ange hur ett ord ska läsas (furigana).
Vid textuppläsning händer det ibland att ord läses upp på ett oväntat sätt.
Till exempel, om "一行" uttalas som "ichiyuki", kan du se till att det uttalas korrekt som "ichigyou" genom att ange läsningen.
I koden anger du kanji i ○○ och läsningen i ◇◇.
Läs korrekt som 一行 istället för ichiyuki.
○○
Du kan betona texten som omges av koden vid uppläsning.
Denna kod kan användas för attbetona .
○○
Prosodi (prosody/rytmen) är en samlingsterm för ljudegenskaperna i ett språk, såsom
- Tonfall (höjning och sänkning)
- Pauspositioner
- Längd och betoning osv.
när man talar naturlig engelska.
Det du kan justera med denna kod är:
- rate (takt, hastighet)
Justeringskoder: "x-slow", "slow", "medium", "fast", "x-fast", "default" - pitch (tonhöjd, höjd)
Justeringskoder: "x-low", "low", "medium", "high", "x-high", "default" - volume (volym, ljudstyrka)
Justeringskoder: "silent", "x-soft", "soft", "medium", "loud", "x-loud", "default"
Dessa tre typer kan justeras.
Jag pratar snabbt.
Jag pratar med hög röst.
Jag pratar högt.
Jag pratar långsamt och med låg röst.
Jag pratar snabbt, med hög röst och normal volym.
Varför inte använda SSML för att göra Ondoku ännu mer praktiskt?
Som du kan se kan du använda Ondoku ännu mer effektivt genom att använda SSML!
Varför inte använda Ondokus realistiska och lättförståeliga röst för ett ännu bredare utbud av ändamål, som videoproduktion och presentationer?
■ AI-talsyntesprogramvara "Ondoku"
"Ondoku" är ett online-text-till-tal-verktyg som kan användas utan initial kostnad.
- Stöder cirka 50 språk inklusive japanska, engelska, kinesiska, koreanska, spanska, franska och tyska.
- Finns både från PC och smartphone
- Lämplig för affärer, utbildning, underhållning, etc.
- Ingen installation krävs, kan användas direkt från din webbläsare
- Stöder även läsning från bilder
För att använda det, skriv bara in text eller ladda upp en fil från webbplatsen. Generera naturliga ljudfiler på några sekunder. Du kan använda talsyntes för upp till 5 000 tecken gratis, så prova det först.
Email: ondoku3.com@gmail.com
Textläsningsprogramvara Ondoku. Det är en text-till-tal-tjänst som kan användas gratis av alla utan installation. Om du registrerar dig gratis kan du få upp till 5000 tecken gratis varje månad. Registrera dig gratis nu
- Vad är Ondoku?
- Läs texten på Ondoku
- Gratis registrering
- Betygsätt plan
- Lista över artiklar
- Prova även andra gratistjänster