Hvad er Irodori-TTS? Funktioner, tips og vejledning forklaret
31. maj 2026

Hvilken slags AI-tekst-til-tale-software er Irodori-TTS?
Mange er sikkert nysgerrige efter den nye AI-tekst-til-tale-software "Irodori-TTS".
I denne artikel forklarer vi Irodori-TTS' funktioner, muligheder, forholdsregler og brug på en letforståelig måde.
Desuden introducerer vi for dem, der føler, at "opsætningen virker svær", en stemmesyntese-metode, der kan bruges med det samme uden installation.
Det lærer du i denne artikel
- Hvilken slags software er Irodori-TTS?
- Hvad Irodori-TTS kan og forholdsregler
- Sådan bruger du Irodori-TTS (fra opsætning til lydjustering)
- Anbefalet metode, når miljøkonfiguration er svær
Hvad er Irodori-TTS? Forklaring af japansk AI-stemmesyntese-software

Lad os først kort forklare, hvilken slags AI-stemmesyntese-software Irodori-TTS er, og dens funktioner.
Irodori-TTS er en AI-stemmesyntese-model, der kører lokalt
Irodori-TTS er en AI-stemmesyntese-software specialiseret i japansk.
Udvikleren er Aratako, og den er udgivet gratis som open source (MIT-licens).
Den største funktion er "lokal drift", hvor stemmesyntese fuldføres udelukkende på din egen PC.
Da al stemmegenerering foregår på din lokale PC, sendes hverken tekst eller genererede lyddata til eksterne servere.
Efter den indledende opsætning kan du generere stemme uden internetforbindelse, og der er ingen begrænsning på antallet af genereringer.
Opsætningen kræver dog programmeringsværktøjer som Python og Git.
Desuden anbefales en højtydende PC udstyret med en GPU (grafikkort) for hurtig drift.
Hvad Irodori-TTS kan og ikke kan

Lad os derefter se på, hvad Irodori-TTS kan og ikke kan.
Hvad Irodori-TTS kan
Da Irodori-TTS kører i et lokalt miljø, kan du generere stemme ubegrænset antal gange.
Selv i miljøer uden internetforbindelse kan du frit skabe stemme, når den indledende opsætning er færdig.
Der er flere metoder til at instruere, hvilken slags stemme der skal skabes, og ved hjælp af caption-funktionen kan du skabe din foretrukne stemmekvalitet kun med tekstinstruktioner.
Det er også muligt at genskabe en eksisterende stemme med stemmekloning eller tilføje følelsesmæssige udtryk med emoji.
Da det er en MIT-licens, er kommerciel brug af den genererede stemme også tilladt.
Forholdsregler for Irodori-TTS
På den anden side er der nogle forholdsregler, man bør kende, før man bruger Irodori-TTS.
Der kan genereres op til ca. 30 sekunders tale ad gangen
Hver generering kan læse op til ca. 30 sekunder.
Hvis du vil læse en lang tekst op, er det nødvendigt at opdele teksten og generere den af flere omgange.
Det er svært at få præcis den stemme eller talemåde, man ønsker
Da Irodori-TTS har en høj grad af frihed, er der ingen standardstemme (basisstemme) klar.
Derfor vil køn og alder ændre sig tilfældigt ved hver generering, medmindre du angiver en caption eller en referencestemme.
Hvis du vil læse op med den samme stemme, skal du indlæse en referencestemme.
Der er heller ingen funktion til manuelt at justere betoning eller intonation.
Understøtter kun japansk
Det understøttede sprog er kun japansk, og fremmedsprog som engelsk understøttes ikke.
Vær også opmærksom på, at der kan forekomme fejllæsninger af Kanji.
Højtydende PC med GPU anbefales
Afhængigt af din PC's specifikationer kan det tage tid at generere stemme.
På en PC uden GPU tager det omkring 1 minut at generere selv en kort tekst.
På CPU'er i entry-klassen som Celeron eller N100 føles praktisk brug vanskelig.
Sådan bruger du Irodori-TTS (Opsætningsforløb)
Her forklarer vi kort, hvordan man bruger Irodori-TTS.
Det samlede forløb for opsætningen er som følger:
- Installer den nødvendige software
- Opret en arbejdsmappe
- Klon Irodori-TTS fra GitHub
- Installer de nødvendige pakker
- Start Irodori-TTS
- Indlæs AI-modellen
- Læs teksten op
1. Installer den nødvendige software til Irodori-TTS
Opsætning af Irodori-TTS kræver forberedelse.
Installer først disse tre typer software:
- Python 3.10 eller nyere: Programmeringssprog
- Git: Versionsstyringssystem (nødvendigt for at downloade Irodori-TTS)
- uv: Pakkehåndtering til Python
For at installere Python, Git og uv skal du først højreklikke på startmenuen og klikke på "Terminal" (det er ikke nødvendigt at starte som administrator).

Derefter åbnes terminalvinduet (PowerShell).

Indtast og kør følgende kommandoer i dette vindue:
winget install --id Git.Git -e
winget install --id=astral-sh.uv -e

Nu er alt det nødvendige for at opsætte Irodori-TTS installeret.
※ Da Python administreres af uv, installeres det automatisk under opsætningen.
Når installationen er færdig, skal du lukke terminalen (PowerShell) og åbne den igen (for at opdatere "Path").
2. Opret en arbejdsmappe
Dernæst skal du oprette en arbejdsmappe.
Her vil Irodori-TTS blive installeret.
I dette eksempel oprettede vi en mappe med navnet "irodori-tts" direkte under C-drevet.

Når mappen er oprettet, skal du navigere til den i terminalen.
cd C:\irodori-tts

3. Klon Irodori-TTS fra GitHub
Indtast følgende kommando i terminalen for at klone Irodori-TTS-repositoriet fra GitHub.
git clone https://github.com/Aratako/Irodori-TTS.git

Kloning af repositoriet tager kun få sekunder.
Indtast derefter følgende kommando for at gå ind i den klonede mappe.
cd Irodori-TTS

4. Installer de nødvendige pakker
Indtast og kør følgende kommando for at installere de pakker, der er nødvendige for at køre Irodori-TTS.
uv sync

Det vil tage tid, da et stort antal pakker skal downloades og installeres.

Selve Python bliver også installeret her.
Vent uden at lukke terminalen, mens overførslen og installationen er i gang.
Da filer på næsten 3GB skal downloades, anbefales det at foretage opsætningen et sted med en god internetforbindelse.
5. Start Irodori-TTS
Når download og installation af pakkerne er færdig, er opsætningen fuldført.
Start Irodori-TTS.
Indtast og kør følgende kommando, og vent lidt på opstarten.
uv run python gradio_app.py --server-name 0.0.0.0 --server-port 7860
Når terminalen viser følgende, er opstarten gennemført:

Running on local URL: http://0.0.0.0:7860
Åbn en webbrowser og gå til http://localhost:7860.
Irodori-TTS-skærmen (WebUI) vil nu åbne.

6. Indlæs AI-modellen
Klik på "Load Model" for at indlæse AI-modellen til oplæsning.

Første gang du bruger programmet, vil download af AI-modellen starte, når du trykker på denne knap.
Når en meddelelse om fuldførelse vises i Model Status (indrammet med rødt på det næste billede), er indlæsningen af AI-modellen færdig.

7. Læs tekst op med Irodori-TTS
I Irodori-TTS kan du give instruktioner om følelsesudtryk og oplæsningsstil, men lad os først prøve at læse op uden instruktioner som et eksempel.
Rul ned for at finde tekstfeltet, og indtast den tekst, du vil have læst op.

Denne gang prøver vi at læse op: "こんにちは、これはイロドリTTSで作成された音声です。" (Hej, dette er en stemme skabt med Irodori-TTS).
(Da oplæsningen ikke blev helt korrekt, når "Irodori-TTS" blev skrevet med latinske bogstaver, brugte vi katakana "イロドリTTS").
Tryk på knappen "Generate" for at starte stemmegenereringen.

Irodori-TTS bruger din egen PC's CPU eller GPU (grafikkort) til at generere stemmen.
Derfor vil tiden det tager at generere stemmen variere meget afhængigt af din PC's ydeevne.
Da vi genererede dette på en bærbar PC uden GPU, tog det omkring 1 minut, selvom teksten var kort.
Reference: Testgenerering udført i et miljø med CPU: Ryzen 5 4650U, Hukommelse: DDR4 32GB, Windows 11 Pro 24H2.
Når genereringen er færdig, vises stemmens bølgeform, og du kan afspille lyden.

Eksempel på oplæsning af "こんにちは、これはイロドリTTSで作成された音声です。"
Hvis du er tilfreds med resultatet, kan du trykke på download-knappen (pil ned-ikonet) for at gemme lydfilen.
Lydfilen gemmes i WAV-format.
Nu har du syntetiseret stemme ved hjælp af Irodori-TTS.
Sådan justeres stemmen i Irodori-TTS
I Irodori-TTS kan du justere udtryk som køn og følelser på forskellige måder.
Angiv følelsesudtryk med emoji
Klik på "Emoji Palette" under tekstfeltet for at vælge emojis.

Hver emoji er tildelt et følelsesmæssigt udtryk.
- 😊 Glad, lykkelig
- 😭 Hulken, gråd
- 😰 Forhastet, rystet
- ⏩ Hurtig tale
- 📖 Narration, monolog
Ved blot at indsætte en emoji i tekstfeltet kan du læse teksten op med det angivne følelsesudtryk.
Eksempel på oplæsning af "😊 こんにちは、これはイロドリTTSで作成された音声です。"
Eksempel på oplæsning af "📖 こんにちは、これはイロドリTTSで作成された音声です。"
Vær dog opmærksom på, at køn og alder ikke kan specificeres præcist kun ved hjælp af emojis.
Indlæs en referencestemme for at tale med samme stemme
I Irodori-TTS kan du indlæse en referencelydfil og få programmet til at læse op med den stemme som reference.
Referencestemmen indlæses i det felt, hvor der står 「音声をここにドロップ - または - クリックしてアップロード」 (Slip lyd her - eller - klik for at uploade).

Udover at kunne læse op med den samme stemme, giver det ofte en klarere lydkvalitet sammenlignet med ikke at angive noget.
Justering af oplæsningsstil direkte med caption-funktionen
I Irodori-TTS kan du også angive direkte med tekst, hvilken slags stemme der skal læses op med.
Hvis du vil bruge caption-funktionen, skal du starte "VoiceDesign-versionen", og kommandoen til at starte Irodori-TTS i terminalen ændres.
uv run python gradio_app_voicedesign.py --server-name 0.0.0.0 --server-port 7861

Når denne kommando køres, starter betjeningsskærmen for VoiceDesign-versionen.
Da VoiceDesign-versionen bruger en anden AI-model end standardversionen, skal du klikke på "Load Model" for at downloade modellen separat fra standardversionen første gang du bruger den.
Da AI-modellen fylder omkring 2GB, anbefales det at downloade den et sted med en god internetforbindelse.
På betjeningsskærmen for VoiceDesign-versionen er der et tekstfelt til "Caption / Style Prompt (optional)".

Her indtaster du en beskrivelse af, hvilken stemme du ønsker skal læse op.
- Læs venligst op med en rolig kvindestemme, med en tæt distance og på en blød og naturlig måde.
- Tal venligst med en frisk mandsstemme, lyst og tydeligt.
- Læs venligst op med en dyb mandsstemme, sagligt som en nyhedsvært.
På denne måde kan du angive, hvilken stemme der skal læses op med.
For eksempel gav beskrivelsen "Læs venligst op med en rolig kvindestemme, med en tæt distance og på en blød og naturlig måde." følgende resultat.
Eksempel med angivelse af "Læs venligst op med en rolig kvindestemme, med en tæt distance og på en blød og naturlig måde."
Her lykkedes det også at generere en stemme med klar lydkvalitet, der var let at forstå.
Men der er en forholdsregel ved brug af caption-funktionen.
Caption-funktionen tager længere tid at generere stemme sammenlignet med andre oplæsningsmetoder.
Da vi genererede dette på en bærbar PC, tog det ca. 5 minutter at generere denne korte tekst.
Når du bruger caption-funktionen, anbefales en højtydende PC med GPU.
Hvad sker der, hvis man læser engelsk tekst op?
Irodori-TTS er en oplæsningssoftware, der kun understøtter japansk.
Hvad sker der så, hvis man prøver at læse engelsk tekst op?
Lad os prøve at indtaste en simpel eksempelsætning.
Eksempel på oplæsning af "Hello, this is a voice recording created using Irodori-TTS."
Som det kan høres, blev "Hello" udtalt som "Haro" med katakana-udtale, og "recording"-delen blev udtalt så utydeligt, at den ikke kunne forstås, så det lykkedes ikke at læse teksten korrekt op.
Hvis du vil læse engelsk tekst op, anbefales det at bruge en AI-oplæsningstjeneste, der understøtter fremmedsprog.
Anbefalet stemmesyntese-metode, hvis "opsætning er for svær"
Efter at have læst hertil føler nogle måske, at opsætningen af Irodori-TTS virker en smule besværlig.
Hvis man ikke er vant til terminal-betjening eller konfiguration af Python-miljøer, kan det tage lang tid blot at følge proceduren.
Hvis man desuden ikke ejer en PC med GPU, tager hver stemmesyntese så lang tid, at det er svært at bruge til formål som f.eks. indtaling til videoer.
I sådanne tilfælde anbefales det at bruge AI-stemme, der hverken kræver installation eller opsætning.
『Ondoku』AI-stemme, der kan bruges uden installation

Når du nemt vil syntetisere stemme med den nyeste AI, anbefales AI-stemmesyntese-tjenesten 『Ondoku』.
『Ondoku』 er en AI-stemmesyntese-tjeneste, hvor du blot åbner browseren og indsætter tekst for at skabe stemme.
Du kan oprette stemme gratis med det samme på din PC, smartphone eller tablet.
Da stemmegenereringen foregår i skyen (på server-siden), er det ikke et problem, hvis din PC ikke har en GPU.
Da der allerede er forberedt flere stemmer som mandsstemmer, kvindestemmer og børnestemmer, kan du læse op med det samme ved blot at vælge, uden at skulle forberede referencestemmer eller captions.
Lange tekster kan også læses op som de er.
Og Ondoku understøtter også engelsk!
Da den understøtter mange sprog som fransk, spansk, koreansk og kinesisk, kan den også bruges til oplæsning på andre sprog end japansk.
Desuden kan du opleve endnu mere naturlig oplæsning med næste generations AI-stemme (OndokuBeta).
Hvis du leder efter en måde at læse tekst op som stemme, hvorfor så ikke prøve 『Ondoku』, som er gratis og nem at bruge?
Sammenligning af forskellene mellem Ondoku og Irodori-TTS
Til sidst sammenligner vi de vigtigste forskelle mellem Ondoku og Irodori-TTS.
| Emne | Ondoku | Irodori-TTS |
|---|---|---|
| Driftsmetode | Skyen (betjenes i browser) | Lokal (behandles på egen PC) |
| Opsætning | Ikke nødvendig | Miljøkonfiguration af Python, Git osv. påkrævet |
| Understøttede sprog | Over 35 sprog | Kun japansk |
| Valg af stemme | Vælg blot blandt flere stemmer | Angiv via stemmekloning, caption eller emoji |
| Grænse pr. generering | Understøtter lange tekster | Op til ca. 30 sekunder |
| Kommerciel brug | Mulig (kreditering påkrævet ved gratis brug) | Mulig (MIT-licens) |
| Understøttede enheder | PC, smartphone, tablet | PC (GPU anbefales) |
| Pris | Gratis abonnement findes (udvidelse af antal tegn ved betalt abonnement) | Gratis (da den kører lokalt) |
Ved sammenligning kan man sige, at Ondoku er bedst til brugervenlighed og øjeblikkelig brug, mens Irodori-TTS er for dem, der har en kraftig PC og ønsker at finjustere stemmen detaljeret.
For dem, der har brug for stemme her og nu, dem der har brug for oplæsning på flere sprog, eller dem der ønsker at bruge det på smartphone eller tablet, anbefales Ondoku.
Den er også velegnet til dem, der vil læse lange tekster op som de er, dem der ikke vil bruge tid på opsætning, eller dem hvis PC ikke har en GPU.
Da du kan generere stemme af høj kvalitet med det samme blot ved at åbne browseren, hvorfor så ikke prøve Ondoku gratis?
Opsamling: Funktioner, opsætning og brug af Irodori-TTS
I denne artikel har vi forklaret Irodori-TTS, en lokal AI-stemmesyntese-software specialiseret i japansk.
Irodori-TTS er et attraktivt værktøj for dem, der går op i stemmeudtryk, med funktioner som stemmekloning, stemmedesign via captions og følelsesstyring via emojis.
Men opsætning og brug er rettet mod avancerede brugere, og opsætningen kræver konfiguration af Python- og Git-miljøer.
Desuden tager det tid at generere stemme på en PC uden GPU.
For dem, der "nemt og hurtigt vil bruge stemmesyntese", anbefales 『Ondoku』, som kan bruges direkte i browseren.
Hvorfor ikke prøve at skabe stemme af høj kvalitet med den brugervenlige og gratis AI-stemmesyntese?
■ AI-talesyntesesoftware "Ondoku"
"Ondoku" er et online tekst-til-tale-værktøj, der kan bruges uden startomkostninger.
- Understøtter cirka 50 sprog, inklusive japansk, engelsk, kinesisk, koreansk, spansk, fransk og tysk.
- Tilgængelig fra både pc og smartphone
- Velegnet til forretning, uddannelse, underholdning osv.
- Ingen installation nødvendig, kan bruges med det samme fra din browser
- Understøtter også læsning fra billeder
For at bruge det skal du blot indtaste tekst eller uploade en fil fra webstedet. Generer naturlige lydfiler på få sekunder. Du kan bruge talesyntese for op til 5.000 tegn gratis, så prøv det først.
Email: ondoku3.com@gmail.com
Tekstlæsningssoftware Ondoku. Det er en tekst-til-tale-tjeneste, der ikke kræver installation og kan bruges af enhver gratis. Hvis du registrerer dig gratis, kan du få op til 5000 tegn gratis hver måned. Tilmeld dig nu gratis
- Hvad er Ondoku?
- Læs tekst på Ondoku
- Gratis registrering
- Bedøm plan
- Liste over artikler
- Prøv andre gratis tjenester