Hva er Irodori-TTS? Funksjoner, oppsett og bruk forklart

31. mai 2026

Hva er Irodori-TTS? Funksjoner, oppsett og bruk forklart
dog

Hva slags AI-opplesningsprogramvare er Irodori-TTS?

Mange lurer sikkert på den nye AI-opplesningsprogramvaren "Irodori-TTS".

I denne artikkelen vil vi forklare funksjonene, hva den kan gjøre, forholdsregler og hvordan du bruker Irodori-TTS på en lettforståelig måte.

For de som føler at "oppsettet virker vanskelig", introduserer vi også en talesyntesemetode som kan brukes umiddelbart uten installasjon.

Dette lærer du i denne artikkelen

  1. Hva slags programvare er Irodori-TTS?
  2. Hva du kan gjøre med Irodori-TTS og ting å være oppmerksom på
  3. Hvordan bruke Irodori-TTS (fra oppsett til lydjustering)
  4. Anbefalte metoder når miljøkonfigurasjon er vanskelig

Hva er Irodori-TTS? Forklaring av japansk AI-talesynteseprogramvare

Hva er Irodori-TTS? Forklaring av japansk AI-talesynteseprogramvare

Først vil vi kort forklare hva slags AI-talesynteseprogramvare Irodori-TTS er og dens funksjoner.

Irodori-TTS er en AI-talesyntesemodell som kjører lokalt

Irodori-TTS er en AI-talesynteseprogramvare spesialisert for japansk.

Utvikleren er Aratako, og den er fritt tilgjengelig som åpen kildekode (MIT-lisens).

Den største funksjonen er "lokal drift", som betyr at talesyntesen fullføres kun på din egen PC.

Siden all bildebehandling skjer på din lokale PC, blir ikke tekst eller generert lyddata sendt til eksterne servere.

Etter det første oppsettet kan du generere tale uten internettforbindelse, og det er ingen begrensning på antall genereringer.

Men oppsettet krever programmeringsverktøy som Python og Git.

I tillegg anbefales en kraftig PC med GPU (skjermkort) for rask drift.

Hva du kan og ikke kan gjøre med Irodori-TTS

Hva du kan og ikke kan gjøre med Irodori-TTS

Neste vil vi forklare hva du kan og ikke kan gjøre med Irodori-TTS.

Hva du kan gjøre med Irodori-TTS

Siden Irodori-TTS kjører lokalt, kan du generere tale ubegrenset antall ganger.

Selv i miljøer uten internettforbindelse kan du fritt lage tale når det første oppsettet er ferdig.

Det finnes flere metoder for å instruere hva slags tale som skal lages, og ved å bruke Caption-funksjonen kan du skape din foretrukne stemmekvalitet kun med tekstinstruksjoner.

Det er også mulig å gjenskape eksisterende stemmer med stemmekloning eller legge til følelsesmessige uttrykk med emojier.

Siden den har MIT-lisens, er kommersiell bruk av den genererte talen også mulig.

Forholdsregler for Irodori-TTS

På den annen side er det noen forholdsregler du bør kjenne til før du bruker Irodori-TTS.

Tale kan genereres i opptil ca. 30 sekunder om gangen

I én generering kan den lese opp i opptil ca. 30 sekunder.

Hvis du vil lese opp lange tekster, må du dele opp teksten og generere den flere ganger.

Det er vanskelig å få stemmen og talemåten akkurat slik du ønsker

Irodori-TTS gir stor frihet, men har ingen standardstemme (basestemme) inkludert.

Derfor vil kjønn og alder endres tilfeldig hver gang du genererer, med mindre du spesifiserer Caption eller referanselyd.

Hvis du vil lese opp med samme stemme, må du laste inn en referanselyd.

Det er heller ingen funksjon for å justere intonasjon manuelt.

Støttet språk er kun japansk

Støttet språk er kun japansk, og den støtter ikke fremmedspråk som engelsk.

Vær også oppmerksom på at det kan oppstå feillesinger av kanji.

Kraftig PC med GPU anbefales

Avhengig av PC-spesifikasjonene kan det ta tid å generere tale.

På en PC uten GPU tar det omtrent ett minutt å generere selv korte setninger.

For CPU-er i inngangsklassen som Celeron eller N100, føles praktisk bruk vanskelig.

Slik bruker du Irodori-TTS (oppsettsprosess)

Her vil vi kort forklare hvordan du bruker Irodori-TTS.

Den overordnede prosessen for oppsettet er som følger:

  1. Installer nødvendig programvare
  2. Opprett en arbeidsmappe
  3. Klon Irodori-TTS fra GitHub
  4. Installer nødvendige pakker
  5. Start Irodori-TTS
  6. Last inn AI-modellen
  7. Les opp tekst

1. Installer programvare som trengs for Irodori-TTS

Forberedelser er nødvendig for å sette opp Irodori-TTS.

Først installerer du disse tre typene:

  • Python 3.10 eller høyere: programmeringsspråk
  • Git: versjonskontrollsystem (nødvendig for å laste ned Irodori-TTS)
  • uv: pakkemaskin for Python

For å installere Python, Git og uv, høyreklikk først på startmenyen og klikk på "Terminal" (det er ikke nødvendig å kjøre som administrator).

Klikk på «Terminal»

Terminal-vinduet (PowerShell) åpnes.

Terminal (PowerShell)

Skriv inn og kjør følgende kommandoer i dette vinduet.

winget install --id Git.Git -e

winget install --id=astral-sh.uv -e

Kommando kjøres

Nå er det som trengs for å sette opp Irodori-TTS installert.

*Python administreres av uv, så det blir automatisk installert under oppsettet.

Når installasjonen er ferdig, lukk og åpne terminalen (PowerShell) på nytt (for å oppdatere "Path").

2. Opprett arbeidsmappe

Neste steg er å opprette en arbeidsmappe.

Irodori-TTS vil bli installert her.

I dette eksempelet opprettet vi en mappe kalt "irodori-tts" direkte på C-stasjonen.

Opprett arbeidsmappe

Når mappen er opprettet, flytt til den mappen i terminalen.

cd C:\irodori-tts

Flytt til arbeidsmappe

3. Klon Irodori-TTS fra GitHub

Skriv inn følgende kommando i terminalen for å klone Irodori-TTS-repositoriet fra GitHub.

git clone https://github.com/Aratako/Irodori-TTS.git

Klon repositorium fra GitHub

Kloning av repositoriet tar bare noen få sekunder.

Skriv inn følgende kommando for å flytte til mappen for det klonede repositoriet.

cd Irodori-TTS

Flytt til mappe

4. Installer nødvendige pakker

Skriv inn og kjør følgende kommando for å installere pakkene som trengs for å kjøre Irodori-TTS.

uv sync

Installer pakker

Det vil ta tid siden et stort antall pakker må lastes ned og installeres.

Skjermbilde under pakkeinstallasjon

Selve Python blir også installert her.

Vent uten å lukke terminalen mens nedlasting og installasjon pågår.

Siden filer på nesten 3 GB skal lastes ned, anbefales det å gjøre oppsettet et sted med god internettforbindelse.

5. Start Irodori-TTS

Når nedlasting og installasjon av pakker er ferdig, er oppsettet fullført.

Start Irodori-TTS.

Skriv inn og kjør følgende kommando, og vent litt på oppstarten.

uv run python gradio_app.py --server-name 0.0.0.0 --server-port 7860

Oppstarten er ferdig når følgende vises i terminalen.

Skjermbilde etter fullført oppstart

Running on local URL: http://0.0.0.0:7860

Åpne en nettleser og gå til http://localhost:7860.

Nå åpnes Irodori-TTS-skjermen (WebUI).

Irodori-TTS WebUI

6. Last inn AI-modellen

Klikk på "Load Model" for å laste inn AI-modellen som skal brukes til opplesning.

Load Model

Første gang du bruker den, vil nedlasting av AI-modellen starte når du trykker på denne knappen.

Når fullført-meldingen vises i Model Status (markert med rødt i neste bilde), er innlastingen av AI-modellen ferdig.

Model Status

7. Lese opp tekst med Irodori-TTS

I Irodori-TTS kan du gi instruksjoner for opplesning, inkludert følelsesuttrykk, men la oss først prøve å lese opp uten instruksjoner som et eksempel.

Bla ned til tekstfeltet og skriv inn teksten du vil lese opp.

Skriv inn tekst

Denne gangen prøver vi å lese opp "こんにちは、これはイロドリTTSで作成された音声です。" (Hei, dette er en stemme laget med Irodori-TTS).

(Siden den ikke leste opp riktig når jeg skrev "Irodori-TTS" med det latinske alfabetet, skrev jeg det med katakana som "イロドリTTS").

Trykk på "Generate"-knappen for å starte talegenereringen.

Start generering

Irodori-TTS bruker CPU eller GPU (skjermkort) på din lokale PC for å generere tale.

Derfor vil tiden det tar å generere variere stort avhengig av PC-ens ytelse.

Denne gangen genererte vi på en bærbar PC uten GPU, så selv for en kort setning tok genereringen omtrent ett minutt.

Referanse: Testgenerering ble utført i et miljø med CPU: Ryzen 5 4650U, Minne: DDR4 32GB, Windows 11 Pro 24H2.

Når genereringen er ferdig, vises lydbølgen slik, og du kan spille av lyden.

Generering fullført

Eksempel på opplesning av "こんにちは、これはイロドリTTSで作成された音声です。"

Hvis du er fornøyd etter å ha lyttet, trykk på nedlastingsknappen (ikonet med pil ned) for å lagre lydfilen.

Lydfilen lagres i WAV-format.

Nå har vi brukt Irodori-TTS til å syntetisere tale.

Slik justerer du lyden i Irodori-TTS

I Irodori-TTS kan du justere uttrykk som kjønn og følelser på ulike måter.

Spesifiser følelsesuttrykk med emojier

Klikk på "Emoji Palette" under tekstfeltet for å velge emojier.

Emoji Palette

Hver emoji er tildelt et følelsesuttrykk.

  • 😊 Gledelig, lykkelig
  • 😭 Hulking, gråt
  • 😰 Travelt, opprørt
  • ⏩ Rask tale
  • 📖 Narrasjon, monolog

Ved å bare legge inn emojien i tekstfeltet, kan du lese opp med det spesifiserte følelsesuttrykket.

Eksempel på opplesning av "😊 こんにちは、これはイロドリTTSで作成された音声です。"

Eksempel på opplesning av "📖 こんにちは、これはイロドリTTSで作成された音声です。"

Vær oppmerksom på at du ikke kan spesifisere kjønn eller alder konkret ved å bare bruke emojier.

Last inn referanselyd for å lese opp med samme stemme

I Irodori-TTS kan du laste inn en referanselydfil og la den lese opp med den stemmen som referanse.

Referanselyd lastes inn fra delen der det står "Slipp lyd her - eller - klikk for å laste opp".

Last inn referanselyd

I tillegg til å kunne lese opp med samme stemme, kan du få en klarere lydkvalitet sammenlignet med når ingenting er spesifisert.

Mulig å justere opplesningsstil direkte med Caption-funksjonen

I Irodori-TTS kan du også direkte spesifisere med tekst hva slags stemme som skal brukes.

For å bruke Caption-funksjonen må du starte "VoiceDesign-versjonen", og kommandoen for å starte Irodori-TTS i terminalen endres.

uv run python gradio_app_voicedesign.py --server-name 0.0.0.0 --server-port 7861

Start VoiceDesign-versjonen

Når denne kommandoen kjøres, starter grensesnittet for VoiceDesign-versjonen.

Siden VoiceDesign-versjonen bruker en annen AI-modell enn standardversjonen, må du klikke på "Load Model" for å laste ned modellen separat fra standardversjonen når du bruker den for første gang.

Siden AI-modellen er på omtrent 2 GB, anbefales det å laste den ned et sted med god internettforbindelse.

I grensesnittet for VoiceDesign-versjonen finnes tekstfeltet "Caption / Style Prompt (optional)".

Caption / Style Prompt (optional)

Her skriver du inn en beskrivelse av hvordan du vil at stemmen skal høres ut.

  • Vennligst les opp med en rolig kvinnevoice, på en nær, myk og naturlig måte.
  • Snakk med en energisk mannsstemme, lyst og tydelig.
  • Les nøytralt som en nyhetsoppleser med en dyp mannsstemme.

Slik kan du spesifisere hva slags stemme som skal brukes.

For eksempel, når jeg spesifiserte "Vennligst les opp med en rolig kvinnevoice, på en nær, myk og naturlig måte.", ble stemmen slik:

Eksempel med spesifisert "Vennligst les opp med en rolig kvinnevoice, på en nær, myk og naturlig måte."

Dette ga også en opplesning med klar og lettfattelig lydkvalitet.

Men vær oppmerksom på Caption-funksjonen.

Caption-funksjonen tar lengre tid å generere tale enn andre metoder.

Da vi genererte på en bærbar PC denne gangen, tok det omtrent 5 minutter å generere denne korte setningen.

Når du bruker Caption-funksjonen, anbefales en kraftig PC med GPU.

Hva skjer hvis du leser opp engelsk tekst?

Irodori-TTS er en opplesningsprogramvare som kun støtter japansk.

Så, hva skjer hvis du prøver å lese opp engelsk tekst?

La oss prøve å skrive inn en enkel eksempelsetning.

Eksempel på opplesning av "Hello, this is a voice recording created using Irodori-TTS."

Som du hører, ble Hello uttalt som "haro" med katakana-aksent, og delen recording ble en uforståelig uttale, så den klarte ikke å lese opp riktig.

Hvis du vil lese opp engelsk tekst, anbefales det å bruke en AI-opplesningstjeneste som støtter fremmedspråk.

Anbefalt talesyntesemetode når "oppsettet er vanskelig"

Etter å ha lest så langt, føler kanskje noen at oppsettet av Irodori-TTS virker litt krevende.

Hvis du ikke er vant til terminaloperasjoner eller å sette opp et Python-miljø, kan det ta tid bare å følge prosedyrene.

Hvis du ikke har en PC med GPU, vil hver talesyntese ta så lang tid at det blir vanskelig å bruke til formål som videonarrasjon.

I slike tilfeller anbefales det å bruke AI-stemmer som ikke krever verken installasjon eller oppsett.

『Ondoku』: AI-stemme som kan brukes uten installasjon

Ondoku

Når du vil syntetisere tale enkelt med den nyeste AI-teknologien, anbefales AI-talesyntesetjenesten 『Ondoku』.

『Ondoku』 er en AI-talesyntesetjeneste der du bare åpner nettleseren og limer inn tekst for å lage tale.

Du kan lage tale gratis akkurat nå på PC, mobil eller nettbrett.

Siden talegenereringen skjer i skyen (på serversiden), er det ikke et problem om PC-en din ikke har en GPU.

Siden flere stemmer som mannsstemme, kvinnevoice og barnestemme er klare fra starten, kan du lese opp umiddelbart ved å bare velge, uten å måtte forberede referanselyd eller Caption.

Lange tekster kan også leses opp som de er.

I tillegg støtter Ondoku engelsk!

Den støtter mange språk som fransk, spansk, koreansk og kinesisk, så den kan også brukes til opplesning på andre språk enn japansk.

I tillegg kan du oppleve enda mer naturlig opplesning med neste generasjons AI-stemme (OndokuBeta).

Hvis du leter etter en måte å lese opp tekst som tale på, hvorfor ikke prøve 『Ondoku』, som er gratis og enkel å bruke?

Sammenligning av forskjeller mellom Ondoku og Irodori-TTS

Til slutt sammenligner vi de viktigste forskjellene mellom Ondoku og Irodori-TTS.

👆 Du kan rulle sidelengs
PunktOndokuIrodori-TTS
DriftsmetodeSkybasert (betjenes i nettleser)Lokal (behandles på din PC)
OppsettIkke nødvendigKrever miljøkonfigurasjon for Python, Git osv.
Støttede språkOver 35 språkKun japansk
Hvordan velge stemmeBare velg fra flere stemmerSpesifiser med stemmekloning, Caption eller emojier
Grense per genereringStøtter lang tekstOpptil ca. 30 sekunder
Kommersiell brukMulig (krever kreditering ved gratis bruk)Mulig (MIT-lisens)
Støttede enheterPC, mobil, nettbrettPC (GPU anbefales)
PrisGratisplan tilgjengelig (betalt plan øker antall tegn)Gratis (siden den kjører lokalt)

Ved sammenligning kan de brukes forskjellig: Ondoku for enkelhet og umiddelbar bruk, og Irodori-TTS hvis du har en kraftig PC og vil skreddersy stemmen i detalj.

For de som vil ha tale med en gang, de som trenger opplesning på flere språk, eller de som vil bruke den på mobil eller nettbrett, anbefales Ondoku.

Den passer også for de som vil lese opp lange tekster som de er, de som ikke vil bruke tid på oppsett, eller de som ikke har en GPU i PC-en.

Siden du kan generere tale av høy kvalitet bare ved å åpne nettleseren, hvorfor ikke prøve Ondoku gratis først?

Sammendrag av funksjoner, oppsett og bruk av Irodori-TTS

I denne artikkelen har vi forklart Irodori-TTS, en AI-talesynteseprogramvare for lokal drift spesialisert for japansk.

Irodori-TTS er et attraktivt verktøy for de som vil være nøye med taleuttrykk, for eksempel gjennom stemmekloning, stemmedesign med Caption eller emosjonell kontroll med emojier.

Vær imidlertid oppmerksom på at oppsettmetoden og bruken er for viderekomne brukere, og krever miljøkonfigurasjon for Python og Git.

I tillegg vil talegenereringen ta tid på en PC uten GPU.

For de som "vil bruke talesyntese enkelt med en gang", anbefales 『Ondoku』, som kan brukes direkte i nettleseren.

Hvorfor ikke prøve å lage tale av høy kvalitet med gratis AI-talesyntese som er enkel å bruke?

■ AI talesyntese programvare «Ondoku»

"Ondoku" er et online tekst-til-tale-verktøy som kan brukes uten innledende kostnad.

  • Støtter omtrent 50 språk, inkludert japansk, engelsk, kinesisk, koreansk, spansk, fransk og tysk.
  • Tilgjengelig fra både PC og smarttelefon
  • Egnet for forretninger, utdanning, underholdning, etc.
  • Ingen installasjon nødvendig, kan brukes umiddelbart fra nettleseren din
  • Støtter også lesing fra bilder

For å bruke den, skriv inn tekst eller last opp en fil fra nettstedet. Generer naturlige lydfiler på sekunder. Du kan bruke talesyntese for opptil 5000 tegn gratis, så prøv det først.

Tekst-til-tale-programvaren "Ondoku" kan lese opp 5000 tegn hver måned med AI-stemme gratis. Du kan enkelt laste ned MP3-er og kommersiell bruk er også mulig. Hvis du registrerer deg gratis, kan du konvertere opptil 5000 tegn per måned gratis fra tekst til tale. Prøv Ondoku nå.
HP: ondoku3.com
Email: ondoku3.com@gmail.com
Relatert artikkel

Programvare for tekstlesing Ondoku. Det er en tekst-til-tale-tjeneste som ikke krever installasjon og kan brukes av hvem som helst gratis. Hvis du registrerer deg gratis, kan du få opptil 5000 tegn gratis hver måned. Registrer deg gratis nå