Wat is Irodori-TTS? Functies, tips en gebruik eenvoudig uitgelegd
31 mei 2026

Wat voor soort AI-voorleessoftware is Irodori-TTS?
Veel mensen zijn waarschijnlijk benieuwd naar de nieuwe AI-voorleessoftware "Irodori-TTS".
In dit artikel leggen we op een begrijpelijke manier de kenmerken, mogelijkheden, aandachtspunten en het gebruik van Irodori-TTS uit.
Daarnaast introduceren we voor degenen die denken dat de "installatie moeilijk lijkt", een spraaksynthesemethode die direct kan worden gebruikt zonder installatie.
Wat u leert in dit artikel
- Wat voor soort software is Irodori-TTS?
- Mogelijkheden en aandachtspunten van Irodori-TTS
- Hoe Irodori-TTS te gebruiken (van installatie tot spraakaanpassing)
- Aanbevolen methode wanneer de configuratie van de omgeving moeilijk is
Wat is Irodori-TTS? Uitleg over de Japanse AI-spraaksynthesesoftware

Laten we eerst kort uitleggen wat voor soort AI-spraaksynthesesoftware Irodori-TTS is en wat de kenmerken zijn.
Irodori-TTS is een lokaal werkend AI-spraaksynthesemodel
Irodori-TTS is AI-spraaksynthesesoftware die gespecialiseerd is in de Japanse taal.
De ontwikkelaar is Aratako, en de software is gratis beschikbaar als open source (MIT-licentie).
Het belangrijkste kenmerk is dat het "lokaal" kan werken, wat betekent dat de spraaksynthese volledig op uw eigen pc plaatsvindt.
Omdat alle verwerking voor het genereren van spraak op uw eigen pc gebeurt, worden tekst en gegenereerde spraakgegevens nooit naar een externe server verzonden.
Na de eerste installatie kunt u spraak genereren zonder internetverbinding, en er is geen limiet op het aantal generaties.
Voor de installatie zijn echter programmeertools zoals Python en Git vereist.
Bovendien wordt een krachtige pc met een GPU (grafische kaart) aanbevolen om de software snel te laten werken.
Wat u wel en niet kunt doen met Irodori-TTS

Vervolgens leggen we uit wat de mogelijkheden en beperkingen van Irodori-TTS zijn.
Wat u kunt doen met Irodori-TTS
Omdat Irodori-TTS in een lokale omgeving werkt, kunt u onbeperkt en zo vaak als u wilt spraak genereren.
Zelfs in een omgeving zonder internetverbinding kunt u na de eerste installatie vrijuit spraak maken.
Er zijn meerdere manieren om aan te geven wat voor soort spraak u wilt maken. Met de bijschriftfunctie kunt u alleen met tekstinstructies een stemkwaliteit creëren die naar uw smaak is.
Ook is het mogelijk om met spraakcloning een bestaande stem te reproduceren of emotionele expressies toe te voegen met emoji's.
Dankzij de MIT-licentie is commercieel gebruik van de gegenereerde spraak ook toegestaan.
Aandachtspunten bij Irodori-TTS
Aan de andere kant zijn er ook enkele aandachtspunten die u moet weten voordat u Irodori-TTS gebruikt.
De per keer gegenereerde spraak is maximaal ongeveer 30 seconden
In één generatie kan er maximaal ongeveer 30 seconden aan spraak worden voorgelezen.
Als u lange teksten wilt laten voorlezen, moet u de tekst opsplitsen en meerdere keren genereren.
Het is moeilijk om precies de gewenste stem of manier van spreken te krijgen
Hoewel Irodori-TTS veel vrijheid biedt, zijn er geen standaardstemmen (basisstemmen) vooraf ingesteld.
Daarom zullen het geslacht en de leeftijd bij elke generatie willekeurig veranderen, tenzij u een bijschrift of referentiestem opgeeft.
Als u met dezelfde stem wilt laten voorlezen, moet u een referentiestem laden.
Bovendien is er geen functie om intonatie en klemtoon handmatig aan te passen.
Ondersteunde taal is alleen Japans
De ondersteunde taal is uitsluitend Japans; vreemde talen zoals Engels worden niet ondersteund.
Houd er ook rekening mee dat er soms fouten kunnen optreden bij het lezen van Kanji.
High-spec pc met GPU aanbevolen
Afhankelijk van de specificaties van uw pc kan het genereren van spraak enige tijd duren.
Op een pc zonder GPU kan het genereren van zelfs korte teksten ongeveer een minuut duren.
Op entry-level CPU's zoals Celeron of N100 voelt praktisch gebruik moeizaam aan.
Hoe Irodori-TTS te gebruiken (stroom van de installatie)
Hieronder volgt een korte uitleg over het gebruik van Irodori-TTS.
De algemene stroom van de installatie is als volgt:
- Installeer de benodigde software
- Maak een werkmap aan
- Kloon Irodori-TTS van GitHub
- Installeer de benodigde pakketten
- Start Irodori-TTS
- Laad het AI-model
- Lees de tekst voor
1. De benodigde software voor Irodori-TTS installeren
Er is enige voorbereiding nodig om Irodori-TTS te installeren.
Installeer eerst deze drie zaken:
- Python 3.10 of hoger: programmeertaal
- Git: versiebeheersysteem (nodig om Irodori-TTS te downloaden)
- uv: pakketbeheerder voor Python
Om Python, Git en uv te installeren, klikt u eerst met de rechtermuisknop op het startmenu en selecteert u "Terminal" (u hoeft dit niet als administrator uit te voeren).

Het terminalvenster (PowerShell) wordt geopend.

Voer in dit scherm de volgende commando's uit:
winget install --id Git.Git -e
winget install --id=astral-sh.uv -e

Hiermee heeft u de benodigdheden geïnstalleerd om Irodori-TTS te configureren.
*Python wordt beheerd door uv en wordt tijdens de installatie automatisch geïnstalleerd.
Sluit na de installatie de terminal (PowerShell) een keer af en open deze opnieuw (om het "pad te activeren").
2. Werkmap maken
Maak vervolgens een werkmap aan.
Hier wordt Irodori-TTS geïnstalleerd.
In dit voorbeeld hebben we een map genaamd "irodori-tts" direct op de C-schijf gemaakt.

Nadat u de map heeft gemaakt, gaat u in de terminal naar die map.
cd C:\irodori-tts

3. Irodori-TTS klonen van GitHub
Voer het volgende commando in de terminal in om de repository van Irodori-TTS van GitHub te klonen.
git clone https://github.com/Aratako/Irodori-TTS.git

Het klonen van de repository is binnen enkele seconden voltooid.
Voer het volgende commando in om naar de map van de gekloonde repository te gaan.
cd Irodori-TTS

4. Benodigde pakketten installeren
Voer het volgende commando uit om de pakketten te installeren die nodig zijn om Irodori-TTS te laten werken.
uv sync

Omdat er een grote hoeveelheid pakketten wordt gedownload en geïnstalleerd, kan dit enige tijd duren.

Python zelf wordt hier ook geïnstalleerd.
Wacht tot het downloaden en installeren klaar is zonder het terminalvenster te sluiten.
Er wordt bijna 3 GB aan bestanden gedownload, dus het wordt aanbevolen om de installatie uit te voeren op een locatie met een goede internetverbinding.
5. Irodori-TTS starten
Zodra het downloaden en installeren van de pakketten is voltooid, is de installatie klaar.
Start Irodori-TTS.
Voer het volgende commando uit en wacht even tot de software is opgestart.
uv run python gradio_app.py --server-name 0.0.0.0 --server-port 7860
Wanneer de terminal het volgende aangeeft, is het opstarten voltooid:

Running on local URL: http://0.0.0.0:7860
Open een webbrowser en ga naar http://localhost:7860.
Het scherm van Irodori-TTS (WebUI) wordt geopend.

6. Het AI-model laden
Klik op "Load Model" om het AI-model te laden dat wordt gebruikt voor het voorlezen van tekst.

De eerste keer dat u deze knop indrukt, begint het downloaden van het AI-model.
Zodra er een voltooiingsbericht verschijnt bij Model Status (het rood omkaderde gedeelte in de volgende afbeelding), is het laden van het AI-model voltooid.

7. Tekst voorlezen met Irodori-TTS
In Irodori-TTS kunt u instructies geven over de manier van voorlezen, waaronder emotionele expressies, maar laten we als voorbeeld eerst eens voorlezen zonder instructies.
Scrol naar beneden naar het tekstinvoerveld en typ de tekst die u wilt laten voorlezen.

In dit geval proberen we "こんにちは、これはイロドリTTSで作成された音声です。" (Hallo, dit is een stem gemaakt met Irodori-TTS) voor te lezen.
(Omdat het schrijven van "Irodori-TTS" in het alfabet niet correct werd voorgelezen, hebben we het in Katakana als "イロドリTTS" geschreven.)
Klik op de knop "Generate" om het genereren van de stem te starten.

Irodori-TTS gebruikt de CPU of GPU (grafische kaart) van uw eigen pc om spraak te genereren.
Daarom varieert de tijd die nodig is voor het genereren sterk, afhankelijk van de prestaties van uw pc.
In dit geval hebben we gegenereerd op een laptop zonder GPU, waardoor het genereren van een korte zin ongeveer een minuut duurde.
Referentie: Getest in een omgeving met CPU: Ryzen 5 4650U, Geheugen: DDR4 32GB, Windows 11 Pro 24H2.
Wanneer het genereren voltooid is, wordt de golfvorm van de stem weergegeven en kunt u de stem afspelen.

Voorbeeld van het voorlezen van "こんにちは、これはイロドリTTSで作成された音声です。"
Als u tevreden bent met de audio, klikt u op de downloadknop (het icoon met de pijl omlaag) om het audiobestand op te slaan.
Het audiobestand wordt opgeslagen in WAV-formaat.
Hiermee is het gelukt om spraak te synthetiseren met Irodori-TTS.
Hoe u de audio van Irodori-TTS kunt aanpassen
In Irodori-TTS kunt u op verschillende manieren expressies zoals geslacht en emotie aanpassen.
Emotionele expressie specificeren met emoji's
Klik op "Emoji Palette" onder het tekstinvoerveld om een emoji te kiezen.

Aan elke emoji is een bepaalde emotionele expressie toegewezen.
- 😊 Vrolijk, blij
- 😭 Snikkend, huilend
- 😰 Gehaast, overstuur
- ⏩ Snel pratend
- 📖 Narratief, monoloog
Door simpelweg een emoji in het tekstinvoerveld te plaatsen, kunt u de tekst laten voorlezen met de opgegeven emotionele expressie.
Voorbeeld van het voorlezen van "😊 こんにちは、これはイロドリTTSで作成された音声です。"
Voorbeeld van het voorlezen van "📖 こんにちは、これはイロドリTTSで作成された音声です。"
Houd er rekening mee dat u door alleen een emoji op te geven, het geslacht of de leeftijd niet specifiek kunt bepalen.
Referentie-audio laden om met dezelfde stem voor te lezen
In Irodori-TTS kunt u een referentie-audiobestand laden om de tekst met die specifieke stem te laten voorlezen.
U kunt de referentie-audio laden via het gedeelte waar staat: "Sleep audio hierheen - of - klik om te uploaden".

Niet alleen kunt u hiermee met dezelfde stem voorlezen, maar de geluidskwaliteit is vaak ook helderder vergeleken met wanneer u niets opgeeft.
Directe aanpassing van de voorleesstijl met de bijschriftfunctie
In Irodori-TTS kunt u ook met tekst direct opgeven met wat voor soort stem u wilt dat er wordt voorgelezen.
Om de bijschriftfunctie te gebruiken, moet u de "VoiceDesign-versie" starten, en het commando om Irodori-TTS in de terminal te starten verandert.
uv run python gradio_app_voicedesign.py --server-name 0.0.0.0 --server-port 7861

Wanneer u dit commando uitvoert, wordt het bedieningsscherm van de VoiceDesign-versie gestart.
Omdat de VoiceDesign-versie een ander AI-model gebruikt dan de standaardversie, moet u de eerste keer op "Load Model" klikken om het model apart van de standaardversie te downloaden.
Omdat het AI-model ongeveer 2 GB groot is, wordt aanbevolen om dit te downloaden op een locatie met een goede internetverbinding.
In het bedieningsscherm van de VoiceDesign-versie staat een tekstvak "Caption / Style Prompt (optional)".

Hier typt u in wat voor soort stem u wilt horen.
- Lees dit alstublieft voor met een rustige vrouwenstem, met een gevoel van nabijheid, zacht en natuurlijk.
- Spreek alstublieft met een energieke mannenstem, vrolijk en duidelijk.
- Lees dit alstublieft voor met een lage mannenstem, zakelijk als een nieuwslezer.
Op deze manier kunt u specificeren wat voor audio u wilt genereren.
Als u bijvoorbeeld kiest voor "Lees dit alstublieft voor met een rustige vrouwenstem, met een gevoel van nabijheid, zacht en natuurlijk.", krijgt u een audio als deze:
Voorbeeld waarbij een rustige vrouwenstem is gespecificeerd.
Ook hier is het gelukt om een heldere en goed verstaanbare stem te genereren.
Er is echter een aandachtspunt bij de bijschriftfunctie.
De bijschriftfunctie doet er aanzienlijk langer over om de audio te genereren in vergelijking met andere voorleesmethoden.
Toen we dit op een laptop genereerden, duurde het genereren van deze korte zin ongeveer 5 minuten.
Voor het gebruik van de bijschriftfunctie wordt een high-spec pc met een GPU aanbevolen.
Wat gebeurt er als u Engelse tekst laat voorlezen?
Irodori-TTS is voorleessoftware die alleen Japans ondersteunt.
Wat gebeurt er dan als we Engelse tekst proberen voor te lezen?
Laten we een eenvoudig voorbeeld invoeren.
Voorbeeld van het voorlezen van "Hello, this is a voice recording created using Irodori-TTS."
Zoals u hoort, wordt "Hello" uitgesproken als "Haroo" in Katakana-stijl, en het gedeelte "recording" is onverstaanbaar. De tekst kon niet correct worden voorgelezen.
Als u Engelse tekst wilt laten voorlezen, is het aanbevolen om een AI-voorleesdienst te gebruiken die vreemde talen ondersteunt.
Aanbevolen spraaksynthesemethode wanneer "installatie moeilijk" is
Na het lezen tot hier, hebben sommige mensen misschien het gevoel dat de installatie van Irodori-TTS nogal wat voeten in de aarde heeft.
Als u niet gewend bent aan terminalbewerkingen of het configureren van een Python-omgeving, kan het zelfs met de juiste stappen veel tijd kosten.
Bovendien, als u geen pc met een GPU heeft, duurt elke spraaksynthese simpelweg te lang om praktisch te gebruiken voor zaken als videonarratie.
In dat geval is het aanbevolen om AI-spraak te gebruiken waarvoor geen installatie of configuratie nodig is.
"Ondoku": AI-spraak die zonder installatie kan worden gebruikt

Als u eenvoudig spraak wilt synthetiseren met de nieuwste AI, is de AI-spraaksynthesedienst Ondoku een aanrader.
Ondoku is een AI-spraaksynthesedienst waarbij u alleen de browser hoeft te openen en de tekst hoeft te plakken om audio te creëren.
U kunt direct gratis audio maken op uw pc, smartphone of tablet.
Omdat het genereren van de stem in de cloud (aan de serverzijde) gebeurt, is het geen probleem als uw pc geen GPU heeft.
Er zijn vanaf het begin meerdere stemmen beschikbaar, zoals mannenstemmen, vrouwenstemmen en kinderstemmen, zodat u direct kunt voorlezen door simpelweg te kiezen, zonder referentie-audio of bijschriften voor te bereiden.
Ook lange teksten kunnen in één keer worden voorgelezen.
Bovendien ondersteunt Ondoku ook Engels!
Het ondersteunt vele talen, waaronder Frans, Spaans, Koreaans en Chinees, dus het kan ook worden gebruikt voor voorlezen in andere talen dan Japans.
Daarnaast kunt u met de volgende generatie AI-spraak (OndokuBeta) een nog natuurlijkere voorleeservaring beleven.
Bent u op zoek naar een manier om tekst als spraak voor te laten lezen? Waarom probeert u het gratis en eenvoudige Ondoku niet eens uit?
Vergelijking van de verschillen tussen Ondoku en Irodori-TTS
Tot slot vergelijken we de belangrijkste verschillen tussen Ondoku en Irodori-TTS.
| Item | Ondoku | Irodori-TTS |
|---|---|---|
| Bedieningswijze | Cloud (via browser) | Lokaal (verwerking op eigen pc) |
| Installatie | Niet nodig | Configuratie van Python, Git etc. nodig |
| Ondersteunde talen | Meer dan 35 talen | Alleen Japans |
| Stemkeuze | Kiezen uit meerdere stemmen | Specificeren via cloning, bijschrift of emoji |
| Limiet per generatie | Ondersteunt lange teksten | Tot ongeveer 30 seconden |
| Commercieel gebruik | Mogelijk (naamsvermelding vereist bij gratis gebruik) | Mogelijk (MIT-licentie) |
| Ondersteunde apparaten | PC, smartphone, tablet | PC (GPU aanbevolen) |
| Kosten | Gratis abonnement beschikbaar (betaald abonnement voor meer tekens) | Gratis (vanwege lokale werking) |
Ter vergelijking: Ondoku is ideaal voor gebruiksgemak en directe inzetbaarheid, terwijl Irodori-TTS geschikt is voor wie een krachtige pc heeft en de stem tot in detail wil aanpassen.
Voor wie direct audio nodig heeft, wie in meerdere talen wil voorlezen of wie het op een smartphone of tablet wil gebruiken, is Ondoku de beste keuze.
Het is ook geschikt voor wie lange teksten direct wil laten voorlezen, geen tijd wil besteden aan installatie, of voor wie de pc geen GPU heeft.
Aangezien u simpelweg de browser kunt openen om direct hoogwaardige audio te genereren, waarom probeert u Ondoku niet eerst gratis uit?
Samenvatting van kenmerken, installatie en gebruik van Irodori-TTS
In dit artikel hebben we Irodori-TTS besproken, de lokaal werkende AI-spraaksynthesesoftware die gespecialiseerd is in Japans.
Irodori-TTS is een aantrekkelijk hulpmiddel voor wie veel waarde hecht aan spraakexpressie, met functies zoals spraakcloning, stemontwerp via bijschriften en emotiecontrole via emoji's.
Echter, de installatiemethode en het gebruik zijn gericht op gevorderden; voor de configuratie is kennis van Python en Git vereist.
Bovendien kost het genereren van audio op een pc zonder GPU veel tijd.
Voor wie "nu direct en eenvoudig spraaksynthese wil gebruiken", is Ondoku, dat direct in de browser werkt, aanbevolen.
Wilt u ook hoogwaardige audio creëren met een gratis en eenvoudig te gebruiken AI-spraaksynthese?
■ AI-spraaksynthesesoftware “Ondoku”
"Ondoku" is een online tekst-naar-spraak-tool die zonder initiële kosten kan worden gebruikt.
- Ondersteunt ongeveer 50 talen, waaronder Japans, Engels, Chinees, Koreaans, Spaans, Frans en Duits.
- Beschikbaar vanaf zowel pc als smartphone
- Geschikt voor zaken, onderwijs, entertainment, enz.
- Geen installatie vereist, kan direct vanuit uw browser worden gebruikt
- Ondersteunt ook het voorlezen van afbeeldingen
Om het te gebruiken, voert u eenvoudig tekst in of uploadt u een bestand van de site. Genereer binnen enkele seconden natuurlijke geluidsbestanden. U kunt gratis spraaksynthese gebruiken voor maximaal 5.000 tekens, dus probeer het eerst uit.
Email: ondoku3.com@gmail.com
Tekstleessoftware Ondoku. Het is een tekst-naar-spraak-service die geen installatie vereist en die door iedereen gratis kan worden gebruikt. Als u zich gratis registreert, kunt u elke maand maximaal 5000 tekens gratis krijgen. Schrijf u nu gratis in
- Wat is Ondoku?
- Lees tekst op Ondoku
- Gratis registratie
- Tariefplan
- Lijst met artikelen
- Probeer ook andere gratis diensten