Mi az Irodori-TTS? Funkciók, tudnivalók és használat érthetően
2026. május 31.

Milyen AI felolvasó szoftver az Irodori-TTS?
Bizonyára sokan kíváncsiak az új „Irodori-TTS” AI felolvasó szoftverre.
Ebben a cikkben érthetően elmagyarázzuk az Irodori-TTS jellemzőit, képességeit, a figyelmet igénylő pontokat és a használatát.
Ezenkívül azoknak, akik úgy érzik, hogy a „beállítás bonyolultnak tűnik”, bemutatunk egy telepítést nem igénylő, azonnal használható hangszintézis módszert is.
Amiről ebben a cikkben szó lesz:
- Milyen szoftver az Irodori-TTS?
- Mire képes az Irodori-TTS és mik a korlátai?
- Az Irodori-TTS használata (a beállítástól a hang finomhangolásáig)
- Ajánlott módszer, ha a környezet kialakítása nehéznek bizonyul
Mi az az Irodori-TTS? A japán nyelvű AI hangszintézis szoftver bemutatása

Először is röviden ismertetjük, milyen AI hangszintézis szoftver az Irodori-TTS és mik a főbb jellemzői.
Az Irodori-TTS egy helyben (local) futó AI hangszintézis modell
Az Irodori-TTS egy kifejezetten japán nyelvre optimalizált AI hangszintézis szoftver.
Fejlesztője Aratako, és nyílt forráskódú (MIT licenc) szoftverként ingyenesen elérhető.
Legnagyobb jellemzője, hogy „local” módon futtatható, azaz a hangszintézis kizárólag a saját PC-jén megy végbe.
Mivel a hanggenerálási folyamat teljes egészében a helyi számítógépen zajlik, a szövegek és a generált hangadatok nem kerülnek külső szerverre.
Az első beállítás után internetkapcsolat nélkül is generálható hang, és a generálások száma sincs korlátozva.
Azonban a beállításhoz olyan programozási eszközökre van szükség, mint a Python vagy a Git.
Továbbá a gyors működéshez GPU-val (grafikus kártyával) felszerelt, nagy teljesítményű PC ajánlott.
Mire képes és mire nem képes az Irodori-TTS?

A következőkben átvesszük, mit lehet megtenni az Irodori-TTS-sel, és mik a korlátai.
Mire képes az Irodori-TTS?
Mivel az Irodori-TTS helyi környezetben fut, bármennyi hangot generálhat korlátozások nélkül.
Akár internetkapcsolat nélküli környezetben is szabadon készíthet hangokat az első beállítást követően.
Több módszer is rendelkezésre áll a kívánt hang megadására: a caption funkcióval például pusztán szöveges utasításokkal is létrehozhatja az Önnek tetsző hangkaraktert.
Ezenkívül lehetőség van meglévő hangok reprodukálására hangklónozással (voice cloning), vagy érzelmek kifejezésére emoji-k használatával.
Mivel MIT licenc alatt áll, a generált hangok kereskedelmi célú felhasználása is megengedett.
Az Irodori-TTS használatával kapcsolatos figyelmeztetések
Ugyanakkor az Irodori-TTS használata előtt érdemes tisztában lenni néhány fontos ponttal.
Egy alkalommal körülbelül 30 másodpercnyi hang készíthető
Egyetlen generálással maximum 30 másodpercnyi szöveg olvasható fel.
Hosszabb szövegek esetén a szöveget fel kell osztani, és több részletben kell legenerálni.
Nehéz pontosan a várt hangot vagy beszédstílust elérni
Az Irodori-TTS nagy szabadságot ad, de cserébe nincsenek benne alapértelmezett hangok (bázishangok).
Ezért, ha nem ad meg caption-t vagy referencia hangot, a generált hang neme és kora minden alkalommal véletlenszerűen változhat.
Ha ugyanazzal a hanggal szeretne felolvastatni, be kell töltenie egy referencia hangot.
Ezenkívül a hanglejtés és az intonáció manuális finomhangolására nincs külön funkció.
Csak a japán nyelvet támogatja
A támogatott nyelv kizárólag a japán; idegen nyelveket, például az angolt nem támogatja.
Emellett előfordulhatnak hibák a kandzsik olvasásában is, ezért óvatosság szükséges.
GPU-val felszerelt high-spec PC ajánlott
A PC specifikációitól függően a hanggenerálás sok időt vehet igénybe.
GPU nélküli számítógépeken még egy rövid mondat generálása is körülbelül 1 percig tarthat.
Belépő szintű processzorokkal, mint a Celeron vagy az N100, a gyakorlati használat nehézkes lehet.
Az Irodori-TTS használata (telepítési folyamat)
Itt röviden bemutatjuk az Irodori-TTS beállításának menetét.
A folyamat a következő:
- A szükséges szoftverek telepítése
- Munkamappa létrehozása
- Az Irodori-TTS klónozása GitHub-ról
- A szükséges csomagok telepítése
- Az Irodori-TTS elindítása
- Az AI modell betöltése
- Szöveg felolvastatása
1. Az Irodori-TTS-hez szükséges szoftverek telepítése
Az Irodori-TTS beállítása előkészületeket igényel.
Először ezt a három komponenst kell telepíteni:
- Python 3.10 vagy újabb: Programozási nyelv
- Git: Verziókezelő rendszer (szükséges az Irodori-TTS letöltéséhez)
- uv: Python csomagkezelő
A Python, Git és uv telepítéséhez először kattintson jobb gombbal a Start menüre, majd válassza a „Terminál” (Terminal) lehetőséget (nem szükséges rendszergazdaként futtatni).

Ekkor megnyílik a terminál (PowerShell) ablaka.

Ebben az ablakban írja be és futtassa a következő parancsokat:
winget install --id Git.Git -e
winget install --id=astral-sh.uv -e

Ezzel telepítette az Irodori-TTS beállításához szükséges alapvető eszközöket.
※ A Python-t az uv kezeli, így az a beállítás során automatikusan települni fog.
A telepítés után zárja be a terminált (PowerShell), majd nyissa meg újra (hogy az elérési utak érvénybe lépjenek).
2. Munkamappa létrehozása
Ezután hozzon létre egy munkamappát.
Ide fog települni az Irodori-TTS.
Ebben a példában a C meghajtó gyökerében hoztunk létre egy „irodori-tts” nevű mappát.

Miután létrehozta a mappát, lépjen be oda a terminálban.
cd C:\irodori-tts

3. Az Irodori-TTS klónozása GitHub-ról
Írja be a következő parancsot a terminálba az Irodori-TTS repository klónozásához a GitHub-ról:
git clone https://github.com/Aratako/Irodori-TTS.git

A klónozás pár másodperc alatt befejeződik.
Ezután lépjen be a klónozott repository mappájába:
cd Irodori-TTS

4. A szükséges csomagok telepítése
Futtassa az alábbi parancsot az Irodori-TTS működéséhez szükséges csomagok telepítéséhez:
uv sync

Ez a folyamat eltarthat egy ideig, mivel nagy mennyiségű csomagot kell letölteni és telepíteni.

Maga a Python is ekkor kerül telepítésre.
Várjon türelemmel, amíg a letöltés és telepítés befejeződik, ne zárja be a terminált.
Mivel közel 3 GB-nyi adatot kell letölteni, javasolt stabil internetkapcsolat mellett végezni a beállítást.
5. Az Irodori-TTS elindítása
Ha a csomagok letöltése és telepítése befejeződött, a beállítás kész.
Indítsa el az Irodori-TTS-t.
Futtassa a következő parancsot, és várjon egy keveset az indulásig:
uv run python gradio_app.py --server-name 0.0.0.0 --server-port 7860
Amikor a terminálban a következő üzenet jelenik meg, a szoftver elindult:

Running on local URL: http://0.0.0.0:7860
Nyisson meg egy böngészőt, és keresse fel a http://localhost:7860 címet.
Ekkor megnyílik az Irodori-TTS kezelőfelülete (WebUI).

6. Az AI modell betöltése
A felolvasáshoz szükséges AI modell betöltéséhez kattintson a „Load Model” gombra.

Az első alkalommal a gomb megnyomása után elindul az AI modell letöltése.
Amikor a „Model Status” mezőben (a következő képen pirossal keretezve) megjelenik a befejező üzenet, az AI modell betöltése kész.

7. Szöveg felolvastatása az Irodori-TTS segítségével
Az Irodori-TTS-ben megadhatók érzelmi kifejezések és egyéb instrukciók, de először próbáljuk ki a felolvasást instrukciók nélkül.
Görgessen le a szövegbeviteli mezőhöz, és írja be a felolvastatni kívánt szöveget.

Ebben a példában a „こんにちは、これはイロドリTTSで作成された音声です。” (Jó napot, ez egy Irodori-TTS-sel készült hang.) mondatot használjuk.
(Mivel az „Irodori-TTS” latin betűs írásmóddal nem minden esetben olvasódott fel helyesen, katakanával „イロドリTTS”-ként adtuk meg.)
A „Generate” gomb megnyomásával elindul a hanggenerálás.

Az Irodori-TTS a helyi PC CPU-ját vagy GPU-ját használja a hang generálásához.
Emiatt a PC teljesítményétől függően a generálási idő jelentősen eltérhet.
Ebben a tesztben egy GPU nélküli laptopot használtunk, így a rövid mondat generálása is körülbelül 1 percet vett igénybe.
Referencia: A tesztgenerálás Ryzen 5 4650U CPU, 32 GB DDR4 RAM és Windows 11 Pro 24H2 környezetben történt.
Ha a generálás befejeződött, megjelenik a hang hullámformája, és a hang lejátszhatóvá válik.

Példa a „こんにちは、これはイロドリTTSで作成された音声です。” felolvasására
Ha az eredmény megfelelő, a letöltés gombbal (lefelé mutató nyíl ikon) mentheti a hangfájlt.
A hangfájl WAV formátumban kerül mentésre.
Ezzel sikeresen szintetizáltunk hangot az Irodori-TTS használatával.
Az Irodori-TTS hangjának finomhangolása
Az Irodori-TTS-ben különféle módszerekkel állítható a nem, az érzelmek és egyéb kifejezésmódok.
Érzelmek megadása emoji-kkal
A szövegbeviteli mező alatti „Emoji Palette” gombra kattintva választhat emoji-kat.

Minden emoji-hoz egy-egy érzelem van rendelve.
- 😊 Vidáman, boldogan
- 😭 Zokogva, sírva
- 😰 Sietve, zaklatottan
- ⏩ Hadarva, gyorsan
- 📖 Narráció, monológ
Csak helyezzen el egy emoji-t a szövegbeviteli mezőbe, és a szoftver a megadott érzelemmel fogja felolvasni a szöveget.
Példa a „😊 こんにちは、これはイロドリTTSで作成された音声です。” felolvasására
Példa a „📖 こんにちは、これはイロドリTTSで作成された音声です。” felolvasására
Vegye figyelembe, hogy az emoji-k önmagukban nem teszik lehetővé a nem vagy az életkor pontos meghatározását.
Azonos hang használata referencia hang betöltésével
Az Irodori-TTS-ben betölthet egy referencia hangfájlt, és a szoftver ezt alapul véve fogja elvégezni a felolvasást.
A referencia hangot az „音声をここにドロップ - または - クリックしてアップロード” (Húzza ide a hangot - vagy - kattintson a feltöltéshez) feliratú területre kell feltölteni.

Ez nemcsak az állandó hangkaraktert biztosítja, hanem tisztább hangminőséget is eredményezhet ahhoz képest, mintha nem adna meg semmit.
A beszédstílus közvetlen hangolása a caption funkcióval
Az Irodori-TTS-ben szövegesen is megadhatja, hogy milyen hangon szeretné a felolvasást.
A caption funkció használatához a „VoiceDesign verziót” kell elindítani, amihez a terminálban használt parancs megváltozik.
uv run python gradio_app_voicedesign.py --server-name 0.0.0.0 --server-port 7861

E parancs futtatásával elindul a VoiceDesign verzió kezelőfelülete.
Mivel a VoiceDesign verzió más AI modellt használ, mint a normál változat, az első használatkor a „Load Model” gombra kattintva le kell tölteni a hozzá tartozó modellt is.
Az AI modell mérete körülbelül 2 GB, ezért javasolt stabil internetkapcsolat mellett letölteni.
A VoiceDesign felületén található egy „Caption / Style Prompt (optional)” szövegdoboz.

Ide írhatja be szövegesen, hogy milyen hangot szeretne.
- Nyugodt női hangon, közvetlen stílusban, lágyan és természetesen olvassa fel.
- Vidám férfihangon, lelkesen és érthetően beszéljen.
- Mély férfihangon, híradóbemondóhoz hasonlóan, tárgyilagosan olvassa fel.
Ezekhez hasonlóan határozhatja meg a kívánt hangot.
Például a „Nyugodt női hangon, közvetlen stílusban, lágyan és természetesen olvassa fel.” utasítással a következő eredmény született:
Példa a „Nyugodt női hangon...” utasítás használatára
Itt is sikerült tiszta, jól érthető hangot generálni.
A caption funkciónak azonban van egy hátulütője.
A caption funkció a többi módszerhez képest jóval több időt vesz igénybe a hang generálásához.
Ebben a tesztben a laptopunkon körülbelül 5 percig tartott ennek a rövid mondatnak a generálása.
A caption funkció használatához kifejezetten ajánlott egy GPU-val felszerelt high-spec PC.
Mi történik, ha angol szöveget olvastatunk fel?
Az Irodori-TTS kizárólag a japán nyelvet támogató szoftver.
De mi történik, ha mégis angol szöveget adunk meg neki?
Próbáljuk ki egy egyszerű példamondattal.
Példa a „Hello, this is a voice recording created using Irodori-TTS.” felolvasására
Amint hallható, a Hello-t katakana-szerű kiejtéssel („haroo”) mondta, a recording rész pedig szinte érthetetlen lett, tehát nem sikerült helyesen felolvasnia.
Ha angol szöveget szeretne felolvastatni, javasolt egy idegen nyelveket is támogató AI felolvasó szolgáltatást használni.
Ajánlott hangszintézis módszer, ha „a beállítás túl nehéz”
Lehet, hogy eddig olvasva úgy érzi, az Irodori-TTS beállítása kissé macerás.
Ha nem jártas a terminál használatában vagy a Python környezet kialakításában, már a lépések követése is sok időt vehet igénybe.
Továbbá, ha nincs GPU-val felszerelt számítógépe, egy-egy hang generálása túl sokáig tart ahhoz, hogy praktikusan használhassa például videók narrációjához.
Ilyenkor ajánlott egy telepítést és beállítást nem igénylő AI hangot választani.
„Ondoku” – Telepítés nélkül használható AI hangszintézis

Ha modern AI segítségével szeretne egyszerűen hangot szintetizálni, az Ondoku szolgáltatást ajánljuk.
Az Ondoku egy olyan AI hangszintézis szolgáltatás, amellyel elég megnyitni a böngészőt és beilleszteni a szöveget a hang elkészítéséhez.
PC-n, okostelefonon vagy tableten azonnal, ingyenesen készíthet hangokat.
Mivel a hanggenerálás a felhőben (szerveroldalon) történik, nem számít, ha a számítógépe nem rendelkezik GPU-val.
Számos kész hang (férfi, női, gyermek hangok) közül választhat, így nincs szükség referencia hangok vagy caption-ök készítésére, csak válassza ki a megfelelőt, és indítsa el a felolvasást.
Hosszabb szövegek felolvasására is alkalmas.
Ráadásul az Ondoku az angol nyelvet is támogatja!
Többek között francia, spanyol, koreai és kínai nyelven is elérhető, így a japánon kívül más nyelvekhez is használható.
Ezenkívül a következő generációs AI hanggal (OndokuBeta) még természetesebb felolvasást is megtapasztalhat.
Ha szövegfelolvasási módszert keres, miért nem próbálja ki az ingyenesen és egyszerűen használható Ondoku-t?
Az Ondoku és az Irodori-TTS összehasonlítása
Végezetül hasonlítsuk össze az Ondoku és az Irodori-TTS főbb különbségeit.
| Tétel | Ondoku | Irodori-TTS |
|---|---|---|
| Működési mód | Felhő (böngészőben) | Helyi (saját PC-n) |
| Telepítés | Nem szükséges | Python, Git stb. környezet szükséges |
| Támogatott nyelvek | Több mint 35 nyelv | Csak japán |
| Hang kiválasztása | Választás előre beállított hangokból | Hangklónozás, caption, emoji segítségével |
| Egyszeri limit | Hosszú szövegeket is kezel | Kb. 30 másodpercig |
| Üzleti használat | Lehetséges (ingyenes csomagban forrásmegjelölés kell) | Lehetséges (MIT licenc) |
| Eszközök | PC, okostelefon, tablet | PC (GPU javasolt) |
| Díj | Van ingyenes csomag (fizetős csomaggal több karakter) | Ingyenes (helyi futtatás miatt) |
Összehasonlítva látható, hogy az egyszerűség és az azonnali használat terén az Ondoku, míg a részletes hangdizájn és a nagy teljesítményű hardver kihasználása esetén az Irodori-TTS a nyerő.
Azoknak, akiknek azonnal hangra van szükségük, több nyelven szeretnének felolvastatni, vagy mobil eszközt használnának, az Ondoku az ajánlott választás.
Szintén ideális azoknak, akik hosszú szövegeket szeretnének egyben felolvastatni, nem akarnak időt tölteni a beállításokkal, vagy nincs GPU a számítógépükben.
Mivel kiváló minőségű hangot generálhat pusztán a böngésző megnyitásával, miért nem próbálja ki az Ondoku-t ingyen?
Irodori-TTS jellemzők, beállítás és használat összefoglaló
Ebben a cikkben a kifejezetten japán nyelvre készült, helyben futó AI hangszintézis szoftvert, az Irodori-TTS-t mutattuk be.
Az Irodori-TTS egy vonzó eszköz azok számára, akik szeretik a hangzást finomhangolni a hangklónozás, a caption-alapú hangdizájn vagy az emoji-kkal vezérelt érzelmek segítségével.
Azonban a beállítása és használata haladó szintű ismereteket igényel, mivel Python és Git környezet kialakítására van szükség.
Emellett GPU nélküli számítógépeken a hanggenerálás lassú lehet.
Azoknak, akik „egyszerűen és azonnal szeretnének hangszintézist használni”, a böngészőből elérhető Ondoku-t ajánljuk.
Készítsen Ön is kiváló minőségű hangokat az egyszerűen használható, ingyenes AI hangszintézissel!
■ „Ondoku” mesterséges intelligencia beszédszintézis szoftver
Az "Ondoku" egy online szövegfelolvasó eszköz, amely kezdeti költség nélkül használható.
- Körülbelül 50 nyelvet támogat, beleértve a japán, angol, kínai, koreai, spanyol, francia és német nyelvet.
- Számítógépről és okostelefonról is elérhető
- Alkalmas üzleti, oktatási, szórakozási stb.
- Nincs szükség telepítésre, azonnal használható a böngészőből
- A képekből való kiolvasást is támogatja
Használatához egyszerűen írjon be szöveget, vagy töltsön fel egy fájlt a webhelyről. Természetes hangfájlokat generál másodpercek alatt. A beszédszintézist 5000 karakter erejéig ingyenesen használhatja, ezért kérjük, először próbálja ki.
Email: ondoku3.com@gmail.com
Szövegolvasó szoftver Ondoku. Ez egy szöveg-beszéd szolgáltatás, amely nem igényel telepítést, és bárki ingyenesen felhasználhatja. Ha ingyenesen regisztrál, havonta legfeljebb 5000 karaktert kaphat ingyen. Regisztráljon most ingyen
- Mi az Ondoku?
- Olvassa el az Ondoku szöveget
- Ingyenes regisztráció
- Ár terv
- Cikkek listája
- Más ingyenes szolgáltatások kipróbálása