Co je Irodori-TTS? Funkce, rady a návod k použití přehledně
31. května 2026

Jaký druh AI softwaru pro předčítání textu je Irodori-TTS?
Možná vás zajímá nový AI software pro předčítání textu s názvem „Irodori-TTS“.
V tomto článku srozumitelně vysvětlíme vlastnosti, možnosti, upozornění a způsob použití Irodori-TTS.
Dále pro ty, kteří mají pocit, že „nastavení vypadá složitě“, představíme také metodu hlasové syntézy, kterou lze použít ihned bez nutnosti instalace.
Co se v tomto článku dozvíte
- Jaký software je Irodori-TTS?
- Co Irodori-TTS dokáže a na co si dát pozor
- Jak používat Irodori-TTS (od nastavení až po úpravu hlasu)
- Doporučená metoda, pokud je konfigurace prostředí náročná
Co je Irodori-TTS? Vysvětlení japonského softwaru pro AI hlasovou syntézu

Nejprve si stručně vysvětlíme vlastnosti Irodori-TTS a to, o jaký druh AI softwaru pro hlasovou syntézu se jedná.
Irodori-TTS je AI model pro hlasovou syntézu běžící lokálně
Irodori-TTS je AI software pro hlasovou syntézu specializovaný na japonštinu.
Vývojářem je Aratako a software je volně dostupný jako open-source (MIT license).
Hlavním rysem je možnost „lokálního provozu“, kdy syntéza hlasu probíhá výhradně na vašem vlastním PC.
Vzhledem k tomu, že veškeré zpracování generování hlasu probíhá na vašem lokálním PC, texty ani generovaná hlasová data se neodesílají na externí servery.
Po počátečním nastavení je možné generovat hlas bez připojení k internetu a počet generování není nijak omezen.
K nastavení jsou však zapotřebí programovací nástroje jako Python nebo Git.
Pro rychlý provoz se doporučuje výkonné PC vybavené GPU (grafickou kartou).
Co Irodori-TTS dokáže a co nedokáže

Dále si vysvětlíme, co Irodori-TTS dokáže a jaká má omezení.
Co Irodori-TTS dokáže
Protože Irodori-TTS běží v lokálním prostředí, můžete generovat hlas neomezeně a opakovaně.
I v prostředí bez internetového připojení můžete po dokončení počátečního nastavení volně vytvářet hlasy.
Existuje několik způsobů, jak zadat pokyny pro vytvoření hlasu. Pomocí funkce popisků (caption) můžete vytvořit kvalitu hlasu podle svých preferencí pouze pomocí textových pokynů.
Kromě toho je možné reprodukovat vlastní hlas pomocí klonování hlasu nebo přidat vyjádření emocí pomocí emoji.
Díky MIT license je možné generovaný hlas využívat i ke komerčním účelům.
Upozornění k Irodori-TTS
Na druhou stranu existují i upozornění, která byste měli před použitím Irodori-TTS znát.
Jeden záznam může mít délku maximálně cca 30 sekund
V rámci jednoho generování lze předčítat text o délce maximálně cca 30 sekund.
Pokud chcete předčítat dlouhé texty, je nutné text rozdělit a generovat jej opakovaně.
Je obtížné dosáhnout přesně takového hlasu nebo stylu mluvení, jaký si představujete
Irodori-TTS nabízí vysokou míru svobody, ale nemá předem připravené výchozí hlasy (základní hlasy).
Z tohoto důvodu se bez určení popisku nebo referenčního hlasu pohlaví a věk při každém generování náhodně mění.
Pokud chcete předčítat stejným hlasem, musíte načíst referenční hlas.
Software také nemá funkci pro ruční úpravu intonace nebo přízvuku.
Podporovaným jazykem je pouze japonština
Podporovaným jazykem je pouze japonština; cizí jazyky jako angličtina nejsou podporovány.
Je také třeba dát pozor na to, že občas může dojít k chybnému čtení znaků kandži.
Doporučuje se vysoce výkonné PC vybavené GPU
V závislosti na specifikacích PC může generování hlasu trvat delší dobu.
U PC bez GPU trvá generování i krátkého textu přibližně jednu minutu.
U procesorů základní třídy jako Celeron nebo N100 se domníváme, že praktické využití je obtížné.
Jak používat Irodori-TTS (průběh nastavení)
Zde si stručně vysvětlíme, jak Irodori-TTS používat.
Celkový průběh nastavení je následující:
- Instalace potřebného softwaru
- Vytvoření pracovní složky
- Klonování Irodori-TTS z GitHubu
- Instalace potřebných balíčků
- Spuštění Irodori-TTS
- Načtení AI modelu
- Předčítání textu
1. Instalace potřebného softwaru pro Irodori-TTS
Nastavení Irodori-TTS vyžaduje přípravu.
Nejprve nainstalujte tyto tři typy softwaru:
- Python 3.10 nebo vyšší: programovací jazyk
- Git: systém pro správu verzí (nutný ke stažení Irodori-TTS)
- uv: správce balíčků pro Python
Chcete-li nainstalovat Python, Git a uv, klikněte pravým tlačítkem na nabídku Start a klikněte na „Terminál“ (není nutné spouštět jako správce).

Tím se otevře okno terminálu (PowerShell).

V tomto okně zadejte a spusťte následující příkazy:
winget install --id Git.Git -e
winget install --id=astral-sh.uv -e

Tímto jste nainstalovali vše potřebné k nastavení Irodori-TTS.
*Python je spravován nástrojem uv, takže se automaticky nainstaluje během nastavení.
Po instalaci terminál (PowerShell) zavřete a znovu otevřete (aby se aktualizovaly cesty „Path“).
2. Vytvoření pracovní složky
Dále vytvořte pracovní složku.
Zde bude Irodori-TTS nainstalován.
V tomto příkladu jsme vytvořili složku s názvem „irodori-tts“ přímo na disku C.

Po vytvoření složky se do ní přesuňte v terminálu.
cd C:\irodori-tts

3. Klonování Irodori-TTS z GitHubu
Zadejte v terminálu následující příkaz pro klonování repozitáře Irodori-TTS z GitHubu.
git clone https://github.com/Aratako/Irodori-TTS.git

Klonování repozitáře bude hotové během několika sekund.
Zadejte další příkaz pro přesun do složky naklonovaného repozitáře.
cd Irodori-TTS

4. Instalace potřebných balíčků
Zadejte a spusťte následující příkaz pro instalaci balíčků potřebných ke spuštění Irodori-TTS.
uv sync

Stahování a instalace velkého množství balíčků zabere nějaký čas.

Zde se nainstaluje i samotný Python.
Během stahování a instalace nezavírejte okno terminálu a počkejte.
Vzhledem k tomu, že se stahují soubory o velikosti téměř 3 GB, doporučujeme provádět nastavení na místě s dobrým internetovým připojením.
5. Spuštění Irodori-TTS
Po dokončení stahování a instalace balíčků je nastavení hotovo.
Spusťte Irodori-TTS.
Zadejte a spusťte následující příkaz a chvíli počkejte na spuštění.
uv run python gradio_app.py --server-name 0.0.0.0 --server-port 7860
Jakmile se v terminálu zobrazí následující, spuštění je dokončeno.

Running on local URL: http://0.0.0.0:7860
Otevřete webový prohlížeč a přejděte na adresu http://localhost:7860.
Tímto se otevře obrazovka Irodori-TTS (WebUI).

6. Načtení AI modelu
Klikněte na „Load Model“ pro načtení AI modelu, který se používá pro předčítání textu.

Při prvním použití se po stisknutí tohoto tlačítka spustí stahování AI modelu.
Jakmile se v poli Model Status (označeno červeně na následujícím obrázku) zobrazí zpráva o dokončení, načítání AI modelu je hotové.

7. Předčítání textu v Irodori-TTS
V Irodori-TTS můžete zadávat pokyny pro způsob předčítání, včetně výrazů emocí, ale nejprve si jako příklad vyzkoušejme předčítání bez pokynů.
Přejděte dolů, kde najdete pole pro zadání textu, a vložte text, který chcete přečíst.

Tentokrát zkusíme přečíst: „こんにちは、これはイロドリTTSで作成された音声です。“ (Dobrý den, toto je hlas vytvořený pomocí Irodori-TTS.)
(Psaní „Irodori-TTS“ v latince nefungovalo pro předčítání správně, proto jsme použili katakanu „イロドリTTS“.)
Stisknutím tlačítka „Generate“ se spustí generování hlasu.

Irodori-TTS generuje hlas pomocí CPU nebo GPU (grafické karty) vašeho lokálního PC.
Doba generování se proto výrazně liší v závislosti na výkonu vašeho PC.
V tomto případě jsme generovali na notebooku bez GPU, takže generování i tohoto krátkého textu trvalo přibližně jednu minutu.
Reference: Testovací generování proběhlo v prostředí CPU: Ryzen 5 4650U, RAM: DDR4 32GB, Windows 11 Pro 24H2.
Po dokončení generování se zobrazí vlnový průběh hlasu a hlas si můžete přehrát.

Příklad předčítání textu „こんにちは、これはイロドリTTSで作成された音声です。“
Pokud je poslech v pořádku, klikněte na tlačítko stahování (ikona šipky dolů) a uložte hlasový soubor.
Hlasový soubor se uloží ve formátu WAV.
Tímto se vám podařilo syntetizovat hlas pomocí Irodori-TTS.
Jak upravit hlas v Irodori-TTS
V Irodori-TTS můžete různými způsoby upravovat vyjádření pohlaví, emocí a dalšího.
Určení výrazu emocí pomocí emoji
Kliknutím na „Emoji Palette“ pod polem pro zadání textu můžete vybrat emoji.

Každému emoji je přiřazeno určité vyjádření emocí.
- 😊 Veselý, radostný
- 😭 Vzlykání, pláč
- 😰 Spěšný, rozrušený
- ⏩ Rychlá mluva
- 📖 Vyprávění, monolog
Pouhým vložením emoji do pole pro zadání textu můžete předčítat se zadaným výrazem emocí.
Příklad předčítání textu „😊 こんにちは、これはイロドリTTSで作成された音声です。“
Příklad předčítání textu „📖 こんにちは、これはイロドリTTSで作成された音声です。“
Při pouhém určení emoji však nelze konkrétně určit pohlaví nebo věk.
Předčítání stejným hlasem načtením referenčního hlasu
V Irodori-TTS můžete načíst soubor s referenčním hlasem a nechat text přečíst hlasem, který z tohoto souboru vychází.
Referenční hlas načtete v části, kde je napsáno 「音声をここにドロップ - または - クリックしてアップロード」 (Sem přetáhněte hlas – nebo – klikněte pro nahrání).

Kromě toho, že můžete předčítat stejným hlasem, bude výsledný zvuk ve srovnání se stavem bez určení hlasu čistší.
Přímá úprava stylu předčítání pomocí funkce popisků (caption)
V Irodori-TTS můžete také přímo textem zadat, jakým hlasem má být text přečten.
Chcete-li použít funkci popisků, musíte spustit verzi „VoiceDesign“ a příkaz pro spuštění Irodori-TTS v terminálu se změní.
uv run python gradio_app_voicedesign.py --server-name 0.0.0.0 --server-port 7861

Provedením tohoto příkazu se spustí ovládací obrazovka verze VoiceDesign.
Verze VoiceDesign používá jiný AI model než standardní verze, takže při prvním použití musíte kliknout na „Load Model“ a stáhnout model odděleně od standardní verze.
AI model má velikost přibližně 2 GB, proto doporučujeme stahování v místě s dobrým internetovým připojením.
Na ovládací obrazovce verze VoiceDesign se nachází textové pole „Caption / Style Prompt (optional)“.

Zde textem zadáte, jakým hlasem má být text přečten.
- Klidným ženským hlasem, s pocitem blízkosti, čtěte jemně a přirozeně.
- Energickým mužským hlasem, mluvte jasně a vesele.
- Hlubším mužským hlasem, čtěte věcně jako televizní hlasatel.
Tímto způsobem můžete specifikovat, jak má hlas znít.
Například při zadání 「落ち着いた女性の声で、近い距離感でやわらかく自然に読み上げてください。」 (Klidným ženským hlasem, s pocitem blízkosti, čtěte jemně a přirozeně.) vypadal výsledek následovně.
Příklad se zadáním klidného ženského hlasu
I v tomto případě se podařilo vytvořit snadno srozumitelný hlas s čistým zvukem.
Funkce popisků má však i svá upozornění.
Funkce popisků trvá ve srovnání s ostatními metodami předčítání déle.
Při našem generování na notebooku trvalo vytvoření tohoto krátkého textu přibližně 5 minut.
Při používání funkce popisků doporučujeme vysoce výkonné PC vybavené GPU.
Co se stane, když se pokusíte přečíst anglický text?
Irodori-TTS je software pro předčítání reagující pouze na japonštinu.
Co se stane, když zkusíme přečíst anglický text?
Zkusíme zadat jednoduchou ukázkovou větu.
Příklad předčítání textu „Hello, this is a voice recording created using Irodori-TTS.“
Tímto způsobem se slovo Hello vyslovilo s katakana přízvukem jako „Haró“ a část „recording“ měla nesrozumitelnou výslovnost, takže text nebyl přečten správně.
Pokud chcete předčítat anglický text, doporučujeme použít AI služby pro předčítání, které podporují cizí jazyky.
Doporučená metoda hlasové syntézy, pokud je „nastavení příliš složité“
Možná jste po přečtení dosavadního textu nabyli dojmu, že nastavení Irodori-TTS vypadá trochu náročně.
Pokud nejste zvyklí na práci v terminálu nebo konfiguraci prostředí Python, může i pouhé dodržení postupu zabrat hodně času.
Také pokud nevlastníte PC s GPU, trvá jedna hlasová syntéza příliš dlouho, což ztěžuje použití pro účely jako je dabing videí.
V takovém případě doporučujeme použít AI hlas, který nevyžaduje instalaci ani nastavení.
『Ondoku』: AI hlas, který lze použít bez nutnosti instalace

Pokud chcete snadno provádět hlasovou syntézu pomocí nejnovější AI, doporučujeme službu AI hlasové syntézy Ondoku.
Ondoku je služba AI hlasové syntézy, kde můžete vytvořit hlas pouhým otevřením prohlížeče a vložením textu.
Hlasy můžete zdarma vytvářet hned teď na PC, smartphonu i tabletu.
Generování hlasu probíhá v cloudu (na straně serveru), takže nevadí, pokud vaše PC nemá GPU.
Vzhledem k tomu, že je od začátku k dispozici několik hlasů, jako jsou mužské, ženské či dětské hlasy, můžete předčítat okamžitě pouhým výběrem, aniž byste museli připravovat referenční hlasy nebo popisky.
Lze přímo předčítat i dlouhé texty.
Ondoku navíc podporuje i angličtinu!
Podporuje mnoho jazyků, jako je francouzština, španělština, korejština, čínština a další, takže jej lze použít i pro jiné než japonské texty.
Navíc s příští generací AI hlasu (OndokuBeta) můžete zažít ještě přirozenější předčítání.
Pokud hledáte způsob, jak převést text na řeč, co takhle vyzkoušet Ondoku, které lze používat zdarma a snadno?
Porovnání rozdílů mezi Ondoku a Irodori-TTS
Na závěr porovnáme hlavní rozdíly mezi Ondoku a Irodori-TTS.
| Položka | Ondoku | Irodori-TTS |
|---|---|---|
| Způsob provozu | Cloud (ovládání v prohlížeči) | Lokální (zpracování ve vlastním PC) |
| Nastavení | Není nutné | Nutná konfigurace prostředí Python, Git atd. |
| Podporované jazyky | Více než 35 jazyků | Pouze japonština |
| Výběr hlasu | Stačí vybrat z několika hlasů | Klonování hlasu, popisky, určení pomocí emoji |
| Limit na jedno generování | Podpora dlouhých textů | Až cca 30 sekund |
| Komerční využití | Možné (u bezplatného použití nutné uvedení zdroje) | Možné (MIT license) |
| Podporovaná zařízení | PC, smartphone, tablet | PC (doporučeno GPU) |
| Cena | K dispozici bezplatný tarif (placené tarify pro více znaků) | Zdarma (díky lokálnímu provozu) |
Při srovnání lze říci, že Ondoku vyniká v jednoduchosti a okamžitém použití, zatímco Irodori-TTS je vhodné pro ty, kteří mají výkonné PC a chtějí si hlasy detailně přizpůsobit.
Pro ty, kteří potřebují hlas hned teď, vyžadují předčítání ve více jazycích nebo chtějí službu používat na smartphonu či tabletu, doporučujeme Ondoku.
Je také vhodné pro ty, kteří chtějí předčítat dlouhé texty bez přerušení, nechtějí trávit čas nastavením nebo nemají PC s GPU.
Vzhledem k tomu, že vysoce kvalitní hlasy můžete generovat ihned pouhým otevřením prohlížeče, proč nezačít používat Ondoku zdarma?
Shrnutí vlastností, nastavení a použití Irodori-TTS
V tomto článku jsme vysvětlili Irodori-TTS, lokálně běžící AI software pro hlasovou syntézu specializovaný na japonštinu.
Irodori-TTS je atraktivní nástroj pro ty, kteří si chtějí vyhrát s hlasovým projevem pomocí klonování hlasu, návrhu kvality hlasu pomocí popisků a ovládání emocí pomocí emoji.
Avšak způsob nastavení a použití je určen pro pokročilé uživatele a vyžaduje konfiguraci prostředí Python a Git.
Také na PC bez GPU trvá generování hlasu delší dobu.
Pro ty, kteří chtějí „používat hlasovou syntézu snadno a hned teď“, doporučujeme Ondoku, které lze používat pouze v prohlížeči.
Proč nezkusit vytvořit vlastní vysoce kvalitní hlasy pomocí této bezplatné a snadno použitelné AI hlasové syntézy?
■ Software pro syntézu řeči AI „Ondoku“
„Ondoku“ je online nástroj pro převod textu na řeč, který lze používat bez počátečních nákladů.
- Podporuje přibližně 50 jazyků včetně japonštiny, angličtiny, čínštiny, korejštiny, španělštiny, francouzštiny a němčiny.
- Dostupné z PC i smartphonu
- Vhodné pro podnikání, vzdělávání, zábavu atd.
- Není nutná žádná instalace, lze jej použít okamžitě z vašeho prohlížeče
- Podporuje také čtení z obrázků
Chcete-li jej použít, jednoduše zadejte text nebo nahrajte soubor z webu. Vytvářejte přirozené zvukové soubory během několika sekund. Syntézu řeči můžete použít zdarma až pro 5 000 znaků, proto ji nejprve vyzkoušejte.
Email: ondoku3.com@gmail.com
Software pro čtení textu Ondoku. Jedná se o službu převodu textu na řeč, která nevyžaduje instalaci a může ji používat kdokoli zdarma. Pokud se zaregistrujete zdarma, můžete každý měsíc získat zdarma až 5000 znaků. Zaregistrujte se nyní zdarma
- Co je Ondoku?
- Přečtěte si text na Ondoku
- Registrace zdarma
- Hodnotit plán
- Seznam článků
- Vyzkoušet i jiné bezplatné služby