Apa itu Irodori-TTS? Fitur, Catatan, dan Cara Pakai yang Mudah
31 Mei 2026

Irodori-TTS itu software pembaca teks AI seperti apa?
Mungkin banyak dari Anda yang penasaran dengan software pembaca teks AI baru "Irodori-TTS".
Dalam artikel ini, kami akan menjelaskan fitur, kemampuan, poin perhatian, dan cara penggunaan Irodori-TTS dengan cara yang mudah dipahami.
Selain itu, bagi Anda yang merasa "setup sepertinya sulit", kami juga memperkenalkan metode sintesis suara yang bisa langsung digunakan tanpa perlu instalasi.
Hal yang akan Anda pahami dari artikel ini
- Software seperti apa Irodori-TTS itu?
- Hal yang bisa dilakukan dan poin perhatian pada Irodori-TTS
- Cara menggunakan Irodori-TTS (dari setup hingga penyesuaian suara)
- Metode yang direkomendasikan saat pembangunan lingkungan (environment) terasa sulit
Apa itu Irodori-TTS? Penjelasan Software Sintesis Suara AI Bahasa Jepang

Pertama-tama, kami akan menjelaskan secara singkat fitur-fitur dari software sintesis suara AI Irodori-TTS.
Irodori-TTS adalah model sintesis suara AI yang berjalan secara lokal
Irodori-TTS adalah software sintesis suara AI yang dikhususkan untuk bahasa Jepang.
Pengembangnya adalah Aratako, dan dirilis secara gratis sebagai open source (lisensi MIT).
Fitur utamanya adalah kemampuan "operasi lokal", di mana sintesis suara diselesaikan sepenuhnya hanya di PC Anda sendiri.
Karena semua proses pembuatan suara dilakukan di PC Anda, teks dan data suara yang dihasilkan tidak akan dikirim ke server eksternal.
Setelah setup awal, Anda dapat menghasilkan suara tanpa koneksi internet, dan tidak ada batasan jumlah pembuatan.
Namun, setup memerlukan alat pemrograman seperti Python dan Git.
Selain itu, PC berperforma tinggi yang dilengkapi dengan GPU (kartu grafis) direkomendasikan agar software dapat berjalan dengan cepat.
Hal yang Bisa dan Tidak Bisa Dilakukan dengan Irodori-TTS

Berikutnya, kami akan menjelaskan tentang apa yang bisa dan tidak bisa dilakukan dengan Irodori-TTS.
Hal yang bisa dilakukan dengan Irodori-TTS
Karena Irodori-TTS berjalan di lingkungan lokal, Anda dapat menghasilkan suara tanpa batas sesering yang Anda mau.
Bahkan di lingkungan tanpa koneksi internet, Anda dapat membuat suara secara bebas setelah setup awal selesai.
Tersedia beberapa cara untuk menginstruksikan jenis suara apa yang ingin dibuat. Dengan menggunakan fitur caption, Anda dapat menciptakan kualitas suara sesuai keinginan hanya dengan instruksi teks.
Selain itu, dimungkinkan juga untuk mereproduksi suara yang Anda miliki melalui voice cloning, atau menambahkan ekspresi emosional menggunakan emoji.
Karena menggunakan lisensi MIT, penggunaan komersial dari suara yang dihasilkan juga dimungkinkan.
Poin perhatian Irodori-TTS
Di sisi lain, ada beberapa poin perhatian yang perlu diketahui sebelum menggunakan Irodori-TTS.
Durasi suara yang dapat dibuat dalam satu waktu maksimal sekitar 30 detik
Dalam satu kali pembuatan, durasi pembacaan maksimal adalah sekitar 30 detik.
Jika Anda ingin membacakan kalimat yang panjang, Anda perlu membagi kalimat tersebut dan melakukan pembuatan beberapa kali.
Sulit untuk menghasilkan suara atau gaya bicara yang persis seperti yang diinginkan
Karena Irodori-TTS memiliki tingkat kebebasan yang tinggi, suara default (suara dasar) tidak disediakan secara tetap.
Oleh karena itu, jika Anda tidak menentukan caption atau suara referensi, jenis kelamin dan usia dapat berubah secara acak setiap kali suara dihasilkan.
Jika Anda ingin membacakan dengan suara yang sama, Anda perlu memuat suara referensi (reference voice).
Selain itu, tidak ada fungsi untuk menyesuaikan intonasi atau nada suara secara manual.
Bahasa yang didukung hanya bahasa Jepang
Bahasa yang didukung hanya bahasa Jepang, dan tidak mendukung bahasa asing seperti bahasa Inggris.
Selain itu, perlu diperhatikan bahwa kesalahan pembacaan kanji terkadang bisa terjadi.
Direkomendasikan PC spek tinggi dengan GPU
Tergantung pada spesifikasi PC, pembuatan suara mungkin memakan waktu lama.
Pada PC yang tidak dilengkapi GPU, pembuatan kalimat pendek sekalipun bisa memakan waktu sekitar 1 menit.
Untuk CPU kelas entry seperti Celeron atau N100, kami merasa akan sulit untuk penggunaan praktis.
Cara Menggunakan Irodori-TTS (Alur Setup)
Berikut penjelasan singkat mengenai cara menggunakan Irodori-TTS.
Alur keseluruhan setup adalah sebagai berikut:
- Instal software yang diperlukan
- Buat folder kerja
- Clone Irodori-TTS dari GitHub
- Instal package yang diperlukan
- Jalankan Irodori-TTS
- Muat model AI
- Bacakan teks
1. Instal software yang diperlukan untuk Irodori-TTS
Persiapan diperlukan untuk melakukan setup Irodori-TTS.
Pertama, instal tiga jenis software berikut:
- Python 3.10 atau lebih tinggi: Bahasa pemrograman
- Git: Sistem kontrol versi (diperlukan untuk mendownload Irodori-TTS)
- uv: Manajer package Python
Untuk menginstal Python, Git, dan uv, pertama-tama klik kanan pada menu Start dan klik "Terminal" (tidak perlu dijalankan sebagai administrator).

Layar Terminal (PowerShell) akan terbuka.

Ketik dan jalankan perintah berikut di layar ini:
winget install --id Git.Git -e
winget install --id=astral-sh.uv -e

Sekarang, Anda telah menginstal hal-hal yang diperlukan untuk setup Irodori-TTS.
*Python akan dikelola oleh uv, sehingga akan diinstal secara otomatis saat setup.
Setelah instalasi, tutup Terminal (PowerShell) satu kali dan buka kembali (untuk menerapkan "path").
2. Buat folder kerja
Selanjutnya, buat folder kerja.
Di sinilah Irodori-TTS akan diinstal.
Kali ini, kami membuat folder bernama "irodori-tts" langsung di drive C.

Setelah folder dibuat, pindah ke folder tersebut di Terminal.
cd C:\irodori-tts

3. Clone Irodori-TTS dari GitHub
Ketik perintah berikut di Terminal untuk melakukan clone repositori Irodori-TTS dari GitHub.
git clone https://github.com/Aratako/Irodori-TTS.git

Clone repositori akan selesai dalam beberapa detik.
Ketik perintah berikut untuk pindah ke folder repositori yang telah di-clone.
cd Irodori-TTS

4. Instal package yang diperlukan
Ketik dan jalankan perintah berikut untuk menginstal package yang diperlukan agar Irodori-TTS dapat berjalan.
uv sync

Ini akan memakan waktu karena akan mendownload dan menginstal banyak package.

Inti Python juga akan diinstal di sini.
Tunggu tanpa menutup layar Terminal selama proses download dan instalasi.
Karena akan mendownload file dengan kapasitas hampir 3GB, disarankan untuk melakukan setup di lokasi dengan koneksi internet yang baik.
5. Jalankan Irodori-TTS
Setelah download dan instalasi package selesai, setup pun selesai.
Jalankan Irodori-TTS.
Ketik dan jalankan perintah berikut, lalu tunggu sebentar hingga program berjalan.
uv run python gradio_app.py --server-name 0.0.0.0 --server-port 7860
Jika Terminal menampilkan pesan seperti berikut, berarti program sudah berjalan.

Running on local URL: http://0.0.0.0:7860
Buka web browser dan akses ke http://localhost:7860.
Layar Irodori-TTS (WebUI) akan terbuka seperti ini.

6. Muat model AI
Klik "Load Model" untuk memuat model AI yang akan digunakan untuk pembacaan teks.

Saat pertama kali digunakan, menekan tombol ini akan memulai download model AI.
Setelah pesan selesai muncul di Model Status (area yang dikelilingi kotak merah pada gambar berikut), pemuatan model AI pun selesai.

7. Bacakan teks dengan Irodori-TTS
Di Irodori-TTS, Anda dapat memberikan instruksi cara membaca termasuk ekspresi emosi, namun sebagai contoh, mari kita coba membacakan tanpa instruksi terlebih dahulu.
Gulir ke bawah untuk menemukan kolom input teks, lalu masukkan kalimat yang ingin dibacakan.

Kali ini, kita akan membacakan "こんにちは、これはイロドリTTSで作成された音声です。" (Halo, ini adalah suara yang dibuat dengan Irodori-TTS).
(Jika ditulis "Irodori-TTS" dalam alfabet, terkadang tidak terbaca dengan benar, jadi kami menulisnya dalam katakana sebagai "イロドリTTS")
Tekan tombol "Generate" untuk memulai pembuatan suara.

Irodori-TTS menggunakan CPU atau GPU (kartu grafis) PC Anda untuk menghasilkan suara.
Oleh karena itu, waktu yang dibutuhkan untuk pembuatan akan sangat bervariasi tergantung pada performa PC.
Kali ini, karena dibuat menggunakan laptop tanpa GPU, meskipun kalimatnya pendek, pembuatannya memakan waktu sekitar 1 menit.
Referensi: Pengujian pembuatan dilakukan pada lingkungan CPU: Ryzen 5 4650U, Memori: DDR4 32GB, Windows 11 Pro 24H2.
Setelah pembuatan selesai, bentuk gelombang suara akan ditampilkan seperti ini, dan Anda dapat memutar suaranya.

Contoh pembacaan "こんにちは、これはイロドリTTSで作成された音声です。"
Jika sudah sesuai, tekan tombol download (ikon panah ke bawah) untuk menyimpan file suara.
File suara disimpan dalam format WAV.
Sekarang, Anda telah berhasil melakukan sintesis suara menggunakan Irodori-TTS.
Cara Menyesuaikan Suara di Irodori-TTS
Di Irodori-TTS, Anda dapat menyesuaikan ekspresi seperti jenis kelamin dan emosi dengan berbagai metode.
Menentukan ekspresi emosi dengan emoji
Klik "Emoji Palette" di bawah kolom input teks untuk memilih emoji.

Masing-masing emoji telah ditetapkan dengan ekspresi emosi tertentu.
- 😊 Senang, tampak gembira
- 😭 Terisak, suara tangisan
- 😰 Terburu-buru, bingung
- ⏩ Bicara cepat
- 📖 Narasi, monolog
Hanya dengan memasukkan emoji ke dalam kolom input teks, Anda dapat membacakan dengan ekspresi emosi yang ditentukan.
Contoh pembacaan "😊 こんにちは、これはイロドリTTSで作成された音声です。"
Contoh pembacaan "📖 こんにちは、これはイロドリTTSで作成された音声です。"
Namun, hanya dengan menentukan emoji, Anda tidak dapat menentukan jenis kelamin atau usia secara spesifik.
Memuat suara referensi untuk membacakan dengan suara yang sama
Di Irodori-TTS, Anda dapat memuat file suara referensi agar teks dibacakan dengan merujuk pada suara tersebut.
Suara referensi dimuat dari bagian yang bertuliskan "Drop Audio Here - or - Click to Upload".

Selain dapat membacakan dengan suara yang sama, kualitas suara yang dihasilkan juga bisa lebih jernih dibandingkan jika tidak menentukan apa pun.
Menyesuaikan gaya pembacaan secara langsung dengan fitur caption
Di Irodori-TTS, Anda juga dapat menentukan secara langsung melalui teks jenis suara seperti apa yang ingin digunakan.
Untuk menggunakan fitur caption, Anda perlu menjalankan "Versi VoiceDesign", dan perintah untuk menjalankan Irodori-TTS di Terminal pun berubah.
uv run python gradio_app_voicedesign.py --server-name 0.0.0.0 --server-port 7861

Setelah menjalankan perintah ini, layar operasi versi VoiceDesign akan terbuka.
Karena versi VoiceDesign menggunakan model AI yang berbeda dari versi standar, saat pertama kali digunakan, Anda perlu mengklik "Load Model" untuk mendownload model secara terpisah dari versi standar.
Kapasitas model AI adalah sekitar 2GB, jadi disarankan untuk mendownload di tempat dengan koneksi internet yang baik.
Pada layar operasi versi VoiceDesign, terdapat kotak teks "Caption / Style Prompt (optional)".

Di sini, masukkan kalimat yang mendeskripsikan suara seperti apa yang Anda inginkan.
- Bacakan dengan suara wanita yang tenang, dengan kesan jarak yang dekat, secara lembut dan alami.
- Bicaralah dengan suara pria yang ceria, terang, dan bersemangat.
- Bacakan dengan suara pria yang rendah, secara datar seperti pembaca berita.
Dengan cara ini, Anda dapat menentukan jenis suara yang akan digunakan.
Sebagai contoh, jika dibacakan dengan instruksi "Bacakan dengan suara wanita yang tenang, dengan kesan jarak yang dekat, secara lembut dan alami.", hasilnya menjadi suara seperti berikut.
Contoh dengan instruksi "Bacakan dengan suara wanita yang tenang, dengan kesan jarak yang dekat, secara lembut dan alami."
Ini juga menghasilkan pembacaan dengan kualitas suara yang jernih dan mudah didengar.
Namun, ada poin perhatian untuk fitur caption ini.
Fitur caption memakan waktu pembuatan suara yang lebih lama dibandingkan metode pembacaan lainnya.
Kali ini saat dibuat dengan laptop, pembuatan kalimat pendek ini memakan waktu sekitar 5 menit.
Saat menggunakan fitur caption, sangat direkomendasikan menggunakan PC spek tinggi yang dilengkapi GPU.
Apa yang terjadi jika membacakan teks bahasa Inggris?
Irodori-TTS adalah software pembaca teks yang hanya mendukung bahasa Jepang.
Lalu, apa yang terjadi jika kita mencoba membacakan teks bahasa Inggris?
Mari kita coba masukkan contoh kalimat sederhana.
Contoh pembacaan "Hello, this is a voice recording created using Irodori-TTS."
Seperti ini, kata "Hello" diucapkan dengan pelafalan katakana "Haro", dan bagian "recording" diucapkan dengan pelafalan yang tidak jelas, sehingga tidak dapat terbaca dengan benar.
Jika Anda ingin membacakan teks bahasa Inggris, direkomendasikan untuk menggunakan layanan pembaca teks AI yang mendukung bahasa asing.
Metode Sintesis Suara yang Direkomendasikan saat "Setup Terasa Sulit"
Setelah membaca sejauh ini, mungkin ada di antara Anda yang merasa bahwa setup Irodori-TTS tampak agak merepotkan.
Jika tidak terbiasa dengan pengoperasian Terminal atau pembangunan lingkungan Python, sekadar mengikuti prosedurnya saja bisa memakan banyak waktu.
Selain itu, jika Anda tidak memiliki PC dengan GPU, satu kali sintesis suara bisa memakan waktu terlalu lama, sehingga sulit digunakan untuk keperluan seperti narasi video.
Dalam kondisi seperti itu, yang direkomendasikan adalah menggunakan suara AI yang tidak memerlukan instalasi maupun setup.
『Ondoku』: Suara AI yang dapat digunakan tanpa instalasi

Rekomendasi untuk melakukan sintesis suara dengan mudah menggunakan AI terbaru adalah layanan sintesis suara AI 『Ondoku』.
『Ondoku』 adalah layanan sintesis suara AI di mana Anda dapat membuat suara hanya dengan membuka browser dan menempelkan teks.
Anda dapat segera membuat suara secara gratis menggunakan PC, smartphone, maupun tablet.
Karena pembuatan suara dilakukan di cloud (sisi server), tidak masalah jika PC Anda tidak dilengkapi dengan GPU.
Berbagai pilihan suara seperti suara pria, suara wanita, dan suara anak-anak sudah disediakan sejak awal, sehingga Anda dapat langsung membacakan hanya dengan memilihnya, tanpa perlu menyiapkan suara referensi atau caption.
Teks panjang juga dapat langsung dibacakan.
Terlebih lagi, Ondoku juga mendukung bahasa Inggris!
Karena mendukung banyak bahasa seperti bahasa Prancis, Spanyol, Korea, Mandarin, dan lainnya, Ondoku juga dapat digunakan untuk pembacaan selain bahasa Jepang.
Bahkan, Anda dapat mencoba pembacaan yang lebih alami dengan suara AI generasi berikutnya (OndokuBeta).
Jika Anda mencari cara untuk membacakan teks sebagai suara, mengapa tidak mencoba 『Ondoku』 yang dapat digunakan secara gratis dan mudah?
Perbandingan Perbedaan antara Ondoku dan Irodori-TTS
Terakhir, berikut adalah perbandingan perbedaan utama antara Ondoku dan Irodori-TTS.
| Item | Ondoku | Irodori-TTS |
|---|---|---|
| Metode Operasi | Cloud (dioperasikan di browser) | Lokal (diproses di PC sendiri) |
| Setup | Tidak Perlu | Perlu pembangunan lingkungan Python, Git, dll. |
| Bahasa yang Didukung | Lebih dari 35 bahasa | Hanya bahasa Jepang |
| Cara Memilih Suara | Hanya perlu memilih dari berbagai suara | Ditentukan dengan voice cloning, caption, emoji |
| Batas Pembuatan per Sesi | Mendukung teks panjang | Maksimal sekitar 30 detik |
| Penggunaan Komersial | Bisa (perlu pencantuman kredit untuk penggunaan gratis) | Bisa (lisensi MIT) |
| Perangkat yang Didukung | PC, Smartphone, Tablet | PC (disarankan GPU) |
| Biaya | Tersedia paket gratis (jumlah karakter bertambah di paket berbayar) | Gratis (karena beroperasi secara lokal) |
Sebagai perbandingan, Ondoku unggul dalam hal kepraktisan dan kemudahan penggunaan segera, sedangkan Irodori-TTS cocok jika Anda memiliki PC berperforma tinggi dan ingin merancang suara secara mendetail.
Bagi Anda yang ingin segera mendapatkan suara, memerlukan pembacaan multibahasa, atau ingin menggunakan di smartphone atau tablet, Ondoku sangat direkomendasikan.
Ondoku juga cocok bagi Anda yang ingin membacakan kalimat panjang apa adanya, tidak ingin menghabiskan waktu untuk setup, atau bagi Anda yang PC-nya tidak dilengkapi GPU.
Karena Anda dapat menghasilkan suara berkualitas tinggi segera hanya dengan membuka browser, mengapa tidak mencoba menggunakan Ondoku secara gratis?
Ringkasan Fitur, Setup, dan Cara Menggunakan Irodori-TTS
Dalam artikel ini, kami telah menjelaskan tentang Irodori-TTS, software sintesis suara AI operasi lokal yang dikhususkan untuk bahasa Jepang.
Irodori-TTS adalah alat yang menarik bagi mereka yang ingin teliti dalam ekspresi suara, seperti desain kualitas suara melalui voice cloning atau caption, serta kontrol emosi melalui emoji.
Namun, metode setup dan penggunaannya ditujukan untuk pengguna tingkat lanjut, di mana pembangunan lingkungan Python dan Git diperlukan untuk setup-nya.
Selain itu, pembuatan suara memakan waktu lama pada PC tanpa GPU.
Bagi Anda yang "ingin menggunakan sintesis suara dengan mudah sekarang juga", 『Ondoku』 yang dapat digunakan hanya dengan browser sangat direkomendasikan.
Dengan sintesis suara AI gratis yang mudah digunakan, mengapa Anda tidak mencoba membuat suara berkualitas tinggi sendiri?
■ Perangkat lunak sintesis ucapan AI “Ondoku”
"Ondoku" adalah alat text-to-speech online yang dapat digunakan tanpa biaya awal.
- Mendukung sekitar 50 bahasa termasuk Jepang, Inggris, Cina, Korea, Spanyol, Prancis, dan Jerman.
- Tersedia dari PC dan smartphone
- Cocok untuk bisnis, pendidikan, hiburan, dll.
- Tidak diperlukan instalasi, dapat langsung digunakan dari browser Anda
- Juga mendukung membaca dari gambar
Untuk menggunakannya, cukup masukkan teks atau unggah file dari situs. Hasilkan file suara alami dalam hitungan detik. Anda dapat menggunakan sintesis ucapan hingga 5.000 karakter secara gratis, jadi silakan mencobanya terlebih dahulu.
Email: ondoku3.com@gmail.com
Perangkat lunak Text-To-SpeechOndoku. Ini adalah layanan Text-To-Speech yang tidak memerlukan instalasi dan dapat digunakan oleh siapa saja secara gratis. Jika Anda mendaftar secara gratis, Anda bisa mendapatkan hingga 5000 karakter gratis setiap bulannya. Daftar sekarang secara gratis
- Apa itu Ondoku?
- Baca teks dengan Ondoku
- Pendaftaran gratis
- Paket harga
- Daftar artikel
- Coba layanan gratis lainnya