Apa itu Irodori-TTS? Fitur, Catatan, dan Cara Pakai yang Mudah

28 Juli 2026

Irodori-TTS itu software pembaca teks AI seperti apa?

Mungkin banyak dari Anda yang penasaran dengan software pembaca teks AI baru "Irodori-TTS".

Dalam artikel ini, kami akan menjelaskan fitur, kemampuan, poin perhatian, dan cara penggunaan Irodori-TTS dengan cara yang mudah dipahami.

Selain itu, bagi Anda yang merasa "setup sepertinya sulit", kami juga memperkenalkan metode sintesis suara yang bisa langsung digunakan tanpa perlu instalasi.

Hal yang akan Anda pahami dari artikel ini

Software seperti apa Irodori-TTS itu?
Hal yang bisa dilakukan dan poin perhatian pada Irodori-TTS
Cara menggunakan Irodori-TTS (dari setup hingga penyesuaian suara)
Metode yang direkomendasikan saat pembangunan lingkungan (environment) terasa sulit

Apa itu Irodori-TTS? Penjelasan Software Sintesis Suara AI Bahasa Jepang

Pertama-tama, kami akan menjelaskan secara singkat fitur-fitur dari software sintesis suara AI Irodori-TTS.

Irodori-TTS adalah model sintesis suara AI yang berjalan secara lokal

Irodori-TTS adalah software sintesis suara AI yang dikhususkan untuk bahasa Jepang.

Pengembangnya adalah Aratako, dan dirilis secara gratis sebagai open source (lisensi MIT).

Fitur utamanya adalah kemampuan "operasi lokal", di mana sintesis suara diselesaikan sepenuhnya hanya di PC Anda sendiri.

Karena semua proses pembuatan suara dilakukan di PC Anda, teks dan data suara yang dihasilkan tidak akan dikirim ke server eksternal.

Setelah setup awal, Anda dapat menghasilkan suara tanpa koneksi internet, dan tidak ada batasan jumlah pembuatan.

Namun, setup memerlukan alat pemrograman seperti Python dan Git.

Selain itu, PC berperforma tinggi yang dilengkapi dengan GPU (kartu grafis) direkomendasikan agar software dapat berjalan dengan cepat.

Hal yang Bisa dan Tidak Bisa Dilakukan dengan Irodori-TTS

Berikutnya, kami akan menjelaskan tentang apa yang bisa dan tidak bisa dilakukan dengan Irodori-TTS.

Hal yang bisa dilakukan dengan Irodori-TTS

Karena Irodori-TTS berjalan di lingkungan lokal, Anda dapat menghasilkan suara tanpa batas sesering yang Anda mau.

Bahkan di lingkungan tanpa koneksi internet, Anda dapat membuat suara secara bebas setelah setup awal selesai.

Tersedia beberapa cara untuk menginstruksikan jenis suara apa yang ingin dibuat. Dengan menggunakan fitur caption, Anda dapat menciptakan kualitas suara sesuai keinginan hanya dengan instruksi teks.

Selain itu, dimungkinkan juga untuk mereproduksi suara yang Anda miliki melalui voice cloning, atau menambahkan ekspresi emosional menggunakan emoji.

Karena menggunakan lisensi MIT, penggunaan komersial dari suara yang dihasilkan juga dimungkinkan.

Poin perhatian Irodori-TTS

Di sisi lain, ada beberapa poin perhatian yang perlu diketahui sebelum menggunakan Irodori-TTS.

Durasi suara yang dapat dibuat dalam satu waktu maksimal sekitar 30 detik

Dalam satu kali pembuatan, durasi pembacaan maksimal adalah sekitar 30 detik.

Jika Anda ingin membacakan kalimat yang panjang, Anda perlu membagi kalimat tersebut dan melakukan pembuatan beberapa kali.

Sulit untuk menghasilkan suara atau gaya bicara yang persis seperti yang diinginkan

Karena Irodori-TTS memiliki tingkat kebebasan yang tinggi, suara default (suara dasar) tidak disediakan secara tetap.

Oleh karena itu, jika Anda tidak menentukan caption atau suara referensi, jenis kelamin dan usia dapat berubah secara acak setiap kali suara dihasilkan.

Jika Anda ingin membacakan dengan suara yang sama, Anda perlu memuat suara referensi (reference voice).

Selain itu, tidak ada fungsi untuk menyesuaikan intonasi atau nada suara secara manual.

Bahasa yang didukung hanya bahasa Jepang

Bahasa yang didukung hanya bahasa Jepang, dan tidak mendukung bahasa asing seperti bahasa Inggris.

Selain itu, perlu diperhatikan bahwa kesalahan pembacaan kanji terkadang bisa terjadi.

Direkomendasikan PC spek tinggi dengan GPU

Tergantung pada spesifikasi PC, pembuatan suara mungkin memakan waktu lama.

Pada PC yang tidak dilengkapi GPU, pembuatan kalimat pendek sekalipun bisa memakan waktu sekitar 1 menit.

Untuk CPU kelas entry seperti Celeron atau N100, kami merasa akan sulit untuk penggunaan praktis.

Cara Menggunakan Irodori-TTS (Alur Setup)

Berikut penjelasan singkat mengenai cara menggunakan Irodori-TTS.

Alur keseluruhan setup adalah sebagai berikut:

Instal software yang diperlukan
Buat folder kerja
Clone Irodori-TTS dari GitHub
Instal package yang diperlukan
Jalankan Irodori-TTS
Muat model AI
Bacakan teks

1. Instal software yang diperlukan untuk Irodori-TTS

Persiapan diperlukan untuk melakukan setup Irodori-TTS.

Pertama, instal tiga jenis software berikut:

Python 3.10 atau lebih tinggi: Bahasa pemrograman
Git: Sistem kontrol versi (diperlukan untuk mendownload Irodori-TTS)
uv: Manajer package Python

Untuk menginstal Python, Git, dan uv, pertama-tama klik kanan pada menu Start dan klik "Terminal" (tidak perlu dijalankan sebagai administrator).

Layar Terminal (PowerShell) akan terbuka.

Ketik dan jalankan perintah berikut di layar ini:

winget install --id Git.Git -e
winget install --id=astral-sh.uv -e

Sekarang, Anda telah menginstal hal-hal yang diperlukan untuk setup Irodori-TTS.

*Python akan dikelola oleh uv, sehingga akan diinstal secara otomatis saat setup.

Setelah instalasi, tutup Terminal (PowerShell) satu kali dan buka kembali (untuk menerapkan "path").

2. Buat folder kerja

Selanjutnya, buat folder kerja.

Di sinilah Irodori-TTS akan diinstal.

Kali ini, kami membuat folder bernama "irodori-tts" langsung di drive C.

Setelah folder dibuat, pindah ke folder tersebut di Terminal.

cd C:\irodori-tts

3. Clone Irodori-TTS dari GitHub

Ketik perintah berikut di Terminal untuk melakukan clone repositori Irodori-TTS dari GitHub.

git clone https://github.com/Aratako/Irodori-TTS.git

Clone repositori akan selesai dalam beberapa detik.

Ketik perintah berikut untuk pindah ke folder repositori yang telah di-clone.

cd Irodori-TTS

4. Instal package yang diperlukan

Ketik dan jalankan perintah berikut untuk menginstal package yang diperlukan agar Irodori-TTS dapat berjalan.

uv sync

Ini akan memakan waktu karena akan mendownload dan menginstal banyak package.

Inti Python juga akan diinstal di sini.

Tunggu tanpa menutup layar Terminal selama proses download dan instalasi.

Karena akan mendownload file dengan kapasitas hampir 3GB, disarankan untuk melakukan setup di lokasi dengan koneksi internet yang baik.

5. Jalankan Irodori-TTS

Setelah download dan instalasi package selesai, setup pun selesai.

Jalankan Irodori-TTS.

Ketik dan jalankan perintah berikut, lalu tunggu sebentar hingga program berjalan.

uv run python gradio_app.py --server-name 0.0.0.0 --server-port 7860

Jika Terminal menampilkan pesan seperti berikut, berarti program sudah berjalan.

Running on local URL: http://0.0.0.0:7860

Buka web browser dan akses ke http://localhost:7860.

Layar Irodori-TTS (WebUI) akan terbuka seperti ini.

6. Muat model AI

Klik "Load Model" untuk memuat model AI yang akan digunakan untuk pembacaan teks.

Saat pertama kali digunakan, menekan tombol ini akan memulai download model AI.

Setelah pesan selesai muncul di Model Status (area yang dikelilingi kotak merah pada gambar berikut), pemuatan model AI pun selesai.

7. Bacakan teks dengan Irodori-TTS

Di Irodori-TTS, Anda dapat memberikan instruksi cara membaca termasuk ekspresi emosi, namun sebagai contoh, mari kita coba membacakan tanpa instruksi terlebih dahulu.

Gulir ke bawah untuk menemukan kolom input teks, lalu masukkan kalimat yang ingin dibacakan.

Kali ini, kita akan membacakan "こんにちは、これはイロドリTTSで作成された音声です。" (Halo, ini adalah suara yang dibuat dengan Irodori-TTS).

(Jika ditulis "Irodori-TTS" dalam alfabet, terkadang tidak terbaca dengan benar, jadi kami menulisnya dalam katakana sebagai "イロドリTTS")

Tekan tombol "Generate" untuk memulai pembuatan suara.

Irodori-TTS menggunakan CPU atau GPU (kartu grafis) PC Anda untuk menghasilkan suara.

Oleh karena itu, waktu yang dibutuhkan untuk pembuatan akan sangat bervariasi tergantung pada performa PC.

Kali ini, karena dibuat menggunakan laptop tanpa GPU, meskipun kalimatnya pendek, pembuatannya memakan waktu sekitar 1 menit.

Referensi: Pengujian pembuatan dilakukan pada lingkungan CPU: Ryzen 5 4650U, Memori: DDR4 32GB, Windows 11 Pro 24H2.

Setelah pembuatan selesai, bentuk gelombang suara akan ditampilkan seperti ini, dan Anda dapat memutar suaranya.

Contoh pembacaan "こんにちは、これはイロドリTTSで作成された音声です。"

Jika sudah sesuai, tekan tombol download (ikon panah ke bawah) untuk menyimpan file suara.

File suara disimpan dalam format WAV.

Sekarang, Anda telah berhasil melakukan sintesis suara menggunakan Irodori-TTS.

Cara Menyesuaikan Suara di Irodori-TTS

Di Irodori-TTS, Anda dapat menyesuaikan ekspresi seperti jenis kelamin dan emosi dengan berbagai metode.

Menentukan ekspresi emosi dengan emoji

Klik "Emoji Palette" di bawah kolom input teks untuk memilih emoji.

Masing-masing emoji telah ditetapkan dengan ekspresi emosi tertentu.

😊 Senang, tampak gembira
😭 Terisak, suara tangisan
😰 Terburu-buru, bingung
⏩ Bicara cepat
📖 Narasi, monolog

Hanya dengan memasukkan emoji ke dalam kolom input teks, Anda dapat membacakan dengan ekspresi emosi yang ditentukan.

Contoh pembacaan "😊 こんにちは、これはイロドリTTSで作成された音声です。"

Contoh pembacaan "📖 こんにちは、これはイロドリTTSで作成された音声です。"

Namun, hanya dengan menentukan emoji, Anda tidak dapat menentukan jenis kelamin atau usia secara spesifik.

Memuat suara referensi untuk membacakan dengan suara yang sama

Di Irodori-TTS, Anda dapat memuat file suara referensi agar teks dibacakan dengan merujuk pada suara tersebut.

Suara referensi dimuat dari bagian yang bertuliskan "Drop Audio Here - or - Click to Upload".

Selain dapat membacakan dengan suara yang sama, kualitas suara yang dihasilkan juga bisa lebih jernih dibandingkan jika tidak menentukan apa pun.

Menyesuaikan gaya pembacaan secara langsung dengan fitur caption

Di Irodori-TTS, Anda juga dapat menentukan secara langsung melalui teks jenis suara seperti apa yang ingin digunakan.

Untuk menggunakan fitur caption, Anda perlu menjalankan "Versi VoiceDesign", dan perintah untuk menjalankan Irodori-TTS di Terminal pun berubah.

uv run python gradio_app_voicedesign.py --server-name 0.0.0.0 --server-port 7861

Setelah menjalankan perintah ini, layar operasi versi VoiceDesign akan terbuka.

Karena versi VoiceDesign menggunakan model AI yang berbeda dari versi standar, saat pertama kali digunakan, Anda perlu mengklik "Load Model" untuk mendownload model secara terpisah dari versi standar.

Kapasitas model AI adalah sekitar 2GB, jadi disarankan untuk mendownload di tempat dengan koneksi internet yang baik.

Pada layar operasi versi VoiceDesign, terdapat kotak teks "Caption / Style Prompt (optional)".

Di sini, masukkan kalimat yang mendeskripsikan suara seperti apa yang Anda inginkan.

Bacakan dengan suara wanita yang tenang, dengan kesan jarak yang dekat, secara lembut dan alami.
Bicaralah dengan suara pria yang ceria, terang, dan bersemangat.
Bacakan dengan suara pria yang rendah, secara datar seperti pembaca berita.

Dengan cara ini, Anda dapat menentukan jenis suara yang akan digunakan.

Sebagai contoh, jika dibacakan dengan instruksi "Bacakan dengan suara wanita yang tenang, dengan kesan jarak yang dekat, secara lembut dan alami.", hasilnya menjadi suara seperti berikut.

Contoh dengan instruksi "Bacakan dengan suara wanita yang tenang, dengan kesan jarak yang dekat, secara lembut dan alami."

Ini juga menghasilkan pembacaan dengan kualitas suara yang jernih dan mudah didengar.

Namun, ada poin perhatian untuk fitur caption ini.

Fitur caption memakan waktu pembuatan suara yang lebih lama dibandingkan metode pembacaan lainnya.

Kali ini saat dibuat dengan laptop, pembuatan kalimat pendek ini memakan waktu sekitar 5 menit.

Saat menggunakan fitur caption, sangat direkomendasikan menggunakan PC spek tinggi yang dilengkapi GPU.

Apa yang terjadi jika membacakan teks bahasa Inggris?

Irodori-TTS adalah software pembaca teks yang hanya mendukung bahasa Jepang.

Lalu, apa yang terjadi jika kita mencoba membacakan teks bahasa Inggris?

Mari kita coba masukkan contoh kalimat sederhana.

Contoh pembacaan "Hello, this is a voice recording created using Irodori-TTS."

Seperti ini, kata "Hello" diucapkan dengan pelafalan katakana "Haro", dan bagian "recording" diucapkan dengan pelafalan yang tidak jelas, sehingga tidak dapat terbaca dengan benar.

Jika Anda ingin membacakan teks bahasa Inggris, direkomendasikan untuk menggunakan layanan pembaca teks AI yang mendukung bahasa asing.

Metode Sintesis Suara yang Direkomendasikan saat "Setup Terasa Sulit"

Setelah membaca sejauh ini, mungkin ada di antara Anda yang merasa bahwa setup Irodori-TTS tampak agak merepotkan.

Jika tidak terbiasa dengan pengoperasian Terminal atau pembangunan lingkungan Python, sekadar mengikuti prosedurnya saja bisa memakan banyak waktu.

Selain itu, jika Anda tidak memiliki PC dengan GPU, satu kali sintesis suara bisa memakan waktu terlalu lama, sehingga sulit digunakan untuk keperluan seperti narasi video.

Dalam kondisi seperti itu, yang direkomendasikan adalah menggunakan suara AI yang tidak memerlukan instalasi maupun setup.

『Ondoku』: Suara AI yang dapat digunakan tanpa instalasi

Rekomendasi untuk melakukan sintesis suara dengan mudah menggunakan AI terbaru adalah layanan sintesis suara AI 『Ondoku』.

『Ondoku』 adalah layanan sintesis suara AI di mana Anda dapat membuat suara hanya dengan membuka browser dan menempelkan teks.

Anda dapat segera membuat suara secara gratis menggunakan PC, smartphone, maupun tablet.

Karena pembuatan suara dilakukan di cloud (sisi server), tidak masalah jika PC Anda tidak dilengkapi dengan GPU.

Berbagai pilihan suara seperti suara pria, suara wanita, dan suara anak-anak sudah disediakan sejak awal, sehingga Anda dapat langsung membacakan hanya dengan memilihnya, tanpa perlu menyiapkan suara referensi atau caption.

Teks panjang juga dapat langsung dibacakan.

Terlebih lagi, Ondoku juga mendukung bahasa Inggris!

Karena mendukung banyak bahasa seperti bahasa Prancis, Spanyol, Korea, Mandarin, dan lainnya, Ondoku juga dapat digunakan untuk pembacaan selain bahasa Jepang.

Bahkan, Anda dapat mencoba pembacaan yang lebih alami dengan suara AI generasi berikutnya (OndokuBeta).

Jika Anda mencari cara untuk membacakan teks sebagai suara, mengapa tidak mencoba 『Ondoku』 yang dapat digunakan secara gratis dan mudah?

Coba gunakan Ondoku sekarang

Perbandingan Perbedaan antara Ondoku dan Irodori-TTS

Terakhir, berikut adalah perbandingan perbedaan utama antara Ondoku dan Irodori-TTS.

👆 Bisa digulir ke samping

Item	Ondoku	Irodori-TTS
Metode Operasi	Cloud (dioperasikan di browser)	Lokal (diproses di PC sendiri)
Setup	Tidak Perlu	Perlu pembangunan lingkungan Python, Git, dll.
Bahasa yang Didukung	Lebih dari 35 bahasa	Hanya bahasa Jepang
Cara Memilih Suara	Hanya perlu memilih dari berbagai suara	Ditentukan dengan voice cloning, caption, emoji
Batas Pembuatan per Sesi	Mendukung teks panjang	Maksimal sekitar 30 detik
Penggunaan Komersial	Bisa (perlu pencantuman kredit untuk penggunaan gratis)	Bisa (lisensi MIT)
Perangkat yang Didukung	PC, Smartphone, Tablet	PC (disarankan GPU)
Biaya	Tersedia paket gratis (jumlah karakter bertambah di paket berbayar)	Gratis (karena beroperasi secara lokal)

Sebagai perbandingan, Ondoku unggul dalam hal kepraktisan dan kemudahan penggunaan segera, sedangkan Irodori-TTS cocok jika Anda memiliki PC berperforma tinggi dan ingin merancang suara secara mendetail.

Bagi Anda yang ingin segera mendapatkan suara, memerlukan pembacaan multibahasa, atau ingin menggunakan di smartphone atau tablet, Ondoku sangat direkomendasikan.

Ondoku juga cocok bagi Anda yang ingin membacakan kalimat panjang apa adanya, tidak ingin menghabiskan waktu untuk setup, atau bagi Anda yang PC-nya tidak dilengkapi GPU.

Karena Anda dapat menghasilkan suara berkualitas tinggi segera hanya dengan membuka browser, mengapa tidak mencoba menggunakan Ondoku secara gratis?

Coba gunakan Ondoku sekarang

Ringkasan Fitur, Setup, dan Cara Menggunakan Irodori-TTS

Dalam artikel ini, kami telah menjelaskan tentang Irodori-TTS, software sintesis suara AI operasi lokal yang dikhususkan untuk bahasa Jepang.

Irodori-TTS adalah alat yang menarik bagi mereka yang ingin teliti dalam ekspresi suara, seperti desain kualitas suara melalui voice cloning atau caption, serta kontrol emosi melalui emoji.

Namun, metode setup dan penggunaannya ditujukan untuk pengguna tingkat lanjut, di mana pembangunan lingkungan Python dan Git diperlukan untuk setup-nya.

Selain itu, pembuatan suara memakan waktu lama pada PC tanpa GPU.

Bagi Anda yang "ingin menggunakan sintesis suara dengan mudah sekarang juga", 『Ondoku』 yang dapat digunakan hanya dengan browser sangat direkomendasikan.

Dengan sintesis suara AI gratis yang mudah digunakan, mengapa Anda tidak mencoba membuat suara berkualitas tinggi sendiri?

■ Perangkat lunak sintesis ucapan AI “Ondoku”

"Ondoku" adalah alat text-to-speech online yang dapat digunakan tanpa biaya awal.

Mendukung sekitar 50 bahasa termasuk Jepang, Inggris, Cina, Korea, Spanyol, Prancis, dan Jerman.
Tersedia dari PC dan smartphone
Cocok untuk bisnis, pendidikan, hiburan, dll.
Tidak diperlukan instalasi, dapat langsung digunakan dari browser Anda
Juga mendukung membaca dari gambar

Untuk menggunakannya, cukup masukkan teks atau unggah file dari situs. Hasilkan file suara alami dalam hitungan detik. Anda dapat menggunakan sintesis ucapan hingga 5.000 karakter secara gratis, jadi silakan mencobanya terlebih dahulu.

Perangkat lunak text-to-speech "Ondoku" dapat membacakan 5000 karakter setiap bulan dengan suara AI secara gratis. Anda dapat dengan mudah mengunduh MP3 dan penggunaan komersial juga dimungkinkan. Jika Anda mendaftar secara gratis, Anda dapat mengonversi hingga 5.000 karakter per bulan secara gratis dari teks ke ucapan. Coba Ondoku sekarang.

HP: ondoku3.com
Email: ondoku3.com@gmail.com

←Artikel sebelumnya |

Artikel yang berkaitan

Rangkuman rekomendasi software pembaca teks. 7 pilihan yang juga bisa untuk penggunaan komersial 【G…

Text-to-speech, Pertanyaan yang Sering Diajukan (FAQ) Ondoku

Cara menyesuaikan jeda dan waktu kosong dalam pembacaan Ondoku 【2 jenis】

Cara mencantumkan kredit Ondoku. Contoh penulisan dan poin yang perlu diperhatikan.

【Gratis】Ringkasan 5 Jenis Perangkat Lunak Pembaca Teks Gratis yang Dapat Digunakan di Mac

Metode pembayaran Ondoku (Kartu kredit, kartu debit, transfer bank) dan tentang tanda terima

Ondoku

Perangkat lunak Text-To-SpeechOndoku. Ini adalah layanan Text-To-Speech yang tidak memerlukan instalasi dan dapat digunakan oleh siapa saja secara gratis. Jika Anda mendaftar secara gratis, Anda bisa mendapatkan hingga 5000 karakter gratis setiap bulannya. Daftar sekarang secara gratis

Artikel Baru

Artikel populer