VOICEVOX使用完全指南!从AI免费语音合成软件的特点到商用利用的详细解析
2026年1月26日

VOICEVOX 是一款安装在 Windows、Mac 或 Linux 的 PC 上使用的音声合成软件。
它采用了基于 AI 的最新音声合成技术,只需输入文本即可生成朗读语音,因此在视频制作者和内容创作者中得到了广泛应用。
可以使用在 YouTube 和 niconico 动画上广受欢迎的「ずんだもん」的声音进行朗读,这也是其特色之一。
在这篇文章中,我们将为想要开始使用 VOICEVOX 的用户详细讲解所需的各种信息,包括音声合成软件 VOICEVOX 的特点、Windows 上的安装方法、使用方法,以及商用利用时的注意事项。
- 打算使用 VOICEVOX
- 正在寻找文本朗读的方法
如果是这样,不妨参考这篇文章,找到最适合您的音声合成软件或朗读方法吧?
【免费・商用利用OK】推荐的最新 AI 文章朗读服务
为您推荐一款想要制作朗读语音时必看的免费朗读服务!
那就是最新的 AI 服务『Ondoku』。
『Ondoku』是一款可以免费使用的朗读服务。
不仅支持 Windows、Mac、Linux,甚至在 iPhone 和 Android 手机等任何环境下都能使用。
使用方法也非常简单,只需输入文本即可!
无需安装,现在就能立即利用,而且无论 PC 配置如何都能流畅地进行朗读。
而且 『Ondoku』 支持免费商用利用!
快来利用 『Ondoku』 清晰自然的声音,尝试免费制作视频吧?
音声合成软件 VOICEVOX 是什么?AI 朗读软件详解
首先,简单讲解一下关于 VOICEVOX 的信息。
VOICEVOX 是什么样的 AI 朗读软件?

音声合成软件 VOICEVOX 是一款利用了基于 AI 的 Deep Learning 技术的文本朗读软件。
输入日语文本后,可以使用 AI 以角色语音进行朗读。
VOICEVOX 是一款可以免费使用的软件,也支持商用利用。
但是,商用利用需要进行适当的署名标注(Credit 表记)。
除了个人利用外,还可用于 YouTube 或 niconico 动画的视频投稿收益化、企业内部利用等,但也需要遵守「ずんだもん」「四国めたん」「春日部つむぎ」等角色的利用规约。
采用 AI 的高品质音声合成技术
近年来,AI 音声合成技术的发展非常迅速。
VOICEVOX 也是采用 AI 音声合成技术的软件之一,与以往机械化的朗读软件相比,可以用更自然的声音进行朗读。
在操作界面上可以以文字为单位调整 Intonation,虽然需要花费一些调整功夫,但可以制作出表现力丰富的语音。
还配备了感情表现功能,可以表现出对应喜怒哀乐的音色变化。
通过使用「ずんだもん」等角色语音,可以制作出吸引听众兴趣的音声内容。
多平台支持
VOICEVOX 支持 Windows、Mac、Linux 这 3 种 OS。
特别是支持 Linux 的音声合成软件非常罕见,对于在 Linux 环境下进行视频制作或音声内容制作的用户来说,是为数不多的选择之一。
VOICEVOX 的特点是什么?

支持多种角色语音朗读
VOICEVOX 的特点之一就是可以使用个性丰富的角色语音。
最著名的角色是「ずんだもん」。
作为东北ずん子项目的一环而提供的角色,其特点是可爱的童声高音。
除了 ずんだもん 之外,还收录了「四国めたん」、「春日部つむぎ」、「波音リツ」等多数具有不同音质和个性的角色。
每个角色都有详细的设定,甚至设定了年龄、身高和性格等,因此可以根据视频或内容的世界观来选择角色。
在 VOICEVOX 中,角色会以每次数人的形式同时发布,因此根据发布时期会被分类为「1期生」、「2期生」等。
无角色的 VOICEVOX Nemo 也已发布
2023 年 11 月发布的 「VOICEVOX Nemo」 是没有角色设定的语音库。
它是以商务场景和教育现场的利用为前提开发的,特点是适用于广泛场景的沉稳音质。
与角色色彩浓厚的普通 VOICEVOX 语音不同,它更适合用于企业演示、教育内容、官方公告等正式用途。
VOICEVOX Nemo 也准备了多种音质,可以从男声和女声中进行选择。
可以根据内容或对象选择最合适的语音。
搭载感情表现与自定义功能
VOICEVOX 准备了将 8 种感情风格反映到语音中的功能。
虽然准备了「甜腻(あまあま)」、「泪眼(なみだめ)」、「胆怯(びびり)」、「细语(ささやき)」等风格,但根据角色的不同,可以使用的风格也是固定的。
此外,作为音声参数,可以对 Accent、Intonation、长度进行调整,并可以将这些组合起来进行调整。
还有仅修改文章中特定部分的感情或调整读法的功能,可以进行细致的表现调整。
通过 Accent 词典功能预先注册专有名词或专业术语的读法,还可以减少朗读错误。
歌声合成功能也已登场
2024 年 1 月,VOICEVOX 添加了歌声合成功能,使得让角色用语音唱歌也成为了可能。
「哼唱(Humming)」功能支持 29 种角色(截至 2025 年 6 月)。
在哼唱功能中,可以生成角色配合旋律唱歌般的语音。
「歌曲(Song)」功能目前仅支持 波音リツ,但可以进行更正式的歌声合成。
【支持商用!】现在就能免费使用的推荐 AI 音声合成软件
对于正在寻找音声合成软件的用户,有一个推荐的朗读方法。
那就是 AI 音声合成 Web 应用 『Ondoku』!
『Ondoku』 是一款可以免费使用的 AI 音声合成服务。
由于它是通过浏览器使用的 Web 应用,因此在 Windows、Mac、Linux、手机等任何环境下都能轻松朗读。
利用最新 AI 制作真实且清晰易听的朗读语音
『Ondoku』 是利用最新 AI 合成语音的朗读服务。
可以生成清晰且真实的声音,听起来就像真正的解说员或声优在朗读一样。
『Ondoku』 的日语朗读中可用的语音共有 16 种。
免费试听文章朗读软件 Ondoku 的 16 种声音。通过高低变化改变印象|文章朗读软件 Ondoku
Ondoku 拥有 16 种日语语音。当然,男声和女声一应俱全。我们准备了常用的 8 种日语语音,以及调整各语音高低时的样音供您试听。
备有男声、女声、童声等,涵盖了从业务用途到趣味用途的广泛场景。
在 YouTube、Instagram、TikTok 的视频,以及店铺公告等各种用途中都能派上用场。
『Ondoku』 还可以调整音高,或使用多种声音进行对话朗读!
您可以生成心目中的语音,制作出极具魅力的视频音轨。
无需安装,现在就能使用的音声合成服务
为了使用 VOICEVOX,需要从官方网站下载软件并进行安装操作。
安装并使用软件需要具备关于 Windows 或 Mac 等 PC 的相关知识。
此外,首次安装 VOICEVOX 时,需要下载大约 1.5GB 大小的文件。
- 正在使用性能较低或旧款的 PC
- 家里的网络速度较慢
- 只能使用手机热点(Tethering)
像这样,安装 VOICEVOX 可能会有很多困难,对吧?
这种时候推荐使用 『Ondoku』!
『Ondoku』 的使用方法非常简单。
由于 『Ondoku』 只要有浏览器就能立即开始使用,因此完全不需要复杂的设置操作。
只需打开首页就能立即制作语音,即使是初学者也能放心利用。

由于无需下载,在您安装 VOICEVOX 的间隙,就能完成语音的生成和下载了。
『Ondoku』支持多语言。轻松制作面向外国的 YouTube 视频
VOICEVOX 是日语专用的朗读软件。
因此,对于外来语或混有英语的文章,朗读可能会变得不自然。
『Ondoku』 支持日语、英语、韩语、中文、西班牙语、越南语等共计 48 种语言!
外语朗读也非常自然,可以活用在制作 YouTube 的多语言内容上。
除此之外,还可以用于店铺或设施的外语广播、支持多语言的教育内容、全球化企业的演示资料等各种场景。
商用利用时的便利性
商用利用 VOICEVOX 时,必须进行 Credit 表记。
因此,在店铺内的店内广播等难以进行标注的情况下,很多时候会采用在语音中朗读出署名的方式,例如「以上由 VOICEVOX 的 春日部つむぎ 为您播报」。
但是,在企业的官方视频或商品介绍视频中,有时标注 Credit 并不合适,或者由于设计上的限制难以标注,对吧?
这种时候推荐使用 『Ondoku』!
『Ondoku』 支持商用利用,且只要使用付费方案,就不再需要 Credit 表记。
无论是企业利用、商品销售、YouTube 收益化等任何商用用途,都可以自由活用。
Ondoku 能做的事。关于商用利用(业务利用)及禁止事项。|文章朗读软件 Ondoku
Ondoku 允许商用利用(业务利用)。无论个人还是法人,以直接或间接获取金钱等利益为目的的利用均属于商用利用。但请注意,Ondoku 制定了禁止行为。本次将介绍 Ondoku 能做和不能做的事。
由于免费方案也可以仅通过 Credit 表记进行商用利用,因此可以先免费尝试,再考虑付费方案。
要不要先体验一下可以免费使用的『Ondoku』?
如果使用可以免费使用的 AI 朗读服务 『Ondoku』,就无需下载大体积文件,也不需要繁琐的安装操作!
在您想要制作语音的时候,现在就能利用最新 AI 制作朗读语音。
您要不要也先体验一下 『Ondoku』 的 AI 文章朗读呢?
详细讲解 VOICEVOX 的安装方法【Windows11】
接下来,讲解 VOICEVOX 的安装方法和使用方法。
为了使用 VOICEVOX,需要从官方网站下载软件并安装。
首先,以 Windows PC 为例,讲解 VOICEVOX 的安装步骤。
※使用 Windows11 24H2 进行讲解。
VOICEVOX 的下载与安装步骤

首先,访问 VOICEVOX 官方网站,下载安装文件。
在下载界面,可以进行如下选择:
- Windows:GPU版和 CPU版
- Mac:Intel版和 Apple Silicon版
- Linux:GPU版和 CPU版
这次选择 Windows版。

另外,在 Windows版中可以选择安装包(Installer)版和 ZIP 版,通常下载安装包版即可。
※根据 Windows 或 Web 浏览器的安全设置,下载可能会被拦截,这种情况下请允许下载并保存。
下载完成后,开始在 Windows11 上安装。

双击下载的文件,设置向导将启动。

点击「次へ(下一步)」,开始下载设置文件。

※由于总共需要下载大约 1.5GB 的文件,根据网络速度可能需要一些时间。


下载完成后,设置向导将继续。
选择安装目标用户。

选择安装文件夹。
通常会安装在 Windows 的 Program Files 文件夹中。

点击「インストール(安装)」,开始安装。

稍等片刻后安装即可完成。

启动 VOICEVOX
启动 VOICEVOX。
如果在安装最后勾选了「VOICEVOXを実行(执行 VOICEVOX)」,安装完成后会自动启动。
也可以从 Windows 的开始菜单或桌面快捷方式启动。

VOICEVOX 的初始设置
首次启动 VOICEVOX 时,需要同意利用规约。

如果没有问题,点击「同意して利用開始(同意并开始利用)」。
追加角色的介绍画面将打开,点击「完了」。

软件利用情况的数据收集同意画面将打开。

点击「許可(许可)」或「拒否(拒绝)」。
至此初始设置完成。
用于输入文本并朗读语音的操作界面将打开。

VOICEVOX 的基本用法
现在 VOICEVOX 已成功安装在您的 Windows PC 上。
接下来,讲解用于实际将文本转换为语音的基本用法。
基本的语音生成功能用法
打开 VOICEVOX 界面后,会显示角色图标和文本输入栏。

点击文本输入栏(有绿色下划线的部分)。
切换到编辑界面。

输入文本。

按下界面左下角的播放按钮,即可播放语音并确认生成结果。
点击文本输入界面的「+」,可以添加新的文本输入栏。

点击角色图标,将打开角色选择菜单。

默认显示的是「四国めたん」,点击后可以更改为「ずんだもん」、「春日部つむぎ」等喜欢的角色。

通过为多个文本行分别分配不同的角色,还可以制作对话形式的语音。

不过,为了有效地使用此功能,需要了解每个角色的音质差异,并选择合适的组合。
此外,还需要对对话的节奏和停顿进行细致的调整工作,因此在熟练之前需要一定的时间和经验。
VOICEVOX 的语音导出(Writing Out)功能用法
接下来,讲解语音导出功能的使用方法。
「音声を別々に書き出し(分别导出语音)」的用法
要导出语音,
选择「ファイル(文件)」→「音声書き出し(语音导出)」。

选择导出目标文件夹。

随后,语音将按行分开导出。
「音声を繋げて書き出し(连接导出语音)」的用法
在 VOICEVOX 中也可以将语音连接起来导出。
选择「ファイル」→「音声を繋げて書き出し」后,将打开文件保存界面。

输入文件名并保存。

感情风格与参数调整的用法
作为高级用法,VOICEVOX 还具有通过感情风格改变表现的功能。
虽然根据角色的不同而有所差异,但可以使用「标准(ノーマル)」、「甜腻(あまあま)」、「傲娇(ツンツン)」、「性感(セクシー)」、「细语(ささやき)」、「低声(ヒソヒソ)」、「兴奋(興奮)」、「泪眼(なみだめ)」等感情风格。

通过更改感情风格,即使是相同的文本也能生成印象完全不同的语音,因此可以根据内容或演出需要来分别使用。
要更改感情风格,请将鼠标悬停在角色选择菜单右侧的「>」上。
会显示备选项,点击即可选择。
此外,还可以分别调整 Accent、Intonation、长度这三个参数。
Accent 的编辑:

Intonation 的编辑:

长度的编辑:

各项目可在界面左下角进行切换。
每一项都可以以每个音为单位进行调整,能够以更真实的读音进行朗读。
【重要】关于 VOICEVOX 的商用利用:规约确认至关重要

以商用目的使用 VOICEVOX 时需要注意规约。
必须正确理解利用规约,并进行适当的署名标注(Credit 表记)。
接下来,详细讲解以正确方式商用利用 VOICEVOX 的重要点。
基本的商用利用规则
在使用由 VOICEVOX 生成的语音时,无论商用利用还是非商用利用,都需要进行适当的署名标注。
标注时,需要能看出使用了 VOICEVOX 以及使用了哪个角色。
例如,使用 ずんだもん 的语音时标注为「VOICEVOX:ずんだもん」,使用 四国めたん 的语音时标注为「VOICEVOX:四国めたん」。
用于 YouTube 等视频时,记载在视频的介绍栏或视频内。
如果是电话语音等只有语音作为署名手段的情况,则在语音中插入如「使用了 VOICEVOX 的 春日部つむぎ」之类的语音署名。
VOICEVOX 不同角色的利用限制
VOICEVOX 的角色分别设定了不同的利用规约。
部分角色存在特殊的限制。
虽然多数角色通过适当的署名标注即可商用利用,但其中也存在对商用利用有限制的角色。
东北项目(Tohoku Project)相关的角色(ずんだもん、东北きりたん、东北イタコ等)基本上可以商用利用,但禁止用于政治性内容或成人内容。
在某些角色中,可能禁止在联盟行销(Affiliate)网站上利用,或禁止将其作为原创角色的声音使用。
如果计划商用利用,预先确认预定使用的角色的个别利用规约是非常重要的。
视频中使用立绘时也要注意插画的授权
此外,在以「ずんだもん」为首的角色视频中使用立绘时,也要注意插画的利用规约。
插画设定了与 VOICEVOX 软件及角色本身不同的利用规约。
需要预先对插画的利用规约也进行检查。
授权体系复杂,事前确认非常重要
VOICEVOX 在商用利用中特别需要注意的是,每个角色都存在不同的授权体系。
由于各角色的利用条件大不相同,在使用多个角色时,需要分别对各自的利用规约进行个别确认。
特别是东北项目相关角色与其他原创角色的利用规约不同,需要注意。
此外,未来添加新角色时,也有可能设定不同的利用规约。
如果考虑在企业利用,有时需要法务部门确认,到开始利用可能需要一些时间。
正是因为这样复杂的授权体系,在商务用途或 YouTube 收益化等想要商用利用时,确认利用规约会成为很大的负担。
要不要试试用『Ondoku』进行免费朗读?
至此,我们详细讲解了 VOICEVOX 的特点、Windows 的安装方法及使用方法。
但是,下载和安装不仅耗时,利用规约有时也因复杂而难以使用,对吧?
这种时候,推荐使用操作简便的多功能音声合成服务 『Ondoku』!
『Ondoku』 是一款可以免费利用的在线 AI 朗读服务。
竟然只需注册邮箱地址,就能免费进行 5,000 字的音声合成!
支持 Windows、Mac、Linux 以及手机使用,可用于商务、教育、娱乐等任何用途。
由于支持商用利用,因此也支持 YouTube 收益化!
使用方法也非常简单!
无需安装即可从浏览器立即利用,想用的时候就能马上制作出高品质的语音!
即使是正在下载 VOICEVOX 安装文件的用户,要不要也在此期间体验一下 『Ondoku』?
利用高品质 AI 语音进行多语言朗读
『Ondoku』 的 16 种日语语音涵盖了男声、女声、童声等,种类非常丰富!
免费试听文章朗读软件 Ondoku 的 16 种声音。通过高低变化改变印象|文章朗读软件 Ondoku
Ondoku 拥有 16 种日语语音。当然,男声和女声一应俱全。我们准备了常用的 8 种日语语音,以及调整各语音高低时的样音供您试听。
当然也支持使用多种语音的对话朗读。
『Ondoku』 支持日语、英语、中文、韩语、西班牙语、法语、德语等约 50 种语言。
由于可以制作全球化的内容,您可以以世界为目标来增加 YouTube 的播放量哦。
无需安装·下载,现在就能利用!
『Ondoku』 的使用方法非常简单。
打开首页后,只需输入文本并按下朗读按钮即可!
数秒内即可生成自然的语音文件。
由于 5,000 字以内的音声合成可以免费利用,首先何不来体验一下 『Ondoku』 呢?
要不要尝试用支持商用的最新 AI 制作真实的朗读语音?
在这篇文章中,我们详细讲解了 VOICEVOX 的特点、Windows 上的安装方法及使用方法。
VOICEVOX 最大的魅力在于可以使用以「ずんだもん」为首的著名角色制作视频。
但其下载、安装以及利用规约等使用上的难点也不少。
如果您想利用最新的 AI 对文章进行朗读,也推荐 Web 服务 『Ondoku』。
您要不要也来试试用无需下载、即刻可用的 『Ondoku』 来制作视频语音呢?
■ AI语音合成软件“Ondoku”
“Ondoku”是一种在线文本转语音工具,无需初始费用即可使用。
- 支持日语、英语、中文、韩语、西班牙语、法语、德语等约50种语言。
- PC 和智能手机均可使用
- 适用于商务、教育、娱乐等。
- 无需安装,可从浏览器立即使用
- 还支持从图像中读出
要使用它,只需输入文本或从网站上传文件即可。 在几秒钟内生成自然的声音文件。 您可以免费使用最多 5,000 个字符的语音合成,因此请先尝试一下。
Email: ondoku3.com@gmail.com
