Zonos 文本转语音

一款领先的开源文本转语音模型,经过20万小时多语言语音数据训练,表现力和质量可与顶级TTS服务相媲美甚至超越。

核心特点:

  • 零样本声音克隆
  • 多语言支持(英语、日语、中文、法语、德语)
  • 音频质量和情感控制
  • 实时生成(RTX 4090上2倍速)
Zonos Architecture Diagram

在线体验 Zonos

直接在浏览器中体验 Zonos 文本转语音的强大功能,无需安装。

功能特点

Zonos 的与众不同

Zonos 是一款领先的开源文本转语音模型,完美结合了高质量、灵活性和易用性。

零样本声音克隆

只需输入目标文本和10-30秒的说话者样本,即可生成高质量的语音输出

音频前缀输入

通过添加文本和音频前缀实现更丰富的说话者匹配,音频前缀可用于触发如耳语等特殊效果

多语言支持

Zonos-v0.1 支持英语、日语、中文、法语和德语

音频质量和情感控制

精细控制多个方面,包括语速、音调、最大频率、音频质量和各种情感表现

快速生成

在 RTX 4090 上实现约2倍实时生成速度(1秒计算时间可生成2秒音频)

简单安装和部署

Zonos 配备易用的 gradio 界面,可通过 docker 简单安装和部署

人们怎么评价

看看社区对 Zonos 的看法

常见问题

常见问题解答

还有问题?给我们发邮件: support@zonos.online

准备体验 Zonos 了吗?

体验开源文本转语音的强大功能。