Zonos Преобразование текста в речь
Ведущая модель преобразования текста в речь с открытыми весами, обученная на более чем 200 000 часов разнообразной многоязычной речи, обеспечивающая выразительность и качество на уровне или даже превосходящая ведущих поставщиков TTS.
Ключевые функции
- •TTS с нулевым выстрелом и клонированием голоса
- •Многоязычная поддержка (EN, JP, CN, FR, DE)
- •Контроль качества аудио и эмоций
- •Генерация в реальном времени (2x скорость на RTX 4090)
🎁 Испытайте будущее технологии преобразования текста в речь

Попробовать Zonos онлайн
Испытайте мощь Zonos преобразования текста в речь прямо в браузере. Установка не требуется.

Что такое Zonos
Zonos-v0.1 - это ведущая модель преобразования текста в речь с открытыми весами, обученная на более чем 200 000 часов разнообразной многоязычной речи, обеспечивающая выразительность и качество на уровне или даже превосходящая ведущих поставщиков TTS.
- TTS с нулевым выстрелом и клонированием голосаВведите желаемый текст и 10-30-секундный образец говорящего для генерации высококачественного TTS-вывода с точными возможностями клонирования голоса.
- Аудио-префиксные входыДобавьте текст плюс аудио-префикс для еще более богатого сопоставления говорящих и поведения, такого как шепот, которое трудно воспроизвести.
- Точный контрольКонтролируйте скорость речи, вариации высоты тона, качество аудио и эмоции, такие как радость, страх, грусть и гнев.
Почему выбирают Zonos
Получите все необходимое для высококачественной генерации преобразования текста в речь с продвинутым клонированием голоса и контролем эмоций.



Что делает Zonos особенным
Zonos - это ведущая модель преобразования текста в речь с открытыми весами, которая сочетает высокое качество, гибкость и простоту использования.
TTS с нулевым выстрелом и клонированием голоса
Введите желаемый текст и 10-30-секундный образец говорящего для генерации высококачественного TTS-вывода
Аудио-префиксные входы
Добавьте текст плюс аудио-префикс для еще более богатого сопоставления говорящих. Аудио-префиксы могут использоваться для вызова поведения, такого как шепот
Многоязычная поддержка
Zonos-v0.1 поддерживает английский, японский, китайский, французский и немецкий языки
Контроль качества аудио и эмоций
Точный контроль многих аспектов, включая скорость речи, высоту тона, максимальную частоту, качество аудио и различные эмоции
Быстрая генерация
Наша модель работает с фактором реального времени ~2x на RTX 4090 (генерирует 2 секунды аудио за 1 секунду времени вычислений)
Простая установка и развертывание
Zonos поставляется с простым в использовании интерфейсом Gradio и может быть легко установлен и развернут с помощью Docker
Что говорят люди
Посмотрите, что сообщество думает о Zonos.
Wow that's very impressive
— Paul Couvert (@itsPaulAi) February 10, 2025
Zonos is a 100% open source AI model that can clone any voice 🤯
You can basically run it anywhere as it's only 1.6B parameters.
Link belowpic.twitter.com/yztyL46NvN
自分の声質でテキストから音声を瞬時に複製できる「Zonos-v0.1」が公開。話す速度や喜怒哀楽を含めた感情も調整可能。つまり音声クローンを創り上げることが出来る。オーディオファイルで学習するので、結論自分の声質以外も学習可能なので、悪用厳禁。詳細はリプ欄へ。 pic.twitter.com/VixYXJXrAG
— みるぼん@スモビジ (@milbon_) February 11, 2025
新发布的最强开源语音模型 Zonos
— 歸藏(guizang.ai) (@op7418) February 11, 2025
语音生成质量非常高,而且这次有中文
- 两种1.6B 模型,transformer 和 SSM
- 用5到30秒的语音进行高保真语音克隆
- 可以调节速度,音高,音频质量和情绪
- 添加文本和音频前缀,实现更丰富的说话人匹配效果
-在 RTX 4090 显卡上运行时,实时率约为 2 倍 pic.twitter.com/hF6qa9JqKW
This is not being talked about enough
— AP (@angrypenguinPNG) February 14, 2025
Zonos is a new open-source voice AI model that clones any voice in under 10 seconds.
Here is how I made a voice clone of @mreflow ! pic.twitter.com/SDEkAH1HOJ
Run ZONOS Locally
— cocktail peanut (@cocktailpeanut) February 15, 2025
ZONOS, the new SOTA Open Source Voice Cloning TTS, is here.
I've managed to write a 1-click launcher for Zonos that works on Mac, Windows, and Linux (ALL platforms!)
Here's me cloning Peter Griffin's voice on my Mac. https://t.co/XLB6NEU8gE pic.twitter.com/nQcVtXE4P
What the heck, this is an AI-generated voice and open source too under Apache 2.0 license. Damn! 🔥🔥
— AshutoshShrivastava (@ai_for_success) February 10, 2025
Zonos Beta is a new open-source highly expressive TTS model with high-fidelity voice cloning from @ZyphraAI
Try it here 👇pic.twitter.com/GGn877CzGp
Часто задаваемые вопросы о Zonos
У вас есть другой вопрос? Свяжитесь с нами по электронной почте.
Какие системные требования?
Zonos требует Linux (предпочтительно Ubuntu 22.04/24.04) или macOS, и GPU с 6GB+ VRAM. Гибридная модель дополнительно требует GPU Nvidia серии 3000 или новее. Zonos также может работать на CPU, но будет значительно медленнее.
Могу ли я запустить Zonos на Windows?
Для экспериментальной поддержки Windows проверьте Windows-форк Zonos. Однако для лучшего опыта рекомендуется Linux или macOS.
Как начать с Zonos?
Вы можете попробовать Zonos прямо в браузере с нашей онлайн-демо или установить его локально с помощью pip или docker. Проверьте нашу документацию для подробных инструкций по установке и использованию.
Какие языки поддерживает Zonos?
Zonos в настоящее время поддерживает английский, японский, китайский, французский и немецкий языки. Мы постоянно работаем над добавлением поддержки для большего количества языков.
Как работает клонирование голоса?
Zonos может клонировать голос всего за несколько секунд аудио (рекомендуется 10-30 секунд). Просто предоставьте референсный аудио-клип вместе с вашим текстом, и Zonos сгенерирует речь этим голосом.
Готовы попробовать Zonos?
Испытайте мощь открытого исходного кода преобразования текста в речь.