Zonos Text-zu-Sprache
Ein führendes Open-Source-Text-zu-Sprache-Modell, trainiert mit über 200.000 Stunden mehrsprachiger Sprache, das eine Ausdruckskraft und Qualität bietet, die den führenden TTS-Anbietern ebenbürtig oder sogar überlegen ist.
Hauptmerkmale:
- Zero-Shot-Stimmklonen
- Mehrsprachige Unterstützung (EN, JP, CN, FR, DE)
- Audioqualität und Emotionskontrolle
- Echtzeit-Generierung (2x Geschwindigkeit auf RTX 4090)

Testen Sie Zonos online
Erleben Sie die Leistung von Zonos direkt in Ihrem Browser. Keine Installation erforderlich.
Funktionen
Was Zonos besonders macht
Zonos ist ein führendes Open-Source-Text-zu-Sprache-Modell, das hohe Qualität, Flexibilität und Benutzerfreundlichkeit vereint.
Zero-Shot-Stimmklonen
Geben Sie den gewünschten Text und eine 10-30s Sprecherprobe ein, um hochwertige TTS-Ausgabe zu generieren
Audio-Präfix-Eingaben
Fügen Sie Text und einen Audio-Präfix für noch reichhaltigeres Sprecher-Matching hinzu. Audio-Präfixe können für Verhaltensweisen wie Flüstern verwendet werden
Mehrsprachige Unterstützung
Zonos-v0.1 unterstützt Englisch, Japanisch, Chinesisch, Französisch und Deutsch
Audioqualität und Emotionskontrolle
Feingranulare Kontrolle vieler Aspekte einschließlich Sprechgeschwindigkeit, Tonhöhe, maximale Frequenz, Audioqualität und verschiedene Emotionen
Schnelle Generierung
Unser Modell läuft mit einem Echtzeitfaktor von ~2x auf einer RTX 4090 (generiert 2 Sekunden Audio pro 1 Sekunde Rechenzeit)
Einfache Installation und Bereitstellung
Zonos wird mit einer benutzerfreundlichen Gradio-Oberfläche geliefert und kann einfach mit Docker installiert und bereitgestellt werden
Was andere sagen
Sehen Sie, was die Community über Zonos denkt
Wow that's very impressive
— Paul Couvert (@itsPaulAi) February 10, 2025
Zonos is a 100% open source AI model that can clone any voice 🤯
You can basically run it anywhere as it's only 1.6B parameters.
Link belowpic.twitter.com/yztyL46NvN
自分の声質でテキストから音声を瞬時に複製できる「Zonos-v0.1」が公開。話す速度や喜怒哀楽を含めた感情も調整可能。つまり音声クローンを創り上げることが出来る。オーディオファイルで学習するので、結論自分の声質以外も学習可能なので、悪用厳禁。詳細はリプ欄へ。 pic.twitter.com/VixYXJXrAG
— みるぼん@スモビジ (@milbon_) February 11, 2025
新发布的最强开源语音模型 Zonos
— 歸藏(guizang.ai) (@op7418) February 11, 2025
语音生成质量非常高,而且这次有中文
- 两种1.6B 模型,transformer 和 SSM
- 用5到30秒的语音进行高保真语音克隆
- 可以调节速度,音高,音频质量和情绪
- 添加文本和音频前缀,实现更丰富的说话人匹配效果
-在 RTX 4090 显卡上运行时,实时率约为 2 倍 pic.twitter.com/hF6qa9JqKW
This is not being talked about enough
— AP (@angrypenguinPNG) February 14, 2025
Zonos is a new open-source voice AI model that clones any voice in under 10 seconds.
Here is how I made a voice clone of @mreflow ! pic.twitter.com/SDEkAH1HOJ
Run ZONOS Locally
— cocktail peanut (@cocktailpeanut) February 15, 2025
ZONOS, the new SOTA Open Source Voice Cloning TTS, is here.
I've managed to write a 1-click launcher for Zonos that works on Mac, Windows, and Linux (ALL platforms!)
Here's me cloning Peter Griffin's voice on my Mac. https://t.co/XLB6NEU8gE pic.twitter.com/nQ1cVtXE4P
What the heck, this is an AI-generated voice and open source too under Apache 2.0 license. Damn! 🔥🔥
— AshutoshShrivastava (@ai_for_success) Febr /uary 10, 2025
Zonos Beta is a new open-source highly expressive TTS model with high-fidelity voice cloning from @ZyphraAI
Try it here 👇pic.twitter.com/GGn877CzGp