Zonos テキスト読み上げ

20万時間以上の多言語音声でトレーニングされた最先端のオープンウェイトテキスト読み上げモデルで、表現力と品質においてトップTTSプロバイダーに匹敵し、さらには凌駕します。

主要機能

•ゼロショットTTSと音声クローニング
•多言語サポート（英語、日本語、中国語、フランス語、ドイツ語）
•音声品質と感情制御
•リアルタイム生成（RTX 4090で2倍速度）

🎁 テキスト読み上げ技術の未来を体験

音声プレイグラウンド

ブラウザで直接 Zonos TTS テキスト読み上げのパワーを体験してください。さまざまな声を試したり、音声クローニングをテストしたり、高品質な音声を即座に生成できます。

~1 クレジット

00:0000:00

Zonosとは

Zonos-v0.1は、20万時間以上の多言語音声でトレーニングされた最先端のオープンウェイトテキスト読み上げモデルで、表現力と品質においてトップTTSプロバイダーに匹敵し、さらには凌駕します。

ゼロショットTTSと音声クローニング
希望するテキストと10-30秒の話者サンプルを入力して、正確な音声クローニング機能を持つ高品質TTS出力を生成。
音声プレフィックス入力
テキストと音声プレフィックスを追加して、より豊富な話者マッチングと、ささやきなど再現が困難な行動を実現。
細かい制御
話速、ピッチ変動、音声品質、喜び、恐れ、悲しみ、怒りなどの感情を制御。

利点

Zonosを選ぶ理由

高度な音声クローニングと感情制御を備えた高品質テキスト読み上げ生成に必要なすべてを入手。

わずか数秒の参照音声で高度に自然な音声を生成し、プロフェッショナル品質の音声クローニングを実現。

Zonosの特別な点

Zonosは、高品質、柔軟性、使いやすさを組み合わせた最先端のオープンウェイトテキスト読み上げモデルです。

ゼロショットTTSと音声クローニング

希望するテキストと10-30秒の話者サンプルを入力して高品質TTS出力を生成

音声プレフィックス入力

テキストと音声プレフィックスを追加して、より豊富な話者マッチングを実現。音声プレフィックスはささやきなどの行動を引き出すために使用可能

多言語サポート

Zonos-v0.1は英語、日本語、中国語、フランス語、ドイツ語をサポート

音声品質と感情制御

話速、ピッチ、最大周波数、音声品質、様々な感情など、多くの側面の細かい制御

高速生成

RTX 4090で約2倍のリアルタイムファクター（1秒の計算時間で2秒の音声を生成）で動作

簡単なインストールとデプロイ

Zonosは使いやすいGradioインターフェースを備えており、Dockerで簡単にインストールとデプロイが可能

お客様の声

人々が言っていること

コミュニティがZonosについてどう思っているかを見てください。

Wow that's very impressive

Zonos is a 100% open source AI model that can clone any voice 🤯

You can basically run it anywhere as it's only 1.6B parameters.

Link belowpic.twitter.com/yztyL46NvN
— Paul Couvert (@itsPaulAi) February 10, 2025

自分の声質でテキストから音声を瞬時に複製できる「Zonos-v0.1」が公開。話す速度や喜怒哀楽を含めた感情も調整可能。つまり音声クローンを創り上げることが出来る。オーディオファイルで学習するので、結論自分の声質以外も学習可能なので、悪用厳禁。詳細はリプ欄へ。 pic.twitter.com/VixYXJXrAG
— みるぼん@スモビジ (@milbon_) February 11, 2025

新发布的最强开源语音模型 Zonos

语音生成质量非常高，而且这次有中文

- 两种1.6B 模型，transformer 和 SSM
- 用5到30秒的语音进行高保真语音克隆
- 可以调节速度，音高，音频质量和情绪
- 添加文本和音频前缀，实现更丰富的说话人匹配效果
-在 RTX 4090 显卡上运行时，实时率约为 2 倍 pic.twitter.com/hF6qa9JqKW
— 歸藏(guizang.ai) (@op7418) February 11, 2025

This is not being talked about enough

Zonos is a new open-source voice AI model that clones any voice in under 10 seconds.

Here is how I made a voice clone of @mreflow ! pic.twitter.com/SDEkAH1HOJ
— AP (@angrypenguinPNG) February 14, 2025

Run ZONOS Locally

ZONOS, the new SOTA Open Source Voice Cloning TTS, is here.

I've managed to write a 1-click launcher for Zonos that works on Mac, Windows, and Linux (ALL platforms!)

Here's me cloning Peter Griffin's voice on my Mac. https://t.co/XLB6NEU8gE pic.twitter.com/nQcVtXE4P
— cocktail peanut (@cocktailpeanut) February 15, 2025

What the heck, this is an AI-generated voice and open source too under Apache 2.0 license. Damn! 🔥🔥

Zonos Beta is a new open-source highly expressive TTS model with high-fidelity voice cloning from @ZyphraAI

Try it here 👇pic.twitter.com/GGn877CzGp
— AshutoshShrivastava (@ai_for_success) February 10, 2025

よくある質問

Zonosに関するよくある質問

他に質問がありますか？メールでお問い合わせください。

システム要件は何ですか？

ZonosはLinux（推奨Ubuntu 22.04/24.04）またはmacOS、6GB+ VRAMを備えたGPUが必要です。ハイブリッドモデルはさらに3000シリーズ以降のNvidia GPUが必要です。ZonosはCPUでも動作しますが、大幅に遅くなります。

WindowsでZonosを実行できますか？

実験的なWindowsサポートについては、ZonosのWindowsフォークをご確認ください。ただし、最高の体験のためにはLinuxまたはmacOSが推奨されます。

Zonosの使い方を教えてください

オンラインデモでブラウザで直接Zonosを試すか、pipまたはdockerでローカルにインストールできます。詳細なインストールと使用方法についてはドキュメントをご確認ください。

Zonosはどの言語をサポートしていますか？

Zonosは現在英語、日本語、中国語、フランス語、ドイツ語をサポートしています。より多くの言語のサポートを追加するために継続的に取り組んでいます。

音声クローニングはどのように動作しますか？

Zonosはわずか数秒の音声（推奨10-30秒）から音声をクローンできます。テキストと一緒に参照音声クリップを提供するだけで、Zonosはその音声で音声を生成します。

Zonosを試す準備はできていますか？

オープンソーステキスト読み上げのパワーを体験してください。