Zonos 텍스트 음성 변환

20만 시간 이상의 다양한 다국어 음성으로 훈련된 선도적인 오픈웨이트 텍스트 음성 변환 모델로, 표현력과 품질 면에서 최고의 TTS 제공업체와 동등하거나 그 이상의 수준을 제공합니다.

주요 기능

•제로샷 TTS와 음성 복제
•다국어 지원 (영어, 일본어, 중국어, 프랑스어, 독일어)
•오디오 품질 및 감정 제어
•실시간 생성 (RTX 4090에서 2배 속도)

🎁 텍스트 음성 변환 기술의 미래를 경험하세요

음성 플레이그라운드

브라우저에서 직접 Zonos TTS 텍스트 음성 변환의 강력한 기능을 경험하세요. 다양한 음성을 시도하고, 음성 복제를 테스트하며, 고품질 음성을 즉시 생성할 수 있습니다.

~1 크레딧

00:0000:00

Zonos란 무엇인가

Zonos-v0.1은 20만 시간 이상의 다양한 다국어 음성으로 훈련된 선도적인 오픈웨이트 텍스트 음성 변환 모델로, 표현력과 품질 면에서 최고의 TTS 제공업체와 동등하거나 그 이상의 수준을 제공합니다.

제로샷 TTS와 음성 복제
원하는 텍스트와 10-30초의 화자 샘플을 입력하여 정확한 음성 복제 기능을 갖춘 고품질 TTS 출력을 생성합니다.
오디오 접두사 입력
텍스트와 오디오 접두사를 추가하여 더욱 풍부한 화자 매칭과 속삭임과 같이 재현하기 어려운 행동을 구현합니다.
세밀한 제어
말하기 속도, 피치 변화, 오디오 품질, 기쁨, 두려움, 슬픔, 분노 등의 감정을 제어합니다.

장점

Zonos를 선택하는 이유

고급 음성 복제와 감정 제어를 갖춘 고품질 텍스트 음성 변환 생성에 필요한 모든 것을 얻으세요.

몇 초의 참조 오디오만으로도 고도로 자연스러운 음성을 생성하여 전문적인 음성 복제 품질을 달성합니다.

Zonos를 특별하게 만드는 것

Zonos는 고품질, 유연성, 사용 편의성을 결합한 선도적인 오픈웨이트 텍스트 음성 변환 모델입니다.

제로샷 TTS와 음성 복제

원하는 텍스트와 10-30초의 화자 샘플을 입력하여 고품질 TTS 출력을 생성

오디오 접두사 입력

텍스트와 오디오 접두사를 추가하여 더욱 풍부한 화자 매칭을 구현합니다. 오디오 접두사는 속삭임과 같은 행동을 유도하는 데 사용할 수 있습니다

다국어 지원

Zonos-v0.1은 영어, 일본어, 중국어, 프랑스어, 독일어를 지원합니다

오디오 품질 및 감정 제어

말하기 속도, 피치, 최대 주파수, 오디오 품질, 다양한 감정 등 많은 측면의 세밀한 제어

빠른 생성

RTX 4090에서 약 2배의 실시간 팩터(1초의 계산 시간으로 2초의 오디오 생성)로 작동합니다

간단한 설치 및 배포

Zonos는 사용하기 쉬운 Gradio 인터페이스와 함께 제공되며 Docker를 사용하여 간단하게 설치하고 배포할 수 있습니다

고객 후기

사람들이 말하는 것

커뮤니티가 Zonos에 대해 어떻게 생각하는지 확인하세요.

Wow that's very impressive

Zonos is a 100% open source AI model that can clone any voice 🤯

You can basically run it anywhere as it's only 1.6B parameters.

Link belowpic.twitter.com/yztyL46NvN
— Paul Couvert (@itsPaulAi) February 10, 2025

自分の声質でテキストから音声を瞬時に複製できる「Zonos-v0.1」が公開。話す速度や喜怒哀楽を含めた感情も調整可能。つまり音声クローンを創り上げることが出来る。オーディオファイルで学習するので、結論自分の声質以外も学習可能なので、悪用厳禁。詳細はリプ欄へ。 pic.twitter.com/VixYXJXrAG
— みるぼん@スモビジ (@milbon_) February 11, 2025

新发布的最强开源语音模型 Zonos

语音生成质量非常高，而且这次有中文

- 两种1.6B 模型，transformer 和 SSM
- 用5到30秒的语音进行高保真语音克隆
- 可以调节速度，音高，音频质量和情绪
- 添加文本和音频前缀，实现更丰富的说话人匹配效果
-在 RTX 4090 显卡上运行时，实时率约为 2 倍 pic.twitter.com/hF6qa9JqKW
— 歸藏(guizang.ai) (@op7418) February 11, 2025

This is not being talked about enough

Zonos is a new open-source voice AI model that clones any voice in under 10 seconds.

Here is how I made a voice clone of @mreflow ! pic.twitter.com/SDEkAH1HOJ
— AP (@angrypenguinPNG) February 14, 2025

Run ZONOS Locally

ZONOS, the new SOTA Open Source Voice Cloning TTS, is here.

I've managed to write a 1-click launcher for Zonos that works on Mac, Windows, and Linux (ALL platforms!)

Here's me cloning Peter Griffin's voice on my Mac. https://t.co/XLB6NEU8gE pic.twitter.com/nQcVtXE4P
— cocktail peanut (@cocktailpeanut) February 15, 2025

What the heck, this is an AI-generated voice and open source too under Apache 2.0 license. Damn! 🔥🔥

Zonos Beta is a new open-source highly expressive TTS model with high-fidelity voice cloning from @ZyphraAI

Try it here 👇pic.twitter.com/GGn877CzGp
— AshutoshShrivastava (@ai_for_success) February 10, 2025

자주 묻는 질문

Zonos에 대한 자주 묻는 질문

다른 질문이 있으신가요? 이메일로 문의해 주세요.

시스템 요구사항은 무엇인가요?

Zonos는 Linux(권장 Ubuntu 22.04/24.04) 또는 macOS, 6GB+ VRAM을 가진 GPU가 필요합니다. 하이브리드 모델은 추가로 3000 시리즈 이상의 Nvidia GPU가 필요합니다. Zonos는 CPU에서도 실행할 수 있지만 훨씬 느려집니다.

Windows에서 Zonos를 실행할 수 있나요?

실험적 Windows 지원을 위해서는 Zonos의 Windows 포크를 확인하세요. 하지만 최고의 경험을 위해서는 Linux 또는 macOS가 권장됩니다.

Zonos를 어떻게 시작하나요?

온라인 데모로 브라우저에서 직접 Zonos를 시도하거나 pip 또는 docker로 로컬에 설치할 수 있습니다. 자세한 설치 및 사용 지침은 문서를 확인하세요.

Zonos는 어떤 언어를 지원하나요?

Zonos는 현재 영어, 일본어, 중국어, 프랑스어, 독일어를 지원합니다. 더 많은 언어 지원을 추가하기 위해 지속적으로 노력하고 있습니다.

음성 복제는 어떻게 작동하나요?

Zonos는 단 몇 초의 오디오(권장 10-30초)에서 음성을 복제할 수 있습니다. 텍스트와 함께 참조 오디오 클립을 제공하기만 하면 Zonos가 해당 음성으로 음성을 생성합니다.

Zonos를 시도할 준비가 되셨나요?

오픈소스 텍스트 음성 변환의 강력함을 경험하세요.