Chatterbox 克隆声音需要什么?

一段该声音的参考音频样本。然后它用这个克隆音色朗读你的文本。

它支持哪些语言?

20 多种,包括英语、中文、日语、韩语、西班牙语、法语、德语、阿拉伯语、印地语。

exaggeration 和 temperature 有什么用?

exaggeration 塑造表演有多富表现力;temperature 控制它多多变还是多一致。

音色克隆和挑预设音色有什么不同?

克隆从你的样本复现一个特定声音,而不是从固定音色库里选。要预设音色,用 Multilingual V3 这类 TTS 模型。

ZOOOP 上的 Chatterbox TTS Multilingual — 多语种音色克隆

Chatterbox TTS Multilingual 擅长什么——又不擅长什么

Chatterbox TTS Multilingual 是 Resemble AI 的音色克隆模型:提供一段参考音频样本,它用这个克隆音色朗读你的文本。不像预设音色的 TTS 模型,它复现一个特定的声音——品牌主播、一个角色,或你自己的——这正是"对某个特定声音保持一致"比"从音色库里挑"更重要时的关键。

它的突出点是范围:克隆音色能跨 20 多种语言朗读——英语、中文、日语、韩语、西班牙语、法语、德语、阿拉伯语、印地语等——所以一个克隆音色就能承载本地化内容。两个控制,exaggeration 和 temperature,塑造表演有多富表现力、多多变。

它在 ZOOOP 语音模型里的位置:Index TTS 2 是带精细情绪控制的音色克隆;LUX TTS 是最便宜的克隆;要预设音色就用 Multilingual V3 或别的 TTS 模型。Chatterbox 的甜点区是从样本做多语种音色克隆。

一个合理的心理模型:需要一个特定克隆音色跨多种语言时,默认选 Chatterbox,要情绪控制就换 Index TTS 2,不需要克隆就用预设音色的 TTS。

Chatterbox TTS Multilingual

Chatterbox TTS Multilingual

核心能力

从样本克隆音色

20+ 种语言

表现力控制

Resemble AI 血统

使用场景

克隆品牌音色

多语种克隆旁白

富表现力表演

驱动说话数字人

如何选对模型

如何使用

深入了解

Chatterbox TTS Multilingual 擅长什么——又不擅长什么

常见问题

更多模型

Chatterbox TTS Multilingual