
克隆品牌音色
从样本克隆一致的品牌或主播音色,跨内容复用。
Resemble AI Chatterbox——从样本克隆一个声音,用 20+ 种语言朗读文本。
一次充值积分,通用所有模型,想用再用。 · 按需充值,不存在月度清零。
Powered by Resemble AI's API on ZOOOP
提供一段参考音频样本,Chatterbox 用这个克隆音色朗读你的文本。
跨 20 多种语言朗读——英语、中文、日语、韩语、西班牙语、法语、德语、阿拉伯语、印地语等。
调 exaggeration 和 temperature,塑造表演有多富表现力、多多变。
基于 Resemble AI 的音色克隆栈。

从样本克隆一致的品牌或主播音色,跨内容复用。

让同一克隆音色跨 20+ 种语言朗读,做本地化内容。

提高 exaggeration 做更活泼的朗读,或保持低值做稳定语气。

先生成克隆语音,再用它驱动 Kling Avatar V2 这类数字人模型。
按需求挑语音模型。积分在 ZOOOP 上所有模型通用。
从本页或音频工具里选中 Chatterbox TTS Multilingual。
上传一段参考音色样本并粘贴文本。
选语言;按需调 exaggeration 和 temperature。
生成,然后下载或发送到画布。
Chatterbox TTS Multilingual 是 Resemble AI 的音色克隆模型:提供一段参考音频样本,它用这个克隆音色朗读你的文本。不像预设音色的 TTS 模型,它复现一个特定的声音——品牌主播、一个角色,或你自己的——这正是"对某个特定声音保持一致"比"从音色库里挑"更重要时的关键。
它的突出点是范围:克隆音色能跨 20 多种语言朗读——英语、中文、日语、韩语、西班牙语、法语、德语、阿拉伯语、印地语等——所以一个克隆音色就能承载本地化内容。两个控制,exaggeration 和 temperature,塑造表演有多富表现力、多多变。
它在 ZOOOP 语音模型里的位置:Index TTS 2 是带精细情绪控制的音色克隆;LUX TTS 是最便宜的克隆;要预设音色就用 Multilingual V3 或别的 TTS 模型。Chatterbox 的甜点区是从样本做多语种音色克隆。
一个合理的心理模型:需要一个特定克隆音色跨多种语言时,默认选 Chatterbox,要情绪控制就换 Index TTS 2,不需要克隆就用预设音色的 TTS。
一段该声音的参考音频样本。然后它用这个克隆音色朗读你的文本。
20 多种,包括英语、中文、日语、韩语、西班牙语、法语、德语、阿拉伯语、印地语。
exaggeration 塑造表演有多富表现力;temperature 控制它多多变还是多一致。
克隆从你的样本复现一个特定声音,而不是从固定音色库里选。要预设音色,用 Multilingual V3 这类 TTS 模型。
Audio Reference*
Text*
Language of Audio Reference*
Exaggeration*
Temperature*
每 1000 字符为一个计费单位