
情感角色语音
克隆角色语音,为每句台词调节精确的情感混合。
Bilibili 的 Index TTS 2 — 语音克隆,八种情感精细控制。
一次充值積分,通用所有模型,想用再用。 · 按需充值,不存在月度清零。
Powered by Bilibili Index's API on ZOOOP
提供参考音频样本,Index TTS 2 用克隆的语音说出你的文本。
单独调节开心、愤怒、悲伤、恐惧、厌恶、忧郁、惊讶和平静——混合情感以精确塑造台词的朗读方式。
独立设置每种情感的强度,实现细腻、层次分明的表达。
基于 Bilibili Index 语音模型构建。

克隆角色语音,为每句台词调节精确的情感混合。

设置愤怒、恐惧或忧郁的强度以匹配戏剧场景。

用可控的情感范围再现一致的语音。

生成克隆的、带情感控制的语音,然后用它驱动头像模型。
选择合适的语音模型。您的积分在 ZOOOP 上通用。
从本页打开 Index TTS 2 或在音频工具中选择。
上传参考语音样本并粘贴文本。
设置每种情感的强度以塑造表达。
生成后下载或发送到画布。
Index TTS 2 是 Bilibili 的语音克隆模型,具有独特优势:八种情感的精细控制。提供参考样本克隆语音,然后单独设置开心、愤怒、悲伤、恐惧、厌恶、忧郁、惊讶和平静的强度——以精确塑造每句台词的朗读方式。因为情感可以混合,你可以叠加微妙的组合而不是选择单一预设感觉,这适合表演性叙述和戏剧对话。
克隆端从你的样本复制特定语音,所以同一角色或品牌语音可以用可控的情感范围承载脚本。每 1000 个字符计价。
在 ZOOOP 语音模型中的位置:Chatterbox TTS 是为广泛多语言覆盖构建的语音克隆;LUX TTS 是最便宜的克隆;预设语音用 Multilingual V3。Index TTS 2 的甜蜜点是情感细腻的语音克隆。
一个合理的决策模型:克隆语音需要精确情感控制时默认用 Index TTS 2,多语言时切换到 Chatterbox,最低成本时用 LUX TTS。
八种,单独设置:开心、愤怒、悲伤、恐惧、厌恶、忧郁、惊讶和平静。混合它们以精确塑造台词的朗读方式。
语音的参考音频样本。它用克隆的语音和你选择的情感混合说出你的文本。
两者都克隆语音。Index TTS 2 提供精细的八种情感控制;Chatterbox 强调广泛的多语言覆盖。情感细微差别最重要时选 Index TTS 2。
每 1000 个字符。
Audio Reference*
Prompt*
Emotion · Happy*
Emotion · Angry*
Emotion · Sad*
Emotion · Afraid*
Emotion · Disgusted*
Emotion · Melancholic*
Emotion · Surprised*
Emotion · Calm*