Bilibili Index

Index TTS 2

Bilibili 的 Index TTS 2 — 语音克隆,八种情感精细控制。

無需訂閱
積分永不過期
瞭解更多

一次充值積分,通用所有模型,想用再用。 · 按需充值,不存在月度清零。

Powered by Bilibili Index's API on ZOOOP

核心能力

从样本克隆语音

提供参考音频样本,Index TTS 2 用克隆的语音说出你的文本。

八种情感控制

单独调节开心、愤怒、悲伤、恐惧、厌恶、忧郁、惊讶和平静——混合情感以精确塑造台词的朗读方式。

精细表达

独立设置每种情感的强度,实现细腻、层次分明的表达。

Bilibili Index 血统

基于 Bilibili Index 语音模型构建。

使用場景

情感角色语音

情感角色语音

克隆角色语音,为每句台词调节精确的情感混合。

戏剧对话

戏剧对话

设置愤怒、恐惧或忧郁的强度以匹配戏剧场景。

克隆品牌语音

克隆品牌语音

用可控的情感范围再现一致的语音。

驱动说话头像

驱动说话头像

生成克隆的、带情感控制的语音,然后用它驱动头像模型。

如何選對模型

选择合适的语音模型。您的积分在 ZOOOP 上通用。

带情感控制的语音克隆Index TTS 2
多语言语音克隆Chatterbox TTS Multilingual
最便宜的语音克隆LUX TTS
预设语音 TTSMultilingual V3
驱动说话头像Kling Avatar V2
音效和环境音Sound Effects V2

如何使用

01

从本页打开 Index TTS 2 或在音频工具中选择。

02

上传参考语音样本并粘贴文本。

03

设置每种情感的强度以塑造表达。

04

生成后下载或发送到画布。

深入瞭解

Index TTS 2 擅长什么——以及不擅长什么

Index TTS 2 是 Bilibili 的语音克隆模型,具有独特优势:八种情感的精细控制。提供参考样本克隆语音,然后单独设置开心、愤怒、悲伤、恐惧、厌恶、忧郁、惊讶和平静的强度——以精确塑造每句台词的朗读方式。因为情感可以混合,你可以叠加微妙的组合而不是选择单一预设感觉,这适合表演性叙述和戏剧对话。

克隆端从你的样本复制特定语音,所以同一角色或品牌语音可以用可控的情感范围承载脚本。每 1000 个字符计价。

在 ZOOOP 语音模型中的位置:Chatterbox TTS 是为广泛多语言覆盖构建的语音克隆;LUX TTS 是最便宜的克隆;预设语音用 Multilingual V3。Index TTS 2 的甜蜜点是情感细腻的语音克隆。

一个合理的决策模型:克隆语音需要精确情感控制时默认用 Index TTS 2,多语言时切换到 Chatterbox,最低成本时用 LUX TTS。

常見問題

Index TTS 2 可以控制哪些情感?+

八种,单独设置:开心、愤怒、悲伤、恐惧、厌恶、忧郁、惊讶和平静。混合它们以精确塑造台词的朗读方式。

克隆语音需要什么?+

语音的参考音频样本。它用克隆的语音和你选择的情感混合说出你的文本。

它和 Chatterbox TTS 有什么区别?+

两者都克隆语音。Index TTS 2 提供精细的八种情感控制;Chatterbox 强调广泛的多语言覆盖。情感细微差别最重要时选 Index TTS 2。

它怎么计价?+

每 1000 个字符。

更多模型