Index TTS 2 可以控制哪些情感？

八種，單獨設置：開心、憤怒、悲傷、恐懼、厭惡、憂鬱、驚訝和平靜。混合它們以精確塑造台詞的朗讀方式。

複製語音需要什麼？

語音的參考音訊樣本。它用複製的語音和你選擇的情感混合說出你的文字。

它和 Chatterbox TTS 有什麼區別？

兩者都複製語音。Index TTS 2 提供精細的八種情感控制；Chatterbox 強調廣泛的多語言覆蓋。情感細微差別最重要時選 Index TTS 2。

ZOOOP 上的 Index TTS 2 — 帶情感控制的語音複製

Index TTS 2 擅長什麼——以及不擅長什麼

Index TTS 2 是 Bilibili 的語音複製模型，具有獨特優勢：八種情感的精細控制。提供參考樣本複製語音，然後單獨設置開心、憤怒、悲傷、恐懼、厭惡、憂鬱、驚訝和平靜的強度——以精確塑造每句台詞的朗讀方式。因為情感可以混合，你可以疊加微妙的組合而不是選擇單一預設感覺，這適合表演性敘述和戲劇對話。

複製端從你的樣本複製特定語音，所以同一角色或品牌語音可以用可控的情感範圍承載腳本。每 1000 個字元計價。

在 ZOOOP 語音模型中的位置：Chatterbox TTS 是為廣泛多語言覆蓋構建的語音複製；LUX TTS 是最便宜的複製；預設語音用 Multilingual V3。Index TTS 2 的甜蜜點是情感細膩的語音複製。

一個合理的決策模型：複製語音需要精確情感控制時預設用 Index TTS 2，多語言時切換到 Chatterbox，最低成本時用 LUX TTS。

Index TTS 2

Index TTS 2

核心能力

從樣本複製語音

八種情感控制

精細表達

Bilibili Index 血統

使用場景

情感角色語音

戲劇對話

複製品牌語音

驅動說話頭像

如何選對模型

如何使用

深入瞭解

Index TTS 2 擅長什麼——以及不擅長什麼

常見問題

更多模型

Index TTS 2