
Voz de personaje emocional
Clona una voz de personaje y ajusta la mezcla emocional exacta para cada línea.
El Index TTS 2 de Bilibili — clonación de voz con control fino sobre ocho emociones.
Paga una vez por los créditos: utilízalos en todos los modelos en ZOOOP. · Recarga cuando lo necesites, sin quemaduras mensuales.
Powered by Bilibili Index's API on ZOOOP
Proporciona una muestra de audio de referencia y Index TTS 2 habla tu texto en esa voz clonada.
Ajusta individualmente feliz, enfadado, triste, con miedo, con asco, melancólico, sorprendido y tranquilo — mezcla emociones para dar forma exacta a cómo se lee una línea.
Establece la fuerza de cada emoción independientemente para una expresión matizada y en capas.
Construido sobre el modelo de voz Bilibili Index.

Clona una voz de personaje y ajusta la mezcla emocional exacta para cada línea.

Establece las fuerzas de enfado, miedo o melancolía para coincidir con una escena dramática.

Reproduce una voz consistente con rango emocional controlable.

Genera la voz clonada con control emocional, luego conduce un modelo de avatar con ella.
Elige el modelo de voz adecuado. Tus créditos funcionan en todo ZOOOP.
Abre Index TTS 2 desde esta página o selecciónalo en las herramientas de Audio.
Sube una muestra de voz de referencia y pega tu texto.
Establece la fuerza de cada emoción para dar forma a la entrega.
Genera, luego descarga o envía el audio a tu canvas.
Index TTS 2 es el modelo de clonación de voz de Bilibili con una fortaleza distintiva : control fino sobre ocho emociones. Proporciona una muestra de referencia para clonar una voz, luego establece la fuerza de feliz, enfadado, triste, con miedo, con asco, melancólico, sorprendido y tranquilo — individualmente — para dar forma exacta a cómo se lee cada línea. Porque las emociones se mezclan, puedes apilar combinaciones sutiles en lugar de elegir un sentimiento preestablecido, lo que se adapta a la narración interpretada y al diálogo dramático.
El lado de la clonación reproduce una voz específica de tu muestra, por lo que la misma voz de personaje o marca puede transportar un guión con rango emocional controlable. El precio es por 1.000 caracteres.
Su posición entre los modelos de voz de ZOOOP : Chatterbox TTS es la clonación de voz construida para amplia cobertura multilingüe ; LUX TTS es la clonación más barata ; para voces preestablecidas usa Multilingual V3. El punto fuerte de Index TTS 2 es la clonación de voz emocionalmente matizada.
Un modelo mental razonable : usa Index TTS 2 por defecto cuando una voz clonada necesita control emocional preciso, y cambia a Chatterbox para muchos idiomas o LUX TTS para el coste más bajo.
Ocho, establecidas individualmente: feliz, enfadado, triste, con miedo, con asco, melancólico, sorprendido y tranquilo. Mézclalas para dar forma exacta a cómo se lee una línea.
Una muestra de audio de referencia de la voz. Habla tu texto en esa voz clonada con tu mezcla emocional elegida.
Ambos clonan voces. Index TTS 2 ofrece control fino de ocho emociones ; Chatterbox enfatiza amplia cobertura multilingüe. Elige Index TTS 2 cuando el matiz emocional es lo más importante.
Por 1.000 caracteres de texto.
Audio Reference*
Prompt*
Emotion · Happy*
Emotion · Angry*
Emotion · Sad*
Emotion · Afraid*
Emotion · Disgusted*
Emotion · Melancholic*
Emotion · Surprised*
Emotion · Calm*