
Curtas-metragens conduzidos por personagem
Etiquete o protagonista uma vez com um plano de referência e o Seedance mantém rosto, cabelo e guarda-roupa idênticos em cada corte da sequência.
O modelo de vídeo multimodal insignia da ByteDance — entradas de texto, imagem, áudio e vídeo de referência numa única passagem.
Pague uma vez por créditos e use-os em todos os modelos em ZOOOP. · Recarregue quando precisar, sem queima mensal.
Powered by ByteDance's API on ZOOOP
Uma arquitetura única gera áudio e vídeo sincronizados numa única passagem — diálogo, som ambiente, música sensível ao ritmo, sem etapa de pós-sincronização. Suporta até 3 clips de vídeo, 9 imagens e 3 clips de áudio como entradas de referência combinadas.
Etiquete cada imagem de referência como uma personagem, acessorário ou localização específica. O Seedance mantém a coerência visual de cada sujeito entre cortes, o mesmo ator aparece em cada plano com o mesmo guarda-roupa.
Forneça um clip de vídeo como referência de movimento e o Seedance transfere a sua coreografia para a sua imagem de personagem — útil para dança, ação desportiva e movimentos de câmara estilizados.
Saída nativa até 1080p em 16:9, 9:16, 4:3, 3:4, 21:9 e 1:1. O formato cinema 21:9 e o vertical 9:16 saem do mesmo prompt, sem necessidade de recorte.

Etiquete o protagonista uma vez com um plano de referência e o Seedance mantém rosto, cabelo e guarda-roupa idênticos em cada corte da sequência.

Coloque fotos de produto + um clip de áudio de guião e o modelo gera um vídeo onde a iluminação, o movimento e a voz em off batem juntos.

A sincronização sensível ao ritmo significa que os visuais cortam no tempo forte. Alimente um clip de áudio de 15 segundos e o modelo edita o movimento da câmara para corresponder.

Anime painéis de storyboard estáticos com vídeo de referência de movimento para o bloqueio — mais rápido do que encomendar uma passagem de previz.

Sequencie planos num único prompt com etiquetas de papel. Poupa o corte e junção manual que outros modelos lhe impõem.

Forneça um vídeo de referência de dança mais um leito de áudio; a imagem da personagem executa movimento coreografado no ritmo.
O Seedance 2.0 é o melhor canivete suíço para áudio nativo + referências multimodais — mas cada modelo tem um ponto forte. Os seus créditos funcionam em todos no ZOOOP.
Abra o Seedance 2.0 a partir desta página ou selecione-o no Gerador de Vídeo.
Coloque as suas imagens de referência e etiquete cada uma (personagem / acessorário / cena).
Escreva o prompt de cena — o Seedance lê movimentos de câmara, pistas de iluminação e falas.
Escolha a duração (4–15s), proporção e resolução, depois clique em Gerar.
O Seedance 2.0 é o modelo que alcança quando a cena precisa de mais do que um prompt de texto — quando um diretor daria ao diretor de fotografia uma pilha de mood boards, uma ficha de guarda-roupa, um rascunho de áudio e uma referência de cascata, e esperaria que tudo caísse no mesmo plano. O anterior Seedance 1.5 Pro podia tomar algumas dessas entradas separadamente. O Seedance 2.0 toma-as juntas: até 9 imagens de referência, 3 clips de vídeo e 3 clips de áudio numa arquitetura multimodal unificada, e o modelo decide como os pesar por plano.
A capacidade que vende o modelo é a etiquetagem de ativos por papel. Coloque uma imagem de referência do seu protagonista e etiquete-a como character_a; coloque um packshot e etiquete-o como product_x; referencie um vídeo de dublê e etiquete-o como motion_ref. O Seedance mantém a personagem etiquetada visualmente coerente — mesmo rosto, mesmo cabelo, mesmo guarda-roupa — em cada corte do clip gerado, enquanto a referência de movimento dita como se movem. É a coisa com que outros modelos ainda lutam: gera um clip de 5 segundos e a cor do cabelo do protagonista desvia a meio caminho. O Seedance 2.0 bloqueia o papel.
A segunda coisa que faz bem é a sincronização áudio sensível ao ritmo. Alimente um leito musical de 15 segundos e o modelo edita movimentos de câmara, movimento de personagem e cortes visuais para cair no tempo forte. É nativo — não um pós-processo. O mesmo modelo também gera diálogo com sincronização labial e som ambiente (passos, tom de quarto, clima) sem uma passagem TTS separada. Em março de 2026, o Seedance 2.0 está em Elo 1.269 para texto-para-vídeo e Elo 1.351 para imagem-para-vídeo em classificadores públicos — primeiro em ambas as categorias à frente de Kling 3.0, Veo 3 e Runway Gen-4.5.
Fraquezas: honestamente, em quase nenhum lugar em capacidade. O Seedance 2.0 é o melhor canivete suíço dos atuais insignias — topo dos quadros Elo públicos, 1080p completo, áudio nativo, o conjunto de referências multimodais mais profundo, e multi-plano estilo Kling V3 quando o escreve. É um modelo de finalização — alcance-o quando a qualidade tem de ganhar, não para executar vinte variações rápidas de rascunho. Use o Grok Imagine quando precisa de iterar na direção rapidamente, depois graduate o prompt vencedor para o Seedance para a finalização.
Um modelo mental razoável: use o Seedance 2.0 por predefinição quando a qualidade tem de ganhar — planos ricos em referências, cortes acabados, entregas premium. Para iteração rápida para encontrar a direção, Grok Imagine. Para o caminho de upscale 4K dedicado do Veo 3.1, mude para a finalização. Para storyboarding multi-plano com cortes duros num prompt, Kling V3.
Uma arquitetura multimodal unificada — o Seedance 2.0 aceita texto, imagem, áudio e vídeo como entrada combinada, enquanto o 1.5 Pro os tratava separadamente. Os maiores ganhos práticos são imagens de referência etiquetadas por papel para coerência de personagem, sincronização áudio sensível ao ritmo, e áudio nativo que não precisa de uma passagem TTS separada.
Sim. O diálogo, som ambiente e banda sonora são produzidos alongside o vídeo na mesma passagem de geração, sincronizados com os visuais. Também pode passar uma referência de áudio e os visuais cortarão no ritmo.
4 a 15 segundos, até 1080p nativo. As proporções incluem 16:9, 9:16, 4:3, 3:4, 21:9 e 1:1, para entregar um master cinema e um corte social vertical do mesmo prompt sem re-renderização.
O Seedance 2.0 lidera os rankings Elo públicos para texto-para-vídeo e imagem-para-vídeo, com Kling 3.0, Veo 3 e Runway Gen-4.5 atrás. Também iguala o Veo 3.1 a 1080p. O último diferenciador do Veo é o seu upscaleur 4K dedicado; o Kling V3 tem storyboarding multi-plano explícito mais forte. O Seedance não tem elo fraco — é o melhor canivete suíço dos atuais insignias.
Sim — lidera os classificadores Elo públicos para texto-para-vídeo e imagem-para-vídeo. Semeie com uma imagem de referência e transporta o seu sujeito, enquadramento e estilo em movimento, com referências etiquetadas mantendo as personagens coerentes entre planos.
Imagens
Videos
Audios
Prompt*
Proporção de Aspecto*
Resolução*
Duração*