
Filmes de pitch e previz
Gere uma sequência com diálogo nativo e som ambiente — perto o suficiente de uma previz acabada para enviar a um produtor.
O modelo de vídeo topo de gama da Google DeepMind — até 4K, áudio nativo, controlo de estilo cinematográfico.
Pague uma vez por créditos e use-os em todos os modelos em ZOOOP. · Recarregue quando precisar, sem queima mensal.
Powered by Google's API on ZOOOP
O Veo 3.1 renderiza limpo até 4K com detalhe real — sem artefactos de ruído, sem esticar desfocado. Utilizável diretamente para trabalho de marca, colocação OOH e acabamento broadcast onde o entregável é 4K.
Carregue até três imagens de referência de uma personagem, produto ou objeto. O Veo 3.1 mantém características faciais, roupa e identidade do objeto coerentes entre cenas, ambientes e ângulos de câmara.
O diálogo, efeitos sonoros e ambiente são gerados na mesma passagem, sincronizados com os visuais — sem etapa TTS ou Foley separada. O lip-sync e o tom de sala chegam com a imagem.
O Veo 3.1 lê vocabulário cinematográfico nos prompts — "dolly in", "flare anamórfico", "golden hour", "low key" — e aplica-o corretamente, plano após plano.

Gere uma sequência com diálogo nativo e som ambiente — perto o suficiente de uma previz acabada para enviar a um produtor.

Referencie até três packshots ; o Veo mantém a embalagem, cor e etiqueta idênticas em múltiplos ângulos de corte.

Gere diálogo com lip-sync e tom de sala ambiente numa única passagem — o áudio sincronizado chega com a imagem, sem etapa Foley separada.

Prompts de estilo cinematográfico — anamórfico, câmara lenta, profundidade de campo — renderizados até 4K prontos para correção de cor.

Renderize em 4K com detalhe real — não um esticar ampliado — utilizável para acabamento OOH e broadcast.

Controlo de prompt cinematográfico — lente, movimento, iluminação — renderizado em 4K para os planos heróis de que um filme de marca depende.
Cada modelo de vídeo insignia tem um ponto forte. Use o Veo 3.1 para fidelidade máxima ; mude quando o seu plano precisa de outra coisa.
Abra o Veo 3.1 a partir desta página ou selecione-o no Gerador de Vídeo.
Escreva a cena — o Veo lê vocabulário cinematográfico, falas e movimentos de câmara.
Escolha a duração (4s / 6s / 8s), resolução (até 4K) e proporção.
Gere. Refine com prompts de seguimento para ajustar a lente, movimento e iluminação.
O Veo 3.1 é o modelo que alcança quando o corte final tem de realmente parecer um filme acabado — quando o "vídeo IA" com os habituais bugs de iluminação, mãos a derreter e ruído de textura não passa. A Google DeepMind construiu a linha Veo com forte apoio no vocabulário cinematográfico no analisador de prompts. Diga ao Veo 3.1 "dolly in lentamente, flare anamórfico da direita da câmara, golden hour low key com o rosto do sujeito na sombra", e ele executará corretamente estas quatro instruções — a maioria dos outros modelos de vídeo executará duas das quatro e improvisará o resto.
A função principal da atualização 3.1 é Ingredientes para Vídeo. Carregue até três imagens de referência de uma personagem, produto ou objeto, e o Veo mantém-nas coerentes entre cenas, ângulos de câmara e até mudanças de iluminação. Isto resolve o problema mais difícil do vídeo IA: a deriva do rosto. Em cada geração anterior de vídeo IA, o rosto do protagonista mudaria subtilmente entre planos — maçãs do rosto diferentes, cor dos olhos diferentes, mesmo quando o prompt os etiquetava explicitamente. Ingredientes para Vídeo bloqueia a referência ; a personagem renderizada é a mesma pessoa em cada corte.
A segunda função principal é a saída até 4K com detalhe real. O Veo 3.1 renderiza limpo em alta resolução sem os artefactos de ruído e o esticar desfocado que se obtém ao ampliar uma fonte de baixa resolução. Para trabalho de marca, colocação OOH ou qualquer contexto onde a entrega final é 4K, o Veo termina o caminho que a maioria dos outros modelos de vídeo IA não consegue.
O terceiro pilar é o áudio nativo sincronizado — diálogo, ambiente e efeitos sonoros produzidos na mesma passagem que a imagem, lip-sync e cronometrados sem etapa Foley separada. Combinado com controlo de prompt cinematográfico e saída 4K, é o modelo atual mais próximo de produzir um curta-metragem acabado numa única geração.
Fraquezas: para iteração rápida de prompts, um modelo "Fast" mais leve é a melhor ferramenta — use um para encontrar a composição certa, depois graduate para o Veo para o acabamento. Entradas de referência multimodais (referência de áudio, vídeo de referência de movimento) são mais fortes no Seedance 2.0. E no Elo texto-para-vídeo bruto, o Seedance 2.0 está atualmente ligeiramente à frente.
Um modelo mental razoável: o Veo 3.1 é a predefinição para qualidade de acabamento cinematográfico e resolução. Para planos ricos em referências, Seedance 2.0. Para storyboards multi-plano, Kling V3.
As grandes atualizações — Ingredientes para Vídeo (até 3 imagens de referência para coerência de personagem/produto), saída até 4K com detalhe real, e áudio nativo mais rico com diálogo e ambiente mais naturalmente sincronizados.
Sim — o Veo 3.1 produz até 4K com recuperação de detalhe real, não um esticar desfocado. Isso torna-o utilizável diretamente para trabalho de marca, OOH e acabamento broadcast onde o entregável tem de ser 4K.
Cada geração é de 4, 6 ou 8 segundos. Para peças mais longas, gere múltiplos clips e monte-os na canvas.
Sim — nativamente. O diálogo, som ambiente e efeitos sonoros saem na mesma passagem de geração, sincronizados com os visuais. Não é necessária uma passagem TTS ou Foley separada.
O Veo 3.1 lidera em resolução bruta (até 4K) e fidelidade de estilo cinematográfico. O Seedance 2.0 tem o Elo mais alto para texto-para-vídeo e imagem-para-vídeo em classificadores públicos. O Kling V3 é o mais forte para storyboarding multi-plano explícito. Os seus créditos funcionam nos três.
Image Url
Prompt*
Proporção de Aspecto*
Resolução*
Duração*