
Personnage dans une scène
Référencez une fiche personnage et Vidu Q3 transporte ce sujet à travers le plan conforme au modèle — contenu épisodique et séries où le même personnage revient.
Le modèle vidéo piloté par référence de Vidu — jusqu'à 4 images de référence pour la cohérence multi-sujets, audio natif, jusqu'à 16 secondes.
Payez une fois pour les crédits - utilisez-les sur tous les modèles de ZOOOP. · Rechargez quand vous en avez besoin, pas de brûlure mensuelle.
Powered by Vidu AI's API on ZOOOP
Passez jusqu'à 4 images de référence et Vidu Q3 maintient ces sujets — un personnage, un produit, un accessoire — reconnaissants et conformes au modèle tout au long du mouvement. Conçu pour mettre *vos* ressources dans une scène.
L'audio est généré avec la vidéo, activé par défaut — le son de la scène et l'ambiance atterrissent avec l'action au lieu d'un passage audio séparé.
Les générations uniques vont de 1 à 16 secondes — parmi les fenêtres de prise unique les plus longues de la gamme vidéo phare.
Sortie en 360p, 540p, 720p ou 1080p sur cinq formats d'image — brouillon économique en basse résolution, livraison en 1080p, en paysage, carré ou portrait.

Référencez une fiche personnage et Vidu Q3 transporte ce sujet à travers le plan conforme au modèle — contenu épisodique et séries où le même personnage revient.

Fournissez des références produit et gardez l'objet précis pendant que la caméra bouge — publicités et démos où le vrai produit doit être lisible.

Jusqu'à 4 références permettent à un personnage, un accessoire et un décor de coexister en une génération, chacun maintenu cohérent plutôt que ré-imaginé.

Jusqu'à 16 secondes capturent un battement complet ou une action continue en une génération — pas d'assemblage entre clips.
Choisissez le bon modèle vidéo. Vos crédits fonctionnent partout sur ZOOOP.
Ouvrez Vidu Q3 depuis cette page ou sélectionnez-le dans le Générateur de Vidéo.
Écrivez le prompt et ajoutez jusqu'à 4 images de référence pour les sujets à maintenir cohérents.
Choisissez le format d'image, la résolution (jusqu'en 1080p) et la durée (1–16s) ; gardez l'audio activé.
Générez, puis téléchargez ou envoyez le clip sur votre canvas.
Vidu Q3 est le modèle à atteindre quand le plan doit contenir vos sujets, pas des génériques. Son workflow définitionnel est piloté par référence : vous passez jusqu'à 4 images de référence — une fiche personnage, un produit, un accessoire, un décor — et Vidu Q3 maintient chacun d'entre eux reconnaissable et conforme au modèle à travers le mouvement. La plupart des modèles texte-vers-vidéo inventent une scène à partir du prompt seul ; Vidu Q3 est conçu pour transporter des ressources spécifiques et cohérentes dans le plan généré. Pour le contenu épisodique avec un personnage récurrent, ou les publicités où le vrai produit doit être lisible, c'est tout le jeu.
La deuxième force est la coexistence multi-sujets. Les quatre références ne sont pas seulement des indices de style — un personnage, un accessoire et un décor peuvent tous vivre en une génération, chacun maintenu cohérent plutôt que ré-imaginé d'image en image. C'en fait un bon choix pour les scènes avec plusieurs éléments ancrés qui tous doivent rester vrais en même temps.
Côté production, les générations vont jusqu'à 16 secondes — parmi les fenêtres de prise unique les plus longues de la gamme phare — avec l'audio natif activé par défaut, donc le son de la scène arrive avec le mouvement. La sortie va de 360p pour les brouillons économiques jusqu'en 1080p pour la livraison, sur cinq formats d'image de 16:9 à 9:16, donc la même configuration sert un coupe héros et un trim social vertical.
Où c'est plus faible : pour le top absolu de la physique du mouvement et du réalisme, Seedance V2.0 mène, et le photoréalisme cinématique est le domaine de Veo 3.1. Pour les brouillons jetables les moins chers et rapides, Pika V2.2 coûte moins par seconde. Le point fort de Vidu Q3 est la génération ancrée par référence, multi-sujets cohérente.
Un modèle mental raisonnable : utilisez Vidu Q3 par défaut quand vous avez besoin que les personnages, produits ou accessoires référencés restent cohérents à travers un plan. Pour le réalisme de mouvement de pointe, passez à Seedance V2.0 ; pour le photoréalisme cinématique, Veo 3.1 ; pour les longues prises avec audio synchronisé, Kling O3.
Son workflow piloté par référence. Vous passez jusqu'à 4 images de référence et Vidu Q3 maintient ces sujets — personnages, produits, accessoires — cohérents à travers le mouvement, plutôt que de générer une scène sans rapport à partir du texte seul.
Jusqu'à 4. Combinez un personnage, un produit et une référence de décor pour que chacun reste reconnaissable et conforme au modèle dans le plan généré.
Oui — l'audio est généré avec la vidéo et activé par défaut, donc le son de la scène et l'ambiance atterrissent synchronisés avec l'action.
De 1 à 16 secondes par génération, avec 5 secondes par défaut — l'une des fenêtres de prise unique les plus longues disponibles, utile pour les actions continues sans assemblage.
Vidu Q3 mène sur la cohérence multi-sujets pilotée par référence — mettre vos ressources spécifiques dans une scène. Seedance V2.0 mène sur la physique du mouvement et le réalisme bruts. Kling V3 est un fort généraliste texte-vers-vidéo phare. Choisissez Vidu Q3 quand la cohérence des sujets référencés est la priorité.
Images
Prompt*
Rapport hauteur / largeur*
Résolution*
Durée*