
Constructions d'écosystème open-source
La licence Apache 2.0 signifie que les sorties Wan 2.7 sont libres pour un usage commercial sans chaînes de licence spécifiques à ZOOOP — important quand la redistribution en aval compte.
Le modèle vidéo phare open-weight d'Alibaba — architecture 27B MoE, 1080p, audio natif, édition par instruction, Apache 2.0.
Payez une fois pour les crédits - utilisez-les sur tous les modèles de ZOOOP. · Rechargez quand vous en avez besoin, pas de brûlure mensuelle.
Powered by Wan AI's API on ZOOOP
Verrouillez l'image d'ouverture et de clôture d'un clip ; Wan génère le mouvement qui les relie. Combiné avec des prompts texte, c'est la manière la plus contrôlable d'atteindre une fin visuelle exacte.
L'audio généré comprend dialogue, son ambiant et musique — synchronisés à l'image dans la même passe de génération, sans étape TTS ou Foley séparée.
Passez une vidéo existante plus une instruction texte (« changez l'arrière-plan en plage », « mettez la veste en rouge ») et Wan applique l'édition tout en préservant le mouvement et l'identité.
La suite complète Wan 2.7 — texte-vers-vidéo, image-vers-vidéo, première/dernière image, édition par instruction — est livrée sous Apache 2.0. Les sorties sont libres pour un usage commercial ; les poids sont ouverts pour l'auto-hébergement.

La licence Apache 2.0 signifie que les sorties Wan 2.7 sont libres pour un usage commercial sans chaînes de licence spécifiques à ZOOOP — important quand la redistribution en aval compte.

Le contrôle première/dernière image donne un timing précis — animez un poster statique, verrouillez l'image de fin pour que la coupe suivante soit nette.

L'édition vidéo par instruction relooker vos séquences — changez la garde-robe, échangez les arrière-plans, déplacez la saison — tout en conservant le mouvement original.

Générez à partir d'un prompt ou animez un still — Wan gère le texte-vers-vidéo et l'image-vers-vidéo avec audio natif dans un seul modèle.

Dialogue, ambiance et musique sont générés avec l'image en une seule passe — courts métrages sociaux avec son synchronisé, sans étape audio séparée.

La licence open-weight plus la qualité phare font de Wan le choix pour la production en lot à volume élevé que vous pouvez redistribuer librement.
Wan 2.7 est la meilleure option open-weight et le plus fort pour les éditions par instruction. Changez quand votre plan a besoin d'autre chose.
Ouvrez Wan 2.7 depuis cette page ou sélectionnez-le dans le Générateur de vidéos.
Choisissez le mode — texte-vers-vidéo, image-vers-vidéo, première/dernière image, ou édition par instruction.
Écrivez le prompt — Wan lit les descriptions de mouvement et les repères audio avec précision.
Choisissez la durée (jusqu'à 10s), la résolution (jusqu'en 1080p), et générez.
Wan 2.7 est le modèle qui a brisé le fossé closed-source sur la vidéo de niveau phare. Pendant les 18 derniers mois, le haut du classement vidéo IA a été contrôlé par des poids fermés — Veo, Kling, Seedance, Runway — avec l'écosystème open-source bloqué une génération derrière. Le Tongyi Lab d'Alibaba a livré Wan 2.7 en avril 2026 sous Apache 2.0, emballé comme une suite complète : texte-vers-vidéo, image-vers-vidéo, contrôle première/dernière image, et édition vidéo par instruction. Le résultat concurrence réellement les phares fermés en résolution, fidélité de mouvement et audio — tout en restant open-weight sous Apache 2.0.
Le choix architectural derrière cela est un modèle Mixture-of-Experts (MoE) de 27 milliards de paramètres qui n'active qu'environ 14 milliards de paramètres par génération. La conception MoE donne à Wan 2.7 les avantages de capacité d'un modèle dense beaucoup plus grand — meilleure connaissance du monde, meilleure couverture de style, meilleure physique du mouvement — tout en gardant la latence d'inférence plus proche d'un modèle dense 14B. Pour les travaux de production à volume élevé (génération ad-tech, storyboarding en lot, grandes bibliothèques de contenu), c'est le modèle qui monte en charge.
La capacité qui distingue fonctionnellement Wan 2.7 est l'édition vidéo par instruction. Passez un clip existant plus une instruction texte — « mettez la veste en rouge », « changez l'arrière-plan en plage », « passez au golden hour » — et Wan applique l'édition tout en préservant le mouvement original, l'identité du personnage et la géométrie de la scène. Le concurrent le plus proche ici est le pipeline de restylage de Veo, mais l'analyseur d'instructions de Wan est plus flexible. Pour les agences qui ont des séquences clients à remixer sans re-tournage, c'est le modèle qui boucle la boucle.
Autres capacités notables : le contrôle première/dernière image vous permet de verrouiller l'image d'ouverture et de clôture et de laisser Wan générer le mouvement de liaison — utile pour atteindre des battements narratifs spécifiques et pour chaîner des clips qui doivent se connecter proprement. L'audio natif synchronisé — dialogue, ambiance et musique — est produit avec l'image dans la même passe, lip-sync et synchronisé sans étape Foley séparée.
Points faibles : sur la fidélité visuelle haut de gamme en travail à prise unique, Veo 3.1 a toujours l'avantage en 1080p+ et le chemin d'upscale 4K. Sur l'Elo de référence multimodale, Seedance 2.0 mène les benchmarks publics. Sur le storyboarding multi-plans explicite avec coupes franches dans un prompt, Kling V3 est plus contrôlable. Le point fort de Wan est l'amiabilité open-source, les éditions par instruction et la production en lot.
Un modèle mental raisonnable : Wan 2.7 est la défaut quand vous avez besoin de provenance open-weight, de production en lot à volume élevé, ou d'un flux de travail intensif en édition. Pour la fidélité maximale, Veo 3.1. Pour les plans riches en références, Seedance 2.0.
Oui — le Tongyi Lab d'Alibaba a publié la suite complète Wan 2.7 sous Apache 2.0, incluant les variantes texte-vers-vidéo, image-vers-vidéo, première/dernière image et édition vidéo par instruction. ZOOOP passe par l'API hébergée pour la fiabilité de production ; les poids et code sous-jacents sont ouverts pour l'auto-hébergement.
Wan 2.7 est construit sur un modèle Mixture-of-Experts (MoE) de 27 milliards de paramètres. Malgré le nombre de paramètres, la conception MoE n'active qu'environ 14 milliards de paramètres par génération — elle reste efficace à l'inférence tout en ayant les avantages de capacité d'un modèle dense beaucoup plus grand.
Passez un clip vidéo existant plus une instruction texte (par ex. « mettez la veste en rouge »), et Wan applique l'édition tout en préservant le mouvement original, l'identité du personnage et la géométrie de la scène. C'est l'une des implémentations d'édition les plus fortes dans tout modèle vidéo actuel.
Jusqu'à 10 secondes par génération en 1080p. Combiné avec le contrôle première/dernière image, vous pouvez chaîner des clips qui se connectent proprement — Wan lit l'image finale du clip précédent comme image de début du clip suivant, préservant la continuité.
Wan 2.7 a l'histoire open-weight la plus forte parmi les phares, plus une édition par instruction unique et forte. Seedance 2.0 mène sur les entrées de référence multimodales et les scores Elo ; Veo 3.1 mène sur la résolution brute et la 4K. Choisissez Wan pour les flux de travail d'édition et la provenance open-source.
Images
Prompt*
Rapport hauteur / largeur*
Résolution*
Durée*