← Blog

WAN 2.7 vs WAN 2.6 : Comparaison des fonctionnalités et décision de mise à niveau

WAN 2.7 vs WAN 2.6 comparés : nouvelles fonctionnalités, modifications au niveau de l'API et guide de décision pour les équipes utilisant déjà WAN en production.

10 min read
WAN 2.7 vs WAN 2.6 : Comparaison des fonctionnalités et décision de mise à niveau

Bonjour à tous, je suis Dora. J’observe la famille de modèles WAN évoluer à travers ses cycles de versions tranquillement — non pas avec enthousiasme, mais avec l’attention qu’on porte aux décisions d’infrastructure difficiles à défaire. WAN 2.7 est prévu pour mars 2026 et la liste des fonctionnalités est suffisamment notable pour qu’il vaille la peine de détailler exactement ce qui change, ce qui reste identique, et où l’incertitude subsiste encore avant de toucher quoi que ce soit en production.

Décision en 30 secondes (Lisez ceci en premier)

Mettez à jour maintenant si vous avez besoin :

  • Du contrôle de la première et de la dernière image dans un seul clip (contrôle structurel de la scène, pas seulement une ancre d’animation)
  • D’une entrée multi-images via une disposition en grille 9 cases pour une composition I2V plus riche
  • De l’édition par instruction en langage naturel sur des vidéos existantes — changer l’arrière-plan, l’éclairage ou les vêtements sans régénérer depuis le début
  • De jusqu’à 5 références vidéo simultanées (2.6 est limité à moins ; 2.7 étend significativement ce nombre)
  • D’une référence combinée sujet + voix en un seul passage (R2V amélioré)

Restez sur la version 2.6 si vous avez besoin :

  • D’une API stable et documentée avec un comportement de production testé
  • De déploiements auto-hébergés — le statut open-weight de WAN 2.7 n’est pas encore confirmé
  • De clarté budgétaire — la tarification de la version 2.7 n’a pas été publiée au moment de la rédaction

Tableau comparatif des fonctionnalités

Contrôle de la première/dernière image : 2.6 vs 2.7

WAN 2.6 a introduit l’ancrage basique de la première image pour I2V. WAN 2.7 ajoute le contrôle de la dernière image en complément, ce qui signifie que vous pouvez définir les deux extrémités d’un clip. Pour les équipes qui construisent des séquences narratives ou du contenu en boucle, c’est la différence entre décrire un mouvement et le composer réellement. Le modèle infère la trajectoire entre vos deux images clés.

Cela a des implications concrètes sur le flux de travail : au lieu de générer plusieurs candidats en espérant que l’un corresponde à votre fin souhaitée, vous contraignez l’espace de sortie depuis les deux extrémités.

Entrée multi-images I2V (grille 9 cases) : Nouveau dans 2.7

C’est la fonctionnalité structurellement la plus novatrice de 2.7. Plutôt qu’une seule image de référence, la disposition en grille 9 cases accepte un arrangement 3×3 d’images — vous permettant d’injecter des références sous plusieurs angles, des poses séquentielles ou des variantes de scènes dans une seule génération I2V. Le modèle utilise cette entrée visuelle structurée pour améliorer la composition de la scène et réduire la dérive.

Si cela surpasse réellement une I2V bien guidée à image unique en pratique est quelque chose que je voudrais tester directement. L’architecture est intéressante. Le delta dans le monde réel nécessite une mesure.

Référence vocale : R2V dans 2.6 → Amélioré dans 2.7

WAN 2.6 a introduit la Reference-to-Video avec entrée vocale. WAN 2.7 affine cela en une référence combinée sujet + voix — un flux de travail unique qui ancre simultanément l’apparence du personnage et la direction vocale. Pour les équipes qui construisent des présentateurs virtuels ou du contenu mené par des personnages à grande échelle, cela réduit considérablement le nombre d’étapes dans le pipeline. Vous pouvez lire sur l’architecture audio-visuelle plus large qui sous-tend cette famille dans la recherche sur le modèle Wan d’Alibaba sur Hugging Face.

Édition par instruction : Nouveau dans 2.7

C’est la fonctionnalité qui rend 2.7 qualitativement différent d’un modèle de génération pure. Vous pouvez transmettre une vidéo existante accompagnée d’une instruction en langage naturel (« changer l’arrière-plan en une rue sous la pluie », « remplacer la veste par une rouge ») et recevoir une sortie éditée plutôt qu’une nouvelle génération.

Cela a une importance opérationnelle : les cycles d’itération qui nécessitaient auparavant une régénération depuis le début peuvent maintenant être traités comme des modifications légères. Cela signifie également que votre stratégie de prompt évolue — vous rédigerez des instructions d’édition, pas des prompts de génération.

Résolution et durée de sortie

Les versions 2.6 et 2.7 prennent en charge jusqu’à 1080P et jusqu’à 15 secondes. Aucun changement ici. Si la résolution ou la durée était votre contrainte principale, cette version n’élargit pas ces limites.

Nombre de références vidéo (jusqu’à 5 dans 2.7)

WAN 2.6 prend en charge une ou deux références vidéo pour la cohérence du sujet. WAN 2.7 porte ce nombre à cinq références simultanées, utile pour les scènes à plusieurs personnages ou les flux de production nécessitant une cohérence stricte de la marque entre les actifs de référence.

Changements au niveau de l’API pour les développeurs

Nouveaux paramètres / Structure du payload

L’entrée en grille 9 cases et l’édition par instruction nécessiteront presque certainement de nouveaux champs de payload — des structures de tableau d’images, un paramètre edit_instruction, et éventuellement un endpoint distinct ou un indicateur de mode. Jusqu’à la publication des docs officiels de l’API, traitez toute spéculation de paramètres tiers comme provisoire. Le dépôt GitHub du modèle WAN a historiquement été le premier endroit où l’équipe d’Alibaba documente les changements de schéma pour les versions open-weight.

Changements d’endpoint et d’ID de modèle

Attendez-vous à un nouvel ID de modèle (par exemple, wan-2.7-i2v, wan-2.7-edit) distinct de wan-2.6-i2v. Les plateformes comme fal.ai qui fournissent de l’inférence hébergée publient généralement la disponibilité des endpoints dans les jours suivant une sortie officielle — il vaut la peine de surveiller directement leur journal des modifications.

Compatibilité ascendante avec les flux de travail WAN 2.6

Les payloads I2V et T2V standard (entrée image unique, prompt textuel, résolution, durée) devraient être structurellement compatibles. Les nouvelles fonctionnalités semblent additives plutôt que destructrices. Cela dit, ne supposez pas que le comportement des prompts est identique — les ajustements de suivi des instructions signifient que les prompts calibrés pour la version 2.6 peuvent produire des résultats différents dans la version 2.7, même sans modifications du payload.

Qualité et performance : Ce que les preuves montrent

Affirmations sur la fidélité visuelle

Les matériaux de pré-lancement décrivent des améliorations de la netteté, de la précision des couleurs et de la préservation des détails. Je ne vais pas reformuler ces éléments comme des faits — c’est exactement le type d’affirmation qui nécessite des données de benchmark. Une fois les benchmarks officiels publiés, croisez-les avec vos propres prompts représentatifs. Les scores agrégés capturent rarement les modes d’échec en cas limites qui comptent le plus pour des flux de travail spécifiques.

Améliorations de la synchronisation audio

WAN 2.5 a introduit la génération audio native. WAN 2.6 l’a affinée. WAN 2.7 revendique une amélioration supplémentaire de la synchronisation audio-visuelle. Le blog fal.ai sur l’architecture audio de WAN 2.5 fournit un contexte utile sur l’évolution du pipeline de synchronisation — vaut la peine d’être lu avant d’évaluer les affirmations de 2.7 avec votre propre audio de test.

Cohérence du mouvement

Décrite comme plus fluide et plus physiquement plausible que la version 2.6. C’est l’affirmation de qualité la plus difficile à évaluer sans exécuter vos propres clips. La cohérence du mouvement se dégrade de manière imprévisible dans les cas limites — angles de caméra inhabituels, mouvements rapides, arrière-plans complexes. Exécutez vos cas d’utilisation spécifiques, pas des démos génériques.

Implications sur les coûts de la mise à niveau

Structure des coûts des nouvelles fonctionnalités

L’I2V en grille 9 cases et l’édition par instruction auront presque certainement des profils de coûts différents de la génération I2V standard. L’inférence multi-entrées est plus lourde en calcul. Budgétisez en conséquence, mais ne finalisez pas les projections avant que la tarification soit en ligne.

Coût de calcul : grille 9 cases vs I2V simple

Neuf images de référence contre une représente une augmentation significative du traitement des entrées. Si vous exécutez des pipelines automatisés à volume élevé, intégrez cette hypothèse dans vos estimations de coûts avant de migrer : la grille 9 cases coûte probablement plus cher par génération que l’I2V à image unique à résolution et durée équivalentes.

Liste de contrôle de migration pour les équipes déjà sur WAN 2.5/2.6

  • Auditez les payloads existants pour les ID de modèle codés en dur — mettez à jour vers l’endpoint 2.7 quand disponible
  • Retestez vos 10 prompts les plus utilisés contre la version 2.7 avant la migration complète
  • Évaluez l’édition par instruction pour les flux de travail utilisant actuellement la régénération pour l’itération
  • Vérifiez le format d’entrée en grille 9 cases par rapport à votre pipeline d’images existant
  • Attendez la migration des nœuds ComfyUI jusqu’à ce que des nœuds 2.7 vérifiés par la communauté soient publiés
  • Confirmez la tarification avec votre fournisseur d’inférence avant de faire évoluer l’utilisation des nouvelles fonctionnalités
  • Ne désapprouvez pas les flux de travail 2.6 tant que la stabilité de l’API 2.7 n’est pas confirmée en production

FAQ

  1. Puis-je appeler WAN 2.7 et WAN 2.6 avec la même clé API ? Presque certainement oui si vous utilisez un fournisseur d’inférence hébergé — la sélection du modèle se fait par requête. Confirmez avec votre fournisseur spécifique.
  2. Les prompts WAN 2.6 sont-ils compatibles avec 2.7 ? Structurellement, probablement oui. Comportementalement, ce n’est pas garanti. Les ajustements de suivi des instructions varient entre les versions. Traitez les prompts 2.6 comme des points de départ, pas des actifs finalisés.
  3. Est-ce que 2.7 change la façon dont je structure les entrées d’images pour I2V ? I2V standard à image unique : probablement aucun changement. Grille 9 cases : structure entièrement nouvelle. Documentez les deux chemins séparément dans votre base de code.
  4. Qu’arrive-t-il à mes flux de travail WAN 2.5 ComfyUI ? Les nœuds WAN 2.7 n’existeront pas tant que les contributeurs de la communauté ne les auront pas publiés après la sortie. Le blog ComfyUI a historiquement été l’endroit le plus rapide pour trouver des nœuds partenaires vérifiés pour les nouvelles versions de Wan.
  5. WAN 2.7 est-il disponible pour l’auto-hébergement ? Inconnu au moment de la rédaction. La famille Wan a varié — certaines versions publiées sous Apache 2.0 comme poids ouverts, d’autres uniquement via une API propriétaire. Confirmez avant de construire un plan d’auto-hébergement autour de la version 2.7.

Conclusion

WAN 2.7 est une version significative si votre travail implique l’itération, la cohérence des personnages ou la composition multi-entrées. L’édition par instruction fait évoluer le modèle d’un outil de génération vers quelque chose qui ressemble davantage à un pipeline d’édition vidéo — ce qui change la façon dont vous structureriez les flux de travail, pas seulement les prompts que vous rédigez.

Ce qu’il n’est pas : une raison de migrer immédiatement. Les détails de l’API ne sont pas finalisés, la tarification n’est pas publiée, et les affirmations de qualité nécessitent une validation par rapport à votre contenu de production réel. Intégrez l’évaluation de la version 2.7 dans votre sprint une fois la documentation disponible, exécutez-la en parallèle avec la version 2.6, et prenez la décision de migration avec des données plutôt qu’avec l’enthousiasme du jour de sortie.

Je ferai un suivi avec un guide de démarrage rapide de l’API WAN 2.7 une fois la documentation officielle disponible — couvrant la structure du payload, le format d’entrée en grille 9 cases, et un exemple d’édition par instruction fonctionnel pour les équipes exécutant déjà la version 2.6 en production.

Articles précédents :