Wan 2.5 : des vidéos IA plus longues et stables pour moitié moins cher.

Wan 2.5 : des vidéos IA plus longues et stables pour moitié moins cher.

Wan 2.5 est un modèle d'image et de vidéo IA de pointe signé Alibaba.

Essayer

Text to Video
Image to Video
Text to Image
T to V(Fast)
I to V(Fast)
Prompt
Audio

Cliquez pour téléverser un audio

Créer

Fonctionnalités clés

Une seule invite, l'audio et la vidéo restent synchronisés du début à la fin

Avec Wan 2.5, plus besoin d'enregistrer des voix off séparées ou d'aligner manuellement les lèvres pour des vidéos IA silencieuses. Fournissez simplement une invite claire et bien structurée pour générer une vidéo complète avec audio/voix off et synchronisation labiale en une seule fois. Le processus devient plus rapide et plus simple.

Commencer

Prompt

A young man sits still on a subway train, surrounded by blurred figures moving rapidly. [Close-up] His eyes, barely blinking, intensify the sense of loneliness.

Final outcome

Plus abordable

Même si Google a récemment annoncé des baisses de prix, Veo 3 reste globalement coûteux. À l'inverse, Wan 2.5 est plus léger et plus économique, offrant davantage d'options aux créateurs tout en réduisant significativement les coûts de production.

Commencer

Wan 2.5

1080p / 10s / $1.5
720p / 10s / $1
480p / 10s / $1

VEO 3

1080p / 8s / $3.2
720p / 8s / $3.2
/

Mouvements fluides et stables

Grâce à une large plage dynamique, Wan 2.5 rend les grands mouvements aussi fluides que les petits et maintient des motions stables et réalistes.

Commencer

Wan 2.5

VEO 3

Prompt: A man is surfing.

Multilingue et tolérant aux accents

Lorsque les invites sont en chinois ou dans des langues minoritaires, Wan 2.5 produit de manière fiable des vidéos audio/vidéo synchronisées. Comparé à Veo 3, il affiche rarement « langue inconnue » lorsque l'invite inclut du chinois ou d'autres langues.

Commencer

Wan 2.5

VEO 3

Prompt: A confident woman in her 40s stands on a stage with a microphone. The background shows a large LED screen with abstract visuals. She smiles and begins speaking to the audience in cockney: “Good evening everyone. Can I have a bottle of water” Her lip movements match her voice, and she uses expressive hand gestures while speaking.

Vidéo au son original pilotée par la voix

Veo 3 ne prend pas en charge l'audio de référence, ce qui limite les créateurs à des clips silencieux ou à un son généré par le système. À l'inverse, Wan 2.5 permet d'entrer directement une voix, des effets sonores et de la musique de fond, pilotant ainsi la génération vidéo avec des repères audio précis.

Commencer

Cas d'utilisation

3D Animation: Create a short 3D animated scene in a cheerful cartoon style. A cute creature, with fur like a snow leopard, large expressive eyes, and a round, friendly physique, frolics through a whimsical winter forest. The scene should feature rounded snow-covered trees, gently falling snowflakes, and warm sunlight filtering through the branches. The creature's lively movements and beaming smile should convey pure joy. Adopt a cheerful and heartwarming tone, with bright, playful colors and fun animation.

2D Animation: A cute magical girl with pink twin-tails is undergoing a brilliant transformation sequence. She is surrounded by shimmering starlight and floating ribbons as her clothes magically dissolve into a detailed battle dress. A close-up shot focuses on her determined, large blue eyes. The background is a fantastical starry sky. Japanese anime style, vibrant colors, magical particle effects, dynamic motion, a mix of Studio Ghibli and Makoto Shinkai art styles.

ASMR Videos: A keyboard whose keys are made of different types of candy. Typing makes sweet, crunchy sounds. Audio: Crunchy, sugary typing sounds, delighted giggles.

Movie Opening: A cinematic opening sequence of a sci-fi movie: a spaceship travels across the galaxy, and the movie title "ギャラクティック・オデッセイ" emerges in golden 3D letters, with flawless kerning and no distortion, floating stably in space as the camera rotates.

Sport shots: A man is surfing.

Speech: A confident woman in her 40s stands on a stage with a microphone. The background shows a large LED screen with abstract visuals. She smiles and begins speaking to the audience: “Good evening everyone. Tonight, I want to share three powerful lessons about leadership and innovation.” Her lip movements match her voice, and she uses expressive hand gestures while speaking.

Articles about Wan 2.5

Q & A

Puis-je animer une vidéo silencieuse existante ?
Oui. La conversion vidéo-vers-vidéo mappe la synchronisation labiale et les expressions sur un clip silencieux tout en préservant l'identité et le contexte de la scène.
Quelle est la durée maximale ?
Jusqu'à 10 minutes par génération.
Comment gérez-vous plusieurs langues et dialectes ?
De nombreuses langues et divers dialectes sont pris en charge et peuvent être mélangés dans un même clip. Attention : des changements rapides au sein du même clip peuvent réduire la stabilité de l'alignement.
Prenez-vous en charge le téléversement d'audio ?
Oui. Wan 2.5 accepte le téléversement d'une piste audio pour piloter la synchronisation labiale et le rythme.
Seedream 4.0