Wan 2.5: crea videos de IA más largos y estables por la mitad del costo.

Wan 2.5: crea videos de IA más largos y estables por la mitad del costo.

Wan 2.5 es un modelo de imagen y video de última generación de Alibaba.

Pruébalo

Text to Video
Image to Video
Text to Image
T to V(Fast)
I to V(Fast)
Indicaciones
Audio

Haz clic para subir un audio

Crear

Características clave

Una sola indicación; audio y video coinciden de principio a fin

Con Wan 2.5 ya no necesitas grabar locuciones por separado ni alinear los labios manualmente para videos de IA silenciosos. Solo proporciona una indicación clara y bien estructurada para generar un video completo con audio, voz en off y sincronización labial al instante. El proceso se vuelve más rápido y sencillo.

Comenzar

Prompt

A young man sits still on a subway train, surrounded by blurred figures moving rapidly. [Close-up] His eyes, barely blinking, intensify the sense of loneliness.

Final outcome

Más asequible

Aunque Google anunció recientemente bajadas de precio, Veo 3 sigue siendo costoso en general. En cambio, Wan 2.5 es más austero y económico, ofreciendo más opciones a los creadores mientras reduce significativamente los costos de producción.

Comenzar

Wan 2.5

1080p / 10s / $1.5
720p / 10s / $1
480p / 10s / $1

VEO 3

1080p / 8s / $3.2
720p / 8s / $3.2
/

Movimiento suave y estable

Con un amplio rango dinámico, Wan 2.5 hace que los grandes movimientos sean tan fluidos como los pequeños y mantiene un movimiento estable y realista.

Comenzar

Wan 2.5

VEO 3

Prompt: A man is surfing.

Multilingüe y amigable con los acentos

Cuando las indicaciones están en chino u otros idiomas minoritarios, Wan 2.5 produce videos sincronizados de audio y video de forma fiable. En comparación, Veo 3 suele mostrar “idioma desconocido” cuando la indicación incluye chino u otros idiomas.

Comenzar

Wan 2.5

VEO 3

Prompt: A confident woman in her 40s stands on a stage with a microphone. The background shows a large LED screen with abstract visuals. She smiles and begins speaking to the audience in cockney: “Good evening everyone. Can I have a bottle of water” Her lip movements match her voice, and she uses expressive hand gestures while speaking.

Video con referencia de voz y sonido original

Veo 3 no admite referencias de audio, lo que limita a los creadores a clips silenciosos o sonido generado por el sistema. En cambio, Wan 2.5 permite introducir voz, efectos de sonido y música de fondo directamente, guiando la generación del video con pistas de audio precisas.

Comenzar

Casos de uso

3D Animation: Create a short 3D animated scene in a cheerful cartoon style. A cute creature, with fur like a snow leopard, large expressive eyes, and a round, friendly physique, frolics through a whimsical winter forest. The scene should feature rounded snow-covered trees, gently falling snowflakes, and warm sunlight filtering through the branches. The creature's lively movements and beaming smile should convey pure joy. Adopt a cheerful and heartwarming tone, with bright, playful colors and fun animation.

2D Animation: A cute magical girl with pink twin-tails is undergoing a brilliant transformation sequence. She is surrounded by shimmering starlight and floating ribbons as her clothes magically dissolve into a detailed battle dress. A close-up shot focuses on her determined, large blue eyes. The background is a fantastical starry sky. Japanese anime style, vibrant colors, magical particle effects, dynamic motion, a mix of Studio Ghibli and Makoto Shinkai art styles.

ASMR Videos: A keyboard whose keys are made of different types of candy. Typing makes sweet, crunchy sounds. Audio: Crunchy, sugary typing sounds, delighted giggles.

Movie Opening: A cinematic opening sequence of a sci-fi movie: a spaceship travels across the galaxy, and the movie title "ギャラクティック・オデッセイ" emerges in golden 3D letters, with flawless kerning and no distortion, floating stably in space as the camera rotates.

Sport shots: A man is surfing.

Speech: A confident woman in her 40s stands on a stage with a microphone. The background shows a large LED screen with abstract visuals. She smiles and begins speaking to the audience: “Good evening everyone. Tonight, I want to share three powerful lessons about leadership and innovation.” Her lip movements match her voice, and she uses expressive hand gestures while speaking.

Articles about Wan 2.5

Q & A

¿Puedo animar un video silencioso existente?
Sí. La conversión de video a video asigna sincronización labial y expresiones a un clip silencioso mientras preserva la identidad y el contexto de la escena.
¿Cuál es la duración máxima?
Hasta 10 minutos por generación.
¿Qué tan bien manejan varios idiomas y dialectos?
Se admiten múltiples idiomas y diversos dialectos, y pueden mezclarse en un mismo clip. Aviso: los cambios rápidos dentro del mismo clip pueden reducir la estabilidad de la sincronización.
¿Permiten subir audio?
Sí. Wan 2.5 permite subir una pista de voz para guiar la sincronización labial y el ritmo.
Seedream 4.0