← Blog

Presentamos Alibaba WAN 2.6 Reference To Video Flash en WaveSpeedAI

Alibaba WAN 2.6 Reference-to-Video Flash convierte referencias de personajes, objetos o escenas de imágenes o videos en nuevas tomas de video con identidad, estilo y

7 min read
Alibaba Wan.2.6 Reference To Video Flash
Alibaba Wan.2.6 Reference To Video Flash Alibaba WAN 2.6 Reference-to-Video Flash convierte referenci...
Try it
Presentamos Alibaba WAN 2.6 Reference To Video Flash en WaveSpeedAI

Alibaba WAN 2.6 Reference-to-Video Flash ya está disponible en WaveSpeedAI

La velocidad se une a la consistencia. WaveSpeedAI se complace en anunciar el lanzamiento de Alibaba WAN 2.6 Reference-to-Video Flash, la variante rápida y destilada del modelo de generación de video con preservación de identidad de Alibaba. Si has estado trabajando con flujos de trabajo de referencia a video y desearas que los resultados llegaran más rápido, este modelo está hecho para ti — ofreciendo la misma consistencia de personajes y narrativa en múltiples tomas en una fracción del tiempo de generación.

¿Qué es WAN 2.6 Reference-to-Video Flash?

WAN 2.6 Reference-to-Video Flash es la versión optimizada para velocidad del modelo estándar WAN 2.6 Reference-to-Video. Destilado a partir del modelo completo, conserva la capacidad principal que hace única a la familia WAN 2.6 R2V: subes imágenes de referencia de personajes, accesorios o escenas, escribes un prompt de texto describiendo el video que deseas, y el modelo genera nuevas tomas de video que preservan fielmente la identidad y apariencia de tus sujetos de referencia.

La versión Flash logra una inferencia significativamente más rápida — generando videos en segundos en lugar de minutos — mientras mantiene la calidad visual, la coherencia del movimiento y la preservación de identidad que definen la serie WAN 2.6. Admite hasta 5 imágenes de referencia, salida en 720p y 1080p, duraciones de 5 o 10 segundos, y generación opcional de audio sincronizado.

Características principales

  • Entrada multi-referencia: Sube hasta 5 imágenes de referencia para guiar la generación. Múltiples ángulos y puntos de vista del mismo sujeto producen una mejor preservación de identidad — una mejora sustancial respecto a los flujos de trabajo típicos de referencia única

  • Preservación de identidad a alta velocidad: El modelo Flash mantiene los rasgos faciales, la ropa, las proporciones corporales y las características distintivas de tus sujetos de referencia en cada fotograma generado, ahora con tiempos de espera drásticamente reducidos

  • Composición en múltiples tomas: Elige entre una única toma continua o una composición automática de múltiples tomas que divide tu prompt en varias tomas coherentes con transiciones suaves — narrativa cinematográfica desde una sola llamada a la API

  • Generación de audio integrada: Habilita audio sincronizado opcional, incluyendo música de fondo, sonidos ambientales y efectos Foley, adaptados al contenido del video generado. No se requiere doblaje en postproducción

  • Flexibilidad de resolución: Genera en 720p (1280×720 o 720×1280) o 1080p (1920×1080 o 1080×1920) para adaptarse a tus requisitos de salida — horizontal o vertical

  • Expansión de prompts: Un potenciador de prompts integrado puede refinar automáticamente tus descripciones en prompts más ricos y detallados, mejorando la calidad de generación sin requerir ingeniería experta de prompts

Casos de uso en el mundo real

Contenido para redes sociales con personajes

Crea TikToks, Reels y YouTube Shorts con personajes consistentes en múltiples videos. Sube algunas fotos de tu personaje o mascota de marca, describe la escena y genera contenido acorde a tu marca a escala. La velocidad Flash hace práctica la iteración rápida — prueba docenas de variaciones en el tiempo que el modelo estándar produce un puñado.

Prototipado de marketing y publicidad

Genera demostraciones de productos, comerciales de marca y conceptos de campaña con personas o personajes específicos con identidad consistente en todas las tomas. Usa el modo multi-toma para producir secuencias publicitarias estructuradas completas con audio sincronizado, reduciendo días de preproducción a minutos.

Narrativa y animación

Construye secuencias narrativas cortas donde los personajes mantienen su apariencia a través de los cambios de escena. La capacidad multi-referencia te permite establecer múltiples personajes en una sola generación, mientras el modo multi-toma maneja las transiciones y el ritmo automáticamente. Los escritores y artistas de storyboard pueden visualizar escenas casi tan rápido como pueden describirlas.

Previsualizacion rápida para cine

Los directores y directores de fotografía pueden previsualizarar tomas y secuencias usando fotos de referencia de actores y locaciones. La velocidad del modelo Flash habilita un ciclo de retroalimentación creativa en vivo — ajusta el prompt, regenera y ve el resultado en segundos en lugar de esperar largas colas de renderizado.

Videos de productos para comercio electrónico

Transforma fotos estáticas de productos en videos dinámicos con branding consistente. Sube imágenes de productos como referencias, describe el movimiento y el entorno deseados, y genera contenido de video pulido listo para listados y anuncios.

Comenzar en WaveSpeedAI

Usar WAN 2.6 Reference-to-Video Flash a través de la API de WaveSpeedAI es sencillo:

import wavespeed

output = wavespeed.run(
    "alibaba/wan-2.6/reference-to-video-flash",
    {
        "reference_urls": [
            "https://example.com/character-front.jpg",
            "https://example.com/character-side.jpg"
        ],
        "prompt": "A woman walks through a sunlit garden, turning to smile at the camera",
        "size": "1280*720",
        "duration": 5,
        "shot_type": "multi"
    },
)

print(output["outputs"][0])

Opciones de configuración

ParámetroDescripción
reference_urls1-5 imágenes de referencia para guiar el personaje y la escena
promptDescripción en texto de la escena y el movimiento del video
sizeResolución de salida: 720p o 1080p, horizontal o vertical
durationDuración del video: 5 o 10 segundos
shot_typesingle para una toma continua, multi para composiciones variadas
enable_audioGenera audio sincronizado (habilitado por defecto)
enable_prompt_expansionMejora automáticamente tu prompt (deshabilitado por defecto)

Precios

ResoluciónDuraciónAudio desactivadoAudio activado
720p5s$0.25$0.50
720p10s$0.375$0.75
1080p5s$0.40$0.80
1080p10s$0.60$1.20

Desde solo $0.25 por video — una fracción de lo que cobran modelos comparables por generación con identidad consistente.

Consejos profesionales

  • Usa múltiples imágenes de referencia desde diferentes ángulos para lograr la preservación de identidad más precisa
  • Selecciona el tipo de toma multi para composiciones cinematográficas y dinámicas con transiciones automáticas
  • Desactiva el audio cuando no lo necesites — el procesamiento es más rápido y cuesta la mitad
  • Usa 720p para prototipos rápidos y borradores, luego cambia a 1080p para renderizados de producción final
  • Añade un prompt negativo como "blurry, distorted, deformed" para mejorar la nitidez del resultado
  • Si tu video generado carece de sonido, añade frases como “with background ambience” a tu prompt

¿Por qué WaveSpeedAI?

WaveSpeedAI proporciona la infraestructura ideal para WAN 2.6 Reference-to-Video Flash:

  • Sin arranques en frío: Cada solicitud comienza a procesarse de inmediato — sin esperar la inicialización del modelo
  • Inferencia rápida: La infraestructura optimizada combinada con la arquitectura destilada del modelo Flash significa que obtienes resultados en segundos
  • Precios accesibles: Generación de video con identidad consistente desde $0.25, con facturación transparente por generación
  • API REST simple: Integra la generación de referencia a video en cualquier aplicación o flujo de trabajo con una sola llamada a la API

Empieza a generar hoy

Alibaba WAN 2.6 Reference-to-Video Flash incorpora la generación de video con preservación de identidad a los flujos de trabajo creativos en tiempo real. Es la misma entrada multi-referencia, la misma consistencia de personajes y la misma narrativa en múltiples tomas — entregada a la velocidad que tus proyectos exigen.

Ya sea que estés iterando sobre conceptos publicitarios, construyendo una biblioteca de contenido con personajes, o previsualizando escenas para producción, este modelo elimina la espera y te permite centrarte en el trabajo creativo.

Pruébalo ahora en wavespeed.ai/models/alibaba/wan-2.6/reference-to-video-flash.