← Blog

Apresentando o Alibaba WAN 2.6 Reference To Video Flash no WaveSpeedAI

O Alibaba WAN 2.6 Reference-to-Video Flash transforma referências de personagens, objetos ou cenas a partir de imagens ou vídeos em novas tomadas de vídeo com identidade, estilo e

7 min read
Alibaba Wan.2.6 Reference To Video Flash
Alibaba Wan.2.6 Reference To Video Flash O Alibaba WAN 2.6 Reference-to-Video Flash transforma referê...
Try it
Apresentando o Alibaba WAN 2.6 Reference To Video Flash no WaveSpeedAI

Alibaba WAN 2.6 Reference-to-Video Flash já está disponível no WaveSpeedAI

Velocidade e consistência em harmonia. O WaveSpeedAI tem o prazer de anunciar o lançamento do Alibaba WAN 2.6 Reference-to-Video Flash, a variante rápida e destilada do modelo de geração de vídeo com preservação de identidade da Alibaba. Se você já trabalhou com fluxos de referência para vídeo e desejou que os resultados chegassem mais rápido, este modelo foi feito para você — entregando a mesma consistência de personagens e narrativa em múltiplos planos em uma fração do tempo de geração.

O que é o WAN 2.6 Reference-to-Video Flash?

O WAN 2.6 Reference-to-Video Flash é a versão otimizada para velocidade do modelo padrão WAN 2.6 Reference-to-Video. Destilado a partir do modelo completo, ele mantém a capacidade central que torna a família WAN 2.6 R2V única: você carrega imagens de referência de personagens, objetos ou cenas, escreve um prompt de texto descrevendo o vídeo desejado, e o modelo gera novos planos de vídeo que preservam fielmente a identidade e a aparência dos seus sujeitos de referência.

A versão Flash alcança uma inferência significativamente mais rápida — gerando vídeos em segundos, em vez de minutos — enquanto mantém a qualidade visual, a coerência de movimento e a preservação de identidade que definem a série WAN 2.6. Suporta até 5 imagens de referência, saída em 720p e 1080p, durações de 5 ou 10 segundos e geração de áudio sincronizado opcional.

Principais Recursos

  • Entrada com Múltiplas Referências: Carregue até 5 imagens de referência para orientar a geração. Múltiplos ângulos e pontos de vista do mesmo sujeito proporcionam melhor preservação de identidade — uma melhoria substancial em relação aos fluxos de trabalho típicos com referência única

  • Preservação de Identidade com Velocidade: O modelo Flash mantém características faciais, roupas, proporções corporais e características distintivas dos seus sujeitos de referência em cada quadro gerado, agora com tempos de espera drasticamente reduzidos

  • Composição em Múltiplos Planos: Escolha entre um único plano contínuo ou uma composição automática de múltiplos planos que divide seu prompt em vários planos coerentes com transições suaves — narrativa cinematográfica a partir de uma única chamada de API

  • Geração de Áudio Integrada: Ative o áudio sincronizado opcional, incluindo música de fundo, sons ambientes e efeitos Foley, combinados ao conteúdo do vídeo gerado. Sem necessidade de dublagem em pós-produção

  • Flexibilidade de Resolução: Gere em 720p (1280×720 ou 720×1280) ou 1080p (1920×1080 ou 1080×1920) para atender aos seus requisitos de saída — paisagem ou retrato

  • Expansão de Prompt: Um aprimorador de prompt integrado pode refinar automaticamente suas descrições em prompts mais ricos e detalhados, melhorando a qualidade da geração sem exigir engenharia avançada de prompts

Casos de Uso no Mundo Real

Conteúdo para Redes Sociais com Personagens

Crie TikToks, Reels e YouTube Shorts com personagens consistentes em múltiplos vídeos. Carregue algumas fotos do seu personagem ou mascote de marca, descreva a cena e gere conteúdo alinhado à marca em escala. A velocidade do Flash torna a iteração rápida prática — teste dezenas de variações no tempo em que o modelo padrão produz apenas algumas.

Prototipagem de Marketing e Publicidade

Gere demonstrações de produtos, comerciais de marca e conceitos de campanha com pessoas ou personagens específicos com identidade consistente em todos os planos. Use o modo de múltiplos planos para produzir sequências de anúncios estruturadas com áudio sincronizado, reduzindo dias de pré-produção para minutos.

Narrativa e Animação

Construa sequências narrativas curtas em que os personagens mantêm sua aparência entre as mudanças de cena. A capacidade de múltiplas referências permite estabelecer vários personagens em uma única geração, enquanto o modo de múltiplos planos cuida das transições e do ritmo automaticamente. Escritores e artistas de storyboard podem visualizar cenas quase tão rápido quanto as descrevem.

Pré-Visualização Rápida para Cinema

Diretores e cinematógrafos podem pré-visualizar planos e sequências usando fotos de referência de atores e locações. A velocidade do modelo Flash permite um ciclo criativo de feedback ao vivo — ajuste o prompt, regenere e veja o resultado em segundos, sem esperar em longas filas de renderização.

Vídeos para E-Commerce e Produtos

Transforme fotos estáticas de produtos em vídeos dinâmicos com branding consistente. Carregue imagens de produtos como referências, descreva o movimento e o ambiente desejados e gere conteúdo em vídeo polido pronto para listagens e anúncios.

Começando no WaveSpeedAI

Usar o WAN 2.6 Reference-to-Video Flash através da API do WaveSpeedAI é simples:

import wavespeed

output = wavespeed.run(
    "alibaba/wan-2.6/reference-to-video-flash",
    {
        "reference_urls": [
            "https://example.com/character-front.jpg",
            "https://example.com/character-side.jpg"
        ],
        "prompt": "A woman walks through a sunlit garden, turning to smile at the camera",
        "size": "1280*720",
        "duration": 5,
        "shot_type": "multi"
    },
)

print(output["outputs"][0])

Opções de Configuração

ParâmetroDescrição
reference_urls1-5 imagens de referência para orientação de personagens e cenas
promptDescrição em texto da cena e do movimento do vídeo
sizeResolução de saída: 720p ou 1080p, paisagem ou retrato
durationDuração do vídeo: 5 ou 10 segundos
shot_typesingle para um plano contínuo, multi para composições variadas
enable_audioGera áudio sincronizado (ativado por padrão)
enable_prompt_expansionAprimora automaticamente seu prompt (desativado por padrão)

Preços

ResoluçãoDuraçãoSem ÁudioCom Áudio
720p5s$0,25$0,50
720p10s$0,375$0,75
1080p5s$0,40$0,80
1080p10s$0,60$1,20

A partir de apenas $0,25 por vídeo — uma fração do que modelos comparáveis cobram por geração com identidade consistente.

Dicas Profissionais

  • Use múltiplas imagens de referência de diferentes ângulos para a preservação de identidade mais precisa
  • Selecione o tipo de plano multi para composições cinematográficas e dinâmicas com transições automáticas
  • Desative o áudio quando não precisar dele — o processamento é mais rápido e custa metade do preço
  • Use 720p para prototipagem rápida e rascunhos, depois mude para 1080p nas renderizações finais de produção
  • Adicione um prompt negativo como "blurry, distorted, deformed" para aprimorar a qualidade da saída
  • Se o vídeo gerado não tiver som, adicione frases como “with background ambience” ao seu prompt

Por que WaveSpeedAI?

O WaveSpeedAI fornece a infraestrutura ideal para o WAN 2.6 Reference-to-Video Flash:

  • Sem Cold Starts: Cada requisição começa a ser processada imediatamente — sem espera pela inicialização do modelo
  • Inferência Rápida: Infraestrutura otimizada combinada com a arquitetura destilada do modelo Flash significa resultados em segundos
  • Preços Acessíveis: Geração de vídeo com identidade consistente a partir de $0,25, com cobrança transparente por geração
  • API REST Simples: Integre a geração de referência para vídeo em qualquer aplicação ou fluxo de trabalho com uma única chamada de API

Comece a Gerar Hoje

O Alibaba WAN 2.6 Reference-to-Video Flash traz a geração de vídeo com preservação de identidade para fluxos de trabalho criativos em tempo real. É a mesma entrada com múltiplas referências, a mesma consistência de personagens e a mesma narrativa em múltiplos planos — entregue na velocidade que seus projetos exigem.

Seja iterando em conceitos de anúncios, construindo uma biblioteca de conteúdo orientado a personagens ou pré-visualizando cenas para produção, este modelo elimina a espera e permite que você se concentre no trabalho criativo.

Experimente agora em wavespeed.ai/models/alibaba/wan-2.6/reference-to-video-flash.

Compartilhar