Apresentando o Alibaba WAN 2.6 Reference To Video Flash no WaveSpeedAI
O Alibaba WAN 2.6 Reference-to-Video Flash transforma referências de personagens, objetos ou cenas a partir de imagens ou vídeos em novas tomadas de vídeo com identidade, estilo e
Alibaba WAN 2.6 Reference-to-Video Flash já está disponível no WaveSpeedAI
Velocidade e consistência em harmonia. O WaveSpeedAI tem o prazer de anunciar o lançamento do Alibaba WAN 2.6 Reference-to-Video Flash, a variante rápida e destilada do modelo de geração de vídeo com preservação de identidade da Alibaba. Se você já trabalhou com fluxos de referência para vídeo e desejou que os resultados chegassem mais rápido, este modelo foi feito para você — entregando a mesma consistência de personagens e narrativa em múltiplos planos em uma fração do tempo de geração.
O que é o WAN 2.6 Reference-to-Video Flash?
O WAN 2.6 Reference-to-Video Flash é a versão otimizada para velocidade do modelo padrão WAN 2.6 Reference-to-Video. Destilado a partir do modelo completo, ele mantém a capacidade central que torna a família WAN 2.6 R2V única: você carrega imagens de referência de personagens, objetos ou cenas, escreve um prompt de texto descrevendo o vídeo desejado, e o modelo gera novos planos de vídeo que preservam fielmente a identidade e a aparência dos seus sujeitos de referência.
A versão Flash alcança uma inferência significativamente mais rápida — gerando vídeos em segundos, em vez de minutos — enquanto mantém a qualidade visual, a coerência de movimento e a preservação de identidade que definem a série WAN 2.6. Suporta até 5 imagens de referência, saída em 720p e 1080p, durações de 5 ou 10 segundos e geração de áudio sincronizado opcional.
Principais Recursos
-
Entrada com Múltiplas Referências: Carregue até 5 imagens de referência para orientar a geração. Múltiplos ângulos e pontos de vista do mesmo sujeito proporcionam melhor preservação de identidade — uma melhoria substancial em relação aos fluxos de trabalho típicos com referência única
-
Preservação de Identidade com Velocidade: O modelo Flash mantém características faciais, roupas, proporções corporais e características distintivas dos seus sujeitos de referência em cada quadro gerado, agora com tempos de espera drasticamente reduzidos
-
Composição em Múltiplos Planos: Escolha entre um único plano contínuo ou uma composição automática de múltiplos planos que divide seu prompt em vários planos coerentes com transições suaves — narrativa cinematográfica a partir de uma única chamada de API
-
Geração de Áudio Integrada: Ative o áudio sincronizado opcional, incluindo música de fundo, sons ambientes e efeitos Foley, combinados ao conteúdo do vídeo gerado. Sem necessidade de dublagem em pós-produção
-
Flexibilidade de Resolução: Gere em 720p (1280×720 ou 720×1280) ou 1080p (1920×1080 ou 1080×1920) para atender aos seus requisitos de saída — paisagem ou retrato
-
Expansão de Prompt: Um aprimorador de prompt integrado pode refinar automaticamente suas descrições em prompts mais ricos e detalhados, melhorando a qualidade da geração sem exigir engenharia avançada de prompts
Casos de Uso no Mundo Real
Conteúdo para Redes Sociais com Personagens
Crie TikToks, Reels e YouTube Shorts com personagens consistentes em múltiplos vídeos. Carregue algumas fotos do seu personagem ou mascote de marca, descreva a cena e gere conteúdo alinhado à marca em escala. A velocidade do Flash torna a iteração rápida prática — teste dezenas de variações no tempo em que o modelo padrão produz apenas algumas.
Prototipagem de Marketing e Publicidade
Gere demonstrações de produtos, comerciais de marca e conceitos de campanha com pessoas ou personagens específicos com identidade consistente em todos os planos. Use o modo de múltiplos planos para produzir sequências de anúncios estruturadas com áudio sincronizado, reduzindo dias de pré-produção para minutos.
Narrativa e Animação
Construa sequências narrativas curtas em que os personagens mantêm sua aparência entre as mudanças de cena. A capacidade de múltiplas referências permite estabelecer vários personagens em uma única geração, enquanto o modo de múltiplos planos cuida das transições e do ritmo automaticamente. Escritores e artistas de storyboard podem visualizar cenas quase tão rápido quanto as descrevem.
Pré-Visualização Rápida para Cinema
Diretores e cinematógrafos podem pré-visualizar planos e sequências usando fotos de referência de atores e locações. A velocidade do modelo Flash permite um ciclo criativo de feedback ao vivo — ajuste o prompt, regenere e veja o resultado em segundos, sem esperar em longas filas de renderização.
Vídeos para E-Commerce e Produtos
Transforme fotos estáticas de produtos em vídeos dinâmicos com branding consistente. Carregue imagens de produtos como referências, descreva o movimento e o ambiente desejados e gere conteúdo em vídeo polido pronto para listagens e anúncios.
Começando no WaveSpeedAI
Usar o WAN 2.6 Reference-to-Video Flash através da API do WaveSpeedAI é simples:
import wavespeed
output = wavespeed.run(
"alibaba/wan-2.6/reference-to-video-flash",
{
"reference_urls": [
"https://example.com/character-front.jpg",
"https://example.com/character-side.jpg"
],
"prompt": "A woman walks through a sunlit garden, turning to smile at the camera",
"size": "1280*720",
"duration": 5,
"shot_type": "multi"
},
)
print(output["outputs"][0])
Opções de Configuração
| Parâmetro | Descrição |
|---|---|
reference_urls | 1-5 imagens de referência para orientação de personagens e cenas |
prompt | Descrição em texto da cena e do movimento do vídeo |
size | Resolução de saída: 720p ou 1080p, paisagem ou retrato |
duration | Duração do vídeo: 5 ou 10 segundos |
shot_type | single para um plano contínuo, multi para composições variadas |
enable_audio | Gera áudio sincronizado (ativado por padrão) |
enable_prompt_expansion | Aprimora automaticamente seu prompt (desativado por padrão) |
Preços
| Resolução | Duração | Sem Áudio | Com Áudio |
|---|---|---|---|
| 720p | 5s | $0,25 | $0,50 |
| 720p | 10s | $0,375 | $0,75 |
| 1080p | 5s | $0,40 | $0,80 |
| 1080p | 10s | $0,60 | $1,20 |
A partir de apenas $0,25 por vídeo — uma fração do que modelos comparáveis cobram por geração com identidade consistente.
Dicas Profissionais
- Use múltiplas imagens de referência de diferentes ângulos para a preservação de identidade mais precisa
- Selecione o tipo de plano
multipara composições cinematográficas e dinâmicas com transições automáticas - Desative o áudio quando não precisar dele — o processamento é mais rápido e custa metade do preço
- Use 720p para prototipagem rápida e rascunhos, depois mude para 1080p nas renderizações finais de produção
- Adicione um prompt negativo como
"blurry, distorted, deformed"para aprimorar a qualidade da saída - Se o vídeo gerado não tiver som, adicione frases como “with background ambience” ao seu prompt
Por que WaveSpeedAI?
O WaveSpeedAI fornece a infraestrutura ideal para o WAN 2.6 Reference-to-Video Flash:
- Sem Cold Starts: Cada requisição começa a ser processada imediatamente — sem espera pela inicialização do modelo
- Inferência Rápida: Infraestrutura otimizada combinada com a arquitetura destilada do modelo Flash significa resultados em segundos
- Preços Acessíveis: Geração de vídeo com identidade consistente a partir de $0,25, com cobrança transparente por geração
- API REST Simples: Integre a geração de referência para vídeo em qualquer aplicação ou fluxo de trabalho com uma única chamada de API
Comece a Gerar Hoje
O Alibaba WAN 2.6 Reference-to-Video Flash traz a geração de vídeo com preservação de identidade para fluxos de trabalho criativos em tempo real. É a mesma entrada com múltiplas referências, a mesma consistência de personagens e a mesma narrativa em múltiplos planos — entregue na velocidade que seus projetos exigem.
Seja iterando em conceitos de anúncios, construindo uma biblioteca de conteúdo orientado a personagens ou pré-visualizando cenas para produção, este modelo elimina a espera e permite que você se concentre no trabalho criativo.
Experimente agora em wavespeed.ai/models/alibaba/wan-2.6/reference-to-video-flash.





