Apresentando o Alibaba WAN 2.6 Reference To Video Flash no WaveSpeedAI

Alibaba WAN 2.6 Reference-to-Video Flash já está disponível no WaveSpeedAI

Velocidade e consistência em harmonia. O WaveSpeedAI tem o prazer de anunciar o lançamento do Alibaba WAN 2.6 Reference-to-Video Flash, a variante rápida e destilada do modelo de geração de vídeo com preservação de identidade da Alibaba. Se você já trabalhou com fluxos de referência para vídeo e desejou que os resultados chegassem mais rápido, este modelo foi feito para você — entregando a mesma consistência de personagens e narrativa em múltiplos planos em uma fração do tempo de geração.

O que é o WAN 2.6 Reference-to-Video Flash?

O WAN 2.6 Reference-to-Video Flash é a versão otimizada para velocidade do modelo padrão WAN 2.6 Reference-to-Video. Destilado a partir do modelo completo, ele mantém a capacidade central que torna a família WAN 2.6 R2V única: você carrega imagens de referência de personagens, objetos ou cenas, escreve um prompt de texto descrevendo o vídeo desejado, e o modelo gera novos planos de vídeo que preservam fielmente a identidade e a aparência dos seus sujeitos de referência.

A versão Flash alcança uma inferência significativamente mais rápida — gerando vídeos em segundos, em vez de minutos — enquanto mantém a qualidade visual, a coerência de movimento e a preservação de identidade que definem a série WAN 2.6. Suporta até 5 imagens de referência, saída em 720p e 1080p, durações de 5 ou 10 segundos e geração de áudio sincronizado opcional.

Principais Recursos

Entrada com Múltiplas Referências: Carregue até 5 imagens de referência para orientar a geração. Múltiplos ângulos e pontos de vista do mesmo sujeito proporcionam melhor preservação de identidade — uma melhoria substancial em relação aos fluxos de trabalho típicos com referência única
Preservação de Identidade com Velocidade: O modelo Flash mantém características faciais, roupas, proporções corporais e características distintivas dos seus sujeitos de referência em cada quadro gerado, agora com tempos de espera drasticamente reduzidos
Composição em Múltiplos Planos: Escolha entre um único plano contínuo ou uma composição automática de múltiplos planos que divide seu prompt em vários planos coerentes com transições suaves — narrativa cinematográfica a partir de uma única chamada de API
Geração de Áudio Integrada: Ative o áudio sincronizado opcional, incluindo música de fundo, sons ambientes e efeitos Foley, combinados ao conteúdo do vídeo gerado. Sem necessidade de dublagem em pós-produção
Flexibilidade de Resolução: Gere em 720p (1280×720 ou 720×1280) ou 1080p (1920×1080 ou 1080×1920) para atender aos seus requisitos de saída — paisagem ou retrato
Expansão de Prompt: Um aprimorador de prompt integrado pode refinar automaticamente suas descrições em prompts mais ricos e detalhados, melhorando a qualidade da geração sem exigir engenharia avançada de prompts

Casos de Uso no Mundo Real

Conteúdo para Redes Sociais com Personagens

Crie TikToks, Reels e YouTube Shorts com personagens consistentes em múltiplos vídeos. Carregue algumas fotos do seu personagem ou mascote de marca, descreva a cena e gere conteúdo alinhado à marca em escala. A velocidade do Flash torna a iteração rápida prática — teste dezenas de variações no tempo em que o modelo padrão produz apenas algumas.

Prototipagem de Marketing e Publicidade

Gere demonstrações de produtos, comerciais de marca e conceitos de campanha com pessoas ou personagens específicos com identidade consistente em todos os planos. Use o modo de múltiplos planos para produzir sequências de anúncios estruturadas com áudio sincronizado, reduzindo dias de pré-produção para minutos.

Narrativa e Animação

Construa sequências narrativas curtas em que os personagens mantêm sua aparência entre as mudanças de cena. A capacidade de múltiplas referências permite estabelecer vários personagens em uma única geração, enquanto o modo de múltiplos planos cuida das transições e do ritmo automaticamente. Escritores e artistas de storyboard podem visualizar cenas quase tão rápido quanto as descrevem.

Pré-Visualização Rápida para Cinema

Diretores e cinematógrafos podem pré-visualizar planos e sequências usando fotos de referência de atores e locações. A velocidade do modelo Flash permite um ciclo criativo de feedback ao vivo — ajuste o prompt, regenere e veja o resultado em segundos, sem esperar em longas filas de renderização.

Vídeos para E-Commerce e Produtos

Transforme fotos estáticas de produtos em vídeos dinâmicos com branding consistente. Carregue imagens de produtos como referências, descreva o movimento e o ambiente desejados e gere conteúdo em vídeo polido pronto para listagens e anúncios.

Começando no WaveSpeedAI

Usar o WAN 2.6 Reference-to-Video Flash através da API do WaveSpeedAI é simples:

import json
import os
import time
from urllib.request import Request, urlopen

api_key = os.environ["WAVESPEED_API_KEY"]
headers = {"Authorization": f"Bearer {api_key}", "Content-Type": "application/json"}
payload = {
    "reference_urls": [
        "https://interactive-examples.mdn.mozilla.net/media/cc0-images/painted-hand-298-332.jpg"
    ],
    "prompt": "A cinematic ocean wave at sunrise, highly detailed",
    "size": "1280*720",
    "duration": 5,
    "shot_type": "single",
    "enable_audio": True,
    "enable_prompt_expansion": False,
    "seed": -1
}

def request_json(url, data=None):
    request = Request(url, data=data, headers=headers, method="POST" if data else "GET")
    with urlopen(request) as response:
        return json.load(response)

# 1. Submit the prediction.
submit_body = request_json("https://api.wavespeed.ai/api/v3/alibaba/wan-2.6/reference-to-video-flash", json.dumps(payload).encode())
task = submit_body.get("data", submit_body)
prediction_id = task.get("id")
if not prediction_id:
    raise RuntimeError("Submission response did not contain a prediction id")
result_url = task.get("urls", {}).get("get") or f"https://api.wavespeed.ai/api/v3/predictions/{prediction_id}/result"

# 2. Poll until the prediction finishes.
while True:
    body = request_json(result_url)
    result = body.get("data", body)
    status = result.get("status")
    if status == "completed":
        print(result.get("outputs", []))
        break
    if status in {"failed", "cancelled", "timeout"}:
        raise RuntimeError(result)
    if status not in {"created", "processing"}:
        raise RuntimeError(f"Unexpected status: {status}")
    time.sleep(2)

Opções de Configuração

Parâmetro	Descrição
`reference_urls`	1-5 imagens de referência para orientação de personagens e cenas
`prompt`	Descrição em texto da cena e do movimento do vídeo
`size`	Resolução de saída: 720p ou 1080p, paisagem ou retrato
`duration`	Duração do vídeo: 5 ou 10 segundos
`shot_type`	`single` para um plano contínuo, `multi` para composições variadas
`enable_audio`	Gera áudio sincronizado (ativado por padrão)
`enable_prompt_expansion`	Aprimora automaticamente seu prompt (desativado por padrão)

Preços

Resolução	Duração	Sem Áudio	Com Áudio
720p	5s	$0,25	$0,50
720p	10s	$0,375	$0,75
1080p	5s	$0,40	$0,80
1080p	10s	$0,60	$1,20

A partir de apenas $0,25 por vídeo — uma fração do que modelos comparáveis cobram por geração com identidade consistente.

Dicas Profissionais

Use múltiplas imagens de referência de diferentes ângulos para a preservação de identidade mais precisa
Selecione o tipo de plano multi para composições cinematográficas e dinâmicas com transições automáticas
Desative o áudio quando não precisar dele — o processamento é mais rápido e custa metade do preço
Use 720p para prototipagem rápida e rascunhos, depois mude para 1080p nas renderizações finais de produção
Adicione um prompt negativo como "blurry, distorted, deformed" para aprimorar a qualidade da saída
Se o vídeo gerado não tiver som, adicione frases como “with background ambience” ao seu prompt

Por que WaveSpeedAI?

O WaveSpeedAI fornece a infraestrutura ideal para o WAN 2.6 Reference-to-Video Flash:

Sem Cold Starts: Cada requisição começa a ser processada imediatamente — sem espera pela inicialização do modelo
Inferência Rápida: Infraestrutura otimizada combinada com a arquitetura destilada do modelo Flash significa resultados em segundos
Preços Acessíveis: Geração de vídeo com identidade consistente a partir de $0,25, com cobrança transparente por geração
API REST Simples: Integre a geração de referência para vídeo em qualquer aplicação ou fluxo de trabalho com uma única chamada de API

Comece a Gerar Hoje

O Alibaba WAN 2.6 Reference-to-Video Flash traz a geração de vídeo com preservação de identidade para fluxos de trabalho criativos em tempo real. É a mesma entrada com múltiplas referências, a mesma consistência de personagens e a mesma narrativa em múltiplos planos — entregue na velocidade que seus projetos exigem.

Seja iterando em conceitos de anúncios, construindo uma biblioteca de conteúdo orientado a personagens ou pré-visualizando cenas para produção, este modelo elimina a espera e permite que você se concentre no trabalho criativo.

Experimente agora em wavespeed.ai/models/alibaba/wan-2.6/reference-to-video-flash.

Alibaba WAN 2.6 Reference-to-Video Flash já está disponível no WaveSpeedAI

O que é o WAN 2.6 Reference-to-Video Flash?

Principais Recursos

Casos de Uso no Mundo Real

Conteúdo para Redes Sociais com Personagens

Prototipagem de Marketing e Publicidade

Narrativa e Animação

Pré-Visualização Rápida para Cinema

Vídeos para E-Commerce e Produtos

Começando no WaveSpeedAI

Opções de Configuração

Preços

Dicas Profissionais

Por que WaveSpeedAI?

Comece a Gerar Hoje

Artigos relacionados

Apresentando o ByteDance Seedance 2.0 Mini no WaveSpeedAI

Claude Fable 5 com Fallback para Opus 4.8 Explicado

API do GLM-5.2: Preços, Contexto de 1M e Roteamento em Produção

Preços do GPT-5.4 Mini: Custo de Entrada, Cache e Saída

API MAI-Image-2.5: O Que os Desenvolvedores Precisam Saber

Preço do MiniMax M3: Custo de API de Contexto Longo para Desenvolvedores