← Blog

WAN 2.7 vs WAN 2.6: Diferenças de Recursos e Decisão de Atualização

WAN 2.7 vs WAN 2.6 comparados: novos recursos, mudanças no nível da API e um guia de decisão para equipes que já utilizam WAN em produção.

10 min read
WAN 2.7 vs WAN 2.6: Diferenças de Recursos e Decisão de Atualização

Olá a todos, sou a Dora. Tenho acompanhado a família de modelos WAN avançar pelos seus ciclos de versões em silêncio — não com entusiasmo, mas com a atenção que se dedica a decisões de infraestrutura difíceis de reverter. O WAN 2.7 está previsto para março de 2026, e a lista de funcionalidades é suficientemente notável para valer a pena detalhar exatamente o que muda, o que permanece igual e onde ainda há incerteza antes de tocar em qualquer coisa em produção.

Decisão em 30 Segundos (Leia Isto Primeiro)

Atualize agora se precisar de:

  • Controlo do primeiro e do último fotograma num único clip (controlo estrutural de cena, não apenas âncora de animação)
  • Entrada de múltiplas imagens através de layout em grelha 3×3 para composições I2V mais ricas
  • Edição de vídeos existentes por instruções em linguagem natural — alterar fundo, iluminação ou vestuário sem gerar novamente do zero
  • Até 5 referências de vídeo simultâneas (o 2.6 limita a menos; o 2.7 expande significativamente)
  • Referência combinada de sujeito + voz numa única passagem (R2V melhorado)

Fique no 2.6 se precisar de:

  • Uma API estável e documentada com comportamento testado em produção
  • Implementações auto-hospedadas — o estatuto de open-weight do WAN 2.7 ainda não está confirmado
  • Clareza orçamental — os preços do 2.7 ainda não foram publicados no momento desta escrita

Tabela de Comparação de Funcionalidades

Controlo do Primeiro/Último Fotograma: 2.6 vs 2.7

O WAN 2.6 introduziu ancoragem básica do primeiro fotograma para I2V. O WAN 2.7 adiciona controlo do último fotograma a par disso, o que significa que é possível definir ambos os extremos de um clip. Para equipas que constroem sequências narrativas ou conteúdo em loop, esta é a diferença entre descrever movimento e realmente compô-lo. O modelo infere a trajetória entre os dois fotogramas-chave.

Isto tem implicações reais no fluxo de trabalho: em vez de gerar múltiplos candidatos e esperar que um corresponda ao final pretendido, constrange-se o espaço de saída por ambos os extremos.

I2V com Múltiplas Entradas (Grelha 9): Novidade no 2.7

Esta é a funcionalidade estruturalmente mais inovadora do 2.7. Em vez de uma única imagem de referência, o layout em grelha 9 aceita uma disposição 3×3 de imagens — permitindo fornecer referências de múltiplos ângulos, poses sequenciais ou variantes de cena numa única geração I2V. O modelo utiliza esta entrada visual estruturada para melhorar a composição de cena e reduzir a deriva.

Se isto supera significativamente o I2V de imagem única bem promovido na prática é algo que gostaria de testar diretamente. A arquitetura é interessante. O delta no mundo real precisa de medição.

Referência de Voz: R2V no 2.6 → Melhorado no 2.7

O WAN 2.6 introduziu Reference-to-Video com entrada de voz. O WAN 2.7 refina isto num sujeito + referência de voz combinados — um único fluxo de trabalho que ancora simultaneamente tanto a aparência do personagem como a direção de voz. Para equipas que constroem apresentadores virtuais ou conteúdo liderado por personagens em escala, isto reduz consideravelmente o número de etapas do pipeline. Pode ler sobre a arquitetura de sincronização áudio-visual mais ampla que suporta esta família na investigação do modelo Wan da Alibaba no Hugging Face.

Edição Baseada em Instruções: Novidade no 2.7

Esta é a funcionalidade que faz o 2.7 parecer qualitativamente diferente de um modelo de geração puro. É possível passar um vídeo existente juntamente com uma instrução em linguagem natural (“muda o fundo para uma rua encharcada pela chuva,” “troca o casaco para vermelho”) e receber uma saída editada em vez de uma nova geração.

Isto é operacionalmente relevante: ciclos de iteração que antes exigiam geração do zero podem agora ser tratados como edições ligeiras. Também significa que a estratégia de prompts muda — passará a escrever instruções de edição, não prompts de geração.

Resolução e Duração de Saída

Tanto o 2.6 como o 2.7 suportam até 1080P e até 15 segundos. Sem alterações aqui. Se a resolução ou duração era a sua principal restrição, esta versão não expande esses limites.

Contagem de Referências de Vídeo (Até 5 no 2.7)

O WAN 2.6 suporta referências de vídeo únicas ou duplas para consistência de sujeito. O WAN 2.7 eleva isto para cinco referências simultâneas, útil para cenas com múltiplos personagens ou fluxos de trabalho de produção que exigem consistência estrita de marca entre ativos de referência.

Alterações ao Nível da API para Programadores

Novos Parâmetros / Estrutura de Payload

A entrada em grelha 9 e a edição baseada em instruções quase certamente requerem novos campos de payload — estruturas de array de imagens, um parâmetro edit_instruction e possivelmente um endpoint distinto ou sinalizador de modo. Até que a documentação oficial da API seja publicada, trate qualquer especulação de parâmetros de terceiros como provisória. O repositório GitHub do modelo WAN tem sido historicamente o primeiro lugar onde a equipa da Alibaba documenta alterações de esquema para versões open-weight.

Alterações de Endpoint e ID de Modelo

Espere um novo ID de modelo (por exemplo, wan-2.7-i2v, wan-2.7-edit) distinto do wan-2.6-i2v. Plataformas como a fal.ai que fornecem inferência hospedada publicam tipicamente a disponibilidade de endpoints dentro de dias após um lançamento oficial — vale a pena monitorizar diretamente o seu changelog.

Compatibilidade com Fluxos de Trabalho WAN 2.6

Os payloads padrão de I2V e T2V (entrada de imagem única, prompt de texto, resolução, duração) deverão ser estruturalmente compatíveis. As novas funcionalidades parecem aditivas em vez de disruptivas. Dito isto, não assuma que o comportamento dos prompts é idêntico — os ajustes de afinação de seguimento de instruções significam que prompts calibrados para o 2.6 podem produzir resultados diferentes no 2.7 mesmo sem alterações de payload.

Qualidade e Desempenho: O Que as Evidências Mostram

Afirmações sobre Fidelidade Visual

Os materiais de pré-lançamento descrevem melhorias na nitidez, precisão de cor e preservação de detalhes. Não vou reafirmar isso como facto — é exatamente o tipo de afirmação que precisa de dados de benchmark. Assim que os benchmarks oficiais forem publicados, compare com os seus próprios prompts representativos. As pontuações agregadas raramente capturam os casos extremos de falha que mais importam para fluxos de trabalho específicos.

Melhorias na Sincronização de Áudio

O WAN 2.5 introduziu geração de áudio nativa. O WAN 2.6 refiniu-a. O WAN 2.7 afirma melhorias adicionais na sincronização áudio-visual. O blog da fal.ai sobre a arquitetura de áudio do WAN 2.5 fornece contexto útil sobre como o pipeline de sincronização evoluiu — vale a pena ler antes de avaliar as afirmações do 2.7 com o seu próprio áudio de teste.

Consistência de Movimento

Descrita como mais suave e mais fisicamente plausível do que o 2.6. Esta é a afirmação de qualidade mais difícil de avaliar sem executar os seus próprios clips. A consistência de movimento degrada-se de forma imprevisível em casos extremos — ângulos de câmara incomuns, movimento rápido, fundos complexos. Execute os seus casos de uso específicos, não demonstrações genéricas.

Implicações de Custo da Atualização

Nova Estrutura de Custos das Funcionalidades

O I2V em grelha 9 e a edição baseada em instruções quase certamente terão perfis de custo diferentes da geração I2V padrão. A inferência com múltiplas entradas é computacionalmente mais pesada. Orce em conformidade, mas não finalize projeções até que os preços estejam ativos.

Custo de Computação: Grelha 9 vs I2V de Imagem Única

Nove imagens de referência versus uma representa um aumento significativo no processamento de entrada. Se estiver a executar pipelines automatizados de alto volume, modele este pressuposto nas suas estimativas de custo antes de migrar: a grelha 9 provavelmente custa mais por geração do que I2V de imagem única com resolução e duração equivalentes.

Lista de Verificação de Migração para Equipas já no WAN 2.5/2.6

  • Audite os payloads existentes em busca de IDs de modelo codificados — atualize para o endpoint 2.7 quando disponível
  • Re-teste os seus 10 prompts mais utilizados contra o 2.7 antes da migração completa
  • Avalie a edição baseada em instruções para fluxos de trabalho que atualmente usam re-geração para iteração
  • Verifique o formato de entrada em grelha 9 com o seu pipeline de imagens existente
  • Adie a migração de nós ComfyUI até que nós 2.7 verificados pela comunidade sejam publicados
  • Confirme os preços com o seu fornecedor de inferência antes de escalar o uso de novas funcionalidades
  • Não deprecie os fluxos de trabalho 2.6 até que a estabilidade da API 2.7 seja confirmada em produção

FAQ

  1. Posso chamar o WAN 2.7 e o WAN 2.6 com a mesma chave de API? Quase certamente sim se estiver a usar um fornecedor de inferência hospedada — a seleção de modelo é por pedido. Confirme com o seu fornecedor específico.
  2. Os prompts do WAN 2.6 são compatíveis com o 2.7? Estruturalmente, provavelmente sim. Comportamentalmente, não é garantido. Os ajustes de afinação de seguimento de instruções variam entre versões. Trate os prompts do 2.6 como pontos de partida, não como ativos acabados.
  3. O 2.7 muda a forma como estruturo entradas de imagens para I2V? I2V de imagem única padrão: provavelmente sem alterações. Grelha 9: estrutura completamente nova. Documente ambos os caminhos separadamente na sua base de código.
  4. O que acontece aos meus fluxos de trabalho ComfyUI do WAN 2.5? Os nós WAN 2.7 não existirão até que colaboradores da comunidade os publiquem após o lançamento. O blog do ComfyUI tem sido historicamente o lugar mais rápido para encontrar nós parceiros verificados para novos lançamentos do Wan.
  5. O WAN 2.7 está disponível para auto-hospedagem? Desconhecido no momento desta escrita. A família Wan tem variado — algumas versões lançadas sob Apache 2.0 como pesos abertos, outras apenas via API proprietária. Confirme antes de construir um plano de auto-hospedagem em torno do 2.7.

Conclusão

O WAN 2.7 é uma versão significativa se o seu trabalho envolve iteração, consistência de personagens ou composição com múltiplas entradas. A edição baseada em instruções transforma o modelo de uma ferramenta de geração em algo mais próximo de um pipeline de edição de vídeo — o que muda a forma como estruturaria os fluxos de trabalho, não apenas os prompts que escreve.

O que não é: uma razão para migrar imediatamente. Os detalhes da API não estão finalizados, os preços não estão publicados e as afirmações de qualidade precisam de validação em relação ao seu conteúdo de produção real. Incorpore a avaliação do 2.7 no seu sprint assim que a documentação for publicada, execute-o em paralelo com o 2.6 e tome a decisão de migração com dados em vez de entusiasmo do dia de lançamento.

Farei um acompanhamento com um guia de início rápido da API do WAN 2.7 assim que a documentação oficial estiver disponível — cobrindo a estrutura do payload, o formato de entrada em grelha 9 e um exemplo de edição por instrução funcional para equipas que já executam o 2.6 em produção.

Posts Anteriores:

Compartilhar