← Blog

Qwen Image 2.0 Está Chegando ao WaveSpeed

O Qwen Image 2.0 da Alibaba — o modelo unificado de geração e edição de imagens mais bem classificado — está chegando ao WaveSpeedAI. Veja o que ele traz e por que isso é importante.

4 min read

Qwen Image 2.0 está chegando ao WaveSpeedAI.

O mais recente modelo de fundação de imagens da Alibaba unifica a geração de imagens a partir de texto e a edição de imagens em uma única arquitetura de 7B parâmetros — e atualmente ocupa o 1º lugar no ranking de avaliação humana cega do AI Arena tanto para geração quanto para edição.

O WaveSpeed já hospeda a linha completa de modelos Qwen Image — Qwen-Image, Qwen-Image-Edit, Qwen-Image-Max e múltiplas variantes LoRA. O Qwen Image 2.0 é o próximo passo.


O Que Torna o Qwen Image 2.0 Diferente

Um Único Modelo para Geração e Edição

As versões anteriores do Qwen Image utilizavam modelos separados — um para gerar imagens a partir de texto, outro para editar imagens existentes. O Qwen Image 2.0 une ambos em um único modelo. Gere uma imagem e edite-a, tudo pelo mesmo endpoint.

Isso abrange transferência de estilo, inserção e remoção de objetos, sobreposição de texto em fotos, composição de múltiplas imagens e edição entre domínios (por exemplo, inserir personagens ilustrados em fotos reais).

Resolução Nativa de 2K

O modelo gera imagens de até 2048 x 2048 pixels de forma nativa — sem redimensionamento. Detalhes finos como poros da pele, textura de tecido e detalhes arquitetônicos são renderizados durante a geração, não adicionados depois.

Renderização Profissional de Texto

Esta é a funcionalidade principal. O Qwen Image 2.0 renderiza layouts complexos de texto diretamente a partir de prompts — slides de apresentação, infográficos, pôsteres de filmes, calendários, gráficos de dados e quadrinhos. Suporta prompts de até 1.000 tokens, trata tanto texto em chinês quanto em inglês com precisão e adapta o texto a diferentes superfícies com perspectiva correta.

Menor e Mais Rápido

7B parâmetros, reduzindo os 20B da v1. Quase 3x menor enquanto supera seu antecessor em todos os benchmarks. A arquitetura — um encoder Qwen3-VL de 8B alimentando um decoder de difusão de 7B — é projetada para inferência eficiente.


Benchmarks

BenchmarkQwen Image 2.0GPT Image 1FLUX.1
DPG-Bench88,3285,1583,84
GenEval0,91
AI Arena ELO#1 (geração)
AI Arena ELO#1 (edição)

O AI Arena utiliza avaliação humana cega — os avaliadores comparam os resultados lado a lado sem saber qual modelo os produziu. O Qwen Image 2.0 lidera em ambas as categorias.


Por Que WaveSpeed

Quando o Qwen Image 2.0 for lançado no WaveSpeed, você terá:

  • Sem cold starts — inferência sempre ativa
  • Geração rápida — serviço otimizado para cargas de trabalho em produção
  • API simples — a mesma interface wavespeed.run() que você já utiliza
  • Pagamento por imagem — sem assinaturas ou gerenciamento de GPU

Se você já usa os modelos Qwen Image no WaveSpeed, o caminho de atualização é direto. Mesmo SDK, mesmo fluxo de trabalho, modelo melhor.


O Que Você Pode Construir Com Ele

Marketing e design — Gere slides de apresentação, infográficos e pôsteres com texto preciso diretamente a partir de prompts. Sem necessidade de ajustes no Photoshop para materiais de rascunho.

Pipelines de conteúdo — Um único modelo gerencia o loop completo de gerar → editar → iterar. Sem encadear ferramentas separadas para geração, edição e sobreposição de texto.

Conteúdo multilíngue — Renderização precisa de texto em chinês e inglês na mesma imagem. Útil para marketing bilíngue, mockups de embalagens e materiais criativos localizados.

Fotografia de produto — A saída nativa em 2K com detalhes finos torna as imagens geradas mais próximas da qualidade de produção sem etapas adicionais de redimensionamento.


Fique Atualizado

O Qwen Image 2.0 estará disponível no WaveSpeed em breve. Acompanhe o wavespeed.ai para o anúncio do lançamento.

Enquanto isso, explore os modelos Qwen Image atuais já disponíveis no WaveSpeed:

Compartilhar