WaveSpeed Blog

Últimas notícias sobre modelos de geração de imagens e vídeos com IA — atualizações de engenharia, lançamentos de produtos, tutoriais e análises detalhadas.

Gemini 3.5 Flash Lançado — Um Modelo Flash Agora Lidera o Tier Pro nos Benchmarks de Agentes
gemini-3-5-flashgoogle

Gemini 3.5 Flash Lançado — Um Modelo Flash Agora Lidera o Tier Pro nos Benchmarks de Agentes

O Gemini 3.5 Flash ficou disponível para todos no I/O 2026 com raciocínio ativado por padrão, $1,50/$9 por 1M de tokens, e um perfil de benchmarks que supera o Claude Opus 4.7 e o GPT-5.5 no MCP Atlas e na maioria dos suites de agentes. Veja onde o Flash lidera, onde perde, e como fazer o deploy.

10 min read
Gemini 3.5 Pro Chega no Próximo Mês — O Que o Lançamento do Flash Já Nos Diz
gemini-3-5gemini-3-5-pro

Gemini 3.5 Pro Chega no Próximo Mês — O Que o Lançamento do Flash Já Nos Diz

O Google lançou o Gemini 3.5 Flash no I/O 2026 e reservou o Pro para junho. O Flash já supera o Gemini 3.1 Pro em benchmarks de programação e agentes, mas regrediu em raciocínio complexo — exatamente a lacuna que o Pro precisa preencher. Veja o que se sabe, o que ainda não se sabe e como se planejar.

7 min read
Gemini Omni Flash Lançado: Vídeo Multimodal de 10 Segundos, Marca d'Água SynthID, Edição de Áudio Retida
gemini-omnigemini-omni-flash

Gemini Omni Flash Lançado: Vídeo Multimodal de 10 Segundos, Marca d'Água SynthID, Edição de Áudio Retida

O Google lançou o Gemini Omni Flash no I/O 2026 — um único modelo que raciocina sobre texto, imagem, áudio e vídeo para produzir uma saída de vídeo consistente com áudio sincronizado. Veja o que foi lançado, o que não foi e como ele se diferencia do Veo.

8 min read
Vazamento do Arcanine: O Que os Desenvolvedores Não Devem Presumir

Vazamento do Arcanine: O Que os Desenvolvedores Não Devem Presumir

Arcanine surgiu em rumores de vazamentos de IA, mas não é um nome de modelo público oficial. Veja como os desenvolvedores devem interpretar esse sinal.

8 min read
Gemini 4.0 no Google I/O 2026: O que está confirmado, o que vem de fontes anônimas e o que os desenvolvedores devem realmente observar
gemini-4google

Gemini 4.0 no Google I/O 2026: O que está confirmado, o que vem de fontes anônimas e o que os desenvolvedores devem realmente observar

O Google I/O abre hoje às 10h PT. As reportagens pré-keynote sobre o novo Gemini variam de 'lançamento incremental do 3.5' a 'Gemini 4.0 completo com integração mais profunda'. Veja o que está realmente confirmado versus o que vem de fontes anônimas — e as sete coisas que os desenvolvedores devem avaliar no momento em que a ficha do modelo for divulgada.

8 min read
O Que É o OpenAI Glacier-Alpha? O Que Realmente Sabemos

O Que É o OpenAI Glacier-Alpha? O Que Realmente Sabemos

O glacier-alpha apareceu em discussões de vazamentos da OpenAI, mas não há uma página de produto oficial para ele. Aqui está o que os desenvolvedores devem e não devem inferir.

9 min read
Seedance 2.1 e Seedance 2.0 Mini estão chegando: melhoria de qualidade e novo nível de preço mais baixo
seedancebytedance

Seedance 2.1 e Seedance 2.0 Mini estão chegando: melhoria de qualidade e novo nível de preço mais baixo

A ByteDance está preparando duas novas variantes do Seedance: o Seedance 2.1 com uma melhoria de qualidade de geração de aproximadamente 20%, e um novo nível Mini que deverá custar bem abaixo do preço atual do Seedance, superando o Seedance 2.0 Fast em desempenho.

7 min read
O Que as Negociações de Financiamento da DeepSeek Significam para as Plataformas de Modelos

O Que as Negociações de Financiamento da DeepSeek Significam para as Plataformas de Modelos

As negociações de financiamento reportadas da DeepSeek podem sinalizar mais do que um salto na avaliação. Veja o que elas podem significar para o poder de precificação de modelos e a estratégia de plataforma.

10 min read
Por Que Desenvolvedores Devem Ignorar Nomes de Modelos Vazados

Por Que Desenvolvedores Devem Ignorar Nomes de Modelos Vazados

Nomes de modelos vazados como oai-2.1 geram ruído, mas equipes de produção precisam de documentação, preços, limites e sinais de suporte antes de agir.

9 min read
design.md vs Design Tokens para Fluxos de UI com IA

design.md vs Design Tokens para Fluxos de UI com IA

Compare design.md vs tokens de design tradicionais para fluxos de UI com IA, com foco em legibilidade para agentes, consistência e portabilidade de fluxo de trabalho.

11 min read
O Que É o ML Intern e Por Que os Agentes Verticais São Importantes

O Que É o ML Intern e Por Que os Agentes Verticais São Importantes

ML Intern é um agente de engenharia de ML de código aberto construído em torno de fluxos de trabalho de pesquisa e treinamento. Veja o que ele sinaliza sobre a próxima fase dos agentes verticais.

10 min read
GPT-5.6 Apareceu nos Logs do Codex da OpenAI — Veja o Que Isso Realmente Significa
gpt-5-6openai

GPT-5.6 Apareceu nos Logs do Codex da OpenAI — Veja o Que Isso Realmente Significa

Uma única entrada de roteamento nos logs de implantação do Codex da OpenAI apontou para o GPT-5.6. O Polymarket está em 89% para um lançamento em 30 de junho. Veja o que está confirmado, o que é ruído e por que o incidente do goblin é a razão pela qual os testes estão avançando tão rápido.

9 min read