WaveSpeed Blog

Últimas noticias sobre modelos de generación de imágenes y videos con IA: actualizaciones de ingeniería, lanzamientos de productos, tutoriales y análisis a fondo.

Gemini 3.5 Flash ya disponible — un modelo de nivel Flash lidera los benchmarks del nivel Pro en agentes
gemini-3-5-flashgoogle

Gemini 3.5 Flash ya disponible — un modelo de nivel Flash lidera los benchmarks del nivel Pro en agentes

Gemini 3.5 Flash llegó a disponibilidad general en I/O 2026 con razonamiento activado por defecto, $1,50/$9 por millón de tokens, y un perfil de rendimiento que supera a Claude Opus 4.7 y GPT-5.5 en MCP Atlas y la mayoría de suites de agentes. Aquí se muestra dónde Flash lidera, dónde pierde y cómo desplegarlo.

9 min read
Gemini 3.5 Pro llegará el próximo mes — Lo que el lanzamiento de Flash ya nos dice
gemini-3-5gemini-3-5-pro

Gemini 3.5 Pro llegará el próximo mes — Lo que el lanzamiento de Flash ya nos dice

Google lanzó Gemini 3.5 Flash en I/O 2026 y reservó Pro para junio. Flash ya supera a Gemini 3.1 Pro en benchmarks de codificación y agentes, pero retrocedió en razonamiento complejo — exactamente la brecha que Pro necesita cerrar. Esto es lo que se sabe, lo que no, y cómo planificar.

7 min read
Gemini Omni Flash ha llegado: video multimodal de 10 segundos, marca de agua SynthID, edición de audio retenida
gemini-omnigemini-omni-flash

Gemini Omni Flash ha llegado: video multimodal de 10 segundos, marca de agua SynthID, edición de audio retenida

Google lanzó Gemini Omni Flash en I/O 2026 — un único modelo que razona a través de texto, imagen, audio y video para producir una salida de video coherente con audio sincronizado. Esto es lo que se lanzó, lo que no, y cómo se diferencia de Veo.

9 min read
Filtración de Arcanine: Lo que los Desarrolladores No Deben Asumir

Filtración de Arcanine: Lo que los Desarrolladores No Deben Asumir

Arcanine ha aparecido en conversaciones de filtraciones de IA, pero no es un nombre oficial de modelo público. Aquí se explica cómo los desarrolladores deben interpretar esa señal.

8 min read
Gemini 4.0 en Google I/O 2026: Qué está confirmado, qué viene de fuentes anónimas y qué deben vigilar realmente los desarrolladores
gemini-4google

Gemini 4.0 en Google I/O 2026: Qué está confirmado, qué viene de fuentes anónimas y qué deben vigilar realmente los desarrolladores

Google I/O abre hoy a las 10 AM PT. Los reportes previos al keynote sobre el nuevo Gemini van desde 'lanzamiento incremental 3.5' hasta 'Gemini 4.0 completo con integración más profunda'. Aquí está lo que realmente está confirmado frente a lo que proviene de fuentes anónimas, y las siete cosas que los desarrolladores deben evaluar en el momento en que se publique la ficha del modelo.

8 min read
¿Qué es OpenAI Glacier-Alpha? Lo que realmente sabemos

¿Qué es OpenAI Glacier-Alpha? Lo que realmente sabemos

Glacier-alpha ha aparecido en discusiones de filtraciones de OpenAI, pero no existe una página oficial del producto. Esto es lo que los desarrolladores deben y no deben inferir.

9 min read
Seedance 2.1 y Seedance 2.0 Mini están en camino: Mejora de calidad y nivel de precio más bajo
seedancebytedance

Seedance 2.1 y Seedance 2.0 Mini están en camino: Mejora de calidad y nivel de precio más bajo

ByteDance está preparando dos nuevas variantes de Seedance: Seedance 2.1 con una mejora reportada de ~20% en la calidad de generación, y un nuevo nivel Mini que se dice estará muy por debajo del precio actual de Seedance mientras supera a Seedance 2.0 Fast.

7 min read
Qué significan las conversaciones de financiación de DeepSeek para las plataformas de modelos

Qué significan las conversaciones de financiación de DeepSeek para las plataformas de modelos

Las conversaciones de financiación reportadas de DeepSeek podrían señalar algo más que un aumento de valoración. Esto es lo que pueden significar para el poder de fijación de precios de modelos y la estrategia de plataformas.

10 min read
Por qué los desarrolladores deben ignorar los nombres de modelos filtrados

Por qué los desarrolladores deben ignorar los nombres de modelos filtrados

Los nombres de modelos filtrados como oai-2.1 generan ruido, pero los equipos de producción necesitan documentación, precios, límites y señales de soporte antes de actuar.

10 min read
design.md vs Tokens de Diseño para Flujos de Trabajo de UI con IA

design.md vs Tokens de Diseño para Flujos de Trabajo de UI con IA

Compara design.md frente a los tokens de diseño tradicionales para flujos de trabajo de UI con IA, con enfoque en la legibilidad de agentes, la consistencia y la portabilidad del flujo de trabajo.

11 min read
Qué Es ML Intern y Por Qué Importan los Agentes Verticales

Qué Es ML Intern y Por Qué Importan los Agentes Verticales

ML Intern es un agente de ingeniería ML de código abierto construido en torno a flujos de trabajo de investigación y entrenamiento. Esto es lo que señala sobre la próxima fase de los agentes verticales.

10 min read
GPT-5.6 Apareció en los Registros de Codex de OpenAI — Esto Es Lo Que Realmente Significa
gpt-5-6openai

GPT-5.6 Apareció en los Registros de Codex de OpenAI — Esto Es Lo Que Realmente Significa

Una sola entrada de enrutamiento en los registros de implementación de Codex de OpenAI apuntó a GPT-5.6. Polymarket está al 89% en un lanzamiento para el 30 de junio. Esto es lo que está confirmado, lo que es ruido y por qué el incidente goblin es la razón por la que las pruebas avanzan tan rápido.

10 min read