WaveSpeed Blog

AI图像和视频生成模型的最新资讯 — 工程更新、产品发布、教程与深度解析。

Gemini 3.5 Flash正式发布——Flash级模型在智能体基准测试中领先Pro级
gemini-3-5-flashgoogle

Gemini 3.5 Flash正式发布——Flash级模型在智能体基准测试中领先Pro级

Gemini 3.5 Flash在I/O 2026上正式发布,默认开启思考模式,定价$1.50/$9每百万token,在MCP Atlas及多数智能体测试套件中超越Claude Opus 4.7和GPT-5.5。本文解析Flash的领先项目、不足之处及部署方案。

4 min read
Gemini 3.5 Pro 下月发布——Flash 已经透露了什么
gemini-3-5gemini-3-5-pro

Gemini 3.5 Pro 下月发布——Flash 已经透露了什么

谷歌在 I/O 2026 上发布了 Gemini 3.5 Flash,并将 Pro 版本推迟至六月。Flash 已在编程和智能体基准测试中超越 Gemini 3.1 Pro,但在高难度推理上出现退步——这正是 Pro 需要弥补的差距。以下是已知信息、未知信息以及如何规划。

3 min read
Gemini Omni Flash 正式发布:10秒多模态视频、SynthID水印,音频编辑功能暂未开放
gemini-omnigemini-omni-flash

Gemini Omni Flash 正式发布:10秒多模态视频、SynthID水印,音频编辑功能暂未开放

谷歌在I/O 2026上发布了Gemini Omni Flash——一个能够跨文本、图像、音频和视频进行推理的单一模型,可生成带同步音频的连贯视频输出。本文详解已发布功能、尚未开放的功能,以及它与Veo的区别。

2 min read
Arcanine泄露:开发者不应妄加假设的几件事

Arcanine泄露:开发者不应妄加假设的几件事

Arcanine出现在AI泄露讨论中,但它并非官方公开的模型名称。以下是开发者应如何解读这一信号的建议。

1 min read
Gemini 4.0 at Google I/O 2026: What's Confirmed, What's Anonymous-Sourced, What Builders Should Actually Watch For
gemini-4google

Gemini 4.0 at Google I/O 2026: What's Confirmed, What's Anonymous-Sourced, What Builders Should Actually Watch For

Google I/O opens today at 10 AM PT. The pre-keynote reporting on the new Gemini ranges from 'incremental 3.5 release' to 'full Gemini 4.0 with deeper integration.' Here's what's actually confirmed versus what's anonymous sourcing — and the seven things builders should evaluate the moment the model card drops.

2 min read
OpenAI Glacier-Alpha 究竟是什么?我们目前真正了解的情况

OpenAI Glacier-Alpha 究竟是什么?我们目前真正了解的情况

glacier-alpha 出现在 OpenAI 泄露讨论中,但目前没有官方产品页面。以下是开发者应该和不应该从中推断的内容。

2 min read
Seedance 2.1 与 Seedance 2.0 Mini 即将到来:画质提升,价格更低
seedancebytedance

Seedance 2.1 与 Seedance 2.0 Mini 即将到来:画质提升,价格更低

字节跳动正在准备两个全新的 Seedance 版本:Seedance 2.1 据报道生成质量提升约 20%,而全新的 Mini 版本定价将远低于当前 Seedance 价格,同时性能超越 Seedance 2.0 Fast。

2 min read
DeepSeek融资谈判对模型平台意味着什么

DeepSeek融资谈判对模型平台意味着什么

DeepSeek据报道的融资谈判可能不仅仅意味着估值上涨。以下是这对模型定价权和平台战略可能意味着什么。

1 min read
为什么开发者应该忽略泄露的模型名称

为什么开发者应该忽略泄露的模型名称

泄露的模型名称(如oai-2.1)制造了噪音,但生产团队在行动之前需要文档、定价、限制和支持信号。

1 min read
design.md与设计令牌在AI UI工作流中的对比

design.md与设计令牌在AI UI工作流中的对比

对比design.md与传统设计令牌在AI UI工作流中的应用,重点关注代理可读性、一致性和工作流可移植性。

2 min read
什么是ML Intern,以及为什么垂直智能体很重要

什么是ML Intern,以及为什么垂直智能体很重要

ML Intern是一个围绕研究和训练工作流构建的开源ML工程智能体。以下是它对垂直智能体下一阶段的启示。

2 min read
GPT-5.6出现在OpenAI的Codex日志中——这究竟意味着什么
gpt-5-6openai

GPT-5.6出现在OpenAI的Codex日志中——这究竟意味着什么

OpenAI Codex发布日志中的一条路由记录指向了GPT-5.6。Polymarket对6月30日发布的预测概率已达89%。以下是已经确认的内容、哪些只是噪音,以及为什么Goblin事件导致测试进展如此之快。

2 min read