#google

108 articles

Gemini 3.5 Flash正式发布——Flash级模型在智能体基准测试中领先Pro级

Gemini 3.5 Flash在I/O 2026上正式发布，默认开启思考模式，定价$1.50/$9每百万token，在MCP Atlas及多数智能体测试套件中超越Claude Opus 4.7和GPT-5.5。本文解析Flash的领先项目、不足之处及部署方案。

2026-05-20 4 分钟阅读

Gemini 3.5 Pro 下月发布——Flash 已经透露了什么

谷歌在 I/O 2026 上发布了 Gemini 3.5 Flash，并将 Pro 版本推迟至六月。Flash 已在编程和智能体基准测试中超越 Gemini 3.1 Pro，但在高难度推理上出现退步——这正是 Pro 需要弥补的差距。以下是已知信息、未知信息以及如何规划。

2026-05-20 3 分钟阅读

Gemini Omni Flash 正式发布：10秒多模态视频、SynthID水印，音频编辑功能暂未开放

谷歌在I/O 2026上发布了Gemini Omni Flash——一个能够跨文本、图像、音频和视频进行推理的单一模型，可生成带同步音频的连贯视频输出。本文详解已发布功能、尚未开放的功能，以及它与Veo的区别。

2026-05-20 2 分钟阅读

Gemini 4.0 at Google I/O 2026: What's Confirmed, What's Anonymous-Sourced, What Builders Should Actually Watch For

Google I/O opens today at 10 AM PT. The pre-keynote reporting on the new Gemini ranges from 'incremental 3.5 release' to 'full Gemini 4.0 with deeper integration.' Here's what's actually confirmed versus what's anonymous sourcing — and the seven things builders should evaluate the moment the model card drops.

2026-05-19 2 分钟阅读

Gemini Omni 演示视频泄露——谷歌全新视频模型究竟能做什么

在最初的UI字符串泄露八天后，首批Gemini Omni样本视频浮出水面。其对话驱动编辑能力表现强劲，但在原始画质方面落后于Seedance 2.0，且每段视频消耗约43%的AI Pro每日配额。这是I/O 2026开幕前一周的客观评测。

2026-05-12 1 分钟阅读

谷歌神秘的'Omni'视频模型：Gemini界面泄露在I/O 2026前告诉我们什么

谷歌似乎正在Gemini内部测试一款名为Omni的新视频生成模型，该消息通过一段在谷歌I/O 2026前被发现的界面字符串曝光。以下是我们已知的、未知的，以及它为何可能影响重大——包括对WaveSpeedAI上Veo的影响。

2026-05-03 2 分钟阅读

Google Veo 3.1 Lite 图生视频现已登陆WaveSpeedAI

使用 Google Veo 3.1 Lite，从任意参考图像生成高质量视频。在 WaveSpeedAI 上体验快速、实惠的 AI 图生视频，无需等待冷启动。

2026-04-03 1 分钟阅读

Google Veo 3.1 Lite Start-End-to-Video 现已登陆WaveSpeedAI

定义起始帧和结束帧，让AI自动生成两帧之间的视频过渡。Google Veo 3.1 Lite Start-End-to-Video现已在WaveSpeedAI上线，无冷启动延迟。

2026-04-03 1 分钟阅读

Google Veo 3.1 Lite文生视频现已登陆WaveSpeedAI

使用Google Veo 3.1 Lite通过文字提示生成视频。快速、经济实惠的AI文生视频，无冷启动延迟，现已在WaveSpeedAI上线。

2026-04-03 1 分钟阅读

Google Gemma 4是什么？架构、基准测试及其重要性

Google Gemma 4是DeepMind迄今为止最强大的开源模型系列，提供四种规模版本，基于Apache 2.0协议，支持多模态输入、原生推理能力，并可在树莓派等设备上本地部署。

2026-04-03 4 分钟阅读

Suno vs MiniMax Music vs Google Lyria 3：AI音乐生成对比评测

深度对比Suno v5.5、MiniMax Music 2.5和Google Lyria 3 Pro的AI音乐生成能力——涵盖音质、人声、创作控制、定价及API访问。

2026-03-29 4 分钟阅读

Google Lyria 3 Clip 现已登陆WaveSpeedAI

Google Lyria 3 Clip 可根据文本提示、歌词、描述和音频生成完整音乐曲目。支持图像引导生成、负向提示词及可复现结果。REST API 接入，每段仅需 $0.04，无冷启动延迟。

2026-03-26 1 分钟阅读