115 articles
Gemini 3.5 Flash正式发布——Flash级模型在智能体基准测试中领先Pro级
Gemini 3.5 Flash在I/O 2026上正式发布,默认开启思考模式,定价$1.50/$9每百万token,在MCP Atlas及多数智能体测试套件中超越Claude Opus 4.7和GPT-5.5。本文解析Flash的领先项目、不足之处及部署方案。
Gemini 3.5 Pro 下月发布——Flash 已经透露了什么
谷歌在 I/O 2026 上发布了 Gemini 3.5 Flash,并将 Pro 版本推迟至六月。Flash 已在编程和智能体基准测试中超越 Gemini 3.1 Pro,但在高难度推理上出现退步——这正是 Pro 需要弥补的差距。以下是已知信息、未知信息以及如何规划。
Gemini Omni Flash 正式发布:10秒多模态视频、SynthID水印,音频编辑功能暂未开放
谷歌在I/O 2026上发布了Gemini Omni Flash——一个能够跨文本、图像、音频和视频进行推理的单一模型,可生成带同步音频的连贯视频输出。本文详解已发布功能、尚未开放的功能,以及它与Veo的区别。
Gemini 4.0 at Google I/O 2026: What's Confirmed, What's Anonymous-Sourced, What Builders Should Actually Watch For
Google I/O opens today at 10 AM PT. The pre-keynote reporting on the new Gemini ranges from 'incremental 3.5 release' to 'full Gemini 4.0 with deeper integration.' Here's what's actually confirmed versus what's anonymous sourcing — and the seven things builders should evaluate the moment the model card drops.
Gemini Omni 演示视频泄露——谷歌全新视频模型究竟能做什么
在最初的UI字符串泄露八天后,首批Gemini Omni样本视频浮出水面。其对话驱动编辑能力表现强劲,但在原始画质方面落后于Seedance 2.0,且每段视频消耗约43%的AI Pro每日配额。这是I/O 2026开幕前一周的客观评测。
谷歌神秘的'Omni'视频模型:Gemini界面泄露在I/O 2026前告诉我们什么
谷歌似乎正在Gemini内部测试一款名为Omni的新视频生成模型,该消息通过一段在谷歌I/O 2026前被发现的界面字符串曝光。以下是我们已知的、未知的,以及它为何可能影响重大——包括对WaveSpeedAI上Veo的影响。
Google Veo 3.1 Lite 图生视频现已登陆WaveSpeedAI
使用 Google Veo 3.1 Lite,从任意参考图像生成高质量视频。在 WaveSpeedAI 上体验快速、实惠的 AI 图生视频,无需等待冷启动。
Google Veo 3.1 Lite Start-End-to-Video 现已登陆WaveSpeedAI
定义起始帧和结束帧,让AI自动生成两帧之间的视频过渡。Google Veo 3.1 Lite Start-End-to-Video现已在WaveSpeedAI上线,无冷启动延迟。
Google Veo 3.1 Lite文生视频现已登陆WaveSpeedAI
使用Google Veo 3.1 Lite通过文字提示生成视频。快速、经济实惠的AI文生视频,无冷启动延迟,现已在WaveSpeedAI上线。
Google Gemma 4是什么?架构、基准测试及其重要性
Google Gemma 4是DeepMind迄今为止最强大的开源模型系列,提供四种规模版本,基于Apache 2.0协议,支持多模态输入、原生推理能力,并可在树莓派等设备上本地部署。
Suno vs MiniMax Music vs Google Lyria 3:AI音乐生成对比评测
深度对比Suno v5.5、MiniMax Music 2.5和Google Lyria 3 Pro的AI音乐生成能力——涵盖音质、人声、创作控制、定价及API访问。
Google Lyria 3 Clip 现已登陆WaveSpeedAI
Google Lyria 3 Clip 可根据文本提示、歌词、描述和音频生成完整音乐曲目。支持图像引导生成、负向提示词及可复现结果。REST API 接入,每段仅需 $0.04,无冷启动延迟。