115 articles
Gemini 3.5 Flash 正式發布——Flash 級模型在 Agent 基準測試上超越 Pro 級
Gemini 3.5 Flash 於 I/O 2026 正式推出,預設開啟思考模式,每百萬 token 定價 $1.50/$9,在 MCP Atlas 及大多數 Agent 測試套件上超越 Claude Opus 4.7 與 GPT-5.5。本文分析 Flash 的領先之處、落後之處,以及如何部署。
Gemini 3.5 Pro 下個月即將到來——Flash 版本已透露的訊息
Google 在 I/O 2026 上發布了 Gemini 3.5 Flash,並將 Pro 版本推遲至六月。Flash 已在程式碼和代理基準測試上超越 Gemini 3.1 Pro,但在複雜推理方面有所退步——這正是 Pro 需要彌補的差距。以下是已知資訊、未知資訊,以及如何提前規劃。
Gemini Omni Flash 正式發布:10 秒多模態影片、SynthID 浮水印標記、音訊編輯功能暫緩推出
Google 在 I/O 2026 上發布了 Gemini Omni Flash——一個能跨文字、圖像、音訊與影片進行推理的單一模型,可生成帶同步音訊的一致影片輸出。本文詳述已發布的功能、尚未推出的部分,以及它與 Veo 的差異。
Google I/O 2026 的 Gemini 4.0:哪些已確認、哪些來自匿名消息、開發者真正需要關注什麼
Google I/O 今日上午 10 點(太平洋時間)正式開幕。關於新版 Gemini 的賽前報導從「漸進式 3.5 更新」到「深度整合的完整 Gemini 4.0」眾說紛紜。以下整理哪些是官方確認的資訊、哪些來自匿名消息來源,以及模型卡片發布後開發者應立即評估的七個面向。
Gemini Omni 演示影片剛剛洩露——Google 全新影片模型究竟能做什麼
距原始 UI 字串洩露八天後,首批 Gemini Omni 示範影片浮出水面。對話式編輯表現強勁,原始畫質遜於 Seedance 2.0,且每段影片消耗約 43% 的 AI Pro 每日配額。這是 I/O 2026 前一週的真實評測。
Google神秘的「Omni」影片模型:Gemini UI洩露在I/O 2026前透露了什麼
Google似乎正在Gemini內部測試一個名為Omni的新影片生成模型,這一消息來自Google I/O 2026前夕發現的UI字串。以下是我們目前所知的、尚不清楚的,以及它可能帶來的影響——包括對WaveSpeedAI上的Veo。
Google Veo 3.1 Lite 現已登陸WaveSpeedAI
使用 Google Veo 3.1 Lite,從任意參考圖像生成高品質影片。在 WaveSpeedAI 上享受快速、經濟實惠的 AI 圖像轉影片生成,無需冷啟動等待。
Google Veo 3.1 Lite Start-End-to-Video 現已登陸WaveSpeedAI
定義起始和結束幀,讓AI自動生成中間的影片過渡效果。Google Veo 3.1 Lite Start-End-to-Video 現已上架WaveSpeedAI,無冷啟動延遲。
Google Veo 3.1 Lite 文字轉影片現已登陸WaveSpeedAI
使用 Google Veo 3.1 Lite 從文字提示生成影片。快速、經濟實惠的 AI 文字轉影片生成,無需等待冷啟動,現已在 WaveSpeedAI 上提供。
什麼是Google Gemma 4?架構、基準測試及其重要性
Google Gemma 4是DeepMind迄今最強大的開源模型系列,以Apache 2.0授權提供四種規格,支援多模態輸入、原生推理,並可部署至樹莓派等端側設備。
Suno vs MiniMax Music vs Google Lyria 3:AI音樂生成全面比較
深入比較 Suno v5.5、MiniMax Music 2.5 與 Google Lyria 3 Pro 的 AI 音樂生成能力,涵蓋音質、人聲、創作控制、定價及 API 存取等面向。
Google Lyria 3 Clip現已登陸WaveSpeedAI
Google Lyria 3 Clip 可根據歌詞、描述及音頻等文字提示生成完整音樂曲目,支援圖像引導生成、負面提示詞及可重現結果。提供 REST API,每段剪輯僅需 $0.04,無冷啟動延遲。