#google

108 articles

Gemini 3.5 Flash 正式發布——Flash 級模型在 Agent 基準測試上超越 Pro 級

Gemini 3.5 Flash 於 I/O 2026 正式推出，預設開啟思考模式，每百萬 token 定價 $1.50/$9，在 MCP Atlas 及大多數 Agent 測試套件上超越 Claude Opus 4.7 與 GPT-5.5。本文分析 Flash 的領先之處、落後之處，以及如何部署。

2026-05-20 4 分鐘閱讀

Gemini 3.5 Pro 下個月即將到來——Flash 版本已透露的訊息

Google 在 I/O 2026 上發布了 Gemini 3.5 Flash，並將 Pro 版本推遲至六月。Flash 已在程式碼和代理基準測試上超越 Gemini 3.1 Pro，但在複雜推理方面有所退步——這正是 Pro 需要彌補的差距。以下是已知資訊、未知資訊，以及如何提前規劃。

2026-05-20 3 分鐘閱讀

Gemini Omni Flash 正式發布：10 秒多模態影片、SynthID 浮水印標記、音訊編輯功能暫緩推出

Google 在 I/O 2026 上發布了 Gemini Omni Flash——一個能跨文字、圖像、音訊與影片進行推理的單一模型，可生成帶同步音訊的一致影片輸出。本文詳述已發布的功能、尚未推出的部分，以及它與 Veo 的差異。

2026-05-20 2 分鐘閱讀

Google I/O 2026 的 Gemini 4.0：哪些已確認、哪些來自匿名消息、開發者真正需要關注什麼

Google I/O 今日上午 10 點（太平洋時間）正式開幕。關於新版 Gemini 的賽前報導從「漸進式 3.5 更新」到「深度整合的完整 Gemini 4.0」眾說紛紜。以下整理哪些是官方確認的資訊、哪些來自匿名消息來源，以及模型卡片發布後開發者應立即評估的七個面向。

2026-05-19 2 分鐘閱讀

Gemini Omni 演示影片剛剛洩露——Google 全新影片模型究竟能做什麼

距原始 UI 字串洩露八天後，首批 Gemini Omni 示範影片浮出水面。對話式編輯表現強勁，原始畫質遜於 Seedance 2.0，且每段影片消耗約 43% 的 AI Pro 每日配額。這是 I/O 2026 前一週的真實評測。

2026-05-12 1 分鐘閱讀

Google神秘的「Omni」影片模型：Gemini UI洩露在I/O 2026前透露了什麼

Google似乎正在Gemini內部測試一個名為Omni的新影片生成模型，這一消息來自Google I/O 2026前夕發現的UI字串。以下是我們目前所知的、尚不清楚的，以及它可能帶來的影響——包括對WaveSpeedAI上的Veo。

2026-05-03 2 分鐘閱讀

Google Veo 3.1 Lite 現已登陸WaveSpeedAI

使用 Google Veo 3.1 Lite，從任意參考圖像生成高品質影片。在 WaveSpeedAI 上享受快速、經濟實惠的 AI 圖像轉影片生成，無需冷啟動等待。

2026-04-03 1 分鐘閱讀

Google Veo 3.1 Lite Start-End-to-Video 現已登陸WaveSpeedAI

定義起始和結束幀，讓AI自動生成中間的影片過渡效果。Google Veo 3.1 Lite Start-End-to-Video 現已上架WaveSpeedAI，無冷啟動延遲。

2026-04-03 1 分鐘閱讀

Google Veo 3.1 Lite 文字轉影片現已登陸WaveSpeedAI

使用 Google Veo 3.1 Lite 從文字提示生成影片。快速、經濟實惠的 AI 文字轉影片生成，無需等待冷啟動，現已在 WaveSpeedAI 上提供。

2026-04-03 1 分鐘閱讀

什麼是Google Gemma 4？架構、基準測試及其重要性

Google Gemma 4是DeepMind迄今最強大的開源模型系列，以Apache 2.0授權提供四種規格，支援多模態輸入、原生推理，並可部署至樹莓派等端側設備。

2026-04-03 4 分鐘閱讀

Suno vs MiniMax Music vs Google Lyria 3：AI音樂生成全面比較

深入比較 Suno v5.5、MiniMax Music 2.5 與 Google Lyria 3 Pro 的 AI 音樂生成能力，涵蓋音質、人聲、創作控制、定價及 API 存取等面向。

2026-03-29 5 分鐘閱讀

Google Lyria 3 Clip現已登陸WaveSpeedAI

Google Lyria 3 Clip 可根據歌詞、描述及音頻等文字提示生成完整音樂曲目，支援圖像引導生成、負面提示詞及可重現結果。提供 REST API，每段剪輯僅需 $0.04，無冷啟動延遲。

2026-03-26 1 分鐘閱讀