WaveSpeed Blog

AI画像・動画生成モデルの最新ニュース — エンジニアリング更新、製品リリース、チュートリアル、詳細解説。

Gemini 3.5 Flash 正式リリース — フラッシュティアモデルがエージェントベンチマークでProティアを上回る
gemini-3-5-flashgoogle

Gemini 3.5 Flash 正式リリース — フラッシュティアモデルがエージェントベンチマークでProティアを上回る

Gemini 3.5 FlashはI/O 2026でGA公開され、デフォルトで思考機能が有効、料金は100万トークンあたり$1.50/$9で、MCP AtlasとほとんどのエージェントスイートでClaude Opus 4.7とGPT-5.5を上回るベンチマーク結果を示した。Flashが勝る点、劣る点、そしてデプロイ方法を解説する。

3 min read
Gemini 3.5 Proは来月登場——Flashリリースが既に示すもの
gemini-3-5gemini-3-5-pro

Gemini 3.5 Proは来月登場——Flashリリースが既に示すもの

GoogleはI/O 2026でGemini 3.5 Flashを公開し、Proは6月に持ち越した。FlashはすでにコーディングとエージェントベンチマークでGemini 3.1 Proを上回るが、高度な推論では後退しており、そこがProが埋めるべきギャップだ。現時点での既知事項・未確認事項と今後の計画指針をまとめる。

2 min read
Gemini Omni Flash リリース:10秒マルチモーダル動画、SynthIDウォーターマーク対応、音声編集は見送り
gemini-omnigemini-omni-flash

Gemini Omni Flash リリース:10秒マルチモーダル動画、SynthIDウォーターマーク対応、音声編集は見送り

GoogleはI/O 2026でGemini Omni Flashを発表しました。テキスト・画像・音声・動画を横断して推論し、音声同期された一貫した動画出力を生成するシングルモデルです。リリースされた機能、見送られた機能、そしてVeoとの違いを詳しく解説します。

2 min read
Arcanineリーク:ビルダーが思い込んではいけないこと

Arcanineリーク:ビルダーが思い込んではいけないこと

ArcanineはAIリーク情報に浮上しているが、公式の公開モデル名ではない。ビルダーはそのシグナルをどう解釈すべきかを解説する。

1 min read
Google I/O 2026のGemini 4.0:確認済み情報、匿名ソース情報、そしてビルダーが本当に注目すべきこと
gemini-4google

Google I/O 2026のGemini 4.0:確認済み情報、匿名ソース情報、そしてビルダーが本当に注目すべきこと

Google I/Oが本日太平洋時間午前10時に開幕します。新しいGeminiに関する基調講演前のレポートは「段階的な3.5リリース」から「より深い統合を備えたフルGemini 4.0」まで様々です。実際に確認されていることと匿名ソースによる情報を整理し、モデルカードが公開された瞬間にビルダーが評価すべき7つのポイントを解説します。

2 min read
OpenAI Glacier-Alphaとは?実際にわかっていること

OpenAI Glacier-Alphaとは?実際にわかっていること

Glacier-alphaはOpenAIのリーク情報として話題になっているが、公式製品ページは存在しない。ビルダーが推測すべきこととすべきでないことを整理する。

1 min read
Seedance 2.1とSeedance 2.0 Miniが登場予定:品質向上と低価格帯
seedancebytedance

Seedance 2.1とSeedance 2.0 Miniが登場予定:品質向上と低価格帯

ByteDanceは2つの新しいSeedanceバリアントを準備中:約20%の生成品質向上が報告されているSeedance 2.1と、現行のSeedance価格を大幅に下回りながらSeedance 2.0 Fastを上回るパフォーマンスを発揮するとされる新しいMiniティア。

2 min read
DeepSeekの資金調達交渉がモデルプラットフォームに意味すること

DeepSeekの資金調達交渉がモデルプラットフォームに意味すること

DeepSeekが報じられている資金調達交渉は、評価額の上昇以上の意味を持つかもしれない。モデルの価格競争力とプラットフォーム戦略への影響を考察する。

1 min read
リークされたモデル名を開発者が無視すべき理由

リークされたモデル名を開発者が無視すべき理由

oai-2.1のようなリークされたモデル名はノイズを生み出すが、プロダクションチームが動く前には、ドキュメント、価格、制限、サポートの情報が必要だ。

1 min read
design.md vs デザイントークン:AI UIワークフロー比較

design.md vs デザイントークン:AI UIワークフロー比較

AIエージェントの可読性・一貫性・ワークフローの移植性に注目し、design.mdと従来のデザイントークンをAI UIワークフローの観点から比較します。

1 min read
ML Internとは何か、そしてなぜ垂直エージェントが重要なのか

ML Internとは何か、そしてなぜ垂直エージェントが重要なのか

ML Internは、研究およびトレーニングワークフローを中心に構築されたオープンソースのMLエンジニアリングエージェントです。これが垂直エージェントの次のフェーズについて何を示しているかを解説します。

1 min read
GPT-5.6がOpenAIのCodexログに突如登場——これが実際に意味すること
gpt-5-6openai

GPT-5.6がOpenAIのCodexログに突如登場——これが実際に意味すること

OpenAIのCodexロールアウトログにある1件のルーティングエントリがGPT-5.6を指していた。Polymarketでは6月30日リリースの確率が89%に達している。確認済みの情報、ノイズに過ぎない情報、そしてゴブリン事件がテストをこれほど加速させている理由を解説する。

1 min read