#model-release
392 articles - Page 10
KuaishouKling Image O1がWaveSpeedAIに登場
Kling Omni Image O1は、MVLテクノロジーを搭載したKuaishouのマルチモーダル画像生成モデルです。最大10枚のリファレンス画像をサポートして機能の一貫性を維持し、詳細な編集(追加/削除/変更)、スタイルコントロール、シリーズコンテンツ作成が可能です。IPキャラクターデザイン、コマ漫画、ブランドマーチャンダイズに最適です
Google Nano Banana Pro Edit MultiがWaveSpeedAIに登場
GoogleのNano Banana Pro(Gemini 3.0 Pro Image)Editは、1回の実行で複数の高品質な編集画像を生成できる次世代の画像編集モデルです。非常に低コスト — 1枚あたり$0.07のみ。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
WaveSpeedAIにMiniMax Hailuo 2.3 T2V Proが登場
MiniMax Hailuo 2.3 Proはテキスト・ツー・ビデオモデルで、1080p動画を2.5倍の効率で生成し、複雑な指示の精度は85%です。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
MiniMax Hailuo 2.3 T2V StandardがWaveSpeedAIに登場
Hailuo 2.3は物理認識型の768p動画を生成するテキスト・ツー・ビデオモデルで、2.5倍の効率性と85%の複雑な指示対応率を実現します。すぐに使用可能なREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
Google Gemini 3 Pro Image EditがWaveSpeedAIに登場
Google の Gemini 3.0 Pro (Gemini 3.0 Pro Image) Edit は、モバイルデバイス向けの 4K 対応出力で画像編集とテキストから画像への生成を実現します。すぐに使用可能な REST 推論 API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
WaveSpeedAI FLUX 2 Dev テキスト画像生成がWaveSpeedAIで利用可能
Black Forest LabsのFLUX.2 [dev]は、高速でスタジオクオリティのテキスト画像生成を実現し、リアリティの向上、鮮明なテキストレンダリング、迅速な反復作業のためのネイティブ編集機能を備えています。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
Google Gemini 3 Pro Image Text-to-ImageがWaveSpeedAIに登場
Google の Gemini 3.0 Pro(Gemini 3.0 Pro プレビュー)は、スマートフォン向けに最適化された高解像度 4K 画像生成を実現する最先端のテキスト画像生成モデルです。すぐに使用できる REST 推論 API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
WaveSpeedAI InfiniteTalk Fast Multi がWaveSpeedAIに登場
InfiniteTalk fast multiは、1つの画像と2つのオーディオ入力を複数キャラクターのトーキングまたはシンギングビデオに変換します。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
WaveSpeedAI HunyuanVideo FoleyがWaveSpeedAIに登場
HunyuanVideo-Foleyは、アップロードされたビデオから、目的の音を説明するテキストプロンプトを使用して、リアルなフォーリーと環境音を生成します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
ThinkSoundがWaveSpeedAIに登場
ThinkSoundは、アップロードされたビデオをテキストガイドのリアルなオーディオに変換します。ビデオをアップロードしてテキストプロンプトを追加して、リアルなサウンドを生成できます。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
WaveSpeedAI WAN 2.2 ビデオ編集がWaveSpeedAIに登場
Wan 2.2 Video Editは、テキストプロンプトでビデオを編集できます(例:衣装やキャラクターを変更)。Wan 2.2を搭載し、480p(5秒あたり$0.20)と720p(5秒あたり$0.40)に対応、最大120秒まで対応。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
MiniMax Speech 02 HDがWaveSpeedAIに登場
MiniMax Speech 02 HDはMinimaxの高定義テキスト音声モデルで、クリアなHD音声を提供します。料金は1,000文字あたり$0.05。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。