OpenAI GPT Image 1.5 EditがWaveSpeedAIに登場
GPT Image 1.5 Editは、精密で自然言語ベースの編集に対応するOpenAIの画像モデルです。オブジェクトの追加/削除、背景の入れ替え、顔のレタッチ、色/ライティングの調整、テキスト/グラフィックスの編集、トリミング/リサイズ、16進数カラーコントロールに対応。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格
LongCat AvatarがWaveSpeedAIに登場
LongCat Avatarは、超リアルなリップシンク機能を備えた長尺ビデオ生成を実現し、自然な動きと一貫性のあるアイデンティティを保ちます。1枚の写真とオーディオから、オーディオ駆動のトーキングまたはシンギングアバタービデオ(画像からビデオへ)を生成でき、最大1分、720p層は$0.30/5秒です。すぐに使えるREST API、コールドスタートなし
WaveSpeedAI Qwen Image Edit 2511 LoRAがWaveSpeedAIに登場
Qwen Image Edit 2511 LoRA はカスタム LoRA サポート対応の強化版で、個人的なスタイルをサポートします。より強力な編集の一貫性、堅牢なマルチパーソン識別性/ポーズ一貫性、カスタム LoRA スタイル、産業/製品設計の強化、構造保持のための幾何学的推論の向上を実現します。
Qwen Image Edit 2511がWaveSpeedAIに登場
Qwen Image Edit 2511は、実世界の画像編集とデザインにおいて2509から大幅にアップグレードされました。より強力な編集の一貫性、堅牢なマルチパーソン識別/ポーズ一貫性、組み込みLoRAスタイル、産業/製品デザインの強化、および構造保存編集のための幾何学的推論の向上を実現します。
Alibaba WAN 2.6 Image-to-Videoが WaveSpeedAI で利用開始
Alibaba WAN 2.6はテキストや画像をビデオ(720p/1080p)に変換し、同期されたオーディオ付きで、Google Veo3よりも高速で低コスト。REST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
ByteDanceのSeedance V1.5 Pro Image-to-Video FastがWaveSpeedAIに登場
Seedance 1.5 Pro Fast Image-to-Videoは、単一の画像(オプションのテキストプロンプト付き)をシネマティックで実写的なクリップに変換し、被写体のアイデンティティ、構図、最初のフレームの忠実性を保持します。4~12秒の期間制御、入力画像に従う適応的なアスペクト比に対応しています。
ByteDanceのSeedance V1.5 Pro Video Extend FastがWaveSpeedAIに登場
Seedance 1.5 Pro Fast Video Extendは、短いショットを自然なモーション継続と強力な時間的一貫性で長いクリップに変換します。4~12秒の延長、720p/1080p出力(内蔵アップスケーリング付き)、およびショットマッチング用のシード再現可能な結果に対応。広告、トレーラー、短編ドラマに最適です。
ByteDanceのSeedream V4.5がWaveSpeedAIで利用可能に
ByteDance Seedream 4.5は、タイポグラフィに最適化された次世代テキスト画像生成モデルです。より鮮明なテキストレンダリング、強力なプロンプト準拠性、ポスターやブランドビジュアル向けの最大4K出力を実現。すぐに利用可能なREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
WaveSpeedAIでAlibaba WAN 2.6 Image Editが利用可能に
Alibaba WAN 2.6 Image-Editはプロンプトを正確な写真編集に変換し、色と照明の調整、美的なリスタイリング、背景の置き換え、オブジェクトの削除、被写体のアイデンティティを保持しながら詳細を洗練します。安定した反復可能な画像対画像パイプライン向けに構築。すぐに使えるREST API、最高
WaveSpeedAI FLUX 2 Max EditがWaveSpeedAIに登場
FLUX 2 Max EditはBlack Forest Labsによるプロダクション グレードの画像編集機能を提供します。自然言語命令と正確な16進カラーコントロールを適用して、一貫性のあるスタジオ品質の結果を実現。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
WaveSpeedAI FLUX 2 Max テキスト・トゥ・イメージ機能がWaveSpeedAIで利用可能に
Black Forest Labsの FLUX 2 Max は、強化されたリアリズム、より鮮明なテキストレンダリング、ネイティブ編集機能により、信頼性が高く再現可能な本番グレードのテキスト・トゥ・イメージ生成を提供します。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
Google Veo3.1 Fast Video Extendがいよいよ登場 - WaveSpeedAI
Veo 3.1ビデオを7秒単位で拡張できるFastエンドポイント—高速で首尾一貫した継続、スタイルとモーションを保持し、単一のマージされたクリップとして出力。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。