#video-generation
499 articles - Page 11
Kuaishou Kling Video O1 テキスト-ビデオ機能がWaveSpeedAIで利用可能に
Kling Omni Video O1はKuaishouの初の統合マルチモーダルビデオモデルで、MVL(マルチモーダルビジュアル言語)技術を搭載しています。テキスト-ビデオモードはテキストプロンプトからシネマティックビデオを生成し、被写体の一貫性、自然な物理シミュレーション、正確なセマンティック理解を実現します。すぐに使用可能なREST API
Vidu Text-to-Video Q2がWaveSpeedAIに登場
Vidu Q2 Text-to-Videoはテキストプロンプトを優れた視覚的忠実性と多様なモーションを備えた高品質ビデオに変換します。すぐに使用可能なREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
Kuaishou Kling Video O1 Std Reference To Video がWaveSpeedAIで利用可能に
Kling Omni Video O1(標準版)Reference-to-Videoは、複数の視点からキャラクター、小道具、またはシーンの参照を使用して創造的なビデオを生成します。対象の特徴を抽出し、フレーム全体でアイデンティティの一貫性を保ちながら新しいビデオコンテンツを作成します。すぐに使用できるREST API、最高のパフォーマンス
Kuaishou Kling Video O1 Std Video EditがWaveSpeedAIに登場
Kling Omni Video O1 Video-Edit(Standard)は自然言語による動画編集を実現します:オブジェクトの削除または置換、背景スワップ、シーンのリスタイル、天候・照明変更、3~10秒のローカライズ変換を強い時間的一貫性で適用。本番環境での安定した使用向けに、すぐに使えるREST
WaveSpeedAIで快手Kling Video O1 Video Editが登場
Kling Omni Video O1 Video-Editは、自然言語コマンドによる会話形式のビデオ編集を実現します。オブジェクトの削除、背景の変更、スタイルの修正、天候/照明の調整、シーンの変換が、「歩行者を削除」や「昼間を夕方に変更」といった簡単なテキスト指示で可能。すぐに使用可能なRE
Google Nano Banana Pro Text-to-Image Ultra がWaveSpeedAIに登場
Google の Nano Banana Pro (Gemini 3.0 Pro Image) は、スマートフォン向けに最適化された高解像度画像生成を実現する最先端のテキスト-画像モデルです。すぐに使える REST 推論 API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
KuaishouKling Image O1がWaveSpeedAIに登場
Kling Omni Image O1は、MVLテクノロジーを搭載したKuaishouのマルチモーダル画像生成モデルです。最大10枚のリファレンス画像をサポートして機能の一貫性を維持し、詳細な編集(追加/削除/変更)、スタイルコントロール、シリーズコンテンツ作成が可能です。IPキャラクターデザイン、コマ漫画、ブランドマーチャンダイズに最適です
WaveSpeedAI Image EraserがWaveSpeedAIに登場
強力なAI画像消去ツールは、オブジェクト、人物、またはテキストを削除し、自然な詳細と一貫した照明で背景を復元します。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
Google Nano Banana Pro Edit UltraがWaveSpeedAIに登場
Google Nano Banana Pro (Gemini 3.0 Pro Image) Editは高解像度出力での画像編集を実現します。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
Lightricks LTX 2 Fast テキスト・トゥ・ビデオがWaveSpeedAIに登場
LTX-2 Fastは、テキストプロンプトから同期したオーディオと1080pビデオを生成するプロダクショングレードのテキスト・トゥ・ビデオエンジンです。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
Lightricks LTX 2 Pro画像から動画へがWaveSpeedAIに登場
LTX-2は本番ワークフロー向けのAIクリエイティブエンジンで、同期オーディオと1080p動画出力を生成します(コスト$0.06/秒)。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
Lightricks LTX 2 Pro テキスト・ツー・ビデオがWaveSpeedAIに登場
LTX-2 Proはテキストプロンプトから同期されたオーディオと1080Pビデオを生成するテキスト・ツー・ビデオエンジンで、プロダクションワークフロー向けです。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。