#wan
189 articles - Page 12
MiniMax Voice DesignがWaveSpeedAIに登場
MiniMax Voice Designはテキストの説明から自然な音声を生成します。クローニングは不要で、トーン、アクセント、個性を設定できます。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
動画エフェクト「Fairy Me」がWaveSpeedAIに登場
Fairy Meは写真を魔法のような幽玄なエフェクトでエンチャンティングな妖精クリップに変換するImage-to-Video機能です。本番対応のREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
動画エフェクト漁師がWaveSpeedAIに登場
写真を自然な動きと感情を持つ漁師テーマの動画に変換します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
WaveSpeedAIにCharacter AI Ovi Image-to-Videoが登場
OviはVeo-3のようなイメージ・トゥ・ビデオモデルで、テキストまたはテキスト+画像プロンプトから同期されたビデオとオーディオを生成します。すぐに使用できるRESTインファレンスAPI、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
Kuaishou Kling Text To AudioがWaveSpeedAIに登場
Kling Text-to-Audio は、テキストプロンプトをビデオ、ゲーム、マルチメディア用のカスタム音声効果に変換します。KlingAI のオーディオモデルを使用しており、すぐに使える REST 推論 API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定を提供します。
Kuaishou Kling V2.6 Pro画像からビデオへの変換がWaveSpeedAIで利用可能に
Kling 2.6 Proは、滑らかなモーション、シネマティックなビジュアル、正確なプロンプト準拠、ネイティブオーディオを備えた最高レベルの画像からビデオへの生成を提供します。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
Google Gemini 3 Flash Image EditがWaveSpeedAIに登場
Google Gemini 3 Flash Image プレビュー - Image to Image - WaveSpeedAI
Google Gemini 2.5 Flash画像編集がWaveSpeedAIに登場
Nano Banana (Gemini 2.5 Flash Image) は画像から画像への生成と深い推論による正確な編集を提供します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
Kuaishou Kling V2.6 Create Voice がWaveSpeedAIに登場
Kling 2.6 Create Voiceはカスタムボイスを生成できるモデルです。オーディオファイルをアップロードして、V2.6ビデオ生成のボイスコントロール機能で使用できるカスタムボイスを作成できます。オーディオはクリーン、ノイズフリー、単一音声で、5~30秒の期間である必要があります。安定した製品向けに構築されています
Lightricks LTX 2 RetakeがWaveSpeedAIに登場
LTX-2 Retakeはビデオの任意のセクションに対して標的化された再撮影を実行し、ビジュアル、オーディオ、またはその両方を置き換えながら、タイミングと連続性を保持します(出力ビデオ1秒あたり$0.1)。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
OpenAI DALL-E 3がWaveSpeedAIに登場
高忠実度のテキスト-画像生成のためのOpenAI DALL·E 3がWaveSpeedAIで管理されたAPIとして利用可能。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
OpenAI SoraがWaveSpeedAIに登場
SoraはOpenAIのマルチモーダルモデルで、テキスト、画像、または既存のビデオ入力からビデオを生成します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。