WaveSpeedAI HunyuanVideo FoleyがWaveSpeedAIに登場
HunyuanVideo-Foleyは、アップロードされたビデオから、目的の音を説明するテキストプロンプトを使用して、リアルなフォーリーと環境音を生成します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
WaveSpeedAI InfiniteTalk ビデオ・トゥ・ビデオがWaveSpeedAIで利用可能に
オーディオドリブンのInfiniteTalkは、1つのビデオとオーディオから、リアルなトーキング・シンギングビデオをリップシンク付きで480pまたは720pで生成します。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
ThinkSoundがWaveSpeedAIに登場
ThinkSoundは、アップロードされたビデオをテキストガイドのリアルなオーディオに変換します。ビデオをアップロードしてテキストプロンプトを追加して、リアルなサウンドを生成できます。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
WaveSpeedAI WAN 2.1 Synthetic To Real DittoがWaveSpeedAIに登場
WAN 2.1 Synthetic To Real Dittoはビデオ間の合成から実写への変換で動きと顔表情をミラーリングします。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
Qwen Image Edit LoRAがWaveSpeedAIに登場
Qwen-Image-Edit LoRA (20B)は、スタイル保持とセマンティック・外観編集機能を備えた、バイリンガル中国語/英語の画像編集を実現します。すぐに使えるREST API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
WaveSpeedAI Video OutpainterがWaveSpeedAIに登場
WaveSpeedAI Video Outpainterは、モーション、アイデンティティ、シーンの一貫性を保ちながら、任意のビデオを元の境界を超えて拡張します。アスペクト比の変更、リフレーミング、安全マージンの追加、またはコンテンツを切り取ったり失うことなく新しい視覚的コンテキストを生成するのに最適です。
WaveSpeedAI WAN 2.2 ビデオ編集がWaveSpeedAIに登場
Wan 2.2 Video Editは、テキストプロンプトでビデオを編集できます(例:衣装やキャラクターを変更)。Wan 2.2を搭載し、480p(5秒あたり$0.20)と720p(5秒あたり$0.40)に対応、最大120秒まで対応。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
FLUX Dev LoRAがWaveSpeedAIに登場
事前学習済みLoRAアダプターを使用した高速で高品質の画像生成と簡単なパーソナライズに対応したFLUX.1 [dev]エンドポイント。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
WaveSpeedAI Jib Mix Qwen Image Text-to-Image LoRAがWaveSpeedAIに登場
Jib Mix Qwen LoRAは、より自然で魅力的な顔を生成することに特化しており、特にアジア人の顔の特徴をレンダリングするのに優れています。LoRAサポート付きの次世代テキスト画像生成に対応しています。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
Qwen Image Text-to-Image LoRAがWaveSpeedAIに登場
Qwen-Image LoRAは、高速なカスタマイズと洗練された画像生成のためのLoRAサポートを備えた20B MMDiT次世代テキスト画像モデルです。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
WaveSpeedAI WAN 2.2 Text-to-Image LoRAがWaveSpeedAIに登場
WAN 2.2はテキストプロンプトから超詳細な画像を生成し、カスタムLoRAをサポートして、きめ細かいスタイルと被写体の制御ができます。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
MiniMax Speech 02 HDがWaveSpeedAIに登場
MiniMax Speech 02 HDはMinimaxの高定義テキスト音声モデルで、クリアなHD音声を提供します。料金は1,000文字あたり$0.05。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。