Qwen Image MaxがWaveSpeedAIに登場
Qwen Image Maxは高品質な画像生成に対応したテキスト画像変換モデルで、中国語と英語のプロンプトをサポートしています。すぐに使えるREST推論APIで、最高のパフォーマンスを発揮します
Qwen3 TTSがWaveSpeedAIに登場
Qwen3 TTS: 11言語対応、9種類の音声キャラクター、スタイル制御機能付きのマルチランゲージ・マルチボイステキスト音声合成。すぐに使用できるREST推論API
Qwen3 TTS Voice CloneがWaveSpeedAIに登場
Qwen3 TTS Voice Clone: 参照音声から任意の声をクローンして、その声で音声を生成します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし
Qwen3 TTS Voice DesignがWaveSpeedAIに登場
Qwen3 TTS Voice Design: 自然言語で説明されたカスタム音声特性で音声を生成します。すぐに使えるREST推論API、最高のパフォーマンス、設定不要
Sam3 ImageがWaveSpeedAIに登場
SAM 3は、テキスト、ポイント、またはボックスを使用してオブジェクトを検出およびセグメント化するための、プロンプト可能な画像セグメンテーション用の統一基盤モデルです。すぐに使用できるREST推論API
SAM 3 RLEがWaveSpeedAIに登場
SAM 3 RLEは、テキスト、ポイント、またはボックスを使用してプロンプト可能な画像セグメンテーション用の統一された基盤モデルです。物体を検出およびセグメント化し、RLE (ラン長エンコーディング)を返します。
Sam3 Video RleがWaveSpeedAIに登場
SAM 3 Video RLEは、ビデオ内のプロンプトベースのセグメンテーション用の統一基盤モデルです。テキスト、ポイント、またはボックスを使用してフレーム間のオブジェクトを追跡およびセグメント化します。
Z Image Base LoRA、WaveSpeedAIに登場
Z-Image-Base LoRA (6B) は、完全なCFGサポートと外部LoRAサポートを備えた高品質なテキストから画像への生成を実現します。ネガティブプロンプトに対応しながら適用
Z Image Base LoRA TrainerがWaveSpeedAIに登場
Z-Image Base LoRA Trainer – 独自のデータセットからカスタム画像LoRAモデルをトレーニング。Zipアップロード、自動チューニングされたデフォルト設定、ブランドやキャラクターの高速反復処理に対応
Z Image BaseがWaveSpeedAIに登場
Z-Image-Baseは60億パラメータのテキスト画像生成モデルで、完全なCFGサポートを備えています。ネガティブプロンプティングと微調整機能に対応し、最大限の制御が可能です
MOVA vs WAN vs Sora 2 vs Seedance: 2026年のビデオ・オーディオAIモデル比較
OpenMOSS MOVA、WAN 2.2 Spicy、WAN 2.6 Flash、Sora 2、Seedance 1.5 Proのビデオ生成機能とオーディオ対応を比較。機能、料金、推奨事項を掲載。
WAN 2.5 ComfyUI ワークフロー: 安定した結果を得るための最適なノードグラフと設定
実用的なWAN 2.5 ComfyUIワークフロー: 最小限のノードグラフ、安定した設定ベースライン、モーションコントロール、エクスポートパス、および一般的なエラー修正