WaveSpeedAIでAlibaba Wan 2.2 T2V-Plus 480Pを導入

Alibaba Wan 2.2 T2V-Plus 480P がWaveSpeedAIで利用可能になったことをお知らせします。Alibaba Cloudの強力なテキスト-ビデオモデルは、当社の高速で信頼性の高い推論APIを通じて、クリエイター、開発者、企業に対して業界レベルのビデオ生成をもたらします。

Alibaba Wan 2.2とは

Alibaba Wan 2.2は、AIビデオ生成技術における大きな前進です。Alibabaの Wan-AIチームによってリリースされたこのモデルは、革新的なMixture-of-Experts（MoE）アーキテクチャ を導入し、以前のバージョンや競合ソリューションとは異なります。

MoEシステムは洗練された2エキスパートの設計を採用しています。「高ノイズ」エキスパートが生成の初期段階を処理し、ビデオの全体的なレイアウトとモーションを確立し、「低ノイズ」エキスパートが複雑な細部を精緻に調整し、ビジュアル品質を向上させます。この革新的なアプローチにより、推論ステップごとにアクティブな計算を140億パラメータに抑えながら、モデルの容量を270億パラメータに倍増させ、計算オーバーヘッドなしに優れた品質を提供します。

前身のWan 2.1と比較して、このバージョンは65.6%多い画像と83.2%多い動画 でトレーニングされており、モーション忠実度、セマンティック理解、ビジュアル品質が大幅に改善されています。

主な機能

シネマティック美学 – ライティング、色、構成の業界レベルのコントロールが、真のフィルム品質のルックを提供します。トレーニングパイプラインには、ライティング、構成、カラーマップ、コントラストをカバーする、細かくラベル付けされた美学データセットが含まれています。
自然なモーション – 複雑な動きをスムーズなトランジションと正確な制御性で復元します。拡張トレーニングデータにより、モデルは以前のモデルが苦労していた複雑なモーションパターンを処理できます。
セマンティック精度 – 複雑なシーンと複数オブジェクトのインタラクションを理解し、詳細なプロンプトを使用しても、クリエイティブなインテントを保持します。
MoEアーキテクチャ – Mixture-of-Expertsを実装する最初のビデオ拡散モデルで、比例計算コストなしに高い容量を実現します。
柔軟な解像度 – 832×480または480×832でビデオを生成し、ランドスケープまたはポートレートコンテンツニーズに対応します。
再現可能な結果 – 一貫性のある出力のための特定のシードを設定するか、クリエイティブな探索用のランダムシードを使用します。

ベンチマーク性能

Wan 2.2は、Wan-Bench 2.0評価スイートを使用して、Sora、KLING 2.0、Hailuo 02などの主要なAIビデオ生成モデルに対して厳密にテストされています。結果は以下の通りです。

テキストレンダリング#1 – Sora、Hailuo 02、その他の商用モデルを上回る
カメラコントロール#1 – Seedance 1.0、Hailuo 02、KLING 2.0、Soraに優る
美的品質#1 – オープンソースおよびクローズドソースベンチマーク全体をリード
モーション忠実度#1 – 最も自然で流動的なモーションを提供

6つの主要ベンチマークのうち4つで上位を確保することで、Wan 2.2は高忠実度ビデオ生成のリーダーとして確立され、Veo2、Kling 2.1、Seedance 1.0などのモデルと同等またはそれを上回ります。

実世界のユースケース

マーケティングと広告

テキスト説明からcompelling なビデオ広告を作成します。製品、設定、ムードを説明すれば、Wan 2.2がソーシャルメディアやデジタルキャンペーン用の業界レベルのプロモーション内容を生成します。

コンテンツ作成

YouTubeクリエイター、TikTokクリエイター、ソーシャルメディアマネージャーは、ビデオコンセプトを迅速にプロトタイプ化し、B-ロール映像を生成したり、高価な製作機器なしに目を引くイントロとトランジションを作成できます。

電子商取引

製品リストに動的なビデオデモを組み込みます。製品を様々な設定や照明条件で表示する、シンプルなテキストプロンプトから生成されたすべてを実現します。

教育とトレーニング

教育ビデオ、説明コンテンツ、トレーニング教材を開発します。複雑な概念を説明すると、AIが学習を強化する視覚的表現を生成します。

ゲーム開発とプロトタイピング

全制作にコミットする前に、コンセプトフェーズ中にカットシーン、キャラクターの動き、または環境アニメーションを迅速に可視化します。

ストーリーボードとプレビジュアライゼーション

映画製作者とビデオプロデューサーは、Wan 2.2を使用してラフカットを作成し、撮影前にシーンをプレビジュアライズでき、プリプロダクションで大幅に時間とリソースを節約できます。

WaveSpeedAIで始める

WaveSpeedAIでAlibaba Wan 2.2 T2V-Plus 480Pを始めるのはわずか数分です。

モデルページを訪問 https://wavespeed.ai/models/alibaba/wan-2.2/t2v-plus-480p
プロンプトを入力 – カメラアングル、アクション、ライティング、ムードを含む、シーンを詳しく説明します
オプションで負のプロンプトを追加 – 生成されたビデオから除外したい要素を指定します
解像度を選択 – ランドスケープビデオの場合は832×480、ポートレートビデオの場合は480×832を選択します
シードを設定 – ランダムなクリエイティブな結果の場合は-1を使用するか、再現性のための特定の数字を固定します
実行をクリック – 生成されたビデオをプレビューしてダウンロードします

価格設定

Wan 2.2 T2V-Plus 480Pでのビデオ生成は驚くほど手頃な価格です。

ビデオ長	コスト
5秒	$0.05

WaveSpeedAIを選ぶ理由は？

WaveSpeedAIを通じてAlibaba Wan 2.2を実行すると、強力なモデルへのアクセスだけではなく、以下を得られます。

高速推論 – 最適化されたインフラストラクチャが高速な生成時間を提供し、ビデオを迅速に準備します
コールドスタートなし – 他のプラットフォームとは異なり、WaveSpeedAIはモデルをウォーム状態に保ち、準備完了のままにして、イライラさせる待機時間を排除します
手頃な価格設定 – 使用した分だけ支払い、透明な生成ごとの価格設定を提供します
シンプルなREST API – 開発者向けのAPIでビデオ生成をアプリケーションに統合します
信頼性の高いアップタイム – エンタープライズグレードのインフラストラクチャにより、ワークフローがスムーズに実行されます