← ブログ

Alibaba Happyhorse 1.0がWaveSpeedAIに登場

Alibaba Happy Horse 1.0(テキスト→動画)は、スムーズなカメラワーク、豊かな動き、高い表現力を備え、テキストプロンプトから720p / 1080pのシネマティックな動画を生成します。

2 min read
Alibaba Happyhorse.1.0 Text To Video Alibaba Happy Horse 1.0(テキスト→動画)は、スムーズなカメラワーク、豊かな動き、高い表現力を備え...
Try it

Alibaba Happy Horse 1.0 テキスト生成動画:純粋なテキストプロンプトからシネマティックなAI動画生成

Alibaba Happy Horse 1.0 テキスト生成動画は、自然言語プロンプトから滑らかなカメラワーク、豊かなモーション、そして卓越したプロンプト忠実性を備えた720pおよび1080pの洗練されたクリップを生成する、新しいシネマティックグレードのAI動画生成モデルです。プロンプトからずれたり、被写体が歪んだり、動きが硬直したりするテキスト生成動画モデルに悩まされてきたクリエイティブチームにとって、Happy Horse 1.0は大きな前進を意味します。そして今、WaveSpeedAIでコールドスタートなし、秒単位の予測可能な料金体系を持つ本番用REST APIとして利用可能になりました。

広告クリエイティブのプロトタイプ制作、短編映画のストーリーボード作成、スクロールを止めるソーシャルコンテンツの制作など、Happy Horse 1.0はレンダーファームや多段階のコンポジットパイプラインなしにシネマティックな出力を提供します。

Alibaba Happy Horse 1.0 テキスト生成動画の仕組み

Happy Horse 1.0は、シネマティックな出力のために専用に設計されたテキスト生成動画拡散モデルです。被写体、アクション、カメラワーク、照明、雰囲気をカバーする単一の説明的なプロンプトを記述すると、モデルは強いシーンレベルの一貫性を持って指示セットに従い、完全にアニメーション化されたクリップを合成します。

このモデルは最大2,500文字のプロンプトを受け付けます。これは非常に寛大な仕様で、細かい指示(例:「ゆっくりとしたドリーイン」、「浅い被写界深度」、「濡れた路面のネオン反射」)を指定することができます。長さ3秒から15秒の動画を720pまたは1080pで出力し、16:99:161:14:33:4の5つのアスペクト比をサポートしているため、1つのモデルでワイドスクリーンのYouTube、縦型のTikTokやReels、スクエアのInstagramフィード、エディトリアルレイアウトに対応できます。

以前のオープンなテキスト生成動画モデルとHappy Horse 1.0を区別するのは、モーションの処理方法です。古い拡散動画システムに見られるような、ぎこちなくとけていく被写体を生成するのではなく、安定した被写体と滑らかで意図的なカメラワーク、そして水の波紋、風になびく髪、折りたたまれる布地といった豊かな二次モーションを生成します。これはアーティファクトに満ちたものではなく、シネマティックなものとして感じられます。

Alibaba Happy Horse 1.0 テキスト生成動画の主な特徴

  • 強いプロンプト忠実性 — 構図、アクション、照明、雰囲気、カメラワークに関する詳細な指示を確実に従い、書いた通りのものを得ることができます。
  • シネマティックなモーション品質 — 安定した被写体と洗練されたビジュアルダイナミクスを持つ滑らかなドリー、パン、トラッキングショットで、商業利用に適しています。
  • マルチフォーマットアスペクト比16:99:161:14:33:4のネイティブサポートにより、1つのプロンプトをすべてのソーシャルチャンネルに展開できます。
  • 2段階の解像度720pで安価に反復し、最終カットを1080pで再レンダリングして納品品質を実現できます。
  • 長文プロンプト — 最大2,500文字のプロンプトにより、クリエイティブディレクターが精密な指示を記述できます。
  • 柔軟な長さ — 1回の呼び出しで3秒のループから15秒のナラティブビートまで生成できます。
  • 本番対応API — WaveSpeedAI上のRESTインファレンスはコールドスタートなしで、バースト的なクリエイティブワークロード下でもレイテンシを予測可能に保ちます。

Alibaba Happy Horse 1.0 テキスト生成動画の最適な使用例

キャンペーン速度での広告クリエイティブ

ブランドおよびパフォーマンスマーケティングチームは、数分でキャンペーンブリーフを複数のシネマティックなプロモコンセプトに変換できます。製品、シーン、雰囲気を説明するパラグラフを書き、720pでバリアントをトリアージするためにレンダリングし、有料配置のために優勝作品を1080pにアップスケールします。

スケールでの縦型ソーシャルメディアコンテンツ

ショートフォームは9:16縦型動画が主流です。Happy Horse 1.0のネイティブ9:16アスペクト比により、切り抜きや構図のロスなしにTikTok、Reels、Shortsのコンテンツを制作できます。最初のフレームからモバイル向けに被写体がフレーミングされます。

ピッチングとストーリーボードのためのコンセプトビジュアライゼーション

映画制作者、エージェンシーのクリエイティブ担当者、プロダクトチームは、書かれたトリートメントをモーションプレビューに変換できます。静的なデッキを送る代わりに、照明、ブロッキング、カメラの意図を示す5秒のアニメーションムードリールを送ることができ、はるかに説得力のあるピッチアーティファクトになります。

コントロールされた雰囲気でのブランドストーリーテリング

Happy Horse 1.0は「ソフトな反射」、「浅い被写界深度」、「ネオングロー」といったディレクティブに従うため、ブランドチームは定義されたビジュアルアイデンティティに合致したムード主導のクリップを制作できます。結果は機械が生成したというよりも、アートディレクトされたように感じられます。

ライブ本番前のクリエイティブプロトタイピング

撮影にコミットする前に、コーヒー1杯の価格で5つのビジュアルディレクションを探索できます。720pでカメラアングル、照明セットアップ、ペーシングをテストし、最も強いディレクションを確信を持って実際の本番に持ち込みます。

トレーラーとティーザー向けショートフォームシネマティックシーン

ティーザーコンテンツ、モーションコンセプト、ナラティブ実験のための表現豊かなクリップを生成します。1回の生成で最大15秒まで生成できるため、1回の呼び出しでセットアップ、ビート、ペイオフという完全なショットを捉えることができます。

エディトリアルとパブリッシングビジュアル

フル横長動画プレーヤーにコミットせずにモーションが必要なデジタルマガジン、ニュースレター、ロングスクロールのエディトリアルフィーチャーには4:33:4のアスペクト比を使用します。

Alibaba Happy Horse 1.0 の料金とAPIアクセス

Happy Horse 1.0は生成された動画の1秒あたりの線形料金で、コストを簡単に予測できます。

5秒あたりの料金

解像度コスト
720p$0.70
1080p$1.40

長さ別の費用例

解像度3秒5秒10秒15秒
720p$0.42$0.70$1.40$2.10
1080p$0.84$1.40$2.80$4.20

料金ルールはシンプルです:total_price = 0.70 × (1080p ? 2 : 1) × duration / 5。リクエストごとの手数料、コールドスタートペナルティ、最低コミットメントはありません。生成したものだけに対して支払います。

APIの使用例

import wavespeed

output = wavespeed.run(
    "alibaba/happyhorse-1.0/text-to-video",
    {
        "prompt": "A cinematic street scene at night, light rain falling, soft reflections on wet pavement, a stylish woman walking slowly toward the camera, gentle dolly-in movement, neon glow, shallow depth of field, elegant and atmospheric mood",
        "aspect_ratio": "16:9",
        "resolution": "1080p",
        "duration": 5
    },
)

print(output["outputs"][0])

唯一の必須パラメータはpromptです。アスペクト比はデフォルトで16:9、解像度は720p、長さは5秒です。これらの適切なデフォルト値により、最初のフレームに素早く到達できます。

WaveSpeedAIでAlibaba Happy Horse 1.0 テキスト生成動画を試す →

Alibaba Happy Horse 1.0 テキスト生成動画で最良の結果を得るためのヒント

  • カメラワークを具体的に指定してください。「ゆっくりとしたドリーイン」、「ゆっくりとした左パン」、「スタティックワイドショット」などのフレーズは、漠然とした説明とは明らかに異なる結果を生み出します。
  • ビジュアルスタイルを名付けてください。「シネマティック」、「コマーシャル」、「エディトリアル」、「ドリーミー」、「ドキュメンタリー」を追加することで、モデルの美学を固定できます。
  • 720pで反復し、1080pで納品してください。低い解像度で構図とモーションを検証し、同じシードで1080pに優勝作品を再レンダリングして本番カットに使用します。
  • 再現性のためにシードを固定してください。気に入ったフレームとモーションパスを見つけたら、seedをロックし、その周囲のプロンプトの詳細だけを調整します。
  • アスペクト比を目的地に合わせてください。モバイルファーストのプラットフォームには9:16、YouTubeとOTTには16:9、フィード投稿には1:1、エディトリアルレイアウトには4:3/3:4を使用します。
  • 短くから始めてください。特に複数のモーションキューを持つ複雑なシーンでは、15秒のクリップを生成する前に3〜5秒でルックを検証します。

ワークフローが純粋なテキストではなく参照画像から始まる場合、Alibaba Happy Horse 1.0 画像生成動画とこのモデルを組み合わせて、正確な開始フレームが必要なアニメーションタスクに使用してください。

よくある質問

Alibaba Happy Horse 1.0 テキスト生成動画とは何ですか?

Alibaba Happy Horse 1.0 テキスト生成動画は、テキストプロンプトから720pまたは1080pの動画を生成するシネマティックAI動画生成モデルです。複数のアスペクト比にわたる強いプロンプト忠実性と滑らかなカメラモーションを備えています。

Alibaba Happy Horse 1.0 テキスト生成動画の料金はいくらですか?

料金は1秒あたりの線形課金です:720pで5秒あたり$0.70、1080pで5秒あたり$1.40。5秒の1080pクリップは$1.40、10秒の720pクリップは$1.40、15秒の1080pクリップは$4.20です。

APIを通じてAlibaba Happy Horse 1.0を使用できますか?

はい。Happy Horse 1.0はコールドスタートなしでWaveSpeedAIのRESTインファレンスAPIを通じて利用可能です。シンプルなHTTPリクエストまたは公式のWaveSpeed Python SDKを使って任意の言語から呼び出すことができます。

Happy Horse 1.0はどのようなアスペクト比と解像度をサポートしていますか?

このモデルは16:99:161:14:33:4のアスペクト比を720pまたは1080pの解像度でサポートし、3秒から15秒の長さに対応しています。

Happy Horse 1.0のプロンプトはどれくらいの長さにできますか?

プロンプトは最大2,500文字まで指定できます。これは被写体、アクション、カメラワーク、照明、雰囲気、ビジュアルスタイルを1つの指示で指定するのに十分な寛大な仕様です。

今日からシネマティックな動画の生成を始めましょう

Alibaba Happy Horse 1.0 テキスト生成動画は、シネマティックなモーション、強いプロンプトコントロール、柔軟なフォーマットを1回のAPI呼び出しで提供します。WaveSpeedAIのコールドスタートなしのインフラストラクチャと使用量に応じた料金体系が支えています。

WaveSpeedAIでAlibaba Happy Horse 1.0 テキスト生成動画を試す →