← ブログ

Seedance 2.0 完全ガイド:マルチモーダル動画制作

Seedance 2.0がWaveSpeedAIで利用可能になりました。この包括的なガイドでマルチモーダル動画生成をマスターしましょう — 画像、動画、音声、テキストを組み合わせて、モーション、スタイル、ストーリーテリングを精密にコントロールできます。

By WaveSpeedAI 3 min read

WaveSpeedAIでライブ配信中。 全14のSeedance 2.0エンドポイントが利用可能 — StandardおよびFastティア、低レイテンシ実行向けのTurboバリアント付き。

Standard: T2V · I2V · T2V Turbo · I2V Turbo · Video Edit · Video Edit Turbo · Video Extend

Fast: T2V · I2V · T2V Turbo · I2V Turbo · Video Edit · Video Edit Turbo · Video Extend

ローンチ10%割引は5月13日(UTC+0)まで実施中。

Seedance 2.0は、AI動画生成における根本的な転換点を表しています。テキストプロンプトや単一の参照画像だけに頼るのではなく、このモデルは画像、動画、音声、テキストを入力として受け付け、まるで本物の映像監督のように創作のあらゆる側面を指示することができます。

最大の特徴はリファレンス機能です。画像でビジュアルスタイルを設定し、動画でモーションとカメワークを指定し、音声でリズムを刻み、テキストでナラティブを導くことができます。その結果、これまで生成動画では不可能だったレベルのコントロールが実現します。


基本仕様

パラメータ仕様
画像入力最大9枚
動画入力最大3本、合計15秒まで
音声入力最大3つのMP3ファイル、合計15秒まで
テキスト入力自然言語プロンプト
出力時間4〜15秒(ユーザー選択可)
音声出力ネイティブ効果音・音楽
ファイル総数制限1生成あたり12ファイル

複数ファイルを扱う際は、最終出力への影響が最も大きいアセット(モーション用の参照動画やキャラクター一貫性用の画像など)を優先してください。


リファレンスの使い方

Seedance 2.0は@メンションシステムを使用して、アップロードした各アセットの使い方を指定します。これにより、各ファイルが生成にどう貢献するかを明示的にコントロールできます。

エントリーポイント

  • 最初/最後のフレームモード: 開始画像とプロンプトだけが必要な場合に使用
  • ユニバーサルリファレンスモード: マルチモーダルの組み合わせ(画像+動画+音声+テキスト)に使用

@構文

ファイルをアップロードした後、プロンプト内でファイル識別子に続けて@を使って参照します:

@Image1 を最初のフレームとして使用し、カメラの動きには @Video1 を参照し、
BGMには @Audio1 を使用する

リファレンス指示の例

ユースケースプロンプトパターン
最初のフレームを設定@Image1 を最初のフレームとして使用
モーションを参照格闘のコレオグラフィーに @Video1 を参照
カメラワークをコピー@Video1 のカメラの動きとトランジションに従う
音楽/リズムを追加BGMに @Audio1 を使用
動画を延長@Video1 を5秒延長
キャラクターを置き換え@Video1 の女性を @Image1 に置き換え

コア機能

1. 向上したベース品質

Seedance 2.0は、基本的な生成品質において大幅な改善をもたらします:

  • 物理精度: 物体が現実世界のルールに従って落下・衝突・相互作用する
  • 流体的なモーション: 適切な勢いとタイミングを持つ自然な動き
  • 正確な指示の遵守: 複雑なプロンプトを理解して実行するモデル
  • スタイルの一貫性: 動画全体を通じてビジュアルの統一感を維持

プロンプト例:

女の子が洗濯物を優雅に干し、一枚干し終えてかごの中の次の洗濯物を取り出し、
しっかりとはたいている。

明示的な指示がなくても、モデルは連続した動作・布の物理挙動・自然な身体の動きを処理します。

2. マルチモーダルリファレンスシステム

これはSeedance 2.0の定義的な機能です。アップロードしたアセットからほぼあらゆるものを参照できます:

  • 参照動画からのモーションパターン
  • クリエイティブテンプレートからの視覚効果とトランジション
  • 参照画像からのキャラクターの外見
  • 映画的サンプルからのカメラテクニック
  • 音楽トラックからの音声リズムとムード

基本原則: 何を参照したいかを自然言語で説明してください。どのファイルからどの要素(モーション、スタイル、カメラ、キャラクター)を抽出するかを具体的に指定してください。

3. キャラクターとオブジェクトの一貫性

従来のモデルはフレーム間でのアイデンティティ維持に苦労していました。Seedance 2.0はこれを直接解決します:

  • 顔の一貫性: キャラクターが全体を通して同じ外見を維持する
  • 製品の細部保持: ロゴ、テキスト、細かいディテールが正確に保たれる
  • シーンの統一感: 環境がショット全体で一貫している
  • スタイルロック: 生成中にビジュアルスタイルがぶれない

プロンプト例:

@Image1 の男性が仕事から疲れて帰宅し、廊下を歩くペースを落とし、玄関のドアの前で立ち止まる。
深呼吸をする彼の顔のクローズアップ、ストレスから穏やかな表情へと整える。
鍵を見つけ、錠前に差し込む彼のクローズアップ。
彼が入ると、娘とペットの犬がハグして迎えに走ってくる。
室内は温かく居心地が良く、全体を通じて自然な会話がある。

4. モーションとカメラの複製

参照動画をアップロードすると、Seedance 2.0は以下を抽出して適用できます:

  • 複雑なコレオグラフィー: 格闘シーン、ダンスの動き、アクションシーン
  • カメラテクニック: ドリーショット、トラッキング、クレーンの動き、手持ちの感触
  • 編集リズム: カットのタイミング、トランジションスタイル、テンポ
  • 特殊な動き: ヒッチコックズーム、ホイップパン、オービットショット

プロンプト例:

@Image2 のエレベーター設定に @Image1 の男性の外見を参照。
@Video1 のカメラの動きと主人公の表情を完全に複製。
驚いた時にヒッチコックズーム、次いでエレベーター内で複数のオービットショット。
ドアが開き、彼が出るのを追うトラッキングショット。
外のシーンは @Image3 を参照し、男性が周囲を見回す。
@Video1 のメカニカルアームの多角度追跡ショットを参照し、彼の視線を追う。

5. クリエイティブテンプレートの複製

モーションを超えて、クリエイティブコンセプト全体を複製できます:

  • 広告フォーマット: 製品紹介、ライフスタイルモンタージュ、ブランドストーリー
  • 視覚効果: パーティクルシステム、モーフィング、スタイライズドトランジション
  • 映画テクニック: オープニングシーケンス、タイトルカード、劇的な演出
  • 編集スタイル: MVカット、ドキュメンタリーのテンポ、コマーシャルリズム

プロンプト例:

@Video1 の人物を @Image1 の女の子に置き換え。月の女神CGを @Image2 を参照した天使に置き換え。
女の子がかがむと背中から翼が生える。翼がカメラの前を通過してトランジション。
天使の瞳を通って次のシーンへ、天使の空撮ショット(らせん状の翼が瞳に合わせる)、
カメラが天使の顔に沿って降下、腕を上げると後ろの石の天使像が現れるように引いていく。
全編ワンカット。

6. 動画の延長

既存の動画をナラティブの一貫性を保ちながら延長します:

プロンプト例:

@Video1 を15秒延長。@Image1 と @Image2 のロバのバイクキャラクターを参照。
ワイルドな広告シーケンスを追加:

シーン1: サイドショット、ロバがバイクでフェンスを突き破り、近くのニワトリが驚く。

シーン2: ロバが砂の上でスピンスタントを行い、タイヤのクローズアップ、
次いでロバが円を描く空撮オーバーヘッドショット、砂煙が立ち上る。

シーン3: 山を背景に、ロバが坂から飛び出し、マスキング効果でコピーが現れる
(ロバが通り過ぎると文字が現れる):"Inspire Creativity, Enrich Life"。
最終ショット:バイクが通過し、砂煙が舞い上がる。

7. 動画編集

一からやり直さずに既存の動画を修正します:

  • キャラクター置き換え: アクションを保ちながら一人を別の人に変える
  • 要素の追加/削除: オブジェクトを追加し、不要なものを取り除く
  • スタイル転写: 新しいビジュアル処理を適用する
  • ナラティブの変更: ストーリーの方向を変える

プロンプト例:

@Video1 のプロットを覆す。男性の表情が優しさから冷たく残酷なものへと即座に変わる。
女性が最も予期しない瞬間、彼は彼女を橋から川へと突き落とす。
その突き落としは断固として、計画的で、躊躇なく——ロマンチックなキャラクター設定を完全に覆す。
彼女が落ちていく間、悲鳴はなく、目には不信感だけ。
彼女が水面に出てきて彼に叫ぶ:「あなたは最初から私に嘘をついていたのね!」
彼は冷たい微笑みで橋に立ち、静かに言う:「これがお前の家が俺の家に負っている借りだ。」

8. 音声同期生成

Seedance 2.0はネイティブ音声で動画を生成し、参照音声と同期できます:

  • 複数言語でのリップシンク対話
  • 画面上の動作に合わせた効果音
  • 映像リズムに従ったBGM
  • 感情表現を伴う声の演技

プロンプト例:

固定ショット。丸い開口部を見下ろす魚眼レンズ。
@Video1 の魚眼効果を参照。@Video2 の馬が魚眼レンズを見上げる。
@Video1 の話す動作を参照。背景音声は @Video3 の効果音を参照。

9. ビート同期編集

ビートに合わせたMVスタイルのコンテンツを制作します:

プロンプト例:

ポスターの女の子が次々と衣装を変えていく。服のスタイルは @Image1 と @Image2 を参照。
彼女は @Image3 のバッグを持っている。動画のリズムは @Video1 を参照。

音楽に同期した複数画像の場合:

@Image1 から @Image7 までを @Video1 のキーフレーム位置と全体的なリズムに合わせてカット。
フレーム内のキャラクターはよりダイナミックに。全体的なスタイルはより夢幻的に。
強い視覚的インパクト。音楽と映像の流れに合わせて参照画像のフレーミングを適宜調整。
ショット間に光の変化を加える。

10. ワンテイク継続性

一貫したモーションで長く途切れのないショットを生成します:

プロンプト例:

@Image1 から @Image5 まで、ランナーが階段を上り、廊下を通り、
屋上に出て、街の俯瞰ビューで終わる一続きのトラッキングショット。

プロンプト例:

スパイスリラースタイル。@Image1 を最初のフレームとして。
赤いコートを着た女性の前面からのトラッキングショット。フルショットで彼女を追う。
歩行者が繰り返しフレームを横切る。彼女がコーナーに到達し、@Image2 のコーナー建築を参照。
女性がフレームを出て角を曲がって消えるまでの固定ショット。
仮面の女の子がコーナーに潜んで悪意を持って見ており、仮面の女の子の外見は @Image3 を参照
(外見のみ、彼女はコーナーに立っている)。カメラが赤い女性に向かって前進。
彼女が邸宅に入って消える。邸宅は @Image4 を参照。カットなし。ワンカット撮影。

クリエイティブ活用例

広告とEコマース

ナレーション、ライフスタイルショット、ブランドストーリーテリングを同期させた製品デモを制作します。マルチモーダルシステムにより、既存のブランドアセットを参照しながら新しいコンテンツを生成できます。

コンテンツのローカライゼーション

ネイティブのリップシンクで多言語動画を生成します。モーションには元の動画を参照しながら、異なる言語の新しい対話を生成します。

ストーリーボードから動画へ

静止したストーリーボードのパネルをアニメーションシーケンスに変換します。ボードを参照画像としてアップロードし、その間のモーションを説明します。

テンプレートベースの制作

気に入った動画スタイルを見つけてリファレンスとしてアップロードし、そのスタイルで自分のキャラクターや設定を使った新しいコンテンツを生成します。


ベストプラクティス

  1. リファレンスを明示的に: どのファイルが何の目的かを明確に記述してください。「@Video1 のカメラの動きを参照」は、単に動画を言及するよりも優れています。

  2. アップロードの優先順位をつける: 12ファイルの制限があるため、出力への影響が最も大きいアセットを選んでください。

  3. @メンションを確認する: 複数のファイルがある場合、どの画像、動画、音声がどこに対応するかを混同していないか再確認してください。

  4. 編集か参照かを明確に: 既存の動画を編集したいのか、それとも新しいものを生成するためのリファレンスとして使いたいのかを明確にしてください。

  5. 時間の整合: 動画を延長する場合、生成時間を新しいコンテンツの長さに合わせて設定してください(例:5秒延長 = 5秒生成)。

  6. 自然言語を使う: モデルはコンテキストを理解します。人間のエディターに伝えるように、欲しいものを説明してください。


今すぐ試す

Seedance 2.0は本日WaveSpeedAIでライブ配信中です。ワークロードに合ったバリアントを選んでください:

ローンチ10%割引は5月13日(UTC+0)まで実施中です。Seedance 2.0コレクションページでラインナップ全体をご覧ください。

今後の展開

Seedance 2.0のマルチモーダル機能は進化し続けています。新機能や入力の組み合わせが利用可能になり次第、このガイドを更新していきます。

問題が発生した場合や機能リクエストがある場合は、ぜひフィードバックをお寄せください。それが全ての方にとってよりよいツールを作る原動力となります。


特定のショットにコンテンツ制限が少ない方がよい場合は、 WaveSpeedAIでこれらの代替モデルをお試しください:

WAN 2.7 | Veo 3.1 Fast T2V | Veo 3.1 Fast I2V | Sora 2 T2V | Sora 2 I2V | Kling | Vidu