PixVerse C1 Reference-to-VideoがWaveSpeedAIに登場

被写体と背景を固定して、動画を生成する

AI動画における根強い弱点は被写体の一貫性でした——「パリの街を歩く赤いコートの女性」というクリップを生成すると、2秒後には別の女性が別のコートを着ています。参照主導型生成はこの問題を解決します：被写体を自分で指定し、背景を自分で指定すると、モデルがそれらを合成して動画を生成します。

PixVerse C1 Reference-to-VideoがWaveSpeedAIで正式に公開されたことをお知らせします——本番対応のREST API、@ref_nameプロンプト構文による細かな参照制御が利用可能です。

PixVerse C1 Reference-to-Videoとは？

PixVerse C1 Reference-to-Videoは、PixVerse C1フラグシップ動画モデルの参照ガイド型バリアントです。純粋にテキストや単一の開始画像から生成するのではなく、名前付きの参照画像をアップロードし、@ref_name構文を使ってプロンプト内でそれらを参照します——モデルは、アップロードした内容と一致する被写体と背景を保持した動画を合成します。

例：

ref_1.png（特定のキャラクター）とref_2.png（特定のビーチ）をアップロード。プロンプト：「@ref_1が夕暮れ時に@ref_2に沿って歩き、後方からゆっくりとトラッキングショット。」 出力：キャラクターがref_1に見え、環境がref_2に見える10秒のクリップ——AIによる近似ではありません。

これはブランドコンテンツ、キャラクターベースのストーリーテリング、被写体が認識可能でなければならないあらゆるIP制作にとって大きな進歩です。

主な機能

@ref_nameプロンプト構文 プロンプト内で複数のアップロード済み画像を名前で参照できます。モデルは各参照をアップロードされたアセットに解決します。

被写体・背景の一貫性 クリップ全体にわたってキャラクターのアイデンティティと環境スタイルを固定します。

最大1080p、1〜15秒 PixVerse C1ファミリーの他のモデルと同じクオリティ基準。360p / 540p / 720p / 1080pから選択可能。

複数のアスペクト比 縦向き、横向き、シネマティック——希望の配信フォーマットに合わせて選択できます。

オプションのネイティブ音声 generate_audio_switchを有効にすると、同期音声付きのワンコール配信が可能です。

実際のユースケース

キャラクター主導の短編・ウェブシリーズ

一連のクリップにわたって一貫した外見の主人公を制作——同じ顔、同じ服装、異なるシーン。シリアルコンテンツには不可欠です。

ブランドアセットを使ったブランドコンテンツ

ブランドキャラクター、ロゴ、または製品リファレンスをアップロード——モデルがずれることなく新しい動画シーンに合成します。

ロックされたタレントでのストーリーボード

「この俳優」が「あの場所」で出会うシーンを、どちらも撮影せずにプリビジュアライズ。参照画像で両方を固定します。

IPおよびライセンスキャラクター制作

特定のキャラクターIPを使ったマーケティングクリップ、ゲームシネマティクス、ソーシャルコンテンツをアイデンティティの忠実度を維持しながら生成します。

教育・インストラクショナルコンテンツ

教育動画シリーズ全体にわたって一貫したインストラクターやマスコットを維持します。

スケールに応じたパーソナライズコンテンツ

ユーザーの写真（@ref_userとして）をシネマティックなシーン——誕生日、お祝い、パーソナライズされたグリーティング——に挿入するアプリ。

WaveSpeedAIで始める

参照画像をアップロード——1枚以上の画像に、それぞれref_nameラベルを付けます。
@ref_nameを使ったプロンプトを作成——どの参照がどこに表示されるかを指示します。
時間、解像度、アスペクト比、音声を選択——最大15秒・1080p。
送信——WaveSpeedAI APIが残りを処理します。

完全なスキーマはモデルページでご確認ください。

料金

1秒あたりの料金は解像度と音声の有無によって異なります：

360p： $0.03/秒（音声なし）、$0.04/秒（音声あり）
540p： $0.04/秒（音声なし）、$0.05/秒（音声あり）
720p： $0.05/秒（音声なし）、$0.065/秒（音声あり）
1080p： $0.095/秒（音声なし）、$0.12/秒（音声あり）

音声付き720pの10秒クリップは約$0.65です。

PixVerse C1 Reference-to-VideoをWaveSpeedAIで使う理由

1つのAPIで890以上のモデル。 Reference-to-videoをアップスケーリング、リップシンク、編集ツールと連携できます。
コールドスタートなし。 本番グレードのレイテンシ。
秒単位の料金、最低利用額なし。
水平スケール——大規模なオーディエンス向けにパーソナライズコンテンツをバッチ生成できます。

プロのヒント

良い参照画像が良い結果を生みます。 クリーンな構図、単一の被写体、明確なライティング。
参照には説明的な名前を付けてください。 プロンプトでは@img1や@img2より@heroや@cafeの方が読みやすいです。
複数の参照は控えめに使用してください。 1プロンプトあたり2〜3の参照が最もクリーンな合成を生みます；それ以上になるとモデルの注意が分散します。
シーンのアクションを明確に説明してください——参照アンカーがあっても、モーションは引き続きテキストで指示します。
まずアイデンティティを固定し、次にスタイルを。 参照キャラクターを維持しながら異なるムードを出したい場合は、参照はそのままにしてプロンプトキーワードでスタイルを調整してください。

今すぐ作成を始める

PixVerse C1 Reference-to-Videoは、スケールに応じた一貫した被写体の動画においてPixVerseファミリーで最も強力な選択肢——そして今やAPIコール1回で利用できます。

今すぐWaveSpeedAIでPixVerse C1 Reference-to-Videoを試す——信頼できるアイデンティティで動画を生成しましょう。

被写体と背景を固定して、動画を生成する

PixVerse C1 Reference-to-Videoとは？

主な機能

実際のユースケース

キャラクター主導の短編・ウェブシリーズ

ブランドアセットを使ったブランドコンテンツ

ロックされたタレントでのストーリーボード

IPおよびライセンスキャラクター制作

教育・インストラクショナルコンテンツ

スケールに応じたパーソナライズコンテンツ

WaveSpeedAIで始める

料金

PixVerse C1 Reference-to-VideoをWaveSpeedAIで使う理由

プロのヒント

今すぐ作成を始める

関連記事

GPT-5.6がOpenAIのCodexログに突如登場——これが実際に意味すること

HiDream-O1-Image-Dev：56BのFLUX.2を超えた8Bピクセルネイティブモデル

Tripo3D H3.1 Image-to-3DがWaveSpeedAIに登場

Tripo3D H3.1 Multiview-to-3DがWaveSpeedAIに登場

Tripo3D H3.1 Text-to-3DがWaveSpeedAIに登場

Nucleus ImageがWaveSpeedAIに登場