Memperkenalkan Alibaba WAN 2.7 Reference To Video di WaveSpeedAI

Wan 2.7 Reference-to-Video: Buat Video AI dengan Karakter Konsisten dari Berbagai Referensi

Mempertahankan identitas karakter di seluruh klip video yang dihasilkan AI telah menjadi salah satu tantangan terbesar dalam pembuatan video generatif — hingga sekarang. Wan 2.7 Reference-to-Video dari Tongyi Lab milik Alibaba mengatasi masalah ini dengan memungkinkan Anda memasukkan beberapa video dan gambar referensi, lalu menghasilkan adegan baru di mana karakter, properti, dan gaya visual tetap konsisten sempurna. Tersedia sekarang di WaveSpeedAI tanpa cold start dan harga bayar-per-penggunaan yang terjangkau, model ini membuka generasi video multi-karakter berkualitas produksi melalui REST API yang sederhana.

Baik Anda seorang pembuat film yang memvisualisasikan adegan kompleks, merek yang membuat kampanye juru bicara, atau kreator konten yang membangun narasi multi-shot, Wan 2.7 Reference-to-Video menghilangkan masalah inkonsistensi yang selama ini menghantui alur kerja video AI.

Cara Kerja Wan 2.7 Reference-to-Video

Wan 2.7 Reference-to-Video dibangun di atas arsitektur Diffusion Transformer (DiT) milik Alibaba dengan mekanisme Full Attention yang memproses hubungan spasial dan temporal di seluruh urutan video secara bersamaan. Inilah mengapa identitas karakter tetap stabil sepanjang durasi klip penuh — model tidak hanya menghasilkan frame demi frame, ia memahami seluruh urutan sekaligus.

Alur kerjanya sederhana:

Unggah video referensi — sediakan satu atau lebih video sumber yang berisi karakter atau elemen visual yang ingin Anda pertahankan.
Tambahkan gambar referensi opsional — lengkapi dengan gambar diam untuk panduan visual tambahan.
Tulis prompt Anda — deskripsikan adegan baru menggunakan bahasa alami, dengan merujuk karakter berdasarkan posisi (misalnya, “Karakter di Video 1 berjalan melalui taman sementara Video 2 menonton dari bangku”).
Hasilkan — model menghasilkan video baru yang menempatkan karakter yang dirujuk ke dalam adegan yang dideskripsikan dengan identitas, gaya, dan gerakan yang koheren.

Model ini mendukung hingga 5 input referensi gabungan (video dan gambar bersama), output pada resolusi 720p atau 1080p, rasio aspek termasuk 16:9, dan durasi klip 5, 10, atau 15 detik. Sistem pengindeksan prompt yang unik memungkinkan Anda mengontrol secara tepat referensi mana yang muncul di mana — video diberi nomor terlebih dahulu (Video 1, Video 2), kemudian gambar melanjutkan urutan (Image 3, Image 4).

Fitur Utama Wan 2.7 Reference-to-Video

Dukungan referensi multi-video — Gabungkan karakter, objek, atau elemen visual dari beberapa video sumber menjadi satu adegan yang koheren. Tidak ada model lain di kelas ini yang menangani referensi video multi-sumber semulus ini.
Konsistensi karakter dengan identitas terkunci — Arsitektur Full Attention mempertahankan fitur wajah, pakaian, proporsi tubuh, dan detail stilistik di seluruh klip yang dihasilkan tanpa pergeseran identitas yang umum terjadi pada model video berbasis difusi yang lebih lama.
Pengindeksan prompt untuk kontrol presisi — Rujuk karakter tertentu menggunakan sintaks “Video 1,” “Video 2,” “Image 3” dalam prompt Anda. Ini memberi Anda kontrol setingkat sutradara atas siapa yang melakukan apa dalam adegan yang dihasilkan.
Dukungan prompt negatif — Tentukan elemen yang harus dikecualikan dari output, mencegah perpaduan visual yang tidak diinginkan antara sumber referensi.
Perluasan prompt otomatis — Aktifkan perluasan prompt untuk membiarkan model memperkaya prompt yang lebih pendek dengan detail tambahan, menghasilkan output yang lebih kaya tanpa rekayasa prompt manual.
Output 1080p — Hasilkan pada resolusi HD penuh untuk hasil siap produksi, atau gunakan 720p untuk iterasi lebih cepat selama proses kreatif.
Hingga 15 detik per klip — Hasilkan adegan yang lebih panjang yang memberi karakter waktu untuk bergerak, berinteraksi, dan berekspresi — cukup untuk short media sosial dan potongan komersial.

Kasus Penggunaan Terbaik Wan 2.7 Reference-to-Video

Penceritaan Multi-Karakter dan Film Pendek

Tempatkan karakter dari video referensi terpisah ke dalam adegan bersama yang tidak pernah mereka rekam bersama. Seorang pembuat film dapat merekam aktor secara individual, lalu menggunakan Wan 2.7 R2V untuk menghasilkan adegan interaksi — karakter duduk bersama, berjalan berdampingan, atau bercakap-cakap di lingkungan baru. Ini secara dramatis mengurangi biaya produksi untuk proyek indie dan pra-visualisasi.

Kampanye Video Juru Bicara Merek

Tim pemasaran dapat menghasilkan puluhan variasi video sesuai merek yang menampilkan juru bicara atau maskot merek yang konsisten. Unggah video referensi karakter merek Anda sekali, lalu hasilkan mereka dalam pengaturan berbeda — di dapur, di kantor, di luar ruangan — sambil mempertahankan identitas visual yang sempurna sepanjang kampanye. Tidak perlu pengambilan ulang.

Konten Media Sosial dalam Skala Besar

Kreator konten dapat memproduksi video bentuk pendek yang konsisten karakternya dalam jumlah banyak. Ambil video referensi karakter atau persona yang berulang, deskripsikan skenario baru, dan hasilkan konten segar setiap hari. Pelestarian identitas memastikan audiens Anda mengenali karakter di setiap postingan, membangun konsistensi merek tanpa overhead produksi.

Demo Produk dan Video Penjelas

Gabungkan video referensi presenter dengan gambar produk untuk menghasilkan video demo yang dipoles. Presenter mempertahankan penampilan dan gaya mereka sambil berinteraksi dengan produk dalam konteks baru — sempurna untuk daftar e-commerce, peluncuran produk, dan konten tutorial.

Konsep Kreatif dan Storyboard

Sutradara dan tim kreatif dapat dengan cepat membuat prototipe adegan multi-karakter sebelum berkomitmen pada produksi penuh. Hasilkan 10 variasi adegan dengan penataan, pencahayaan, atau interaksi karakter yang berbeda dalam hitungan menit. Gunakan 720p untuk iterasi cepat, lalu render konsep terbaik pada 1080p.

Konten Fan dan Crossover Karakter

Gabungkan elemen visual dari berbagai sumber menjadi satu adegan yang koheren. Karakter dari video referensi yang berbeda dapat berinteraksi secara alami, membuka kemungkinan kreatif untuk fan art, mashup, dan penceritaan visual eksperimental.

Konten Pelatihan dan Pendidikan

Hasilkan konten video yang dipimpin instruktur yang konsisten di beberapa pelajaran. Unggah referensi instruktur sekali, lalu produksi mereka dalam pengaturan pendidikan yang berbeda — di papan tulis, di laboratorium, di lapangan — mempertahankan kontinuitas visual di seluruh seri kursus.

Harga dan Akses API Wan 2.7 Reference-to-Video

WaveSpeedAI menawarkan Wan 2.7 Reference-to-Video dengan harga per-generasi yang mudah dipahami:

Durasi	720p	1080p
5 detik	$1,00	$1,60
10 detik	$1,50	$2,40
15 detik	$2,00	$3,20

Render 1080p berharga 1,6× dari tarif 720p. Harga sudah termasuk overhead tetap untuk pemrosesan video referensi.

Memulai hanya membutuhkan beberapa menit. Instal WaveSpeed SDK dan buat panggilan API pertama Anda:

import json
import os
import time
from urllib.request import Request, urlopen

api_key = os.environ["WAVESPEED_API_KEY"]
headers = {"Authorization": f"Bearer {api_key}", "Content-Type": "application/json"}
payload = {
    "prompt": "A cinematic ocean wave at sunrise, highly detailed",
    "resolution": "720p",
    "aspect_ratio": "16:9",
    "duration": 5,
    "enable_prompt_expansion": False,
    "seed": -1
}

def request_json(url, data=None):
    request = Request(url, data=data, headers=headers, method="POST" if data else "GET")
    with urlopen(request) as response:
        return json.load(response)

# 1. Submit the prediction.
submit_body = request_json("https://api.wavespeed.ai/api/v3/alibaba/wan-2.7/reference-to-video", json.dumps(payload).encode())
task = submit_body.get("data", submit_body)
prediction_id = task.get("id")
if not prediction_id:
    raise RuntimeError("Submission response did not contain a prediction id")
result_url = task.get("urls", {}).get("get") or f"https://api.wavespeed.ai/api/v3/predictions/{prediction_id}/result"

# 2. Poll until the prediction finishes.
while True:
    body = request_json(result_url)
    result = body.get("data", body)
    status = result.get("status")
    if status == "completed":
        print(result.get("outputs", []))
        break
    if status in {"failed", "cancelled", "timeout"}:
        raise RuntimeError(result)
    if status not in {"created", "processing"}:
        raise RuntimeError(f"Unexpected status: {status}")
    time.sleep(2)

WaveSpeedAI menjalankan Wan 2.7 Reference-to-Video dengan tanpa cold start — permintaan pertama Anda secepat yang keseratus. Tanpa penundaan provisi GPU, tanpa biaya komputasi idle. Anda hanya membayar untuk apa yang Anda hasilkan.

Coba Wan 2.7 Reference-to-Video sekarang →

Tips untuk Hasil Terbaik dengan Wan 2.7 Reference-to-Video

Gunakan video referensi yang jelas dan berbeda. Semakin berbeda secara visual setiap video referensi, semakin baik model mempertahankan identitas setiap karakter dalam output. Hindari referensi dengan subjek yang terlihat serupa.
Rujuk karakter berdasarkan indeks dalam prompt Anda. Selalu gunakan “Video 1,” “Video 2,” dll. untuk menentukan karakter mana yang melakukan apa. Penomoran mengikuti urutan unggahan untuk video, lalu berlanjut untuk gambar referensi.
Mulai dengan 720p untuk iterasi. Uji komposisi adegan, phrasing prompt, dan posisi karakter pada 720p sebelum berkomitmen pada render final 1080p. Ini menghemat waktu dan biaya.
Gunakan prompt negatif untuk mencegah perpaduan. Jika Anda melihat gaya visual bercampur antara sumber referensi, tambahkan prompt negatif untuk mengecualikan elemen yang tidak diinginkan.
Aktifkan perluasan prompt untuk prompt pendek. Jika prompt Anda singkat atau kurang detail adegan, mengaktifkan perluasan prompt membiarkan model mengisi detail sinematik secara otomatis.
Jaga video referensi tetap pendek dan terfokus. Klip referensi yang dengan jelas menampilkan subjek yang ingin Anda pertahankan akan menghasilkan konsistensi identitas yang lebih baik daripada rekaman panjang dan beragam.

Pertanyaan yang Sering Diajukan tentang Wan 2.7 Reference-to-Video

Apa itu Wan 2.7 Reference-to-Video?

Wan 2.7 Reference-to-Video adalah model pembuatan video AI dari Alibaba yang menciptakan adegan video baru sambil mempertahankan identitas, penampilan, dan gaya karakter dari video dan gambar referensi Anda.

Berapa biaya Wan 2.7 Reference-to-Video?

Harga mulai dari $1,00 per klip 5 detik pada 720p, naik hingga $3,20 untuk video 1080p berdurasi 15 detik. Tidak ada biaya berlangganan — Anda membayar per generasi di WaveSpeedAI.

Bisakah saya menggunakan Wan 2.7 Reference-to-Video melalui API?

Ya. Wan 2.7 Reference-to-Video tersedia sebagai REST API di WaveSpeedAI tanpa cold start, harga bayar-per-penggunaan, dan WaveSpeed Python SDK untuk integrasi yang mudah.

Berapa banyak video referensi yang bisa saya gunakan sekaligus?

Anda dapat menyediakan hingga 5 input referensi gabungan (video dan gambar bersama). Setiap referensi diberi nomor secara berurutan dalam prompt Anda untuk kontrol presisi atas karakter mana yang muncul di mana.

Apa perbedaan Wan 2.7 Reference-to-Video dengan Wan 2.7 Image-to-Video?

Wan 2.7 Image-to-Video menganimasikan satu gambar referensi menjadi video. Reference-to-Video menerima beberapa referensi video, mempertahankan identitas di seluruh sumber dan memungkinkan adegan multi-karakter dengan identitas yang konsisten — kemampuan yang secara fundamental berbeda untuk alur kerja produksi.

Mulai Membuat Video dengan Karakter Konsisten menggunakan Wan 2.7

Wan 2.7 Reference-to-Video menghadirkan kemampuan yang sebelumnya tidak mungkin dalam pembuatan video AI: pelestarian identitas multi-karakter yang andal dari referensi video. Dikombinasikan dengan inferensi instan WaveSpeedAI dan API sederhana, ini siap untuk alur kerja produksi hari ini.

Jelajahi rangkaian lengkap Wan 2.7 di WaveSpeedAI — termasuk Text-to-Video, Image-to-Video, Video Edit, dan Video Extend.

Coba Wan 2.7 Reference-to-Video di WaveSpeedAI →