← Blog

Memperkenalkan Alibaba WAN 2.6 Reference To Video Flash di WaveSpeedAI

Alibaba WAN 2.6 Reference-to-Video Flash mengubah referensi karakter, properti, atau adegan dari gambar atau video menjadi shot video baru dengan identitas, gaya, a

By WaveSpeedAI 6 min read
Alibaba Wan.2.6 Reference To Video Flash
Alibaba Wan.2.6 Reference To Video Flash Alibaba WAN 2.6 Reference-to-Video Flash mengubah referensi ...
Try it
Memperkenalkan Alibaba WAN 2.6 Reference To Video Flash di WaveSpeedAI

Alibaba WAN 2.6 Reference-to-Video Flash Kini Tersedia di WaveSpeedAI

Kecepatan bertemu konsistensi. WaveSpeedAI dengan bangga mengumumkan peluncuran Alibaba WAN 2.6 Reference-to-Video Flash, varian cepat dan terdistilasi dari model pembuatan video berbasis identitas milik Alibaba. Jika Anda selama ini bekerja dengan alur kerja reference-to-video dan berharap hasilnya bisa datang lebih cepat, model ini dibuat untuk Anda — menghadirkan konsistensi karakter dan penceritaan multi-shot yang sama dalam sebagian kecil waktu pembuatan.

Apa itu WAN 2.6 Reference-to-Video Flash?

WAN 2.6 Reference-to-Video Flash adalah versi yang dioptimalkan untuk kecepatan dari model WAN 2.6 Reference-to-Video standar. Didistilasi dari model ukuran penuh, ia mempertahankan kemampuan inti yang menjadikan keluarga WAN 2.6 R2V unik: Anda mengunggah gambar referensi karakter, properti, atau adegan, menulis prompt teks yang mendeskripsikan video yang Anda inginkan, dan model menghasilkan shot video baru yang secara setia mempertahankan identitas dan penampilan subjek referensi Anda.

Versi Flash mencapai inferensi yang jauh lebih cepat — menghasilkan video dalam hitungan detik, bukan menit — sambil mempertahankan kualitas visual, koherensi gerakan, dan preservasi identitas yang mendefinisikan seri WAN 2.6. Model ini mendukung hingga 5 gambar referensi, output 720p dan 1080p, durasi 5 atau 10 detik, dan pembuatan audio tersinkronisasi opsional.

Fitur Utama

  • Input Multi-Referensi: Unggah hingga 5 gambar referensi untuk memandu pembuatan. Berbagai sudut dan sudut pandang subjek yang sama menghasilkan preservasi identitas yang lebih baik — peningkatan signifikan dibandingkan alur kerja referensi tunggal biasa

  • Preservasi Identitas dengan Kecepatan: Model Flash mempertahankan fitur wajah, pakaian, proporsi tubuh, dan karakteristik khas subjek referensi Anda di setiap frame yang dihasilkan, kini dengan waktu tunggu yang jauh berkurang

  • Komposisi Multi-Shot: Pilih antara satu shot berkelanjutan atau komposisi multi-shot otomatis yang memecah prompt Anda menjadi beberapa shot koheren dengan transisi mulus — penceritaan sinematik dari satu panggilan API

  • Pembuatan Audio Bawaan: Aktifkan audio tersinkronisasi opsional, termasuk musik latar, suara ambien, dan efek Foley, yang disesuaikan dengan konten video yang dihasilkan. Tidak diperlukan pengisian suara pascaproduksi

  • Fleksibilitas Resolusi: Hasilkan dalam 720p (1280×720 atau 720×1280) atau 1080p (1920×1080 atau 1080×1920) sesuai kebutuhan output Anda — lanskap atau potret

  • Perluasan Prompt: Penyempurna prompt bawaan dapat secara otomatis menyempurnakan deskripsi Anda menjadi prompt yang lebih kaya dan detail, meningkatkan kualitas pembuatan tanpa memerlukan keahlian rekayasa prompt

Kasus Penggunaan Nyata

Konten Media Sosial Berbasis Karakter

Buat TikTok, Reels, dan YouTube Shorts yang menampilkan karakter konsisten di beberapa video. Unggah beberapa foto karakter atau maskot merek Anda, deskripsikan adegan, dan hasilkan konten sesuai merek dalam skala besar. Kecepatan Flash membuat iterasi cepat menjadi praktis — uji puluhan variasi dalam waktu model standar menghasilkan beberapa saja.

Prototipe Pemasaran dan Periklanan

Hasilkan demo produk, iklan merek, dan konsep kampanye yang menampilkan orang atau karakter tertentu dengan identitas konsisten di semua shot. Gunakan mode multi-shot untuk menghasilkan urutan iklan terstruktur lengkap dengan audio tersinkronisasi, memangkas hari-hari praproduksi menjadi menit.

Penceritaan Naratif dan Animasi

Bangun urutan naratif pendek di mana karakter mempertahankan penampilannya di berbagai perubahan adegan. Kemampuan multi-referensi memungkinkan Anda membangun beberapa karakter dalam satu pembuatan, sementara mode multi-shot menangani transisi dan tempo secara otomatis. Penulis dan seniman storyboard dapat memvisualisasikan adegan hampir secepat mereka mendeskripsikannya.

Pra-Visualisasi Cepat untuk Film

Sutradara dan sinematografer dapat memvisualisasikan shot dan urutan menggunakan foto referensi aktor dan lokasi. Kecepatan model Flash memungkinkan siklus umpan balik kreatif langsung — sesuaikan prompt, regenerasi, dan lihat hasilnya dalam hitungan detik, bukan menunggu dalam antrean render yang panjang.

Video E-Commerce dan Produk

Ubah foto produk statis menjadi video produk dinamis dengan merek yang konsisten. Unggah gambar produk sebagai referensi, deskripsikan gerakan dan lingkungan yang diinginkan, dan hasilkan konten video yang dipoles dan siap untuk listing dan iklan.

Memulai di WaveSpeedAI

Menggunakan WAN 2.6 Reference-to-Video Flash melalui API WaveSpeedAI sangatlah mudah:

import wavespeed

output = wavespeed.run(
    "alibaba/wan-2.6/reference-to-video-flash",
    {
        "reference_urls": [
            "https://example.com/character-front.jpg",
            "https://example.com/character-side.jpg"
        ],
        "prompt": "A woman walks through a sunlit garden, turning to smile at the camera",
        "size": "1280*720",
        "duration": 5,
        "shot_type": "multi"
    },
)

print(output["outputs"][0])

Opsi Konfigurasi

ParameterDeskripsi
reference_urls1-5 gambar referensi untuk panduan karakter dan adegan
promptDeskripsi teks adegan dan gerakan video
sizeResolusi output: 720p atau 1080p, lanskap atau potret
durationDurasi video: 5 atau 10 detik
shot_typesingle untuk satu shot berkelanjutan, multi untuk komposisi bervariasi
enable_audioHasilkan audio tersinkronisasi (diaktifkan secara default)
enable_prompt_expansionSempurnakan prompt Anda secara otomatis (dinonaktifkan secara default)

Harga

ResolusiDurasiAudio MatiAudio Nyala
720p5d$0,25$0,50
720p10d$0,375$0,75
1080p5d$0,40$0,80
1080p10d$0,60$1,20

Mulai dari hanya $0,25 per video — sebagian kecil dari yang dikenakan model sebanding untuk pembuatan yang konsisten identitas.

Tips Pro

  • Gunakan beberapa gambar referensi dari sudut berbeda untuk preservasi identitas yang paling akurat
  • Pilih tipe shot multi untuk komposisi sinematik dan dinamis dengan transisi otomatis
  • Nonaktifkan audio saat tidak diperlukan — pemrosesan lebih cepat dan biayanya setengahnya
  • Gunakan 720p untuk prototipe cepat dan draf, lalu beralih ke 1080p untuk render produksi final
  • Tambahkan negative prompt seperti "blurry, distorted, deformed" untuk mempertajam kualitas output
  • Jika video yang dihasilkan tidak memiliki suara, tambahkan frasa seperti “with background ambience” ke prompt Anda

Mengapa WaveSpeedAI?

WaveSpeedAI menyediakan infrastruktur ideal untuk WAN 2.6 Reference-to-Video Flash:

  • Tanpa Cold Start: Setiap permintaan langsung mulai diproses — tidak ada waktu tunggu untuk inisialisasi model
  • Inferensi Cepat: Infrastruktur yang dioptimalkan dikombinasikan dengan arsitektur terdistilasi model Flash berarti Anda mendapatkan hasil dalam hitungan detik
  • Harga Terjangkau: Pembuatan video yang konsisten identitas mulai dari $0,25, dengan penagihan per pembuatan yang transparan
  • REST API Sederhana: Integrasikan pembuatan reference-to-video ke aplikasi atau alur kerja apa pun dengan satu panggilan API

Mulai Membuat Sekarang

Alibaba WAN 2.6 Reference-to-Video Flash membawa pembuatan video yang mempertahankan identitas ke dalam alur kerja kreatif real-time. Input multi-referensi yang sama, konsistensi karakter yang sama, dan penceritaan multi-shot yang sama — dihadirkan dengan kecepatan yang dibutuhkan proyek Anda.

Baik Anda sedang melakukan iterasi pada konsep iklan, membangun perpustakaan konten berbasis karakter, atau memvisualisasikan adegan untuk produksi, model ini menghilangkan penantian dan membiarkan Anda fokus pada pekerjaan kreatif.

Coba sekarang di wavespeed.ai/models/alibaba/wan-2.6/reference-to-video-flash.