← Blog

Memperkenalkan WaveSpeedAI LTX 2.3 Image-to-Video LoRA di WaveSpeedAI

LTX-2.3 dengan dukungan LoRA adalah model fondasi audio-video berbasis DiT yang dirancang untuk menghasilkan video dan audio tersinkronisasi dengan gaya, gerakan, atau kemiripan khusus

6 min read
Wavespeed Ai Ltx.2.3 Image To Video Lora
Wavespeed Ai Ltx.2.3 Image To Video Lora LTX-2.3 dengan dukungan LoRA adalah model fondasi audio-vide...
Try it
Memperkenalkan WaveSpeedAI LTX 2.3 Image-to-Video LoRA di WaveSpeedAI

Hidupkan Gambar Anda dengan Gaya Kustom: LTX-2.3 Image-to-Video LoRA Kini Hadir

Gambar statis memang kuat, namun gerakan yang bercerita. Dengan hadirnya LTX-2.3 Image-to-Video LoRA di WaveSpeedAI, kini Anda dapat mengubah gambar diam apapun menjadi video berkualitas tinggi lengkap dengan audio tersinkronisasi — dan menyesuaikan hasilnya dengan gaya, karakter, serta pola gerakan terlatih milik Anda sendiri melalui adapter LoRA.

Dibangun di atas arsitektur Diffusion Transformer (DiT) terbaru dari Lightricks dengan 19 miliar parameter, LTX-2.3 merupakan lompatan generasional dalam pembuatan video open-source. Dan dengan dukungan LoRA di WaveSpeedAI, Anda tidak lagi terbatas pada pengaturan default model dasar — Anda dapat menyuntikkan estetika merek, tampilan sinematik tertentu, atau kemiripan karakter langsung ke dalam pipeline pembuatan video.

Apa Itu LTX-2.3 Image-to-Video LoRA?

LTX-2.3 adalah model fondasi audio-video terbaru dari Lightricks, dan varian ini menggabungkan dua kemampuan yang jarang ditemukan bersama: pembuatan video berbasis gambar dan dukungan fine-tuning LoRA.

Begini cara kerjanya secara praktis. Anda menyediakan gambar referensi — foto produk, potret, karya konsep seni — dan model akan menganimasikannya menjadi video dengan gerakan alami dan audio tersinkronisasi, semuanya dalam satu proses. Lapisan LoRA memungkinkan Anda menerapkan hingga tiga adapter kustom secara bersamaan, mengarahkan hasil ke gaya visual, dinamika gerakan, atau kemiripan karakter tertentu yang telah Anda latih pada data Anda sendiri.

Hasilnya adalah pipeline pembuatan video yang canggih langsung dari kotak dan sangat dapat dikustomisasi untuk alur kerja profesional.

Yang Baru di LTX-2.3

LTX-2.3 bukan pembaruan inkremental. Lightricks membangun ulang tiga komponen inti model:

  • VAE yang Didesain Ulang: Variational autoencoder baru yang dilatih pada data berkualitas lebih tinggi menghasilkan detail halus yang lebih tajam, tekstur lebih realistis, dan tepi yang lebih bersih. Rambut, teks, dan objek kecil mempertahankan kejernihan di seluruh frame — peningkatan signifikan yang terutama terlihat pada resolusi lebih tinggi.

  • Text Connector 4x Lebih Besar: Mekanisme perhatian gated baru berarti prompt diikuti dengan lebih setia. Deskripsi timing, gerakan, ekspresi, dan isyarat audio diterjemahkan lebih akurat ke dalam hasil yang dihasilkan.

  • HiFi-GAN Vocoder yang Ditingkatkan: Kualitas audio mengalami kemajuan besar dengan suara lebih jernih, pengurangan artefak noise, dan penanganan dialog, musik, serta audio ambien yang lebih baik. Celah keheningan dan artefak yang menjangkiti versi sebelumnya telah disaring.

  • Gerakan Image-to-Video yang Lebih Baik: Model menghasilkan gerakan yang lebih alami dan realistis dari frame input — lebih sedikit efek panning “Ken Burns” yang statis dan lebih banyak animasi asli yang menghormati komposisi, pencahayaan, dan subjek gambar referensi Anda.

  • Dukungan Potret Asli: Buat video vertikal 9:16 secara asli tanpa perlu memotong dari lanskap, sempurna untuk media sosial dan konten yang mengutamakan perangkat mobile.

Fitur Utama

  • Pembuatan Audio-Video Tersinkronisasi: Audio dibuat bersama video dalam satu proses model — tidak perlu pipeline audio terpisah. Suara disesuaikan secara kontekstual dengan gerakan visual dan isyarat prompt.
  • Kustomisasi LoRA: Terapkan hingga 3 adapter LoRA secara bersamaan untuk mengontrol gaya, gerakan, dan kemiripan. Setiap adapter menyertakan parameter skala untuk pencampuran yang halus.
  • Resolusi Fleksibel: Pilih antara 480p untuk iterasi cepat, 720p untuk kualitas seimbang, atau 1080p untuk pengiriman final.
  • Durasi Variabel: Buat klip dari 5 hingga 20 detik dalam satu proses.
  • Preservasi Komposisi: Model mempertahankan subjek, framing, dan pencahayaan gambar input Anda sambil menambahkan gerakan yang alami dan koheren.

Kasus Penggunaan di Dunia Nyata

Pemasaran Produk

Ubah foto produk menjadi iklan video yang menarik. Unggah gambar hero, deskripsikan gerakan halus dan audio ambien, lalu terapkan LoRA bergaya merek untuk menjaga konsistensi visual di seluruh kampanye Anda.

Animasi Karakter

Latih LoRA pada karakter atau maskot tertentu, lalu animasikan pose atau adegan apapun yang menampilkan karakter tersebut dengan kemiripan yang konsisten. Ideal untuk studio animasi, pengembang game, dan pembuat konten yang membangun IP yang dapat dikenali.

Konten Media Sosial

Ubah postingan sosial statis menjadi konten video yang menarik perhatian. Dukungan mode potret asli berarti Anda dapat membuat video vertikal siap TikTok dan Instagram Reels secara langsung, tanpa pasca-pemrosesan.

Bercerita Sinematik

Animasikan frame storyboard atau karya konsep seni dengan LoRA gaya sinematik tertentu — film noir, anime, dokumenter — dan dapatkan video koheren dengan atmosfer audio yang sesuai.

Konten Konsisten Merek dalam Skala Besar

Kunci pembuatan video Anda pada panduan estetika tertentu menggunakan LoRA gaya. Setiap konten membawa tanda tangan visual merek Anda, baik Anda membuat satu klip maupun seratus.

Memulai di WaveSpeedAI

Memulai hanya butuh beberapa baris kode:

import wavespeed

output = wavespeed.run(
    "wavespeed-ai/ltx-2.3/image-to-video-lora",
    {
        "image": "https://example.com/your-image.jpg",
        "prompt": "The woman turns her head slowly and smiles, soft ambient music plays",
        "loras": [
            {"path": "https://example.com/your-style-lora.safetensors", "scale": 0.8}
        ],
        "resolution": "720p",
        "duration": 10,
    },
)

print(output["outputs"][0])

Harga yang Skalabel Sesuai Kebutuhan Anda

Resolusi5 dtk10 dtk15 dtk20 dtk
480p$0.15$0.30$0.45$0.60
720p$0.20$0.40$0.60$0.80
1080p$0.25$0.50$0.75$1.00

Mulai dengan 480p untuk melakukan iterasi prompt dan kombinasi LoRA dengan cepat, lalu tingkatkan ke 1080p saat Anda siap untuk hasil akhir.

Tips Pro untuk Hasil Terbaik

  • Deskripsikan audio secara eksplisit saat Anda menginginkan suara tertentu: “hujan di jendela,” “jazz yang ceria,” atau “tepuk tangan penonton.”
  • Jaga prompt gerakan tetap terfokus — satu aksi yang jelas per prompt menghasilkan hasil yang paling koheren.
  • Gunakan gambar input berkualitas tinggi yang tajam dan terekspos dengan baik untuk fidelitas animasi terbaik.
  • Iterasi cepat di 480p, lalu render versi final Anda di 720p atau 1080p.
  • Gunakan seed tetap saat membandingkan variasi LoRA untuk mengisolasi perubahan gaya dari variasi acak.

Kesimpulan

LTX-2.3 Image-to-Video LoRA di WaveSpeedAI memberikan Anda pembuatan video berkelas produksi dengan kedalaman kustomisasi yang dituntut oleh alur kerja profesional. Kombinasi kualitas visual yang ditingkatkan, audio tersinkronisasi, dan dukungan adapter LoRA berarti Anda tidak hanya membuat video generik — Anda membuat video Anda, dalam gaya Anda, pada skala Anda.

Tanpa cold start, inferensi cepat, dan harga per detik yang transparan, tidak ada hambatan untuk memulai.

Coba LTX-2.3 Image-to-Video LoRA di WaveSpeedAI hari ini dan lihat apa yang dapat dicapai oleh gambar Anda.