Menskalakan Generasi Video AI: Bagaimana Novita AI Mencapai Optimasi Dual Efisiensi dan Biaya dengan WaveSpeedAI

Menskalakan Generasi Video AI: Bagaimana Novita AI Mencapai Optimasi Dual Efisiensi dan Biaya dengan WaveSpeedAI

Menskalakan Generasi Video AI: Bagaimana Novita AI Mencapai Optimasi Ganda Efisiensi dan Biaya dengan WaveSpeedAI

Novita AI

WaveSpeedAI telah meningkatkan efisiensi inferensi kami secara signifikan dan membantu kami mengurangi biaya generasi video hingga 67%. Dengan pemrosesan video yang lebih cepat dan lebih andal, kami dapat memberikan pengalaman pengguna yang luar biasa dalam skala besar.”
— Junyu Huang, COO Novita AI

Latar Belakang Pelanggan

Novita AI adalah perusahaan yang fokus pada infrastruktur inferensi AI, berdedikasi untuk menyediakan kreator, pengembang, dan perusahaan dengan layanan inferensi generasi video yang andal dan efisien. Perusahaan mendukung penerapan berbagai model generasi video utama, mencakup kemampuan end-to-end dari generasi image-to-video dan text-to-video, melayani pengguna kreatif global dan platform AI dengan resolusi mulai dari 720P hingga 1080P.

Novita AI

Tantangan Sebelum WaveSpeedAI

Seiring dengan meningkatnya jumlah model dan kompleksitas layanan, Novita AI menghadapi beberapa tantangan dalam arsitektur inferensi dan operasinya:

  • Penjadwalan sumber daya yang kompleks karena penerapan multi-model: Mendukung berbagai model seperti Wan 2.1, Kling V1.6, dan Hunyuan Video, masing-masing dengan persyaratan memori dan komputasi yang berbeda, menghasilkan perbedaan signifikan dalam efisiensi inferensi.

  • Biaya tinggi untuk inferensi HD dengan GPU yang kurang dimanfaatkan: Terutama untuk tugas generasi video 720P dan 1080P, setiap siklus inferensi mengonsumsi jumlah memori GPU yang besar, menyebabkan biaya generasi per unit yang tinggi.

  • Latensi tidak stabil di bawah konkurensi tinggi: Beberapa model besar mengalami penundaan respons yang signifikan selama lalu lintas pengguna puncak, berdampak negatif pada pengalaman pengguna akhir dan reputasi platform.

Kolaborasi dengan WaveSpeedAI

Untuk mengatasi tantangan ini, Novita AI menjalin kolaborasi mendalam dengan WaveSpeed AI, berfokus pada penerapan optimal model-model inti berikut:

  • Wan 2.1 Image-to-Video / Text-to-Video

Wan 2.1 Image-to-Video / Text-to-Video

MiniMax Video 01

  • Kling V1.6 Image-to-Video / Text-to-Video

Kling V1.6 Image-to-Video / Text-to-Video

Dengan dukungan WaveSpeed AI, Novita dapat menyetel setiap model secara individual dan menjadwalkan sumber daya GPU secara dinamis di seluruh kumpulan terpadu, sehingga memaksimalkan kinerja dan efisiensi biaya.

Hasil & Manfaat

✅ Optimasi Kinerja Inferensi: Efisiensi inferensi meningkat hingga 25%, dengan rata-rata waktu generasi video berkurang 30–40%.

ModelResolusiWaktu Sebelum OptimasiWaktu Setelah Optimasi
Hunyuan Video Fast720P2 menit1 menit 30 detik
Wan 2.1 Text-to-Video1280×7202 menit 24 detik1 menit 55 detik
Wan 2.1 Image-to-Video1280×7203 menit 10 detik2 menit 30 detik
Kling V1.6 Image-to-Video1080P / 5s$0.98 / video$0.92 / video

✅ Optimasi Struktur Biaya: Biaya rata-rata per panggilan berkurang lebih dari 30%, dengan penghematan hingga 66% dalam skenario resolusi tinggi.

ModelResolusiBiaya Sebelum OptimasiBiaya Setelah OptimasiPengurangan Biaya
Hunyuan Video Fast720P$0.18 / detik$0.06 / detik-66.7%
Wan 2.1 Text-to-Video1280×720$0.06 / detik$0.04 / detik-33.3%
Wan 2.1 Image-to-Video1280×720$0.08 / detik$0.06 / detik-25.0%
Kling V1.6 Image-to-Video1080P / 5s$0.49 / video$0.46 / video-6.1%

✅ Stabilitas Sistem Meningkat: Respons model lebih stabil di bawah konkurensi tinggi, tingkat kesuksesan generasi video meningkat, dan tingkat kegagalan turun di bawah 0.05%, secara signifikan meningkatkan pengalaman pengguna.

Ke Depannya

Di masa depan, Novita AI akan terus memperdalam kolaborasinya dengan WaveSpeed AI untuk lebih meningkatkan fleksibilitas dan stabilitas penerapan multi-model, mengeksplorasi kerangka kerja inferensi video yang lebih efisien, dan terus mengoptimalkan struktur biayanya. Dengan kekuatan teknis WaveSpeedAI, Novita AI yakin dapat memberikan layanan generasi video yang lebih cepat, lebih stabil, dan lebih hemat biaya kepada pelanggan global—mendorong batas-batas teknologi dan nilai bisnis dalam bidang generasi media AI.

Coba sekarang!

🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6