Menskalakan Generasi Video AI: Bagaimana Novita AI Mencapai Optimasi Dual Efisiensi dan Biaya dengan WaveSpeedAI
Menskalakan Generasi Video AI: Bagaimana Novita AI Mencapai Optimasi Ganda Efisiensi dan Biaya dengan WaveSpeedAI

WaveSpeedAI telah meningkatkan efisiensi inferensi kami secara signifikan dan membantu kami mengurangi biaya generasi video hingga 67%. Dengan pemrosesan video yang lebih cepat dan lebih andal, kami dapat memberikan pengalaman pengguna yang luar biasa dalam skala besar.”
— Junyu Huang, COO Novita AI
Latar Belakang Pelanggan
Novita AI adalah perusahaan yang fokus pada infrastruktur inferensi AI, berdedikasi untuk menyediakan kreator, pengembang, dan perusahaan dengan layanan inferensi generasi video yang andal dan efisien. Perusahaan mendukung penerapan berbagai model generasi video utama, mencakup kemampuan end-to-end dari generasi image-to-video dan text-to-video, melayani pengguna kreatif global dan platform AI dengan resolusi mulai dari 720P hingga 1080P.

Tantangan Sebelum WaveSpeedAI
Seiring dengan meningkatnya jumlah model dan kompleksitas layanan, Novita AI menghadapi beberapa tantangan dalam arsitektur inferensi dan operasinya:
-
Penjadwalan sumber daya yang kompleks karena penerapan multi-model: Mendukung berbagai model seperti Wan 2.1, Kling V1.6, dan Hunyuan Video, masing-masing dengan persyaratan memori dan komputasi yang berbeda, menghasilkan perbedaan signifikan dalam efisiensi inferensi.
-
Biaya tinggi untuk inferensi HD dengan GPU yang kurang dimanfaatkan: Terutama untuk tugas generasi video 720P dan 1080P, setiap siklus inferensi mengonsumsi jumlah memori GPU yang besar, menyebabkan biaya generasi per unit yang tinggi.
-
Latensi tidak stabil di bawah konkurensi tinggi: Beberapa model besar mengalami penundaan respons yang signifikan selama lalu lintas pengguna puncak, berdampak negatif pada pengalaman pengguna akhir dan reputasi platform.
Kolaborasi dengan WaveSpeedAI
Untuk mengatasi tantangan ini, Novita AI menjalin kolaborasi mendalam dengan WaveSpeed AI, berfokus pada penerapan optimal model-model inti berikut:
- Wan 2.1 Image-to-Video / Text-to-Video

- Hunyuan Video Fast

- Kling V1.6 Image-to-Video / Text-to-Video

Dengan dukungan WaveSpeed AI, Novita dapat menyetel setiap model secara individual dan menjadwalkan sumber daya GPU secara dinamis di seluruh kumpulan terpadu, sehingga memaksimalkan kinerja dan efisiensi biaya.
Hasil & Manfaat
✅ Optimasi Kinerja Inferensi: Efisiensi inferensi meningkat hingga 25%, dengan rata-rata waktu generasi video berkurang 30–40%.
| Model | Resolusi | Waktu Sebelum Optimasi | Waktu Setelah Optimasi |
|---|---|---|---|
| Hunyuan Video Fast | 720P | 2 menit | 1 menit 30 detik |
| Wan 2.1 Text-to-Video | 1280×720 | 2 menit 24 detik | 1 menit 55 detik |
| Wan 2.1 Image-to-Video | 1280×720 | 3 menit 10 detik | 2 menit 30 detik |
| Kling V1.6 Image-to-Video | 1080P / 5s | $0.98 / video | $0.92 / video |
✅ Optimasi Struktur Biaya: Biaya rata-rata per panggilan berkurang lebih dari 30%, dengan penghematan hingga 66% dalam skenario resolusi tinggi.
| Model | Resolusi | Biaya Sebelum Optimasi | Biaya Setelah Optimasi | Pengurangan Biaya |
|---|---|---|---|---|
| Hunyuan Video Fast | 720P | $0.18 / detik | $0.06 / detik | -66.7% |
| Wan 2.1 Text-to-Video | 1280×720 | $0.06 / detik | $0.04 / detik | -33.3% |
| Wan 2.1 Image-to-Video | 1280×720 | $0.08 / detik | $0.06 / detik | -25.0% |
| Kling V1.6 Image-to-Video | 1080P / 5s | $0.49 / video | $0.46 / video | -6.1% |
✅ Stabilitas Sistem Meningkat: Respons model lebih stabil di bawah konkurensi tinggi, tingkat kesuksesan generasi video meningkat, dan tingkat kegagalan turun di bawah 0.05%, secara signifikan meningkatkan pengalaman pengguna.
Ke Depannya
Di masa depan, Novita AI akan terus memperdalam kolaborasinya dengan WaveSpeed AI untuk lebih meningkatkan fleksibilitas dan stabilitas penerapan multi-model, mengeksplorasi kerangka kerja inferensi video yang lebih efisien, dan terus mengoptimalkan struktur biayanya. Dengan kekuatan teknis WaveSpeedAI, Novita AI yakin dapat memberikan layanan generasi video yang lebih cepat, lebih stabil, dan lebih hemat biaya kepada pelanggan global—mendorong batas-batas teknologi dan nilai bisnis dalam bidang generasi media AI.
Coba sekarang!
🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6





