#talking-head
6 articles
daVinci-MagiHuman: Model Open-Source yang Mengalahkan Semua Generator Digital Human
daVinci-MagiHuman adalah model open-source 15B yang menghasilkan video kepala berbicara dengan sinkronisasi bibir dalam 2 detik di satu GPU H100. Mengalahkan Ovi 1.1 (tingkat kemenangan 80%) dan LTX 2.3 (60,9%). Berlisensi Apache 2.0, multibahasa, dan sangat cepat.
Memperkenalkan daVinci MagiHuman Image-to-Video di WaveSpeedAI
daVinci MagiHuman Image-to-Video adalah model open-source 15B yang menganimasikan gambar referensi menjadi video sinematik dengan sinkronisasi audio opsional. Setara dengan WAN 2.5. Hingga 1080p, 5-10 detik. REST API, $0,04/detik, tanpa cold start.
Memperkenalkan daVinci MagiHuman Text-to-Video di WaveSpeedAI
daVinci MagiHuman Text-to-Video menghasilkan video sinematik yang berpusat pada manusia dari teks prompt dengan sinkronisasi audio opsional. Model open-source 15B, hingga 1080p, 5-10 detik. REST API, $0,04/detik, tanpa cold start.
Memperkenalkan InfiniteTalk Fast Video-to-Video Multi di WaveSpeedAI
InfiniteTalk Fast multi-karakter lip sync mengubah video dan dua trek audio menjadi video berbicara atau bernyanyi yang realistis. 50% lebih murah dari standar, hingga 10 menit. API inferensi REST siap pakai, performa terbaik, tanpa coldstart, harga terjangkau.
Memperkenalkan InfiniteTalk Video-to-Video Multi di WaveSpeedAI
InfiniteTalk Video-to-Video Multi menghasilkan video multi-karakter dengan sinkronisasi bibir yang realistis dari input video dan dua audio. Mendukung resolusi 480p/720p, durasi hingga 10 menit, dengan koherensi seluruh tubuh. API inferensi REST siap pakai, performa terbaik, tanpa cold start, harga terjangkau.
SoulX FlashHead: Kepala Bicara AI Real-Time dengan 96 FPS
SoulX FlashHead menghasilkan video kepala bicara streaming real-time dengan 96 FPS tanpa pergeseran identitas. Video tanpa batas panjang. Coba di WaveSpeedAI.