#digital-human
39 articles
daVinci-MagiHuman: Model Open-Source yang Mengalahkan Semua Generator Digital Human
daVinci-MagiHuman adalah model open-source 15B yang menghasilkan video kepala berbicara dengan sinkronisasi bibir dalam 2 detik di satu GPU H100. Mengalahkan Ovi 1.1 (tingkat kemenangan 80%) dan LTX 2.3 (60,9%). Berlisensi Apache 2.0, multibahasa, dan sangat cepat.
Memperkenalkan daVinci MagiHuman Image-to-Video di WaveSpeedAI
daVinci MagiHuman Image-to-Video adalah model open-source 15B yang menganimasikan gambar referensi menjadi video sinematik dengan sinkronisasi audio opsional. Setara dengan WAN 2.5. Hingga 1080p, 5-10 detik. REST API, $0,04/detik, tanpa cold start.
Memperkenalkan daVinci MagiHuman Text-to-Video di WaveSpeedAI
daVinci MagiHuman Text-to-Video menghasilkan video sinematik yang berpusat pada manusia dari teks prompt dengan sinkronisasi audio opsional. Model open-source 15B, hingga 1080p, 5-10 detik. REST API, $0,04/detik, tanpa cold start.
Memperkenalkan InfiniteTalk Fast Video-to-Video Multi di WaveSpeedAI
InfiniteTalk Fast multi-karakter lip sync mengubah video dan dua trek audio menjadi video berbicara atau bernyanyi yang realistis. 50% lebih murah dari standar, hingga 10 menit. API inferensi REST siap pakai, performa terbaik, tanpa coldstart, harga terjangkau.
Memperkenalkan InfiniteTalk Video-to-Video Multi di WaveSpeedAI
InfiniteTalk Video-to-Video Multi menghasilkan video multi-karakter dengan sinkronisasi bibir yang realistis dari input video dan dua audio. Mendukung resolusi 480p/720p, durasi hingga 10 menit, dengan koherensi seluruh tubuh. API inferensi REST siap pakai, performa terbaik, tanpa cold start, harga terjangkau.
SkyReels V3 Talking Avatar: Video Kepala Berbicara AI dari Satu Foto
SkyReels V3 Talking Avatar menghasilkan video kepala berbicara yang realistis dari satu foto potret dan audio. Sinkronisasi bibir dalam 40+ bahasa. Coba di WaveSpeedAI.
SoulX FlashHead: Kepala Bicara AI Real-Time dengan 96 FPS
SoulX FlashHead menghasilkan video kepala bicara streaming real-time dengan 96 FPS tanpa pergeseran identitas. Video tanpa batas panjang. Coba di WaveSpeedAI.
Memperkenalkan WaveSpeedAI Longcat Avatar di WaveSpeedAI
LongCat Avatar menghasilkan video panjang yang ultra-realistis dengan sinkronisasi bibir, dinamika alami, dan identitas yang konsisten. Mengubah satu foto + audio menjadi video avatar yang berbicara atau bernyanyi yang didorong audio (Image-to-Video), hingga 1 menit, tier 720p $0,30/5 detik. REST API siap pakai, tanpa coldstarts, aff
Memperkenalkan WaveSpeedAI InfiniteTalk di WaveSpeedAI
InfiniteTalk mengubah satu foto + audio menjadi video avatar berbicara atau bernyanyi yang digerakkan audio (Image-to-Video), hingga 10 menit, tier 720p $0.30/5s. REST API siap pakai, tanpa coldstart, harga terjangkau.
Memperkenalkan WaveSpeedAI Live Avatar di WaveSpeedAI
Live Avatar menghasilkan video avatar yang berbicara dari gambar referensi dan audio, menciptakan animasi sinkronisasi bibir yang realistis dengan ekspresi alami.
Memperkenalkan Kuaishou Kling V1 AI Avatar Standard di WaveSpeedAI
Kling AI Avatar menghasilkan avatar video yang dibuat oleh AI yang menakjubkan untuk identitas digital dan pembuatan konten, dengan video sesuai permintaan ditagih sebesar $0,25 per 5 detik. REST API siap pakai, tanpa coldstart, harga terjangkau.
Memperkenalkan WaveSpeedAI InfiniteTalk Multi di WaveSpeedAI
InfiniteTalk Multi mengubah satu gambar dan dua input audio menjadi video berbicara atau bernyanyi multi-karakter hingga 720p. API inferensi REST siap pakai, performa terbaik, tanpa coldstart, harga terjangkau.