#digital-human

37 articles

daVinci-MagiHuman: Model Open-Source yang Mengalahkan Semua Generator Digital Human

daVinci-MagiHuman adalah model open-source 15B yang menghasilkan video kepala berbicara dengan sinkronisasi bibir dalam 2 detik di satu GPU H100. Mengalahkan Ovi 1.1 (tingkat kemenangan 80%) dan LTX 2.3 (60,9%). Berlisensi Apache 2.0, multibahasa, dan sangat cepat.

2026-03-275 menit baca

Memperkenalkan daVinci MagiHuman Image-to-Video di WaveSpeedAI

daVinci MagiHuman Image-to-Video adalah model open-source 15B yang menganimasikan gambar referensi menjadi video sinematik dengan sinkronisasi audio opsional. Setara dengan WAN 2.5. Hingga 1080p, 5-10 detik. REST API, $0,04/detik, tanpa cold start.

2026-03-275 menit baca

Memperkenalkan daVinci MagiHuman Text-to-Video di WaveSpeedAI

daVinci MagiHuman Text-to-Video menghasilkan video sinematik yang berpusat pada manusia dari teks prompt dengan sinkronisasi audio opsional. Model open-source 15B, hingga 1080p, 5-10 detik. REST API, $0,04/detik, tanpa cold start.

2026-03-276 menit baca

Memperkenalkan InfiniteTalk Fast Video-to-Video Multi di WaveSpeedAI

InfiniteTalk Fast multi-karakter lip sync mengubah video dan dua trek audio menjadi video berbicara atau bernyanyi yang realistis. 50% lebih murah dari standar, hingga 10 menit. API inferensi REST siap pakai, performa terbaik, tanpa coldstart, harga terjangkau.

2026-03-185 menit baca

Memperkenalkan InfiniteTalk Video-to-Video Multi di WaveSpeedAI

InfiniteTalk Video-to-Video Multi menghasilkan video multi-karakter dengan sinkronisasi bibir yang realistis dari input video dan dua audio. Mendukung resolusi 480p/720p, durasi hingga 10 menit, dengan koherensi seluruh tubuh. API inferensi REST siap pakai, performa terbaik, tanpa cold start, harga terjangkau.

2026-03-185 menit baca

SkyReels V3 Talking Avatar: Video Kepala Berbicara AI dari Satu Foto

SkyReels V3 Talking Avatar menghasilkan video kepala berbicara yang realistis dari satu foto potret dan audio. Sinkronisasi bibir dalam 40+ bahasa. Coba di WaveSpeedAI.

2026-03-037 menit baca

SoulX FlashHead: Kepala Bicara AI Real-Time dengan 96 FPS

SoulX FlashHead menghasilkan video kepala bicara streaming real-time dengan 96 FPS tanpa pergeseran identitas. Video tanpa batas panjang. Coba di WaveSpeedAI.

2026-03-037 menit baca

Memperkenalkan WaveSpeedAI Longcat Avatar di WaveSpeedAI

LongCat Avatar menghasilkan video panjang yang ultra-realistis dengan sinkronisasi bibir, dinamika alami, dan identitas yang konsisten. Mengubah satu foto + audio menjadi video avatar yang berbicara atau bernyanyi yang didorong audio (Image-to-Video), hingga 1 menit, tier 720p $0,30/5 detik. REST API siap pakai, tanpa coldstarts, aff

2025-12-266 menit baca

Memperkenalkan WaveSpeedAI InfiniteTalk di WaveSpeedAI

InfiniteTalk mengubah satu foto + audio menjadi video avatar berbicara atau bernyanyi yang digerakkan audio (Image-to-Video), hingga 10 menit, tier 720p $0.30/5s. REST API siap pakai, tanpa coldstart, harga terjangkau.

2025-12-216 menit baca

Memperkenalkan WaveSpeedAI Live Avatar di WaveSpeedAI

Live Avatar menghasilkan video avatar yang berbicara dari gambar referensi dan audio, menciptakan animasi sinkronisasi bibir yang realistis dengan ekspresi alami.

2025-12-165 menit baca

Memperkenalkan Kuaishou Kling V1 AI Avatar Standard di WaveSpeedAI

Kling AI Avatar menghasilkan avatar video yang dibuat oleh AI yang menakjubkan untuk identitas digital dan pembuatan konten, dengan video sesuai permintaan ditagih sebesar $0,25 per 5 detik. REST API siap pakai, tanpa coldstart, harga terjangkau.

2025-11-265 menit baca

Memperkenalkan WaveSpeedAI InfiniteTalk Multi di WaveSpeedAI

InfiniteTalk Multi mengubah satu gambar dan dua input audio menjadi video berbicara atau bernyanyi multi-karakter hingga 720p. API inferensi REST siap pakai, performa terbaik, tanpa coldstart, harga terjangkau.

2025-11-225 menit baca