#digital-human

37 articles

daVinci-MagiHuman: Das Open-Source-Modell, das jeden digitalen Menschen-Generator übertroffen hat

daVinci-MagiHuman ist ein 15B Open-Source-Modell, das lippensynchrone Talking-Head-Videos in 2 Sekunden auf einer einzigen H100 generiert. Übertrifft Ovi 1.1 (80% Gewinnrate) und LTX 2.3 (60,9%). Apache 2.0 lizenziert, mehrsprachig und blitzschnell.

2026-03-27 5 Min. Lesezeit

daVinci MagiHuman Image-to-Video jetzt auf WaveSpeedAI

daVinci MagiHuman Image-to-Video ist ein 15B Open-Source-Modell, das Referenzbilder in kinoreife Videos mit optionaler Audio-Synchronisierung animiert. Vergleichbar mit WAN 2.5. Bis zu 1080p, 5–10 Sekunden. REST API, 0,04 $/Sek., keine Cold Starts.

2026-03-27 5 Min. Lesezeit

daVinci MagiHuman Text-to-Video jetzt auf WaveSpeedAI

daVinci MagiHuman Text-to-Video erstellt kinematografische, menschenzentrierte Videos aus Textprompts mit optionaler Audiosynchronisierung. 15B Open-Source-Modell, bis zu 1080p, 5–10 Sekunden. REST API, 0,04 $/Sek., keine Cold Starts.

2026-03-27 5 Min. Lesezeit

InfiniteTalk Fast Video-to-Video Multi auf WaveSpeedAI vorgestellt

InfiniteTalk Fast Multi-Charakter-Lippensynchronisation wandelt Videos und zwei Audiospuren in realistische Sprech- oder Gesangsvideos um. 50 % günstiger als der Standard, bis zu 10 Minuten. Sofort einsatzbereite REST-Inference-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.

2026-03-18 5 Min. Lesezeit

InfiniteTalk Video-to-Video Multi auf WaveSpeedAI

InfiniteTalk Video-to-Video Multi erstellt realistische Mehrpersonen-Videos mit lippensynchronem Audio aus einem Video und zwei Audioeingaben. Unterstützt 480p/720p, bis zu 10 Minuten, mit ganzkörperlicher Kohärenz. Sofort einsatzbereite REST-Inferenz-API, beste Performance, keine Kaltstarts, günstige Preise.

2026-03-18 5 Min. Lesezeit

SkyReels V3 Talking Avatar: KI-Sprechkopf-Video aus einem Foto

SkyReels V3 Talking Avatar erstellt lebensechte Sprechkopf-Videos aus einem Porträtfoto und Audio. Lippensynchronisation in 40+ Sprachen. Jetzt auf WaveSpeedAI ausprobieren.

2026-03-03 6 Min. Lesezeit

SoulX FlashHead: KI-Gesprächskopf in Echtzeit mit 96 FPS

SoulX FlashHead erzeugt Echtzeit-Streaming-Talking-Head-Videos mit 96 FPS ohne Identitätsdrift. Videos in unbegrenzter Länge. Jetzt auf WaveSpeedAI ausprobieren.

2026-03-03 6 Min. Lesezeit

WaveSpeedAI Longcat Avatar auf WaveSpeedAI vorstellen

LongCat Avatar erzeugt super-realistische, lippensynchronisierte Langvideos mit natürlicher Dynamik und konsistenter Identität. Konvertiert ein Foto + Audio in audio-gesteuerte Sprech- oder Singing-Avatar-Videos (Image-to-Video), bis zu 1 Minute, 720p-Stufe $0,30/5s. Ready-to-use REST API, keine Coldstarts, aff

2025-12-26 6 Min. Lesezeit

InfiniteTalk auf WaveSpeedAI vorstellen

InfiniteTalk konvertiert ein Foto + Audio in audio-gesteuerte sprechende oder singende Avatar-Videos (Image-to-Video), bis zu 10 Minuten, 720p-Stufe $0,30/5s. Sofort einsatzbare REST-API, keine Kaltstarts, erschwingliche Preise.

2025-12-21 5 Min. Lesezeit

WaveSpeedAI Live Avatar auf WaveSpeedAI vorstellen

Live Avatar generiert sprechende Avatar-Videos aus einem Referenzbild und Audio und erstellt realistische Lippensynchronisations-Animationen mit natürlichen Ausdrücken.

2025-12-16 5 Min. Lesezeit

Einführung von Kuaishou Kling V1 AI Avatar Standard auf WaveSpeedAI

Kling AI Avatar produziert beeindruckende KI-generierte Video-Avatare für digitale Identität und Content-Erstellung, mit On-Demand-Videos abgerechnet zu $0,25 pro 5 Sekunden. Sofort einsatzbereite REST-API, keine Kaltstart-Verzögerungen, erschwingliche Preisgestaltung.

2025-11-26 5 Min. Lesezeit

Einführung von WaveSpeedAI InfiniteTalk Multi auf WaveSpeedAI

InfiniteTalk Multi konvertiert ein einzelnes Bild und zwei Audioeingaben in Videos mit mehreren sprechenden oder singenden Charakteren in bis zu 720p. REST-Inference-API ready-to-use, beste Leistung, keine Kaltstart-Zeiten, erschwingliche Preise.

2025-11-22 5 Min. Lesezeit