#talking-head
6 articles
daVinci-MagiHuman: Das Open-Source-Modell, das jeden digitalen Menschen-Generator übertroffen hat
daVinci-MagiHuman ist ein 15B Open-Source-Modell, das lippensynchrone Talking-Head-Videos in 2 Sekunden auf einer einzigen H100 generiert. Übertrifft Ovi 1.1 (80% Gewinnrate) und LTX 2.3 (60,9%). Apache 2.0 lizenziert, mehrsprachig und blitzschnell.
daVinci MagiHuman Image-to-Video jetzt auf WaveSpeedAI
daVinci MagiHuman Image-to-Video ist ein 15B Open-Source-Modell, das Referenzbilder in kinoreife Videos mit optionaler Audio-Synchronisierung animiert. Vergleichbar mit WAN 2.5. Bis zu 1080p, 5–10 Sekunden. REST API, 0,04 $/Sek., keine Cold Starts.
daVinci MagiHuman Text-to-Video jetzt auf WaveSpeedAI
daVinci MagiHuman Text-to-Video erstellt kinematografische, menschenzentrierte Videos aus Textprompts mit optionaler Audiosynchronisierung. 15B Open-Source-Modell, bis zu 1080p, 5–10 Sekunden. REST API, 0,04 $/Sek., keine Cold Starts.
InfiniteTalk Fast Video-to-Video Multi auf WaveSpeedAI vorgestellt
InfiniteTalk Fast Multi-Charakter-Lippensynchronisation wandelt Videos und zwei Audiospuren in realistische Sprech- oder Gesangsvideos um. 50 % günstiger als der Standard, bis zu 10 Minuten. Sofort einsatzbereite REST-Inference-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.
InfiniteTalk Video-to-Video Multi auf WaveSpeedAI
InfiniteTalk Video-to-Video Multi erstellt realistische Mehrpersonen-Videos mit lippensynchronem Audio aus einem Video und zwei Audioeingaben. Unterstützt 480p/720p, bis zu 10 Minuten, mit ganzkörperlicher Kohärenz. Sofort einsatzbereite REST-Inferenz-API, beste Performance, keine Kaltstarts, günstige Preise.
SoulX FlashHead: KI-Gesprächskopf in Echtzeit mit 96 FPS
SoulX FlashHead erzeugt Echtzeit-Streaming-Talking-Head-Videos mit 96 FPS ohne Identitätsdrift. Videos in unbegrenzter Länge. Jetzt auf WaveSpeedAI ausprobieren.