#digital-human
39 articles
daVinci-MagiHuman: Das Open-Source-Modell, das jeden digitalen Menschen-Generator übertroffen hat
daVinci-MagiHuman ist ein 15B Open-Source-Modell, das lippensynchrone Talking-Head-Videos in 2 Sekunden auf einer einzigen H100 generiert. Übertrifft Ovi 1.1 (80% Gewinnrate) und LTX 2.3 (60,9%). Apache 2.0 lizenziert, mehrsprachig und blitzschnell.
daVinci MagiHuman Image-to-Video jetzt auf WaveSpeedAI
daVinci MagiHuman Image-to-Video ist ein 15B Open-Source-Modell, das Referenzbilder in kinoreife Videos mit optionaler Audio-Synchronisierung animiert. Vergleichbar mit WAN 2.5. Bis zu 1080p, 5–10 Sekunden. REST API, 0,04 $/Sek., keine Cold Starts.
daVinci MagiHuman Text-to-Video jetzt auf WaveSpeedAI
daVinci MagiHuman Text-to-Video erstellt kinematografische, menschenzentrierte Videos aus Textprompts mit optionaler Audiosynchronisierung. 15B Open-Source-Modell, bis zu 1080p, 5–10 Sekunden. REST API, 0,04 $/Sek., keine Cold Starts.
InfiniteTalk Fast Video-to-Video Multi auf WaveSpeedAI vorgestellt
InfiniteTalk Fast Multi-Charakter-Lippensynchronisation wandelt Videos und zwei Audiospuren in realistische Sprech- oder Gesangsvideos um. 50 % günstiger als der Standard, bis zu 10 Minuten. Sofort einsatzbereite REST-Inference-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.
InfiniteTalk Video-to-Video Multi auf WaveSpeedAI
InfiniteTalk Video-to-Video Multi erstellt realistische Mehrpersonen-Videos mit lippensynchronem Audio aus einem Video und zwei Audioeingaben. Unterstützt 480p/720p, bis zu 10 Minuten, mit ganzkörperlicher Kohärenz. Sofort einsatzbereite REST-Inferenz-API, beste Performance, keine Kaltstarts, günstige Preise.
SkyReels V3 Talking Avatar: KI-Sprechkopf-Video aus einem Foto
SkyReels V3 Talking Avatar erstellt lebensechte Sprechkopf-Videos aus einem Porträtfoto und Audio. Lippensynchronisation in 40+ Sprachen. Jetzt auf WaveSpeedAI ausprobieren.
SoulX FlashHead: KI-Gesprächskopf in Echtzeit mit 96 FPS
SoulX FlashHead erzeugt Echtzeit-Streaming-Talking-Head-Videos mit 96 FPS ohne Identitätsdrift. Videos in unbegrenzter Länge. Jetzt auf WaveSpeedAI ausprobieren.
WaveSpeedAI Longcat Avatar auf WaveSpeedAI vorstellen
LongCat Avatar erzeugt super-realistische, lippensynchronisierte Langvideos mit natürlicher Dynamik und konsistenter Identität. Konvertiert ein Foto + Audio in audio-gesteuerte Sprech- oder Singing-Avatar-Videos (Image-to-Video), bis zu 1 Minute, 720p-Stufe $0,30/5s. Ready-to-use REST API, keine Coldstarts, aff
InfiniteTalk auf WaveSpeedAI vorstellen
InfiniteTalk konvertiert ein Foto + Audio in audio-gesteuerte sprechende oder singende Avatar-Videos (Image-to-Video), bis zu 10 Minuten, 720p-Stufe $0,30/5s. Sofort einsatzbare REST-API, keine Kaltstarts, erschwingliche Preise.
WaveSpeedAI Live Avatar auf WaveSpeedAI vorstellen
Live Avatar generiert sprechende Avatar-Videos aus einem Referenzbild und Audio und erstellt realistische Lippensynchronisations-Animationen mit natürlichen Ausdrücken.
Einführung von Kuaishou Kling V1 AI Avatar Standard auf WaveSpeedAI
Kling AI Avatar produziert beeindruckende KI-generierte Video-Avatare für digitale Identität und Content-Erstellung, mit On-Demand-Videos abgerechnet zu $0,25 pro 5 Sekunden. Sofort einsatzbereite REST-API, keine Kaltstart-Verzögerungen, erschwingliche Preisgestaltung.
Einführung von WaveSpeedAI InfiniteTalk Multi auf WaveSpeedAI
InfiniteTalk Multi konvertiert ein einzelnes Bild und zwei Audioeingaben in Videos mit mehreren sprechenden oder singenden Charakteren in bis zu 720p. REST-Inference-API ready-to-use, beste Leistung, keine Kaltstart-Zeiten, erschwingliche Preise.