#model-release
346 articles - Page 6
Vidu Text-to-Video Q2 auf WaveSpeedAI vorgestellt
Vidu Q2 Text-to-Video wandelt Textaufforderungen in hochwertige Videos mit außergewöhnlicher visueller Wiedergabetreue und vielfältigen Bewegungen um. Sofort einsatzbereite REST-Inferenz-API, beste Leistung, keine Kaltstartstarts, erschwingliche Preise.
Kuaishou Kling Video O1 Std Reference To Video jetzt auf WaveSpeedAI verfügbar
Kling Omni Video O1 (Standard) Reference-to-Video generiert kreative Videos mit Charakter-, Requisiten- oder Szenenreferenzen aus mehreren Perspektiven. Extrahiert Motivmerkmale und erstellt neue Videoinhalte mit konsistenter Identität über Frames hinweg. Einsatzbereite REST-API, beste Leistung, keine c
Einführung von Kuaishou Kling Image O1 auf WaveSpeedAI
Kling Omni Image O1 ist Kuaishous Multi-Modal-Bildgenerationsmodell mit MVL-Technologie. Unterstützt bis zu 10 Referenzbilder für Funktionskonsistenz, präzise Detailbearbeitung (hinzufügen/entfernen/ändern), Stilkontrolle und Serienerstellung. Perfekt für IP-Charakterdesign, Comic-Panels und Marken-Merchandise
Google Nano Banana Pro Edit Multi auf WaveSpeedAI
Google's Nano Banana Pro (Gemini 3.0 Pro Image) Edit ist ein hochmodernes Bildbearbeitungsmodell, das mehrere hochwertige bearbeitete Bilder in einem einzigen Durchgang generieren kann. Extrem kostengünstig — nur 0,07 $ pro Bild. Ready-to-use REST-Inferenz-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.
MiniMax Hailuo 2.3 T2V Pro auf WaveSpeedAI
MiniMax Hailuo 2.3 Pro ist ein Text-zu-Video-Modell, das 1080p-Videos mit 2,5x Effizienz und 85% Genauigkeit bei komplexen Anweisungen liefert. Einsatzbereite REST-Inferenz-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.
MiniMax Hailuo 2.3 T2V Standard auf WaveSpeedAI eingeführt
Hailuo 2.3 ist ein Text-zu-Video-Modell, das physikbewusste 768p-Videos mit 2,5× Effizienz und 85% Antwortquote für komplexe Anweisungen erstellt. Sofort einsatzbereite REST-Inferenz-API, beste Leistung, keine Coldstarts, erschwingliche Preise.
Einführung von Google Gemini 3 Pro Image Edit auf WaveSpeedAI
Google's Gemini 3.0 Pro (Gemini 3.0 Pro Image) Edit ermöglicht Bildbearbeitung und Text-zu-Bild-Generierung mit 4K-fähiger Ausgabe für mobile Geräte. Sofort einsatzbare REST-Inference-API, beste Leistung, keine Kaltstart-Zeiten, erschwingliche Preise.
Einführung in WaveSpeedAI FLUX 2 Dev Text-to-Image auf WaveSpeedAI
FLUX.2 [dev] von Black Forest Labs bietet schnelle, studioqualitative Text-zu-Bild-Generierung mit verbessertem Realismus, schärferer Textwiedergabe und nativem Editing für schnelle Iterationen. Ready-to-Use REST Inference API, beste Performance, keine Cold Starts, erschwingliche Preisgestaltung.
Google Gemini 3 Pro Image Text-zu-Bild auf WaveSpeedAI
Google's Gemini 3.0 Pro (Gemini 3.0 Pro Preview) ist ein hochmodernes Text-zu-Bild-Modell, das hochauflösende 4K-Bildgenerierung für Mobilgeräte ermöglicht. Ready-to-use REST-Inference-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.
WaveSpeedAI InfiniteTalk Fast Multi auf WaveSpeedAI
InfiniteTalk Fast Multi konvertiert ein einzelnes Bild und zwei Audioeingaben in Multi-Character-Videos mit Sprach- oder Gesangsausgabe. Sofort einsatzbereite REST-Inference-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.
Einführung von WaveSpeedAI Hunyuan Video Foley auf WaveSpeedAI
HunyuanVideo-Foley generiert realistische Foley- und Umgebungsgeräusche aus einem hochgeladenen Video unter Verwendung eines Text-Prompts zur Beschreibung der gewünschten Sounds. Einsatzbereite REST-Inference-API, beste Leistung, keine Coldstarts, erschwingliche Preise.
Introducing WaveSpeedAI Think Sound on WaveSpeedAI
ThinkSound wandelt hochgeladene Videos in realistische, textgesteuerte Audio um. Laden Sie ein Video hoch und fügen Sie eine Texteingabe hinzu, um lebensechte Sounds zu generieren. Ready-to-use REST Inference API, beste Leistung, keine Kaltstarts, erschwingliche Preise.