#model-release
392 articles - Page 10
Einführung von Kuaishou Kling Image O1 auf WaveSpeedAI
Kling Omni Image O1 ist Kuaishous Multi-Modal-Bildgenerationsmodell mit MVL-Technologie. Unterstützt bis zu 10 Referenzbilder für Funktionskonsistenz, präzise Detailbearbeitung (hinzufügen/entfernen/ändern), Stilkontrolle und Serienerstellung. Perfekt für IP-Charakterdesign, Comic-Panels und Marken-Merchandise
Google Nano Banana Pro Edit Multi auf WaveSpeedAI
Google's Nano Banana Pro (Gemini 3.0 Pro Image) Edit ist ein hochmodernes Bildbearbeitungsmodell, das mehrere hochwertige bearbeitete Bilder in einem einzigen Durchgang generieren kann. Extrem kostengünstig — nur 0,07 $ pro Bild. Ready-to-use REST-Inferenz-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.
MiniMax Hailuo 2.3 T2V Pro auf WaveSpeedAI
MiniMax Hailuo 2.3 Pro ist ein Text-zu-Video-Modell, das 1080p-Videos mit 2,5x Effizienz und 85% Genauigkeit bei komplexen Anweisungen liefert. Einsatzbereite REST-Inferenz-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.
MiniMax Hailuo 2.3 T2V Standard auf WaveSpeedAI eingeführt
Hailuo 2.3 ist ein Text-zu-Video-Modell, das physikbewusste 768p-Videos mit 2,5× Effizienz und 85% Antwortquote für komplexe Anweisungen erstellt. Sofort einsatzbereite REST-Inferenz-API, beste Leistung, keine Coldstarts, erschwingliche Preise.
Einführung von Google Gemini 3 Pro Image Edit auf WaveSpeedAI
Google's Gemini 3.0 Pro (Gemini 3.0 Pro Image) Edit ermöglicht Bildbearbeitung und Text-zu-Bild-Generierung mit 4K-fähiger Ausgabe für mobile Geräte. Sofort einsatzbare REST-Inference-API, beste Leistung, keine Kaltstart-Zeiten, erschwingliche Preise.
Einführung in WaveSpeedAI FLUX 2 Dev Text-to-Image auf WaveSpeedAI
FLUX.2 [dev] von Black Forest Labs bietet schnelle, studioqualitative Text-zu-Bild-Generierung mit verbessertem Realismus, schärferer Textwiedergabe und nativem Editing für schnelle Iterationen. Ready-to-Use REST Inference API, beste Performance, keine Cold Starts, erschwingliche Preisgestaltung.
Google Gemini 3 Pro Image Text-zu-Bild auf WaveSpeedAI
Google's Gemini 3.0 Pro (Gemini 3.0 Pro Preview) ist ein hochmodernes Text-zu-Bild-Modell, das hochauflösende 4K-Bildgenerierung für Mobilgeräte ermöglicht. Ready-to-use REST-Inference-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.
WaveSpeedAI InfiniteTalk Fast Multi auf WaveSpeedAI
InfiniteTalk Fast Multi konvertiert ein einzelnes Bild und zwei Audioeingaben in Multi-Character-Videos mit Sprach- oder Gesangsausgabe. Sofort einsatzbereite REST-Inference-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.
Einführung von WaveSpeedAI Hunyuan Video Foley auf WaveSpeedAI
HunyuanVideo-Foley generiert realistische Foley- und Umgebungsgeräusche aus einem hochgeladenen Video unter Verwendung eines Text-Prompts zur Beschreibung der gewünschten Sounds. Einsatzbereite REST-Inference-API, beste Leistung, keine Coldstarts, erschwingliche Preise.
Einführung von WaveSpeedAI Think Sound auf WaveSpeedAI
ThinkSound wandelt hochgeladene Videos in realistische, textgesteuerte Audioinhalte um. Laden Sie ein Video hoch und fügen Sie einen Textprompt hinzu, um lebensechten Sound zu erzeugen. Sofort einsatzbereite REST-Inferenz-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.
Einführung von WaveSpeedAI WAN 2.2 Video Edit auf WaveSpeedAI
Wan 2.2 Video Edit ermöglicht es Ihnen, Videos über Textaufforderungen zu ändern (z. B. Kleidung oder Charaktere ändern). Unterstützt von Wan 2.2, es unterstützt 480p ($0,20/5s) und 720p ($0,40/5s), bis zu 120s. Einsatzbereite REST-Inferenz-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.
MiniMax Speech 02 HD jetzt auf WaveSpeedAI verfügbar
MiniMax Speech 02 HD ist das hochauflösende Text-to-Speech-Modell von MiniMax mit kristallklaren HD-Stimmen; Preisgestaltung $0,05 pro 1.000 Zeichen. Sofort einsatzfähige REST-Inference-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.