WaveSpeedAI Molmo2 Video Captioner jetzt auf WaveSpeedAI verfügbar
Molmo2-4B Video Captioner: Generieren Sie detaillierte, präzise Videobeschriftungen mit anpassbaren Detailstufen (niedrig, mittel, hoch). Open-Source Vision-Language-Modell
WaveSpeedAI Molmo2 Video Content Moderator wird auf WaveSpeedAI eingeführt
Molmo2-4B Video Content Moderator analysiert Videoinhalte auf Sicherheit, Angemessenheit und Richtlinieneinhaltung. Erkennt Gewalt, Nacktheit, Blut und andere schädliche Inhalte
WaveSpeedAI Molmo2 Video QA auf WaveSpeedAI
Molmo2-4B Video QA: Beantworten Sie Fragen zu Videoinhalten mit zeitlichem Verständnis. Open-Source Vision-Language-Modell. Einsatzbereite REST-API, keine Kaltstarts.
WaveSpeedAI Molmo2 Video Understanding auf WaveSpeedAI
Molmo2-4B Video Understanding: Analysieren Sie Videos mit spezialisierten Aufgaben (allgemein, Zusammenfassung, Analyse, Zählung, Szenenbeschreibung). Open-Source Vision-Language-Modell
Einführung von WaveSpeedAI OpenAI Whisper mit Video auf WaveSpeedAI
OpenAI Whisper Large v3 (Video-zu-Text) bietet hochgenaue mehrsprachige Transkription direkt aus Videodateien mit automatischer Spracherkennung und optionalen
Einführung von WaveSpeedAI Paddle Ocr auf WaveSpeedAI
PaddleOCR-VL ist ein ultra-kompaktes Vision-Language-Modell mit 0,9B Parametern für die Dokumentenanalyse, das 109 Sprachen mit Text-, Tabellen-, Formel- und Diagrammerkennung unterstützt
WaveSpeedAI Qwen Image 2512 LoRA Trainer auf WaveSpeedAI eingeführt
Qwen-Image-2512 LoRA Trainer ermöglicht es dir, benutzerdefinierte LoRA-Modelle 10x schneller mit Stil-, Charakter- und Objekttraining zu trainieren. Von der Idee zum Modell in Minuten, nicht Stunden
WaveSpeedAI Qwen Image Text-to-Image 2512 LoRA jetzt auf WaveSpeedAI verfügbar
Qwen-Image-2512 LoRA ist ein verbessertes 20B MMDiT Text-zu-Bild-Modell mit LoRA-Unterstützung für schnelle Anpassung und verfeinerte Bildgenerierung. Ready-to-use REST infer
WaveSpeedAI Video-Hintergrund-Entferner jetzt auf WaveSpeedAI
Der WaveSpeed Video-Hintergrund-Entferner ersetzt oder entfernt Videohintergründe mit einem benutzerdefinierten Bild. Laden Sie ein Video hoch oder fügen Sie einen Link ein, und stellen Sie dann ein benutzerdefiniertes Hintergrundbild bereit
Z-Image-Turbo ControlNet auf WaveSpeedAI
Z-Image-Turbo ControlNet generiert Bilder mit struktureller Kontrolle (Tiefe, Canny Edge, Pose) für präzise Kompositionskontrolle. REST-Inferenz sofort einsatzbereit
xAI Grok 2 Image jetzt auf WaveSpeedAI verfügbar
Grok 2 Image ist xAIs neuestes Bildgenerierungsmodell, das einfache Textaufforderungen in Sekunden in scharfe, fotorealistische Bilder umwandelt. Von Produktfotos bis zu sozialen
Z AI CogView 4 jetzt auf WaveSpeedAI verfügbar
Z-AI CogView-4 generiert hochwertige Bilder aus Textbeschreibungen mit schnellem und präzisem Verständnis von Benutzervorgaben und ermöglicht es der KI, Bilder präziser auszudrücken