WaveSpeedAI Molmo2 Image Content Moderator auf WaveSpeedAI einführen
Molmo2-4B Image Content Moderator: Analysieren Sie Bildinhalte auf Sicherheit, Angemessenheit und Richtlinienkonformität. Erkennt Gewalt, Nacktheit, Blut und andere schädliche Inhalte
WaveSpeedAI Molmo2 Image QA auf WaveSpeedAI
Molmo2-4B Image QA: Beantworten Sie Fragen zu Bildern mit Unterstützung für Multi-Bild-Vergleich (1-2 Bilder). Open-Source Vision-Language-Modell. REST API sofort einsatzbereit
WaveSpeedAI Molmo2 Prompt Optimizer jetzt auf WaveSpeedAI verfügbar
Molmo2-4B Prompt Optimizer: Verbessern Sie Prompts für Bild- und Videogenerierung durch intelligente Umstrukturierung, Stilanleitung und kontextbewusste Verbesserungen. Open-
WaveSpeedAI Molmo2 Video Captioner jetzt auf WaveSpeedAI verfügbar
Molmo2-4B Video Captioner: Generieren Sie detaillierte, präzise Videobeschriftungen mit anpassbaren Detailstufen (niedrig, mittel, hoch). Open-Source Vision-Language-Modell
Einführung von WaveSpeedAI Molmo2 Text Content Moderator auf WaveSpeedAI
Molmo2-4B Text Content Moderator: Analysieren Sie Textinhalte auf Sicherheit, Angemessenheit und Richtlinieneinhaltung. Erkennt Hassreden, Gewalt, sexuelle Inhalte und weitere
WaveSpeedAI Molmo2 Video Content Moderator wird auf WaveSpeedAI eingeführt
Molmo2-4B Video Content Moderator analysiert Videoinhalte auf Sicherheit, Angemessenheit und Richtlinieneinhaltung. Erkennt Gewalt, Nacktheit, Blut und andere schädliche Inhalte
WaveSpeedAI Molmo2 Video QA auf WaveSpeedAI
Molmo2-4B Video QA: Beantworten Sie Fragen zu Videoinhalten mit zeitlichem Verständnis. Open-Source Vision-Language-Modell. Einsatzbereite REST-API, keine Kaltstarts.
WaveSpeedAI Molmo2 Video Understanding auf WaveSpeedAI
Molmo2-4B Video Understanding: Analysieren Sie Videos mit spezialisierten Aufgaben (allgemein, Zusammenfassung, Analyse, Zählung, Szenenbeschreibung). Open-Source Vision-Language-Modell
Einführung von WaveSpeedAI OpenAI Whisper mit Video auf WaveSpeedAI
OpenAI Whisper Large v3 (Video-zu-Text) bietet hochgenaue mehrsprachige Transkription direkt aus Videodateien mit automatischer Spracherkennung und optionalen
Einführung von WaveSpeedAI Paddle Ocr auf WaveSpeedAI
PaddleOCR-VL ist ein ultra-kompaktes Vision-Language-Modell mit 0,9B Parametern für die Dokumentenanalyse, das 109 Sprachen mit Text-, Tabellen-, Formel- und Diagrammerkennung unterstützt
WaveSpeedAI Qwen Image 2512 LoRA Trainer auf WaveSpeedAI eingeführt
Qwen-Image-2512 LoRA Trainer ermöglicht es dir, benutzerdefinierte LoRA-Modelle 10x schneller mit Stil-, Charakter- und Objekttraining zu trainieren. Von der Idee zum Modell in Minuten, nicht Stunden
WaveSpeedAI Qwen Image Text-to-Image 2512 LoRA jetzt auf WaveSpeedAI verfügbar
Qwen-Image-2512 LoRA ist ein verbessertes 20B MMDiT Text-zu-Bild-Modell mit LoRA-Unterstützung für schnelle Anpassung und verfeinerte Bildgenerierung. Ready-to-use REST infer