
Detect objects, faces, poses, text, depth, and more with powerful AI detection and analysis models on WaveSpeed

Scalable Text Content Moderator for filtering and classifying user-generated text, ideal for safety and compliance workflows. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Scalable Text Content Moderator for filtering and classifying user-generated text, ideal for safety and compliance workflows. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Image Content Moderator provides automated image moderation to detect and flag policy-violating or inappropriate images for automation. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Moondream3 Point finds objects in images and returns precise coordinate points for computer vision tasks, enabling accurate point localization. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Molmo2-4B Image Captioner: Generate detailed, accurate captions for images with customizable detail levels (low, medium, high). Open-source vision-language model with object grounding capabilities. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Video Captioner: Generate detailed, accurate captions for videos with customizable detail levels (low, medium, high). Open-source vision-language model with temporal understanding capabilities. Ready-to-use REST API, no cold starts, duration-based pricing.

Molmo2-4B Video QA: Answer questions about video content with temporal understanding. Open-source vision-language model. Ready-to-use REST API, no cold starts, duration-based pricing.

Molmo2-4B Video Understanding: Analyze videos with specialized tasks (general, summary, analysis, counting, scene description). Open-source vision-language model with temporal understanding. Ready-to-use REST API, no cold starts, duration-based pricing.

Molmo2-4B Image QA: Answer questions about images with support for multi-image comparison (1-2 images). Open-source vision-language model. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Text Content Moderator: Analyze text content for safety, appropriateness, and policy compliance. Detects hate speech, violence, sexual content, and other harmful categories. Open-source vision-language model. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Image Content Moderator: Analyze image content for safety, appropriateness, and policy compliance. Detects violence, nudity, gore, and other harmful visual content. Open-source vision-language model. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Video Content Moderator analyzes video content for safety, appropriateness, and policy compliance. Detects violence, nudity, gore, and other harmful visual content in videos using an open-source vision-language model. Ready-to-use REST inference API, best performance, no cold starts, affordable pricing.
Nutzen Sie jedes Modell der Content Detection Models-Sammlung über eine einzige REST-API. Bezahlen Sie pro Generierung — keine Abos, keine Mindestbeträge — mit branchenführender Latenz auf einer Infrastruktur mit 99,9 % Verfügbarkeit.
Abrechnung pro Aufruf für jedes Content Detection Models-Modell. Der Preis ist auf jeder Modellseite ausgewiesen — keine Plattformgebühren obendrauf.
Die meisten Content Detection Models-Bildmodelle laufen in unter 2 Sekunden. Video- und 3D-Modelle sind mehrfach schneller als selbst gehostete Alternativen.
Multi-Region-Failover und automatische Wiederholungen halten Ihren Produktionsverkehr online — auch bei Anbieter-Ausfällen.
Jedes Modell hat seinen eigenen Preis pro Aufruf, der auf der Modellseite angegeben ist. Wir rechnen pro erfolgreicher Generierung ab — ohne Abogebühren oder Mindestbeträge.
Bildmodelle in dieser Sammlung sind typischerweise in unter 2 Sekunden fertig. Video- und 3D-Modelle hängen von Dauer und Auflösung ab, sind aber meist mehrfach schneller als selbst gehostete Läufe.
Ja — jedes Konto erhält bei der Anmeldung 1 $ Startguthaben, genug, um die meisten Content Detection Models-Modelle ohne Kreditkarte auszuprobieren.
Standardkonten haben großzügige Limits für gleichzeitige Jobs. Enterprise-Pläne bieten individuelle RPM, höhere Parallelität und reservierte Kapazität — bei Interesse den Vertrieb kontaktieren.