
Detect objects, faces, poses, text, depth, and more with powerful AI detection and analysis models on WaveSpeed

Scalable Text Content Moderator for filtering and classifying user-generated text, ideal for safety and compliance workflows. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Image Content Moderator provides automated image moderation to detect and flag policy-violating or inappropriate images for automation. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Moondream3 Point finds objects in images and returns precise coordinate points for computer vision tasks, enabling accurate point localization. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Molmo2-4B Image Captioner: Generate detailed, accurate captions for images with customizable detail levels (low, medium, high). Open-source vision-language model with object grounding capabilities. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Video Captioner: Generate detailed, accurate captions for videos with customizable detail levels (low, medium, high). Open-source vision-language model with temporal understanding capabilities. Ready-to-use REST API, no cold starts, duration-based pricing.

Molmo2-4B Video QA: Answer questions about video content with temporal understanding. Open-source vision-language model. Ready-to-use REST API, no cold starts, duration-based pricing.

Molmo2-4B Video Understanding: Analyze videos with specialized tasks (general, summary, analysis, counting, scene description). Open-source vision-language model with temporal understanding. Ready-to-use REST API, no cold starts, duration-based pricing.

Molmo2-4B Image QA: Answer questions about images with support for multi-image comparison (1-2 images). Open-source vision-language model. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Text Content Moderator: Analyze text content for safety, appropriateness, and policy compliance. Detects hate speech, violence, sexual content, and other harmful categories. Open-source vision-language model. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Image Content Moderator: Analyze image content for safety, appropriateness, and policy compliance. Detects violence, nudity, gore, and other harmful visual content. Open-source vision-language model. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Video Content Moderator analyzes video content for safety, appropriateness, and policy compliance. Detects violence, nudity, gore, and other harmful visual content in videos using an open-source vision-language model. Ready-to-use REST inference API, best performance, no cold starts, affordable pricing.
เรียกใช้โมเดลใดก็ได้ในคอลเลกชัน Content Detection Models ผ่าน REST API เดียว จ่ายต่อการสร้าง — ไม่มีการสมัครสมาชิก ไม่มีขั้นต่ำ — ด้วยเวลาแฝงระดับชั้นนำของวงการบนโครงสร้างพื้นฐานที่มีอัพไทม์ 99.9%
ราคาต่อการเรียกสำหรับโมเดล Content Detection Models ทุกตัว ราคาแสดงอยู่ในหน้าของแต่ละโมเดล — ไม่มีค่าธรรมเนียมแพลตฟอร์มเพิ่มเติม
โมเดลภาพ Content Detection Models ส่วนใหญ่ทำงานเสร็จในเวลาน้อยกว่า 2 วินาที โมเดลวิดีโอและ 3D เร็วกว่าทางเลือกที่โฮสต์เองหลายเท่า
การสำรองระบบหลายภูมิภาคและการลองใหม่อัตโนมัติช่วยให้ทราฟฟิกใช้งานจริงของคุณยังออนไลน์ — แม้ในช่วงที่ผู้ให้บริการล่ม
แต่ละโมเดลมีราคาต่อการเรียกของตัวเองแสดงอยู่ในหน้าของโมเดล เราเรียกเก็บเงินตามการสร้างที่สำเร็จ ไม่มีค่าสมาชิกหรือขั้นต่ำ
โมเดลภาพในคอลเลกชันนี้มักจะเสร็จภายในเวลาน้อยกว่า 2 วินาที โมเดลวิดีโอและ 3D ขึ้นอยู่กับระยะเวลาและความละเอียด แต่โดยปกติเร็วกว่าการรันที่โฮสต์เองหลายเท่า
ได้ — ทุกบัญชีได้รับเครดิตฟรี $1 เมื่อสมัคร เพียงพอที่จะลองโมเดล Content Detection Models ส่วนใหญ่โดยไม่ต้องใช้บัตรเครดิต
บัญชีมาตรฐานมีขีดจำกัดงานพร้อมกันที่ใจกว้าง แผน Enterprise ให้ RPM ที่กำหนดเอง การทำงานพร้อมกันที่สูงขึ้น และความสามารถเฉพาะ — ติดต่อฝ่ายขายเพื่อรายละเอียด