
Detect objects, faces, poses, text, depth, and more with powerful AI detection and analysis models on WaveSpeed

Scalable Text Content Moderator for filtering and classifying user-generated text, ideal for safety and compliance workflows. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Scalable Text Content Moderator for filtering and classifying user-generated text, ideal for safety and compliance workflows. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Image Content Moderator provides automated image moderation to detect and flag policy-violating or inappropriate images for automation. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Moondream3 Point finds objects in images and returns precise coordinate points for computer vision tasks, enabling accurate point localization. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Molmo2-4B Image Captioner: Generate detailed, accurate captions for images with customizable detail levels (low, medium, high). Open-source vision-language model with object grounding capabilities. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Video Captioner: Generate detailed, accurate captions for videos with customizable detail levels (low, medium, high). Open-source vision-language model with temporal understanding capabilities. Ready-to-use REST API, no cold starts, duration-based pricing.

Molmo2-4B Video QA: Answer questions about video content with temporal understanding. Open-source vision-language model. Ready-to-use REST API, no cold starts, duration-based pricing.

Molmo2-4B Video Understanding: Analyze videos with specialized tasks (general, summary, analysis, counting, scene description). Open-source vision-language model with temporal understanding. Ready-to-use REST API, no cold starts, duration-based pricing.

Molmo2-4B Image QA: Answer questions about images with support for multi-image comparison (1-2 images). Open-source vision-language model. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Text Content Moderator: Analyze text content for safety, appropriateness, and policy compliance. Detects hate speech, violence, sexual content, and other harmful categories. Open-source vision-language model. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Image Content Moderator: Analyze image content for safety, appropriateness, and policy compliance. Detects violence, nudity, gore, and other harmful visual content. Open-source vision-language model. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Video Content Moderator analyzes video content for safety, appropriateness, and policy compliance. Detects violence, nudity, gore, and other harmful visual content in videos using an open-source vision-language model. Ready-to-use REST inference API, best performance, no cold starts, affordable pricing.
Запускайте любую модель из коллекции Content Detection Models через один REST API. Оплата за генерацию — без подписок, без минимумов — с лидирующей в отрасли задержкой на инфраструктуре с аптаймом 99,9%.
Цена за вызов для каждой модели Content Detection Models. Цена указана на странице каждой модели — без комиссий платформы сверху.
Большинство моделей изображений Content Detection Models выполняются менее чем за 2 секунды. Видео- и 3D-модели в несколько раз быстрее самостоятельно размещаемых аналогов.
Мультирегиональная отказоустойчивость и автоматические повторы поддерживают ваш продакшен-трафик онлайн — даже при сбоях провайдера.
У каждой модели своя цена за вызов, указанная на странице модели. Мы выставляем счёт за каждую успешную генерацию, без подписок и минимумов.
Модели изображений в этой коллекции обычно выполняются менее чем за 2 секунды. Видео- и 3D-модели зависят от длительности и разрешения, но обычно в несколько раз быстрее самостоятельно размещаемых запусков.
Да — каждый аккаунт получает 1 $ бесплатных кредитов при регистрации — достаточно, чтобы попробовать большинство моделей Content Detection Models без банковской карты.
Стандартные аккаунты имеют щедрые лимиты на параллельные задачи. Enterprise-планы предлагают индивидуальный RPM, более высокую конкурентность и выделенную мощность — свяжитесь с отделом продаж для подробностей.
Просмотрите наш полный каталог современных AI-моделей — изображения, видео, 3D, аудио, LLM и многое другое.
wavespeed.ai/models →Интегрируйте AI в свои приложения. RESTful API с клиентскими библиотеками — без холодных стартов, оплата по факту использования.
wavespeed.ai/docs →