
Detect objects, faces, poses, text, depth, and more with powerful AI detection and analysis models on WaveSpeed

Scalable Text Content Moderator for filtering and classifying user-generated text, ideal for safety and compliance workflows. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Scalable Text Content Moderator for filtering and classifying user-generated text, ideal for safety and compliance workflows. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Image Content Moderator provides automated image moderation to detect and flag policy-violating or inappropriate images for automation. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Moondream3 Point finds objects in images and returns precise coordinate points for computer vision tasks, enabling accurate point localization. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Molmo2-4B Image Captioner: Generate detailed, accurate captions for images with customizable detail levels (low, medium, high). Open-source vision-language model with object grounding capabilities. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Video Captioner: Generate detailed, accurate captions for videos with customizable detail levels (low, medium, high). Open-source vision-language model with temporal understanding capabilities. Ready-to-use REST API, no cold starts, duration-based pricing.

Molmo2-4B Video QA: Answer questions about video content with temporal understanding. Open-source vision-language model. Ready-to-use REST API, no cold starts, duration-based pricing.

Molmo2-4B Video Understanding: Analyze videos with specialized tasks (general, summary, analysis, counting, scene description). Open-source vision-language model with temporal understanding. Ready-to-use REST API, no cold starts, duration-based pricing.

Molmo2-4B Image QA: Answer questions about images with support for multi-image comparison (1-2 images). Open-source vision-language model. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Text Content Moderator: Analyze text content for safety, appropriateness, and policy compliance. Detects hate speech, violence, sexual content, and other harmful categories. Open-source vision-language model. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Image Content Moderator: Analyze image content for safety, appropriateness, and policy compliance. Detects violence, nudity, gore, and other harmful visual content. Open-source vision-language model. Ready-to-use REST API, no cold starts, affordable pricing.

Molmo2-4B Video Content Moderator analyzes video content for safety, appropriateness, and policy compliance. Detects violence, nudity, gore, and other harmful visual content in videos using an open-source vision-language model. Ready-to-use REST inference API, best performance, no cold starts, affordable pricing.
Execute qualquer modelo da coleção Content Detection Models por meio de uma única API REST. Pague por geração — sem assinaturas, sem mínimos — com latência líder do setor numa infraestrutura com 99,9% de disponibilidade.
Preço por chamada para cada modelo Content Detection Models. O preço aparece na página de cada modelo — sem taxas de plataforma adicionais.
A maioria dos modelos de imagem Content Detection Models termina em menos de 2 segundos. Modelos de vídeo e 3D são várias vezes mais rápidos que alternativas auto-hospedadas.
Failover multirregião e novas tentativas automáticas mantêm seu tráfego de produção online — mesmo durante quedas do provedor.
Cada modelo tem seu próprio preço por chamada listado na página do modelo. Cobramos por geração bem-sucedida, sem taxas de assinatura nem mínimos.
Os modelos de imagem desta coleção normalmente terminam em menos de 2 segundos. Modelos de vídeo e 3D dependem da duração e resolução, mas costumam ser várias vezes mais rápidos do que execuções auto-hospedadas.
Sim — toda conta recebe US$ 1 em créditos grátis no cadastro, suficiente para experimentar a maioria dos modelos Content Detection Models sem cartão de crédito.
Contas padrão têm limites generosos de tarefas concorrentes. Planos Enterprise oferecem RPM personalizado, maior concorrência e capacidade dedicada — entre em contato com vendas para detalhes.
Navegue por nosso catálogo completo de modelos de IA de última geração — imagem, vídeo, 3D, áudio, LLM e muito mais.
wavespeed.ai/models →Integre IA em seus próprios aplicativos. API RESTful com bibliotecas cliente — sem cold starts, pague por uso.
wavespeed.ai/docs →