Seedream 5.0 Pro está no ar | Experimente no Gerador de Imagens →

Painel Explorar Gerador IAEm alta Aplicativo de desktop

LLM

Chaves de API Recarregar

Configurações

Object Detection and Segmentation

Detect, identify, and segment objects in images and videos with AI models on WaveSpeed

Nossa seleção

image-to-text

wavespeed-ai/moondream3-preview/point

Moondream3 Point finds objects in images and returns precise coordinate points for computer vision tasks, enabling accurate point localization. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Experimente agora!Ver docs

Todos os modelos

10 modelos

image-to-text

wavespeed-ai/moondream3-preview/point

image-to-text

wavespeed-ai/moondream3-preview/detect

Moondream3 Detect: Precise object bounding boxes in images for accurate computer vision localization. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

image-to-3d

wavespeed-ai/sam-3d-body

Advanced SAM 3D body generation model for creating detailed 3D human body models from images with optional mask-based segmentation. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

image-to-3d

wavespeed-ai/sam-3d-objects

Advanced SAM 3D objects generation model for creating detailed 3D object models from images with text prompts and optional mask-based segmentation. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

video-to-video

wavespeed-ai/sam3-video

SAM3 Video is a unified foundation model for prompt-based video segmentation. Provide text, point, box, or mask prompts and the model segments and tracks targets across frames with strong temporal consistency. Supports concept-level (“segment anything with concepts”) and multi-object masks for editing, analytics, and VFX. Ready-to-use REST inference API with fast response, no cold starts, and affordable pricing.

image-to-image

wavespeed-ai/sam3-image

SAM 3 is a unified foundation model for promptable image segmentation using text, points, or boxes to detect and segment objects. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

video-to-text

wavespeed-ai/sam3-video-rle

SAM 3 Video RLE is a unified foundation model for prompt-based segmentation in video. Track and segment objects across frames using text, points, or boxes, returning RLE encoded masks for efficient processing. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

image-to-text

wavespeed-ai/sam3-image-rle

SAM 3 RLE is a unified foundation model for promptable image segmentation using text, points, or boxes to detect and segment objects. Returns RLE (Run-Length Encoding) encoded masks for efficient storage and processing. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

image-to-image

bria/embed-product

Bria Embed Product seamlessly integrates product images into scene backgrounds with natural lighting and perspective matching. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

video-to-video

wavespeed-ai/void-video-inpainting/mask

VOID Video Inpainting removes objects from videos using mask-guided inpainting. Supports quad-mask or auto-generated SAM-3 masks, optional Pass 2 refinement for temporal consistency, adjustable denoising steps, guidance scale, and temporal window size. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

API Object Detection and Segmentation — preços e performance

Execute qualquer modelo da coleção Object Detection and Segmentation por meio de uma única API REST. Pague por geração — sem assinaturas, sem mínimos — com latência líder do setor numa infraestrutura com 99,9% de disponibilidade.

Por que executar Object Detection and Segmentation na WaveSpeedAI

Preços transparentes

Preço por chamada para cada modelo Object Detection and Segmentation. O preço aparece na página de cada modelo — sem taxas de plataforma adicionais.

Otimizado para baixa latência

A maioria dos modelos de imagem Object Detection and Segmentation termina em menos de 2 segundos. Modelos de vídeo e 3D são várias vezes mais rápidos que alternativas auto-hospedadas.

99,9% de disponibilidade

Failover multirregião e novas tentativas automáticas mantêm seu tráfego de produção online — mesmo durante quedas do provedor.

Perguntas frequentes

Quanto custa a API de Object Detection and Segmentation?+

Cada modelo tem seu próprio preço por chamada listado na página do modelo. Cobramos por geração bem-sucedida, sem taxas de assinatura nem mínimos.

Quão rápidos são os modelos Object Detection and Segmentation na WaveSpeedAI?+

Os modelos de imagem desta coleção normalmente terminam em menos de 2 segundos. Modelos de vídeo e 3D dependem da duração e resolução, mas costumam ser várias vezes mais rápidos do que execuções auto-hospedadas.

Posso experimentar a API sem cartão de crédito?+

Sim — toda conta recebe US$ 1 em créditos grátis no cadastro, suficiente para experimentar a maioria dos modelos Object Detection and Segmentation sem cartão de crédito.

Existem limites de taxa?+

Contas padrão têm limites generosos de tarefas concorrentes. Planos Enterprise oferecem RPM personalizado, maior concorrência e capacidade dedicada — entre em contato com vendas para detalhes.

Explore Mais de 1.000 Modelos de IA

Navegue por nosso catálogo completo de modelos de IA de última geração — imagem, vídeo, 3D, áudio, LLM e muito mais.

wavespeed.ai/models →

Construa com a API

Integre IA em seus próprios aplicativos. API RESTful com bibliotecas cliente — sem cold starts, pague por uso.

wavespeed.ai/docs →