Seedance 2.0 −15 % | Créez dans le Video Generator →

Tableau de bord Explorer Générateur IAHOT Application de bureau

LLM

Clés API Facturation

Paramètres

Object Detection and Segmentation

Detect, identify, and segment objects in images and videos with AI models on WaveSpeed

Notre sélection

image-to-text

wavespeed-ai/moondream3-preview/point

Moondream3 Point finds objects in images and returns precise coordinate points for computer vision tasks, enabling accurate point localization. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Essayez-le maintenant !Voir la documentation

Tous les modèles

10 modèles

image-to-text

wavespeed-ai/moondream3-preview/point

image-to-text

wavespeed-ai/moondream3-preview/detect

Moondream3 Detect: Precise object bounding boxes in images for accurate computer vision localization. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

image-to-3d

wavespeed-ai/sam-3d-body

Advanced SAM 3D body generation model for creating detailed 3D human body models from images with optional mask-based segmentation. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

image-to-3d

wavespeed-ai/sam-3d-objects

Advanced SAM 3D objects generation model for creating detailed 3D object models from images with text prompts and optional mask-based segmentation. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

video-to-video

wavespeed-ai/sam3-video

SAM3 Video is a unified foundation model for prompt-based video segmentation. Provide text, point, box, or mask prompts and the model segments and tracks targets across frames with strong temporal consistency. Supports concept-level (“segment anything with concepts”) and multi-object masks for editing, analytics, and VFX. Ready-to-use REST inference API with fast response, no cold starts, and affordable pricing.

image-to-image

wavespeed-ai/sam3-image

SAM 3 is a unified foundation model for promptable image segmentation using text, points, or boxes to detect and segment objects. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

video-to-text

wavespeed-ai/sam3-video-rle

SAM 3 Video RLE is a unified foundation model for prompt-based segmentation in video. Track and segment objects across frames using text, points, or boxes, returning RLE encoded masks for efficient processing. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

image-to-text

wavespeed-ai/sam3-image-rle

SAM 3 RLE is a unified foundation model for promptable image segmentation using text, points, or boxes to detect and segment objects. Returns RLE (Run-Length Encoding) encoded masks for efficient storage and processing. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

image-to-image

bria/embed-product

Bria Embed Product seamlessly integrates product images into scene backgrounds with natural lighting and perspective matching. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

video-to-video

wavespeed-ai/void-video-inpainting/mask

VOID Video Inpainting removes objects from videos using mask-guided inpainting. Supports quad-mask or auto-generated SAM-3 masks, optional Pass 2 refinement for temporal consistency, adjustable denoising steps, guidance scale, and temporal window size. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

API Object Detection and Segmentation — tarifs et performances

Exécutez n'importe quel modèle de la collection Object Detection and Segmentation via une seule API REST. Paiement à la génération — sans abonnement ni minimum — avec une latence à l'état de l'art sur une infrastructure à 99,9 % de disponibilité.

Pourquoi exécuter Object Detection and Segmentation sur WaveSpeedAI

Tarification transparente

Tarification à l'appel pour chaque modèle Object Detection and Segmentation. Le prix est indiqué sur la page de chaque modèle — pas de frais de plateforme en plus.

Optimisé pour une faible latence

La plupart des modèles d'image Object Detection and Segmentation s'exécutent en moins de 2 secondes. Les modèles vidéo et 3D sont plusieurs fois plus rapides que les alternatives auto-hébergées.

99,9 % de disponibilité

Bascule multi-régions et nouvelles tentatives automatiques maintiennent votre trafic de production en ligne — même en cas de panne fournisseur.

Questions fréquentes

Combien coûte l'API Object Detection and Segmentation ?+

Chaque modèle a son propre prix par appel indiqué sur sa page. Nous facturons à chaque génération réussie, sans abonnement ni minimum.

À quelle vitesse les modèles Object Detection and Segmentation fonctionnent-ils sur WaveSpeedAI ?+

Les modèles d'image de cette collection se terminent généralement en moins de 2 secondes. Les modèles vidéo et 3D dépendent de la durée et de la résolution mais sont en général plusieurs fois plus rapides que les exécutions auto-hébergées.

Puis-je essayer l'API sans carte de crédit ?+

Oui — chaque compte reçoit 1 $ de crédits offerts à l'inscription, suffisant pour essayer la plupart des modèles Object Detection and Segmentation sans carte de crédit.

Y a-t-il des limites de taux ?+

Les comptes standard ont des limites de jobs concurrents généreuses. Les plans Enterprise proposent un RPM personnalisé, une concurrence plus élevée et de la capacité dédiée — contactez le service commercial pour les détails.

Explorez plus de 1 000 modèles d'IA

Parcourez notre catalogue complet de modèles d'IA à la pointe de la technologie — image, vidéo, 3D, audio, LLM et plus.

wavespeed.ai/models →

Construisez avec l'API

Intégrez l'IA dans vos propres apps. API RESTful avec des bibliothèques client — pas de démarrages à froid, paiement à l'usage.

wavespeed.ai/docs →