
Add music, voiceovers, and sound effects to your videos with WaveSpeedAI’s audio-for-video tools.

MMaudio v2 produces synchronized audio from video or text inputs, ideal for adding soundtracks to videos when paired with video models. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

MMaudio v2 produces synchronized audio from video or text inputs, ideal for adding soundtracks to videos when paired with video models. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Kling Video-to-Audio auto-generates or extracts matching sound effects and audio tracks from video using KlingAI's audio generation model. Ready-to-use REST API, best performance, no coldstarts, affordable pricing.

Kling Text-to-Audio turns text prompts into custom sound effects for videos, games, and multimedia using KlingAI's audio model. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

HunyuanVideo-Foley generates realistic Foley and ambient audio from an uploaded video using a text prompt to describe desired sounds. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

ACE-Step Prompt-to-Audio creates music from simple prompts, auto-generating genre tags and lyrics for quick song creation. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Mirelo SFX V1.5 generates synchronized sound effects and audio for any video, producing synced SFX to enhance visuals. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

ElevenLabs Dubbing automatically translates and dubs video/audio content into different languages while preserving the original speakers' voices. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Mirelo SFX V1 Video-to-Audio generates synchronized sound effects from video input with text prompt guidance. Supports multiple sample generation and customizable duration. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.
Execute qualquer modelo da coleção Audio for Video por meio de uma única API REST. Pague por geração — sem assinaturas, sem mínimos — com latência líder do setor numa infraestrutura com 99,9% de disponibilidade.
Preço por chamada para cada modelo Audio for Video. O preço aparece na página de cada modelo — sem taxas de plataforma adicionais.
A maioria dos modelos de imagem Audio for Video termina em menos de 2 segundos. Modelos de vídeo e 3D são várias vezes mais rápidos que alternativas auto-hospedadas.
Failover multirregião e novas tentativas automáticas mantêm seu tráfego de produção online — mesmo durante quedas do provedor.
Cada modelo tem seu próprio preço por chamada listado na página do modelo. Cobramos por geração bem-sucedida, sem taxas de assinatura nem mínimos.
Os modelos de imagem desta coleção normalmente terminam em menos de 2 segundos. Modelos de vídeo e 3D dependem da duração e resolução, mas costumam ser várias vezes mais rápidos do que execuções auto-hospedadas.
Sim — toda conta recebe US$ 1 em créditos grátis no cadastro, suficiente para experimentar a maioria dos modelos Audio for Video sem cartão de crédito.
Contas padrão têm limites generosos de tarefas concorrentes. Planos Enterprise oferecem RPM personalizado, maior concorrência e capacidade dedicada — entre em contato com vendas para detalhes.
Navegue por nosso catálogo completo de modelos de IA de última geração — imagem, vídeo, 3D, áudio, LLM e muito mais.
wavespeed.ai/models →Integre IA em seus próprios aplicativos. API RESTful com bibliotecas cliente — sem cold starts, pague por uso.
wavespeed.ai/docs →