#model-release
392 articles - Page 24
Apresentando ByteDance Dreamina V3.1 Texto-para-Imagem no WaveSpeedAI
ByteDance Dreamina V3.1 é um modelo texto-para-imagem com estética aprimorada e precisão de estilo, produzindo imagens mais ricas e polidas. API REST de inferência pronta para usar, melhor desempenho, sem inicializações lentas, preços acessíveis.
Apresentando ByteDance LipSync Audio Para Vídeo no WaveSpeedAI
ByteDance LipSync transforma áudio em vídeos de fala realistas gerando movimentos labiais precisos totalmente sincronizados com o áudio de entrada. API REST de inferência pronta para usar, melhor desempenho, sem inicializações a frio, preços acessíveis.
Apresentando o ByteDance Video Upscaler no WaveSpeedAI
O ByteDance Video Upscaler usa super-resolução com IA para ampliar vídeos para 4K e recuperar detalhes finos em um ambiente de nuvem seguro. API REST de inferência pronta para uso, melhor desempenho, sem inicializações frias, preços acessíveis.
Apresentando ByteDance USO no WaveSpeedAI
USO (Unified Style-Subject Optimized) do ByteDance unifica geração orientada por estilo e orientada por sujeito para produzir saídas consistentes que combinam estilo artístico com fidelidade ao sujeito. API de inferência REST pronta para uso, melhor desempenho, sem inicializações frias, preços acessíveis.
Apresentando ElevenLabs Eleven V3 no WaveSpeedAI
ElevenLabs eleven-v3 é um modelo de conversão de texto em fala disponível como um endpoint hospedado; solicitações custam $0,1 por 1000 caracteres. API REST de inferência pronta para usar, melhor desempenho, sem inicializações frias, preços acessíveis.
Apresentando o ElevenLabs Flash V2.5 no WaveSpeedAI
O ElevenLabs Flash V2 é um modelo de Texto-para-Fala que converte texto em áudio falado usando o mecanismo ElevenLabs Flash V2. API de inferência REST pronta para uso, melhor desempenho, sem coldstarts, preços acessíveis.
Apresentando ElevenLabs Flash V2 no WaveSpeedAI
ElevenLabs Flash V2 é um modelo Text-to-Speech que converte texto em áudio falado usando o mecanismo ElevenLabs Flash V2. API REST de inferência pronta para usar, melhor desempenho, sem inicializações frias, preços acessíveis.
Apresentando ElevenLabs Eleven V3 Timing no WaveSpeedAI
ElevenLabs Eleven-V3 Timing converte texto em fala natural e retorna metadados de alinhamento—timestamps de caracteres/palavras em JSON—para legendas precisas, efeitos de karaokê e sincronização labial. Suporta voice_id, similaridade/estabilidade e Speaker Boost opcional. Preço de $0,10 por 1.000 caracteres. Pronto para u
Apresentando ElevenLabs Multilingual V1 no WaveSpeedAI
ElevenLabs Multilingual V1 oferece síntese de voz natural em múltiplos idiomas. API REST de inferência pronta para usar, melhor desempenho, sem inicializações lentas, preços acessíveis.
Apresentando ElevenLabs Multilingual V2 no WaveSpeedAI
ElevenLabs Multilingual V2 é um modelo multilíngue de conversão de texto para fala; custa $0,1 por 1000 caracteres. API REST de inferência pronta para usar, melhor desempenho, sem inicializações lentas, preços acessíveis.
Apresentando ElevenLabs Turbo V2.5 no WaveSpeedAI
ElevenLabs Turbo V2.5 é um modelo de conversão de texto em fala disponível via WaveSpeedAI, cobrado a $0,05 por 1000 caracteres para solicitações de TTS. API de inferência REST pronta para usar, melhor desempenho, sem inicializações a frio, preços acessíveis.
Apresentando ElevenLabs Turbo V2 no WaveSpeedAI
ElevenLabs Turbo V2 é um modelo Text-To-Speech disponível via WaveSpeedAI, cobrado a $0,05 por 1000 caracteres para solicitações de API. API REST de inferência pronta para usar, melhor desempenho, sem inicializações a frio, preços acessíveis.