#model-release
392 articles - Page 10
Apresentando Kuaishou Kling Image O1 na WaveSpeedAI
Kling Omni Image O1 é o modelo de geração de imagens multimodal da Kuaishou com tecnologia MVL. Suporta até 10 imagens de referência para consistência de recursos, edição precisa de detalhes (adicionar/remover/modificar), controle de estilo e criação de conteúdo em série. Perfeito para design de personagens IP, painéis de quadrinhos e merchandising de marca
Apresentando Google Nano Banana Pro Edit Multi no WaveSpeedAI
Google's Nano Banana Pro (Gemini 3.0 Pro Image) Edit é um modelo de edição de imagens de próxima geração capaz de gerar múltiplas imagens editadas de alta qualidade em uma única execução. Custo extremamente baixo — apenas $0,07 por imagem. API REST de inferência pronta para usar, melhor desempenho, sem coldstarts, preços acessíveis.
Apresentando MiniMax Hailuo 2.3 T2V Pro no WaveSpeedAI
MiniMax Hailuo 2.3 Pro é um modelo texto-para-vídeo que entrega vídeos em 1080p com eficiência 2.5x e precisão de 85% em instruções complexas. API de inferência REST pronta para usar, melhor desempenho, sem coldstarts, preços acessíveis.
Apresentando MiniMax Hailuo 2.3 T2V Standard no WaveSpeedAI
Hailuo 2.3 é um modelo de texto para vídeo que cria vídeos de 768p com consciência física, eficiência 2.5× maior e taxa de resposta de 85% para instruções complexas. API de inferência REST pronta para usar, melhor desempenho, sem inicializações lentas, preços acessíveis.
Apresentando Google Gemini 3 Pro Image Edit no WaveSpeedAI
O Google Gemini 3.0 Pro (Gemini 3.0 Pro Image) Edit permite edição de imagens e geração de texto para imagem com saída capaz de 4K para dispositivos móveis. API de inferência REST pronta para usar, melhor desempenho, sem inicializações lentas, preços acessíveis.
Apresentando WaveSpeedAI FLUX 2 Dev Text-to-Image no WaveSpeedAI
FLUX.2 [dev] do Black Forest Labs oferece geração de texto para imagem rápida e de qualidade estúdio com realismo aprimorado, renderização de texto mais nítida e edição nativa para iteração rápida. API de inferência REST pronta para usar, melhor desempenho, sem inicializações frias, preços acessíveis.
Apresentando Google Gemini 3 Pro Image Text-to-Image no WaveSpeedAI
O Gemini 3.0 Pro (Gemini 3.0 Pro Preview) do Google é um modelo de texto para imagem de ponta que permite a geração de imagens em alta resolução 4K otimizada para celulares. API REST de inferência pronta para usar, melhor desempenho, sem inicializações frias, preços acessíveis.
Apresentando WaveSpeedAI InfiniteTalk Fast Multi no WaveSpeedAI
InfiniteTalk fast multi converte uma única imagem e duas entradas de áudio em vídeos de múltiplos personagens falando ou cantando. API REST de inferência pronta para usar, melhor desempenho, sem inicializações lentas, preços acessíveis.
Apresentando WaveSpeedAI Hunyuan Video Foley no WaveSpeedAI
HunyuanVideo-Foley gera áudio Foley e ambiental realista a partir de um vídeo enviado usando um prompt de texto para descrever os sons desejados. API REST de inferência pronta para usar, melhor desempenho, sem inicializações frias, preços acessíveis.
Apresentando WaveSpeedAI Think Sound no WaveSpeedAI
ThinkSound transforma vídeos enviados em áudio realista e guiado por texto. Envie um vídeo e adicione um prompt de texto para gerar som realista. API REST de inferência pronta para usar, melhor desempenho, sem inicializações frias, preços acessíveis.
Apresentando WAN 2.2 Video Edit no WaveSpeedAI
Wan 2.2 Video Edit permite modificar vídeos através de prompts de texto (por exemplo, alterar roupas ou personagens). Alimentado por Wan 2.2, suporta 480p ($0,20/5s) e 720p ($0,40/5s), até 120s. API de inferência REST pronta para usar, melhor desempenho, sem coldstarts, preços acessíveis.
Apresentando MiniMax Speech 02 HD no WaveSpeedAI
MiniMax Speech 02 HD é o modelo de texto para fala de alta definição da MiniMax que oferece vozes HD claras; preço de $0,05 por 1.000 caracteres. API REST de inferência pronta para usar, melhor desempenho, sem inicializações lentas, preço acessível.