WaveSpeedAI Molmo2 Image Content Moderator já disponível no WaveSpeedAI
Molmo2-4B Image Content Moderator: Analise conteúdo de imagens para segurança, adequação e conformidade com políticas. Detecta violência, nudez, gore e outros conteúdos prejudiciais
Apresentando WaveSpeedAI Molmo2 Prompt Optimizer no WaveSpeedAI
Molmo2-4B Prompt Optimizer: Melhore prompts para geração de imagens e vídeos com reestruturação inteligente, orientação de estilo e melhorias conscientes de contexto. Aberto-
Apresentando WaveSpeedAI Molmo2 Image QA na WaveSpeedAI
Molmo2-4B Image QA: Responda perguntas sobre imagens com suporte para comparação multi-imagem (1-2 imagens). Modelo de visão-linguagem de código aberto. API REST pronta para usar
Introduzindo o Moderador de Conteúdo de Texto WaveSpeedAI Molmo2 no WaveSpeedAI
Molmo2-4B Moderador de Conteúdo de Texto: Analise conteúdo de texto para segurança, adequação e conformidade com políticas. Detecta discurso de ódio, violência, conteúdo sexual e ot
Molmo2 Video Captioner agora disponível em WaveSpeedAI
Molmo2-4B Video Captioner: Gere legendas detalhadas e precisas para vídeos com níveis de detalhe personalizáveis (baixo, médio, alto). Modelo de visão-linguagem de código aberto
Introduzindo WaveSpeedAI Molmo2 Video Content Moderator on WaveSpeedAI
Molmo2-4B Video Content Moderator analisa conteúdo de vídeo para segurança, adequação e conformidade com políticas. Detecta violência, nudez, gore e outros conteúdos prejudiciais
Apresentando WaveSpeedAI Molmo2 Video QA no WaveSpeedAI
Molmo2-4B Video QA: Responda perguntas sobre conteúdo de vídeo com compreensão temporal. Modelo de visão-linguagem de código aberto. API REST pronta para usar, sem cold starts,
Apresentando WaveSpeedAI Molmo2 Video Understanding no WaveSpeedAI
Molmo2-4B Video Understanding: Analise vídeos com tarefas especializadas (geral, resumo, análise, contagem, descrição de cena). Modelo visão-linguagem de código aberto
Apresentando WaveSpeedAI Openai Whisper With Video on WaveSpeedAI
OpenAI Whisper Large v3 (Video-to-Text) oferece transcrição multilíngue de alta precisão diretamente de arquivos de vídeo, com detecção automática de idioma e opções
Apresentando WaveSpeedAI Paddle Ocr no WaveSpeedAI
PaddleOCR-VL é um modelo compacto de visão-linguagem com 0,9B de parâmetros para análise de documentos, suportando 109 idiomas com reconhecimento de texto, tabelas, fórmulas e gráficos
Apresentando WaveSpeedAI Qwen Image 2512 LoRA Trainer no WaveSpeedAI
Qwen-Image-2512 LoRA Trainer permite treinar modelos LoRA personalizados 10x mais rápido com treinamento de estilo, personagem e objeto. Do conceito ao modelo em minutos, não horas
Apresentando WaveSpeedAI Qwen Image Text-to-Image 2512 LoRA no WaveSpeedAI
Qwen-Image-2512 LoRA é um modelo MMDiT texto-para-imagem de 20B aprimorado com suporte a LoRA para customização rápida e geração refinada de imagens. REST pronto para uso