Presentamos WaveSpeedAI Molmo2 Image Content Moderator en WaveSpeedAI
Molmo2-4B Image Content Moderator: Analiza el contenido de imágenes para seguridad, idoneidad y cumplimiento normativo. Detecta violencia, desnudez, gore y otros contenidos dañinos
Molmo2 Image QA de WaveSpeedAI ahora disponible en WaveSpeedAI
Molmo2-4B Image QA: Responde preguntas sobre imágenes con soporte para comparación multi-imagen (1-2 imágenes). Modelo de visión-lenguaje de código abierto. API REST lista para usar
Presentamos WaveSpeedAI Molmo2 Prompt Optimizer en WaveSpeedAI
Molmo2-4B Prompt Optimizer: Mejora tus prompts para generación de imágenes y vídeos con reestructuración inteligente, orientación de estilo y mejoras contextuales. Open-
WaveSpeedAI Molmo2 Text Content Moderator ahora disponible en WaveSpeedAI
Molmo2-4B Text Content Moderator: Analiza contenido de texto para seguridad, adecuación y cumplimiento de políticas. Detecta discurso de odio, violencia, contenido sexual y más
Molmo2 Video Captioner de WaveSpeedAI ahora disponible en WaveSpeedAI
Molmo2-4B Video Captioner: Genera títulos detallados y precisos para videos con niveles de detalle personalizables (bajo, medio, alto). Modelo de visión-lenguaje de código abierto
Presentando WaveSpeedAI Molmo2 Video Content Moderator en WaveSpeedAI
Molmo2-4B Video Content Moderator analiza contenido de video para seguridad, adecuación y cumplimiento de políticas. Detecta violencia, desnudez, gore y otros contenidos dañinos
Molmo2 Video QA de WaveSpeedAI ahora disponible en WaveSpeedAI
Molmo2-4B Video QA: Responde preguntas sobre contenido de video con comprensión temporal. Modelo de visión-lenguaje de código abierto. API REST lista para usar, sin inicios en frío.
Presentamos WaveSpeedAI Molmo2 Video Understanding en WaveSpeedAI
Molmo2-4B Video Understanding: Analiza videos con tareas especializadas (general, resumen, análisis, conteo, descripción de escenas). Modelo de visión-lenguaje de código abierto
Presentando OpenAI Whisper Con Video en WaveSpeedAI
OpenAI Whisper Large v3 (Video-to-Text) ofrece transcripción multilingüe de alta precisión directamente desde archivos de video, con detección automática de idioma y opciones
Presentando WaveSpeedAI Paddle Ocr en WaveSpeedAI
PaddleOCR-VL es un modelo visión-lenguaje ultracompacto de 0,9B parámetros para análisis de documentos, compatible con 109 idiomas e incluyendo reconocimiento de texto, tablas, fórmulas y gráficos
Presentamos WaveSpeedAI Qwen Image 2512 LoRA Trainer en WaveSpeedAI
Qwen-Image-2512 LoRA Trainer te permite entrenar modelos LoRA personalizados 10 veces más rápido con entrenamiento de estilos, personajes y objetos. Del concepto al modelo en minutos, no en horas
Presentando WaveSpeedAI Qwen Image Text-to-Image 2512 LoRA en WaveSpeedAI
Qwen-Image-2512 LoRA es un modelo MMDiT mejorado de 20B text-to-image con soporte LoRA para personalización rápida y generación de imágenes refinada. REST infer listo para usar