Presentamos WaveSpeedAI Molmo2 Image Content Moderator en WaveSpeedAI

Presentamos WaveSpeedAI Molmo2 Image Content Moderator en WaveSpeedAI

Molmo2-4B Image Content Moderator: Analiza el contenido de imágenes para seguridad, idoneidad y cumplimiento normativo. Detecta violencia, desnudez, gore y otros contenidos dañinos

7 min read
Molmo2 Image QA de WaveSpeedAI ahora disponible en WaveSpeedAI

Molmo2 Image QA de WaveSpeedAI ahora disponible en WaveSpeedAI

Molmo2-4B Image QA: Responde preguntas sobre imágenes con soporte para comparación multi-imagen (1-2 imágenes). Modelo de visión-lenguaje de código abierto. API REST lista para usar

6 min read
Presentamos WaveSpeedAI Molmo2 Prompt Optimizer en WaveSpeedAI

Presentamos WaveSpeedAI Molmo2 Prompt Optimizer en WaveSpeedAI

Molmo2-4B Prompt Optimizer: Mejora tus prompts para generación de imágenes y vídeos con reestructuración inteligente, orientación de estilo y mejoras contextuales. Open-

6 min read
WaveSpeedAI Molmo2 Text Content Moderator ahora disponible en WaveSpeedAI

WaveSpeedAI Molmo2 Text Content Moderator ahora disponible en WaveSpeedAI

Molmo2-4B Text Content Moderator: Analiza contenido de texto para seguridad, adecuación y cumplimiento de políticas. Detecta discurso de odio, violencia, contenido sexual y más

7 min read
Molmo2 Video Captioner de WaveSpeedAI ahora disponible en WaveSpeedAI

Molmo2 Video Captioner de WaveSpeedAI ahora disponible en WaveSpeedAI

Molmo2-4B Video Captioner: Genera títulos detallados y precisos para videos con niveles de detalle personalizables (bajo, medio, alto). Modelo de visión-lenguaje de código abierto

6 min read
Presentando WaveSpeedAI Molmo2 Video Content Moderator en WaveSpeedAI

Presentando WaveSpeedAI Molmo2 Video Content Moderator en WaveSpeedAI

Molmo2-4B Video Content Moderator analiza contenido de video para seguridad, adecuación y cumplimiento de políticas. Detecta violencia, desnudez, gore y otros contenidos dañinos

7 min read
Molmo2 Video QA de WaveSpeedAI ahora disponible en WaveSpeedAI

Molmo2 Video QA de WaveSpeedAI ahora disponible en WaveSpeedAI

Molmo2-4B Video QA: Responde preguntas sobre contenido de video con comprensión temporal. Modelo de visión-lenguaje de código abierto. API REST lista para usar, sin inicios en frío.

6 min read
Presentamos WaveSpeedAI Molmo2 Video Understanding en WaveSpeedAI

Presentamos WaveSpeedAI Molmo2 Video Understanding en WaveSpeedAI

Molmo2-4B Video Understanding: Analiza videos con tareas especializadas (general, resumen, análisis, conteo, descripción de escenas). Modelo de visión-lenguaje de código abierto

6 min read
Presentando OpenAI Whisper Con Video en WaveSpeedAI

Presentando OpenAI Whisper Con Video en WaveSpeedAI

OpenAI Whisper Large v3 (Video-to-Text) ofrece transcripción multilingüe de alta precisión directamente desde archivos de video, con detección automática de idioma y opciones

5 min read
Presentando WaveSpeedAI Paddle Ocr en WaveSpeedAI

Presentando WaveSpeedAI Paddle Ocr en WaveSpeedAI

PaddleOCR-VL es un modelo visión-lenguaje ultracompacto de 0,9B parámetros para análisis de documentos, compatible con 109 idiomas e incluyendo reconocimiento de texto, tablas, fórmulas y gráficos

5 min read
Presentamos WaveSpeedAI Qwen Image 2512 LoRA Trainer en WaveSpeedAI

Presentamos WaveSpeedAI Qwen Image 2512 LoRA Trainer en WaveSpeedAI

Qwen-Image-2512 LoRA Trainer te permite entrenar modelos LoRA personalizados 10 veces más rápido con entrenamiento de estilos, personajes y objetos. Del concepto al modelo en minutos, no en horas

6 min read
Presentando WaveSpeedAI Qwen Image Text-to-Image 2512 LoRA en WaveSpeedAI

Presentando WaveSpeedAI Qwen Image Text-to-Image 2512 LoRA en WaveSpeedAI

Qwen-Image-2512 LoRA es un modelo MMDiT mejorado de 20B text-to-image con soporte LoRA para personalización rápida y generación de imágenes refinada. REST infer listo para usar

6 min read