WaveSpeedAI Molmo2 Image Content Moderator теперь доступен на WaveSpeedAI
Molmo2-4B Image Content Moderator: анализируйте содержимое изображений на предмет безопасности, уместности и соответствия политикам. Обнаруживает насилие, обнаженность, кровь и другое вредоносное содержимое
Молмо2 Image QA на WaveSpeedAI
Molmo2-4B Image QA: Ответьте на вопросы об изображениях с поддержкой сравнения нескольких изображений (1-2 изображения). Модель открытого исходного кода для работы с видением и языком. Готовый к использованию REST API
Представляем WaveSpeedAI Molmo2 Prompt Optimizer на WaveSpeedAI
Molmo2-4B Prompt Optimizer: улучшайте подсказки для генерации изображений и видео с помощью интеллектуального переструктурирования, рекомендаций по стилю и контекстно-ориентированных улучшений. Открыт-
Представляем WaveSpeedAI Molmo2 Text Content Moderator на WaveSpeedAI
Molmo2-4B Text Content Moderator: анализируйте текстовое содержимое на предмет безопасности, соответствия и соответствия политике. Обнаруживает речь ненависти, насилие, сексуальное содержание и другое
WaveSpeedAI Molmo2 Video Captioner теперь доступен на WaveSpeedAI
Molmo2-4B Video Captioner: Генерируйте подробные и точные субтитры для видео с настраиваемыми уровнями детализации (низкий, средний, высокий). Модель открытого исходного кода для анализа видео.
Molmo2 Video Content Moderator теперь доступен на WaveSpeedAI
Molmo2-4B Video Content Moderator анализирует видеоконтент на предмет безопасности, уместности и соответствия политике. Обнаруживает насилие, обнаженность, кровавые сцены и другой вредоносный видеоконтент
Представляем WaveSpeedAI Molmo2 Video Qa на WaveSpeedAI
Molmo2-4B Video QA: Отвечайте на вопросы о содержании видео с временным пониманием. Открытая модель зрения и языка. Готовый REST API, без холодного запуска,
Представляем WaveSpeedAI Molmo2 Video Understanding на WaveSpeedAI
Molmo2-4B Video Understanding: Анализируйте видео со специализированными задачами (общий анализ, резюме, анализ, подсчет, описание сцены). Модель визуального понимания с открытым исходным кодом
OpenAI Whisper с видео теперь доступен на WaveSpeedAI
OpenAI Whisper Large v3 (Video-to-Text) обеспечивает высокоточную многоязычную транскрипцию напрямую из видеофайлов с автоматическим определением языка и дополнительными опциями
PaddleOCR теперь доступен на WaveSpeedAI
PaddleOCR-VL — это компактная модель обработки зрения размером 0,9B параметров для анализа документов, поддерживающая 109 языков с распознаванием текста, таблиц, формул и диаграмм
Представляем WaveSpeedAI Qwen Image 2512 LoRA Trainer на WaveSpeedAI
Qwen-Image-2512 LoRA Trainer позволяет обучать пользовательские LoRA модели в 10 раз быстрее с обучением стилей, персонажей и объектов. От концепции к модели за минуты, а не часы
WaveSpeedAI Qwen Image Text-to-Image 2512 LoRA теперь доступна на WaveSpeedAI
Qwen-Image-2512 LoRA — это улучшенная 20B MMDiT модель преобразования текста в изображение с поддержкой LoRA для быстрой кастомизации и уточненной генерации изображений. Готов к использованию REST интерфейс