Memperkenalkan WaveSpeedAI Molmo2 Image Content Moderator di WaveSpeedAI
Molmo2-4B Image Content Moderator: Analisis konten gambar untuk keamanan, kesesuaian, dan kepatuhan kebijakan. Mendeteksi kekerasan, nuditas, gore, dan konten berbahaya lainnya
Memperkenalkan WaveSpeedAI Molmo2 Image QA di WaveSpeedAI
Molmo2-4B Image QA: Jawab pertanyaan tentang gambar dengan dukungan perbandingan multi-gambar (1-2 gambar). Model vision-language open-source. REST API siap pakai
WaveSpeedAI Molmo2 Prompt Optimizer Kini Tersedia di WaveSpeedAI
Molmo2-4B Prompt Optimizer: Tingkatkan prompt untuk pembuatan gambar dan video dengan restructuring cerdas, panduan gaya, dan peningkatan yang aware terhadap konteks. Terbuka-
Memperkenalkan WaveSpeedAI Molmo2 Text Content Moderator di WaveSpeedAI
Molmo2-4B Text Content Moderator: Analisis konten teks untuk keamanan, kesesuaian, dan kepatuhan kebijakan. Mendeteksi ujaran kebencian, kekerasan, konten seksual, dan lainnya
Memperkenalkan WaveSpeedAI Molmo2 Video Captioner di WaveSpeedAI
Molmo2-4B Video Captioner: Hasilkan keterangan video yang detail dan akurat dengan tingkat detail yang dapat disesuaikan (rendah, sedang, tinggi). Mode visi-bahasa sumber terbuka
Memperkenalkan WaveSpeedAI Molmo2 Video Content Moderator di WaveSpeedAI
Molmo2-4B Video Content Moderator menganalisis konten video untuk keamanan, kesesuaian, dan kepatuhan kebijakan. Mendeteksi kekerasan, nuditas, gore, dan konten berbahaya lainnya
Memperkenalkan WaveSpeedAI Molmo2 Video Qa di WaveSpeedAI
Molmo2-4B Video QA: Jawab pertanyaan tentang konten video dengan pemahaman temporal. Model visi-bahasa sumber terbuka. REST API siap pakai, tanpa cold starts,
Memperkenalkan Pemahaman Video WaveSpeedAI Molmo2 di WaveSpeedAI
Molmo2-4B Pemahaman Video: Analisis video dengan tugas khusus (umum, ringkasan, analisis, penghitungan, deskripsi adegan). Model visi-bahasa sumber terbuka
Memperkenalkan WaveSpeedAI Openai Whisper With Video on WaveSpeedAI
OpenAI Whisper Large v3 (Video-to-Text) memberikan transkripsi multibahasa dengan akurasi tinggi langsung dari file video, dengan deteksi bahasa otomatis dan opsi
Memperkenalkan WaveSpeedAI Paddle OCR di WaveSpeedAI
PaddleOCR-VL adalah model visi-bahasa ultra-kompak dengan 0,9B parameter untuk parsing dokumen, mendukung 109 bahasa dengan pengenalan teks, tabel, formula, dan bagan
Memperkenalkan WaveSpeedAI Qwen Image 2512 LoRA Trainer di WaveSpeedAI
Qwen-Image-2512 LoRA Trainer memungkinkan Anda melatih model LoRA khusus 10x lebih cepat dengan pelatihan gaya, karakter, dan objek. Dari konsep ke model dalam hitungan menit, bukan jam
Memperkenalkan WaveSpeedAI Qwen Image Text-to-Image 2512 LoRA di WaveSpeedAI
Qwen-Image-2512 LoRA adalah model text-to-image MMDiT 20B yang ditingkatkan dengan dukungan LoRA untuk kustomisasi cepat dan pembuatan gambar yang disempurnakan. REST infer siap digunakan