Introducing WaveSpeedAI Molmo2 Video Understanding on WaveSpeedAI
Molmo2-4B Video Understanding: Analysez des vidéos avec des tâches spécialisées (général, résumé, analyse, comptage, description de scène). Modèle vision-langage open-source
Introducing WaveSpeedAI OpenAI Whisper With Video on WaveSpeedAI
OpenAI Whisper Large v3 (Vidéo-en-Texte) offre une transcription multilingue haute précision directement à partir de fichiers vidéo, avec détection automatique de la langue et options
Introducing WaveSpeedAI Paddle OCR on WaveSpeedAI
PaddleOCR-VL est un modèle vision-langage ultra-compact avec 0,9B paramètres pour l'analyse de documents, supportant 109 langues avec reconnaissance de texte, tableaux, formules et graphiques
Introducing WaveSpeedAI Qwen Image 2512 LoRA Trainer on WaveSpeedAI
Qwen-Image-2512 LoRA Trainer vous permet d'entraîner des modèles LoRA personnalisés 10 fois plus rapidement avec l'entraînement de style, de caractère et d'objet. Du concept au modèle en minutes, pas en heures
Introducing WaveSpeedAI Qwen Image Text-to-Image 2512 LoRA on WaveSpeedAI
Qwen-Image-2512 LoRA est un modèle texte-vers-image MMDiT 20B amélioré avec support LoRA pour une personnalisation rapide et une génération d'images affinée. Inférence REST prête à l'emploi
Introducing WaveSpeedAI Video Background Remover on WaveSpeedAI
Le WaveSpeed Video Background Remover remplace ou supprime les arrière-plans vidéo avec une image personnalisée. Téléchargez ou collez un lien vers votre vidéo, puis fournissez une image d'arrière-plan
Z Image Turbo Controlnet est maintenant disponible sur WaveSpeedAI
Z-Image-Turbo ControlNet génère des images guidées par des signaux de contrôle structurel (profondeur, canny edge, pose) pour un contrôle de composition précis. Inférence REST prête à l'emploi
Introducing xAI Grok 2 Image on WaveSpeedAI
Grok 2 Image est le dernier modèle de génération d'images de xAI qui transforme des invites textuelles simples en visuels nets et photoréalistes en quelques secondes. Des clichés de produits aux réseaux sociaux
Z AI CogView 4 maintenant disponible sur WaveSpeedAI
Z-AI CogView-4 génère des images de haute qualité à partir de descriptions textuelles avec une compréhension rapide et précise des demandes des utilisateurs, permettant à l'IA d'exprimer les images de manière plus précise
GLM-Image Edit est maintenant disponible sur WaveSpeedAI
GLM-Image Edit est un puissant modèle d'édition image-vers-image qui transforme les images selon des instructions textuelles. API REST d'inférence prête à l'emploi, meilleures performances, sans co
Z AI GLM Image Text-to-Image arrive maintenant sur WaveSpeedAI
Z-AI GLM Image génère des images de haute qualité à partir de descriptions textuelles, avec une meilleure compréhension des instructions utilisateur, produisant des images plus précises et détaillées.
Kling 2.6 Motion Control pour animations de danse : paramètres et conseils de synchronisation labiale
Conseils pratiques pour animer des danses avec Kling 2.6 Motion Control — paramètres, priorités des parties du corps, alignement au rythme et corrections pour le glissement des pieds et les tremblements.