#model-release
392 articles - Page 10
Présentation de Kuaishou Kling Image O1 sur WaveSpeedAI
Kling Omni Image O1 est le modèle de génération d'images multimodal de Kuaishou avec la technologie MVL. Supporte jusqu'à 10 images de référence pour la cohérence des caractéristiques, l'édition détaillée précise (ajouter/supprimer/modifier), le contrôle de style et la création de contenu en série. Parfait pour la conception de personnages IP, les bandes dessinées et les produits de marque
Google Nano Banana Pro Edit Multi maintenant disponible sur WaveSpeedAI
Google's Nano Banana Pro (Gemini 3.0 Pro Image) Edit est un modèle d'édition d'images de nouvelle génération capable de générer plusieurs images éditées de haute qualité en une seule exécution. Coût extrêmement faible — seulement 0,07 $ par image. API d'inférence REST prête à l'emploi, meilleures performances, sans démarrages à froid, tarification abordable.
Présentation de MiniMax Hailuo 2.3 T2V Pro sur WaveSpeedAI
MiniMax Hailuo 2.3 Pro est un modèle de texte vers vidéo offrant des vidéos 1080p avec une efficacité 2.5x supérieure et une précision de 85% pour les instructions complexes. API d'inférence REST prête à l'emploi, meilleures performances, aucun démarrage à froid, tarification abordable.
Présentation de MiniMax Hailuo 2.3 T2V Standard sur WaveSpeedAI
Hailuo 2.3 est un modèle texte-vers-vidéo créant des vidéos 768p conscientes de la physique avec une efficacité 2,5× et un taux de réponse aux instructions complexes de 85%. API d'inférence REST prête à l'emploi, meilleures performances, aucun démarrage à froid, tarification abordable.
Présentation de Google Gemini 3 Pro Image Edit sur WaveSpeedAI
Google's Gemini 3.0 Pro (Gemini 3.0 Pro Image) Edit permet l'édition d'images et la génération d'images à partir de texte avec une sortie compatible 4K pour les appareils mobiles. API d'inférence REST prête à l'emploi, meilleures performances, pas de démarrages à froid, prix abordables.
Présentation de WaveSpeedAI FLUX 2 Dev Text-to-Image sur WaveSpeedAI
FLUX.2 [dev] de Black Forest Labs offre une génération d'images à partir de texte rapide et de qualité studio avec un réalisme amélioré, un rendu de texte plus net et une édition native pour une itération rapide. API d'inférence REST prête à l'emploi, meilleures performances, pas de démarrages à froid, tarification abordable.
Présentation de Google Gemini 3 Pro Image Text-to-Image sur WaveSpeedAI
Google's Gemini 3.0 Pro (Gemini 3.0 Pro Preview) est un modèle texte-vers-image de pointe permettant la génération d'images haute résolution 4K optimisées pour les téléphones. API d'inférence REST prête à l'emploi, meilleures performances, pas de démarrages à froid, tarification abordable.
Présentation de WaveSpeedAI InfiniteTalk Fast Multi sur WaveSpeedAI
InfiniteTalk fast multi convertit une seule image et deux entrées audio en vidéos multi-personnages parlants ou chantants. API d'inférence REST prête à l'emploi, meilleures performances, aucun démarrage à froid, tarification abordable.
Présentation de WaveSpeedAI HunyuanVideo Foley sur WaveSpeedAI
HunyuanVideo-Foley génère du son Foley et audio ambiant réaliste à partir d'une vidéo téléchargée en utilisant une invite textuelle pour décrire les sons souhaités. API d'inférence REST prête à l'emploi, meilleures performances, sans démarrages à froid, tarification abordable.
Présentation de WaveSpeedAI Think Sound sur WaveSpeedAI
ThinkSound transforme les vidéos téléchargées en audio réaliste et guidé par texte. Téléchargez une vidéo et ajoutez une invite textuelle pour générer un son réaliste. API d'inférence REST prête à l'emploi, meilleures performances, pas de démarrages à froid, tarification abordable.
Présentation de WaveSpeedAI WAN 2.2 Video Edit sur WaveSpeedAI
Wan 2.2 Video Edit vous permet de modifier des vidéos via des invites textuelles (par exemple, changer les vêtements ou les personnages). Alimenté par Wan 2.2, il prend en charge 480p (0,20 $/5s) et 720p (0,40 $/5s), jusqu'à 120s. API d'inférence REST prête à l'emploi, meilleures performances, pas de démarrages à froid, tarification abordable.
Présentation de MiniMax Speech 02 HD sur WaveSpeedAI
MiniMax Speech 02 HD est le modèle de synthèse vocale haute définition de MiniMax offrant des voix claires en HD ; tarification à 0,05 $ pour 1 000 caractères. API d'inférence REST prête à l'emploi, meilleures performances, pas de démarrages à froid, tarification abordable.