#model-release
389 articles - Page 10
Presentamos MiniMax Hailuo 2.3 T2V Standard en WaveSpeedAI
Hailuo 2.3 es un modelo de texto a video que crea videos de 768p conscientes de la física con una eficiencia 2.5× y una tasa de respuesta de instrucciones complejas del 85%. API de inferencia REST lista para usar, mejor rendimiento, sin inicios en frío, precios asequibles.
Presentamos Google Gemini 3 Pro Image Edit en WaveSpeedAI
Google's Gemini 3.0 Pro (Gemini 3.0 Pro Image) Edit permite la edición de imágenes y generación de texto a imagen con salida compatible con 4K para dispositivos móviles. API de inferencia REST lista para usar, mejor rendimiento, sin inicios en frío, precios asequibles.
Presentando FLUX 2 Dev Generación de Texto a Imagen en WaveSpeedAI
FLUX.2 [dev] de Black Forest Labs ofrece generación de texto a imagen rápida y de calidad de estudio con realismo mejorado, renderizado de texto más nítido y edición nativa para iteración rápida. API de inferencia REST lista para usar, mejor rendimiento, sin arranques en frío, precios asequibles.
Presentando Google Gemini 3 Pro Image Text-to-Image en WaveSpeedAI
Google's Gemini 3.0 Pro (Gemini 3.0 Pro Preview) es un modelo de texto a imagen de vanguardia que permite la generación de imágenes en alta resolución 4K optimizadas para teléfonos. API de inferencia REST lista para usar, mejor rendimiento, sin arranques en frío, precios asequibles.
Presentando InfiniteTalk Fast Multi de WaveSpeedAI en WaveSpeedAI
InfiniteTalk fast multi convierte una sola imagen y dos entradas de audio en videos de múltiples personajes hablando o cantando. API REST de inferencia lista para usar, mejor rendimiento, sin arranques en frío, precios asequibles.
Presentando WaveSpeedAI Hunyuan Video Foley en WaveSpeedAI
HunyuanVideo-Foley genera audio Foley realista y ambiental a partir de un video cargado utilizando una indicación de texto para describir los sonidos deseados. API de inferencia REST lista para usar, mejor rendimiento, sin arranques en frío, precios asequibles.
Presentamos WaveSpeedAI Think Sound en WaveSpeedAI
ThinkSound convierte videos cargados en audio realista guiado por texto. Carga un video y agrega un prompt de texto para generar sonido realista. API REST de inferencia lista para usar, mejor rendimiento, sin inicios en frío, precios asequibles.
Presentamos WAN 2.2 Video Edit en WaveSpeedAI
WAN 2.2 Video Edit te permite modificar videos mediante indicaciones de texto (por ejemplo, cambiar ropa o personajes). Impulsado por WAN 2.2, admite 480p ($0,20/5s) y 720p ($0,40/5s), hasta 120s. API de inferencia REST lista para usar, mejor rendimiento, sin arranques en frío, precios asequibles.
Presentamos MiniMax Speech 02 HD en WaveSpeedAI
MiniMax Speech 02 HD es el modelo de síntesis de voz de alta definición de MiniMax que ofrece voces claras en HD; precio de $0.05 por cada 1,000 caracteres. API de inferencia REST lista para usar, mejor rendimiento, sin arranques en frío, precios asequibles.
Presentando WaveSpeedAI Qwen Image Edit en WaveSpeedAI
Qwen-Image-Edit es un modelo de imagen a imagen MMDiT de 20B que ofrece ediciones de texto bilingües precisas (chino e inglés) mientras preserva el estilo. API de inferencia REST lista para usar, mejor rendimiento, sin arranques en frío, precios asequibles.
Presentamos PixVerse V5 Effects en WaveSpeedAI
PixVerse V5 Effects convierte imágenes en videos cortos suave y naturales con movimiento realista; soporta salidas de 5s/8s y 720p/1080p. API REST lista para usar, sin arranques en frío, mejor rendimiento, precios asequibles.
Presentando PixVerse V5 I2V en WaveSpeedAI
PixVerse V5 convierte imágenes en videos cortos, suaves y de aspecto natural. Video de 5s: $0,15 (360p/540p), $0,20 (720p), $0,40 (1080p). API de inferencia REST lista para usar, mejor rendimiento, sin arranques en frío, precios asequibles.