Presentamos PixVerse C1 Reference-to-Video en WaveSpeedAI
PixVerse C1 reference-to-video — genera videos con consistencia de sujeto y fondo a partir de imágenes de referencia mediante prompts @ref_name. Hasta 1080p, de 1 a 15 segundos.
Fija tu Sujeto y Fondo, Genera el Video
Una debilidad persistente en el video con IA ha sido la consistencia del sujeto — genera un clip de “una mujer con abrigo rojo caminando por una calle de París”, y dos segundos después es una mujer diferente con un abrigo diferente. La generación guiada por referencias soluciona esto: tú aportas el sujeto, tú aportas el fondo, y el modelo los compone en video.
Nos complace anunciar que PixVerse C1 Reference-to-Video ya está disponible en WaveSpeedAI — API REST de producción, control preciso de referencias mediante la sintaxis de prompt @ref_name.
¿Qué es PixVerse C1 Reference-to-Video?
PixVerse C1 Reference-to-Video es la variante guiada por referencias del modelo de video insignia PixVerse C1. En lugar de generar únicamente a partir de texto o una sola imagen inicial, subes imágenes de referencia con nombres, y luego las citas en tu prompt usando la sintaxis @ref_name — el modelo compone un video que mantiene el sujeto y el fondo consistentes con lo que subiste.
Ejemplo:
Sube
ref_1.png(un personaje específico) yref_2.png(una playa específica). Prompt: “@ref_1 camina por @ref_2 al atardecer, toma de seguimiento lenta desde atrás.” Resultado: un clip de 10 segundos donde el personaje se parece aref_1y el entorno se parece aref_2, no alguna aproximación de IA.
Esto es muy importante para contenido de marca, narrativa basada en personajes, y cualquier trabajo de propiedad intelectual donde el sujeto debe ser reconocible.
Características Principales
Sintaxis de Prompt @ref_name
Referencia múltiples imágenes subidas por nombre en tu prompt. El modelo resuelve cada referencia al recurso subido.
Consistencia de Sujeto + Fondo Mantiene la identidad del personaje y el estilo del entorno fijos durante toda la duración del clip.
Hasta 1080p, 1–15 Segundos El mismo nivel de calidad que el resto de la familia PixVerse C1. Elige entre 360p / 540p / 720p / 1080p.
Múltiples Relaciones de Aspecto Vertical, horizontal, cinematográfico — adapta tu formato de entrega.
Audio Nativo Opcional
Activa generate_audio_switch para una entrega en una sola llamada con audio sincronizado.
Casos de Uso Reales
Cortometrajes y Series Web Basadas en Personajes
Produce un protagonista de aspecto consistente a través de una serie de clips — mismo rostro, mismo vestuario, diferentes escenas. Esencial para contenido serial.
Contenido de Marca con Activos de Marca
Sube personajes de marca, logotipos o referencias de productos — el modelo los compone en nuevas escenas de video sin desviaciones.
Storyboarding con Talento Fijo
Previsualiza una escena donde “este actor” se encuentra con “esa ubicación” sin filmar ninguno. Fija ambos mediante imágenes de referencia.
Trabajo de Propiedad Intelectual y Personajes con Licencia
Genera clips de marketing, cinemáticas de juegos o contenido social con un personaje de propiedad intelectual específico, con fidelidad de identidad.
Contenido Educativo e Instructivo
Ancla un instructor o mascota consistente a lo largo de una serie de videos educativos.
Contenido Personalizado a Escala
Aplicaciones que insertan la foto de un usuario (como @ref_user) en escenas cinematográficas — cumpleaños, celebraciones, saludos personalizados.
Cómo Empezar en WaveSpeedAI
- Sube tus referencias — una o más imágenes, cada una con una etiqueta
ref_name. - Escribe un prompt usando
@ref_namepara indicar qué referencia aparece dónde. - Elige duración, resolución, relación de aspecto y audio — hasta 15 segundos a 1080p.
- Envía — la API de WaveSpeedAI se encarga del resto.
Esquema completo en la página del modelo.
Precios
El precio por segundo escala con la resolución y el audio:
- 360p: $0.03/seg (sin audio), $0.04/seg (con audio)
- 540p: $0.04/seg (sin audio), $0.05/seg (con audio)
- 720p: $0.05/seg (sin audio), $0.065/seg (con audio)
- 1080p: $0.095/seg (sin audio), $0.12/seg (con audio)
Un clip de 10 segundos a 720p con audio cuesta aproximadamente $0.65.
Por Qué Usar PixVerse C1 Reference-to-Video en WaveSpeedAI
- Una sola API, más de 890 modelos. Encadena reference-to-video con herramientas de mejora de calidad, sincronización labial y edición.
- Sin arranques en frío. Latencia de nivel producción.
- Precio por segundo, sin mínimos.
- Escala horizontalmente — genera contenido personalizado en lote para grandes audiencias.
Consejos Profesionales
- Las buenas imágenes de referencia producen buenos resultados. Composición limpia, sujeto único, iluminación clara.
- Nombra las referencias de forma descriptiva.
@heroey@cafese leen más claramente en los prompts que@img1e@img2. - Usa múltiples referencias con moderación. 2–3 referencias por prompt produce la composición más limpia; más allá de eso, el modelo dispersa la atención.
- Describe claramente la acción de la escena — el movimiento sigue siendo dirigido por texto, incluso con anclajes de referencia.
- Fija la identidad primero, el estilo después. Si quieres el personaje de referencia pero con un estado de ánimo diferente, mantén la referencia pero impulsa el estilo mediante palabras clave en el prompt.
Empieza a Crear Hoy
PixVerse C1 Reference-to-Video es la respuesta más sólida de la familia PixVerse para video de sujeto consistente a escala — y ahora está a solo una llamada de API de distancia.
Prueba PixVerse C1 Reference-to-Video ahora en WaveSpeedAI y genera video con una identidad en la que puedes confiar.




