← Blog

Presentamos PixVerse C1 Reference-to-Video en WaveSpeedAI

PixVerse C1 reference-to-video — genera videos con consistencia de sujeto y fondo a partir de imágenes de referencia mediante prompts @ref_name. Hasta 1080p, de 1 a 15 segundos.

5 min read
Pixverse Pixverse C1 Reference To Video PixVerse C1 reference-to-video — genera videos con consisten...
Try it

Fija tu Sujeto y Fondo, Genera el Video

Una debilidad persistente en el video con IA ha sido la consistencia del sujeto — genera un clip de “una mujer con abrigo rojo caminando por una calle de París”, y dos segundos después es una mujer diferente con un abrigo diferente. La generación guiada por referencias soluciona esto: tú aportas el sujeto, tú aportas el fondo, y el modelo los compone en video.

Nos complace anunciar que PixVerse C1 Reference-to-Video ya está disponible en WaveSpeedAI — API REST de producción, control preciso de referencias mediante la sintaxis de prompt @ref_name.

¿Qué es PixVerse C1 Reference-to-Video?

PixVerse C1 Reference-to-Video es la variante guiada por referencias del modelo de video insignia PixVerse C1. En lugar de generar únicamente a partir de texto o una sola imagen inicial, subes imágenes de referencia con nombres, y luego las citas en tu prompt usando la sintaxis @ref_name — el modelo compone un video que mantiene el sujeto y el fondo consistentes con lo que subiste.

Ejemplo:

Sube ref_1.png (un personaje específico) y ref_2.png (una playa específica). Prompt: “@ref_1 camina por @ref_2 al atardecer, toma de seguimiento lenta desde atrás.” Resultado: un clip de 10 segundos donde el personaje se parece a ref_1 y el entorno se parece a ref_2, no alguna aproximación de IA.

Esto es muy importante para contenido de marca, narrativa basada en personajes, y cualquier trabajo de propiedad intelectual donde el sujeto debe ser reconocible.

Características Principales

Sintaxis de Prompt @ref_name Referencia múltiples imágenes subidas por nombre en tu prompt. El modelo resuelve cada referencia al recurso subido.

Consistencia de Sujeto + Fondo Mantiene la identidad del personaje y el estilo del entorno fijos durante toda la duración del clip.

Hasta 1080p, 1–15 Segundos El mismo nivel de calidad que el resto de la familia PixVerse C1. Elige entre 360p / 540p / 720p / 1080p.

Múltiples Relaciones de Aspecto Vertical, horizontal, cinematográfico — adapta tu formato de entrega.

Audio Nativo Opcional Activa generate_audio_switch para una entrega en una sola llamada con audio sincronizado.

Casos de Uso Reales

Cortometrajes y Series Web Basadas en Personajes

Produce un protagonista de aspecto consistente a través de una serie de clips — mismo rostro, mismo vestuario, diferentes escenas. Esencial para contenido serial.

Contenido de Marca con Activos de Marca

Sube personajes de marca, logotipos o referencias de productos — el modelo los compone en nuevas escenas de video sin desviaciones.

Storyboarding con Talento Fijo

Previsualiza una escena donde “este actor” se encuentra con “esa ubicación” sin filmar ninguno. Fija ambos mediante imágenes de referencia.

Trabajo de Propiedad Intelectual y Personajes con Licencia

Genera clips de marketing, cinemáticas de juegos o contenido social con un personaje de propiedad intelectual específico, con fidelidad de identidad.

Contenido Educativo e Instructivo

Ancla un instructor o mascota consistente a lo largo de una serie de videos educativos.

Contenido Personalizado a Escala

Aplicaciones que insertan la foto de un usuario (como @ref_user) en escenas cinematográficas — cumpleaños, celebraciones, saludos personalizados.

Cómo Empezar en WaveSpeedAI

  1. Sube tus referencias — una o más imágenes, cada una con una etiqueta ref_name.
  2. Escribe un prompt usando @ref_name para indicar qué referencia aparece dónde.
  3. Elige duración, resolución, relación de aspecto y audio — hasta 15 segundos a 1080p.
  4. Envía — la API de WaveSpeedAI se encarga del resto.

Esquema completo en la página del modelo.

Precios

El precio por segundo escala con la resolución y el audio:

  • 360p: $0.03/seg (sin audio), $0.04/seg (con audio)
  • 540p: $0.04/seg (sin audio), $0.05/seg (con audio)
  • 720p: $0.05/seg (sin audio), $0.065/seg (con audio)
  • 1080p: $0.095/seg (sin audio), $0.12/seg (con audio)

Un clip de 10 segundos a 720p con audio cuesta aproximadamente $0.65.

Por Qué Usar PixVerse C1 Reference-to-Video en WaveSpeedAI

  • Una sola API, más de 890 modelos. Encadena reference-to-video con herramientas de mejora de calidad, sincronización labial y edición.
  • Sin arranques en frío. Latencia de nivel producción.
  • Precio por segundo, sin mínimos.
  • Escala horizontalmente — genera contenido personalizado en lote para grandes audiencias.

Consejos Profesionales

  • Las buenas imágenes de referencia producen buenos resultados. Composición limpia, sujeto único, iluminación clara.
  • Nombra las referencias de forma descriptiva. @heroe y @cafe se leen más claramente en los prompts que @img1 e @img2.
  • Usa múltiples referencias con moderación. 2–3 referencias por prompt produce la composición más limpia; más allá de eso, el modelo dispersa la atención.
  • Describe claramente la acción de la escena — el movimiento sigue siendo dirigido por texto, incluso con anclajes de referencia.
  • Fija la identidad primero, el estilo después. Si quieres el personaje de referencia pero con un estado de ánimo diferente, mantén la referencia pero impulsa el estilo mediante palabras clave en el prompt.

Empieza a Crear Hoy

PixVerse C1 Reference-to-Video es la respuesta más sólida de la familia PixVerse para video de sujeto consistente a escala — y ahora está a solo una llamada de API de distancia.

Prueba PixVerse C1 Reference-to-Video ahora en WaveSpeedAI y genera video con una identidad en la que puedes confiar.