Guía Completa de Seedance 2.0: Creación de Video Multimodal
Seedance 2.0 ya está disponible en WaveSpeedAI. Domina su generación de video multimodal con esta guía completa: combina imágenes, videos, audio y texto para un control preciso sobre el movimiento, el estilo y la narrativa.
Ya disponible en WaveSpeedAI. Los 14 endpoints de Seedance 2.0 están disponibles — niveles Standard y Fast, con variantes Turbo para ejecuciones de baja latencia.
Standard: T2V · I2V · T2V Turbo · I2V Turbo · Video Edit · Video Edit Turbo · Video Extend
Fast: T2V · I2V · T2V Turbo · I2V Turbo · Video Edit · Video Edit Turbo · Video Extend
10% de descuento de lanzamiento válido hasta el 13 de mayo (UTC+0).
Seedance 2.0 representa un cambio fundamental en la generación de video con IA. En lugar de basarse únicamente en indicaciones de texto o imágenes de referencia individuales, este modelo acepta imágenes, videos, audio y texto como entradas, lo que te permite dirigir cada aspecto de tu creación como un verdadero cineasta.
La característica más destacada es su capacidad de referencia: puedes establecer el estilo visual con una imagen, especificar el movimiento y el trabajo de cámara con un video, marcar el ritmo con audio y guiar la narrativa con texto. El resultado es un nivel de control que antes era imposible en el video generativo.
Especificaciones Rápidas
| Parámetro | Especificación |
|---|---|
| Entradas de imagen | Hasta 9 imágenes |
| Entradas de video | Hasta 3 videos, máximo 15 s en total |
| Entradas de audio | Hasta 3 archivos MP3, máximo 15 s en total |
| Entrada de texto | Indicaciones en lenguaje natural |
| Duración de salida | 4–15 segundos (seleccionable por el usuario) |
| Salida de audio | Efectos de sonido y música nativos |
| Límite total de archivos | 12 archivos por generación |
Al trabajar con varios archivos, prioriza los recursos que tengan mayor impacto en tu resultado final, ya sea un video de referencia para el movimiento o una imagen para la coherencia del personaje.
Cómo Usar las Referencias
Seedance 2.0 utiliza un sistema de menciones con @ para especificar cómo debe usarse cada recurso cargado. Esto te da control explícito sobre lo que cada archivo aporta a la generación.
Puntos de Entrada
- Modo de primer/último fotograma: Úsalo cuando solo necesitas una imagen inicial más una indicación
- Modo de referencia universal: Úsalo para combinaciones multimodales (imágenes + videos + audio + texto)
La Sintaxis @
Después de cargar los archivos, referencialos en tu indicación usando @ seguido del identificador del archivo:
@Image1 como primer fotograma, referencia @Video1 para el movimiento de cámara,
usa @Audio1 para la música de fondo
Ejemplos de Instrucciones de Referencia
| Caso de uso | Patrón de indicación |
|---|---|
| Establecer primer fotograma | @Image1 como primer fotograma |
| Referenciar movimiento | Referencia @Video1 para la coreografía de la pelea |
| Copiar trabajo de cámara | Sigue los movimientos de cámara y transiciones de @Video1 |
| Añadir música/ritmo | Usa @Audio1 para la música de fondo |
| Extender un video | Extiende @Video1 en 5 segundos |
| Reemplazar personaje | Reemplaza a la mujer en @Video1 con @Image1 |
Capacidades Principales
1. Calidad Base Mejorada
Seedance 2.0 ofrece mejoras significativas en la calidad de generación fundamental:
- Precisión física: Los objetos caen, colisionan e interactúan según las reglas del mundo real
- Movimiento fluido: Movimiento natural con impulso y temporización adecuados
- Seguimiento preciso de instrucciones: El modelo comprende y ejecuta indicaciones complejas
- Coherencia de estilo: Mantiene la coherencia visual a lo largo del video
Ejemplo de indicación:
Una chica colgando la ropa con elegancia, terminando una prenda y metiendo
la mano en la cesta para coger otra, sacudiéndola con firmeza.
El modelo maneja la acción continua, la física de la tela y la mecánica corporal natural sin necesidad de orientación explícita.
2. Sistema de Referencia Multimodal
Esta es la característica definitoria de Seedance 2.0. Puedes referenciar prácticamente cualquier cosa de tus recursos cargados:
- Patrones de movimiento de videos de referencia
- Efectos visuales y transiciones de plantillas creativas
- Apariencia de personajes de imágenes de referencia
- Técnicas de cámara de ejemplos cinematográficos
- Ritmo y estado de ánimo del audio de pistas musicales
Principio clave: Usa lenguaje natural para describir lo que quieres referenciar. Sé específico sobre qué elemento (movimiento, estilo, cámara, personaje) debe extraerse de qué archivo.
3. Consistencia de Personajes y Objetos
Los modelos anteriores tenían dificultades para mantener la identidad entre fotogramas. Seedance 2.0 aborda esto directamente:
- Consistencia facial: Los personajes mantienen su apariencia a lo largo del video
- Preservación de detalles del producto: Los logotipos, textos y detalles finos permanecen precisos
- Coherencia de escena: Los entornos se mantienen consistentes entre planos
- Bloqueo de estilo: El estilo visual no se desvía durante la generación
Ejemplo de indicación:
El hombre @Image1 llega a casa cansado del trabajo, camina por el pasillo
reduciendo el paso, se detiene ante la puerta principal. Primer plano de su cara
mientras toma una respiración profunda, ajusta su expresión de estresado
a relajado. Primer plano de él encontrando sus llaves, insertándolas en
la cerradura. Entra y su hija y su perro corren a recibirle
con un abrazo. El interior es cálido y acogedor, con diálogos naturales
a lo largo de toda la escena.
4. Replicación de Movimiento y Cámara
Sube un video de referencia y Seedance 2.0 puede extraer y aplicar:
- Coreografías complejas: Secuencias de pelea, movimientos de baile, escenas de acción
- Técnicas de cámara: Travellings, seguimientos, movimientos de grúa, efecto de mano alzada
- Ritmo de edición: Temporización de cortes, estilos de transición, ritmo
- Movimientos especiales: Zoom Hitchcock, barridos, planos orbitales
Ejemplo de indicación:
Referencia @Image1 para la apariencia del hombre en el entorno del ascensor
de @Image2. Replica completamente los movimientos de cámara de @Video1 y las
expresiones faciales del protagonista. Zoom Hitchcock al asustarse,
luego varios planos orbitales dentro del ascensor. Las puertas se abren, plano
de seguimiento que lo acompaña al salir. La escena exterior referencia @Image3, el hombre
mira a su alrededor. Referencia los planos de seguimiento multi-ángulo del brazo mecánico
de @Video1 que rastrean su línea de visión.
5. Replicación de Plantillas Creativas
Más allá del movimiento, puedes replicar conceptos creativos completos:
- Formatos publicitarios: Presentaciones de productos, montajes de estilo de vida, historias de marca
- Efectos visuales: Sistemas de partículas, morphing, transiciones estilizadas
- Técnicas cinematográficas: Secuencias de apertura, títulos, revelaciones dramáticas
- Estilos de edición: Cortes de videoclip, ritmo documental, cadencia comercial
Ejemplo de indicación:
Reemplaza a la persona en @Video1 con la chica en @Image1. Reemplaza
el CG de la diosa de la luna con un ángel que referencia @Image2. Cuando la
chica se agacha, le crecen alas en la espalda. Las alas barren la cámara
para hacer la transición. Referencia el trabajo de cámara y las transiciones de @Video1.
Entra en la siguiente escena a través de la pupila del ángel, plano aéreo del
ángel (las alas en espiral coinciden con la pupila), la cámara desciende
siguiendo la cara del ángel, se aleja al levantar el brazo para revelar
las estatuas de ángeles de piedra al fondo. Un plano continuo
en todo momento.
6. Extensión de Video
Extiende videos existentes manteniendo la coherencia narrativa:
Ejemplo de indicación:
Extiende @Video1 en 15 segundos. Referencia @Image1 y @Image2 para
el personaje del burro en moto. Añade una secuencia de anuncio alocado:
Escena 1: Plano lateral, el burro irrumpe por la valla en moto,
las gallinas cercanas se asustan.
Escena 2: El burro realiza acrobacias giratorias sobre la arena, primer plano
del neumático y luego plano aéreo cenital del burro haciendo círculos, levantando polvo.
Escena 3: Fondo de montaña, el burro salta por una pendiente, el texto del anuncio
aparece detrás mediante efecto de máscara (texto revelado al pasar el burro):
"Inspira la creatividad, enriquece la vida". Plano final: la moto pasa,
se levanta una nube de polvo.
7. Edición de Video
Modifica videos existentes sin regenerarlos desde cero:
- Reemplazo de personajes: Intercambia una persona por otra manteniendo la acción
- Adición/eliminación de elementos: Añade objetos, elimina distracciones
- Transferencia de estilo: Aplica nuevos tratamientos visuales
- Cambios narrativos: Altera la dirección de la historia
Ejemplo de indicación:
Subvierte la trama de @Video1. La expresión del hombre cambia al instante
de tierna a fría y despiadada. En el momento en que la mujer menos se lo espera,
la empuja del puente al agua. El empujón es decisivo, premeditado, sin vacilación,
subvirtiendo completamente la configuración del personaje romántico. Al caer,
no hay grito, solo incredulidad en sus ojos. Ella sale a la superficie y le grita:
"¡Me estabas mintiendo desde el principio!" Él se queda en el puente con una sonrisa fría
y dice en voz baja: "Esto es lo que tu familia le debe a la mía."
8. Generación Sincronizada con Audio
Seedance 2.0 genera videos con audio nativo y puede sincronizarse con audio de referencia:
- Sincronización de labios en múltiples idiomas
- Efectos de sonido sincronizados con las acciones en pantalla
- Música de fondo siguiendo el ritmo visual
- Actuación de voz con expresión emocional
Ejemplo de indicación:
Plano fijo. Objetivo ojo de pez mirando hacia abajo a través de una apertura circular.
Referencia el efecto ojo de pez de @Video1. Haz que el caballo de @Video2
mire hacia arriba al objetivo ojo de pez. Referencia el movimiento al hablar de @Video1.
El audio de fondo referencia los efectos de sonido de @Video3.
9. Edición Sincronizada con el Ritmo
Crea contenido al estilo de videoclip que golpea en los tiempos:
Ejemplo de indicación:
La chica del póster cambia de atuendo continuamente. Los estilos de ropa
referencian @Image1 y @Image2. Lleva el bolso de @Image3.
El ritmo del video referencia @Video1.
Para varias imágenes sincronizadas con música:
Las imágenes @Image1 a @Image7 se cortan en las posiciones de fotograma clave
y el ritmo general de @Video1. Los personajes en el encuadre son más
dinámicos. El estilo general es más onírico. Fuerte impacto visual.
Ajusta el encuadre de las imágenes de referencia según sea necesario para el flujo musical y visual.
Añade cambios de iluminación entre planos.
10. Continuidad en Una Sola Toma
Genera planos largos e ininterrumpidos con movimiento consistente:
Ejemplo de indicación:
@Image1 a @Image5, un plano de seguimiento continuo que sigue
a un corredor subiendo escaleras, por pasillos, hasta el tejado, terminando
con una vista cenital de la ciudad.
Ejemplo de indicación:
Estilo thriller de espías. @Image1 como primer fotograma. Plano de seguimiento frontal
de una mujer en abrigo rojo caminando hacia adelante. Plano entero siguiéndola.
Los peatones bloquean el encuadre repetidamente. Llega a una esquina,
referencia la arquitectura de la esquina de @Image2. Plano fijo mientras la mujer
sale del encuadre, desaparece al doblar la esquina. Una chica enmascarada acecha en
la esquina mirando con malicia, la apariencia de la chica enmascarada referencia @Image3
(solo apariencia, ella está en la esquina). La cámara avanza hacia la mujer de rojo.
Ella entra en una mansión y desaparece. La mansión referencia @Image4. Sin cortes. Una toma continua.
Aplicaciones Creativas
Publicidad y Comercio Electrónico
Crea demostraciones de productos con narración sincronizada, planos de estilo de vida e historias de marca. El sistema multimodal te permite referenciar recursos de marca existentes mientras generas contenido nuevo.
Localización de Contenido
Genera adaptaciones de video en múltiples idiomas con sincronización de labios nativa. Referencia el video original para el movimiento mientras generas nuevos diálogos en diferentes idiomas.
De Guion Gráfico a Video
Convierte paneles de guion gráfico estáticos en secuencias animadas. Sube tus tableros como imágenes de referencia y describe el movimiento entre ellos.
Creación Basada en Plantillas
Encuentra un estilo de video que te guste, súbelo como referencia y genera nuevo contenido en ese estilo con tus propios personajes y escenarios.
Mejores Prácticas
-
Sé explícito con las referencias: Escribe claramente qué archivo es para qué propósito. “Referencia el movimiento de cámara de @Video1” es mejor que simplemente mencionar el video.
-
Prioriza tus cargas: Con un límite de 12 archivos, elige los recursos que tengan mayor impacto en tu resultado.
-
Comprueba tus menciones @: Con varios archivos, verifica que no hayas confundido qué imagen, video o audio va dónde.
-
Especifica edición frente a referencia: Deja claro si quieres editar un video existente o usarlo como referencia para generar algo nuevo.
-
Alineación de duración: Al extender un video, establece la duración de generación para que coincida con la longitud del nuevo contenido (p. ej., extender 5 s = generar 5 s).
-
Usa lenguaje natural: El modelo entiende el contexto. Describe lo que quieres como lo harías con un editor humano.
Pruébalo Ahora
Seedance 2.0 está disponible hoy en WaveSpeedAI. Elige la variante que se ajuste a tu carga de trabajo:
- Mayor fidelidad — Seedance 2.0 T2V / I2V
- Menor latencia — Seedance 2.0 Fast T2V Turbo / I2V Turbo
- Edición de material existente — Video Edit / Video Extend
El 10% de descuento de lanzamiento está vigente hasta el 13 de mayo (UTC+0). Explora la colección completa en la página de colección de Seedance 2.0.
Próximos Pasos
Las capacidades multimodales de Seedance 2.0 continúan evolucionando. Actualizaremos esta guía a medida que estén disponibles nuevas funciones y combinaciones de entradas.
Si encuentras problemas o tienes solicitudes de funciones, agradecemos tus comentarios: así es como mejoramos la herramienta para todos.
¿Necesitas menos restricciones de contenido para un plano específico? Prueba estas alternativas en WaveSpeedAI:
WAN 2.7 | Veo 3.1 Fast T2V | Veo 3.1 Fast I2V | Sora 2 T2V | Sora 2 I2V | Kling | Vidu
