VEO 3.1 está llegando: generación más larga y consistencia perfecta

SORA 2.0 llegará pronto.

Mientras esperamos el modelo VEO 3.1, te recomendamos usar el modelo compatible de Veo 3.1, Sora 2.

Pruébalo

Texto a video
Imagen a video
Texto a video Pro
Imagen a video Pro
Indicaciones
Crear

Características clave

Un simulador del mundo más inteligente

Sora 2 entiende cómo funciona el mundo real. A diferencia de los modelos antiguos que distorsionan la realidad, respeta la física: cuando un jugador falla, la pelota rebota de forma natural y no se teletransporta mágicamente. Además, el modelo marca un gran avance en control, capaz de seguir indicaciones complejas de múltiples tomas mientras mantiene un estado del mundo coherente y consistente.

Comenzar

Prompt

A gymnast flips on a balance beam.

Final outcome

Precisión física superior que refleja el mundo real

Los modelos tradicionales de video con IA a menudo fallan en el realismo del movimiento: piensa en manos deformadas, extremidades que desafían la física y objetos flotantes. Sora 2 cambia eso. Ofrece movimientos sorprendentemente realistas, simulando con precisión cómo se mueven las personas, cómo interactúan los objetos y cómo el impulso recorre una escena. Sin objetos flotantes ni fallos: solo física que se siente real.

Comenzar

Prompt

A man does a backflip on a paddleboard.
A dalmatian deftly walks runs and hops his way through a complex obstacle course in burano italy.
A man rides a horse which is on another horse.
In the style of a studio ghibli anime, a boy and his dog run up a grassy scenic mountain with gorgeous clouds, overlooking a village in the distant background.

Image

Video con sonido: verdadera generación multimodal

Sora 2 no se detiene en lo visual; también escucha. Genera video y audio sincronizados según diálogo, sonido ambiental y música. Con simples indicaciones de texto natural, los usuarios pueden generar historias de múltiples escenas con control total sobre el movimiento de cámara, la iluminación y las transiciones. Además, puede manejar fondos y sonido sofisticados. En el siguiente caso, compáralo con otros modelos para ver los efectos más recientes.

Comenzar

Prompt

underwater scuba diver, sounds of the coral reef.
Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time

Image

Use cases

Movie Trailer: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...

2D Animation: In the style of a Japanese anime, the hero with white hair awakens his dormant powers. his body is enveloped in a blue and black fiery aura and markings grow to cover his face and body, a deep ancient power finally awakened...Ghibli and Makoto Shinkai art styles.

Clay animation: A claymation conductor conducts a claymation orchestra

Lecture: old professor talks in english then german

Documentary: Underwater scuba diver, sounds of the coral reef

Sports shorts: skateboarder does a kickflip

Q&A

¿Qué es Sora 2? ¿Cuál es el cambio más fundamental respecto a la generación anterior?
Sora 2 es el último modelo de generación de video y audio de OpenAI. Hace hincapié en un comportamiento físico más preciso, mayor realismo y mayor control, y por primera vez sincroniza diálogo y efectos de sonido con lo visual de forma predeterminada. Es un cambio real respecto al paradigma anterior de “video silencioso”.
¿Puede Sora 2 generar videos con diálogo inmediatamente?
Sí. El audio y el video se generan juntos. Si incluyes líneas, efectos de sonido o ambiente en tu indicación, el modelo intentará materializarlos.
¿Qué entradas se admiten? ¿Puedo hacer imagen a video o video a video?
Las indicaciones pueden partir de texto o de imágenes.
¿En qué se diferencia Sora 2 Pro de la versión regular?
La versión Pro apunta a mayor fidelidad y tomas más complejas, con tiempos de generación potencialmente más largos. Los usuarios de ChatGPT Pro y de la API se incorporarán gradualmente.
Sora2