Seedance 2.0 Kompletter Leitfaden: Multimodale Videoerstellung
Seedance 2.0 ist jetzt live auf WaveSpeedAI. Meistern Sie die multimodale Videogenerierung mit diesem umfassenden Leitfaden — kombinieren Sie Bilder, Videos, Audio und Text für präzise Kontrolle über Bewegung, Stil und Storytelling.
Jetzt live auf WaveSpeedAI. Alle 14 Seedance 2.0-Endpunkte sind verfügbar – Standard- und Fast-Stufen mit Turbo-Varianten für Runs mit geringer Latenz.
Standard: T2V · I2V · T2V Turbo · I2V Turbo · Video Edit · Video Edit Turbo · Video Extend
Fast: T2V · I2V · T2V Turbo · I2V Turbo · Video Edit · Video Edit Turbo · Video Extend
10 % Launch-Rabatt gilt bis zum 13. Mai (UTC+0).
Seedance 2.0 stellt einen grundlegenden Wandel in der KI-Videogenerierung dar. Anstatt sich ausschließlich auf Textprompts oder einzelne Referenzbilder zu verlassen, akzeptiert dieses Modell Bilder, Videos, Audio und Text als Eingaben – so können Sie jeden Aspekt Ihrer Kreation wie ein echter Filmemacher steuern.
Das herausragende Merkmal ist seine Referenzfähigkeit: Sie können den visuellen Stil mit einem Bild festlegen, Bewegung und Kameraarbeit mit einem Video bestimmen, den Rhythmus mit Audio antreiben und die Handlung mit Text lenken. Das Ergebnis ist ein Kontrollniveau, das bei der generativen Videoproduktion bisher nicht möglich war.
Kurzübersicht
| Parameter | Spezifikation |
|---|---|
| Bildeingaben | Bis zu 9 Bilder |
| Videoeingaben | Bis zu 3 Videos, max. 15 s gesamt |
| Audioeingaben | Bis zu 3 MP3-Dateien, max. 15 s gesamt |
| Texteingabe | Prompts in natürlicher Sprache |
| Ausgabedauer | 4–15 Sekunden (vom Nutzer wählbar) |
| Audioausgabe | Native Soundeffekte und Musik |
| Gesamtdateilimit | 12 Dateien pro Generierung |
Priorisieren Sie beim Arbeiten mit mehreren Dateien die Assets, die den größten Einfluss auf Ihr Endergebnis haben – sei es ein Referenzvideo für Bewegung oder ein Bild für Charakterkonsistenz.
Verwendung von Referenzen
Seedance 2.0 verwendet ein @-Erwähnungssystem, um festzulegen, wie jedes hochgeladene Asset genutzt werden soll. Damit haben Sie explizite Kontrolle darüber, was jede Datei zur Generierung beiträgt.
Einstiegspunkte
- Erstes/Letztes-Frame-Modus: Verwenden, wenn Sie nur ein Startbild plus einen Prompt benötigen
- Universeller Referenzmodus: Für multimodale Kombinationen (Bilder + Videos + Audio + Text)
Die @-Syntax
Referenzieren Sie nach dem Hochladen von Dateien diese in Ihrem Prompt mit @ gefolgt von der Dateikennung:
@Image1 als erstes Frame, @Video1 als Referenz für Kamerabewegung,
@Audio1 für Hintergrundmusik verwenden
Beispiele für Referenzanweisungen
| Anwendungsfall | Prompt-Muster |
|---|---|
| Erstes Frame festlegen | @Image1 als erstes Frame |
| Bewegung referenzieren | @Video1 als Referenz für die Kampfchoreografie |
| Kameraarbeit übernehmen | Kamerabewegungen und Übergänge von @Video1 folgen |
| Musik/Rhythmus hinzufügen | @Audio1 für die Hintergrundmusik verwenden |
| Video verlängern | @Video1 um 5 Sekunden verlängern |
| Charakter ersetzen | Die Frau in @Video1 durch @Image1 ersetzen |
Kernfähigkeiten
1. Verbesserte Basisqualität
Seedance 2.0 liefert erhebliche Verbesserungen bei der grundlegenden Generierungsqualität:
- Physikgenauigkeit: Objekte fallen, kollidieren und interagieren nach realen Gesetzmäßigkeiten
- Flüssige Bewegung: Natürliche Bewegung mit korrektem Schwung und Timing
- Präzise Anweisungsausführung: Das Modell versteht und führt komplexe Prompts aus
- Stilkonsistenz: Visuelle Kohärenz bleibt im gesamten Video erhalten
Beispielprompt:
Ein Mädchen hängt elegant Wäsche auf, nimmt ein Stück nach dem anderen
aus dem Korb und schüttelt es kräftig aus.
Das Modell bewältigt die kontinuierliche Handlung, die Stoff-Physik und die natürliche Körpermechanik ohne explizite Anleitung.
2. Multimodales Referenzsystem
Dies ist das bestimmende Merkmal von Seedance 2.0. Sie können nahezu alles aus Ihren hochgeladenen Assets referenzieren:
- Bewegungsmuster aus Referenzvideos
- Visuelle Effekte und Übergänge aus kreativen Vorlagen
- Charaktererscheinungen aus Referenzbildern
- Kameratechniken aus kinematografischen Beispielen
- Audiorhythmus und -stimmung aus Musiktracks
Grundprinzip: Beschreiben Sie mit natürlicher Sprache, was Sie referenzieren möchten. Geben Sie genau an, welches Element (Bewegung, Stil, Kamera, Charakter) aus welcher Datei entnommen werden soll.
3. Charakter- und Objektkonsistenz
Frühere Modelle hatten Schwierigkeiten, Identitäten über Frames hinweg beizubehalten. Seedance 2.0 geht dieses Problem direkt an:
- Gesichtskonsistenz: Charaktere behalten ihr Erscheinungsbild durchgehend bei
- Produktdetailerhaltung: Logos, Text und feine Details bleiben korrekt
- Szenenkohärenz: Umgebungen bleiben über Einstellungen hinweg konsistent
- Stilsperre: Der visuelle Stil driftet während der Generierung nicht ab
Beispielprompt:
Mann @Image1 kommt müde von der Arbeit nach Hause, geht den Flur entlang
und verlangsamt seinen Schritt, bleibt an der Haustür stehen. Nahaufnahme
seines Gesichts, als er tief durchatmet und seinen Ausdruck von gestresst
zu entspannt verändert. Nahaufnahme davon, wie er seinen Schlüssel findet
und ihn ins Schloss steckt. Er betritt das Haus und seine Tochter sowie
sein Hund laufen ihm entgegen und umarmen ihn. Das Innere ist warm und
gemütlich, mit natürlichen Dialogen durchgehend.
4. Bewegungs- und Kamerareplikation
Laden Sie ein Referenzvideo hoch, und Seedance 2.0 kann Folgendes extrahieren und anwenden:
- Komplexe Choreografien: Kampfsequenzen, Tanzbewegungen, Actionszenen
- Kameratechniken: Dolly-Shots, Tracking, Kranfahrten, Handkamera-Gefühl
- Schnittrhythmus: Schnitttiming, Übergangsstile, Pacing
- Spezielle Bewegungen: Hitchcock-Zoom, Whip-Pans, Orbit-Shots
Beispielprompt:
@Image1 als Referenz für das Erscheinungsbild des Mannes in @Image2s
Aufzugssetting. @Video1s Kamerabewegungen und die Gesichtsausdrücke des
Protagonisten vollständig replizieren. Hitchcock-Zoom bei Erschrecken,
dann mehrere Orbit-Shots im Aufzug. Türen öffnen, Tracking-Shot folgt
ihm hinaus. Außenszene referenziert @Image3, Mann schaut sich um.
Referenz zu @Video1s mechanischem Arm mit Mehrwinkel-Verfolgungsshots,
die seine Blicklinie verfolgen.
5. Kreative Vorlagenreplikation
Über Bewegung hinaus können Sie ganze kreative Konzepte replizieren:
- Werbeformate: Produktvorstellungen, Lifestyle-Montagen, Markengeschichten
- Visuelle Effekte: Partikelsysteme, Morphing, stilisierte Übergänge
- Filmtechniken: Eröffnungssequenzen, Titelkarten, dramatische Enthüllungen
- Schnittstile: Musikvideo-Cuts, Dokumentarpacing, Werberhythmus
Beispielprompt:
Die Person in @Video1 durch das Mädchen in @Image1 ersetzen. Die
Mondgöttin-CG durch einen Engel ersetzen, der @Image2 referenziert.
Wenn das Mädchen sich duckt, wachsen ihr Flügel aus dem Rücken.
Flügel schwingen an der Kamera vorbei als Übergang. @Video1s Kameraarbeit
und Übergänge referenzieren. In die nächste Szene durch die Pupille des
Engels eintreten, Vogelperspektive des Engels (spiralförmige Flügel
entsprechen der Pupille), Kamera senkt sich dem Gesicht des Engels folgend,
zieht sich beim Heben des Arms zurück, um die steinernen Engelstatuen im
Hintergrund zu enthüllen. Eine durchgehende Einstellung.
6. Videoverlängerung
Verlängern Sie bestehende Videos unter Beibehaltung der narrativen Kohärenz:
Beispielprompt:
@Video1 um 15 Sekunden verlängern. @Image1 und @Image2 als Referenz für
den Esel-auf-Motorrad-Charakter. Eine wilde Werbesequenz hinzufügen:
Szene 1: Seitenansicht, Esel bricht auf dem Motorrad durch einen Zaun,
nahegelegene Hühner erschrecken.
Szene 2: Esel führt Drehstunts auf Sand aus, Reifennahaufnahme, dann
Vogelperspektive des Esels, der Kreise dreht, aufsteigender Staub.
Szene 3: Bergkulisse, Esel springt von Hang, Werbetext erscheint dahinter
durch Masking-Effekt (Text wird enthüllt, wenn Esel passiert): „Kreativität
inspirieren, Leben bereichern". Abschlusseinstellung: Motorrad fährt vorbei,
Staubwolke steigt auf.
7. Videobearbeitung
Vorhandene Videos modifizieren, ohne von Grund auf neu zu generieren:
- Charakteraustausch: Eine Person gegen eine andere tauschen, während die Aktion erhalten bleibt
- Elemente hinzufügen/entfernen: Objekte hinzufügen, Ablenkungen entfernen
- Stilübertragung: Neue visuelle Behandlungen anwenden
- Narrative Änderungen: Die Handlungsrichtung verändern
Beispielprompt:
Die Handlung von @Video1 umkehren. Der Ausdruck des Mannes wechselt
sofort von zärtlich zu kalt und gnadenlos. In dem Moment, in dem die
Frau es am wenigsten erwartet, stößt er sie von der Brücke ins Wasser.
Der Stoß ist entschlossen, vorsätzlich, ohne Zögern – das romantische
Charakterbild wird vollständig umgekehrt. Als sie fällt, kein Schrei,
nur Unglaube in ihren Augen. Sie taucht auf und ruft ihm zu: „Du hast
mich von Anfang an belogen!" Er steht auf der Brücke mit einem kalten
Lächeln und sagt leise: „Das ist, was deine Familie meiner schuldet."
8. Audiosynchronisierte Generierung
Seedance 2.0 generiert Videos mit nativem Audio und kann mit Referenzaudio synchronisieren:
- Lippensynchronisierte Dialoge in mehreren Sprachen
- Soundeffekte, die zu den Bildschirmaktionen passen
- Hintergrundmusik, die dem visuellen Rhythmus folgt
- Sprachausgabe mit emotionalem Ausdruck
Beispielprompt:
Feste Einstellung. Fischauge-Objektiv schaut durch kreisförmige Öffnung
nach unten. @Video1s Fischauge-Effekt referenzieren. Das Pferd aus @Video2
dazu bringen, durch das Fischauge-Objektiv nach oben zu schauen. @Video1s
Sprechbewegung referenzieren. Hintergrundaudio referenziert @Video3s
Soundeffekte.
9. Beatgesteuerte Bearbeitung
Erstellen Sie musikvideo-artigen Inhalt, der die Beats trifft:
Beispielprompt:
Das Mädchen im Poster wechselt ständig die Outfits. Kleidungsstile
referenzieren @Image1 und @Image2. Sie hält die Tasche aus @Image3.
Videorhythmus referenziert @Video1.
Für mehrere Bilder synchronisiert mit Musik:
Bilder @Image1 bis @Image7 schneiden auf die Keyframe-Positionen
und den Gesamtrhythmus von @Video1. Charaktere im Bild sind dynamischer.
Gesamtstil ist traumhafter. Starke visuelle Wirkung. Referenzbildausschnitt
nach Bedarf für Musik und visuellen Fluss anpassen. Lichtveränderungen
zwischen Einstellungen hinzufügen.
10. Kontinuität in einer Einstellung
Lange, ununterbrochene Einstellungen mit konsistenter Bewegung generieren:
Beispielprompt:
@Image1 bis @Image5, ein durchgehender Tracking-Shot folgt einem Läufer
Treppen hinauf, durch Korridore, auf das Dach, mit Draufsicht der Stadt
als Abschluss.
Beispielprompt:
Spionage-Thriller-Stil. @Image1 als erstes Frame. Frontal-Tracking-Shot
einer Frau im roten Mantel, die nach vorne geht. Totale folgt ihr.
Fußgänger verdecken wiederholt das Bild. Sie erreicht eine Ecke,
@Image2s Eckenarchitektur referenzieren. Feste Einstellung, während Frau
aus dem Bild tritt und um die Ecke verschwindet. Ein maskiertes Mädchen
lauert an der Ecke und beobachtet bösartig; Erscheinung des Maskenmädchens
referenziert @Image3 (nur Erscheinung, sie steht an der Ecke). Kamera
schwenkt vorwärts zur Frau in Rot. Sie betritt ein Herrenhaus und
verschwindet. Herrenhaus referenziert @Image4. Keine Schnitte.
Eine durchgehende Einstellung.
Kreative Anwendungen
Werbung und E-Commerce
Erstellen Sie Produktdemonstrationen mit synchronisierter Kommentierung, Lifestyle-Shots und Marken-Storytelling. Das multimodale System ermöglicht es Ihnen, bestehende Marken-Assets zu referenzieren, während Sie neue Inhalte generieren.
Inhaltslokalisierung
Generieren Sie mehrsprachige Videoanpassungen mit nativem Lippensync. Referenzieren Sie das Originalvideo für die Bewegung und generieren Sie neue Dialoge in verschiedenen Sprachen.
Storyboard zu Video
Konvertieren Sie statische Storyboard-Panels in animierte Sequenzen. Laden Sie Ihre Boards als Referenzbilder hoch und beschreiben Sie die Bewegung zwischen ihnen.
Vorlagenbasierte Erstellung
Finden Sie einen Videostil, der Ihnen gefällt, laden Sie ihn als Referenz hoch und generieren Sie neue Inhalte in diesem Stil mit Ihren eigenen Charakteren und Einstellungen.
Best Practices
-
Referenzen explizit angeben: Schreiben Sie klar, welche Datei für welchen Zweck ist. „@Video1s Kamerabewegung referenzieren” ist besser als nur das Video zu erwähnen.
-
Uploads priorisieren: Wählen Sie bei einem Limit von 12 Dateien Assets, die den größten Einfluss auf Ihr Ergebnis haben.
-
@-Erwähnungen überprüfen: Bei mehreren Dateien doppelt prüfen, dass Sie nicht vertauscht haben, welches Bild, Video oder Audio wohin gehört.
-
Bearbeiten vs. Referenzieren angeben: Klarmachen, ob Sie ein vorhandenes Video bearbeiten oder es als Referenz für die Generierung von etwas Neuem verwenden möchten.
-
Dauerabstimmung: Beim Verlängern von Videos die Generierungsdauer auf die neue Inhaltslänge einstellen (z. B. um 5 s verlängern = 5 s generieren).
-
Natürliche Sprache verwenden: Das Modell versteht Kontext. Beschreiben Sie, was Sie möchten, wie Sie es einem menschlichen Editor erklären würden.
Jetzt ausprobieren
Seedance 2.0 ist heute auf WaveSpeedAI live. Wählen Sie die Variante, die zu Ihrer Arbeitslast passt:
- Höchste Wiedergabetreue — Seedance 2.0 T2V / I2V
- Niedrigste Latenz — Seedance 2.0 Fast T2V Turbo / I2V Turbo
- Vorhandenes Material bearbeiten — Video Edit / Video Extend
Der 10 % Launch-Rabatt gilt bis zum 13. Mai (UTC+0). Die vollständige Auswahl finden Sie auf der Seedance 2.0-Sammlungsseite.
Was als Nächstes kommt
Die multimodalen Fähigkeiten von Seedance 2.0 entwickeln sich kontinuierlich weiter. Wir werden diesen Leitfaden aktualisieren, sobald neue Funktionen und Eingabekombinationen verfügbar werden.
Wenn Sie auf Probleme stoßen oder Funktionswünsche haben, freuen wir uns über Ihr Feedback – so verbessern wir das Tool für alle.
Benötigen Sie weniger Inhaltsbeschränkungen für eine bestimmte Einstellung? Probieren Sie diese Alternativen auf WaveSpeedAI:
WAN 2.7 | Veo 3.1 Fast T2V | Veo 3.1 Fast I2V | Sora 2 T2V | Sora 2 I2V | Kling | Vidu
