- Blog | Sora 2 Video Generator
- Sora 2 Prompting Guide: Die Kunst der Videogenerierung meistern
Sora 2 Prompting Guide: Die Kunst der Videogenerierung meistern
Einführung
Sora 2 stellt einen bedeutenden Sprung in der KI-Videogenerierung dar und bietet beispiellose Kontrolle über Physik, Beleuchtung und Bewegung. Um jedoch das volle Potenzial auszuschöpfen, müssen wir unsere Denkweise beim Prompting ändern.
Betrachten Sie das Prompting für Sora 2 nicht als Suche nach einem Video, sondern als Briefing einer professionellen Filmcrew. Sie sind der Regisseur, und das Modell ist Ihr Kameramann, Beleuchter und Szenenbildner in einem. Wenn Sie Details weglassen, werden sie improvisieren – oft wunderschön, aber vielleicht nicht so, wie Sie es beabsichtigt haben. Um genau das zu bekommen, was Sie wollen, müssen Sie die Sprache des Films sprechen.
Es kann jedoch genauso wirkungsvoll sein, einige Details offen zu lassen. Dem Modell mehr kreative Freiheit zu geben, kann zu überraschenden Variationen und unerwarteten, schönen Interpretationen führen. Beide Ansätze sind valide: Detaillierte Prompts geben Ihnen Kontrolle und Konsistenz, während leichtere Prompts Raum für kreative Ergebnisse öffnen. Die richtige Balance hängt von Ihren Zielen und dem gewünschten Ergebnis ab.
Am wichtigsten ist, seien Sie bereit zu iterieren. Kleine Änderungen an Kamera, Beleuchtung oder Handlung können das Ergebnis dramatisch verändern. Arbeiten Sie mit dem Modell zusammen: Sie geben die Richtung vor, und das Modell liefert kreative Variationen.
Dieser Leitfaden fasst Best Practices, Vorlagenstrukturen und fortgeschrittene Techniken von Branchenexperten zusammen, um Ihnen zu helfen, bessere Prompts für Sora 2 zu schreiben.
1. Die Kernphilosophie: "Briefing der Crew"
Ein starker Prompt muss spezifische Fragen für die KI-"Crew" beantworten:
- Das Subjekt: Wen oder was filmen wir?
- Die Handlung: Was passiert? (Beschreiben Sie in "Beats")
- Die Kamera: Wo ist die Kamera? Wie bewegt sie sich? (Objektiv, Winkel, Bewegung)
- Die Beleuchtung & der Look: Was ist die Stimmung? (Farbpalette, Lichtquelle)
- Der Ton: Was hören wir? (Ambiente, Foley, Dialog)
2. Anatomie eines perfekten Prompts
Ein strukturierter Prompt liefert konsistente Ergebnisse. Beschreiben Sie eine Einstellung, als würden Sie sie auf ein Storyboard skizzieren. Geben Sie den Kameraausschnitt an, notieren Sie die Schärfentiefe, beschreiben Sie die Handlung in Beats und legen Sie Beleuchtung und Palette fest. Die Verankerung Ihres Subjekts mit einigen markanten Details hält es erkennbar, während eine einzelne, plausible Handlung die Einstellung leichter nachvollziehbar macht.
Vermeiden Sie Textwände; organisieren Sie Ihren Prompt stattdessen in logische Abschnitte.
Die Struktur
- Format & Stil: Etablieren Sie das Medium (z. B. "35mm-Film", "Digital IMAX", "Handgezeichnete Animation").
- Subjekt & Schauplatz: Konkrete Beschreibungen des Hauptfokus und Hintergrunds.
- Kameraführung: Kamerawinkel, Objektive und Bewegung.
- Beleuchtung & Palette: Hauptlichtrichtung, Aufhellung und 3-5 disparate Farbanker.
- Handlung (Die Beats): Sequenzielle Ereignisse (z. B. "0-2s: Subjekt dreht sich", "2-4s: lächelt").
- Audio: Diegetische Geräusche und Dialoge.
Gute vs. Schlechte Beispiele
Klarheit gewinnt. Anstatt vager Hinweise wie "eine schöne Straße", schreiben Sie "nasser Asphalt, Zebrastreifen, Leuchtreklamen-Reflexion". Verben und Substantive, die auf sichtbare Ergebnisse hinweisen, liefern immer eine klarere, konsistentere Ausgabe.
| Merkmal | Schwacher Prompt ❌ | Starker Prompt ✅ |
|---|---|---|
| Stil | "Filmischer Look" | "Weitwinkel, niedriger Winkel. Schärfentiefe: gering. Beleuchtung: warmes Gegenlicht mit weichem Rand." |
| Handlung | "Liest ein Dokument" | "Subjekt nimmt das Papier auf, überfliegt die erste Zeile, runzelt dann die Stirn." |
| Beleuchtung | "Heller Raum" | "Weiches Fensterlicht von links, warme Lampenaufhellung von rechts. Palette: Bernstein, Schiefer, Creme." |
| Bewegung | "bewegt sich schnell" | "Subjekt joggt drei Schritte und stoppt abrupt am Bordstein." |
3. Techniken zur Kontrolle
A. Das "Beats"-System für Bewegung
Bewegung ist oft der schwierigste Teil, also halten Sie es einfach. Jede Einstellung sollte eine klare Kamerabewegung und eine klare Handlung des Subjekts haben. Handlungen funktionieren am besten, wenn sie in Beats oder Zählzeiten beschrieben werden – kleine Schritte, Gesten oder Pausen –, damit sie sich zeitlich verankert anfühlen.
- Beat 1: Der Aufbau (z. B. Ein Auto steht still).
- Beat 2: Die Aktion (z. B. Motor heult auf, Reifen drehen durch).
- Beat 3: Die Konsequenz (z. B. Auto rast aus dem Bild).
Tipp: Planen Sie für längere Videos (8s+) 1-2 unterschiedliche Handlungen pro 4-Sekunden-Block.
B. Visuelle Verankerung mit Bildern (Image-to-Video)
Für das höchste Maß an Kontrolle über Komposition und Stil einer Einstellung verwenden Sie ein Bild als Eingabe. Dies "sperrt" das Charakterdesign, das Outfit und den Schauplatz und ermöglicht es dem Prompt, sich rein auf die Bewegung zu konzentrieren. Das Modell verwendet das Bild als Anker für das erste Frame, während Ihr Textprompt definiert, was als nächstes passiert.
Beispiel 1: Charakterkonsistenz
| Eingabebild generiert mit OpenAI GPT Image | Generiertes Video mit Sora 2 (in GIF konvertiert) |
|---|---|
![]() | ![]() |
| Dieses Bild herunterladen | Prompt: "Sie dreht sich um und lächelt, dann geht sie langsam aus dem Bild." |
Beispiel 2: Animation & Remixing
Sie können dies auch für stilisierte Charaktere verwenden.
| Eingabebild generiert mit OpenAI GPT Image | Generiertes Video mit Sora 2 (in GIF konvertiert) |
|---|---|
![]() | ![]() |
| Dieses Bild herunterladen | Prompt: "Die Kühlschranktür öffnet sich. Ein süßes, pummeliges lila Monster kommt heraus." |
C. Die Macht des "Remix"
Sobald Sie ein generiertes Video haben, können Sie die Remix-Funktion verwenden, um spezifische Details anzupassen, ohne die ursprüngliche Komposition zu verlieren. Verwenden Sie sie, um kontrollierte Änderungen vorzunehmen – eine nach der anderen – und sagen Sie, was Sie ändern: "gleiche Einstellung, wechsel zu 85 mm" oder "gleiche Beleuchtung, neue Palette: Türkis, Sand, Rost."
| Remix Prompt | Ergebnis |
|---|---|
| Original | ![]() |
| "Ändere die Farbe des Monsters zu Orange" | ![]() |
| "Ein zweites Monster kommt direkt danach heraus" | ![]() |
D. Dialog und Audio
Dialoge müssen direkt in Ihrem Prompt beschrieben werden. Platzieren Sie sie in einen Dialogblock unter Ihrer Prosabeschreibung, damit das Modell eine visuelle Beschreibung klar von gesprochenen Zeilen unterscheidet. Halten Sie die Zeilen prägnant und natürlich, und versuchen Sie, den Austausch auf eine Handvoll Sätze zu beschränken, damit das Timing zu Ihrer Cliplänge passt.
- Rhythmus: Eine 4-Sekunden-Einstellung bietet normalerweise Platz für einen oder zwei kurze Austausche.
- Kennzeichnung: Kennzeichnen Sie Sprecher bei Szenen mit mehreren Charakteren konsistent.
- Ton: Wenn die Einstellung stumm ist, können Sie das Tempo dennoch mit einem kleinen Geräusch andeuten, z. B. "entferntes Verkehrszischen" oder "scharfes Schnippen".
4. Prompt-Vorlagen
Kopieren Sie diese Vorlagen, um loszulegen.
Vorlage 1: Die Produktenthüllung (Werbespot)
Stil: High-End-Tech-Werbespot, sauberes Studio, Makrofotografie. Szene: Graphit-Laptop steht auf einem Nussbaumschreibtisch. Kamera: Halbnah, Augenhöhe, langsames Heranfahren. Beleuchtung: Warme praktische Lampen mit kühlem Fenster-Kantenlicht. Palette: Bernstein, Graphit, Nussbaum, Schiefer. Handlungen:
- Weicher Lichtschwenk enthüllt graviertes Logo.
- Hand öffnet Deckel ein paar Zentimeter.
- Bildschirm erwacht mit sanfter Reflexion. Audio: Futuristisch klingende Hintergrundmusik.
z. B. Prompt: In einem ruhigen Designstudio in der Dämmerung steht ein Graphit-Laptop auf einem Nussbaumschreibtisch...
Vorlage 2: Die narrative Szene (Filmisch)
Format & Look: Modern digital mit weichem Lichthof; feines Korn. Objektive: 35mm dann 50mm; leichtes Black Pro-Mist. Beleuchtung & Palette: Weiches Fenster-Hauptlicht von links, negative Aufhellung von rechts; Anker Türkis, Sand, Rost. Ort: Eingangshalle eines Boutique-Hotels; Beginn weit, dann mittel. Handlungssequenz:
- Concierge legt eine Zimmer-Schlüsselkarte in einer Papierhülle auf Marmor.
- Die Hand des Gastes nimmt die gehüllte Schlüsselkarte und nimmt sie aus der Hülle. Ton: Stilvolle Jazzmusik, leises Raummurmeln.
5. Fortgeschrittene Beispiele
Beispiel: Das "Ultra-Detaillierte" Regiebriefing
Dieser Prompt nutzt die volle Leistungsfähigkeit von Sora 2 Pro, um eine spezifische Stimmung zu erzeugen.
**Format & Look:** Dauer 4s; 180°-Verschluss; digitale Aufnahme, emuliert 65mm-Film-Kontrast; feines Korn.
**Objektive:** 32mm Festbrennweite; leichter Lichthof auf spiegelnden Highlights.
**Beleuchtung & Palette:** Highlights: sauberes Morgensonnenlicht (Bernstein). Schatten: Türkisstich. Schwarztöne: weich, angehoben.
**Ort:** Städtischer Pendlerbahnsteig, Morgendämmerung. Nebel in der Luft.
**Subjekt:** Reisender Mitte 30, marineblauer Mantel, Rucksack, hält Telefon locker.
**Handlung:**
1. "Ankunftsdrift": Kamera gleitet an Bahnsteigbeschilderung vorbei.
2. Subjekt schaut die Gleise hinunter.
3. Zugscheinwerfer blenden weich durch Nebel auf.
**Ton:** Entferntes Schienenquietschen, tiefes Umgebungssummen, keine Musik.
Beispiel: Die "Märchenbuch"-Animation
Sora 2 ist nicht auf Realismus beschränkt. Es zeichnet sich auch bei stilisierten Inhalten aus.
**Stil:** Handgemalte 2D/3D-Hybrid-Animation, weiche Pinseltexturen, Märchenbuch-Ästhetik Mitte der 2000er Jahre.
**Szene:** Eine überfüllte Werkstatt, Regale quellen über vor Zahnrädern. Ein kleiner, runder Roboter sitzt auf einer Holzbank.
**Beleuchtung:** Warmes Wolfram-Hauptlicht, kühles Fenstereinfalllicht.
**Handlungen:**
- Roboter tippt auf eine Glühbirne; Funken knistern.
- Roboter zuckt zusammen, lässt Birne fallen.
- Roboter fängt Birne in Zeitlupe.
- Roboter seufzt Dampf (Erleichterung).
**Dialog:** Roboter: "Fast verloren... aber ich hab sie!"
**Audio:** Regen am Fenster, tickende Uhr, mechanisches Surren.
6. Fehlerbehebung & Optimierung
-
"Das Video sieht zu chaotisch aus."
- Lösung: Reduzieren Sie die Anzahl der Handlungen. Teilen Sie die Szene in zwei separate Prompts/Clips auf. Vereinfachen Sie die Kamerabewegung (statische Kameras liefern oft die höchste Wiedergabetreue).
- Tipp: Verwenden Sie Remix, um zu iterieren, ohne den gesamten Prompt zu ändern. Ändern Sie eine Variable (z. B. "Ändere Beleuchtung zu Sonnenuntergang") und behalten Sie den Rest bei.
-
"Das Subjekt sieht nicht wie mein Charakter aus."
- Lösung: Stellen Sie eine Eingabebild-Referenz bereit. Dies ist der einzige zuverlässige Weg, um die Identität des Charakters über Einstellungen hinweg beizubehalten.
-
"Die Bewegung fühlt sich unnatürlich an."
- Lösung: Beschreiben Sie die Physik oder das Gewicht. Anstatt "Monster springt", versuchen Sie "Monster wuchtet seinen schweren Körper nach oben und landet mit einem schweren Schlag, der den Staub aufwirbelt."
Fazit
Sora 2 ist ein kollaborativer Partner. Je präziser Ihre Vision (über den Prompt) und je besser Sie seine Stärken verstehen, desto besser werden Ihre Ergebnisse sei. Beginnen Sie mit einem klaren mentalen Bild, verwenden Sie die obigen Vorlagen und iterieren Sie mit den Remix-Steuerelementen, um Ihr Meisterwerk zu verfeinern.






