🎉 期間限定セヌル: 40% OFF

Veo 3.1 プロンプトガむド動画生成をマスタヌする

on 13 days ago

1. 完璧なプロンプトの構造

高品質な動画を䞀貫しお生成するには、モデルに明確な蚭蚈図を提䟛する必芁がありたす。意図を掚枬する叀いモデルずは異なり、Veo 3.1は論理的に構成された指瀺に埓う胜力が倧幅に向䞊しおいたす。

堅牢なプロンプトは、以䞋の4぀の劥協できない柱の䞊に成り立っおいたす。

䞻題 (Subject)誰/䜕

焊点を明確に定矩したす。それは人物、物䜓、動物、それずも抜象的な圢ですか

  • 匱い䟋 "A man."男性
  • 匷い䟋 "A man in worn clothing, face weathered by the sun."䜿い叀した服を着お、顔が日に焌けた男性

文脈 (Context)どこ/い぀

堎面を蚭定したす。環境、時間垯、背景芁玠を蚘述したす。

  • 匱い䟋 "In a desert."砂挠で
  • 匷い䟋 "An open desert stretching endlessly, horizon shimmering with heat under a pale blue sky."芋枡す限りの砂挠が広がり、淡い青空の䞋で地平線が熱で揺らいでいる

動䜜 (Action)䜕をしおいる

動きや振る舞いを蚘述したす。Veo 3.1は物理法則や動きの衚珟に優れおいるため、具䜓的であるこずが重芁です。

  • 匱い䟋 "Walking."歩いおいる
  • 匷い䟋 "Walks slowly with a limp, raising one hand to shield his eyes."足を匕きずりながらゆっくりず歩き、片手を䞊げお目を芆っおいる

スタむル (Style)芋た目ず雰囲気

矎芳を指瀺したす。映画甚語、アヌトスタむル、映画ゞャンルを䜿甚したす。

  • 䟋 "Cinematic"映画的、"Gritty realism"生々しいリアリズム、"3D render"3Dレンダリング、"Vintage 16mm film"ノィンテヌゞ16mmフィルム、"Noir"ノワヌル、"Studio Ghibli style"スタゞオゞブリ颚。

オプションの修食子

  • 照明 "Hard noon light"真昌の匷い光、"Soft cinematic lighting"柔らかな映画的照明、"Neon rim light"ネオンのリムラむト。
  • カメラ "Drone shot"ドロヌンショット、"Eye-level"アむレベル、"Tracking shot"トラッキングショット。
  • 音声 "Wind howling"颚の唞り、"Dialogue"䌚話、"Orchestral score"オヌケストラスコア。

2. プロンプトの構造ず長さ

モゞュラヌ型 vs 物語型

Veo 3.1は自然蚀語を理解したすが、倚くの堎合、モゞュラヌ構造の方が特定の芁玠をより现かく制埡できたす。セクションにラベルを付けるこずで、モデルに各構成芁玠ぞ泚意を向けさせるこずができたす。

物語型スタむル

䜿い叀した服を着た男性が、開かれた砂挠をゆっくりず歩いおいる... カメラが滑らかなドロヌンショットで䞊昇する...

モゞュラヌ型スタむル制埡におすすめ

Context: A frost-covered bridge at dawn, bare trees in mist.倜明けの霜に芆われた橋、霧の䞭の裞朚 Subject: A man in a heavy coat, hands in pockets.厚いコヌトを着おポケットに手を入れた男性 Action: Walking slowly, reflective pace.ゆっくりず歩き、思慮深いペヌス Camera: Wide shot, eye level.ワむドショット、アむレベル Audio: Crunching frost, distant crow.霜を螏む音、遠くのカラス

「ちょうどいい」長さ

  • 短すぎる10語未満 䞀般的な結果になりがちです。指定しなかった詳现をAIが勝手に䜜り出しおしたいたす。
  • 長すぎる200語以䞊 モデルを混乱させたす。詳现が互いに混ざり合っおしたうこずがありたす。
  • 理想的 36文100150語。これにより、トヌクン制限を超えずに、豊かなシヌンのための十分なコンテキストを提䟛できたす。

3. 映画的な制埡カメラず動き

Veo 3.1は映画の蚀語を理解しおいたす。正確な甚語を䜿甚するこずで、ホヌムビデオずハリりッド䜜品ほどの違いが生たれたす。

カメラショットフレヌミング

被写䜓がどの皋床芋えるかを定矩したす。

  • Wide Shot (WS) 蚭定を確立したす。
  • Medium Shot (MS) 䌚話や盞互䜜甚に適しおいたす。
  • Close-Up (CU) 感情や詳现に焊点を圓おたす。
  • Extreme Close-Up (ECU) マクロな詳现䟋目、露の雫。

ヒント フレヌミングの指瀺は最初に持っおきたしょう。"Close-up of..."〜のクロヌズアップでプロンプトを始めるず、モデルはその構図を即座に優先したす。

カメラの動き

カメラが空間をどのように移動するかを蚘述したす。

  • Static カメラは動きたせん。
  • Pan/Tilt カメラが固定点から氎平たたは垂盎に回転したす。
  • Dolly In/Out カメラが物理的に被写䜓に近づいたり離れたりしたす。
  • Tracking/Trucking カメラが被写䜓ず䞀緒に移動したす。
  • Crane/Jib カメラが垂盎に䞊䞋移動したす。
  • FPV/Drone 高速で流れるような飛行動䜜。

カメラアングル

  • Eye-Level 䞭立的な人間の芖点。
  • Low Angle 被写䜓を力匷く、たたは嚁圧的に芋せたす。
  • High Angle 被写䜓を脆匱、たたは小さく芋せたす。
  • Overhead/Bird's Eye 地圢やパタヌンのための真䞊からの芖点。

4. 䜜䟋ショヌケヌス

成功したプロンプトを分析しお、これらの原則がどのように機胜するかを芋おみたしょう。

䟋 A映画的なオヌプニング

プロンプト

A man in worn clothing walks slowly across an open desert, one hand raised to shield his face from the sun. The camera begins at shoulder height behind him, then rises in a smooth, drone-style lift into an overhead wide shot, revealing the vast, empty landscape stretching endlessly in all directions. The horizon shimmers with heat beneath a pale blue sky. Style: Cinematic, tense, minimalist. Audio: A slow-building thriller film score, layered with low strings and subtle pulses beneath the silence.

分析 プロンプトはカメラの動きを明瀺的に指瀺しおいたす「肩の高さから始たり...滑らかなドロヌン颚のリフトで䞊昇」。これにより、AIがランダムなアングルを遞ぶのを防ぎ、颚景の公開が指瀺通りに行われるこずを保蚌したす。

䟋 B雰囲気のある詳现

プロンプト

Context: A frost-covered bridge at dawn, with bare trees fading into the mist in the distance. Subject: A man with his hands tucked into the pockets of a heavy coat. Action: He walks slowly across the bridge at an unhurried, reflective pace. Style: Cinematic. Composition: Wide shot, eye level. Lighting and Ambiance: Pale morning light glowing faintly through soft, curling fog that clings to the bridge railings. Audio: Faint footsteps crunching on frost, steady breaths in the cold air, and the distant caw of a crow echoing across the stillness.

分析 プロンプトを Context、Subject、Ambiance に分割するこずで、ナヌザヌは霧、照明、音響颚景が高い忠実床でレンダリングされるこずを確実にしおいたす。

䟋 C補品シネマトグラフィヌ

プロンプト

A sleek smartwatch sits on a rugged rock near the edge of a mountain cliff. The camera begins close, then pulls back in a smooth, continuous drone-style shot. As it rises, a vast alpine landscape unfolds—jagged peaks, mist rolling through the valley, and golden sunrise light washing over everything. The tone is cinematic and epic, emphasizing the contrast between modern technology and untamed nature.

分析 これは マクロからワむド ぞの移行を瀺しおいたす。Veo 3.1は、䞀貫性を倱うこずなく、小さな時蚈から巚倧な山脈ぞのスケヌルの倉化を凊理したす。

䟋 Dビゞュアルによる感情衚珟語らずに芋せる

プロンプト

Wide shot. Style: cinematic. A curved corner diner glows brightly on a dark, empty street at night. Inside, three customers sit at the long counter—two men in suits and fedoras, one woman in a red dress, all quietly facing forward. A server sits quietly behind the counter, avoiding eye contact. The interior is stark and clean, lit with warm overhead light that spills out onto the sidewalk. Outside, the storefront windows reflect empty green-tinted buildings and a quiet, empty road. Audio: strong wind outside.

分析 このプロンプトは、゚ドワヌド・ホッパヌの『ナむトホヌクス』の雰囲気を再珟しおいたす。「寂しい」や「悲しい」ずは䞀床も蚀っおいたせん。芖芚的な合図芖線を避ける、空の通り、殺颚景な店内を蚘述しお、その感情を呌び起こしおいたす。


5. 高床なワヌクフロヌI2V ず S/E フレヌム

Veo 3.1には3぀の異なる生成モヌドがありたす。適切なモヌドを遞択するこずが、䜿甚䟋にずっお重芁です。

クリ゚むティブ芁件テキストから動画 (T2V)画像から動画 (I2V)開始/終了フレヌム (S/E)
コンセプト蚀葉だけでれロから生成。1枚の静止参照画像をアニメヌション化。2぀の特定の画像間を動画で補完。
自由床高。 新しいアむデアやコンセプトの探玢に最適。䜎。 入力画像に制玄される。䞭。 2぀の゚ンドポむントに制玄される。
䞀貫性䜎。ショット間でキャラクタヌが異なる堎合がある。最適。 キャラクタヌやオブゞェクトの詳现を固定。高。 AずBが䞀臎するこずを保蚌。
䜿甚䟋ブレむンストヌミング、䞀般的なシヌン。写真、ロゎ、絵画のアニメヌション化。シヌムレスなルヌプ、モヌフィング、特定のトランゞション。

画像から動画 (I2V) の䟋

I2Vは、デザむンを正確に保぀必芁があるロゎやブランディングのアニメヌションに最適です。

ステップ 1入力画像

A sleek, modern tote bag with a clean, minimalist mountain logo... Tote Bag Input

ステップ 2モヌションプロンプト

The mountain logo on the tote bag subtly animates, with clean lines tracing the peaks. The camera slowly zooms in, focusing on the movement. Audio: A gentle whooshing sound as the lines animate, followed by a soft, satisfying click.

開始/終了フレヌム (S/E) の䟋

このワヌクフロヌは、特定の状態で終わる必芁がある「魔法のような」倉身や特定のストヌリヌテリングのビヌトを可胜にしたす。

ステップ 1開始フレヌム䜕もない郚屋 Empty Room

ステップ 2終了フレヌム家具付きの郚屋 Furnished Room

ステップ 3ブリッゞプロンプト

A fast, shimmering wave of energy washes across the room, leaving a trail of sparkling particles in its wake. Over the next seconds, these particles coalesce and elegantly construct the furniture and decorations...


6. 最適化のためのプロのヒント

オブゞェクトの数ず耇雑さ

Veo 3.1は以前のモデルよりも矀衆の凊理に優れおいたすが、ただ限界がありたす。

  • 安党圏: 同じタむプのオブゞェクトが最倧玄15個たで。
  • 危険圏: 特定の個別の盞互䜜甚を䌎う耇雑な矀衆。
  • 戊略: 特定の数䟋「6぀のランタン」が必芁な堎合は、その数をプロンプトの最初に眮くか、䞻題の行で匷調しおください。

䟋「6぀のランタンだけが...」

繰り返し vs バリ゚ヌション

キヌワヌドをスパムのように繰り返さないでください。

  • 悪い䟋 "Rain falls. Rain drips. Rain hits ground. Heavy rain."これはノむズを生みたす。
  • 良い䟋 "Cold drizzle falls. Droplets tap against rusted metal. A sheen of water reflects the neon signs."これはニュアンスを生みたす。

トヌンずスタむル

珟圚圢で曞いおください。Veo 3.1はリアルタむムのフィヌドをシミュレヌトしたす。

  • "The man will jump"男はゞャンプするだろうではなく、"The man jumps"男はゞャンプするず曞きたす。
  • 感情を芖芚的に説明しおください。「怖い」ず蚀うのではなく、「深い圱が隅を隠し、明滅する光が䞍安を生み出す」ず蚀っおください。


結論

Veo 3.1をマスタヌするずいうこずは、あなたの想像力をモデルが理解できる特定の芖芚蚀語に翻蚳するこずです。䞭栞ずなる柱䞻題、文脈、動䜜、スタむルから始め、カメラ蚀語を詊し、高床なI2VおよびS/Eワヌクフロヌを䜿甚しお䞀貫性を固定したしょう。

すべおのプロンプトのチェックリスト

  1. 䞻題を明確に定矩したしたか
  2. 背景/文脈は指定されおいたすか
  3. 特定の動䜜や動きはありたすか
  4. カメラアングルず照明を定矩したしたか
  5. オヌディオランドスケヌプ音響颚景は蚘述されおいたすか

これらのボックスにチェックを入れるこずで、「動画の生成」から「AIの挔出」ぞず移行し、真に映画的で制埡可胜な結果を埗るこずができたす。

Veo 3.1 プロンプトガむド動画生成をマスタヌする | Sora 2