- المدونة | مولد فيديو Sora 2
- دليل أوامر Sora 2: إتقان فن توليد الفيديو
دليل أوامر Sora 2: إتقان فن توليد الفيديو
دليل أوامر Sora 2: إتقان فن توليد الفيديو
مقدمة
يمثل Sora 2 قفزة نوعية في مجال توليد الفيديو بالذكاء الاصطناعي، حيث يوفر تحكماً غير مسبوق في الفيزياء، والإضاءة، والحركة. ومع ذلك، فإن إطلاق العنان لإمكاناته الكاملة يتطلب تحولاً في طريقة تفكيرنا في كتابة الأوامر (Prompts).
فكر في كتابة الأوامر لـ Sora 2 ليس كعملية بحث عن فيديو، بل كـ إعطاء موجز لطاقم تصوير محترف. أنت المخرج، والنموذج هو مدير التصوير، وفني الإضاءة، ومصمم الديكور في آن واحد. إذا أغفلت التفاصيل، فسوف يرتجلون - غالباً بشكل جميل، ولكن ربما ليس بالطريقة التي كنت تقصدها. للحصول على ما تريده بالضبط، عليك التحدث بلغة السينما.
ومع ذلك، فإن ترك بعض التفاصيل مفتوحة يمكن أن يكون بنفس القوة. فمنح النموذج المزيد من الحرية الإبداعية يمكن أن يؤدي إلى تغييرات مدهشة وتفسيرات غير متوقعة وجميلة. كلا النهجين صحيح: الأوامر المفصلة تمنحك التحكم والاتساق، بينما تفتح الأوامر الأخف مساحة للنتائج الإبداعية. التوازن الصحيح يعتمد على أهدافك والنتيجة التي تسعى إليها.
الأهم من ذلك، كن مستعداً للتكرار والتحسين. يمكن للتغييرات الصغيرة في الكاميرا أو الإضاءة أو الحركة أن تغير النتيجة بشكل كبير. تعاون مع النموذج: أنت تقدم التوجيه، والنموذج يقدم تنويعات إبداعية.
يجمع هذا الدليل أفضل الممارسات وهياكل القوالب والتقنيات المتقدمة من خبراء الصناعة لمساعدتك في كتابة أوامر أفضل لـ Sora 2.
1. الفلسفة الأساسية: "إيجاز الطاقم"
يجب أن يجيب الأمر القوي على أسئلة محددة لـ "طاقم" الذكاء الاصطناعي:
- الموضوع (The Subject): من أو ماذا نصور؟
- الحدث (The Action): ماذا يحدث؟ (صف ذلك في "نقلات" أو Beats)
- الكاميرا (The Camera): أين الكاميرا؟ كيف تتحرك؟ (العدسة، الزاوية، الحركة)
- الإضاءة والمظهر (The Lighting & Look): ما هو المزاج؟ (لوحة الألوان، مصدر الضوء)
- الصوت (The Audio): ماذا نسمع؟ (الأجواء، المؤثرات الصوتية، الحوار)
2. تشريح الأمر المثالي
الأمر المنظم يعطي نتائج متسقة. صف اللقطة كما لو كنت ترسمها على لوحة قصة (Storyboard). حدد إطار الكاميرا، وسجل عمق المجال، وصف الحدث في نقلات، وحدد الإضاءة واللوحة. إن تثبيت موضوعك ببعض التفاصيل المميزة يجعله قابلاً للتعرف عليه، بينما يجعل الحدث الواحد والمقبول اللقطة أسهل في المتابعة.
تجنب نصوص الكتل الكبيرة؛ بدلاً من ذلك، نظم أمرك في أقسام منطقية.
الهيكل
- التنسيق والأسلوب: حدد الوسيط (مثل "فيلم 35 مم"، "IMAX رقمي"، "رسوم متحركة مرسومة باليد").
- الموضوع والإعداد: أوصاف ملموسة للتركيز الرئيسي والخلفية.
- التصوير السينمائي: زوايا الكاميرا، والعدسات، والحركة.
- الإضاءة واللوحة: اتجاه الضوء الرئيسي، والملء، و3-5 مثبتات ألوان متباينة.
- الحدث (النقلات): أحداث متسلسلة (مثل "0-2ث: الموضوع يلتفت"، "2-4ث: يبتسم").
- الصوت: الأصوات التي يسمعها الشخصيات والحوارات.
أمثلة جيدة مقابل سيئة
الوضوح يفوز. بدلاً من الإشارات الغامضة مثل “شارع جميل”، اكتب “أسفلت مبلل، ممر مشاة، انعكاس لافتة نيون”. الأفعال والأسماء التي تشير إلى نتائج مرئية ستعطيك دائماً مخرجات أكثر وضوحاً واتساقاً.
| الميزة | أمر ضعيف ❌ | أمر قوي ✅ |
|---|---|---|
| الأسلوب | "مظهر سينمائي" | "لقطة واسعة، زاوية منخفضة. عمق المجال: ضحل. الإضاءة: إضاءة خلفية دافئة مع حافة ناعمة." |
| الحدث | "يراجع مستنداً" | "الموضوع يلتقط الورقة، يمسح السطر الأول، ثم يعقد حاجبيه." |
| الإضاءة | "غرفة مشرقة" | "ضوء نافذة ناعم من اليسار، ملء مصباح دافئ على اليمين. اللوحة: كهرماني، رمادي، كريمي." |
| الحركة | "يتحرك بسرعة" | "الموضوع يركض ثلاث خطوات ويتوقف فجأة عند الرصيف." |
3. تقنيات التحكم
أ. نظام "النقلات" (Beats) للحركة
الحركة غالباً ما تكون الجزء الأصعب في ضبطه، لذا اجعلها بسيطة. يجب أن تحتوي كل لقطة على حركة كاميرا واحدة واضحة وحركة موضوع واحدة واضحة. تعمل الحركات بشكل أفضل عندما توصف في نقلات أو عدات – خطوات صغيرة، إيماءات، أو توقفات – بحيث تبدو راسخة في الوقت.
- النقلة 1: الإعداد (مثل سيارة متوقفة).
- النقلة 2: الحدث (مثل المحرك يهدر، الإطارات تدور).
- النقلة 3: النتيجة (مثل السيارة تسرع خارج الإطار).
نصيحة: للفيديوهات الأطول (8ث+)، خطط لـ 1-2 حركة مميزة لكل كتلة مدتها 4 ثوانٍ.
ب. التثبيت البصري بالصور (Image-to-Video)
لأعلى مستوى من التحكم في تكوين وأسلوب اللقطة، استخدم صورة كمدخل. هذا "يقفل" تصميم الشخصية، والزي، والإعداد، مما يسمح للأمر بالتركيز فقط على الحركة. يستخدم النموذج الصورة كمرساة للإطار الأول، بينما يحدد أمرك النصي ما يحدث بعد ذلك.
مثال 1: اتساق الشخصية
| صورة مدخلة تم إنشاؤها باستخدام OpenAI GPT Image | فيديو تم إنشاؤه باستخدام Sora 2 (تم تحويله إلى GIF) |
|---|---|
![]() | ![]() |
| تحميل هذه الصورة | الأمر: "تلتفت وتبتسم، ثم تمشي ببطء خارج الإطار." |
مثال 2: الرسوم المتحركة وإعادة المزج (Remix)
يمكنك أيضاً استخدام هذا للشخصيات المنمقة.
| صورة مدخلة تم إنشاؤها باستخدام OpenAI GPT Image | فيديو تم إنشاؤه باستخدام Sora 2 (تم تحويله إلى GIF) |
|---|---|
![]() | ![]() |
| تحميل هذه الصورة | الأمر: "يفتح باب الثلاجة. يخرج منه وحش أرجواني لطيف وممتلئ." |
ج. قوة "إعادة المزج" (Remix)
بمجرد حصولك على فيديو تم إنشاؤه، يمكنك استخدام وظيفة Remix لتعديل تفاصيل محددة دون فقدان التكوين الأصلي. استخدمه لإجراء تغييرات خاضعة للتحكم – واحداً تلو الآخر – وقل ما تقوم بتغييره: "نفس اللقطة، انتقل إلى 85 مم"، أو "نفس الإضاءة، لوحة جديدة: فيروزي، رملي، صدئ".
| أمر إعادة المزج | النتيجة |
|---|---|
| الأصلي | ![]() |
| "غير لون الوحش إلى البرتقالي" | ![]() |
| "وحش ثاني يخرج مباشرة بعد ذلك" | ![]() |
د. الحوار والصوت
يجب وصف الحوار مباشرة في أمرك. ضعه في كتلة حوار أسفل وصفك النثري حتى يميز النموذج بوضوح الوصف المرئي عن السطور المنطوقة. اجعل السطور موجزة وطبيعية، وحاول قصر التبادلات على حفنة من الجمل حتى يتناسب التوقيت مع طول المقطع الخاص بك.
- الإيقاع: تستوعب اللقطة التي تبلغ مدتها 4 ثوانٍ عادةً تبادلاً واحداً أو تبادلين قصيرين.
- التسمية: للمشاهد متعددة الشخصيات، قم بتسمية المتحدثين باستمرار.
- النغمة: إذا كانت اللقطة صامتة، فلا يزال بإمكانك اقتراح السرعة بصوت صغير واحد، مثل "هسيس حركة المرور البعيدة" أو "فرقعة نضرة".
4. قوالب الأوامر
انسخ والصق هذه القوالب للبدء.
القالب 1: الكشف عن المنتج (تجاري)
الأسلوب: إعلان تقني راقٍ، استوديو نظيف، تصوير ماكرو. المشهد: كمبيوتر محمول من الجرافيت يجلس على مكتب من خشب الجوز. الكاميرا: متوسطة قريبة، مستوى العين، اقتراب بطيء. الإضاءة: مصابيح عملية دافئة مع ضوء حافة نافذة بارد. اللوحة: كهرماني، جرافيت، جوز، رمادي. الأحداث:
- مسح ضوئي ناعم يكشف عن الشعار المحفور.
- يد تفتح الغطاء بضع بوصات.
- الشاشة تستيقظ بانعكاس لطيف. الصوت: موسيقى محيطة تبدو مستقبلية.
مثال: الأمر: داخل استوديو تصميم هادئ عند الغسق، يجلس كمبيوتر محمول من الجرافيت على مكتب من خشب الجوز...
القالب 2: المشهد السردي (سينمائي)
التنسيق والمظهر: رقمي حديث مع هالة ناعمة؛ حبيبات دقيقة. العدسات: 35 مم ثم 50 مم؛ Black Pro-Mist خفيف. الإضاءة واللوحة: ضوء رئيسي ناعم من النافذة من اليسار، ملء سلبي على اليمين؛ مثبتات فيروزي، رملي، صدئ. الموقع: قاعة دخول فندق بوتيك؛ ابدأ واسعاً، ثم متوسطاً. تسلسل الأحداث:
- يضع الكونسيرج بطاقة مفتاح الغرفة داخل غلاف ورقي على الرخام.
- تأخذ يد الضيف بطاقة المفتاح المغلفة وتخرجها من الغلاف. الصوت: موسيقى جاز راقية، همهمة منخفضة في الغرفة.
5. أمثلة متقدمة
مثال: موجز المخرج "فائق التفصيل"
يستخدم هذا الأمر القدرة الكاملة لـ Sora 2 Pro لإنشاء مزاج معين.
**التنسيق والمظهر:** المدة 4 ثوانٍ؛ غالق 180 درجة؛ التقاط رقمي يحاكي تباين فيلم 65 مم؛ حبيبات دقيقة.
**العدسات:** 32 مم ثابتة؛ هالة طفيفة على الإضاءات البارزة.
**الإضاءة واللوحة:** الإضاءات: ضوء شمس صباحي نظيف (كهرماني). الظلال: مسحة فيروزية. الأسود: ناعم، مرفوع.
**الموقع:** منصة ركاب حضرية، الفجر. ضباب في الهواء.
**الموضوع:** مسافر في منتصف الثلاثينيات، معطف كحلي، حقيبة ظهر، يمسك الهاتف بشكل فضفاض.
**الحدث:**
1. "انحراف الوصول": الكاميرا تنزلق عبر لافتات المنصة.
2. الموضوع ينظر لأسفل المسارات.
3. مصابيح القطار تتوهج بنعومة عبر الضباب.
**الصوت:** صرير سكة حديد بعيد، همهمة محيطة منخفضة، لا موسيقى.
مثال: رسوم متحركة "كتاب القصص"
Sora 2 ليس مقتصراً على الواقعية. إنه يتفوق في المحتوى المنمق أيضاً.
**الأسلوب:** رسوم متحركة هجينة 2D/3D مرسومة باليد، قوام فرشاة ناعم، جمالية كتب القصص في منتصف العقد الأول من القرن الحادي والعشرين.
**المشهد:** ورشة عمل فوضوية، أرفف تفيض بالتروس. روبوت صغير مستدير يجلس على مقعد خشبي.
**الإضاءة:** ضوء رئيسي تنجستن دافئ، تسرب نافذة بارد.
**الأحداث:**
- الروبوت ينقر على مصباح؛ الشرر يفرقع.
- الروبوت يجفل، يسقط المصباح.
- الروبوت يمسك المصباح بحركة بطيئة.
- الروبوت يتنهد بخاراً (راحة).
**الحوار:** الروبوت: "كدت أفقده... لكني حصلت عليه!"
**الصوت:** مطر على النافذة، ساعة تدق، أزيز ميكانيكي.
6. استكشاف الأخطاء وإصلاحها والتحسين
-
"الفيديو يبدو فوضوياً جداً."
- الحل: قلل عدد الإجراءات. قسم المشهد إلى أمرين/مقطعين منفصلين. بسّط حركة الكاميرا (الكاميرات الثابتة غالباً ما تعطي أعلى دقة).
- نصيحة: استخدم Remix للتكرار دون تغيير الأمر بالكامل. غير متغيراً واحداً (مثل "تغيير الإضاءة إلى غروب الشمس") واحتفظ بالباقي.
-
"الموضوع لا يشبه شخصيتي."
- الحل: قدم مرجع صورة مدخلة. هذه هي الطريقة الموثوقة الوحيدة للحفاظ على هوية الشخصية عبر اللقطات.
-
"الحركة تبدو غير طبيعية."
- الحل: صف الفيزياء أو الوزن. بدلاً من "الوحش يقفز"، جرب "الوحش يرفع جسده الثقيل إلى الأعلى، ويهبط بضربة ثقيلة تهز الغبار."
خاتمة
Sora 2 شريك تعاوني. كلما كانت رؤيتك أكثر دقة (عبر الأمر) وكلما فهمت نقاط وقوته بشكل أفضل، كانت نتائجك أفضل. ابدأ بصورة ذهنية واضحة، واستخدم القوالب أعلاه، وكرر باستخدام عناصر تحكم Remix لتحسين تحفتك الفنية.






