دليل كتابة مطالبات الفيديو بالذكاء الاصطناعي: من المبتدئين إلى الجودة السينمائية

Feb 22, 2026

TL;DR

تنبع مقاطع الفيديو الرائعة التي تعتمد على الذكاء الاصطناعي من مطالبات رائعة. يعلّمك هذا الدليل صيغة مطالبات فيديو عالمية — إطار عمل مكون من سبعة عناصر قابل للتطبيق على جميع منصات الفيديو الشائعة التي تعتمد على الذكاء الاصطناعي:

[الموضوع] + [الإجراء] + [الإعداد] + [حركة الكاميرا] + [الإضاءة] + [الأسلوب] + [الصوت]

سوف تتعلم: الأسباب الرئيسية لحدوث الأعطال الفورية (وكيفية إصلاحها على الفور)، مرجع شامل للغة الكاميرا يغطي أكثر من 15 تقنية كاميرا، مكتبة كلمات رئيسية للأجواء منظمة عبر أربعة أبعاد: الإضاءة، لوحة الألوان، الملمس، والمزاج، خمسة أمثلة تقدمية من الأساسي إلى الجودة السينمائية، كيفية دمج تصميم الصوت في المطالبات، وتقنيات التحسين الخاصة بالمنصات لـ Seedance و Sora و Kling و Runway و Veo 3.

هذا ليس درسًا تعليميًا عن الأداة، بل هو منهجية. مهارات كتابة المطالبات المرئية قابلة للتطبيق على مختلف المنصات؛ تعلمها مرة واحدة، وطبقها في كل مكان.

مطالبات يتم إنشاؤها تلقائيًا →

عرض توضيحي مقارن: تؤدي مقاطع الفيديو الغامضة التي تعتمد على الذكاء الاصطناعي إلى نتائج عادية ومبتذلة، في حين أن المقاطع المنظمة ذات الجودة السينمائية تنتج مقاطع فيديو ذات جودة احترافية.

نفس المفهوم، لكن النتائج مختلفة تمامًا. تقول العبارة الموجودة على اليسار: "امرأة تمشي تحت المطر". تحدد العبارة الموجودة على اليمين حركة الكاميرا واتجاه الإضاءة والأجواء والصوت، ويستجيب نموذج الذكاء الاصطناعي لذلك بجودة سينمائية.


لماذا تفشل معظم مطالبات الفيديو بالذكاء الاصطناعي (وكيفية إصلاحها)

بغض النظر عن منشئ الفيديو بالذكاء الاصطناعي الذي تستخدمه — Seedance أو Sora أو Keeling أو Runway أو Veo 3 — فإن المبدأ الأساسي يظل كما هو: كلما كان النص المدخل أكثر دقة واكتمالاً من الناحية الهيكلية، أصبح الناتج أكثر قابلية للتحكم وأكثر سينمائية. يكتب معظم الناس المطالبات كما لو كانوا يصفون صورة فوتوغرافية لصديق، لكن الفيديو ليس صورة فوتوغرافية. يتضمن الفيديو الحركة والوقت وسلوك الكاميرا وتطور الأجواء والصوت.

فيما يلي الأسباب الخمسة الأكثر شيوعًا لفشل البرنامج، مع حل فوري لكل منها.

  1. غامض للغاية — مشكلة "غروب الشمس الجميل"

أكثر الأخطاء شيوعًا. تكتب "غروب شمس جميل على البحر" وتحصل على مقتطف دقيق من الناحية الفنية ولكنه فارغ عاطفيًا يشبه شاشات التوقف الجاهزة.

المشكلة ليست أن الذكاء الاصطناعي لا يستطيع تصوير غروب الشمس، بل أن "الجمال" و"غروب الشمس" هما المعلومات الوحيدة التي قدمتها. بعد أن واجه ملايين غروب الشمس في بيانات التدريب، يختار الذكاء الاصطناعي المتوسط الإحصائي، والمتوسط، بطبيعته، هو المتوسط.

قبل التعديلبعد التعديل
غروب شمس جميل فوق المحيطضوء الساعة الذهبية ينسكب على شاطئ المحيط الهادئ، والأمواج تتلاطم على الصخور البركانية، والشمس تجلس على بعد إصبعين فوق الأفق، وتدرج السماء يتحول من الكهرمان الغامق عند الأفق إلى اللون الوردي السلموني إلى اللون اللافندر الباهت عند الزاوية العليا، والظلال الطويلة تمتد نحو الكاميرا الشمس معلقة على ارتفاع إصبعين فوق الأفق، وتدرج لون السماء يتحول من الكهرماني الغامق عند الأفق إلى الوردي السلموني إلى اللون اللافندر الباهت عند الزاوية العليا، والظلال الطويلة تمتد نحو الكاميرا)

طريقة التصحيح: استبدل الصفات ("جميل"، "مذهل"، "رائع") بتفاصيل محددة يمكن ملاحظتها — اللون، الموضع، الملمس، العلاقات المكانية.

  1. عدم وجود تعليمات الحركة — مشاكل مع الصور الثابتة

لقد كتبت وصفًا غنيًا بالتفاصيل للمشهد، لكن الذكاء الاصطناعي أنتج صورة تبدو وكأنها صورة فوتوغرافية مع تأثير دفع وسحب طفيف — لأنك وصفت لحظة، وليس حركة.

الفيديو يعتمد على الوقت. بدون تعليمات حركة واضحة، تعتمد الذكاء الاصطناعي على التفسير الأكثر تحفظًا: تقدم بطيء أو اختلاف طفيف في المنظر. من الناحية الفنية، هذا هو بالفعل "فيديو"، ولكنه ليس ما تريده.

| قبل التعديل | بعد التعديل | |--------|------- -| | سيارة رياضية حمراء قديمة متوقفة على طريق جبلي، صباح ضبابي، سينمائي (一辆复古红色跑车停在山路上,薄雾清晨,电影感) | سيارة بورش 911 حمراء قديمة تتسارع على طريق جبلي متعرج، والإطارات تلتصق بالإسفلت الرطب، والضباب يتلاشى حول جسم السيارة، والكاميرا تتبعها على ارتفاع المصد، والأشجار تمر بسرعة في المقدمة |

طريقة التصحيح: يتطلب كل مقطع فيديو موجهًا على الأقل فعلًا واحدًا يصف الحركة الجسدية للموضوع وجملة واحدة تصف حركة الكاميرا. الموضوع في حالة حركة، والكاميرا في حالة حركة — معًا يخلقان طاقة بصرية.

3. التوجيه المتناقض — مفارقة "اللقطة المقربة + اللقطة البعيدة"

هذه الحالة أكثر شيوعًا مما قد تتخيل، خاصةً عندما يربط الناس بين مصطلحات سينمائية سمعوا بها ولكنهم لا يفهمونها تمامًا. "لقطة مقربة للغاية لامرأة تعبر صحراء شاسعة، لقطة واسعة، إحساس ملحمي" تحتوي على توجيهين متعارضين في التركيب. سيحاول الذكاء الاصطناعي التوفيق بينهما، لينتج صورة ليست قريبة ولا بعيدة، بل فوضوية ببساطة.

قبل التعديلبعد التعديل
لقطة مقربة لامرأة تعبر صحراء شاسعة، لقطة واسعة، نطاق ملحميلقطة مقربة للغاية لعيني امرأة تعكسان ضوء الصحراء، وجزيئات الرمل تعكس أشعة الشمس الذهبية على رموشها، وعمق مجال ضحل مع تلاشي الكثبان الرملية الشاسعة خلفها في تدرج لونه كهرماني (عيني امرأة في لقطة مقربة للغاية، تعكسان ضوء الصحراء؛ وجزيئات الرمل تعكس أشعة الشمس الذهبية على رموشها؛ عمق مجال ضحل يجعل الكثبان الرملية الشاسعة خلفها تتحول إلى تدرج لونه كهرماني)

طريقة الإصلاح: حدد موضعًا واحدًا للكاميرا لكل لقطة. إذا كنت بحاجة إلى لقطات مقربة ولقطات بعيدة، فاكتب لقطتين منفصلتين واربطهما بانتقال. بالنسبة للتسلسلات متعددة اللقطات، تدعم منصات مثل Seedance تنسيق الجدول الزمني للوحة القصة، مما يتيح لك تحديد كل لقطة على حدة.

  1. غياب الجو العام — فراغ من الضوء والظل والعاطفة

تصف مهمتك موضوعًا يقوم بعمل ما في مكان محدد. وهذا يغطي ثلاثة من الأبعاد السبعة. بدون توجيهات بشأن الإضاءة أو لوحة الألوان أو التأثيرات الجوية أو الاتجاه الأسلوبي، ستملأ الذكاء الاصطناعي الفجوات بقيم افتراضية محايدة: إضاءة مسطحة وموحدة وألوان باهتة وبدون مزاج معين. والنتيجة تشبه لقطات مراقبة عالية الدقة.

| قبل المراجعة | بعد المراجعة | |--------|------- -| | رجل يجلس بمفرده في مقهى | رجل في الأربعينيات من عمره يجلس بمفرده في زاوية مظلمة، ضوء كهرماني دافئ من مصباح معلق واحد يضيء البخار المتصاعد من فنجان قهوته، المطر يتساقط على النافذة خلفه ملقياً ظلالاً متعرجة على وجهه، ألوان خافتة من الأزرق المخضر والنحاسي، جو حزين |

طريقة العلاج: دمج اتجاه الضوء ودرجة حرارة اللون والتأثيرات الجوية (الضباب والمطر والغبار والبخار) والكلمات التي تعبر عن الحالة المزاجية. هذه الإضافات الأربع تحول "المشهد" إلى "شعور".

  1. غياب التصميم الصوتي — مشكلة الأفلام الصامتة

بحلول عام 2026، ستدعم معظم منصات الفيديو التي تعمل بالذكاء الاصطناعي إنتاج الصوت، مثل الموسيقى الخلفية والمؤثرات الصوتية المحيطة وحتى الحوار مع مزامنة الشفاه. ومع ذلك، تظل المطالبات التي يكتبها معظم الناس صامتة تمامًا، حيث يعاملون مطالبات الفيديو على أنها تعليمات بصرية فقط.

الصوت يشكل نصف التجربة. مشهد الغابة بدون أصوات العصافير وحفيف أوراق الشجر يبدو مصطنعًا. مشاهد الحركة التي تفتقر إلى أصوات التأثير تبدو غير ملموسة. عروض المنتجات بدون موسيقى تشبه عروض PowerPoint.

| قبل التعديل | بعد التعديل | |------- -|--------| | قطة تقفز من رف الكتب وتهبط على الأريكة | قطة برتقالية اللون تقفز برشاقة من أعلى رف كتب طويل مصنوع من خشب البلوط، وتمد جسدها في الهواء، وتهبط برفق على وسادة أريكة مخملية تنضغط تحت وزنها. الصوت: صوت ملامسة الكفوف الناعمة للنسيج، انزلاق كتاب واحد على الرف، صوت الغرفة الهادئ مع صوت المطر البعيد على النوافذ الصوت: صوت أقدامها الناعمة على القماش، وكتاب واحد ينزلق على الرف، وصوت الغرفة الهادئ مع صوت المطر البعيد على النوافذ) |

الإصلاح: أضف سطراً من التعليمات الصوتية في نهاية الموجه، مع تحديد نمط الموسيقى الخلفية والمؤثرات الصوتية المحيطة وأي حوار أو سرد. نقدم إرشادات مفصلة في [قسم تصميم الصوت](#دمج تصميم الصوت في الموجهات) أدناه.


صيغة موجهة للفيديو عالمية

بغض النظر عن المنصة التي تستخدمها، تحتوي كل مطالبة فيديو فعالة على نفس العناصر السبعة. بعضها أساسي (مطلوب في كل مطالبة)، بينما البعض الآخر اختياري (يعزز الفعالية ولكنه ليس إلزاميًا). الصيغة:

[الموضوع] + [الإجراء] + [البيئة] + [تصوير الكاميرا] + [الإضاءة] + [الأسلوب] + [الصوت]

رسم تخطيطي مرئي للعناصر السبعة في صيغة موجهة للفيديو عالمية، يوضح الموضوع، والحركة، والإعداد، وحركة الكاميرا، والإضاءة، والأسلوب، وعناصر الصوت إلى جانب أمثلة على الكلمات المفتاحية.

العناصر السبعة الأساسية لصيغة موجه الفيديو الشاملة. يضيف كل عنصر بُعدًا إضافيًا للتحكم في الناتج النهائي.

فيما يلي تفصيل خطوة بخطوة لكل عنصر، مصحوبًا بمكتبة كلمات رئيسية وأمثلة على العبارات.

العنصر الأول: الموضوع (مطلوب)

الموضوع هو موضوع نظر الجمهور. يجب أن يكون هذا الجزء الأكثر تحديدًا في الموجهة — ليس "امرأة"، بل "امرأة في الستينيات من عمرها، بشعر فضي مربوط بشكل فضفاض في كعكة، وخطوط ضحك عميقة في زوايا عينيها، ترتدي مئزرًا من الدنيم الباهت".

مكتبة الكلمات المفتاحية:

| الفئة | مثال (موجه باللغة الإنجليزية) | |------|------------------ -| | شخصيات | شاب في العشرينات من عمره، امرأة مسنة، طفل في الخامسة من عمره، راقصة، طاهية، جندي | | حيوانات | كلب من فصيلة غولدن ريتريفر، نمر ثلجي، طائر طنان، سمكة كوي، فراشة ملكية | | أشياء | آلة كاتبة قديمة، زجاجة عطر كريستالية، دفتر يوميات مغلف بالجلد، مزهرية خزفية | | مركبات | دراجة نارية سوداء غير لامعة، قارب شراعي خشبي، شاحنة صغيرة متآكلة، قطار سريع | | مجرد | جزيئات ضوئية، قطرات حبر في الماء، أشكال هندسية، معدن سائل |

أمثلة على العبارات:

  • "باريستا في الثلاثينيات من عمرها، ترتدي مريلة سوداء مغطاة بالدقيق وتضع وشمًا على ذراعيها"
  • بوصلة برونزية قديمة مفتوحة على خريطة بحرية - آلاف الفوانيس الورقية، كل منها يضيء بلون كهرماني دافئ من شمعة بداخلها

العنصر الثاني: الإجراء (مطلوب)

الحركة هي ما يتكشف - ما يفعله الشخص وكيف تتطور المشهد بمرور الوقت. وهذا يمثل الفاصل بين مطالبات الفيديو ومطالبات الصور. بدون حركة، لن يتبقى لك سوى صورة متحركة.

مكتبة الكلمات المفتاحية:

| نوع الحركة | مثال (موجه باللغة الإنجليزية) | |--------- -|-------------------| | حركة الإنسان | المشي، الجري، الدوران ببطء، مد اليد، الانحناء إلى الأمام، الزفير، الرمش | | حركة الكاميرا النسبية | الاقتراب من الكاميرا، الابتعاد عن الكاميرا، عبور الإطار من اليسار إلى اليمين | | حركة الأجسام | الدوران، السقوط، الطفو، التكسر، التجميع، الانفتاح، الذوبان | | حركة البيئة | الرياح تهب عبر العشب، السحب تتدحرج، المطر يتساقط، الأوراق تتطاير، المد يأتي | | العمليات الانتقالية | النهار يتحول إلى ليل، الزهور تتفتح، الجليد يتشكل، الطلاء ينتشر، الضوء يتغير |

أمثلة على العبارات:

  • "تمتد ببطء وتلتقط ورقة خريفية متساقطة، وتديرها بين أصابعها"
  • ترتجف إبرة البوصلة، ثم تتأرجح بثبات نحو الشمال
  • ترتفع الفوانيس واحدة تلو الأخرى من الأرض، وتصعد إلى السماء المظلمة بسرعات مختلفة

العنصر الثالث: البيئة (أساسي)

الموقع هو المكان الذي تدور فيه الأحداث. صِف المشهد المباشر (المقدمة) والسياق الأوسع. أضف معلومات عن الطقس والوقت من اليوم والموسم إذا كان ذلك مناسبًا.

مكتبة الكلمات المفتاحية:

| نوع المشهد | مثال (موجه باللغة الإنجليزية) | |----------|------------------ -| | الطبيعة | غابة كثيفة، كثبان صحراوية، منحدر مطل على المحيط، مرج جبلي، شاطئ بركاني، غابة خيزران | | حضري | زقاق ضيق في طوكيو، ساحة خرسانية بروتالية، حديقة على السطح، رصيف مترو الأنفاق، شارع مضاء بالنيون | | داخلي | مكتبة مضاءة بالشموع، دور علوي صناعي، دفيئة زجاجية، غرفة تحميض قديمة، ردهة رخامية | | خيالي | جزر عائمة، كهف بلوري، شعاب مرجانية مضيئة، معبد مهدم، مدينة سحابية | | الوقت/الطقس | شفق ما قبل الفجر، ظهيرة غائمة، عاصفة رعدية، أول تساقط للثلوج، أمسية صيفية رطبة |

أمثلة على العبارات:

  • "في شارع جانبي ضيق في كيوتو، تنتشر الفوانيس الحجرية على جانبي الطريق، وتنتشر بتلات أزهار الكرز على الحصى الرطب".
  • داخل كاتدرائية مهجورة شاسعة، أشعة ضوء مغبرة تخترق الزجاج الملون المكسور
  • على حافة منحدر بركاني في الساعة الزرقاء، يتصاعد بخار كبريتي من شقوق الصخور السوداء

العنصر الرابع: حركة الكاميرا (مهم)

توجه تعليمات اتجاه الكاميرا جمهور الذكاء الاصطناعي إلى كيفية مشاهدة المشهد، بما في ذلك التكوين (مدى القرب) والزاوية (من أين) والحركة (كيف يتغير منظور المشهد بمرور الوقت). تمثل لغة الكاميرا العامل الأكثر أهمية لتحسين جودة الموجهات — وسنستكشف ذلك بالتفصيل في القسم المخصص أدناه.

مكتبة الكلمات المفتاحية السريعة:

| الجانب | المصطلحات الإنجليزية والمصطلحات الصينية المكافئة | |------|------------------ -| | التأطير | لقطة مقربة للغاية، لقطة مقربة، لقطة متوسطة، لقطة كاملة، لقطة واسعة، لقطة واسعة للغاية (لقطة بعيدة للغاية) | | الزاوية | مستوى العين، زاوية منخفضة، زاوية عالية، منظور عين الطائر، منظور عين الدودة، زاوية هولندية | | الحركة | دوالي داخل/خارج، تحريك يسار/يمين، إمالة لأعلى/لأسفل، لقطة تتبع، مدار، رافعة (ارتفاع) | | العدسة | زاوية عريضة 24 مم، قياسية 50 مم، بورتريه 85 مم، تليفوتوغرافي 200 مم، عدسة ماكرو، أنامورفيك |

العنصر الخامس: الإضاءة (مهم)

الضوء والظل يحددان مزاج كل إطار. يقضي المصورون المحترفون ساعات في ترتيب الإضاءة. في الكتابة السريعة، يمكن لبضع كلمات دقيقة أن تحقق نفس المستوى من التحكم.

مكتبة الكلمات المفتاحية:

| نوع الإضاءة (الإنجليزية/الصينية) | التأثيرات البصرية | |--------------------- -|----------| | الساعة الذهبية | درجات ألوان دافئة، ظلال ممدودة، درجات ألوان برتقالية-كهرمانية، مناسبة بشكل استثنائي للصور الشخصية | | الساعة الزرقاء | درجات ألوان باردة، جو حزين، سماء زرقاء عميقة مع دفء باقٍ على طول الأفق | | الإضاءة الخلفية | توهج الخطوط العريضة، تأثير الصورة الظلية، فصل واضح عن الخلفية | | الإضاءة الجانبية | وجه نصف مضاء ونصف مظلل؛ تباين عالٍ وتأثير درامي | | إضاءة رامبرانت | إضاءة مثلثة تحت العين المظللة؛ تأثير صورة شخصية كلاسيكي | | إضاءة حجمية | أشعة مرئية تخترق الغبار أو الضباب أو الدخان | | تأثير تيندال | تشتت الضوء داخل الجسيمات، مما ينتج عنه أشعة مميزة داخل الضباب أو الغبار | | النيون | مصادر ضوء صناعية ملونة، انعكاسات على الأسطح الرطبة، جماليات السايبربانك |

العنصر السادس: الأسلوب (موصى به)

يحدد الأسلوب اللغة البصرية التي تستخدمها الذكاء الاصطناعي، سواء كانت أفلامًا سينمائية أو وثائقية واقعية أو رسومًا متحركة أو لوحات زيتية أو غير ذلك. بدون تحديد الأسلوب، يتخذ الذكاء الاصطناعي أسلوبًا واقعيًا عامًا بشكل افتراضي.

مكتبة الكلمات المفتاحية:

| النمط (الإنجليزية/الصينية) | الخصائص البصرية | |----------------- -|----------| | سينمائي | عمق مجال ضحل، تدرج ألوان على مستوى الأفلام، نسبة عرض إلى ارتفاع 2.39:1 | | وثائقي | إحساس الكاميرا المحمولة باليد، إضاءة طبيعية، تأطير مراقبة | | تجاري | إضاءة واضحة ومشرقة ومركزة على المنتج ودقيقة وحركة سلسة | | أنيمي | أسلوب تظليل الخلايا، ألوان زاهية، حركة مبالغ فيها، خطوط ديناميكية | | فيلم نوار | أحادي اللون عالي التباين، ظلال ستائر فينيسية، إضاءة خافتة | | غسل الحبر | حبر أسود على أرضية بيضاء، تدرجات سائلة، بساطة، جماليات شرقية | | فيلم كلاسيكي | حبيبات الفيلم، ألوان غير مشبعة قليلاً، درجات ألوان دافئة، حواف ضبابية | | سايبربانك | ألوان نيون زاهية، تباين عالٍ، عناصر ثلاثية الأبعاد، إحساس بمدينة ما بعد نهاية العالم |

العنصر السابع: الصوت (اختياري)

يضيف الصوت بعدًا سمعيًا. على الرغم من أن جميع المنصات لا تدعم إنتاج الصوت، فإن دمج تصميم الصوت في المطالبات ليس فقط تفكيرًا متقدمًا، بل غالبًا ما يعزز التأثير البصري، حيث تستخدم الذكاء الاصطناعي الإشارات الصوتية للتأثير على النغمة العاطفية وسرعة العرض المرئي.

مكتبة الكلمات المفتاحية:

نوع الصوتمثال (موجه باللغة الإنجليزية)
نمط الموسيقىأوركسترالي، هيب هوب منخفض الدقة، إلكتروني محيطي، بيانو جاز، جيتار أكوستيكي، موسيقى سينمائية (موسيقى تصويرية)
مؤثرات صوتية محيطةالمطر على الزجاج، الرياح بين الأشجار، ضجيج حركة المرور في المدينة، أمواج البحر، طقطقة النار
مؤثرات صوتية للحركةخطوات على الحصى، صرير الباب، تحطم الزجاج، صوت المحرك
أصوات بشريةسرد بصوت خافت، حوار، تنفس، ضحك

اللغة السينمائية: السلاح السري

اللغة السينمائية هي المهارة الأكثر تأثيرًا التي يمكنك تنميتها ككاتب مقترحات فيديو. عندما تكتب "تحرك الكاميرا ببطء" بدلاً من "تقريب الصورة"، فإنك تتحدث بلغة نماذج الذكاء الاصطناعي الأصلية، حيث يتم تدريب هذه النماذج على ملايين الساعات من اللقطات المصورة بشكل احترافي، حيث تحمل حركات الكاميرا أسماء محددة وتنتج تأثيرات بصرية محددة.

هذا القسم هو دليلك المرجعي الشامل. نوصيك بإضافته إلى المفضلة.

دليل مرجعي لحركة الكاميرا يوضح أسماء ومسارات وتأثيرات عاطفية لـ 12 حركة كاميرا متميزة، بما في ذلك: لقطات الدفع/السحب، لقطات التحريك، لقطات التتبع، لقطات الدolly، لقطات الارتفاع، ولقطات اليد.

حركات الكاميرا ليست قابلة للتبديل — فكل منها تنتج تأثيرًا عاطفيًا مميزًا. إن معرفة المصطلحات الصحيحة ستغير تأثير إشاراتك.

التصوير السينمائي الأساسي

دولي إن / دولي آوت (دفع / سحب)

تقترب الكاميرا فعليًا من الهدف (دفع) أو تبتعد عنه (سحب). على عكس التكبير، يتغير المنظور – تظهر الأجسام في المقدمة أكبر نسبيًا، مما يخلق إحساسًا بالعمق والقرب المادي.

  • التأثير العاطفي: يدفع إلى تعزيز الحميمية والتركيز والكشف. يجذب إلى إثارة الشعور بالعزلة والسياق والانفصال.
  • متى يستخدم: يدفع إلى اللقطات العاطفية القريبة ولحظات الشخصيات والكشف عن التفاصيل. تراجع لإظهار الحجم أو الخاتمة أو الانسحاب من الموضوع.
  • عبارة موجهة: "تتحرك الكاميرا ببطء من لقطة متوسطة إلى لقطة مقربة للغاية على يدي الشخصية".

تحريك الكاميرا إلى اليسار / تحريك الكاميرا إلى اليمين (التحريك الأفقي)

تظل الكاميرا ثابتة، وتدور أفقياً كما لو كنت تدير رأسك. وتجوب نقطة الرؤية المشهد بأكمله.

  • التأثير العاطفي: الدورية، الاكتشاف، حركة التتبع الجانبية، ربط عنصرين داخل مشهد.
  • متى تستخدم: عرض المناظر الطبيعية، تتبع الشخصيات المتحركة، إظهار الاتساع المكاني.
  • عبارة موجهة: "تحريك الكاميرا ببطء إلى اليمين عبر الورشة، وكشف صفوف من الآلات المصنوعة يدويًا على الحائط"

إمالة لأعلى / إمالة لأسفل (تحريك رأسي/إمالة)

تظل الكاميرا ثابتة، وتدور عموديًا — كما لو كانت تومئ برأسها. ويكشف التحريك لأعلى عن الارتفاع؛ بينما يكشف التحريك لأسفل عن التفاصيل على مستوى الأرض.

  • التأثير العاطفي: الميل إلى الأعلى يثير الإعجاب والرهبة والشوق. الميل إلى الأسفل يخلق إحساسًا بالثبات والاكتشاف والحميمية مع السطح.
  • متى تستخدم: يستخدم الميل إلى الأعلى للهياكل الشاهقة، والشخصيات التي تقف على أقدامها، أو لإظهار السماء. أما الحركة المائلة لأسفل فتكشف عن الأشياء الموجودة على الطاولة أو الانتقال من السماء إلى الأرض.
  • عبارة موجهة: تتحرك الكاميرا لأعلى من جذور الشجرة القديمة، متتبعة الجذع الضخم حتى تاج الشجرة

تتبع اللقطة (لقطة متابعة/لقطة تتبع جانبية)

تتحرك الكاميرا جنبًا إلى جنب مع الهدف، مع الحفاظ على مسافة وزاوية ثابتة، كما لو كانت مثبتة على مسار موازٍ لمسار الهدف.

  • التأثير العاطفي: الرفقة، الرحلة، الانغماس. يسافر الجمهور جنبًا إلى جنب مع الشخصية.
  • متى تستخدم: للشخصيات التي تمشي أو تركض، أو تعبر المساحات، أو تعرض المنتجات على الأسطح.
  • عبارة موجهة: "تتبع الكاميرا العداءة على ارتفاع الكتف، وتواكب سرعتها وهي تركض في الزقاق".

مدار / قوس (لقطة تتبع دائرية)

تدور الكاميرا حول الهدف مع إبقائه في منتصف الإطار. قد يتضمن ذلك دورانًا كاملًا بزاوية 360 درجة أو قوسًا جزئيًا.

  • التأثير العاطفي: حضور بطولي، إحساس بالقوة، جودة العرض، عرض ثلاثي الأبعاد.
  • متى تستخدم: عروض المنتجات (عرض جميع الزوايا)، لقطات بطولية، تقديم شخصيات درامية، لحظات حاسمة.
  • عبارة موجهة: تدور الكاميرا 180 درجة حول لاعب الشطرنج، بدءًا من الخلف وانتهاءً بالوجه

رفع الرافعة / إنزال الرافعة (لقطة مرتفعة / لقطة جيب)

عادةً ما يتم الجمع بين حركة الكاميرا العمودية —الارتفاع أو الانخفاض المادي— والإمالة لإبقاء الهدف داخل الإطار.

  • التأثير العاطفي: الصعود يخلق إحساسًا بالسمو والتحرر وتوسيع الأفق. النزول يعزز التوازن والوصول والتركيز.
  • متى يستخدم: الصعود للاستنتاجات أو لحظات الانتصار أو الانتقال إلى منظورات جوية. يستخدم التصوير الهابط في الافتتاحيات والوصول والانتقال من اللقطات الواسعة إلى التراكيب الحميمة.
  • عبارة موجهة: "ترتفع الكاميرا من مستوى الأرض، وترتفع فوق الحشد، لتكشف عن الحجم الكامل للمهرجان".

محمول (عدسة محمولة)

تظهر العدسة اهتزازًا عضويًا طفيفًا — فهي غير مثبتة على حامل ثلاثي القوائم أو مثبت. وهذا يحاكي إحساس المصور البشري الذي يحمل الكاميرا بيده.

  • التأثير العاطفي: الفورية، الإلحاح، المصداقية الوثائقية، التوتر، الحميمية.
  • متى تستخدم: مشاهد الحركة، الحوار العاطفي، الأنماط الوثائقية، أفلام الرعب، أي مشهد يتطلب إحساسًا بالانغماس.
  • عبارة موجهة: "تتبع الكاميرا المحمولة باليد الشخصية عبر السوق المزدحم، وهي غير مستقرة قليلاً".

ستيديكام / جيمبال (عدسة ستيديكام/مثبت)

تتحرك الكاميرا بانسيابية وسلسلة عبر الفضاء. على عكس اللقطات الملتقطة باليد، لا يوجد أي اهتزاز — فالحركة سلسة ومستمرة.

  • التأثير العاطفي: استكشاف شبيه بالحلم، أنيق، غامر، مريح.
  • متى تستخدم: التنقل في المساحات المعمارية، متابعة الشخصيات عبر بيئات معقدة، لقطات من مرة واحدة، تصوير سينمائي فاخر وجمالي.
  • عبارة موجهة: "تنزلق الكاميرا الثابتة خلف الراقصة وهي تتحرك عبر قاعة الرقص الفارغة"

تقنيات متقدمة لتحريك الكاميرا

تقريب هيتشكوك (تقريب دوللي / تأثير الدوار)

عندما تقوم الكاميرا بالتقريب، يزداد البعد البؤري (أو العكس). يظل حجم الهدف كما هو، ولكن الخلفية تتعرض لتشوه كبير — إما بالتمدد أو بالانضغاط.

  • التأثير العاطفي: الارتباك، الإلهام، الرهبة، العالم يتغير حول نقطة ثابتة.
  • عبارة موجهة: "تقريب الكاميرا على وجه الشخصية — تقترب الكاميرا بينما تبتعد العدسة، وتبتعد الخلفية، مما يخلق تأثير الدوار".

Whip Pan

تحريك أفقي سريع للغاية، مما يؤدي إلى ظهور الإطار بأكمله بشكل ضبابي أثناء الحركة. يستخدم عادةً كانتقال بين مشهدين.

  • التأثير العاطفي: الطاقة، المفاجأة، الإلحاح، التوقيت الكوميدي.
  • عبارة الإشارة: "تحريك الكاميرا بسرعة من وجه المتحدث إلى رد فعل الجمهور، مع وجود ضبابية الحركة أثناء الانتقال"

تركيز الرف (سحب التركيز)

ينتقل التركيز من مستوى عمق إلى آخر داخل لقطة واحدة. تصبح الصورة الأمامية ضبابية بينما تصبح الصورة الخلفية أكثر وضوحًا، أو العكس.

  • التأثير العاطفي: يعيد توجيه الانتباه، ويكشف المعلومات، ويربط بين عناصر المقدمة والخلفية.
  • عبارة موجهة: "حول التركيز من الزهور الضبابية في المقدمة إلى وجه المرأة في الخلفية"

الزاوية الهولندية (زاوية مائلة)

تنحرف العدسة على طول المحور الأفقي، مما يخلق أفقًا قطريًا. يبدو العالم مائلًا.

  • التأثير العاطفي: القلق، عدم الاستقرار، التوتر، الدراما المنمقة، الهياج.
  • العبارة الموجهة: "لقطة مقربة بزاوية هولندية لوجه المحقق، ميل 15 درجة، إضاءة جانبية قاسية"

منحدر السرعة (تدرج الوقت)

تختلف سرعة التشغيل داخل لقطة واحدة — وعادةً ما تتباطأ في اللحظات الحاسمة قبل أن تتسارع مرة أخرى.

  • التأثير العاطفي: التأكيد والتأثير وإضفاء وزن درامي على لحظات معينة.
  • عبارة موجهة: "تتحول الحركة إلى حركة بطيئة في لحظة التصادم، ثم تعود إلى السرعة الطبيعية".

لقطة واحدة (لقطة طويلة)

تصوير مستمر دون تحرير. تتنقل الكاميرا عبر المساحات، وتتبع الحركات، وتكتشف العناصر، مع الحفاظ على منظور واحد دون انقطاع طوال الوقت.

  • التأثير العاطفي: تجربة غامرة في الوقت الفعلي، إحساس بالإتقان التقني، تراكم مستمر للتوتر.
  • عبارة موجزة: "لقطة واحدة متواصلة: تدخل الكاميرا من الباب الأمامي، تنزلق عبر الرواق، وتصل إلى الحديقة".

الشخص الأول / وجهة النظر

الكاميرا تمثل عيون الشخصية. يرى الجمهور ما تراه الشخصية، بما في ذلك أيديها التي تدخل في الإطار.

  • التأثير العاطفي: الانغماس التام، التجربة الذاتية، جماليات اللعبة.
  • عبارة موجهة: منظور الشخص الأول: تدفع اليدان بابًا خشبيًا ثقيلًا، لتكشف عن مرج مضاء بنور الشمس

للاطلاع على ميزات التحكم الفريدة في الكاميرا في Seedance وكيفية دمجها في الجدول الزمني للقصص المصورة، يرجى الرجوع إلى دليل Seedance Prompt.


مكتبة الكلمات المفتاحية الخاصة بالجو

الجو هو المفتاح لتحويل الفيديو الجيد تقنيًا إلى عمل مؤثر عاطفيًا. إنه الفرق بين "غرفة" و"غرفة تجعلك تشعر بشيء ما". تم تنظيم مكتبة الكلمات الرئيسية هذه عبر أربعة أبعاد — الإضاءة، وتدرج الألوان، والملمس، والمزاج — مما يتيح لك المزج والمطابقة لخلق الشعور الذي تريده بدقة.

جدول مرجعي لكلمات مفتاحية لفيديو الذكاء الاصطناعي من أجل الجو، مصنف حسب أربعة أبعاد: الإضاءة، درجة اللون، الملمس، والمزاج، مصحوب بأمثلة بصرية.

مكتبة الكلمات المفتاحية للأجواء: حدد كلمة مفتاحية واحدة من كل بُعد لتعريف الطابع العاطفي لمقطع الفيديو الخاص بك.

كلمات مفتاحية عن الضوء والظل

تشكل الإضاءة أساس الجو العام. يمكن أن يؤدي تغيير الإضاءة في الموجه إلى تغيير المزاج تمامًا مع ترك جميع العناصر الأخرى دون تغيير.

| الكلمات الرئيسية (الإنجليزية/الصينية) | التأثيرات البصرية | السيناريوهات المناسبة | |-------|----------|--------- -| | الساعة الذهبية | ضوء كهرماني دافئ، ظلال طويلة ناعمة، ألوان بشرة جذابة | الرومانسية، الحنين إلى الماضي، السفر، الجمال | | الساعة الزرقاء | ضوء أزرق غامق، ألوان دافئة متبقية في الأفق | الحزن، التأمل، الانتقال، الأجواء الحضرية | | الإضاءة الخلفية | موضوع محدد بواسطة مصدر ضوء خلفي، ظلال الوجه أو الصور الظلية | الدراما، الغموض، اللقطات البطولية، الجاذبية الجمالية | | الإضاءة الجانبية | ضوء قوي موجه من جانب واحد، نصف مضاء ونصف مظلل | التوتر، لقطات مقربة للشخصيات، صور درامية | | إضاءة رامبرانت | إضاءة كلاسيكية للصور الشخصية – جانب واحد مضاء، مع ضوء مثلثي صغير تحت العين على الجانب المظلل | صور شخصية، أناقة، أجواء كلاسيكية | | الإضاءة الحجمية | أشعة مرئية تمر عبر الغبار أو الضباب أو الدخان | المقدس، المسرح، مشاهد الغابة، إضاءة المسرح | | تأثير تيندال | يتشتت الضوء داخل جزيئات دقيقة، مكونًا أشعة مميزة داخل الضباب | طبيعي، مشاهد الفجر، أثيري، شبيه بالحلم | | النيون | مصادر ضوء ملونة اصطناعية، غالبًا باللون الوردي أو الأزرق أو السماوي أو الأرجواني | سايبربانك، الحياة الليلية، الحضرية، المعاصرة | | ضوء الشموع | دافئ، متلألئ، مصدر ضوء برتقالي-كهرماني | حميمية، تاريخ، مشاهد عشاء، دفء | | الصورة الظلية | موضوع مظلم بالكامل، محدد فقط بخطوطه العريضة على خلفية مشرقة | غموض، إخفاء الهوية، تأثير بصري، سرد | | البيولوجي | مصدر ضوء عضوي ذاتي الإضاءة، عادةً ما يكون أزرق-أخضر | خيال، تحت الماء، عوالم غريبة، أشبه بالحلم |

كلمات مفتاحية تتعلق بالألوان

تحدد الألوان درجة الحرارة العاطفية للتكوين بأكمله. تبعث الألوان الدافئة شعوراً بالترحيب، بينما تبعث الألوان الباردة شعوراً بالبعد. تبعث الألوان عالية التشبع شعوراً بالحيوية، بينما تبعث الألوان منخفضة التشبع شعوراً بالهدوء.

| الكلمات الرئيسية (الإنجليزية/الصينية) | التأثيرات البصرية | التناغم العاطفي | |-------|----------|--------- -| | ألوان دافئة | تغلب عليها درجات اللون العنبر والبرتقالي والذهبي والأحمر | الراحة والحنين إلى الماضي والحميمية والخريف | | ألوان باردة | تغلب عليها درجات اللون الأزرق والسماوي والرمادي | البعد والهدوء والحزن والشتاء والتكنولوجيا | | تشبع عالٍ | ألوان زاهية، مكثفة، قوية | طاقة، شباب، خيال، ثقافة البوب | | غير مشبع | ألوان ناعمة، باهتة، شبيهة بالألوان الباستيل | حزن، واقعية، ذكريات، رجعية | | أزرق مخضر وبرتقالي | تدرج ألوان الأفلام الكلاسيكية — ظلال باردة، إضاءة دافئة | أفلام هوليوود الشهيرة، الإعلانات التجارية، السينما | | لوحة ألوان سايبربانك | وردي نيون، أزرق كهربائي، بنفسجي غامق على خلفيات داكنة | مستقبلي، حياة ليلية، رقمي، طليعي | | كلاسيكي | باهت قليلاً، درجات دافئة، ظلال بارزة | حنين إلى الماضي، السبعينيات والثمانينيات، أفلام مستقلة، ذكريات | | ألوان ترابية | بني، أخضر، مغرة، تيراكوتا | الطبيعة، الجذور، العضوية، الوثائقي | | Kodachrome | أخضر وأحمر غنيان، درجات لون البشرة دافئة، أسود غامق | التصوير الصحفي، الستينيات والسبعينيات، الجمالية الأمريكية |

كلمات مفتاحية تتعلق بجودة النسيج/الصورة

تحدد النسيج السطح البصري للفيديو — سواء كان يشبه فيلم 35 مم أو إعلانًا مصقولًا أو فيلمًا وثائقيًا أو لوحة زيتية.

| الكلمات الرئيسية (الإنجليزية/الصينية) | المؤثرات البصرية | السيناريوهات القابلة للتطبيق | |-------|--------- -|----------| | سينمائي | إحساس بالشاشة العريضة، عمق مجال ضحل، لوحة ألوان سينمائية | السرد، الدراما، رواية القصص | | وثائقي | إضاءة طبيعية، تركيبات غير مثالية قليلاً | الواقعية، الأخبار، التعليم | | إعلانات | إضاءة نظيفة ومشرقة ودقيقة، حركة كاميرا سلسة | عرض المنتجات، الإعلانات، الشركات | | حبيبات الفيلم | نسيج ضوضاء عضوي مضاف على الصورة | رجعي، تناظري، مستقل، دافئ | | مشوه | توهج عدسة أفقي، بوكيه بيضاوي، تشويه طفيف للحواف | دراما سينمائية، خيال علمي، إحساس ملحمي | | نسيج اللوحة الزيتية | نسيج ضربات الفرشاة المرئي، تأثير إمباستو غني | فن، خيال، مناظر أحلام، كلاسيكي | | غسل الحبر | تدرجات الحبر الأسود على خلفية بيضاء، عضوي سائل | جماليات شرقية، بساطة، هدوء | | 8 مم / سوبر 8 | حبيبات كثيفة، تسرب ضوء، لقطات غير مستقرة، ألوان باهتة | ذكريات، ذكريات الماضي، فيديوهات منزلية، حنين إلى الماضي |

الكلمات المفتاحية العاطفية

توفر الكلمات المفتاحية العاطفية للذكاء الاصطناعي اتجاهه العاطفي. فهي تؤثر على كل شيء — السرعة، واختيار الألوان، وسلوك الكاميرا، والشعور العام.

| الكلمات الرئيسية (الإنجليزية/الصينية) | المشاعر المستحثة | اقتراحات الاقتران | |-------|----------- -|----------| | مريح | الدفء، الراحة، الأمان، المنزل | ضوء الشموع، الألوان الدافئة، المشاهد الداخلية | | متوتر | القلق، الترقب، الأحداث الوشيكة | الإضاءة الجانبية، اللقطات المحمولة باليد، الإطارات الضيقة | | مشوق | الخوف، عدم اليقين، التراكم البطيء | إضاءة خافتة، تقدم تدريجي، تشبع منخفض | | مبهج | السعادة، الاحتفال، خفة | الساعة الذهبية، تشبع عالٍ، لقطات طويلة | | حزين | حزن، شوق، جمال في الحزن | الساعة الزرقاء، ألوان باردة، حركة بطيئة | | ملحمي | عظمة، بطولة، إثارة للإعجاب | زوايا واسعة، لقطات متحركة، موسيقى أوركسترالية | | شفاء | هدوء، استعادة، إصلاح لطيف | إضاءة خافتة، ألوان باستيل، ألوان طبيعية، إيقاع بطيء | | رعب | خوف، غرابة، قلق | ظلال عميقة، زوايا هولندية، تشبع منخفض، صمت | | رومانسية | حب، شوق، حنان، حميمية | إضاءة خلفية، ألوان دافئة، عمق مجال ضحل، لقطات مقربة | | حيوية | السرعة، الإثارة، الأدرينالين | اهتزاز الكاميرا، سرعة متغيرة، تشبع عالٍ، زاوية واسعة | | حنين | الحنين إلى الماضي، الذكريات الحلوة والمرة | حبيبات الفيلم، ألوان عتيقة، إضاءة زائدة |

تركيبات الكلمات الرئيسية المتعلقة بالجو: ثلاثة أمثلة

تكمن القوة الحقيقية في اختيار كلمة أو كلمتين رئيسيتين من كل بعد ودمجهما معًا. تخلق التركيبات الثلاث التالية أجواء مختلفة تمامًا لنفس الموضوع، وهي امرأة تقف عند النافذة:

التركيبة الأولى: الحنين الدافئ

إضاءة خلفية في الساعة الذهبية، لوحة ألوان دافئة بدرجات الكهرمان والعسل، نسيج حبيبات الفيلم، جو حنيني

التركيبة الثانية: توتر مخيف

إضاءة جانبية من مصدر واحد، ألوان زرقاء خضراء باردة، نسيج رقمي واضح، جو متوتر

التركيبة الثالثة: روحانية وحالمة

تأثير تيندال لأشعة الضوء عبر الستائر الشفافة، ألوان الباستيل، ملمس الألوان المائية، جو مريح

نفس الموضوع، ثلاثة مقاطع فيديو مختلفة تمامًا. كلمة السر هي لوحة التحكم.


من العبارات المفردة إلى المطالبات السينمائية: 5 أمثلة متقدمة

أفضل طريقة لتعلم الكتابة السريعة هي مراقبة عملية تطور المطالبات. يتطور كل مثال أدناه من V1 الأساسي (النوع الذي يكتبه معظم الناس) إلى V2 (إضافة الخصوصية وحركة الكاميرا)، وينتهي بـ V3 (مطالبة محددة بالكامل وذات جودة سينمائية). لاحظ التغييرات التي تحدث في كل مستوى وأسباب تنفيذها.

لمزيد من الأمثلة الجاهزة للاستخدام على مطالبات الفيديو، انظر 10 مطالبات فيديو عملية للذكاء الاصطناعي.

مقارنة بين ثلاث مراحل من التطور السريع، تعرض المطالبات الأساسية V1، والمطالبات المحسّنة V2 (التي تتضمن حركة الكاميرا وتأثيرات الإضاءة)، والمطالبات السينمائية V3 (المحددة بالكامل)، والتي تظهر كل منها التحسينات المقابلة في جودة الفيديو.

التطور السريع في الممارسة. لا تزود النسخة V1 الذكاء الاصطناعي بأي معلومات تقريبًا. بينما تزوده النسخة V3 بكل شيء – والنتيجة تختلف تمامًا.

مثال 1: صورة شخصية/عاطفة — "امرأة تمشي تحت المطر"

V1 — الإصدار الأساسي (18 كلمة)

A woman walking in the rain at night in a city, cinematic, beautiful

ستحصل على: امرأة عادية، مدينة عادية، مطر عادي، إضاءة باهتة، لا يوجد أي تأثير عاطفي. الذكاء الاصطناعي يملأ كل فراغ بالمتوسطات الإحصائية.

V2 — نسخة محسّنة (62 كلمة)

A young Asian woman in a long dark coat walks slowly through a rain-soaked Tokyo backstreet at night. Neon signs reflect in the wet pavement, casting pink and blue light. She carries a transparent umbrella. Camera tracks beside her at shoulder height. Shallow depth of field. Melancholic mood.

ما تم تحسينه: هوية موضوع محددة، موقع محدد، مصدر ضوء محدد، موضع الكاميرا، الاتجاه العاطفي. تمتلك الذكاء الاصطناعي الآن معلومات كافية لإنشاء صور فريدة.

V3 — جودة سينمائية (138 كلمة)

A woman in her late 20s, Japanese, long black hair partially wet and clinging to her neck, wearing an oversized charcoal wool coat over a cream turtleneck, walks alone through a narrow Shinjuku backstreet at 2am. Rain falls in fine sheets, catching neon light from izakaya signs overhead — warm amber kanji characters and cold blue beer advertisements. The wet asphalt mirrors everything, creating a double world beneath her feet. She carries a transparent vinyl umbrella, water beading and streaming down its surface.

Camera: tracking shot at shoulder height, moving alongside her at walking pace, shallow depth of field at f/1.4, foreground rain droplets occasionally crossing the lens out of focus.

Lighting: practical neon sources only — no fill light. Rim light from signs behind her outlines her coat collar and umbrella edge. Her face catches intermittent warm light as she passes each shopfront.

Style: cinematic, Kodak Vision3 500T film stock, slight grain, teal-and-amber color grade, Wong Kar-wai atmosphere.

الصوت: صوت المطر على سطح المظلة، صوت موسيقى الجاز البعيد والمكتوم من حانة، صوت خطواتها على الحجر الرطب، لا حوار، لا موسيقى تصويرية.

(امرأة يابانية في العشرينات من عمرها، شعرها الأسود الطويل مبلل جزئياً ويلتصق برقبتها، ترتدي معطفاً كبيراً من الصوف الرمادي الفاتح فوق بلوزة كريمية اللون بياقة عالية، تمشي وحدها في الأزقة الضيقة في شينجوكو في الساعة 2 صباحاً. تقاطعت خيوط المطر الخفيف مع وهج النيون لافتات الإيزاكايا فوقها — أحرف يابانية دافئة بلون الكهرمان وإعلانات بيرة زرقاء باردة. عكس الطريق الرطب كل شيء، مكونًا عالمًا معكوسًا تحت قدميها. كانت تحمل مظلة بلاستيكية شفافة، تتكثف قطرات المطر وتتساقط على سطحها.)

لماذا تعمل V3: كل عنصر من عناصر الصيغة محدد بشكل واضح. لا يوجد مجال لتخمين الذكاء الاصطناعي – عندما لا يقوم الذكاء الاصطناعي بالتخمين، فإنه يعرض بالضبط ما تصفه.

مثال 2: عرض المنتج — "الساعة على المكتب"

V1 — الإصدار الأساسي (14 كلمة)

A luxury watch sitting on a table, product shot, high quality, 4K

V2 — طبعة منقحة (58 كلمة)

A stainless steel dive watch with a dark blue dial rests on a slab of raw gray marble. Camera orbits slowly around the watch, 15 degrees above. Single key light from the upper left creates a defined shadow. The watch's crystal catches the light and creates a brief flare. Commercial style, clean background.

V3 — جودة سينمائية (126 كلمة)

A stainless steel dive watch with a sunburst navy-blue dial and ceramic bezel sits on a rough-cut block of Carrara marble, positioned at the golden-ratio intersection of the frame. The second hand sweeps continuously. Micro water droplets bead on the crystal surface and the steel bracelet links, catching light.

Camera: begins in macro extreme close-up on the dial — the indices and lume dots fill the frame — then slowly dollies out while simultaneously orbiting clockwise, completing a 270-degree arc over 8 seconds until the full watch and marble base are revealed in a three-quarter beauty shot.

Lighting: single hard key light at 10 o'clock position, 45 degrees above. No fill — deep shadows on the right side. A subtle rim light from behind separates the watch from the dark charcoal background.

Style: high-end commercial, ultra-sharp 8K downscaled to 4K, zero grain, clinical precision. Color: cool steel tones with warm gold accents from the lume.

الصوت: صمت شبه تام — فقط صوت طقطقة ميكانيكية خافتة للحركة، ورنين واحد واضح في لحظة التوهج.

(ساعة غوص من الفولاذ المقاوم للصدأ، مزودة بمينا زرقاء داكنة مع إطار من السيراميك، توضع على كتلة من رخام كارارا المقطوع بشكل خشن والموضوعة عند تقاطع النسبة الذهبية للإطار. عقرب الثواني يواصل حركته. تتكثف قطرات صغيرة من الماء على سطح الكريستال ووصلات السوار الفولاذي، عاكسة الضوء.)

المثال 3: السفر السياحي — "الجبال عند شروق الشمس"

V1 — الإصدار الأساسي (12 كلمة)

Beautiful mountains at sunrise, drone shot, epic landscape, cinematic

V2 — الطبعة المنقحة (55 كلمة)

Snow-capped mountain peaks emerging from a sea of clouds at sunrise. The first rays of sun paint the peaks golden while the valleys remain in blue shadow. Camera cranes up slowly from the cloud layer, revealing the full mountain range. Wide angle, epic scale, warm-to-cool color gradient.

V3 — جودة سينمائية (134 كلمة)

The Dolomites at sunrise in late autumn. Jagged limestone spires — the Tre Cime di Lavaredo — pierce through a thick layer of valley clouds, their east-facing faces catching the first horizontal rays of sun and turning from cold blue-gray to blazing amber-gold. The cloud layer below is a rolling ocean of soft white and pale peach, filling the valleys completely.

Camera: starts buried inside the cloud layer — visibility near zero, soft white diffusion everywhere — then cranes upward at a steady pace, breaking through the cloud surface to reveal the peaks and the vast sky above. The transition from claustrophobic fog to infinite horizon takes 4 seconds. Continue rising to a high aerial wide shot. 24mm wide angle lens.

Lighting: first light of day — sun at 5 degrees above the eastern horizon, casting extreme raking light across the mountain faces. Golden hour warmth on lit surfaces, blue hour coolness in shadowed areas. Volumetric light beams visible where sun cuts between peaks.

Style: National Geographic cinematic, IMAX-quality, ultra-wide dynamic range, vivid but natural color, no filters.

الصوت: ريح على ارتفاع — همسة منخفضة مستمرة مع هبوب رياح من حين لآخر، بدون موسيقى، بدون أصوات بشرية. الصمت يضخم الحجم.

(شروق الشمس في أواخر الخريف في جبال الدولوميت. أطراف صخرية من الحجر الجيري — القمم الثلاث — تخترق السحب الكثيفة في الوادي، وجوانبها الشرقية تستقبل أول أشعة الشمس الأفقية، وتتحول من اللون الأزرق الرمادي البارد إلى اللون الكهرماني الذهبي الناري.)

مثال 4: مشهد حركة — "فنان قتالي يوجه لكمة"

V1 — الإصدار الأساسي (15 كلمة)

A martial artist doing a spinning kick, action movie style, slow motion

V2 — نسخة محسّنة (64 كلمة)

A female martial artist in a dark training hall performs a spinning back kick. Her bare foot connects with a hanging heavy bag, sending it swinging violently. Camera captures the kick from a low angle, slightly slow motion at the point of impact, then returns to real-time as she recovers her stance. Side lighting creates dramatic shadows.

V3 — جودة سينمائية (141 كلمة)

A woman in her 30s, lean and muscular, wearing a fitted black tank top and loose gray training pants, stands in a dimly lit martial arts gym. Worn wooden floor, heavy bags hanging in rows, chalk dust suspended in the air. She explodes from stillness — a spinning hook kick that arcs through 360 degrees, her back heel striking a leather heavy bag at head height.

Camera: starts medium shot at 45-degree angle. As the spin begins, camera speed-ramps to 240fps slow motion — her hair whips in an arc, chalk dust traces the path of her foot, the bag surface ripples visibly on impact. Hold for one beat, then ramp back to real-time as she plants her foot. Slight handheld energy.

Lighting: single harsh side light from camera-left, no fill. Chalk dust and sweat particles glow in the light beam.

Style: David Fincher / Fight Club aesthetic — desaturated, greenish-teal undertone, high contrast, gritty. Anamorphic lens with subtle horizontal flares.

الصوت: صمت قبل الركلة — ضجيج صالة الألعاب الرياضية، شهيق. الركلة: صوت قماش ينفجر، صوت ارتطام جلد ثقيل، صوت قعقعة سلسلة. زفيرها الحاد عند التلامس. لا موسيقى.

(امرأة في الثلاثينيات من عمرها، نحيفة وذات عضلات، ترتدي سترة سوداء ضيقة وسروال تدريب رمادي فضفاض، تقف في قاعة فنون قتالية مضاءة بإضاءة خافتة. أرضية خشبية بالية، صفوف من أكياس الملاكمة المعلقة، غبار عالق في الهواء. تنفجر من السكون — ركلة خطافية تدور 360 درجة، كعبها يضرب الكيس الجلدي على ارتفاع الرأس.)

المثال 5: السرد العاطفي — "الجدة والحفيد"

V1 — الإصدار الأساسي (16 كلمة)

A grandmother and her grandchild spending time together, heartwarming, emotional, beautiful moment

V2 — طبعة منقحة (71 كلمة)

An elderly grandmother with silver hair and weathered hands teaches her 5-year-old granddaughter how to knead bread dough in a sunlit country kitchen. The child stands on a wooden step stool, flour on her cheeks, laughing. The grandmother guides her small hands through the dough. Golden morning light through a window. Warm color palette. Intimate, cozy atmosphere.

V3 — جودة سينمائية (147 كلمة)

A Japanese grandmother in her 80s, silver hair in a soft bun, deep expression lines around smiling eyes, wearing an indigo apron over a cream linen blouse, stands beside her granddaughter — age 4 or 5, round cheeks, short black hair with a red clip — at a low wooden table in a traditional kitchen. Shoji screen doors are slid open to a small garden where morning light enters. They are making mochi together. The grandmother's large, weathered hands wrap around the child's tiny ones, guiding them to fold and press the soft rice dough. Flour dust floats in the shaft of sunlight between them.

Camera: close-up on their four hands working the dough — the contrast of old and young skin. Slowly dolly out to a medium shot including both faces. Rack focus between them — first sharp on the grandmother's eyes, then pulling to the child's smile. 85mm portrait lens, f/2.0, creamy bokeh.

Lighting: natural morning sunlight from the garden, soft and directional, Tyndall effect through the flour dust. No artificial light. The light creates a warm halo around the grandmother's silver hair.

Style: Hirokazu Kore-eda film quality — observational, unhurried, documentary intimacy with cinematic beauty. Kodachrome-inspired color. 16:9.

الصوت: صوت إيقاعي ناعم لليدين تضغطان على العجين، أصوات الطيور في الحديقة، صوت ناعم لرياح بعيدة، ضحكة طفل من حين لآخر، جدّة تهمهم بألحان شعبية. لا موسيقى تصويرية — فقط أصوات داخلية.

(جدة يابانية في الثمانينيات من عمرها، شعرها الفضي مربوط في كعكة فضفاضة، خطوط تعبير عميقة حول عينيها المبتسمتين، ترتدي مئزرًا أزرق نيلي فوق قميص كتاني كريمي اللون. تقف بجانب حفيدتها البالغة من العمر أربع أو خمس سنوات — ذات الخدين المستديرتين والشعر الأسود القصير المثبت بمشبك أحمر — عند الطاولة الخشبية المنخفضة في المطبخ التقليدي. تنزلق أبواب شوجي لتفتح على الحديقة الصغيرة، حيث يتدفق ضوء الصباح. يصنعان معًا الموتشي. تغلف يدا الجدة الكبيرتان، اللتان تحملان علامات السنين، يدي الطفلة الصغيرتين، وتوجههما لطي وضغط عجينة الأرز اللزجة الناعمة. تطاير غبار الدقيق في شعاع ضوء الشمس بينهما. كان ذلك يتميز بصفة هيروكازو كوري-إيدا المميزة — المراقبة، عدم التسرع، الحميمية الوثائقية الممزوجة بالجمال السينمائي.


دمج التصميم الصوتي في الموجه

يمثل تصميم الصوت البعد الأكثر إهمالًا في كتابة مطالبات الفيديو. بحلول عام 2026، أصبحت منصات مثل Seedance و Veo 3 و Keeling تدعم جميعها إنتاج الصوت المتزامن للفيديوهات – وتبين أن الفرق في الجودة بين المطالبات التي تتضمن إشارات صوتية وتلك التي تفتقر إليها كبير جدًا.

تخيلوا هذا: مشهد غابة جميل بدون أصوات محيطة يبدو وكأنه صورة متحركة بتنسيق GIF. أضفوا أصوات العصافير وحفيف أوراق الشجر وخرير مياه النهر البعيد، وسيصبح المكان مكانًا ترغبون في الدخول إليه.

تنسيق تصميم الصوت

أضف الأوامر الصوتية في نهاية الموجه في فقرة أو سطر منفصل، بحيث تغطي ثلاثة مستويات:

الطبقة الأولى: الموسيقى الخلفية — المزاج العام والأسلوب

Background music: slow ambient piano, minor key, sparse notes with reverb
(背景音乐:缓慢的氛围钢琴,小调,稀疏的音符带混响)

الطبقة الثانية: المؤثرات الصوتية المحيطة — إنشاء أصوات خلفية المشهد

Ambient: light rain on leaves, distant thunder rolls, wet road traffic hum
(环境音:轻柔的雨打树叶声、远处的雷声滚动、湿路上的交通嗡嗡声)

الطبقة الثالثة: مؤثرات صوتية للحركة والحوار — أصوات محددة مرتبطة بالأحداث في الفيديو

SFX: footsteps on wet pavement, umbrella opening with a click
Dialogue: none
(音效:湿路面上的脚步声、雨伞咔嗒打开的声音。对话:无)

مرجع الكلمات المفتاحية الصوتية

أنماط موسيقية لمشاعر مختلفة:

المزاجالتوجيه الموسيقي (موجه باللغة الإنجليزية)
هادئموسيقى محيطة، بيانو ناعم، عزف على الجيتار الأكستيكي، صوت منخفض الجودة
متوترطنين منخفض، أوتار متنافرة، إيقاع بسيط
مبهجصوت أكوستيكي مبهج، قيثارة، إيقاع خفيف، نغمة رئيسية
ملحميتصعيد أوركسترالي، طبول تايكو، أبواق نحاسية، جوقة
رومانسيرباعي وتري، جاز لطيف، بوسانوفا
غامضأجواء مظلمة، بيانو كثيف الصدى، نغمات أجراس بعيدة
حيويإيقاع إلكتروني، طبول محفزة، صوت جهير كثيف، إيقاع سريع
حزينتشيلو منفرد، بيانو بطيء في نغمة صغرى، جيتار متقطع

الأصوات المحيطة:

| البيئة | طبقات الصوت (مطالبات باللغة الإنجليزية) | |------|--------------------- -| | الغابة | أصوات العصافير، حفيف الأوراق، صوت نقار الخشب البعيد، صوت الجدول | | الليل في المدينة | ضجيج حركة المرور، صوت صفارات الإنذار البعيدة، ضجيج أضواء النيون، صوت الخطوات | | المحيط | صوت الأمواج المتلاطمة، صوت طيور النورس، صوت الرياح، صوت محرك قارب بعيد | | مقهى داخلي | آلة صنع القهوة، همهمات المحادثات، صوت الملعقة على الخزف، موسيقى الجاز | | يوم ممطر | شدة المطر (طقطقة خفيفة / أمطار غزيرة)، الرعد، قطرات المطر | | ورشة عمل | أصوات الأدوات، نشارة الخشب، أزيز الآلات، الراديو في الخلفية |

متى يجب استخدام الصمت

الصمت ليس غيابًا لتصميم الصوت، بل هو اختيار متعمد. الصمت الاستراتيجي يمكن أن يخلق:

  • لحظات التأثير: الصمت الذي يسبق لحظة درامية يضاعف من قوتها
  • الإحساس بالحجم: المناظر الطبيعية الشاسعة التي لا يقطعها سوى صوت الريح تنقل إحساسًا بالامتداد اللامتناهي
  • التوتر: إزالة الأصوات المتوقعة يخلق شعورًا بالقلق
  • التركيز: الصمت يوجه كل الانتباه نحو العنصر البصري

في الموجه، اذكر صراحةً: "الصوت: صمت — بدون موسيقى، بدون أصوات محيطة، فقط تنفس الشخص المعني".

لمزيد من المعلومات حول إنتاج الصوت في إنتاج مقاطع الفيديو الموسيقية باستخدام الذكاء الاصطناعي، يرجى الرجوع إلى دليل إنتاج مقاطع الفيديو الموسيقية باستخدام الذكاء الاصطناعي.


تقنيات المطالبة الخاصة بالمنصة

تنطبق الصيغة العامة بشكل شامل، ولكن كل منصة فيديو تعمل بالذكاء الاصطناعي تمتلك خصائصها المميزة في تفسير المطالبات. يمكن أن يؤدي تحسين المطالبات خصيصًا للمنصة التي تستخدمها إلى تحسين النتائج بشكل كبير.

مقارنة بين التحسينات الفورية لنفس مفهوم الفيديو عبر خمس منصات فيديو مختلفة تعمل بالذكاء الاصطناعي (Seedance و Sora و Keeling و Runway و Veo 3)

نفس المفهوم — "امرأة تمشي تحت المطر" — تم تحسينه لخمس منصات مختلفة. نفس الصيغة، لكن بتركيز مختلف.

Seedance

المزايا: تنسيق الجدول الزمني للقصص المصورة، تسلسلات متعددة اللقطات، مراجع الصور إلى الفيديو، [مولد مطالبات] مدمج.

تقنيات التحسين:

  • استخدم هيكل جدول زمني للقصص المصورة للتسلسلات المعقدة: قسّم الفيديو إلى لقطات مزودة بعلامات زمنية:
 Shot 1 (0-3s): [描述]
 Shot 2 (3-6s): [描述]
 Shot 3 (6-10s): [描述]
  • استخدم مراجع @Image1 و@Image2 للصور التي تم تحميلها لضمان اتساق الأسلوب والشخصيات
  • اللغة السينمائية تعطي نتائج ممتازة — استخدم مصطلحات محددة (دولي، مسار، مدار) بدلاً من الأوصاف الغامضة ("التحرك نحو")
  • يتضمن تصميم الصوت - Seedance يتعامل مع الإشارات الصوتية
  • سير العمل الأكثر كفاءة: استخدم مولد مطالبات الفيديو لإنشاء مطالبات منظمة من أفكار بسيطة، ثم قم بتحسينها يدويًا

دليل Seedance الشامل الخاص بالمنصة (يضم أكثر من 50 مثالاً)، انظر دليل Seedance.

Sora(OpenAI)

المزايا: سلوك واقعي من الناحية الفيزيائية، وحركة طبيعية، وفهم طبيعي للغة في النصوص الطويلة.

تقنيات التحسين:

  • استخدم فقرات وصفية سلسة بدلاً من القوائم المنظمة—تتفوق Sora في تحليل اللغة الطبيعية
  • ركز على التفاصيل الفيزيائية: الجاذبية، الوزن، خصائص المواد، ديناميكيات السوائل
  • صف كيف " يبدو" - تزيد أوصاف الملمس والمواد من الدقة المادية
  • حدد نسب العرض إلى الارتفاع ومواصفات المدة
  • تفاصيل الفيزياء: "يتأرجح القماش الثقيل مع كل خطوة، متأخرًا بسبب وزنه" يعطي نتائج أفضل مقارنة بـ "تنورة عائمة"

كي لينغ كلينغ (Kuaishou)

المزايا: سرعة إنشاء سريعة، أداء قوي في الحركة والحركة، اتساق ممتاز في الوجه.

نصائح للتحسين:

  • اجعل المطالبات موجزة — تستجيب Keli بشكل أفضل للمطالبات المركزة والموجهة نحو العمل (50-80 كلمة هي الأمثل)
  • ابدأ بالعمل: "راقص يقفز ويدور" بدلاً من ذكر الحركة بعد وصف طويل للمشهد
  • حدد اتجاه الحركة بوضوح: "يتحرك من اليسار إلى اليمين"، "يقترب من الكاميرا"، "يستدير"
  • Keeling يتفوق في تجسيد حركات الإنسان وتعبيرات الوجه — استفد من ذلك في المطالبات العاطفية عن قرب
  • تعليمات حركة الكاميرا فعالة، ولكن يجب أن تحتفظ كل إشارة بحركة أو حركتين متميزتين للكاميرا.

المعنى الشامل، الشكل الشامل / مدرج (الجيل الثالث ألفا / الجيل الرابع)

تقنيات تحسين Tongyi Wanshang:

  • يدعم الإدخال المباشر للمطالبات الصينية، مما ينتج عنه نتائج فائقة مقارنة بالترجمة
  • يظهر فهمًا ممتازًا للعناصر الجمالية الصينية التقليدية — الرسم بالحبر، والأسلوب الوطني، ومشاهد الأزياء التاريخية
  • يحقق نتائج فعالة باستخدام علامات أسلوب موجزة وواضحة

تقنيات تحسين Runway:

  • دمج الأوصاف النصية مع علامات الأنماط — يتمتع Runway بفهم قوي للأنماط
  • وصف الحركة باستخدام المتجهات المكانية: الحركة من أسفل اليسار إلى أعلى اليمين
  • عند استخدام Motion Brush، ركز على النص الموجه للمشهد العام والأسلوب، واستخدم الفرشاة لتحسين مناطق الحركة المحددة
  • يتميز Runway في تفسير الأوصاف الفنية للأسلوب — "على غرار أسلوب أفلام تيرينس مالك" يعطي نتائج ممتازة
  • حافظ على التركيز في التوجيهات — قم بإنشاء مشهد واحد مميز لكل توجيه بدلاً من تسلسلات متعددة اللقطات

Veo 3(Google DeepMind)

المزايا: فهم الصوت، محاكاة فيزيائية، جودة سينمائية، تسلسلات ممتدة.

تقنيات التحسين:

  • تضمين وصف صوتي مفصل — يقوم Veo 3 بإنشاء صوت متزامن من النص
  • وصف التفاعلات الفيزيائية بالتفصيل: كيف تتصادم الأجسام، وكيف تتشوه المواد، وكيف يتفاعل الضوء مع الأسطح
  • استخدام مصطلحات السينما — تعتمد بيانات تدريب Veo 3 بشكل كبير على صناعة الأفلام الاحترافية
  • تحديد المدة والسرعة: تتكشف المشهد ببطء على مدى 10 ثوانٍ
  • تعزز الأوصاف المادية التأثير بشكل كبير: تتناثر المياه لأعلى عند الاصطدام، وتلتقط القطرات الضوء الخلفي بدلاً من مجرد "تتناثر"

للحصول على مقارنة مفصلة بين Seedance و Sora من حيث سرعة الترجمة وجودة المخرجات، يرجى الرجوع إلى مقارنة بين Seedance و Sora.


أو دع الذكاء الاصطناعي يكتب المطالبات نيابة عنك

لقد أكملت للتو الإطار الكامل لإنشاء مطالبات الفيديو من البداية. هذه المعرفة لا تقدر بثمن — فهي تزودك بالقدرة على الحكم بشكل أفضل على جودة المطالبات وتمنحك تحكمًا كاملاً في كل التفاصيل. لكنك لست بحاجة إلى كتابة كل مطالبة يدويًا في كل مرة.

يوضح مخطط سير العمل نهجًا مختلطًا: تولد الذكاء الاصطناعي موجهًا أوليًا منظمًا، ثم يقوم البشر بمراجعته وتحسينه بالنسبة لعناصر محددة. بعد ذلك، ينتج الموجه المحسّن الفيديو النهائي.

سير العمل الهجين: دع الذكاء الاصطناعي يتعامل مع المصطلحات الهيكلية والتقنية، ثم أضف منظورك الإبداعي خلال مرحلة التحسين.

متى يجب الكتابة بخط اليد ومتى يجب استخدام الذكاء الاصطناعي

السيناريوأفضل نهج
لديك رؤية إبداعية دقيقة وتعرف بالضبط ما تريدالكتابة اليدوية — ستكون أسرع وأكثر دقة من تحرير مسودات الذكاء الاصطناعي
لديك فكرة تقريبية ولكنك بحاجة إلى هيكلإنشاء الذكاء الاصطناعي → الصقل اليدوي
تحتاج إلى إنشاء العديد من الاختلافات السريعةإنشاء دفعة بالذكاء الاصطناعي → حدد واحسن الأفضل
أنت تتعلم وترغب في دراسة هياكل المطالباتإنشاء بالذكاء الاصطناعي → اقرأ وحلل — هكذا تبني مفرداتك
تحتاج إلى مطابقة صور مرجعية محددةالكتابة اليدوية — صف بدقة ما تراه في المرجع

سير العمل المختلط (موصى به)

أكثر سير عمل الكتابة الفورية كفاءةً هو الذي يجمع بين التوليد بالذكاء الاصطناعي والتحسين البشري:

  1. ابدأ بالذكاء الاصطناعي. انتقل إلى Seedance مولد مطالبات الفيديو، ووصف فكرتك في جملة أو جملتين، واختر نمطًا، ثم قم بإنشائها.

  2. قم بمراجعة الناتج بعناية. سيقوم الذكاء الاصطناعي بإنشاء موجه منظم يحتوي على لغة حركة الكاميرا والجدول الزمني والإضاءة والصوت. اقرأه جيدًا. هل تتوافق حركة الكاميرا مع النغمة العاطفية المطلوبة؟ هل يخلق اتجاه الإضاءة الجو المطلوب؟ هل هناك أي تفاصيل ترغب في تعديلها؟

  3. التحسين اليدوي. هنا يأتي دور معرفتك بالصيغ ولغة السينما والكلمات المفتاحية ذات التأثير. استبدل اللقطات التي اختارتها الذكاء الاصطناعي بأخرى تتوافق بشكل أفضل مع رؤيتك. اضبط الكلمات المفتاحية المتعلقة بالإضاءة. أضف تفاصيل محددة لا يمكن للذكاء الاصطناعي معرفتها، مثل السمات الخاصة بالشخصيات والمتطلبات الخاصة بالعلامة التجارية والفروق الدقيقة في المشاعر.

  4. إنشاء الفيديو. أرسل الموجه المحسّن إلى مولد الفيديو. ستكون النتائج أفضل بكثير من الموجهات اليدوية تمامًا للمبتدئين أو الموجهات التي تم إنشاؤها بالكامل بواسطة الذكاء الاصطناعي دون التحقق منها.

يمكن العثور على دليل شامل لتشغيل مولدات مطالبات الذكاء الاصطناعي في دليل مولد مطالبات الفيديو بالذكاء الاصطناعي.


التأثيرات السينمائية: الإتقان من خلال التكامل

دعونا نصوغ موجهًا نهائيًا يستخدم كل ما تم تناوله في هذا الدليل — الصيغ، اللغة السينمائية، الكلمات المفتاحية التي تخلق الجو المناسب، تصميم الصوت — لإنتاج تأثير سينمائي حقيقي.

موجز إبداعي: يكتشف رائد فضاء وحيد حياة نباتية على كوكب المريخ.

يصور مقطع فيديو مذهل بجودة سينمائية تم إنتاجه باستخدام الذكاء الاصطناعي رائد فضاء وحيدًا راكعًا وسط تضاريس المريخ القرمزية، وهو يكتشف نبتة خضراء صغيرة، مع إضاءة جانبية درامية وتأثيرات غبار حجمية.

تؤدي المطالبات السينمائية المحددة بالكامل إلى نتائج كما لو كانت من إخراج مخرج أفلام — لأنها في الواقع كذلك. كل عنصر يخدم السرد.

الطلب الكامل:

Subject: A solitary astronaut in a dusty, sun-bleached EVA suit — visor partially reflective, scratched from use, mission patches barely legible. The suit is not pristine Hollywood white; it is a working tool, weathered by months on the Martian surface.

Action: The astronaut crouches beside a small crack in the rust-red basalt. Inside the crack, a single tiny green sprout — two delicate leaves, almost translucent — pushes up through the red soil. The astronaut's gloved hand reaches toward it, hesitates, trembles slightly, then gently touches the soil beside it.

Environment: The Martian surface — a flat, rust-red plain scattered with dark basalt rocks, stretching to low eroded hills on the horizon. The sky is a pale butterscotch-pink. Dust devils move in the far distance. The scene feels vast and achingly empty — except for this one tiny green thing.

Camera: Opens with an extreme wide shot — the astronaut is a small figure in the immense Martian landscape. Slow dolly in over 4 seconds to a medium shot. As the astronaut crouches, camera drops to ground level and continues to a close-up of the gloved hand and the sprout. Rack focus: pull from the hand to the astronaut's visor, where we see the sprout's reflection. 65mm lens, anamorphic.

Lighting: Late Martian afternoon — low sun from camera-right, casting long amber-red shadows. The side light sculpts the EVA suit's texture. The sprout's translucent leaves glow with subsurface scattering as sunlight passes through them — the only green in a world of red. Volumetric dust particles drift through the light beam.

Style: Ridley Scott's The Martian meets Terrence Malick's The Tree of Life. Cinematic, anamorphic, muted Martian color palette with the single point of vivid green as deliberate contrast. Subtle film grain.

Sound: Wind — thin, high-pitched Martian wind, unlike Earth wind. The astronaut's breathing inside the suit — measured at first, then quickening. A single sustained low note from a cello enters as the hand reaches for the sprout. No dialogue. No narration.

رائد فضاء وحيد، يرتدي بذلة EVA مغطاة بالغبار ومبهتة بسبب أشعة الشمس — حاجب العين نصف عاكس، عليه خدوش من الاستخدام، وشارة المهمة بالكاد يمكن تمييزها. هذه البذلة ليست بيضاء نقية مثل بذلات هوليوود؛ إنها أداة عمل، تآكلت بسبب أشهر من العمل على سطح المريخ. يجلس رائد الفضاء بجانب شق ضيق في البازلت الأحمر الصدئ، ويراقب برعمًا أخضر صغيرًا - ورقتان رقيقتان شبه شفافتين - يخترقان التربة القرمزية. تمتد يده المقفازة، تتردد، ترتجف قليلاً، ثم تلمس الأرض بجانبها برفق.

يتضمن هذا الموجه جميع العناصر السبعة النمطية، واللغة السينمائية المحددة (اللقطات البعيدة للغاية، اللقطات المتحركة، تغيير البؤرة)، والكلمات الرئيسية التي تخلق الجو المناسب (الإضاءة الحجمية، التشتت تحت السطحي، العدسة البصرية)، وتصميم الصوت (صوت الرياح المحيطة، أصوات التنفس، نغمة التشيلو المنفردة)، والمراجع الأسلوبية (ريدلي سكوت، تيرينس مالك). كل تفصيل يخدم القوس العاطفي: الوحدة → الاكتشاف → الرهبة.

هذا هو مشروع هندسة الفيديو السريع.


الأسئلة المتكررة

ما هي المدة التي يجب أن تستغرقها مطالبات الفيديو الخاصة بالذكاء الاصطناعي؟

لا يوجد معيار عالمي للطول. يعتمد الطول المناسب على مدى تعقيد مفهومك الإبداعي والمنصة المستخدمة. المستوى V1 (15-30 كلمة) ينتج نتائج عالمية على أي منصة. يمثل المستوى V2 (50-80 كلمة) النطاق الأمثل لمعظم المنصات — فهو محدد بدرجة كافية دون إثقال النموذج. ينتج المستوى V3 (100-200 كلمة) النتائج الأكثر قابلية للتحكم على المنصات التي تدعم المطالبات الطويلة، مثل Seedance و Sora. عند استخدام Keeling، حافظ على حوالي 50-80 كلمة. المقياس الحاسم ليس عدد الكلمات — ولكن ما إذا كان كل عنصر من عناصر الصيغة قد تمت معالجته بشكل شامل.

هل الخبرة في مجال التصوير الفوتوغرافي ضرورية لإنشاء مقاطع فيديو فعالة؟

ليس ضروريًا، ولكن فهمه سيكون مفيدًا للغاية — وقد علمك هذا الدليل للتو المعرفة الأساسية. لا تحتاج إلى شهادة في السينما؛ ما تحتاجه هو معرفة أسماء 10-15 نوعًا من حركات الكاميرا، وفهم التأثير العاطفي لأنماط الإضاءة المختلفة، وامتلاك مفردات لوصف الأجواء. ضع إشارة مرجعية على الأقسام المتعلقة بـ لغة حركة الكاميرا ومكتبة الكلمات المفتاحية للأجواء، وارجع إليها مرارًا وتكرارًا حتى تصبح هذه المصطلحات طبيعية بالنسبة لك.

هل يمكن استخدام نفس الموجه عبر منصات الفيديو المختلفة التي تعمل بالذكاء الاصطناعي؟

بالتأكيد — الصيغة العامة تنطبق بشكل عام. ومع ذلك، تفسر كل منصة المطالبات بشكل مختلف. قد تتطلب المطالبات المُحسّنة لـ Sora (طويلة، سلسة، تركز على الفيزياء) إعادة هيكلة لـ Keeling (أقصر، تركز على الحركة أولاً). يوضح قسم التقنيات الخاصة بالمنصة كيفية التكيف. تظل الصيغة الأساسية دون تغيير؛ فقط يتم تخصيص تنسيق التسليم.

ما الذي يميز هذا الدليل عن دليل Seedance السريع؟

دليل Seedance Prompt خاص بمنصة معينة — فهو يعلمك تنسيق لوحة القصة المصورة في Seedance، ومراجع الصور، وأكثر من 50 موجهة جاهزة للاستخدام. هذا الدليل عالمي — فهو يعلمك المهارات الأساسية لكتابة الموجهات التي تنطبق على أي منصة. اعتبر هذا الدليل كتابك الدراسي، ودليل Seedance دليلك العملي لأداة معينة.

كيف تصف حركة الكاميرا إذا لم تكن على دراية بمصطلحات التصوير السينمائي؟

صف أولاً ما تريد أن يراه الجمهور ويشعر به. "تقترب الكاميرا ببطء من وجه الشخص" هي حركة دوّلية . "الكاميرا تتبع الشخص الذي يمشي من الجانب" هو لقطة تتبع. تفهم منصات الذكاء الاصطناعي الوصف باللغة الطبيعية جيدًا. ومع ذلك، فإن تعلم المصطلحات الفنية (باستخدام [مرجع لغة حركة الكاميرا](#سلاح سري لغة حركة الكاميرا) أعلاه) يؤدي إلى نتائج أفضل بكثير، حيث يتم تدريب نماذج الذكاء الاصطناعي على مقاطع فيديو موصوفة باستخدام هذه المصطلحات المهنية بدقة.

هل يجب تضمين المطالبات العكسية (ما لا يجب تضمينه)؟

تدعم بعض المنصات التوجيهات العكسية، وهي تعليمات تحدد ما يجب تجنبه. ويمكن أن تكون هذه التوجيهات مفيدة: "لا تضع أي نصوص فوق الصورة، ولا علامات مائية، ولا إطارات ضبابية". ومع ذلك، فإن معظم برامج إنشاء الفيديو الحديثة التي تعمل بالذكاء الاصطناعي تتعامل مع مشكلات الجودة بشكل أكثر فعالية من خلال المواصفات الإيجابية. بدلاً من كتابة "لا إضاءة سيئة"، حدد "إضاءة رامبرانت من يسار الكاميرا". بدلاً من "لا لقطات مهتزة"، اذكر "حركة كاميرا ثابتة سلسة". توجه المطالبات الإيجابية الذكاء الاصطناعي نحو النتيجة المرجوة؛ بينما تقتصر المطالبات السلبية على إخباره بما يجب تجنبه، تاركة البدائل للصدفة.

كيف تحافظ على اتساق الشخصية عبر عدة مطالبات؟

يعد الحفاظ على اتساق الشخصيات عبر عدة أجيال من مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي أحد أكثر الجوانب صعوبة في الكتابة السريعة. هناك ثلاث استراتيجيات أثبتت فاعليتها: (1) استخدام وصف مفصل للغاية للشخصية، وتكراره حرفياً بين المطالبات – "امرأة في أواخر العشرينات من عمرها، يابانية، شعر أسود طويل، معطف صوف كبير الحجم بلون فحمي، بلوزة كريمية بياقة عالية". (2) استخدام سير عمل تحويل الصور إلى فيديو — تحميل صور مرجعية للشخصيات من أجل الرسوم المتحركة بالذكاء الاصطناعي. يدعم Seedance ذلك عبر مراجع @Image. (3) إنشاء جميع المقاطع لنفس الشخصية في جلسة واحدة كلما أمكن ذلك، باستخدام بذور أو إعدادات نمط متطابقة.

هل هناك أي أداة يمكن أن تساعدني في كتابة مطالبات الفيديو؟

نعم. يقبل [مولد مطالبات الفيديو] (/video-prompt-generator) من Seedance الأوصاف باللغة الطبيعية لإنشاء مطالبات قائمة لقطات كاملة ومنظمة تشمل لغة حركة الكاميرا والجداول الزمنية والإضاءة وتصميم الصوت. للحصول على إرشادات تشغيلية مفصلة، راجع [دليل مولد مطالبات الفيديو بالذكاء الاصطناعي] (/blog/ai-video-prompt-generator-guide). سير العمل الموصى به: إنشاء بالذكاء الاصطناعي → تحسين يدوي → إنتاج الفيديو.


ابدأ اليوم في كتابة مطالبات فيديو أفضل

أنت الآن تمتلك مجموعة أدوات شاملة: الصيغة المكونة من سبعة عناصر، مرجع لغة حركة الكاميرا الذي يشمل أكثر من 15 تقنية، مكتبة كلمات رئيسية رباعية الأبعاد تغطي أكثر من 50 مصطلحًا، خمسة أمثلة تقدمية توضح التطور من المعايير الأساسية إلى المعايير السينمائية، منهجية تصميم الصوت، وتقنيات التحسين الخاصة بالمنصة.

الفرق بين مخرجات الفيديو التي يتم إنتاجها بواسطة الذكاء الاصطناعي الهواة والمحترفين لا يكمن في الأدوات، بل في المطالبات. وكتابة المطالبات هي مهارة تتحسن مع الممارسة.

ثلاث طرق للبدء:

  1. تدرب على الصيغة. اختر أي موضوع، وصيغ المسودات V1 → V2 → V3. قارن النتائج. ستلاحظ تحسناً فورياً وملحوظاً.

  2. استخدم مولد المطالبات. دع الذكاء الاصطناعي يتولى أمر الهيكل، ثم استخدم معرفتك بحركة الكاميرا والأجواء لتحسين النتيجة. جرب مولد مطالبات الفيديو →

  3. أنشئ أول فيديو لك. اختر أفضل موجه لك وأنشئ فيديو الآن. افتح منشئ الفيديو →

مزيد من الإلهام الفوري والأمثلة الجاهزة للاستخدام:

استكشف Seedance 2.0 →

أفضل فيديو بالذكاء الاصطناعي يمكنك إنشاؤه يبدأ بالموجه التالي الذي تكتبه.

Seedance 2.0 AI

Seedance 2.0 AI

الفيديو بالذكاء الاصطناعي والتكنولوجيا الإبداعية