คู่มือการเขียนข้อความสำหรับวิดีโอ AI: จากมือใหม่สู่คุณภาพระดับภาพยนตร์

Feb 22, 2026

TL;DR

วิดีโอ AI ที่ยอดเยี่ยมเกิดจากคำสั่งที่ยอดเยี่ยม คู่มือนี้จะสอนสูตรคำสั่งวิดีโอแบบสากลให้คุณ—กรอบการทำงานเจ็ดองค์ประกอบที่สามารถนำไปใช้กับแพลตฟอร์มวิดีโอ AI หลักทั้งหมด:

[หัวข้อ] + [การกระทำ] + [สถานที่] + [การเคลื่อนไหวของกล้อง] + [แสง] + [สไตล์] + [เสียง]

คุณจะได้เรียนรู้: สาเหตุหลักที่ทำให้เกิดการล้มเหลวของคำสั่ง (และวิธีแก้ไขทันที), คู่มือภาษาของกล้องที่ครอบคลุมเทคนิคการถ่ายภาพมากกว่า 15 แบบ, ไลบรารีคำค้นหาบรรยากาศที่จัดหมวดหมู่ตามสี่มิติ: แสงสว่าง, โทนสี, ผิวสัมผัส, และอารมณ์, ตัวอย่างคำสั่งที่ก้าวหน้าห้าแบบตั้งแต่พื้นฐานไปจนถึงคุณภาพภาพยนตร์, วิธีการผสานการออกแบบเสียงเข้ากับคำสั่ง, และเทคนิคการปรับแต่งให้เหมาะกับแพลตฟอร์มสำหรับ Seedance, Sora, Kling, Runway, และ Veo 3

นี่ไม่ใช่การสอนเครื่องมือ—นี่คือวิธีการ. ทักษะการเขียนคำแนะนำวิดีโอสามารถนำไปใช้ข้ามแพลตฟอร์มได้; เรียนรู้เพียงครั้งเดียว และนำไปใช้ได้ทุกที่.

คำแนะนำที่สร้างขึ้นโดยอัตโนมัติ →

การสาธิตที่ตัดกัน: คำสั่งวิดีโอ AI ที่คลุมเครือให้ผลลัพธ์ที่จืดชืดและทั่วไป ในขณะที่คำสั่งที่มีโครงสร้างและระดับภาพยนตร์ให้ผลลัพธ์วิดีโอที่มีคุณภาพระดับมืออาชีพ

แนวคิดเดียวกัน แต่ผลลัพธ์ที่แตกต่างกันโดยสิ้นเชิง คำสั่งทางด้านซ้ายระบุว่า: "ผู้หญิงคนหนึ่งกำลังเดินในสายฝน" คำสั่งทางด้านขวาระบุถึงการเคลื่อนไหวของกล้อง ทิศทางของแสง บรรยากาศ และเสียง—ซึ่งโมเดล AI ตอบสนองด้วยคุณภาพระดับภาพยนตร์


ทำไมคำสั่งวิดีโอ AI ส่วนใหญ่จึงล้มเหลว (และวิธีแก้ไข)

ไม่ว่าคุณจะใช้โปรแกรมสร้างวิดีโอ AI แบบใด—Seedance, Sora, Keeling, Runway, Veo 3—หลักการพื้นฐานยังคงเหมือนเดิม: ยิ่งข้อความที่คุณป้อนมีความแม่นยำและสมบูรณ์ในเชิงโครงสร้างมากเท่าไร ผลลัพธ์ที่ได้ก็จะยิ่งควบคุมได้และดูเป็นภาพยนตร์มากขึ้นเท่านั้น คนส่วนใหญ่มักเขียนข้อความกระตุ้น (prompt) ราวกับกำลังอธิบายภาพถ่ายให้เพื่อนฟัง แต่วิดีโอไม่ใช่ภาพถ่าย วิดีโอเกี่ยวข้องกับการเคลื่อนไหว เวลา พฤติกรรมของกล้อง การเปลี่ยนแปลงของบรรยากาศ และเสียง

ด้านล่างนี้คือห้าสาเหตุที่พบบ่อยที่สุดสำหรับการล้มเหลวของระบบ พร้อมวิธีแก้ไขทันที

  1. ไม่ชัดเจนเกินไป – ปัญหาของ "พระอาทิตย์ตกที่สวยงาม"

ความล้มเหลวของคำสั่งที่พบบ่อยที่สุด คุณเขียนว่า "พระอาทิตย์ตกที่สวยงามริมทะเล" แล้วได้รับข้อความที่แม่นยำทางเทคนิคแต่ไร้ความรู้สึก ซึ่งคล้ายกับภาพสกรีนเซฟเวอร์ทั่วไป

ปัญหาไม่ได้อยู่ที่ว่า AI ไม่สามารถสร้างภาพพระอาทิตย์ตกได้ แต่เป็นเพราะ 'ความงาม' และ 'พระอาทิตย์ตก' เป็นข้อมูลเพียงอย่างเดียวที่คุณให้ไว้ เมื่อ AI ได้พบเห็นภาพพระอาทิตย์ตกนับล้านครั้งในข้อมูลการฝึกฝน มันจึงเลือกค่าเฉลี่ยทางสถิติ—และค่าเฉลี่ยนั้นโดยธรรมชาติแล้วก็คือความธรรมดา

ก่อนการแก้ไขหลังการแก้ไข
พระอาทิตย์ตกดินอันงดงามเหนือมหาสมุทรแสงสีทองยามโกลเด้นอาวร์สาดส่องปกคลุมชายฝั่งแปซิฟิกที่เงียบสงบ คลื่นซัดกระทบโขดหินภูเขาไฟ ดวงอาทิตย์ลอยอยู่เหนือขอบฟ้าเพียงสองนิ้ว ความลาดเอียงของท้องฟ้าเปลี่ยนสีจากสีเหลืองอำพันเข้มที่ขอบฟ้าผ่านสีชมพูแซลมอนไปจนถึงสีม่วงอ่อนที่จุดสูงสุด เงายาวทอดยาวไปยังกล้อง ดวงอาทิตย์ลอยอยู่เหนือขอบฟ้าสองนิ้วมือ ท้องฟ้าค่อยๆ เปลี่ยนสีจากสีเหลืองอำพันเข้มที่ขอบฟ้าเป็นสีชมพูแซลมอนไปจนถึงสีม่วงอ่อนที่จุดสูงสุด เงายาวทอดยาวไปยังกล้อง)

วิธีการแก้ไข: แทนที่คำคุณศัพท์ ("สวยงาม", "น่าทึ่ง", "ตระการตา") ด้วยรายละเอียดที่เฉพาะเจาะจงและสังเกตได้—สี, ตำแหน่ง, ผิวสัมผัส, ความสัมพันธ์ทางพื้นที่

  1. การขาดคำแนะนำการเคลื่อนไหว — ปัญหาเกี่ยวกับภาพนิ่ง

คุณเขียนคำบรรยายฉากอย่างละเอียดมาก แต่ AI กลับสร้างภาพที่ดูเหมือนภาพถ่ายพร้อมเอฟเฟกต์ดึง-ดันเล็กน้อย—เพราะคุณบรรยายช่วงเวลาหนึ่ง ไม่ใช่การเคลื่อนไหว

วิดีโอเป็นสิ่งที่ขึ้นอยู่กับเวลา หากไม่มีคำแนะนำการเคลื่อนไหวอย่างชัดเจน AI จะตีความในแบบที่ระมัดระวังที่สุด: การเคลื่อนที่ช้าหรือการเปลี่ยนมุมมองเพียงเล็กน้อย ในทางเทคนิคแล้ว นี่ถือเป็น 'วิดีโอ' จริง แต่ไม่ใช่สิ่งที่คุณต้องการ

| ก่อนการแก้ไข | หลังการแก้ไข | |--------|------- -| | รถสปอร์ตสีแดงวินเทจจอดอยู่บนถนนบนภูเขา เช้าที่มีหมอกบาง บรรยากาศเหมือนในภาพยนตร์ (一辆复古红色跑车停在山路上,薄雾清晨,电影感) | รถปอร์เช่ 911 สีแดงวินเทจกำลังเร่งความเร็วผ่านถนนบนภูเขาที่คดเคี้ยว ยางเกาะถนนเปียกหมอก หมอกแยกออกจากตัวรถ กล้องติดตามไปข้างๆ ที่ระดับกันชน ต้นไม้เบลอผ่านในเบื้องหน้า |

วิธีการแก้ไข: แต่ละวิดีโอต้องมีการกระตุ้นอย่างน้อยหนึ่งคำกริยาที่อธิบายการเคลื่อนไหวทางกายภาพของตัวแบบ และหนึ่งวลีที่อธิบายการเคลื่อนไหวของกล้อง ตัวแบบเคลื่อนไหว กล้องเคลื่อนไหว—ทั้งสองอย่างร่วมกันสร้างพลังงานทางสายตา

3. คำสั่งที่ขัดแย้งกัน — ปริศนาของ "ภาพระยะใกล้ + ภาพระยะไกล"

สถานการณ์นี้พบได้บ่อยกว่าที่คุณอาจคิด โดยเฉพาะเมื่อผู้คนนำคำศัพท์ภาพยนตร์ที่ได้ยินมาต่อกันโดยยังไม่เข้าใจความหมายอย่างถ่องแท้ "ภาพโคลสอัพสุดขีดของหญิงสาวที่กำลังเดินข้ามทะเลทรายกว้างใหญ่ เต็มเฟรม ให้ความรู้สึกมหากาพย์" ประกอบด้วยคำสั่งในการจัดองค์ประกอบที่ขัดแย้งกันสองประการ AI จะพยายามหาค่าเฉลี่ย ทำให้ได้ภาพที่ไม่ใกล้และไม่ไกล แต่กลับดูสับสนวุ่นวาย

ก่อนการแก้ไขหลังการแก้ไข
ภาพระยะใกล้ของหญิงสาวที่กำลังเดินทางข้ามทะเลทรายอันกว้างใหญ่ ภาพมุมกว้างเพื่อสร้างบรรยากาศ ภาพในขนาดใหญ่ภาพโคลสอัพสุดขีดของดวงตาผู้หญิงที่สะท้อนแสงทะเลทราย อนุภาคของทรายจับแสงอาทิตย์ยามโกลเด้นอาวร์บนขนตาของเธอ ความชัดลึกตื้นทำให้ทุ่งเนินทรายกว้างใหญ่เบลอเป็นเฉดสีเหลืองอำพันอยู่เบื้องหลังเธอ ความลึกของสนามที่ตื้นทำให้เนินทรายกว้างใหญ่เบื้องหลังเธอดูเป็นสีเหลืองอำพัน)

วิธีการแก้ไข: เลือกตำแหน่งกล้องหนึ่งตำแหน่งต่อหนึ่งช็อต หากคุณต้องการภาพระยะใกล้และภาพระยะไกล ให้เขียนช็อตแยกกันสองช็อตและเชื่อมต่อกันด้วยการเปลี่ยนฉาก สำหรับลำดับภาพหลายช็อต แพลตฟอร์มเช่น Seedance รองรับ รูปแบบไทม์ไลน์สตอรี่บอร์ด ซึ่งช่วยให้คุณระบุแต่ละช็อตได้อย่างอิสระ

  1. ขาดบรรยากาศ — ความว่างเปล่าของแสง เงา และอารมณ์

ข้อความของคุณอธิบายถึงบุคคลที่กำลังทำกิจกรรมบางอย่างในสถานที่เฉพาะเจาะจง ซึ่งครอบคลุมสามในเจ็ดมิติของเนื้อหา หากไม่มีคำแนะนำเกี่ยวกับแสง สี บรรยากาศ หรือสไตล์ที่ต้องการ ระบบ AI จะเติมเต็มช่องว่างด้วยค่าเริ่มต้นที่เป็นกลาง เช่น แสงสว่างที่เรียบและสม่ำเสมอ สีที่หม่นหมอง และไม่มีอารมณ์หรือบรรยากาศเฉพาะ ผลลัพธ์ที่ได้จะคล้ายกับภาพจากกล้องวงจรปิดความละเอียดสูง

| ก่อนแก้ไข | หลังแก้ไข | |--------|------- -| | ชายคนหนึ่งนั่งอยู่คนเดียวในร้านกาแฟ | ชายวัยสี่สิบกว่า นั่งอยู่คนเดียวในมุมมืดสลัวของร้าน โคมไฟแขวนเพียงดวงเดียวส่องแสงอำพันอบอุ่นจับไอร้อนที่ลอยขึ้นจากถ้วยกาแฟของเขา ฝนโปรยปรายเป็นทางยาวบนหน้าต่างด้านหลัง สะท้อนเป็นเงาคลื่นไหวบนใบหน้าของเขา โทนสีเขียวอมฟ้าและทองแดงที่ดูหม่นหมอง บรรยากาศเต็มไปด้วยความเศร้าสร้อย |

วิธีการแก้ไข: ผสมผสานทิศทางของแสง, อุณหภูมิสี, ผลกระทบของบรรยากาศ (หมอก, ฝน, ฝุ่น, ไอน้ำ) และคำที่สื่ออารมณ์. การเพิ่มเติมทั้งสี่นี้จะเปลี่ยน "ฉาก" ให้กลายเป็น "ความรู้สึก".

  1. การขาดการออกแบบเสียง — ปัญหาของภาพยนตร์เงียบ

ภายในปี 2026 แพลตฟอร์มวิดีโอ AI ส่วนใหญ่จะรองรับการสร้างเสียง—ทั้งดนตรีประกอบ เสียงบรรยากาศ เอฟเฟกต์เสียง และแม้กระทั่งบทสนทนาที่มีการซิงค์ริมฝีปาก อย่างไรก็ตาม ผู้ใช้ส่วนใหญ่ยังคงสร้างคำสั่งที่เงียบสนิท เนื่องจากพวกเขามองว่าคำสั่งสำหรับวิดีโอเป็นเพียงคำแนะนำทางภาพเท่านั้น

เสียงประกอบเป็นครึ่งหนึ่งของประสบการณ์ ฉากป่าที่ไม่มีเสียงนกร้องและใบไม้ไหวรู้สึกไม่เป็นธรรมชาติ ฉากแอ็คชั่นที่ขาดเสียงกระแทกและเสียงเอฟเฟกต์รู้สึกไม่มีน้ำหนัก การสาธิตสินค้าที่ไม่มีดนตรีประกอบเหมือนกับการนำเสนอ PowerPoint

| ก่อนการแก้ไข | หลังการแก้ไข | |------- -|--------| | แมวกระโดดจากชั้นหนังสือและลงบนโซฟา | แมวสีส้มกระโดดอย่างสง่างามจากยอดชั้นหนังสือไม้โอ๊คสูง ร่างยืดออกกลางอากาศ ลงอย่างนุ่มนวลบนเบาะโซฟาผ้าไหมที่ยุบตัวลงตามน้ำหนักของมัน เสียง: เสียงอุ้งเท้าที่นุ่มนวลกระทบกับผ้า, เสียงหนังสือเล่มเดียวเลื่อนบนชั้น, เสียงบรรยากาศในห้องที่เงียบสงบพร้อมเสียงฝนที่ตกกระทบหน้าต่างอยู่ไกลๆ เสียง: เสียงอุ้งเท้าที่นุ่มนวลกระทบกับผ้า, เสียงหนังสือเล่มเดียวเลื่อนบนชั้น, เสียงบรรยากาศในห้องที่เงียบสงบพร้อมเสียงฝนที่ตกกระทบหน้าต่างอยู่ไกลๆ) |

แก้ไข: เพิ่มบรรทัดคำแนะนำเสียงที่ท้ายของข้อความกระตุ้น โดยระบุสไตล์ของเพลงพื้นหลัง, เสียงบรรยากาศ, และบทสนทนาหรือการบรรยายใด ๆ ที่ต้องการ เราให้คำแนะนำอย่างละเอียดในส่วน การออกแบบเสียง ด้านล่าง


สูตรสำหรับคำกระตุ้นวิดีโอแบบสากล

ไม่ว่าคุณจะใช้แพลตฟอร์มใด วิดีโอที่มีประสิทธิภาพทุกชิ้นจะมีองค์ประกอบหลัก 7 ประการเหมือนกัน บางอย่างเป็นสิ่งจำเป็น (ต้องมีในทุกๆ วิดีโอ) ในขณะที่บางอย่างเป็นตัวเลือก (ช่วยเพิ่มประสิทธิภาพแต่ไม่จำเป็น) สูตรคือ:

[หัวข้อ] + [การกระทำ] + [สภาพแวดล้อม] + [กล้อง] + [แสง] + [สไตล์] + [เสียง]

แผนผังแสดงองค์ประกอบทั้งเจ็ดในสูตรคำสั่งวิดีโอสากล พร้อมคำอธิบายภาพประกอบที่แสดงหัวข้อ การกระทำ สถานที่ การเคลื่อนไหวของกล้อง แสง สไตล์ และองค์ประกอบเสียง พร้อมตัวอย่างคำสำคัญ

องค์ประกอบหลัก 7 ประการของสูตรคำแนะนำวิดีโอแบบสากล แต่ละองค์ประกอบเพิ่มมิติการควบคุมเพิ่มเติมให้กับผลลัพธ์สุดท้าย

ด้านล่างนี้คือรายละเอียดทีละขั้นตอนของแต่ละองค์ประกอบ พร้อมด้วยคลังคำหลักและตัวอย่างวลี

องค์ประกอบที่หนึ่ง: หัวข้อ (จำเป็น)

หัวข้อคือสิ่งที่ผู้ชมมองดู สิ่งนี้ควรเป็นส่วนที่เฉพาะเจาะจงที่สุดของคำแนะนำ—ไม่ใช่ 'ผู้หญิง' แต่เป็น 'ผู้หญิงวัยหกสิบเศษ ผมสีเงินรวบเป็นมวยหลวมๆ รอยยิ้มลึกที่หางตา สวมผ้ากันเปื้อนยีนส์สีซีด'

คลังคำหลัก:

| หมวดหมู่ | ตัวอย่าง (ข้อความภาษาอังกฤษ) | |------|------------------ -| | ตัวละคร | ชายหนุ่มวัยยี่สิบกว่าปี หญิงชรา เด็กอายุประมาณห้าขวบ นักเต้น เชฟ ทหาร | | สัตว์ | สุนัขพันธุ์โกลเด้นรีทรีฟเวอร์ เสือดาวหิมะ นกฮัมมิ่งเบิร์ด ปลาคาร์พ ผีเสื้อโมนาร์ช | | | วัตถุ | เครื่องพิมพ์ดีดวินเทจ, ขวดน้ำหอมคริสตัล, สมุดบันทึกปกหนัง, แจกันเซรามิก | | ยานพาหนะ | มอเตอร์ไซค์สีดำด้าน, เรือใบไม้, รถกระบะเก่า, รถไฟความเร็วสูง | | นามธรรม | อนุภาคของแสง, หยดหมึกในน้ำ, รูปทรงเรขาคณิต, โลหะเหลว |

ตัวอย่างวลี:

  • บาริสต้าหญิงวัย 30 กว่า มีรอยสักเต็มแขน สวมผ้ากันเปื้อนสีดำที่เปื้อนแป้ง
  • เข็มทิศทองสัมฤทธิ์ที่ผ่านกาลเวลาวางเปิดอยู่บนแผนที่เดินเรือ
  • โคมไฟกระดาษนับพันดวง แต่ละดวงส่องแสงอำพันอบอุ่นจากเทียนภายใน

องค์ประกอบที่สอง: การดำเนินการ (จำเป็น)

การกระทำคือสิ่งที่เกิดขึ้น—สิ่งที่ตัวเอกกำลังทำและวิธีที่ฉากพัฒนาไปตามกาลเวลา นี่ถือเป็นเส้นแบ่งระหว่างคำแนะนำสำหรับวิดีโอและคำแนะนำสำหรับภาพ หากปราศจากการกระทำ คุณก็จะได้เพียงภาพถ่ายที่เคลื่อนไหวเท่านั้น

คลังคำหลัก:

| ประเภทการเคลื่อนไหว | ตัวอย่าง (ข้อความภาษาอังกฤษ) | |--------- -|-------------------| | การเคลื่อนไหวของมนุษย์ | เดิน, วิ่ง, หันตัวช้าๆ, เอื้อมมือ, ก้มตัวไปข้างหน้า, หายใจออก, กระพริบตา | | สัมพันธ์กับการเคลื่อนไหวของกล้อง | เดินเข้าหา, เดินออกจากกล้อง, ข้ามกรอบจากซ้ายไปขวา | | | การเคลื่อนไหวของวัตถุ | หมุน, ตกลง, ลอย, แตก, ประกอบ, คลี่ออก, ละลาย | | การเคลื่อนไหวของสิ่งแวดล้อม | ลมเคลื่อนผ่านหญ้า, เมฆเคลื่อนตัว, ฝนตก, ใบไม้ลอย, น้ำขึ้น | | กระบวนการเปลี่ยนผ่าน | วันเปลี่ยนเป็นคืน, ดอกไม้บาน, น้ำแข็งก่อตัว, สีแพร่กระจาย, แสงเปลี่ยน |

ตัวอย่างวลี:

  • ค่อยๆ เอื้อมมือลงหยิบใบไม้ร่วงในฤดูใบไม้ร่วงขึ้นมา พลิกดูด้วยนิ้วมือ
  • เข็มทิศสั่นไหว แล้วชี้ไปทางเหนืออย่างเด็ดขาด
  • โคมไฟลอยขึ้นจากพื้นทีละดวง ทีละดวง ทะยานขึ้นสู่ท้องฟ้ามืดด้วยความเร็วที่แตกต่างกัน

องค์ประกอบที่สาม: สิ่งแวดล้อม (จำเป็น)

ฉากคือสถานที่ที่เหตุการณ์เกิดขึ้น ให้บรรยายทั้งฉากที่อยู่ใกล้ (เบื้องหน้า) และฉากหลังที่กว้างขึ้น รวมถึงรายละเอียดของสภาพอากาศ เวลาของวัน และฤดูกาลที่เกี่ยวข้อง

คลังคำหลัก:

| ประเภทฉาก | ตัวอย่าง (ข้อความภาษาอังกฤษ) | |----------|------------------ -| | ธรรมชาติ | ป่าทึบ, ทะเลทราย, หน้าผาริมทะเล, ทุ่งหญ้าบนภูเขา, ชายหาดภูเขาไฟ, ป่าไผ่ | | เมือง | ซอยแคบในโตเกียว, ลานคอนกรีตสไตล์บรูทาลิสต์, สวนบนดาดฟ้า, ชานชาลารถไฟใต้ดิน, ถนนสายหลักที่ประดับไฟนีออน | | | ภายในอาคาร | ห้องสมุดใต้แสงเทียน, ห้องใต้หลังคาสไตล์อุตสาหกรรม, เรือนกระจกอนุรักษ์, ห้องล้างฟิล์มวินเทจ, โถงกลางหินอ่อน | | แฟนตาซี | เกาะลอยฟ้า, ถ้ำคริสตัล, แนวปะการังเรืองแสง, วิหารโบราณ, เมืองบนเมฆ | | เวลา/สภาพอากาศ | ยามรุ่งอรุณก่อนรุ่งสาง, กลางวันที่มีเมฆครึ้ม, พายุฝนฟ้าคะนอง, หิมะแรกตก, เย็นฤดูร้อนชื้น |

ตัวอย่างวลี:

  • ในตรอกแคบของเกียวโต มีโคมหินเรียงรายทั้งสองข้าง ดอกซากุระโปรยปรายบนก้อนหินที่เปียกชื้น
  • ภายในมหาวิหารร้างอันกว้างใหญ่ ช่องแสงฝุ่นลอยลอดผ่านกระจกสีที่แตกร้าว
  • บนขอบหน้าผาภูเขาไฟในช่วงเวลาฟ้าสางสีน้ำเงิน ไอน้ำกำมะถันพวยพุ่งขึ้นจากรอยแยกในหินสีดำ

องค์ประกอบที่สี่: การเคลื่อนไหวของกล้อง (สำคัญ)

คำแนะนำทิศทางกล้องช่วยนำทางให้ผู้ชม AI รับรู้ฉากในลักษณะที่ต้องการ โดยครอบคลุมองค์ประกอบ (ระยะใกล้-ไกล), มุมมอง (จากจุดไหน), และการเคลื่อนไหว (มุมมองเปลี่ยนไปอย่างไรตามเวลา) ภาษาของกล้องถือเป็นเครื่องมือที่สำคัญที่สุดในการปรับปรุงคุณภาพของคำสั่ง (prompt) — เราจะสำรวจเรื่องนี้อย่างลึกซึ้งในส่วนที่จัดไว้โดยเฉพาะด้านล่าง

คลังคำหลักด่วน:

| แง่มุม | คำศัพท์ภาษาอังกฤษและคำเทียบเคียงภาษาจีน | |------|------------------ -| | การจัดกรอบ | ภาพระยะใกล้มาก, ภาพระยะใกล้, ภาพระยะกลาง, ภาพเต็มตัว, ภาพมุมกว้าง, ภาพมุมกว้างมาก (มุมกล้องไกลมาก) | | มุมมอง | ระดับสายตา, มุมต่ำ, มุมสูง, มุมสูงมาก, มุมมองจากนก, มุมมองจากแมลง, มุมเอียงดัตช์ | | การเคลื่อนไหว | รถเข็นเข้า/ออก, ปรับมุมกล้องซ้าย/ขวา, เอียงขึ้น/ลง, การเคลื่อนที่ตามวัตถุ, การหมุนรอบ, เครน (ระดับความสูง) | | เลนส์ | มุมกว้าง 24 มม., มาตรฐาน 50 มม., พอร์เทรต 85 มม., เทเลโฟโต้ 200 มม., เลนส์มาโคร, อะนาโมร์ฟิก |

องค์ประกอบที่ห้า: แสงสว่าง (สำคัญ)

แสงและเงาเป็นตัวกำหนดอารมณ์ของทุกเฟรม ภาพถ่ายมืออาชีพใช้เวลาหลายชั่วโมงในการจัดแสง ในงานเขียนตามคำสั่ง คำที่แม่นยำเพียงไม่กี่คำก็สามารถควบคุมอารมณ์ในระดับเดียวกันได้

คลังคำหลัก:

| ประเภทแสง (อังกฤษ/จีน) | เอฟเฟกต์ภาพ | |--------------------- -|----------| | ช่วงเวลากลางวัน | โทนสีอบอุ่น เงาที่ยาว สีส้มอมเหลือง เหมาะอย่างยิ่งสำหรับการถ่ายภาพบุคคล | | ช่วงเวลากลางคืน | โทนสีเย็น บรรยากาศเศร้าหมอง ท้องฟ้าสีน้ำเงินเข้ม พร้อมความอบอุ่นที่ยังคงอยู่ตามขอบฟ้า | | มีแสงไฟด้านหลัง | ขอบมีเส้นขอบ, ให้เอฟเฟ็กต์เงา, แยกออกจากพื้นหลังอย่างชัดเจน | | แสงข้าง | ใบหน้าครึ่งสว่างครึ่งเงา; ความต่างของแสงและเงาสูง, ให้ความรู้สึกดราม่า | | แสงแบบแรมบรันต์ | แสงสว่างรูปสามเหลี่ยมใต้ตาที่อยู่ในเงา; ให้เอฟเฟกต์ภาพเหมือนคลาสสิก | | การให้แสงแบบปริมาตร | ลำแสงที่มองเห็นได้ทะลุฝุ่นละออง หมอก หรือควัน | | ปรากฏการณ์ทินดอลล์ | การกระจายแสงภายในอนุภาค ทำให้เกิดลำแสงที่ชัดเจนภายในหมอกหรือฝุ่นละออง | | นีออน | แหล่งกำเนิดแสงสีเทียม, การสะท้อนบนพื้นผิวเปียก, สุนทรียศาสตร์ไซเบอร์พังค์ |

องค์ประกอบที่หก: รูปแบบ (แนะนำ)

สไตล์เป็นตัวกำหนดภาษาภาพที่ปัญญาประดิษฐ์ใช้ ไม่ว่าจะเป็นฟิล์มสต็อก ความสมจริงแบบสารคดี แอนิเมชัน ภาพวาดสีน้ำมัน หรือรูปแบบอื่น ๆ หากไม่มีการระบุสไตล์ไว้ AI จะเลือกใช้สไตล์ภาพเสมือนจริงทั่วไปโดยอัตโนมัติ

คลังคำหลัก:

| สไตล์ (อังกฤษ/จีน) | ลักษณะทางสายตา | |----------------- -|----------| | ภาพยนตร์ | ระยะชัดตื้นตื้น, การปรับสีระดับฟิล์ม, อัตราส่วนภาพกว้าง 2.39:1 | | สารคดี | รู้สึกเหมือนกล้องมือถือ, แสงธรรมชาติ, การจัดกรอบแบบสังเกต | | เชิงพาณิชย์ | สะอาด สว่าง เน้นสินค้า แสงไฟแม่นยำ การเคลื่อนไหวลื่นไหล | | อนิเมะ | สไตล์เซลเชด สีสันสดใส การเคลื่อนไหวเกินจริง เส้นสายพลิ้วไหว | | ฟิล์มนัวร์ | ภาพขาวดำที่มีความเปรียบต่างสูง เงาจากมู่ลี่เวนิส แสงสลัว | | หมึกจีน | หมึกสีดำบนพื้นขาว เกลียวสีที่ไหลลื่น ความเรียบง่าย ความงามแบบตะวันออก | | ฟิล์มวินเทจ | เกรนฟิล์ม, สีจางเล็กน้อย, โทนอุ่น, ขอบภาพเบลอ | | ไซเบอร์พังค์ | แสงนีออนเจิดจ้า, คอนทราสต์สูง, องค์ประกอบโฮโลกราฟิก, บรรยากาศเมืองหลังวันสิ้นโลก |

องค์ประกอบที่เจ็ด: เสียง (ไม่บังคับ)

เสียงเพิ่มมิติทางเสียงให้กับประสบการณ์ แม้ไม่ใช่ทุกแพลตฟอร์มที่รองรับการสร้างเสียง แต่การผสานการออกแบบเสียงเข้ากับคำแนะนำไม่เพียงแต่เป็นการคิดล่วงหน้าเท่านั้น แต่ยังช่วยเพิ่มผลกระทบทางสายตาได้บ่อยครั้ง—เนื่องจาก AI ใช้สัญญาณเสียงเพื่อส่งผลต่อโทนอารมณ์และความเร็วของภาพ

คลังคำหลัก:

ประเภทเสียงตัวอย่าง (ข้อความภาษาอังกฤษ)
สไตล์ดนตรีออร์เคสตรา, ลอฟิ ฮิปฮอป, อิเล็กทรอนิกส์แอมเบียนต์, แจ๊สเปียโน, กีตาร์อะคูสติก, ดนตรีประกอบภาพยนตร์ (เพลงประกอบภาพยนตร์)
เสียงบรรยากาศฝนตกกระทบกระจก, ลมพัดผ่านต้นไม้, เสียงรถราในเมือง, คลื่นทะเล, เสียงไฟแตก
เสียงเอฟเฟกต์แอคชั่นเสียงฝีเท้าบนกรวด, เสียงประตูเปิดปิด, เสียงกระจกแตก, เสียงเครื่องยนต์เร่ง
เสียงพูดเสียงบรรยายกระซิบ, บทสนทนา, เสียงหายใจ, เสียงหัวเราะ

ภาษาภาพยนตร์: อาวุธลับ

ภาษาภาพยนตร์เป็นทักษะที่มีอิทธิพลมากที่สุดที่คุณสามารถพัฒนาได้ในฐานะนักเขียนคำแนะนำวิดีโอ เมื่อคุณเขียนว่า dolly in slowly แทนที่จะเป็น zoom in คุณกำลังใช้คำศัพท์พื้นเมืองของโมเดล AI—เพราะโมเดลเหล่านี้ถูกฝึกฝนจากฟุตเทจที่ถ่ายทำโดยมืออาชีพหลายล้านชั่วโมง ซึ่งการเคลื่อนไหวของกล้องมีชื่อเฉพาะและสร้างเอฟเฟกต์ภาพที่เฉพาะเจาะจง

ส่วนนี้ทำหน้าที่เป็นคู่มืออ้างอิงที่ครอบคลุมสำหรับคุณ เราขอแนะนำให้บุ๊กมาร์กหน้านี้ไว้

คู่มือการเคลื่อนไหวของกล้อง อธิบายชื่อ, เส้นทางการเคลื่อนไหว, และผลกระทบทางอารมณ์ของการเคลื่อนไหวของกล้องที่แตกต่างกัน 12 แบบ ได้แก่: การเคลื่อนกล้องเข้า/ออก, การหมุนกล้อง, การเคลื่อนกล้องตาม, การเคลื่อนกล้องด้วยรถเข็น, การถ่ายจากมุมสูง/ต่ำ, และการถ่ายด้วยมือ

การเคลื่อนไหวของกล้องไม่สามารถสลับกันได้—แต่ละแบบจะสร้างผลกระทบทางอารมณ์ที่แตกต่างกันออกไป การรู้คำศัพท์ที่ถูกต้องจะเปลี่ยนผลกระทบของคำสั่งของคุณ

ภาพยนตร์หลัก

เคลื่อนกล้องเข้า / เคลื่อนกล้องออก (ภาพดัน / ภาพดึง)

กล้องจะเคลื่อนที่เข้าใกล้ตัวแบบ (push) หรือถอยห่างออกไป (pull) อย่างเป็นรูปธรรม ซึ่งแตกต่างจากการซูม เพราะมุมมองจะเปลี่ยนไป—วัตถุที่อยู่เบื้องหน้าจะดูใหญ่ขึ้นตามสัดส่วน ทำให้เกิดความรู้สึกของมิติและความใกล้ชิดทางกายภาพ

  • ผลกระทบทางอารมณ์: การผลักสร้างความใกล้ชิด, ความสนใจ, และการเปิดเผย. การดึงสร้างความโดดเดี่ยว, บริบท, และการจากไป.
  • เมื่อใดควรใช้: ใช้การผลักเพื่อเน้นอารมณ์, ช่วงเวลาของตัวละคร, และรายละเอียดที่เปิดเผย. ดึงออกเพื่อแสดงขนาด สรุป หรือถอนตัวออกจากหัวข้อ
  • วลีสำคัญ: กล้องเคลื่อนที่เข้ามาอย่างช้าๆ จากภาพขนาดกลางไปยังภาพระยะใกล้มากที่มือของบุคคล

แพนซ้าย / แพนขวา (การแพนแนวนอน)

กล้องยังคงอยู่นิ่ง หมุนในแนวนอนเหมือนกับการหันศีรษะของคุณ มุมมองจะเคลื่อนผ่านฉากไป

  • ผลกระทบทางอารมณ์: การลาดตระเวน การค้นพบ การเคลื่อนไหวแบบติดตามด้านข้าง การเชื่อมโยงสององค์ประกอบภายในฉาก
  • เมื่อใดควรใช้: การนำเสนอภูมิทัศน์ การติดตามตัวละครที่เคลื่อนไหว การแสดงพื้นที่กว้างขวาง
  • ข้อความคำสั่ง: แพนกล้องช้าไปทางขวาทั่วทั้งเวิร์กช็อป เผยให้เห็นแถวของเครื่องดนตรีที่ทำด้วยมือบนผนัง

เอียงขึ้น / เอียงลง (แพน/เอียงในแนวดิ่ง)

กล้องยังคงอยู่นิ่ง หมุนในแนวตั้ง—ราวกับกำลังพยักหน้า การแพนกล้องขึ้นเผยให้เห็นความสูง; การแพนกล้องลงเผยให้เห็นรายละเอียดในระดับพื้นดิน

  • ผลกระทบทางอารมณ์: การเอียงขึ้นจะกระตุ้นความตื่นตะลึง ความยิ่งใหญ่ และความปรารถนา การเอียงลงจะสร้างความรู้สึกมั่นคง การค้นพบ และความใกล้ชิดกับพื้นผิว
  • เมื่อใดควรใช้: การเอียงขึ้นใช้สำหรับโครงสร้างที่สูงตระหง่าน ตัวละครที่ยืนขึ้น หรือเปิดเผยท้องฟ้า การเอียงกล้องลงเผยให้เห็นวัตถุบนโต๊ะหรือการเปลี่ยนจากท้องฟ้าสู่พื้นดิน
  • วลีคำสั่ง: กล้องเอียงขึ้นจากรากของต้นไม้โบราณ ตามลำต้นขนาดใหญ่ไปจนถึงยอดเรือนยอด

การติดตามภาพ (การติดตาม/การติดตามด้านข้าง)

กล้องเคลื่อนที่ไปพร้อมกับวัตถุ โดยรักษาระยะห่างและมุมคงที่ ราวกับว่าติดตั้งอยู่บนรางที่วิ่งขนานไปกับเส้นทางของวัตถุ

  • ผลกระทบทางอารมณ์: ความเป็นเพื่อนร่วมทาง การเดินทาง การมีส่วนร่วมอย่างลึกซึ้ง ผู้ชมเดินทางเคียงข้างกับเรื่องราวหรือตัวละคร
  • เมื่อใช้: สำหรับตัวละครที่เดินหรือวิ่ง ข้ามพื้นที่ หรือแสดงสินค้าตามพื้นผิว
  • วลีคำสั่ง: กล้องติดตามผู้วิ่งในระดับความสูงของไหล่ รักษาความเร็วให้สอดคล้องขณะที่เธอวิ่งผ่านตรอก

วงโคจร / เส้นโค้ง (การถ่ายภาพแบบติดตามวงกลม)

กล้องหมุนรอบวัตถุโดยให้วัตถุอยู่ตรงกลางของกรอบภาพตลอดเวลา ซึ่งอาจเป็นการหมุนครบ 360 องศาหรือเป็นมุมบางส่วนก็ได้

  • ผลกระทบทางอารมณ์: การปรากฏตัวอย่างกล้าหาญ, ความรู้สึกของพลัง, การแสดงคุณภาพ, การแสดงผลแบบสามมิติ.
  • เมื่อใดที่ควรใช้: การสาธิตผลิตภัณฑ์ (แสดงทุกมุม), ภาพเด่น, การแนะนำตัวละครอย่างดราม่า, ช่วงเวลาสำคัญ.
  • วลีคำสั่ง: กล้องหมุน 180 องศาไปรอบๆ ผู้เล่นหมากรุก โดยเริ่มจากด้านหลังและจบที่ด้านหน้า

เครนยก / เครนลง (ภาพยกสูง / ภาพแขนเครน)

การเคลื่อนไหวของกล้องในแนวตั้ง—การยกขึ้นหรือลงทางกายภาพ—มักใช้ร่วมกับมุมเอียงเพื่อให้วัตถุอยู่ในกรอบภาพ

  • ผลกระทบทางอารมณ์: การขึ้นสร้างความรู้สึกของการก้าวข้าม การปลดปล่อย และมุมมองที่กว้างขึ้น การลงส่งเสริมความมั่นคง การมาถึง และการมีสมาธิ
  • เมื่อใดควรใช้: การขึ้นใช้สำหรับบทสรุป ช่วงเวลาแห่งชัยชนะ หรือการเปลี่ยนผ่านไปสู่มุมมองทางอากาศ ช็อตที่ถ่ายจากมุมต่ำขึ้นใช้สำหรับการเปิดฉาก การมาถึง และการเปลี่ยนผ่านจากภาพมุมกว้างไปสู่การจัดองค์ประกอบที่ใกล้ชิด
  • วลีคำสั่ง: กล้องเคลื่อนขึ้นจากระดับพื้นดิน เหนือฝูงชน เผยให้เห็นขนาดทั้งหมดของเทศกาล

มือถือ (เลนส์มือถือ)

เลนส์มีการสั่นไหวแบบออร์แกนิกอย่างละเอียด—ไม่ได้ติดตั้งบนขาตั้งกล้องหรืออุปกรณ์กันสั่นใดๆ สิ่งนี้จำลองความรู้สึกของการถ่ายภาพด้วยมือเปล่าของช่างภาพมนุษย์

  • ผลกระทบทางอารมณ์: ความทันทีทันใด, ความเร่งด่วน, ความน่าเชื่อถือแบบสารคดี, ความตึงเครียด, ความใกล้ชิด
  • เมื่อใดควรใช้: ฉากแอ็กชัน, บทสนทนาที่เต็มไปด้วยอารมณ์, สไตล์สารคดี, ภาพยนตร์สยองขวัญ, ฉากใดก็ตามที่ต้องการความรู้สึกที่สมจริงและดึงดูด
  • วลีคำสั่ง: กล้องมือถือติดตามตัวละครผ่านตลาดที่แออัด, สั่นไหวเล็กน้อย

Steadicam / Gimbal (Steadicam/เลนส์กันสั่น)

การเคลื่อนไหวของกล้องที่ราบรื่นและลอยตัวเคลื่อนผ่านอวกาศ แตกต่างจากการถ่ายด้วยมือที่สั่นไหว การเคลื่อนไหวนี้ไม่มีสะดุด—ลื่นไหลและต่อเนื่อง

  • ผลกระทบทางอารมณ์: ฝันเฟื่อง, สง่างาม, ดื่มด่ำ, การสำรวจที่ผ่อนคลาย
  • เมื่อใดควรใช้: การสำรวจพื้นที่สถาปัตยกรรม, การติดตามตัวละครผ่านสภาพแวดล้อมที่ซับซ้อน, การถ่ายทำแบบเทคเดียว, การถ่ายทำภาพยนตร์ที่หรูหราและสวยงาม
  • วลีคำสั่ง: กล้องสเตดิแคมเคลื่อนที่อย่างนุ่มนวลอยู่ด้านหลังนักเต้นขณะที่เธอเคลื่อนไหวผ่านห้องบอลรูมที่ว่างเปล่า

เทคนิคการเคลื่อนไหวกล้องขั้นสูง

ฮิตช์ค็อกซูม (ดอลลี่ซูม / เอฟเฟกต์เวอร์ทิโก้)

เมื่อกล้องซูมเข้า ความยาวโฟกัสจะเพิ่มขึ้น (หรือในทางกลับกัน) วัตถุยังคงมีขนาดเท่าเดิม แต่พื้นหลังจะเกิดการบิดเบือนอย่างเห็นได้ชัด—ทั้งการยืดหรือการบีบอัด

  • ผลกระทบทางอารมณ์: ความสับสน, การตระหนักรู้, ความหวาดกลัว, โลกที่หมุนรอบจุดคงที่
  • วลีกระตุ้น: การซูมดอลลี่บนใบหน้าของตัวละคร — กล้องดันเข้าขณะที่เลนส์ซูมออก, พื้นหลังยืดออกไป, สร้างเอฟเฟกต์เวียนศีรษะ

การแพนกล้องอย่างรวดเร็ว

การแพนกล้องในแนวนอนอย่างรวดเร็วมาก จนทำให้ทั้งเฟรมดูเบลอในระหว่างการเคลื่อนไหว มักใช้เป็นเทคนิคในการเปลี่ยนฉากระหว่างสองฉาก

  • ผลกระทบทางอารมณ์: พลังงาน, ความประหลาดใจ, ความเร่งด่วน, จังหวะตลก
  • วลีสัญญาณ: แพนกล้องอย่างรวดเร็วจากใบหน้าของผู้พูดไปยังปฏิกิริยาของผู้ชม พร้อมเอฟเฟกต์เบลอการเคลื่อนไหวระหว่างการเปลี่ยนฉาก

แร็กโฟกัส (ปรับโฟกัส)

จุดสนใจเปลี่ยนจากระนาบความลึกหนึ่งไปยังอีกระนาบหนึ่งภายในภาพเดียวกัน พื้นหน้าจะเบลอในขณะที่พื้นหลังคมชัด หรือในทางกลับกัน

  • ผลกระทบทางอารมณ์: เปลี่ยนความสนใจ, เปิดเผยข้อมูล, เชื่อมโยงองค์ประกอบเบื้องหน้าและเบื้องหลัง
  • วลีคำสั่ง: เปลี่ยนโฟกัสจากดอกไม้เบื้องหน้าที่เบลอไปยังใบหน้าของผู้หญิงในเบื้องหลัง

มุมดัตช์ (มุมเอียง)

เลนส์เอียงตามแกนหมุน ทำให้เส้นขอบฟ้าเป็นแนวทแยงมุม โลกดูเหมือนเอียง

  • ผลกระทบทางอารมณ์: ความไม่สบายใจ, ความไม่มั่นคง, ความตึงเครียด, ความดราม่าแบบจัดฉาก, ความวุ่นวาย
  • วลีกระตุ้น: ภาพโคลสอัพใบหน้าของนักสืบในมุมเอียงดัตช์ 15 องศา แสงด้านข้างที่รุนแรง

สปีดแรมป์ (การปรับความเร็วแบบเป็นช่วง)

ความเร็วในการเล่นซ้ำอาจเปลี่ยนแปลงได้ภายในช็อตเดียว โดยทั่วไปจะชะลอตัวลงในช่วงเวลาสำคัญก่อนจะเร่งความเร็วขึ้นอีกครั้ง

  • ผลกระทบทางอารมณ์: เน้นย้ำ, สร้างผลกระทบ, เพิ่มน้ำหนักทางดราม่าให้กับช่วงเวลาเฉพาะ
  • วลีกระตุ้น: การเคลื่อนไหวเร่งเป็นสโลว์โมชั่นในช่วงเวลาที่เกิดการกระทบกระแทก จากนั้นเร่งกลับสู่เวลาจริง

ถ่ายเดียว (ยาวต่อเนื่อง)

การถ่ายทำต่อเนื่องโดยไม่มีการตัดต่อ กล้องเคลื่อนที่ผ่านพื้นที่ต่างๆ ติดตามการเคลื่อนไหว และค้นพบองค์ประกอบต่างๆ โดยคงมุมมองเดียวที่ไม่ขาดตอนตลอดทั้งเรื่อง

  • ผลกระทบทางอารมณ์: การดื่มด่ำ, ประสบการณ์แบบเรียลไทม์, ความรู้สึกของการควบคุมทางเทคนิค, การสร้างความตึงเครียดอย่างต่อเนื่อง
  • วลีคำสั่ง: การถ่ายทำแบบต่อเนื่องไม่มีการตัดต่อ: กล้องเข้ามาทางประตูหน้า, ลื่นไหลผ่านโถงทางเดิน, และมาถึงสวน

บุคคลที่หนึ่ง / มุมมอง

กล้องเป็นตัวแทนของดวงตาของตัวละคร ผู้ชมจะเห็นสิ่งที่ตัวละครเห็น รวมถึงมือของตัวละครที่เข้ามาในกรอบภาพ

  • ผลกระทบทางอารมณ์: การดื่มด่ำอย่างสูงสุด, ประสบการณ์เชิงอัตวิสัย, ความสวยงามของเกม
  • วลีกระตุ้น: มุมมองบุคคลที่หนึ่ง: มือผลักประตูไม้หนักเปิดออก เผยให้เห็นทุ่งหญ้าที่อาบไปด้วยแสงแดด

สำหรับคุณสมบัติการควบคุมกล้องที่เป็นเอกลักษณ์ของ Seedance และวิธีการผสมผสานคุณสมบัติเหล่านี้ภายในไทม์ไลน์ของสตอรี่บอร์ด โปรดดูที่ คู่มือคำสั่ง Seedance


บรรยากาศคลังคำค้นหา

บรรยากาศคือกุญแจสำคัญในการเปลี่ยนวิดีโอที่มีคุณภาพทางเทคนิคให้กลายเป็นผลงานที่สื่ออารมณ์ได้ มันคือความแตกต่างระหว่าง 'ห้องหนึ่ง' กับ 'ห้องที่ทำให้คุณรู้สึกอะไรบางอย่าง' ไลบรารีคำสำคัญนี้ถูกจัดระเบียบตามสี่มิติ ได้แก่ แสง สี พื้นผิว และอารมณ์ ซึ่งช่วยให้คุณสามารถผสมผสานเพื่อสร้างบรรยากาศที่คุณต้องการได้อย่างแม่นยำ

แผนภูมิอ้างอิงคำสำคัญสำหรับวิดีโอ AI เพื่อสร้างบรรยากาศ โดยแบ่งตามสี่มิติ: แสง, โทนสี, พื้นผิว, และอารมณ์ พร้อมตัวอย่างภาพประกอบ

ห้องสมุดคำสำคัญบรรยากาศ: เลือกคำสำคัญหนึ่งคำจากแต่ละมิติเพื่อกำหนดลายเซ็นทางอารมณ์ของวิดีโอของคุณ

คำสำคัญแห่งแสงและเงา

แสงสว่างเป็นรากฐานของบรรยากาศ การปรับเปลี่ยนแสงสว่างในคำแนะนำสามารถเปลี่ยนอารมณ์ได้โดยสิ้นเชิงในขณะที่ยังคงองค์ประกอบอื่น ๆ ไว้เหมือนเดิม

| คำสำคัญ (อังกฤษ/จีน) | เอฟเฟกต์ภาพ | สถานการณ์ที่เหมาะสม | |-------|----------|--------- -| | ช่วงเวลาทอง | แสงสีอำพันอุ่น เงาทอดยาวนุ่มนวล โทนสีผิวดูโดดเด่น | ความโรแมนติก ความคิดถึง การเดินทาง ความงาม | | ช่วงฟ้าสาง | แสงสีน้ำเงินเข้มรอบตัว เฉดสีอบอุ่นที่ยังหลงเหลืออยู่ขอบฟ้า | ความเศร้า ความครุ่นคิด การเปลี่ยนแปลง อารมณ์เมือง | | แสงหลัง | วัตถุถูกเน้นด้วยแสงจากด้านหลัง ทำให้เห็นเงาหรือเป็นเงาดำ | ความดราม่า, ความลึกลับ, ภาพฮีโร่, ความสวยงาม | | แสงข้าง | แสงที่ส่องจากด้านใดด้านหนึ่งอย่างแรง ทำให้เห็นครึ่งหนึ่งสว่างและครึ่งหนึ่งเป็นเงา | ความตึงเครียด, ภาพบุคคลใกล้ชิด, ภาพบุคคลที่ดูมีมิติ | | แสงแบบเรมบรันด์ | แสงถ่ายภาพบุคคลคลาสสิก – ส่องสว่างด้านเดียว พร้อมไฮไลท์สามเหลี่ยมขนาดเล็กใต้ตาด้านที่เป็นเงา | ภาพบุคคล, ความสง่างาม, บรรยากาศคลาสสิก | | แสงแบบปริมาตร | ลำแสงที่มองเห็นได้ผ่านฝุ่นละออง หมอก หรือควัน | ความศักดิ์สิทธิ์ โรงละคร ฉากป่าไม้ แสงเวที | | ปรากฏการณ์ทินดอลล์ | แสงกระจายตัวภายในอนุภาคขนาดเล็กมาก ก่อให้เกิดลำแสงที่ชัดเจนภายในหมอก | ฉากธรรมชาติยามรุ่งอรุณ เหนือจริง ราวกับความฝัน | | นีออน | แหล่งกำเนิดแสงสีสังเคราะห์ มักเป็นสีชมพู สีฟ้า สีฟ้าอมเขียว สีม่วงแดง | ไซเบอร์พังค์ ชีวิตกลางคืน เมือง ทันสมัย | | แสงเทียน | อุ่น ไหววูบไหว แหล่งกำเนิดแสงสีส้มอำพัน | ความใกล้ชิด ประวัติศาสตร์ ฉากอาหารค่ำ ความอบอุ่น | | เงาดำ | วัตถุทั้งหมดมืดสนิท กำหนดรูปร่างเฉพาะจากเส้นขอบที่ตัดกับพื้นหลังสว่าง | ความลึกลับ ความไม่เปิดเผยตัวตน ผลกระทบทางสายตา การเล่าเรื่อง | | เรืองแสง | แหล่งกำเนิดแสงอินทรีย์ที่ส่องสว่างด้วยตัวเอง มักมีสีฟ้าอมเขียว | แฟนตาซี ใต้น้ำ โลกต่างดาว ฝัน |

คำสำคัญโทนสี

โทนสีกำหนดอุณหภูมิทางอารมณ์ขององค์ประกอบทั้งหมด โทนสีอบอุ่นสร้างความรู้สึกใกล้ชิด โทนสีเย็นสื่อถึงความห่างเหิน ความอิ่มตัวของสีสูงสื่อถึงความมีชีวิตชีวา ความอิ่มตัวของสีต่ำสื่อถึงความยับยั้งชั่งใจ

| คำสำคัญ (อังกฤษ/จีน) | เอฟเฟกต์ภาพ | การตอบสนองทางอารมณ์ | |-------|----------|--------- -| | โทนสีอบอุ่น | สีอำพัน สีส้ม สีทอง สีโทนแดง | ความสบาย ความคิดถึง ความใกล้ชิด ฤดูใบไม้ร่วง | | โทนสีเย็น | สีฟ้า สีฟ้าอมเขียว สีเทา | ความห่างไกล ความสงบ ความเศร้า ฤดูหนาว เทคโนโลยี | | ความอิ่มตัวสูง | สีสดใส เข้มข้น โดดเด่น | พลังงาน ความเยาว์วัย แฟนตาซี วัฒนธรรมป๊อป | | ความอิ่มตัวต่ำ | สีอ่อนจาง เหมือนพาสเทล | ความเศร้า ความสมจริง ความทรงจำ ย้อนยุค | | สีเขียวอมฟ้าและสีส้ม | การปรับสีฟิล์มแบบคลาสสิก—เงาเย็น แสงสว่างอบอุ่น | ภาพยนตร์ฮอลลีวูดฟอร์มยักษ์, โฆษณา, ภาพยนตร์ | | จานสีไซเบอร์พังค์ | สีชมพูนีออน, สีฟ้าไฟฟ้า, สีม่วงเข้มบนพื้นหลังสีเข้ม | อนาคต, ชีวิตกลางคืน, ดิจิทัล, อวอง-การ์ด | | วินเทจ | สีซีดเล็กน้อย, โทนอุ่น, เงาที่สว่างขึ้น | โหยหาอดีต, ยุค 70-80, ภาพยนตร์อินดี้, ความทรงจำ | | โทนสีธรรมชาติ | น้ำตาล, เขียว, โอ๊คเกอร์, เทอร์ราคอตต้า | ธรรมชาติ, รากฐาน, ออร์แกนิก, สารคดี | | โคดาครอม | สีเขียวและแดงที่เข้มข้น, โทนสีผิวที่อบอุ่น, สีดำที่ลึก | ภาพข่าว, ทศวรรษ 1960-70, สุนทรียศาสตร์อเมริกัน |

คำสำคัญเกี่ยวกับคุณภาพพื้นผิว/ภาพ

พื้นผิว (Texture) กำหนดลักษณะพื้นผิวทางสายตาของวิดีโอ ไม่ว่าจะเป็นลักษณะคล้ายฟิล์ม 35 มม. โฆษณาที่ขัดเงา สารคดี หรือภาพวาดสีน้ำมัน

| คำสำคัญ (อังกฤษ/จีน) | เอฟเฟกต์ภาพ | สถานการณ์ที่นำไปใช้ได้ | |-------|--------- -|----------| | ภาพยนตร์ | บรรยากาศแบบจอกว้าง, ระยะชัดตื้น, สีสันแบบฟิล์ม | เรื่องเล่า, ดราม่า, การเล่าเรื่อง | | สารคดี | แสงธรรมชาติ, องค์ประกอบที่ไม่สมบูรณ์แบบเล็กน้อย | ความสมจริง, ข่าว, การศึกษา | | เชิงพาณิชย์ | แสงสว่างสะอาด สว่างไสว คมชัด การเคลื่อนไหวของกล้องลื่นไหล | การจัดแสดงสินค้า โฆษณา องค์กร | | เกรนฟิล์ม | พื้นผิวเสียงรบกวนแบบออร์แกนิก | เรโทร อนาล็อก อินดี้ อบอุ่น | | อนาโมฟิก | แสงแฟลร์เลนแนวนอน, โบเก้รูปวงรี, การบิดเบือนขอบเล็กน้อย | ดราม่าภาพยนตร์, ไซไฟ, ความรู้สึกยิ่งใหญ่ | | พื้นผิวสีน้ำมัน | ลวดลายแปรงที่มองเห็นได้ชัดเจน, เอฟเฟกต์อิมพาสโตที่เข้มข้น | ศิลปะ, แฟนตาซี, ภูมิทัศน์ในฝัน, คลาสสิก | | หมึกจีน | เฉดสีดำของหมึกบนพื้นหลังสีขาว, ไหลลื่นและเป็นธรรมชาติ | ความงามแบบตะวันออก, มินิมอล, ความสงบ | | 8mm / Super 8 | เกรนหยาบ, รอยรั่วของแสง, ภาพไม่เสถียร, สีซีดจาง | ความทรงจำ, ภาพย้อนอดีต, วิดีโอครอบครัว, ความคิดถึง |

คำสำคัญทางอารมณ์

คำหลักทางอารมณ์ให้ทิศทางทางอารมณ์แก่ระบบ AI. พวกมันมีอิทธิพลต่อทุกสิ่งทุกอย่าง—การดำเนินเรื่อง, การเลือกสี, พฤติกรรมของกล้อง, และความรู้สึกโดยรวม.

| คำสำคัญ (อังกฤษ/จีน) | อารมณ์ที่กระตุ้น | ข้อเสนอแนะการจับคู่ | |-------|----------- -|----------| | อบอุ่น | ความอบอุ่น, ความสบาย, ความปลอดภัย, บ้าน | แสงเทียน, โทนสีอบอุ่น, ฉากภายใน | | ตึงเครียด | ความวิตกกังวล, ความคาดหวัง, เหตุการณ์ที่กำลังจะเกิดขึ้น | แสงด้านข้าง, การถ่ายแบบถือกล้อง, กรอบภาพแคบ | | น่าตื่นเต้น | ความกลัว ความไม่แน่นอน การสะสมอย่างช้าๆ | แสงสลัว ความก้าวหน้าช้า ความอิ่มตัวต่ำ | | มีความสุข | ความสุข การเฉลิมฉลอง ความเบา | ช่วงโกลเด้นอาวร์, ความอิ่มตัวของสีสูง, ภาพระยะไกล | | ความเศร้าหมอง | ความโศกเศร้า, ความโหยหา, ความงามท่ามกลางความเศร้า | ช่วงบลูอาวร์, โทนสีเย็น, ภาพเคลื่อนไหวช้า | | มหากาพย์ | ความยิ่งใหญ่, ความกล้าหาญ, ความน่าเกรงขาม | มุมกว้าง, การเคลื่อนกล้องแบบดอลลี่, ดนตรีประกอบแบบออร์เคสตรา | | การเยียวยา | ความสงบ, การฟื้นฟู, การเยียวยาอย่างอ่อนโยน | แสงนุ่มนวล, โทนสีพาสเทล, โทนธรรมชาติ, จังหวะช้า | | สยองขวัญ | ความกลัว, ความน่าขนลุก, ความไม่สบายใจ | เงามืดลึก, มุมกล้องเอียงดัตช์, ความอิ่มตัวของสีต่ำ, ความเงียบ | | โรแมนติก | ความรัก, ความโหยหา, ความอ่อนโยน, ความใกล้ชิด | แสงย้อน, โทนสีอบอุ่น, ระยะชัดตื้น, ภาพระยะใกล้ | | พลังงานเต็มเปี่ยม | ความเร็ว, ความตื่นเต้น, อะดรีนาลีน | ภาพสั่นไหว, ความเร็วแปรผัน, ความอิ่มตัวของสีสูง, มุมกว้าง | | ความคิดถึง | ความโหยหาอดีต, ความทรงจำหวานอมขม | เกรนฟิล์ม, โทนวินเทจ, ไฮไลท์ที่สว่างเกินไป |

การผสมผสานคำหลักบรรยากาศ: สามตัวอย่าง

พลังที่แท้จริงอยู่ที่การเลือกคำหลักหนึ่งหรือสองคำจากแต่ละมิติแล้วนำมาผสมผสานกัน การผสมผสานสามแบบต่อไปนี้สร้างบรรยากาศที่แตกต่างกันอย่างสิ้นเชิงสำหรับหัวข้อเดียวกัน—ผู้หญิงที่ยืนอยู่ที่หน้าต่าง:

การผสมผสานที่หนึ่ง: ความอบอุ่นแห่งความคิดถึง

แสงหลังยามทองอันอบอุ่น โทนสีอุ่นที่ผสมผสานสีเหลืองอำพันและน้ำผึ้ง พื้นผิวเม็ดฟิล์ม สร้างบรรยากาศแห่งความคิดถึง

การผสมผสานที่สอง: ความตึงเครียดที่เย็นเยียบ

แสงด้านข้างจากแหล่งเดียว โทนสีฟ้าอมเขียวเย็น เนื้อสัมผัสดิจิทัลที่สะอาดตา บรรยากาศตึงเครียด

การผสมผสานที่สาม: เหนือจริงและเหมือนฝัน

ลำแสงเอฟเฟกต์ไทน์ดอลล์ส่องผ่านผ้าม่านบางเบา โทนสีพาสเทล พื้นผิวสีน้ำ บรรยากาศเยียวยา

หัวข้อเดียวกัน วิดีโอสามตอนที่แตกต่างกันโดยสิ้นเชิง บรรยากาศหลักคือแผงควบคุม


จากวลีเดี่ยวสู่คำสั่งที่ชวนให้จินตนาการ: 5 ตัวอย่างขั้นสูง

วิธีที่ดีที่สุดในการเรียนรู้การเขียนคำสั่งคือการสังเกตกระบวนการวิวัฒนาการของคำสั่ง ตัวอย่างแต่ละข้อด้านล่างจะพัฒนาจากพื้นฐาน V1 (ประเภทที่คนส่วนใหญ่เขียน) ไปสู่ V2 (เพิ่มความเป็นเฉพาะเจาะจงและการเคลื่อนไหวของกล้อง) จนถึง V3 (คำสั่งที่ระบุรายละเอียดครบถ้วนในระดับภาพยนตร์) สังเกตการเปลี่ยนแปลงที่เกิดขึ้นในแต่ละระดับและเหตุผลที่มีการนำมาใช้

สำหรับตัวอย่างคำแนะนำวิดีโอที่พร้อมใช้งานเพิ่มเติม กรุณาดูที่ 10 คำแนะนำวิดีโอ AI ที่ใช้งานได้จริง

การเปรียบเทียบวิวัฒนาการของคำสั่งสามขั้นตอน แสดงคำสั่งพื้นฐาน V1 คำสั่งที่ได้รับการปรับปรุง V2 (รวมการเคลื่อนไหวของกล้องและเอฟเฟกต์แสง) และคำสั่งระดับภาพยนตร์ V3 (ระบุรายละเอียดครบถ้วน) โดยแต่ละขั้นตอนแสดงให้เห็นถึงการปรับปรุงคุณภาพวิดีโอที่สอดคล้องกัน

การพัฒนาอย่างรวดเร็วในทางปฏิบัติ V1 ให้ข้อมูลกับ AI แทบไม่มีเลย V3 ให้ข้อมูลทุกอย่าง—ผลลัพธ์แตกต่างกันอย่างสิ้นเชิง

ตัวอย่างที่ 1: ภาพบุคคล/อารมณ์ — "หญิงสาวเดินในสายฝน"

V1 — รุ่นพื้นฐาน (18 คำ)

A woman walking in the rain at night in a city, cinematic, beautiful

คุณจะได้รับ: ผู้หญิงทั่วไป เมืองทั่วไป ฝนทั่วไป แสงที่แบนราบ ไม่มีความรู้สึกหรืออารมณ์ใดๆ AI เติมเต็มทุกช่องว่างด้วยค่าเฉลี่ยทางสถิติ

V2 — เวอร์ชันปรับปรุง (62 คำ)

A young Asian woman in a long dark coat walks slowly through a rain-soaked Tokyo backstreet at night. Neon signs reflect in the wet pavement, casting pink and blue light. She carries a transparent umbrella. Camera tracks beside her at shoulder height. Shallow depth of field. Melancholic mood.

สิ่งที่ได้รับการปรับปรุง: ตัวตนเฉพาะของหัวข้อ, สถานที่เฉพาะเจาะจง, แหล่งกำเนิดแสงเฉพาะ, ตำแหน่งกล้อง, ทิศทางอารมณ์. AI ขณะนี้มีข้อมูลเพียงพอที่จะสร้างภาพที่ไม่ซ้ำกัน.

V3 — คุณภาพภาพยนตร์ (138 คำ)

A woman in her late 20s, Japanese, long black hair partially wet and clinging to her neck, wearing an oversized charcoal wool coat over a cream turtleneck, walks alone through a narrow Shinjuku backstreet at 2am. Rain falls in fine sheets, catching neon light from izakaya signs overhead — warm amber kanji characters and cold blue beer advertisements. The wet asphalt mirrors everything, creating a double world beneath her feet. She carries a transparent vinyl umbrella, water beading and streaming down its surface.

Camera: tracking shot at shoulder height, moving alongside her at walking pace, shallow depth of field at f/1.4, foreground rain droplets occasionally crossing the lens out of focus.

Lighting: practical neon sources only — no fill light. Rim light from signs behind her outlines her coat collar and umbrella edge. Her face catches intermittent warm light as she passes each shopfront.

Style: cinematic, Kodak Vision3 500T film stock, slight grain, teal-and-amber color grade, Wong Kar-wai atmosphere.

เสียง: ฝนตกกระทบผิวกระจกร่ม, เสียงแจ๊สเบาๆ จากบาร์ที่อยู่ไกล, เสียงฝีเท้าของเธอบนหินเปียก, ไม่มีบทสนทนา, ไม่มีดนตรีประกอบ.

(หญิงสาวชาวญี่ปุ่นวัยยี่สิบกว่าๆ ผมยาวสีดำเปียกชื้นบางส่วนและติดอยู่ที่คอ สวมเสื้อโค้ทขนสัตว์สีเทาเข้มขนาดใหญ่เกินตัวทับเสื้อคอเต่าสีครีม เดินคนเดียวผ่านตรอกแคบๆ ในชินจูกุเวลาตีสอง. สายฝนละเอียดจับแสงนีออนจากป้ายร้านอิซากายะเหนือศีรษะ—อักษรญี่ปุ่นสีเหลืองอำพันอบอุ่นและโฆษณาเบียร์สีฟ้าเย็นยะเยือก ถนนแอสฟัลต์ที่ชื้นสะท้อนทุกสิ่ง สร้างโลกกระจกใต้ฝ่าเท้าของเธอ เธอถือร่มพลาสติกใส หยดน้ำควบแน่นและไหลลงตามผิวของมัน

ทำไม V3 ถึงได้ผล: ทุกองค์ประกอบของสูตรถูกกำหนดไว้อย่างชัดเจน ไม่มีช่องว่างให้ AI เดา – เมื่อ AI ไม่เดา มันจะแสดงผลตามที่คุณอธิบายไว้อย่างแม่นยำ

ตัวอย่างที่ 2: การจัดแสดงสินค้า — "นาฬิกาบนโต๊ะ"

V1 — รุ่นพื้นฐาน (14 คำ)

A luxury watch sitting on a table, product shot, high quality, 4K

V2 — ฉบับปรับปรุง (58 คำ)

A stainless steel dive watch with a dark blue dial rests on a slab of raw gray marble. Camera orbits slowly around the watch, 15 degrees above. Single key light from the upper left creates a defined shadow. The watch's crystal catches the light and creates a brief flare. Commercial style, clean background.

V3 — คุณภาพภาพยนตร์ (126 คำ)

A stainless steel dive watch with a sunburst navy-blue dial and ceramic bezel sits on a rough-cut block of Carrara marble, positioned at the golden-ratio intersection of the frame. The second hand sweeps continuously. Micro water droplets bead on the crystal surface and the steel bracelet links, catching light.

Camera: begins in macro extreme close-up on the dial — the indices and lume dots fill the frame — then slowly dollies out while simultaneously orbiting clockwise, completing a 270-degree arc over 8 seconds until the full watch and marble base are revealed in a three-quarter beauty shot.

Lighting: single hard key light at 10 o'clock position, 45 degrees above. No fill — deep shadows on the right side. A subtle rim light from behind separates the watch from the dark charcoal background.

Style: high-end commercial, ultra-sharp 8K downscaled to 4K, zero grain, clinical precision. Color: cool steel tones with warm gold accents from the lume.

เสียง: เงียบเกือบสนิท — มีเพียงเสียงติ๊กเบา ๆ ของกลไกการทำงาน และเสียงกริ่งใสเพียงหนึ่งครั้งในช่วงเวลาที่แสงวาบ

(นาฬิกาดำน้ำสแตนเลสสตีล หน้าปัดสีน้ำเงินนาวีแบบซันเบิร์สต์ ขอบเซรามิก วางอยู่บนบล็อกหินอ่อนคาร์ราราที่ตัดอย่างหยาบ ๆ ซึ่งวางอยู่ที่จุดตัดของอัตราส่วนทองคำของกรอบ นาฬิกาเดินหน้าต่อไป หยดน้ำเล็กๆ ควบแน่นบนพื้นผิวของคริสตัลและข้อต่อของสายเหล็ก สะท้อนแสง

ตัวอย่างที่ 3: การท่องเที่ยวชมวิว — "ภูเขาในยามพระอาทิตย์ขึ้น"

V1 — รุ่นพื้นฐาน (12 คำ)

Beautiful mountains at sunrise, drone shot, epic landscape, cinematic

V2 — ฉบับปรับปรุง (55 คำ)

Snow-capped mountain peaks emerging from a sea of clouds at sunrise. The first rays of sun paint the peaks golden while the valleys remain in blue shadow. Camera cranes up slowly from the cloud layer, revealing the full mountain range. Wide angle, epic scale, warm-to-cool color gradient.

V3 — คุณภาพภาพยนตร์ (134 คำ)

The Dolomites at sunrise in late autumn. Jagged limestone spires — the Tre Cime di Lavaredo — pierce through a thick layer of valley clouds, their east-facing faces catching the first horizontal rays of sun and turning from cold blue-gray to blazing amber-gold. The cloud layer below is a rolling ocean of soft white and pale peach, filling the valleys completely.

Camera: starts buried inside the cloud layer — visibility near zero, soft white diffusion everywhere — then cranes upward at a steady pace, breaking through the cloud surface to reveal the peaks and the vast sky above. The transition from claustrophobic fog to infinite horizon takes 4 seconds. Continue rising to a high aerial wide shot. 24mm wide angle lens.

Lighting: first light of day — sun at 5 degrees above the eastern horizon, casting extreme raking light across the mountain faces. Golden hour warmth on lit surfaces, blue hour coolness in shadowed areas. Volumetric light beams visible where sun cuts between peaks.

Style: National Geographic cinematic, IMAX-quality, ultra-wide dynamic range, vivid but natural color, no filters.

เสียง: ลมที่ระดับความสูง — เสียงกระซิบต่ำอย่างต่อเนื่องเป็นระยะ ๆ พร้อมลมกระโชกเป็นครั้งคราว ไม่มีเสียงดนตรี ไม่มีเสียงมนุษย์ ความเงียบยิ่งขับเน้นให้เห็นถึงขนาด

(พระอาทิตย์ยามเช้าปลายฤดูใบไม้ร่วงในเทือกเขาโดโลไมท์ ยอดหินปูนแหลมคม—สามยอดเขา—ทะลวงผ่านเมฆหนาทึบในหุบเขา ด้านทิศตะวันออกของยอดเขาสะท้อนแสงอาทิตย์แนวนอนแรก เปลี่ยนสีจากน้ำเงินเทาเย็นเป็นทองอำพันเปลวไฟ)

ตัวอย่างที่ 4: ฉากแอ็กชัน — "นักศิลปะการต่อสู้ชกหมัด"

V1 — รุ่นพื้นฐาน (15 คำ)

A martial artist doing a spinning kick, action movie style, slow motion

V2 — เวอร์ชันปรับปรุง (64 คำ)

A female martial artist in a dark training hall performs a spinning back kick. Her bare foot connects with a hanging heavy bag, sending it swinging violently. Camera captures the kick from a low angle, slightly slow motion at the point of impact, then returns to real-time as she recovers her stance. Side lighting creates dramatic shadows.

V3 — คุณภาพภาพยนตร์ (141 คำ)

A woman in her 30s, lean and muscular, wearing a fitted black tank top and loose gray training pants, stands in a dimly lit martial arts gym. Worn wooden floor, heavy bags hanging in rows, chalk dust suspended in the air. She explodes from stillness — a spinning hook kick that arcs through 360 degrees, her back heel striking a leather heavy bag at head height.

Camera: starts medium shot at 45-degree angle. As the spin begins, camera speed-ramps to 240fps slow motion — her hair whips in an arc, chalk dust traces the path of her foot, the bag surface ripples visibly on impact. Hold for one beat, then ramp back to real-time as she plants her foot. Slight handheld energy.

Lighting: single harsh side light from camera-left, no fill. Chalk dust and sweat particles glow in the light beam.

Style: David Fincher / Fight Club aesthetic — desaturated, greenish-teal undertone, high contrast, gritty. Anamorphic lens with subtle horizontal flares.

เสียง: ความเงียบก่อนการเตะ — เสียงฮัมเบาๆ จากโรงยิม, การหายใจเข้า. การเตะ: เสียงผ้าแตกดังสนั่น, ผลกระทบจากหนังหนัก, เสียงโซ่กระทบ. การหายใจออกอย่างแรงของเธอเมื่อสัมผัส. ไม่มีเสียงเพลง.

(ผู้หญิงวัยสามสิบ, ผอมเพรียวและมีกล้ามเนื้อ, สวมเสื้อกั๊กสีดำแนบเนื้อและกางเกงฝึกซ้อมสีเทาหลวม, ยืนอยู่ในห้องฝึกศิลปะการต่อสู้ที่มีแสงสลัว. พื้นไม้ที่สึกหรอ แถวของกระสอบทรายที่แขวนอยู่ ฝุ่นละอองที่ลอยอยู่ในอากาศ เธอระเบิดจากความนิ่ง—เตะหมุน 360 องศา ส้นเท้าฟาดกระสอบหนังที่ระดับศีรษะ

ตัวอย่างที่ 5: เรื่องเล่าเชิงอารมณ์ — "คุณยายกับหลานชาย"

V1 — รุ่นพื้นฐาน (16 คำ)

A grandmother and her grandchild spending time together, heartwarming, emotional, beautiful moment

V2 — ฉบับปรับปรุง (71 คำ)

An elderly grandmother with silver hair and weathered hands teaches her 5-year-old granddaughter how to knead bread dough in a sunlit country kitchen. The child stands on a wooden step stool, flour on her cheeks, laughing. The grandmother guides her small hands through the dough. Golden morning light through a window. Warm color palette. Intimate, cozy atmosphere.

V3 — คุณภาพภาพยนตร์ (147 คำ)

A Japanese grandmother in her 80s, silver hair in a soft bun, deep expression lines around smiling eyes, wearing an indigo apron over a cream linen blouse, stands beside her granddaughter — age 4 or 5, round cheeks, short black hair with a red clip — at a low wooden table in a traditional kitchen. Shoji screen doors are slid open to a small garden where morning light enters. They are making mochi together. The grandmother's large, weathered hands wrap around the child's tiny ones, guiding them to fold and press the soft rice dough. Flour dust floats in the shaft of sunlight between them.

Camera: close-up on their four hands working the dough — the contrast of old and young skin. Slowly dolly out to a medium shot including both faces. Rack focus between them — first sharp on the grandmother's eyes, then pulling to the child's smile. 85mm portrait lens, f/2.0, creamy bokeh.

Lighting: natural morning sunlight from the garden, soft and directional, Tyndall effect through the flour dust. No artificial light. The light creates a warm halo around the grandmother's silver hair.

Style: Hirokazu Kore-eda film quality — observational, unhurried, documentary intimacy with cinematic beauty. Kodachrome-inspired color. 16:9.

เสียง: เสียงนุ่มนวลเป็นจังหวะของมือที่กดแป้ง, นกนอกสวน, กระดิ่งลมที่ดังไกล, เสียงหัวเราะของเด็กเป็นครั้งคราว, เสียงคุณยายฮัมเพลงพื้นบ้านเบาๆ ไม่มีคะแนน — มีเพียงเสียงที่อยู่ในเรื่องเท่านั้น

(คุณยายชาวญี่ปุ่นอายุประมาณแปดสิบปี ผมสีเงินรวบเป็นมวยหลวมๆ รอยย่นลึกปรากฏรอบดวงตาที่ยิ้มแย้ม สวมผ้ากันเปื้อนสีน้ำเงินครามทับเสื้อเชิ้ตผ้าลินินสีครีม) เธอยืนอยู่ข้างหลานสาววัยสี่หรือห้าขวบ—แก้มกลม ผมสั้นสีดำติดกิ๊บสีแดง—ที่โต๊ะไม้เตี้ยในห้องครัวแบบดั้งเดิม ประตูโชจิเลื่อนเปิดออกสู่สวนเล็กๆ ที่แสงยามเช้าสาดส่องเข้ามา ทั้งสองคนร่วมกันทำโมจิ มือใหญ่ของยายที่เต็มไปด้วยร่องรอยแห่งกาลเวลาโอบล้อมมือเล็กๆ ของเด็กน้อย ค่อยๆ นำทางให้เธอพับและกดแป้งข้าวเหนียวนุ่มๆ ฝุ่นแป้งลอยอยู่ในลำแสงแดดระหว่างพวกเขา มันมีลักษณะเฉพาะตัวแบบที่ Hirokazu Kore-eda มักมี—การสังเกตอย่างละเอียด ไม่รีบร้อน ความใกล้ชิดแบบสารคดีที่ผสมผสานกับความงามแบบภาพยนตร์


ผสานการออกแบบเสียงเข้ากับคำแนะนำ

การออกแบบเสียงถือเป็นมิติที่ถูกมองข้ามมากที่สุดในการเขียนข้อความสำหรับวิดีโอ ภายในปี 2026 แพลตฟอร์มอย่าง Seedance, Veo 3 และ Kelin ต่างก็รองรับการสร้างเสียงแบบซิงโครไนซ์สำหรับวิดีโอแล้ว – ความแตกต่างด้านคุณภาพระหว่างข้อความที่มีการใช้สัญญาณเสียงกับข้อความที่ไม่มีนั้นเห็นได้ชัดเจนอย่างมาก

ลองพิจารณาดู: ภาพป่าที่สวยงามโดยปราศจากเสียงรอบข้างให้ความรู้สึกเหมือนภาพเคลื่อนไหว GIF เมื่อเพิ่มเสียงนกร้อง เสียงใบไม้ไหว และเสียงน้ำไหลเบาๆ จากระยะไกล มันจะกลายเป็นสถานที่ที่คุณอยากก้าวเข้าไปสัมผัสทันที

รูปแบบการออกแบบเสียง

เพิ่มคำสั่งเสียงที่ท้ายข้อความแจ้งเตือนในย่อหน้าหรือบรรทัดแยกต่างหาก โดยครอบคลุมสามระดับ:

ชั้นแรก: เพลงพื้นหลัง — บรรยากาศโดยรวมและสไตล์

Background music: slow ambient piano, minor key, sparse notes with reverb
(背景音乐:缓慢的氛围钢琴,小调,稀疏的音符带混响)

ชั้นที่สอง: เสียงเอฟเฟกต์บรรยากาศ — สร้างเสียงพื้นหลังของฉาก

Ambient: light rain on leaves, distant thunder rolls, wet road traffic hum
(环境音:轻柔的雨打树叶声、远处的雷声滚动、湿路上的交通嗡嗡声)

ชั้นที่สาม: เสียงเอฟเฟกต์การกระทำและบทสนทนา — เสียงเฉพาะที่เกี่ยวข้องกับเหตุการณ์ในวิดีโอ

SFX: footsteps on wet pavement, umbrella opening with a click
Dialogue: none
(音效:湿路面上的脚步声、雨伞咔嗒打开的声音。对话:无)

ออดิโอคีย์เวิร์ดอ้างอิง

สไตล์ดนตรีสำหรับอารมณ์ต่าง ๆ:

อารมณ์ทิศทางดนตรี (คำแนะนำภาษาอังกฤษ)
สงบแอมเบียนต์, เปียโนเบาๆ, กีตาร์โปร่งเล่นด้วยนิ้ว, โล-ไฟ

| โรแมนติก | สตริงควอเต็ต, แจ๊สเบาๆ, บอสซาโนวา | | ลึกลับ | แอมเบียนท์มืด, เปียโนเสียงสะท้อนหนัก, เสียงระฆังจากระยะไกล | | เต็มไปด้วยพลัง | จังหวะอิเล็กทรอนิกส์, กลองเร้าใจ, เบสหนัก, จังหวะเร็ว | | เศร้า | เชลโล่เดี่ยว, เปียโนช้าในคีย์ไมเนอร์, กีตาร์เบาบาง |

เสียงรอบข้าง:

| สิ่งแวดล้อม | ชั้นเสียง (คำแนะนำภาษาอังกฤษ) | |------|--------------------- -| | ป่า | เสียงนกร้อง ใบไม้ไหว เสียงนกหัวขวานไกล ๆ น้ำไหล | | เมืองยามค่ำคืน | เสียงรถวิ่ง เสียงไซเรนไกล ๆ แสงนีออนวูบวาบ เสียงฝีเท้า | | มหาสมุทร | คลื่นซัดสาด เสียงนกนางแอ่น เครื่องยนต์เรือไกล ๆ | | คาเฟ่ในร่ม | เครื่องชงกาแฟ, เสียงพูดคุยเบาๆ, ช้อนกระทบกับเซรามิก, แจ๊ส | | วันฝนตก | ฝนตกหนัก (หยดเบาๆ / ฝนตกหนัก), ฟ้าร้อง, เสียงหยดน้ำ | | เวิร์กช็อป | เสียงเครื่องมือ, เศษไม้, เสียงเครื่องจักร, วิทยุในพื้นหลัง |

เมื่อใดควรใช้ความเงียบ

ความเงียบไม่ใช่การขาดการออกแบบเสียง—แต่เป็นการเลือกอย่างตั้งใจ ความเงียบเชิงกลยุทธ์สามารถสร้าง:

  • ช่วงเวลาแห่งผลกระทบ: ความเงียบที่มาก่อนจังหวะสำคัญจะยิ่งเน้นย้ำจังหวะนั้น
  • ความรู้สึกของขนาด: เสียงลมเพียงอย่างเดียวที่พัดผ่านภูมิประเทศอันกว้างใหญ่สามารถสื่อถึงความยิ่งใหญ่
  • ความตึงเครียด: การตัดเสียงที่คาดว่าจะได้ยินออกไปสร้างความรู้สึกไม่สบายใจ
  • การโฟกัส: ความเงียบจะนำสายตาและความสนใจทั้งหมดไปยังสิ่งที่มองเห็น

ในคำสั่ง ให้ระบุอย่างชัดเจนว่า: เสียง: เงียบ — ไม่มีเพลง ไม่มีเสียงบรรยากาศ มีเพียงเสียงหายใจของบุคคลเท่านั้น

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการสร้างเสียงในวิดีโอเพลงด้วย AI โปรดดูที่ คู่มือการสร้างวิดีโอเพลงด้วย AI.


เทคนิคการแจ้งเตือนเฉพาะแพลตฟอร์ม

สูตรสากลสามารถใช้ได้ทั่วไป แต่แพลตฟอร์มวิดีโอ AI แต่ละแพลตฟอร์มมีลักษณะเฉพาะในการตีความคำสั่งที่แตกต่างกัน การปรับคำสั่งให้เหมาะสมกับแพลตฟอร์มที่คุณใช้สามารถเพิ่มประสิทธิภาพผลลัพธ์ได้อย่างมาก

การเปรียบเทียบการปรับปรุงคำสั่งสำหรับแนวคิดวิดีโอเดียวกันบนแพลตฟอร์มวิดีโอ AI ห้าแพลตฟอร์มที่แตกต่างกัน (Seedance, Sora, Keeling, Runway และ Veo 3)

แนวคิดเดียวกัน—'ผู้หญิงเดินในฝนตอนกลางคืน'—ปรับให้เหมาะสมสำหรับแพลตฟอร์มที่แตกต่างกันห้าแพลตฟอร์ม สูตรเดียวกัน แต่เน้นต่างกัน

Seedance

ข้อดี: รูปแบบไทม์ไลน์สตอรี่บอร์ด, ลำดับภาพหลายช็อต, การอ้างอิงจากภาพเป็นวิดีโอ, ตัวสร้าง ข้อความกระตุ้น ในตัว

เทคนิคการเพิ่มประสิทธิภาพ:

  • ใช้โครงสร้างไทม์ไลน์สตอรี่บอร์ดสำหรับลำดับที่ซับซ้อน—แบ่งวิดีโอออกเป็นช็อตที่มีเวลาประทับ:
 Shot 1 (0-3s): [描述]
 Shot 2 (3-6s): [描述]
 Shot 3 (6-10s): [描述]
  • รักษาความสอดคล้องของสไตล์และลักษณะตัวละครโดยอ้างอิงรูปภาพที่อัปโหลดด้วย @Image1, @Image2
  • การใช้ภาษาภาพยนตร์ให้ผลลัพธ์ที่ยอดเยี่ยม—ใช้คำศัพท์เฉพาะ (dolly, track, orbit) แทนคำอธิบายที่คลุมเครือ ("เคลื่อนที่ไปข้างหน้า")
  • รวมการออกแบบเสียง—Seedance จัดการสัญญาณเสียง
  • กระบวนการทำงานที่มีประสิทธิภาพสูงสุด: ใช้ Video Prompt Generator เพื่อสร้างคำแนะนำที่มีโครงสร้างจากแนวคิดง่ายๆ จากนั้นปรับแต่งด้วยตนเอง

คู่มือคำแนะนำเฉพาะแพลตฟอร์มของ Seedance ที่ครอบคลุม (พร้อมตัวอย่างมากกว่า 50 ตัวอย่าง) ดูได้ที่ คู่มือคำแนะนำของ Seedance.

Sora(OpenAI)

ข้อดี: พฤติกรรมที่สมจริงทางกายภาพ, การเคลื่อนไหวที่เป็นธรรมชาติ, และการเข้าใจภาษาธรรมชาติของข้อความยาว

เทคนิคการเพิ่มประสิทธิภาพ:

  • ใช้ย่อหน้าที่ลื่นไหลและอธิบายอย่างละเอียดแทนการใช้รายการที่มีโครงสร้าง—Sora มีความสามารถโดดเด่นในการแยกแยะภาษาธรรมชาติ
  • เน้นรายละเอียดทางกายภาพ: แรงโน้มถ่วง, น้ำหนัก, คุณสมบัติของวัสดุ, พลศาสตร์ของไหล
  • อธิบายว่าสิ่งต่างๆ " "รู้สึกเหมือน" — คำอธิบายเนื้อสัมผัสและวัสดุช่วยเพิ่มความสมจริงทางกายภาพ
  • ระบุอัตราส่วนภาพและข้อกำหนดระยะเวลา
  • รายละเอียดทางฟิสิกส์: "ผ้าหนาหนักแกว่งไปมาตามแต่ละก้าว ล่าช้าเนื่องจากน้ำหนักของมันเอง" ให้ผลลัพธ์ที่ดีกว่า "กระโปรงลอย"

เกอ หลิง คลิง (Kuaishou)

ข้อดี: ความเร็วในการสร้างที่รวดเร็ว, ประสิทธิภาพการเคลื่อนไหวและการเคลื่อนไหวที่แข็งแกร่ง, และความสม่ำเสมอของใบหน้าที่ยอดเยี่ยม

เคล็ดลับการเพิ่มประสิทธิภาพ:

  • รักษาข้อความให้กระชับ—Keli ตอบสนองได้ดีกว่ากับข้อความที่มุ่งเน้นการกระทำ (50-80 คำเป็นค่าที่เหมาะสม)
  • เริ่มต้นด้วยการกระทำ: นักเต้นกระโดดและหมุน แทนที่จะกล่าวถึงการเคลื่อนไหวหลังจากบรรยายฉากยาว
  • ระบุทิศทางการเคลื่อนไหวอย่างชัดเจน: เคลื่อนที่จากซ้ายไปขวา, เข้าหาเลนส์กล้อง, หันออก
  • Keen มีความโดดเด่นในการแสดงการเคลื่อนไหวของมนุษย์และสีหน้า—ใช้ประโยชน์จากสิ่งนี้สำหรับคำสั่งที่เน้นอารมณ์ในระยะใกล้
  • คำแนะนำการเคลื่อนไหวของกล้องมีประสิทธิภาพ แต่แต่ละคำเตือนควรรักษาการเคลื่อนไหวของกล้องไว้เพียงหนึ่งหรือสองอย่างที่แตกต่างกัน

ความหมายสากล, รูปแบบสากล / รันเวย์ (รุ่น-3 อัลฟา / รุ่น-4)

เทคนิคการเพิ่มประสิทธิภาพสำหรับ Tongyi Wanshang:

  • รองรับการป้อนคำสั่งภาษาจีนโดยตรง ให้ผลลัพธ์ที่เหนือกว่าเมื่อเทียบกับการแปล
  • แสดงความเข้าใจที่ยอดเยี่ยมในองค์ประกอบความงามของภาษาจีนดั้งเดิม—การวาดด้วยหมึก, สไตล์ชาติ, และฉากเครื่องแต่งกายตามยุคสมัย
  • ให้ผลลัพธ์ที่มีประสิทธิภาพด้วยแท็กสไตล์ที่กระชับและชัดเจน

เทคนิคการเพิ่มประสิทธิภาพรันเวย์:

  • ผสานคำอธิบายข้อความกับแท็กสไตล์ — รันเวย์มีความเข้าใจสไตล์ที่แข็งแกร่ง
  • อธิบายการเคลื่อนไหวโดยใช้เวกเตอร์เชิงพื้นที่: การเคลื่อนไหวจากล่างซ้ายไปบนขวา
  • เมื่อใช้ Motion Brush ให้เน้นข้อความคำแนะนำที่ฉากและสไตล์โดยรวม ในขณะที่ใช้แปรงเพื่อจัดการกับพื้นที่การเคลื่อนไหวเฉพาะ
  • รันเวย์แสดงให้เห็นถึงความเข้าใจที่ยอดเยี่ยมในการอธิบายสไตล์ศิลปะ — "ในสไตล์ของภาพยนตร์ Terrence Malick" - เมื่อใช้ Motion Brush ให้เน้นที่ภาพรวมของฉากและสไตล์ จากนั้นใช้แปรงเพื่อปรับแต่งพื้นที่การเคลื่อนไหวเฉพาะ
  • Runway มีความโดดเด่นในการตีความคำอธิบายสไตล์ทางศิลปะ – "ในสไตล์ของภาพยนตร์ของ Terrence Malick" ให้ผลลัพธ์ที่ยอดเยี่ยม
  • รักษาคำกระตุ้นที่เน้น – สร้างฉากที่ชัดเจนหนึ่งฉากต่อคำกระตุ้น แทนที่จะเป็นลำดับหลายช็อต

Veo 3(Google DeepMind)

ข้อดี: ความเข้าใจในเสียง, การจำลองทางกายภาพ, คุณภาพภาพยนตร์, ฉากที่ยาวขึ้น

เทคนิคการเพิ่มประสิทธิภาพ:

  • รวมคำบรรยายเสียงโดยละเอียด—Veo 3 สร้างเสียงที่ซิงโครไนซ์จากข้อความ
  • อธิบายปฏิสัมพันธ์ทางกายภาพอย่างละเอียด: วิธีที่วัตถุชนกัน วัสดุเปลี่ยนรูป และแสงมีปฏิสัมพันธ์กับพื้นผิว
  • ใช้คำศัพท์ทางภาพยนตร์—ข้อมูลการฝึกของ Veo 3 ให้ความสำคัญกับการสร้างภาพยนตร์มืออาชีพอย่างมาก
  • ระบุระยะเวลาและจังหวะ: ฉากค่อยๆ เปิดเผยออกมาอย่างช้าๆ ตลอด 10 วินาที
  • คำอธิบายทางกายภาพช่วยเพิ่มผลกระทบอย่างมีนัยสำคัญ: น้ำกระเด็นขึ้นไปเมื่อกระทบกับพื้นผิว, ละอองน้ำสะท้อนแสงสว่าง แทนที่จะเป็นเพียง "กระเด็น"

สำหรับการเปรียบเทียบอย่างละเอียดระหว่าง Seedance และ Sora ในแง่ของการตีความคำสั่งและการคุณภาพของผลลัพธ์ โปรดดูที่ การเปรียบเทียบ Seedance กับ Sora.


หรือให้ AI เขียนข้อความกระตุ้นความคิดแทนคุณ

คุณเพิ่งเสร็จสิ้นการสร้างกรอบการทำงานทั้งหมดสำหรับการสร้างคำแนะนำวิดีโอจากศูนย์ ความรู้นี้มีค่าอย่างยิ่ง—มันช่วยให้คุณประเมินคุณภาพของคำแนะนำได้ดีขึ้น และมอบอำนาจให้คุณควบคุมทุกรายละเอียดอย่างสมบูรณ์ แต่คุณไม่จำเป็นต้องเขียนคำแนะนำทุกครั้งด้วยตัวเอง

แผนภาพกระบวนการทำงานแสดงแนวทางแบบผสมผสาน: AI สร้างคำแนะนำที่มีโครงสร้างเบื้องต้น จากนั้นมนุษย์จะตรวจสอบและปรับปรุงให้เหมาะสมสำหรับองค์ประกอบเฉพาะ คำแนะนำที่ได้รับการปรับปรุงแล้วจะนำไปสร้างวิดีโอขั้นสุดท้าย

การทำงานแบบผสมผสาน: ให้ AI จัดการกับคำศัพท์เชิงโครงสร้างและเทคนิค จากนั้นใส่มุมมองสร้างสรรค์ของคุณในระหว่างขั้นตอนการปรับปรุงให้เหมาะสม

เมื่อไรควรเขียนด้วยมือ vs. การใช้ AI

สถานการณ์วิธีที่ดีที่สุด
คุณมีวิสัยทัศน์สร้างสรรค์ที่ชัดเจนและรู้แน่ชัดว่าคุณต้องการอะไรการเขียนด้วยลายมือ — คุณจะเร็วกว่าและแม่นยำกว่าการแก้ไขร่างที่สร้างโดย AI
คุณมีแนวคิดคร่าวๆ แต่ต้องการโครงสร้างการสร้างโดย AI → การปรับแต่งด้วยตนเอง
คุณจำเป็นต้องสร้างข้อความกระตุ้นที่หลากหลายอย่างรวดเร็วการสร้างแบบกลุ่มด้วย AI → เลือกและปรับปรุงข้อความที่ดีที่สุด
คุณกำลังเรียนรู้และต้องการศึกษาโครงสร้างของข้อความกระตุ้นการสร้างด้วย AI → อ่านและวิเคราะห์ — นี่คือวิธีที่คุณสร้างคลังคำศัพท์ของคุณ
คุณจำเป็นต้องจับคู่ภาพอ้างอิงเฉพาะเขียนด้วยมือ — อธิบายอย่างแม่นยำว่าคุณเห็นอะไรในภาพอ้างอิง

กระบวนการทำงานแบบผสมผสาน (แนะนำ)

กระบวนการเขียนข้อความที่มีประสิทธิภาพสูงสุดคือการผสมผสานระหว่างการสร้างสรรค์ด้วย AI กับการปรับปรุงโดยมนุษย์:

  1. เริ่มต้นด้วย AI. ไปที่ Seedance Video Prompt Generator, อธิบายความคิดของคุณในประโยคหรือสองประโยค, เลือกสไตล์, และสร้าง.

  2. ตรวจสอบผลลัพธ์อย่างละเอียด ระบบ AI จะสร้างคำแนะนำที่มีโครงสร้างซึ่งประกอบด้วยภาษาของกล้อง, ระยะเวลา, แสงสว่าง, และเสียง อ่านผ่านอย่างละเอียด กล้องทำงานตามอารมณ์ที่ต้องการหรือไม่? การจัดแสงสร้างบรรยากาศตามที่ต้องการหรือไม่? มีรายละเอียดใดที่คุณต้องการแก้ไขหรือไม่?

  3. การปรับแต่งด้วยตนเอง นี่คือจุดที่ความรู้ของคุณเกี่ยวกับสูตร, ภาษาภาพยนตร์, และคำค้นหาที่สร้างบรรยากาศเข้ามามีบทบาท. แทนที่ภาพที่เลือกโดย AI ด้วยภาพที่สอดคล้องกับวิสัยทัศน์ของคุณมากขึ้น. ปรับคำค้นหาเกี่ยวกับแสงสว่าง. เพิ่มรายละเอียดเฉพาะที่ AI ไม่สามารถคำนึงถึงได้—ลักษณะเฉพาะของตัวละคร, ข้อกำหนดเฉพาะของแบรนด์, ความละเอียดอ่อนทางอารมณ์.

  4. สร้างวิดีโอ ส่งคำสั่งที่ได้รับการปรับให้เหมาะสมไปยัง เครื่องมือสร้างวิดีโอ ผลลัพธ์ที่ได้จะดีกว่าคำสั่งที่สร้างโดยมือใหม่ทั้งหมดหรือคำสั่งที่สร้างโดย AI โดยไม่มีการตรวจสอบอย่างสิ้นเชิง

คู่มือที่ครอบคลุมเกี่ยวกับการใช้งานเครื่องมือสร้างข้อความสำหรับ AI สามารถพบได้ใน คู่มือการสร้างข้อความสำหรับวิดีโอ AI


เอฟเฟกต์ภาพยนตร์: ความเชี่ยวชาญผ่านการบูรณาการ

ให้เราสร้างคำแนะนำสุดท้ายที่ใช้ทุกสิ่งที่ได้กล่าวถึงในคู่มือนี้—สูตร, ภาษาภาพยนตร์, คำสำคัญที่สร้างบรรยากาศ, การออกแบบเสียง—เพื่อสร้างเอฟเฟ็กต์ที่เหมือนภาพยนตร์อย่างแท้จริง

บรีฟสร้างสรรค์: นักบินอวกาศที่โดดเดี่ยวค้นพบชีวิตพืชบนดาวอังคาร

วิดีโอ AI คุณภาพระดับภาพยนตร์อันน่าทึ่งแสดงให้เห็นนักบินอวกาศผู้โดดเดี่ยวคุกเข่าอยู่ท่ามกลางพื้นผิวดาวอังคารสีแดงเลือดหมู ค้นพบพืชสีเขียวขนาดเล็ก ซึ่งถูกสร้างขึ้นด้วยแสงด้านข้างอันน่าตื่นตาตื่นใจและเอฟเฟกต์ฝุ่นแบบสามมิติ

คำแนะนำที่ระบุไว้อย่างครบถ้วนในสไตล์ภาพยนตร์จะให้ผลลัพธ์เสมือนถูกกำกับโดยผู้สร้างภาพยนตร์—เพราะนั่นคือสิ่งที่มันเป็นจริงๆ ทุกองค์ประกอบล้วนรับใช้เรื่องราว

คำแนะนำเต็มรูปแบบ:

Subject: A solitary astronaut in a dusty, sun-bleached EVA suit — visor partially reflective, scratched from use, mission patches barely legible. The suit is not pristine Hollywood white; it is a working tool, weathered by months on the Martian surface.

Action: The astronaut crouches beside a small crack in the rust-red basalt. Inside the crack, a single tiny green sprout — two delicate leaves, almost translucent — pushes up through the red soil. The astronaut's gloved hand reaches toward it, hesitates, trembles slightly, then gently touches the soil beside it.

Environment: The Martian surface — a flat, rust-red plain scattered with dark basalt rocks, stretching to low eroded hills on the horizon. The sky is a pale butterscotch-pink. Dust devils move in the far distance. The scene feels vast and achingly empty — except for this one tiny green thing.

Camera: Opens with an extreme wide shot — the astronaut is a small figure in the immense Martian landscape. Slow dolly in over 4 seconds to a medium shot. As the astronaut crouches, camera drops to ground level and continues to a close-up of the gloved hand and the sprout. Rack focus: pull from the hand to the astronaut's visor, where we see the sprout's reflection. 65mm lens, anamorphic.

Lighting: Late Martian afternoon — low sun from camera-right, casting long amber-red shadows. The side light sculpts the EVA suit's texture. The sprout's translucent leaves glow with subsurface scattering as sunlight passes through them — the only green in a world of red. Volumetric dust particles drift through the light beam.

Style: Ridley Scott's The Martian meets Terrence Malick's The Tree of Life. Cinematic, anamorphic, muted Martian color palette with the single point of vivid green as deliberate contrast. Subtle film grain.

Sound: Wind — thin, high-pitched Martian wind, unlike Earth wind. The astronaut's breathing inside the suit — measured at first, then quickening. A single sustained low note from a cello enters as the hand reaches for the sprout. No dialogue. No narration.

นักบินอวกาศผู้โดดเดี่ยว สวมชุดอวกาศ EVA ที่เต็มไปด้วยฝุ่นและซีดจางจากแสงอาทิตย์—หน้ากากกันแดดสะท้อนแสงเพียงครึ่งเดียว มีรอยขีดข่วนจากการใช้งาน แผ่นป้ายแขนภารกิจแทบจะมองไม่เห็น ชุดนี้ไม่ใช่สีขาวสะอาดตาแบบในฮอลลีวูด แต่เป็นเครื่องมือทำงานที่ผ่านการใช้งานบนพื้นผิวดาวอังคารมาหลายเดือน นักบินอวกาศนั่งยองอยู่ข้างรอยแยกแคบในหินบะซอลต์สีแดงสนิม สังเกตเห็นต้นอ่อนสีเขียวเล็กๆ—ใบเรียวบางสองใบที่แทบจะโปร่งแสง—กำลังงอกออกมาจากดินสีแดงเข้ม มือที่สวมถุงมือเอื้อมไปทางมัน ลังเล สั่นเล็กน้อย แล้วแตะลงบนพื้นดินข้างๆ อย่างแผ่วเบา

ข้อความนี้รวมองค์ประกอบตามสูตรทั้งเจ็ดอย่างครบถ้วน ภาษาภาพยนตร์เฉพาะ (ภาพระยะไกลสุดขีด, การเคลื่อนกล้อง, การเปลี่ยนจุดโฟกัส) คำสำคัญที่สร้างบรรยากาศ (แสงแบบปริมาตร, การกระจายแสงใต้ผิว, เลนส์อนามอร์ฟิก) การออกแบบเสียง (เสียงลมรอบข้าง, เสียงหายใจ, เสียงเชลโลเดี่ยว) และการอ้างอิงสไตล์ (Ridley Scott, Terrence Malick) ทุกรายละเอียดล้วนเสริมสร้างเส้นอารมณ์: ความโดดเดี่ยว → การค้นพบ → ความตื่นตะลึง

นี่คือโครงการวิศวกรรมคำแนะนำวิดีโอ


คำถามที่พบบ่อย

คำสั่งสำหรับวิดีโอ AI ควรมีความยาวเท่าไร?

ไม่มีมาตรฐานสากลสำหรับความยาว ความยาวที่เหมาะสมขึ้นอยู่กับระดับความซับซ้อนของแนวคิดสร้างสรรค์ของคุณและแพลตฟอร์มที่ใช้ ระดับ V1 (15–30 คำ) ให้ผลลัพธ์ที่เป็นสากลบนทุกแพลตฟอร์ม ระดับ V2 (50–80 คำ) เป็นช่วงที่เหมาะสมที่สุดสำหรับแพลตฟอร์มส่วนใหญ่—เฉพาะเจาะจงเพียงพอโดยไม่ทำให้โมเดลทำงานหนักเกินไป ระดับ V3 (100–200 คำ) ให้ผลลัพธ์ที่ควบคุมได้ดีที่สุดบนแพลตฟอร์มที่รองรับคำสั่งยาว เช่น Seedance และ Sora เมื่อใช้ Keeling ให้รักษาความยาวประมาณ 50–80 คำ ตัวชี้วัดที่สำคัญไม่ใช่จำนวนคำ—แต่คือแต่ละองค์ประกอบของสูตรได้รับการกล่าวถึงอย่างครอบคลุมหรือไม่

การมีพื้นฐานด้านการถ่ายภาพเป็นสิ่งจำเป็นสำหรับการสร้างคำแนะนำวิดีโอที่มีประสิทธิภาพหรือไม่?

ไม่จำเป็น แต่การเข้าใจมันจะเป็นประโยชน์อย่างมาก—และคู่มือนี้ได้สอนความรู้พื้นฐานให้คุณแล้ว คุณไม่จำเป็นต้องมีปริญญาด้านภาพยนตร์ สิ่งที่คุณต้องการคือรู้ชื่อของการเคลื่อนไหวของกล้อง 10-15 ประเภท เข้าใจผลกระทบทางอารมณ์ของสไตล์การให้แสงที่แตกต่างกัน และมีคำศัพท์เพื่ออธิบายบรรยากาศ บุ๊กมาร์กส่วนที่เกี่ยวกับ [ภาษาของการถ่ายภาพยนตร์](#The Language of Cinematography) และ [คลังคำสำคัญบรรยากาศ](#The Atmosphere Keyword Library) และอ้างอิงกลับไปดูบ่อยๆ จนกว่าคำเหล่านี้จะกลายเป็นธรรมชาติที่สองของคุณ

สามารถใช้คำสั่งเดียวกันได้กับแพลตฟอร์มวิดีโอ AI ที่ต่างกันได้หรือไม่?

แน่นอน—สูตรสากลสามารถใช้ได้ทั่วไป อย่างไรก็ตาม แต่ละแพลตฟอร์มจะตีความคำสั่งที่แตกต่างกัน คำสั่งที่ปรับให้เหมาะสมสำหรับ Sora (รูปแบบยาว, ไหลลื่น, เน้นฟิสิกส์) อาจต้องปรับโครงสร้างใหม่สำหรับ Keeling (สั้นกว่า, เน้นการกระทำก่อน) ส่วน เทคนิคเฉพาะแพลตฟอร์ม จะอธิบายรายละเอียดวิธีการปรับใช้ สูตรหลักยังคงไม่เปลี่ยนแปลง มีเพียงรูปแบบการนำเสนอเท่านั้นที่ต้องปรับเปลี่ยน

อะไรที่ทำให้คู่มือนี้แตกต่างจากคู่มือ Seedance prompt?

คู่มือคำแนะนำ Seedance เป็นคู่มือเฉพาะแพลตฟอร์ม—สอนรูปแบบสตอรี่บอร์ดของ Seedance, อ้างอิงภาพ และคำแนะนำพร้อมใช้มากกว่า 50 แบบ คู่มือนี้เป็นคู่มือสากล—สอนทักษะพื้นฐานในการเขียนคำแนะนำที่สามารถนำไปใช้กับแพลตฟอร์มใดก็ได้ ถือว่าคู่มือนี้เป็นตำราเรียนของคุณ และคู่มือ Seedance เป็นคู่มือปฏิบัติสำหรับเครื่องมือเฉพาะ

จะอธิบายการเคลื่อนไหวของกล้องอย่างไรหากไม่คุ้นเคยกับคำศัพท์ทางภาพยนตร์?

ก่อนอื่นอธิบายสิ่งที่คุณต้องการให้ผู้ชมเห็นและรู้สึก "กล้องเคลื่อนเข้าใกล้ใบหน้าของตัวแบบอย่างช้าๆ" คือการเคลื่อนกล้องแบบดอลลี่ "กล้องติดตามบุคคลที่เดินจากด้านข้าง" คือการถ่ายภาพแบบติดตาม (tracking shot) แพลตฟอร์ม AI เข้าใจคำอธิบายภาษาธรรมชาติได้ค่อนข้างดี อย่างไรก็ตาม การเรียนรู้คำศัพท์ทางเทคนิค (โดยใช้ [อ้างอิงภาษาการเคลื่อนไหวของกล้อง](#camera movement language secret weapon) ข้างต้น) จะให้ผลลัพธ์ที่ดีกว่าอย่างมีนัยสำคัญ เนื่องจากโมเดล AI ได้รับการฝึกฝนจากวิดีโอที่อธิบายด้วยคำศัพท์เฉพาะทางเหล่านี้โดยตรง

ควรรวมคำแนะนำที่เป็นการเตือนกลับ (สิ่งที่ไม่ควรรวม) ไว้หรือไม่?

แพลตฟอร์มบางแห่งรองรับคำสั่งย้อนกลับ—คำแนะนำที่ระบุสิ่งที่ควรหลีกเลี่ยง ซึ่งอาจมีประโยชน์: ห้ามมีข้อความทับซ้อน, ห้ามมีลายน้ำ, ห้ามมีเฟรมเบลอ อย่างไรก็ตาม เครื่องมือสร้างวิดีโอ AI สมัยใหม่ส่วนใหญ่จัดการปัญหาคุณภาพได้ดีกว่าผ่านข้อกำหนดเชิงบวก แทนที่จะเขียนว่า "ห้ามแสงน้อย" ให้ระบุเป็น "ใช้แสงแบบแรมบรันต์จากด้านซ้ายของกล้อง" แทนที่จะเขียนว่า "ห้ามภาพสั่น" ให้ระบุเป็น "การเคลื่อนไหวของกล้องสเตดิแคมที่นิ่งและราบรื่น" คำแนะนำเชิงบวกจะชี้นำ AI ไปสู่ผลลัพธ์ที่คุณต้องการ ส่วนคำแนะนำเชิงลบจะบอกเพียงว่าอะไรที่ควรหลีกเลี่ยง โดยปล่อยให้ทางเลือกอื่นเป็นไปตามโอกาส

วิธีรักษาความสม่ำเสมอของตัวละครข้ามคำสั่งหลาย ๆ คำสั่ง?

การรักษาความสอดคล้องของตัวละครในวิดีโอ AI หลายรุ่นเป็นหนึ่งในความท้าทายที่สำคัญที่สุดของการเขียนคำสั่ง (prompt) มีกลยุทธ์สามประการที่พิสูจน์แล้วว่ามีประโยชน์: (1) ใช้คำอธิบายตัวละครที่เฉพาะเจาะจงมาก โดยทำซ้ำคำต่อคำระหว่างคำสั่ง – ผู้หญิงอายุปลาย 20 ชาวญี่ปุ่น ผมยาวสีดำ เสื้อโค้ทขนสัตว์สีเทาขนาดใหญ่เกินไป เสื้อคอเต่าสีครีม (2) ใช้กระบวนการทำงานจากภาพเป็นวิดีโอ—อัปโหลดภาพอ้างอิงตัวละครสำหรับแอนิเมชัน AI Seedance รองรับสิ่งนี้ผ่านการอ้างอิง @Image (3) สร้างคลิปทั้งหมดสำหรับตัวละครเดียวกันภายในเซสชันเดียวเมื่อเป็นไปได้ โดยใช้เมล็ดพันธุ์หรือการตั้งค่าสไตล์ที่เหมือนกัน

มีเครื่องมือใดบ้างที่สามารถช่วยฉันเขียนคำแนะนำสำหรับวิดีโอได้?

ใช่ เครื่องมือสร้างคำแนะนำวิดีโอของ Seedance Video Prompt Generator รองรับคำอธิบายภาษาธรรมชาติเพื่อสร้างคำแนะนำรายการช็อตที่สมบูรณ์และมีโครงสร้าง ซึ่งครอบคลุมภาษาการเคลื่อนไหวของกล้อง ไทม์ไลน์ การจัดแสง และการออกแบบเสียง สำหรับคำแนะนำการใช้งานโดยละเอียด โปรดดูที่ คู่มือการสร้างคำแนะนำวิดีโอด้วย AI กระบวนการทำงานที่แนะนำ: การสร้างด้วย AI → การปรับแต่งด้วยตนเอง → การผลิตวิดีโอ


เริ่มเขียนคำแนะนำวิดีโอที่ดีขึ้นวันนี้

คุณมีชุดเครื่องมือที่ครอบคลุมแล้ว: สูตรเจ็ดองค์ประกอบ, ภาษาการเคลื่อนไหวของกล้องที่ครอบคลุมเทคนิคมากกว่า 15 วิธี, ฐานข้อมูลคำสำคัญบรรยากาศสี่มิติที่ครอบคลุมคำศัพท์มากกว่า 50 คำ, ตัวอย่างแบบก้าวหน้าห้าตัวอย่างที่แสดงการพัฒนาจากมาตรฐานพื้นฐานสู่มาตรฐานภาพยนตร์, วิธีการออกแบบเสียง, และเทคนิคการปรับให้เหมาะสมกับแพลตฟอร์มเฉพาะ

ช่องว่างระหว่างผลงานวิดีโอ AI ของมือสมัครเล่นกับมืออาชีพไม่ได้อยู่ที่เครื่องมือ—แต่อยู่ที่คำสั่งป้อนเข้า (prompt) และการเขียนคำสั่งป้อนเข้าเป็นทักษะที่พัฒนาได้ด้วยการฝึกฝน

สามวิธีในการเริ่มต้น:

  1. ฝึกฝนสูตร เลือกหัวข้อใดก็ได้ ร่างเวอร์ชัน V1 → V2 → V3 เปรียบเทียบผลลัพธ์ การปรับปรุงจะเกิดขึ้นทันทีและเห็นได้ชัดเจน

  2. ใช้เครื่องมือสร้างข้อความเริ่มต้น ให้ AI จัดการโครงสร้าง จากนั้นใช้ความรู้ของคุณเกี่ยวกับการเคลื่อนไหวของกล้องและบรรยากาศเพื่อปรับแต่งผลลัพธ์ ลองใช้เครื่องมือสร้างข้อความเริ่มต้นสำหรับวิดีโอ →

  3. สร้างวิดีโอแรกของคุณ ใช้คำแนะนำที่ดีที่สุดของคุณและสร้างวิดีโอทันที เปิดตัวสร้างวิดีโอ →

แรงบันดาลใจที่รวดเร็วขึ้นและตัวอย่างพร้อมใช้งาน:

สำรวจ Seedance 2.0 →

วิดีโอ AI ที่ดีที่สุดที่คุณจะสร้างได้เริ่มต้นจากคำสั่งถัดไปที่คุณเขียน

Seedance 2.0 AI

Seedance 2.0 AI

เทคโนโลยีวิดีโอและสร้างสรรค์ด้วยปัญญาประดิษฐ์