TL;DR
Video AI xuất sắc bắt nguồn từ các từ khóa xuất sắc. Hướng dẫn này sẽ dạy bạn một bộ công thức từ khóa video chung — một khung bảy yếu tố, áp dụng cho tất cả các nền tảng video AI phổ biến:
[Chủ thể] + [Hành động] + [Môi trường] + [Cách quay] + [Ánh sáng và bóng tối] + [Phong cách] + [Âm thanh]
Bạn sẽ học được: Các nguyên nhân khiến hầu hết các từ gợi ý thất bại (và cách sửa chữa nhanh chóng), tài liệu tham khảo đầy đủ về ngôn ngữ chuyển động máy quay bao gồm hơn 15 cách chuyển động máy quay, thư viện từ khóa về không khí được sắp xếp theo bốn chiều kích chính là ánh sáng/tông màu/kết cấu/cảm xúc, năm ví dụ nâng cao từ cơ bản đến cấp độ điện ảnh về từ gợi ý, cách thêm thiết kế âm thanh vào từ gợi ý, và các kỹ thuật tối ưu hóa nền tảng cho Seedance, Sora, Kling, Runway và Veo 3.
Đây không phải là hướng dẫn sử dụng công cụ — đây là một bộ phương pháp luận. Kỹ năng viết từ khóa video có thể áp dụng trên nhiều nền tảng, học một lần là có thể áp dụng ở mọi nơi.

Cùng một khái niệm, kết quả hoàn toàn khác biệt. Từ gợi ý bên trái ghi "Một người phụ nữ đi bộ trong mưa". Từ gợi ý bên phải chỉ định góc quay, hướng ánh sáng, không khí và âm thanh — mô hình AI phản hồi với chất lượng điện ảnh.
Tại sao hầu hết các từ khóa video AI đều thất bại (và cách khắc phục)
Dù sử dụng trình tạo video AI nào — Seedance, Sora, Keeling, Runway, Veo 3 — nguyên lý cốt lõi đều giống nhau: Càng nhập văn bản chính xác và cấu trúc hoàn chỉnh, kết quả đầu ra càng dễ kiểm soát và càng gần với chất lượng phim. Hầu hết mọi người viết từ khóa như đang mô tả một bức ảnh cho bạn bè, nhưng video không phải là ảnh. Video có chuyển động, thời gian, hành vi của ống kính, sự phát triển của không khí và âm thanh.
Dưới đây là năm nguyên nhân phổ biến nhất dẫn đến lỗi từ khóa, kèm theo giải pháp khắc phục ngay lập tức cho từng trường hợp.
1. Quá mơ hồ — Vấn đề "hoàng hôn đẹp"
Lời gợi ý phổ biến nhất không thành công. Bạn viết "hoàng hôn đẹp bên bờ biển", nhận được một đoạn văn chính xác về mặt kỹ thuật nhưng trống rỗng về mặt cảm xúc, trông giống như hình nền cổ phiếu.
Vấn đề không phải là AI không thể tái tạo cảnh hoàng hôn, mà là "đẹp" và "hoàng hôn" là tất cả thông tin mà bạn cung cấp cho nó. AI đã xem hàng triệu cảnh hoàng hôn trong dữ liệu huấn luyện, và nó sẽ chọn giá trị trung bình thống kê - mà giá trị trung bình, về bản chất, là sự tầm thường.
| Trước khi sửa đổi | Sau khi sửa đổi |
|---|---|
| Hoàng hôn tuyệt đẹp trên biển | Ánh sáng vàng rực rỡ chiếu xuống bờ biển Thái Bình Dương yên tĩnh, sóng vỗ vào đá núi lửa, mặt trời nằm cách đường chân trời hai ngón tay, bầu trời chuyển màu từ hổ phách đậm ở đường chân trời sang hồng cá hồi rồi đến màu hoa oải hương nhạt ở đỉnh trời, bóng dài kéo dài về phía máy ảnh (Ánh sáng vàng rực rỡ chiếu xuống bờ biển Thái Bình Dương yên tĩnh, sóng vỗ vào đá núi lửa, mặt trời lơ lửng trên đường chân trời, bầu trời chuyển từ màu hổ phách đậm ở đường chân trời sang màu hồng cá hồi rồi đến màu tím nhạt ở đỉnh trời, những cái bóng dài kéo dài về phía ống kính) |
Phương pháp sửa chữa: Thay thế các tính từ ("đẹp", "đáng kinh ngạc", "ấn tượng") bằng các chi tiết cụ thể có thể quan sát được — màu sắc, vị trí, kết cấu, mối quan hệ không gian.
2. Không có lệnh chuyển động — Vấn đề hình ảnh tĩnh
Bạn đã viết một mô tả cảnh chi tiết, nhưng AI lại tạo ra một hình ảnh trông giống như một bức ảnh được chỉnh sửa nhẹ - vì bạn mô tả một khoảnh khắc, chứ không phải một chuyển động.
Video là thời gian. Nếu không có lệnh chuyển động rõ ràng, AI sẽ mặc định sử dụng cách giải thích thận trọng nhất: di chuyển chậm hoặc độ lệch nhẹ. Về mặt kỹ thuật, đây thực sự là "video", nhưng không phải là điều bạn muốn.
| Trước khi sửa đổi | Sau khi sửa đổi | |--------|------- -| | Một chiếc xe thể thao màu đỏ cổ điển đậu trên đường núi, buổi sáng sương mù, như trong phim (Một chiếc xe thể thao màu đỏ cổ điển đậu trên đường núi, buổi sáng sương mù, như trong phim) | Một chiếc Porsche 911 màu đỏ cổ điển tăng tốc trên con đường núi uốn lượn, lốp xe bám chặt vào mặt đường nhựa ướt, sương mù tách ra xung quanh thân xe, máy quay theo dõi ở độ cao cản xe, cây cối mờ ảo ở phía trước (Một chiếc Porsche 911 màu đỏ cổ điển tăng tốc trên con đường núi uốn lượn, lốp xe bám chặt vào mặt đường nhựa ướt, sương mù tách ra xung quanh thân xe, máy quay theo song song ở độ cao cản xe, cây cối mờ ảo lướt qua ở tiền cảnh) |
Phương pháp sửa chữa: Mỗi từ gợi ý video cần có ít nhất một động từ mô tả chuyển động vật lý của chủ thể và một cụm từ mô tả chuyển động của ống kính. Chủ thể đang chuyển động, ống kính cũng đang chuyển động — cả hai cùng tạo ra năng lượng thị giác.
3. Mệnh lệnh mâu thuẫn — Nghịch lý "cận cảnh + toàn cảnh"
Tình huống này phổ biến hơn bạn tưởng, đặc biệt là khi mọi người kết hợp các thuật ngữ điện ảnh mà họ đã nghe qua nhưng không hoàn toàn hiểu rõ. "Cảnh cận cảnh cực đoan của người phụ nữ băng qua sa mạc rộng lớn, cảnh toàn cảnh, cảm giác sử thi" chứa hai chỉ dẫn bố cục mâu thuẫn nhau. AI sẽ cố gắng lấy giá trị trung bình, tạo ra một khung hình không gần cũng không xa, chỉ đơn thuần là hỗn loạn.
| Trước khi sửa đổi | Sau khi sửa đổi |
|---|---|
| Cận cảnh một người phụ nữ đi qua sa mạc rộng lớn, cảnh quay toàn cảnh rộng, quy mô hoành tráng(Cận cảnh một người phụ nữ đi qua sa mạc rộng lớn, cảnh quay toàn cảnh rộng, quy mô hoành tráng) | Cận cảnh cực đại đôi mắt của một người phụ nữ phản chiếu ánh sáng sa mạc, các hạt cát bắt ánh nắng hoàng hôn trên lông mi của cô, độ sâu trường ảnh nông với cánh đồng cát rộng lớn mờ dần thành một dải màu hổ phách phía sau cô (Cận cảnh cực đại đôi mắt của một người phụ nữ, phản chiếu ánh sáng sa mạc, các hạt cát bắt ánh nắng hoàng hôn trên lông mi của cô, độ sâu trường ảnh nông làm cho những cồn cát rộng lớn phía sau cô mờ dần thành một dải màu hổ phách) |
Phương pháp sửa chữa: Chọn một vị trí máy quay cho mỗi cảnh quay. Nếu bạn cần cảnh cận và cảnh xa, hãy viết hai cảnh quay riêng biệt và kết nối chúng bằng hiệu ứng chuyển cảnh. Đối với chuỗi nhiều cảnh quay, các nền tảng như Seedance hỗ trợ định dạng timeline phân cảnh, cho phép bạn chỉ định từng cảnh quay một cách độc lập.
4. Thiếu không khí — khoảng trống của ánh sáng và cảm xúc
Mô tả của bạn về từ khóa mô tả một chủ thể thực hiện một hành động tại một địa điểm cụ thể. Điều này bao phủ ba trong bảy chiều. Nếu không có hướng dẫn về ánh sáng, tông màu, hiệu ứng không khí và phong cách, AI sẽ điền vào khoảng trống bằng các giá trị mặc định trung tính: ánh sáng phẳng và đồng đều, màu sắc nhạt nhòa, không có cảm xúc cụ thể. Kết quả trông giống như hình ảnh từ camera giám sát độ nét cao.
| Trước khi sửa đổi | Sau khi sửa đổi | |--------|------- -| | Một người đàn ông ngồi một mình trong quán cà phê | Một người đàn ông khoảng 40 tuổi ngồi một mình trong góc quán tối, ánh sáng màu hổ phách ấm áp từ một chiếc đèn treo bắt lấy hơi nước bốc lên từ tách cà phê của anh, mưa rơi xuống cửa sổ phía sau anh tạo ra những bóng mờ trên khuôn mặt anh, màu xanh lục và đồng nhạt, bầu không khí u sầu (Một người đàn ông ngoài 40 tuổi ngồi một mình trong góc quán cà phê tối tăm, ánh sáng màu hổ phách ấm áp từ một chiếc đèn treo bắt lấy hơi nước bốc lên từ tách cà phê, những vệt mưa trên cửa sổ phía sau anh ta tạo ra những hình bóng gợn sóng trên khuôn mặt anh ta, tông màu xanh lục và đồng, bầu không khí u sầu) |
Phương pháp sửa chữa: Thêm hướng nguồn sáng, nhiệt độ màu, hiệu ứng khí quyển (sương mù, mưa, bụi, hơi nước) và từ ngữ cảm xúc. Bốn yếu tố bổ sung này sẽ biến "một cảnh" thành "một cảm giác".
5. Thiếu thiết kế âm thanh – Vấn đề của phim câm
Đến năm 2026, hầu hết các nền tảng video AI đều hỗ trợ tạo âm thanh - nhạc nền, hiệu ứng âm thanh môi trường, thậm chí cả đối thoại và đồng bộ hóa khẩu hình. Tuy nhiên, hầu hết mọi người viết các từ gợi ý hoàn toàn im lặng, vì họ chỉ coi các từ gợi ý video là các chỉ dẫn trực quan.
Âm thanh chiếm một nửa trải nghiệm. Cảnh rừng không có tiếng chim hót và tiếng lá xào xạc sẽ cảm thấy giả tạo. Cảnh hành động không có hiệu ứng âm thanh va chạm sẽ cảm thấy nhẹ nhàng. Sản phẩm trưng bày không có nhạc nền sẽ giống như một bản trình chiếu PowerPoint.
| Trước khi sửa đổi | Sau khi sửa đổi | |------- -|--------| | Một con mèo nhảy từ giá sách xuống ghế sofa | Một con mèo màu gừng nhảy duyên dáng từ đỉnh giá sách bằng gỗ sồi cao, cơ thể duỗi ra giữa không trung, hạ cánh nhẹ nhàng trên đệm sofa nhung mềm mại, đệm bị nén xuống dưới sức nặng của nó. Âm thanh: tiếng chân mềm mại chạm vào vải, một cuốn sách trượt trên kệ, âm thanh phòng yên tĩnh với tiếng mưa xa xa ngoài cửa sổ (Một con mèo màu cam nhảy xuống từ đỉnh kệ sách bằng gỗ sồi cao, cơ thể duỗi ra giữa không trung, hạ cánh nhẹ nhàng trên đệm sofa bằng nhung, đệm bị nén nhẹ dưới trọng lượng của nó. Âm thanh: tiếng móng vuốt chạm nhẹ vào vải, tiếng một cuốn sách trượt trên kệ, âm thanh môi trường xung quanh yên tĩnh với tiếng mưa xa xa ngoài cửa sổ) |
Phương pháp sửa chữa: Thêm một dòng mô tả âm thanh vào cuối từ gợi ý, chỉ định phong cách nhạc nền, hiệu ứng âm thanh môi trường và bất kỳ cuộc đối thoại hoặc lời bình luận nào. Chúng tôi có giới thiệu chi tiết trong phần [Thiết kế âm thanh](#Viết thiết kế âm thanh vào từ gợi ý) dưới đây.
Công thức từ khóa video chung
Dù bạn sử dụng nền tảng nào, mỗi từ khóa video hiệu quả đều bao gồm bảy yếu tố giống nhau. Một số yếu tố là bắt buộc (mỗi từ khóa đều cần có), một số là tùy chọn (có thể nâng cao hiệu quả nhưng không bắt buộc). Công thức:
[Chủ thể Subject] + [Hành động Action] + [Môi trường Environment] + [Điều khiển máy quay Camera] + [Ánh sáng Lighting] + [Phong cách Style] + [Âm thanh Sound]

Bảy yếu tố chính của công thức gợi ý video chung. Mỗi yếu tố đều tăng thêm một chiều hướng kiểm soát cho kết quả cuối cùng.
Dưới đây là phân tích từng yếu tố, kèm theo từ khóa và ví dụ cụm từ.
Yếu tố 1: Chủ thể Subject (bắt buộc)
Chủ thể là đối tượng mà khán giả chú ý. Đây có lẽ là phần cụ thể nhất trong các từ gợi ý — không phải "một người phụ nữ", mà là "một người phụ nữ ngoài sáu mươi, tóc bạc xõa xuống, nếp nhăn sâu ở khóe mắt, mặc một chiếc tạp dề denim đã bạc màu".
Từ khóa:
| Loại | Ví dụ (từ gợi ý tiếng Anh) | |------|------------------ -| | Nhân vật | một chàng trai trẻ khoảng 20 tuổi, một bà lão, một đứa trẻ khoảng 5 tuổi, một vũ công, một đầu bếp, một người lính | | Động vật | một con chó săn vàng, một con báo tuyết, một con chim ruồi, một con cá koi, một con bướm vua | | Vật phẩm | một chiếc máy đánh chữ cổ, một chai nước hoa bằng pha lê, một cuốn nhật ký bìa da, một chiếc bình gốm | | Phương tiện | một chiếc xe máy màu đen mờ, một chiếc thuyền buồm bằng gỗ, một chiếc xe bán tải cũ, một chiếc tàu cao tốc | | Trừu tượng | các hạt ánh sáng, các giọt mực trong nước, các hình dạng hình học, kim loại lỏng |
Ví dụ cụm từ:
Một barista ở độ tuổi 30 với hình xăm trên tay áo và tạp dề đen phủ bột mì(Một barista ở độ tuổi 30, có hình xăm trên tay áo và tạp dề đen dính bột mì)A weathered bronze compass lying open on a nautical chart(Một chiếc la bàn bằng đồng bị mòn nằm mở trên bản đồ hàng hải)Thousands of paper lanterns, each glowing warm amber from a candle inside(Hàng ngàn chiếc đèn lồng giấy, mỗi chiếc phát ra ánh sáng màu hổ phách ấm áp từ ngọn nến bên trong)
Yếu tố thứ hai: Hành động Action (bắt buộc)
Hành động là những gì đang xảy ra — chủ thể đang làm gì và cảnh tượng diễn biến như thế nào theo thời gian. Đây chính là ranh giới giữa video gợi ý và hình ảnh gợi ý. Nếu không có hành động, bạn chỉ nhận được một bức ảnh động.
Từ khóa:
| Loại vận động | Ví dụ (từ gợi ý tiếng Anh) | |--------- -|-------------------| | Chuyển động của cơ thể con người | đi bộ, chạy, quay chậm, vươn tay, nghiêng người về phía trước, thở ra, chớp mắt | | Chuyển động tương đối với ống kính | tiến lại gần máy quay, đi xa máy quay, đi ngang qua khung hình từ trái sang phải | | Chuyển động của vật thể | xoay, rơi, trôi nổi, vỡ, lắp ráp, mở ra, tan chảy | | Chuyển động của môi trường | gió thổi qua cỏ, mây cuộn, mưa rơi, lá bay, thủy triều lên | | Quá trình thay đổi | ngày chuyển sang đêm, hoa nở, băng hình thành, sơn lan rộng, ánh sáng thay đổi |
Ví dụ cụm từ:
Chậm rãi cúi xuống nhặt một chiếc lá thu rơi, xoay xoay nó giữa các ngón tay(Chậm rãi cúi xuống nhặt một chiếc lá thu rơi, xoay xoay nó giữa các ngón tay)The compass needle trembles, then swings decisively north(Kim la bàn rung động, sau đó quyết định hướng về phía bắc)Lanterns lift off one by one from the ground, rising into the dark sky at different speeds(Những chiếc đèn lồng lần lượt bay lên từ mặt đất, bay vào bầu trời tối với tốc độ khác nhau)
Yếu tố thứ ba: Môi trường Environment (bắt buộc)
Môi trường là nơi diễn ra cảnh. Mô tả cảnh hiện tại (tiền cảnh) và bối cảnh rộng hơn. Bao gồm thời tiết, thời gian và mùa khi có liên quan.
Từ khóa:
| Loại cảnh | Ví dụ (từ gợi ý tiếng Anh) | |----------|------------------ -| | Tự nhiên | rừng rậm, cồn cát sa mạc, vách đá biển, đồng cỏ núi cao, bãi biển núi lửa, rừng tre | | Thành phố | hẻm nhỏ Tokyo, quảng trường bê tông brutalist, vườn trên mái, sân ga tàu điện ngầm, đại lộ đèn neon | | Nội thất | thư viện thắp nến, gác xép công nghiệp, nhà kính bảo tồn, phòng tối cổ điển, sảnh đá cẩm thạch | | Kỳ ảo | đảo nổi, hang động pha lê, rạn san hô phát quang, đền thờ đổ nát, thành phố trên mây | | Thời gian/Thời tiết | bình minh trước rạng đông, trưa u ám, giông bão, tuyết đầu mùa, buổi tối mùa hè ẩm ướt |
Ví dụ cụm từ:
Trong một con hẻm nhỏ ở Kyoto, những chiếc đèn đá xếp hàng hai bên, những cánh hoa anh đào bay lượn trên những viên đá lát ướtInside a cavernous abandoned cathedral, shafts of dusty light piercing through broken stained glass(Bên trong một nhà thờ bỏ hoang rộng lớn, những tia sáng bụi bặm xuyên qua những tấm kính màu vỡ)Vào giờ xanh, trên mép vách núi lửa, hơi nước lưu huỳnh bốc lên từ những vết nứt trên đá đen(Vào giờ xanh, trên mép vách núi lửa, hơi nước lưu huỳnh bốc lên từ những vết nứt trên đá đen)
Yếu tố thứ tư: Máy quay (quan trọng)
Hướng dẫn chuyển động máy quay cho AI biết cách người xem quan sát cảnh quay, bao gồm bố cục (gần hay xa), góc nhìn (từ đâu nhìn) và chuyển động (góc nhìn thay đổi như thế nào theo thời gian). Ngôn ngữ chuyển động máy quay là yếu tố quan trọng nhất để nâng cao chất lượng gợi ý - chúng tôi sẽ giới thiệu chi tiết trong [chương chuyên đề](#Vũ khí bí mật của ngôn ngữ chuyển động máy quay) bên dưới.
Thư viện từ khóa nhanh:
| Mặt | Thuật ngữ tiếng Anh và tương ứng tiếng Trung | |------|------------------ -| | Cấu trúc khung hình Framing | extreme close-up (cận cảnh cực đại), close-up (cận cảnh), medium shot (cảnh trung), full shot (cảnh toàn), wide shot (cảnh rộng), extreme wide shot (cảnh cực rộng) (cảnh toàn cảnh) | | Góc quay Angle | eye level (mức mắt), low angle (góc thấp), high angle (góc cao), bird's eye (góc nhìn từ trên cao), worm's eye (góc nhìn từ dưới lên), Dutch angle (góc nghiêng) | | Chuyển động Movement | dolly in/out (đẩy/kéo), pan left/right (xoay ngang), tilt up/down (xoay dọc), tracking shot (theo dõi), orbit (xoay vòng), crane (nâng hạ) | | Ống kính Lens | 24mm wide angle (góc rộng), 50mm standard (tiêu chuẩn), 85mm portrait (chân dung), 200mm telephoto (tele), macro lens (macro), anamorphic (màn hình rộng biến dạng) |
Yếu tố thứ năm: Ánh sáng Lighting (quan trọng)
Ánh sáng và bóng tối định hình cảm xúc của mỗi khung hình. Các nhiếp ảnh gia chuyên nghiệp có thể dành hàng giờ để bố trí ánh sáng. Trong việc viết từ khóa, một vài từ chính xác có thể mang lại sức mạnh kiểm soát tương tự.
Từ khóa:
| Loại ánh sáng (tiếng Anh/tiếng Trung) | Hiệu ứng thị giác | |--------------------- -|----------| | Golden hour Giờ vàng | Ấm áp, bóng dài, tông màu cam hổ phách, chân dung rất đẹp | | Blue hour Giờ xanh | Tông màu lạnh, u ám, bầu trời xanh đậm, đường chân trời còn sót lại màu ấm | | Ánh sáng ngược/ánh sáng nền | Viền sáng, hiệu ứng bóng, tách biệt mạnh mẽ với nền | | Ánh sáng bên | Một nửa khuôn mặt sáng, một nửa tối, độ tương phản cao, cảm giác kịch tính | | Ánh sáng Rembrandt | Vùng sáng hình tam giác xuất hiện dưới mắt ở phía bóng, cảm giác chân dung cổ điển | | Volumetric Ánh sáng thể tích | Chùm ánh sáng nhìn thấy xuyên qua bụi, sương mù hoặc khói | | Tyndall effect Hiệu ứng Tyndall | Ánh sáng tán xạ trong các hạt nhỏ, xuất hiện chùm ánh sáng rõ ràng trong sương mù hoặc bụi | | Neon Neon | Nguồn sáng nhân tạo màu, phản xạ bề mặt ẩm ướt, thẩm mỹ cyberpunk |
Yếu tố thứ sáu: Phong cách Style (đề xuất)
Phong cách cho AI biết nên sử dụng ngôn ngữ hình ảnh nào — phim điện ảnh, tài liệu thực tế, hoạt hình, tranh sơn dầu hoặc các thể loại khác. Nếu không có tuyên bố về phong cách, AI sẽ mặc định sử dụng phong cách thực tế chung.
Từ khóa:
| Phong cách (Tiếng Anh/Tiếng Trung) | Đặc điểm thị giác | |----------------- -|----------| | Cinematic Điện ảnh | Độ sâu trường ảnh nông, phân cấp màu phim, tỷ lệ màn hình rộng 2,39:1 | | Documentary Phim tài liệu | Cảm giác quay cầm tay, ánh sáng tự nhiên, bố cục quan sát | | Quảng cáo thương mại | Sạch sẽ, sáng sủa, tập trung vào sản phẩm, ánh sáng chính xác, chuyển động mượt mà | | Anime | Phong cách cel, màu sắc rực rỡ, chuyển động cường điệu, đường nét động | | Phim noir | Đen trắng tương phản cao, bóng rèm, ánh sáng nhẹ nhàng | | Mực nước | Mực đen trên nền trắng, chuyển màu mượt mà, tối giản, thẩm mỹ phương Đông | | Vintage film Phim cổ điển | Hạt phim, độ bão hòa giảm nhẹ, tông màu ấm, viền mờ | | Cyberpunk Cyberpunk | Ánh đèn neon, độ tương phản cao, yếu tố ba chiều, cảm giác tận thế đô thị |
Yếu tố thứ bảy: Âm thanh (tùy chọn)
Âm thanh thêm chiều kích thính giác. Không phải tất cả các nền tảng đều hỗ trợ tạo âm thanh, nhưng việc thêm thiết kế âm thanh vào từ khóa không chỉ hướng tới tương lai mà còn thường nâng cao hiệu ứng thị giác — vì AI sẽ sử dụng các manh mối âm thanh để ảnh hưởng đến cảm xúc và nhịp điệu thị giác.
Từ khóa:
| Loại âm thanh | Ví dụ (từ gợi ý tiếng Anh) |
|---|---|
| Phong cách âm nhạc | orchestral (nhạc giao hưởng), lo-fi hip hop, ambient electronic (nhạc điện tử không gian), jazz piano, acoustic guitar, cinematic score (nhạc phim) |
| Hiệu ứng âm thanh môi trường | rain on glass (mưa rơi trên kính cửa sổ), wind through trees (gió thổi qua rừng cây), city traffic hum (tiếng ồn giao thông thành phố), ocean waves (sóng biển), fire crackling (tiếng lửa bập bùng) |
| Hiệu ứng âm thanh hành động | footsteps on gravel (tiếng bước chân trên sỏi), door creaking (tiếng cửa kêu cót két), glass shattering (tiếng kính vỡ), engine revving (tiếng động cơ rú) |
| Giọng nói | whispered narration (lời kể thì thầm), dialogue (đối thoại), breathing (tiếng thở), laughter (tiếng cười) |
Ngôn ngữ chuyển động máy quay: Vũ khí bí mật
Ngôn ngữ chuyển động máy quay là kỹ năng có ảnh hưởng nhất mà bạn có thể phát triển với tư cách là người viết kịch bản video. Khi bạn viết "dolly in slowly" (di chuyển máy quay chậm) thay vì "zoom in" (phóng to), bạn đang sử dụng từ vựng gốc của mô hình AI - vì những mô hình này được đào tạo trên hàng triệu giờ video quay chuyên nghiệp, trong đó các chuyển động máy quay có tên gọi cụ thể và hiệu ứng hình ảnh đặc trưng.
Phần này là tài liệu tham khảo tổng hợp của bạn. Nên lưu lại để tham khảo.

Các chuyển động máy quay không thể thay thế cho nhau — mỗi loại tạo ra một hiệu ứng cảm xúc độc đáo. Hiểu rõ các thuật ngữ chính xác sẽ hoàn toàn thay đổi hiệu quả của các gợi ý của bạn.
Quay phim cốt lõi
Dolly In / Dolly Out (Đẩy máy quay / Kéo máy quay)
Ống kính di chuyển vật lý đến gần chủ thể (zoom in) hoặc xa chủ thể (zoom out). Khác với zoom, quan hệ phối cảnh sẽ thay đổi — các vật thể ở tiền cảnh sẽ tăng kích thước theo tỷ lệ, tạo ra cảm giác chiều sâu và sự gần gũi vật lý.
- Hiệu ứng cảm xúc: Tạo ra cảm giác thân mật, tập trung, tiết lộ. Kéo ra để tạo cảm giác cô đơn, bối cảnh, chia ly.
- Khi nào sử dụng: Sử dụng cho cảnh cảm xúc, khoảnh khắc nhân vật, tiết lộ chi tiết. Kéo ra để thể hiện quy mô, kết thúc, rời khỏi chủ thể.
- Cụm từ gợi ý:
Camera dollies in slowly from medium shot to extreme close-up on the subject's hands(Máy quay từ cảnh trung bình từ từ tiến đến cận cảnh cực đại trên bàn tay của chủ thể)
Pan Left / Pan Right (quay ngang)
Máy quay giữ nguyên vị trí, xoay ngang, giống như bạn đang xoay đầu. Góc nhìn quét qua cảnh.
- Hiệu ứng cảm xúc: Quan sát, phát hiện, theo dõi ngang, kết nối hai yếu tố trong cảnh.
- Khi nào sử dụng: Trình bày phong cảnh, theo dõi nhân vật di chuyển, thể hiện độ rộng của không gian.
- Cụm từ gợi ý:
Slow pan right across the workshop, revealing rows of handcrafted instruments on the wall(Quay chậm sang phải qua xưởng, hiển thị hàng loạt nhạc cụ thủ công trên tường)
Tilt Up / Tilt Down (Nâng lên / Hạ xuống)
Máy quay giữ nguyên vị trí, xoay theo chiều dọc — giống như gật đầu. Xoay lên để hiển thị độ cao; xoay xuống để hiển thị chi tiết mặt đất.
- Hiệu ứng cảm xúc: Nghiêng lên tạo ra sự kính sợ, hùng vĩ, khao khát. Nghiêng xuống tạo ra cảm giác tiếp đất, khám phá, gần gũi với bề mặt.
- Khi nào sử dụng: Nghiêng lên được sử dụng cho các tòa nhà cao tầng, nhân vật đứng dậy, thể hiện bầu trời. Lắc xuống được sử dụng để tiết lộ các vật trên bàn, chuyển từ bầu trời xuống mặt đất.
- Cụm từ gợi ý:
Camera tilts up from the roots of the ancient tree, following the massive trunk to the canopy(Máy quay lắc lên từ gốc cây cổ thụ, theo thân cây khổng lồ đến tán cây)
Tracking Shot (Quay theo/Quay từ bên hông)
Máy quay di chuyển bên cạnh chủ thể, giữ nguyên khoảng cách và góc quay, như thể được lắp đặt trên một đường ray song song với đường đi của chủ thể.
- Hiệu ứng cảm xúc: Cảm giác đồng hành, hành trình, đắm chìm. Khán giả cùng nhân vật chính trải nghiệm hành trình.
- Khi nào sử dụng: Theo dõi nhân vật đang đi bộ hoặc chạy, di chuyển qua không gian, trình bày sản phẩm dọc theo bề mặt.
- Cụm từ gợi ý:
Camera tracks alongside the runner at shoulder height, keeping pace as she sprints through the alley(Máy quay theo dõi người chạy ở độ cao ngang vai, giữ tốc độ ngang bằng với cô ấy khi cô ấy chạy nước rút qua con hẻm)
Orbit / Arc (Quay vòng)
Ống kính xoay quanh chủ thể, đồng thời giữ chủ thể ở trung tâm khung hình. Có thể là xoay tròn 360 độ hoàn toàn hoặc một phần vòng cung.
- Hiệu ứng cảm xúc: Cảm giác anh hùng, sức mạnh, sự trình diễn, trình diễn 3D.
- Khi nào sử dụng: Trình diễn sản phẩm (trình diễn từ mọi góc độ), cảnh quay anh hùng, giới thiệu nhân vật kịch tính, khoảnh khắc quyết định.
- Cụm từ gợi ý:
Camera orbits 180 degrees around the chess player, starting from behind and ending face-on(Máy quay quay 180 độ quanh người chơi cờ, bắt đầu từ phía sau và kết thúc ở phía trước)
Crane Up / Crane Down (Crane Up / Crane Down)
Di chuyển ống kính theo chiều dọc — nâng hoặc hạ vật lý — thường kết hợp với góc nghiêng để giữ chủ thể trong khung hình.
- Hiệu ứng cảm xúc: Tăng lên tạo cảm giác vượt trội, giải phóng, mở rộng tầm nhìn. Giảm xuống tạo cảm giác tiếp đất, đến đích, tập trung sự chú ý.
- Khi nào sử dụng: Tăng lên dùng cho kết thúc, khoảnh khắc chiến thắng, chuyển sang góc quay từ trên cao. Hạ xuống được sử dụng cho phần mở đầu, phần kết thúc, chuyển từ cảnh toàn cảnh sang bố cục gần gũi.
- Cụm từ gợi ý:
Camera cranes up from ground level, rising above the crowd, revealing the full scale of the festival(Máy quay từ mặt đất, bay lên trên đám đông, cho thấy toàn bộ quy mô của lễ hội)
Handheld (ống kính cầm tay)
Ống kính có sự rung lắc nhẹ nhàng, tự nhiên — không được gắn trên chân máy hoặc bộ ổn định. Tái hiện cảm giác cầm máy ảnh bằng tay của nhiếp ảnh gia.
- Hiệu ứng cảm xúc: Cảm giác tức thì, cảm giác cấp bách, tính chân thực của phim tài liệu, căng thẳng, gần gũi.
- Khi nào sử dụng: Cảnh hành động, đối thoại cảm xúc, phong cách phim tài liệu, phim kinh dị, bất kỳ cảnh nào cần cảm giác đắm chìm.
- Cụm từ gợi ý:
Máy quay cầm tay theo chân nhân vật qua chợ đông đúc, hơi rung lắc
Steadicam / Gimbal (Steadicam / Ống kính ổn định)
Chuyển động ống kính mượt mà, lơ lửng, trượt trong không gian. Không có rung lắc như khi cầm tay — chuyển động mượt mà và liên tục.
- Hiệu ứng cảm xúc: Mơ mộng, thanh lịch, đắm chìm, khám phá thoải mái.
- Khi nào sử dụng: Di chuyển qua không gian kiến trúc, theo chân nhân vật qua môi trường phức tạp, quay một cảnh liên tục, cảnh quay sang trọng và thẩm mỹ.
- Cụm từ gợi ý:
Steadicam glides behind the dancer as she moves through the empty ballroom(Steadicam lướt phía sau vũ công khi cô ấy di chuyển qua sảnh khiêu vũ trống rỗng)
Kỹ thuật quay phim nâng cao
Hitchcock Zoom (Dolly Zoom / Vertigo Effect)
Khi ống kính di chuyển tiến lại gần, khoảng cách tiêu cự sẽ được kéo dài (hoặc ngược lại). Đối tượng chính giữ nguyên kích thước nhưng nền phía sau bị biến dạng mạnh mẽ — kéo dài hoặc nén lại.
- Hiệu ứng cảm xúc: Mất phương hướng, giác ngộ, sợ hãi, thế giới di chuyển xung quanh một điểm cố định.
- Cụm từ gợi ý:
Dolly zoom trên khuôn mặt nhân vật — máy quay tiến lại gần trong khi ống kính zoom ra, nền sau kéo dài ra xa, tạo hiệu ứng chóng mặt
Whip Pan (Quay nhanh)
Chuyển động ngang cực nhanh, làm mờ toàn bộ khung hình trong quá trình chuyển động. Thường được sử dụng để chuyển cảnh giữa hai cảnh quay.
- Hiệu ứng cảm xúc: Năng lượng, bất ngờ, cấp bách, nhịp điệu hài hước.
- Cụm từ gợi ý:
Chuyển cảnh nhanh từ khuôn mặt người nói sang phản ứng của khán giả, hiệu ứng mờ chuyển động trong quá trình chuyển cảnh
Rack Focus (Chuyển tiêu điểm) (Pull Focus (Điều chỉnh tiêu điểm))
Điểm nhấn chuyển từ một mặt phẳng sâu này sang mặt phẳng sâu khác trong một khung hình duy nhất. Phần tiền cảnh trở nên mờ nhạt trong khi phần hậu cảnh trở nên rõ nét, hoặc ngược lại.
- Hiệu ứng cảm xúc: Hướng sự chú ý trở lại, tiết lộ thông tin, kết nối các yếu tố tiền cảnh và hậu cảnh.
- Cụm từ gợi ý:
Chuyển tiêu điểm từ những bông hoa mờ ảo ở tiền cảnh sang khuôn mặt của người phụ nữ ở hậu cảnh
Góc nghiêng (Dutch Angle)
Ống kính nghiêng theo trục ngang, tạo ra đường chân trời chéo. Thế giới trông như bị nghiêng.
- Hiệu ứng cảm xúc: Lo lắng, bất ổn, căng thẳng, kịch tính hóa, điên cuồng.
- Cụm từ gợi ý:
Góc quay Dutch angle cận cảnh khuôn mặt thám tử, nghiêng 15 độ, ánh sáng bên cạnh mạnh mẽ
Speed Ramp (Thay đổi tốc độ) (Time Ramping (Thay đổi thời gian))
Tốc độ phát lại thay đổi trong một cảnh quay — thường chậm lại vào những thời điểm quan trọng, sau đó tăng tốc trở lại.
- Hiệu ứng cảm xúc: Nhấn mạnh, tạo sức ảnh hưởng mạnh mẽ, mang lại trọng lượng kịch tính cho khoảnh khắc cụ thể.
- Cụm từ gợi ý:
Chuyển động tăng dần đến chế độ chậm tại thời điểm va chạm, sau đó tăng tốc trở lại tốc độ thực
One-Take (Long Take)
Quay liên tục mà không cắt ghép. Ống kính di chuyển qua không gian, theo dõi chuyển động, khám phá các yếu tố, không thay đổi góc quay trong suốt quá trình.
- Hiệu ứng cảm xúc: Đắm chìm, trải nghiệm thời gian thực, cảm giác kỹ thuật tinh xảo, liên tục tạo ra sự căng thẳng.
- Cụm từ gợi ý:
Cảnh quay liên tục một lần: máy quay đi vào qua cửa trước, lướt qua hành lang và đến khu vườn
First Person / POV Góc nhìn người thứ nhất
Ống kính đại diện cho đôi mắt của nhân vật. Khán giả nhìn thấy những gì nhân vật nhìn thấy, bao gồm cả tay của họ xuất hiện trong khung hình.
- Hiệu ứng cảm xúc: Trải nghiệm đắm chìm mạnh mẽ nhất, trải nghiệm chủ quan, thẩm mỹ trò chơi.
- Cụm từ gợi ý:
Góc nhìn người thứ nhất: hai tay đẩy mở cánh cửa gỗ nặng nề, lộ ra một cánh đồng ngập tràn ánh nắng
Để biết thêm thông tin về các tính năng điều khiển máy quay đặc trưng của Seedance và cách kết hợp sử dụng chúng trong dòng thời gian phân cảnh, vui lòng tham khảo Hướng dẫn từ khóa Seedance.
Từ khóa về không khí
Không khí là yếu tố quan trọng giúp biến một video kỹ thuật hoàn hảo thành một tác phẩm gợi cảm xúc. Đó là sự khác biệt giữa "một căn phòng" và "một căn phòng khiến bạn cảm nhận được điều gì đó". Bộ từ khóa này được sắp xếp theo bốn chiều: ánh sáng, tông màu, kết cấu và cảm xúc, cho phép bạn kết hợp linh hoạt để tạo ra chính xác cảm giác mà bạn mong muốn.

Thư viện từ khóa không khí: Chọn một từ khóa từ mỗi chiều để định nghĩa dấu ấn cảm xúc của video của bạn.
Từ khóa ánh sáng và bóng tối
Ánh sáng và bóng tối là nền tảng của không khí. Thay đổi ánh sáng và bóng tối trong gợi ý có thể thay đổi hoàn toàn cảm xúc mà không ảnh hưởng đến các yếu tố khác.
| Từ khóa (tiếng Anh/tiếng Trung) | Hiệu ứng thị giác | Tình huống áp dụng | |-------|----------|--------- -| | Golden hour Giờ vàng | Ánh sáng hổ phách ấm áp, bóng dài mềm mại, màu da dễ chịu | Lãng mạn, hoài cổ, du lịch, làm đẹp | | Blue hour Giờ xanh | Ánh sáng môi trường xanh đậm, màu ấm còn sót lại trên đường chân trời | U sầu, trầm tư, chuyển tiếp, cảm xúc đô thị | | Backlit Ánh sáng ngược | Chủ thể được phác họa bởi nguồn sáng phía sau, bóng hoặc hình bóng trên khuôn mặt | Kịch tính, bí ẩn, cảnh quay anh hùng, thẩm mỹ | | Side light Ánh sáng bên | Ánh sáng mạnh chiếu từ một bên, một nửa sáng một nửa tối | Căng thẳng, cận cảnh nhân vật, chân dung kịch tính | | Rembrandt lighting Ánh sáng Rembrandt | Ánh sáng chân dung cổ điển — một bên sáng, bên tối có vùng sáng hình tam giác nhỏ dưới mắt | Chân dung, thanh lịch, không khí cổ điển | | Ánh sáng thể tích | Chùm ánh sáng nhìn thấy được xuyên qua bụi, sương mù hoặc khói | Cảm giác thiêng liêng, kịch tính, cảnh rừng, ánh sáng sân khấu | | Hiệu ứng Tyndall | Ánh sáng tán xạ trong các hạt nhỏ, tạo thành chùm sáng rõ ràng trong sương mù | Tự nhiên, cảnh buổi sáng sớm, thanh tao, mơ mộng | | Neon | Nguồn sáng màu nhân tạo, thường có màu hồng, xanh lam, xanh lục, đỏ tươi | Cyberpunk, cuộc sống về đêm, đô thị, đương đại | | Candlelight | Ấm áp, lung linh, đèn điểm màu cam hổ phách | thân mật, lịch sử, bữa tối, ấm áp | | Silhouette bóng | chủ thể hoàn toàn tối, chỉ được định nghĩa bởi đường viền trước nền sáng | bí ẩn, ẩn danh, tác động thị giác, kể chuyện | | Bioluminescent Ánh sáng sinh học | Nguồn sáng hữu cơ tự phát sáng, thường có màu xanh lục | Kỳ ảo, dưới nước, thế giới ngoài hành tinh, mơ mộng |
Từ khóa về tông màu
Màu sắc quyết định nhiệt độ cảm xúc của toàn bộ bức tranh. Màu ấm tạo cảm giác thân thiện; màu lạnh tạo cảm giác xa cách. Độ bão hòa cao tạo cảm giác tràn đầy năng lượng; độ bão hòa thấp tạo cảm giác kín đáo.
| Từ khóa (tiếng Anh/tiếng Trung) | Hiệu ứng thị giác | Kết nối cảm xúc | |-------|----------|--------- -| | Bảng màu ấm | Màu hổ phách, cam, vàng, đỏ chủ đạo | Thoải mái, hoài niệm, thân mật, mùa thu | | Bảng màu lạnh | Màu xanh lam, xanh lục, xanh đá chủ đạo | Khoảng cách, bình tĩnh, buồn bã, mùa đông, công nghệ | | Độ bão hòa cao | Màu sắc tươi sáng, đậm và mạnh mẽ | Năng lượng, tuổi trẻ, kỳ ảo, văn hóa đại chúng | | Độ bão hòa thấp | Màu sắc nhẹ nhàng, nhạt, màu phấn | U sầu, thực tế, ký ức, cổ điển | | Màu xanh lam và cam | Phân loại màu sắc phim cổ điển — bóng tối nghiêng về màu xanh lam, ánh sáng nghiêng về màu ấm | Phim bom tấn Hollywood, thương mại, cảm giác điện ảnh | | Bảng màu Cyberpunk | Màu hồng neon, xanh điện, tím đậm trên nền tối | Cảm giác tương lai, cuộc sống về đêm, kỹ thuật số, tiên phong | | Vintage | Màu hơi phai, nghiêng về màu ấm, phần tối sáng hơn | Hoài cổ, thập niên 70-80, phim độc lập, ký ức | | Earth tones Màu đất | Nâu, xanh lá, màu đất son, màu gốm | Tự nhiên, cảm giác gắn bó, hữu cơ, phim tài liệu | | Kodachrome | Màu đỏ và xanh lá cây đậm, màu da ấm áp, màu đen đậm | Nhiếp ảnh báo chí, những năm 1960-70, phong cách Mỹ |
Chất lượng/Chất lượng hình ảnh từ khóa
Chất lượng hình ảnh là yếu tố quyết định bề mặt thị giác của video — nó trông giống như phim 35mm, quảng cáo tinh tế, phim tài liệu hay tranh sơn dầu.
| Từ khóa (tiếng Anh/tiếng Trung) | Hiệu ứng hình ảnh | Tình huống áp dụng | |-------|--------- -|----------| | Cinematic Cảm giác điện ảnh | Cảm giác khung hình rộng, độ sâu trường ảnh nông, màu sắc phim | Kể chuyện, kịch, câu chuyện | | Documentary Phim tài liệu | Ánh sáng tự nhiên, bố cục hơi không hoàn hảo | Thực tế, tin tức, giáo dục | | Quảng cáo thương mại | Sáng sủa, rõ ràng, ánh sáng chính xác, chuyển động máy quay mượt mà | Trưng bày sản phẩm, quảng cáo, doanh nghiệp | | Hạt phim | Hạt phim phủ lên hình ảnh | Cổ điển, mô phỏng, độc lập, ấm áp | | Anamorphic Màn hình rộng biến dạng | Hào quang ống kính ngang, hiệu ứng bokeh hình elip, biến dạng nhẹ ở rìa | Phim kịch, khoa học viễn tưởng, cảm giác sử thi | | Oil painting texture (Kết cấu tranh sơn dầu) | Kết cấu nét vẽ rõ ràng, cảm giác sơn dày phong phú | Nghệ thuật, kỳ ảo, giấc mơ, cổ điển | | Ink wash (Mực nước) | Mực đen chuyển màu trên nền trắng, chảy tự nhiên | Mỹ học phương Đông, tối giản, tĩnh lặng | | 8mm / Super 8 | Hạt nặng, rò rỉ ánh sáng, hình ảnh không ổn định, phai màu | Ký ức, hồi tưởng, băng gia đình, hoài niệm |
Từ khóa cảm xúc
Từ khóa cảm xúc là hướng cảm xúc mà bạn cung cấp cho AI. Chúng ảnh hưởng đến mọi thứ — nhịp điệu, lựa chọn màu sắc, hành vi của ống kính và cảm giác tổng thể.
| Từ khóa (tiếng Anh/tiếng Trung) | Cảm xúc gợi lên | Gợi ý kết hợp | |-------|----------- -|----------| | Cozy Ấm cúng | Ấm áp, thoải mái, an toàn, gia đình | Ánh nến, tông màu ấm, cảnh trong nhà | | Tense Căng thẳng | Lo lắng, mong đợi, điều sắp xảy ra | Ánh sáng bên, ống kính cầm tay, bố cục chặt chẽ | | Suspenseful Hồi hộp | Sợ hãi, không chắc chắn, tích tụ từ từ | Ánh sáng dịu, tiến triển chậm, độ bão hòa thấp | | Joyful Vui vẻ | Hạnh phúc, ăn mừng, nhẹ nhàng | Giờ vàng, độ bão hòa cao, cảnh xa | | Melancholic Buồn bã | Buồn bã, khao khát, vẻ đẹp trong nỗi buồn | Giờ xanh, tông màu lạnh, chuyển động chậm | | Epic Sử thi | Vĩ đại, anh hùng, đáng kính | Góc rộng, ống kính nâng hạ, nhạc giao hưởng | | Healing Chữa lành | Bình yên, phục hồi, chữa lành nhẹ nhàng | Ánh sáng mềm, màu phấn, tự nhiên, nhịp độ chậm | | Horror Kinh dị | Sợ hãi, kỳ lạ, lo lắng | Bóng tối sâu, góc Hà Lan, độ bão hòa thấp, im lặng | | Romantic Lãng mạn | Tình yêu, khao khát, dịu dàng, thân mật | Ánh sáng ngược, tông màu ấm, độ sâu trường ảnh nông, cận cảnh | | Năng động | Tốc độ, hưng phấn, adrenaline | Lắc máy ảnh, thay đổi tốc độ, độ bão hòa cao, góc rộng | | Hoài niệm | Khao khát quá khứ, ký ức ngọt ngào và đắng cay | Hạt phim, tông màu cổ điển, ánh sáng quá mức |
Tổ hợp từ khóa về không khí: ba ví dụ
Sức mạnh thực sự đến từ việc kết hợp một hoặc hai từ khóa được chọn từ mỗi chiều. Ba sự kết hợp sau đây tạo ra những bầu không khí hoàn toàn khác nhau cho cùng một chủ đề - "một người phụ nữ đứng trước cửa sổ":
Bộ sưu tập 1: Ấm áp và hoài niệm
Ánh sáng hoàng hôn, bảng màu ấm áp với tông màu hổ phách và mật ong, kết cấu hạt phim, không khí hoài niệm.
Bộ đôi thứ hai: Lạnh lẽo và căng thẳng
Ánh sáng bên từ một nguồn duy nhất, bảng màu xanh lục nhạt mát mẻ, kết cấu kỹ thuật số sạch sẽ, không khí căng thẳng.
Bộ ba: Mơ màng huyền ảo
Hiệu ứng Tyndall chiếu qua rèm mỏng, bảng màu pastel, kết cấu màu nước, không khí thư giãn.
Cùng một chủ thể, ba video hoàn toàn khác nhau. Từ khóa chính là bảng điều khiển.
Từ một câu nói đến từ khóa cấp độ phim: 5 ví dụ nâng cao
Cách tốt nhất để học viết lời nhắc là quan sát quá trình phát triển của chúng. Mỗi ví dụ dưới đây bắt đầu từ phiên bản cơ bản V1 (loại mà hầu hết mọi người viết), sau đó được cải tiến lên V2 (thêm chi tiết cụ thể và góc quay), và cuối cùng đạt đến V3 (lời nhắc chi tiết hoàn chỉnh đạt chuẩn điện ảnh). Hãy chú ý đến những thay đổi xảy ra ở mỗi cấp độ và lý do tại sao.
Để xem thêm các ví dụ về từ khóa video sẵn sàng sử dụng, vui lòng tham khảo 10 từ khóa video AI hữu ích.

Thực hành tiến hóa từ khóa gợi ý. V1 hầu như không cung cấp bất kỳ thông tin nào cho AI. V3 cung cấp tất cả cho nó — kết quả hoàn toàn khác biệt.
Ví dụ 1: Chân dung/Cảm xúc —— "Người phụ nữ đi bộ trong mưa"
V1 — Phiên bản cơ bản (18 từ)
A woman walking in the rain at night in a city, cinematic, beautifulBạn sẽ nhận được: một người phụ nữ chung chung, một thành phố chung chung, một cơn mưa chung chung, ánh sáng phẳng lặng, không có sự đồng cảm cảm xúc. AI lấp đầy mọi khoảng trống bằng giá trị trung bình thống kê.
V2 — Phiên bản cải tiến (62 từ)
A young Asian woman in a long dark coat walks slowly through a rain-soaked Tokyo backstreet at night. Neon signs reflect in the wet pavement, casting pink and blue light. She carries a transparent umbrella. Camera tracks beside her at shoulder height. Shallow depth of field. Melancholic mood.Cải tiến gì: Chủ thể cụ thể, địa điểm cụ thể, nguồn sáng cụ thể, vị trí ống kính, hướng cảm xúc. AI hiện có đủ thông tin để tạo ra hình ảnh độc đáo.
V3 — Đẳng cấp điện ảnh (138 từ)
A woman in her late 20s, Japanese, long black hair partially wet and clinging to her neck, wearing an oversized charcoal wool coat over a cream turtleneck, walks alone through a narrow Shinjuku backstreet at 2am. Rain falls in fine sheets, catching neon light from izakaya signs overhead — warm amber kanji characters and cold blue beer advertisements. The wet asphalt mirrors everything, creating a double world beneath her feet. She carries a transparent vinyl umbrella, water beading and streaming down its surface.
Camera: tracking shot at shoulder height, moving alongside her at walking pace, shallow depth of field at f/1.4, foreground rain droplets occasionally crossing the lens out of focus.
Lighting: practical neon sources only — no fill light. Rim light from signs behind her outlines her coat collar and umbrella edge. Her face catches intermittent warm light as she passes each shopfront.
Style: cinematic, Kodak Vision3 500T film stock, slight grain, teal-and-amber color grade, Wong Kar-wai atmosphere.
Âm thanh: tiếng mưa rơi trên bề mặt ô, tiếng nhạc jazz xa xăm từ một quán bar, tiếng bước chân của cô trên đá ướt, không có đối thoại, không có nhạc nền.(Một phụ nữ Nhật Bản ở độ tuổi 20, mái tóc đen dài ướt sũng dính vào cổ, mặc áo khoác len màu xám than oversized bên ngoài áo len cổ lọ màu kem, đi bộ một mình trong con hẻm hẹp ở Shinjuku vào lúc 2 giờ sáng. Những hạt mưa mịn màng trong không khí bắt lấy ánh đèn neon của biển hiệu quán rượu trên đầu cô - những chữ cái màu hổ phách ấm áp và quảng cáo bia màu xanh lạnh. Mặt đường nhựa ẩm ướt phản chiếu mọi thứ, tạo ra một thế giới phản chiếu dưới chân cô. Cô cầm một chiếc ô nhựa trong suốt, những giọt nước ngưng tụ trên bề mặt ô và chảy xuống.)
V3 hiệu quả vì: Mỗi yếu tố trong công thức đều được chỉ định cụ thể. AI không có chỗ cho sự phỏng đoán — khi AI không phỏng đoán, nó sẽ tái hiện chính xác những gì bạn mô tả.
Ví dụ 2: Trưng bày sản phẩm —— "Đồng hồ trên bàn"
V1 — Phiên bản cơ bản (14 từ)
A luxury watch sitting on a table, product shot, high quality, 4KV2 — Phiên bản cải tiến (58 từ)
A stainless steel dive watch with a dark blue dial rests on a slab of raw gray marble. Camera orbits slowly around the watch, 15 degrees above. Single key light from the upper left creates a defined shadow. The watch's crystal catches the light and creates a brief flare. Commercial style, clean background.V3 — Đẳng cấp điện ảnh (126 từ)
A stainless steel dive watch with a sunburst navy-blue dial and ceramic bezel sits on a rough-cut block of Carrara marble, positioned at the golden-ratio intersection of the frame. The second hand sweeps continuously. Micro water droplets bead on the crystal surface and the steel bracelet links, catching light.
Camera: begins in macro extreme close-up on the dial — the indices and lume dots fill the frame — then slowly dollies out while simultaneously orbiting clockwise, completing a 270-degree arc over 8 seconds until the full watch and marble base are revealed in a three-quarter beauty shot.
Lighting: single hard key light at 10 o'clock position, 45 degrees above. No fill — deep shadows on the right side. A subtle rim light from behind separates the watch from the dark charcoal background.
Style: high-end commercial, ultra-sharp 8K downscaled to 4K, zero grain, clinical precision. Color: cool steel tones with warm gold accents from the lume.
Âm thanh: gần như im lặng — chỉ có tiếng tích tắc nhẹ nhàng của bộ máy, một tiếng chuông trong trẻo duy nhất vào khoảnh khắc bùng sáng.(Một chiếc đồng hồ lặn bằng thép không gỉ, mặt số màu xanh hải quân với hoa văn mặt trời và viền gốm, được đặt trên một phiến đá cẩm thạch Carrara thô, nằm ở điểm giao nhau của tỷ lệ vàng trên khung hình. Kim giây tiếp tục chuyển động. Những giọt nước nhỏ ngưng tụ trên bề mặt kính và các mắt xích thép, phản chiếu ánh sáng.)
Ví dụ 3: Du lịch phong cảnh —— "Dãy núi bình minh"
V1 — Phiên bản cơ bản (12 từ)
Beautiful mountains at sunrise, drone shot, epic landscape, cinematicV2 — Phiên bản cải tiến (55 từ)
Snow-capped mountain peaks emerging from a sea of clouds at sunrise. The first rays of sun paint the peaks golden while the valleys remain in blue shadow. Camera cranes up slowly from the cloud layer, revealing the full mountain range. Wide angle, epic scale, warm-to-cool color gradient.V3 — Đẳng cấp điện ảnh (134 từ)
The Dolomites at sunrise in late autumn. Jagged limestone spires — the Tre Cime di Lavaredo — pierce through a thick layer of valley clouds, their east-facing faces catching the first horizontal rays of sun and turning from cold blue-gray to blazing amber-gold. The cloud layer below is a rolling ocean of soft white and pale peach, filling the valleys completely.
Camera: starts buried inside the cloud layer — visibility near zero, soft white diffusion everywhere — then cranes upward at a steady pace, breaking through the cloud surface to reveal the peaks and the vast sky above. The transition from claustrophobic fog to infinite horizon takes 4 seconds. Continue rising to a high aerial wide shot. 24mm wide angle lens.
Lighting: first light of day — sun at 5 degrees above the eastern horizon, casting extreme raking light across the mountain faces. Golden hour warmth on lit surfaces, blue hour coolness in shadowed areas. Volumetric light beams visible where sun cuts between peaks.
Style: National Geographic cinematic, IMAX-quality, ultra-wide dynamic range, vivid but natural color, no filters.
Âm thanh: gió ở độ cao — một tiếng thì thầm thấp kéo dài với những cơn gió thổi mạnh thỉnh thoảng, không có nhạc, không có tiếng người. Sự im lặng làm tăng thêm quy mô.(Dãy núi Dolomites vào buổi sáng muộn mùa thu. Những ngọn tháp đá vôi nhọn như răng cưa — ba ngọn núi — xuyên qua lớp mây dày đặc trong thung lũng, mặt đông của chúng đón những tia nắng đầu tiên, chuyển từ màu xanh xám lạnh lẽo sang màu hổ phách rực rỡ.)
Ví dụ 4: Cảnh hành động —— "Võ sĩ ra đòn"
V1 — Phiên bản cơ bản (15 từ)
A martial artist doing a spinning kick, action movie style, slow motionV2 — Phiên bản cải tiến (64 từ)
A female martial artist in a dark training hall performs a spinning back kick. Her bare foot connects with a hanging heavy bag, sending it swinging violently. Camera captures the kick from a low angle, slightly slow motion at the point of impact, then returns to real-time as she recovers her stance. Side lighting creates dramatic shadows.V3 — Đẳng cấp điện ảnh (141 từ)
A woman in her 30s, lean and muscular, wearing a fitted black tank top and loose gray training pants, stands in a dimly lit martial arts gym. Worn wooden floor, heavy bags hanging in rows, chalk dust suspended in the air. She explodes from stillness — a spinning hook kick that arcs through 360 degrees, her back heel striking a leather heavy bag at head height.
Camera: starts medium shot at 45-degree angle. As the spin begins, camera speed-ramps to 240fps slow motion — her hair whips in an arc, chalk dust traces the path of her foot, the bag surface ripples visibly on impact. Hold for one beat, then ramp back to real-time as she plants her foot. Slight handheld energy.
Lighting: single harsh side light from camera-left, no fill. Chalk dust and sweat particles glow in the light beam.
Style: David Fincher / Fight Club aesthetic — desaturated, greenish-teal undertone, high contrast, gritty. Anamorphic lens with subtle horizontal flares.
Âm thanh: sự im lặng trước cú đá — tiếng ồn xung quanh phòng tập, một hơi thở vào. Cú đá: tiếng vải rách nổ, tiếng da nặng va chạm, tiếng xích lách cách. Tiếng thở ra sắc bén của cô khi tiếp xúc. Không có nhạc.(Một phụ nữ ngoài ba mươi, gầy gò và cơ bắp rõ rệt, mặc áo thun đen ôm sát và quần tập rộng màu xám, đứng trong phòng tập võ tối tăm. Sàn gỗ mòn, hàng loạt bao cát treo lơ lửng, bụi bay lơ lửng trong không khí. Cô bùng nổ từ trạng thái tĩnh — xoay 360 độ và đá, gót chân đánh trúng bao cát da cao ngang đầu.)
Ví dụ 5: Câu chuyện cảm xúc — "Bà và cháu trai"
V1 — Phiên bản cơ bản (16 từ)
A grandmother and her grandchild spending time together, heartwarming, emotional, beautiful momentV2 — Phiên bản cải tiến (71 từ)
An elderly grandmother with silver hair and weathered hands teaches her 5-year-old granddaughter how to knead bread dough in a sunlit country kitchen. The child stands on a wooden step stool, flour on her cheeks, laughing. The grandmother guides her small hands through the dough. Golden morning light through a window. Warm color palette. Intimate, cozy atmosphere.V3 — Đẳng cấp điện ảnh (147 từ)
A Japanese grandmother in her 80s, silver hair in a soft bun, deep expression lines around smiling eyes, wearing an indigo apron over a cream linen blouse, stands beside her granddaughter — age 4 or 5, round cheeks, short black hair with a red clip — at a low wooden table in a traditional kitchen. Shoji screen doors are slid open to a small garden where morning light enters. They are making mochi together. The grandmother's large, weathered hands wrap around the child's tiny ones, guiding them to fold and press the soft rice dough. Flour dust floats in the shaft of sunlight between them.
Camera: close-up on their four hands working the dough — the contrast of old and young skin. Slowly dolly out to a medium shot including both faces. Rack focus between them — first sharp on the grandmother's eyes, then pulling to the child's smile. 85mm portrait lens, f/2.0, creamy bokeh.
Lighting: natural morning sunlight from the garden, soft and directional, Tyndall effect through the flour dust. No artificial light. The light creates a warm halo around the grandmother's silver hair.
Style: Hirokazu Kore-eda film quality — observational, unhurried, documentary intimacy with cinematic beauty. Kodachrome-inspired color. 16:9.
Âm thanh: tiếng nhịp nhàng nhẹ nhàng của đôi tay nhào bột, tiếng chim hót ngoài vườn, tiếng chuông gió xa xăm, tiếng cười thỉnh thoảng của đứa trẻ, tiếng bà nội ngân nga một giai điệu dân ca. Không có nhạc nền — chỉ có âm thanh trong phim.(Một bà ngoại Nhật Bản hơn 80 tuổi, tóc bạc buộc thành búi lỏng lẻo, nụ cười quanh mắt có nếp nhăn sâu, mặc tạp dề màu xanh lam bên ngoài áo sơ mi lanh màu kem. Bà đứng bên cạnh cháu gái 4-5 tuổi — khuôn mặt tròn, tóc đen ngắn cài kẹp đỏ — trước bàn gỗ thấp trong bếp truyền thống. Cửa shoji mở ra hướng về khu vườn nhỏ, ánh sáng buổi sáng tràn vào từ đó. Họ cùng nhau làm mochi. Bàn tay lớn đầy vết tích thời gian của bà ôm lấy bàn tay nhỏ của cháu, hướng dẫn chúng gấp và ấn bột gạo nếp mềm. Bột mì bay lơ lửng trong tia nắng giữa hai người. Đó là chất lượng phim của Hirokazu Koreeda - quan sát, không vội vàng, sự thân mật của phim tài liệu và vẻ đẹp của điện ảnh.
Viết thiết kế âm thanh vào từ gợi ý
Thiết kế âm thanh là khía cạnh bị bỏ qua nhiều nhất trong việc viết lời nhắc video. Đến năm 2026, các nền tảng như Seedance, Veo 3 và Keeling đều hỗ trợ tạo âm thanh đồng bộ với video — sự chênh lệch về chất lượng giữa các nền tảng có và không có tính năng này là rất lớn.
Hãy nghĩ như thế này: một khung cảnh rừng đẹp không có âm thanh môi trường giống như một hình ảnh GIF động. Khi thêm tiếng chim hót, tiếng lá xào xạc và tiếng suối chảy xa xa, nó trở thành một nơi mà bạn muốn bước vào.
Định dạng thiết kế âm thanh
Thêm lệnh âm thanh vào cuối từ gợi ý bằng một đoạn hoặc dòng riêng biệt, bao gồm ba cấp độ:
Lớp đầu tiên: Nhạc nền — Tâm trạng và phong cách tổng thể
Background music: slow ambient piano, minor key, sparse notes with reverb
(背景音乐:缓慢的氛围钢琴,小调,稀疏的音符带混响)Lớp thứ hai: Âm thanh môi trường — Tạo âm thanh môi trường cho cảnh
Ambient: light rain on leaves, distant thunder rolls, wet road traffic hum
(环境音:轻柔的雨打树叶声、远处的雷声滚动、湿路上的交通嗡嗡声)Lớp thứ ba: Hiệu ứng âm thanh hành động và đối thoại — Các âm thanh cụ thể liên quan đến các sự kiện trong video.
SFX: footsteps on wet pavement, umbrella opening with a click
Dialogue: none
(音效:湿路面上的脚步声、雨伞咔嗒打开的声音。对话:无)Tham khảo từ khóa âm thanh
Các phong cách âm nhạc thể hiện các cảm xúc khác nhau:
| Cảm xúc | Hướng âm nhạc (từ gợi ý tiếng Anh) |
|---|---|
| Bình yên | Ambient, piano nhẹ nhàng, guitar acoustic fingerpicking, lo-fi |
| Căng thẳng | Tiếng vo vo thấp, dây đàn bất hòa, nhịp điệu tối giản |
| Vui vẻ | Âm thanh acoustic lạc quan, ukulele, nhịp điệu nhẹ nhàng, âm điệu chính |
| Sử thi | Dàn nhạc crescendo, trống taiko, kèn đồng, hợp xướng |
| Lãng mạn | Tứ tấu dây, jazz nhẹ nhàng, bossa nova |
| Bí ẩn | Âm thanh xung quanh tối, piano có nhiều âm vang, tiếng chuông xa xôi |
| Năng động | Nhịp điệu điện tử, trống mạnh mẽ, âm trầm nặng, nhịp nhanh |
| Buồn bã | Cello độc tấu, piano chậm ở âm điệu nhỏ, guitar thưa thớt |
Âm thanh môi trường:
| Môi trường | Cấp độ âm thanh (từ gợi ý tiếng Anh) | |------|--------------------- -| | Rừng | Tiếng chim hót, tiếng lá xào xạc, tiếng chim gõ kiến xa xa, tiếng suối chảy | | Đêm thành phố | Tiếng ồn ào của giao thông, tiếng còi báo động xa xa, tiếng đèn neon kêu vo vo, tiếng bước chân | | Biển | Tiếng sóng vỗ, tiếng mòng biển, tiếng gió, tiếng động cơ thuyền xa xa | | Quán cà phê trong nhà | Máy pha cà phê, tiếng trò chuyện thì thầm, tiếng thìa trên gốm, nhạc jazz | | Ngày mưa | Mưa nặng hạt (mưa nhỏ / mưa lớn), sấm sét, tiếng nước nhỏ giọt | | Xưởng | Tiếng dụng cụ, mùn cưa, tiếng máy móc, tiếng radio trong nền |
Khi nào sử dụng im lặng
Sự im lặng không phải là sự thiếu vắng của thiết kế âm thanh — đó là một sự lựa chọn có chủ ý. Sự im lặng chiến lược có thể tạo ra:
- Khoảnh khắc tác động: Sự im lặng trước nhịp điệu kịch tính sẽ làm nổi bật nhịp điệu đó
- Cảm giác quy mô: Chỉ có tiếng gió trong khung cảnh rộng lớn mới truyền tải được sự bao la
- Cảm giác căng thẳng: Loại bỏ âm thanh dự kiến sẽ tạo ra sự bất an
- Tập trung: Sự im lặng hướng tất cả sự chú ý vào thị giác
Trong lời nhắc, hãy ghi rõ: Âm thanh: im lặng — không có nhạc, không có âm thanh môi trường, chỉ có tiếng thở của đối tượng.
Để biết thêm thông tin về việc tạo âm thanh trong sản xuất video âm nhạc AI, hãy tham khảo Hướng dẫn tạo video âm nhạc AI.
Kỹ thuật gợi ý từ khóa dành riêng cho nền tảng
Công thức chung có thể áp dụng ở mọi nơi, nhưng mỗi nền tảng video AI có những đặc điểm riêng trong việc giải thích từ khóa. Tối ưu hóa từ khóa cho nền tảng bạn sử dụng có thể cải thiện hiệu quả đáng kể.

Cùng một khái niệm — "Người phụ nữ đi bộ trong đêm mưa" — được tối ưu hóa cho năm nền tảng khác nhau. Cùng một công thức, nhưng với các trọng tâm khác nhau.
Seedance
Ưu điểm: Định dạng dòng thời gian phân cảnh, chuỗi nhiều cảnh quay, tham chiếu video từ hình ảnh, tích hợp trình tạo từ khóa.
Kỹ thuật tối ưu hóa:
- Sử dụng cấu trúc timeline phân cảnh cho chuỗi phức tạp — chia video thành các cảnh có dấu thời gian:
Shot 1 (0-3s): [描述]
Shot 2 (3-6s): [描述]
Shot 3 (6-10s): [描述]- Sử dụng
@Image1,@Image2để tham chiếu hình ảnh đã tải lên để đảm bảo tính nhất quán về phong cách và nhân vật - Hiệu ứng ngôn ngữ chuyển động máy quay rất tốt - sử dụng các thuật ngữ cụ thể (dolly, track, orbit) thay vì các thuật ngữ chung chung ("di chuyển")
- Bao gồm thiết kế âm thanh - Seedance sẽ xử lý các manh mối âm thanh
- Quy trình làm việc hiệu quả nhất: sử dụng trình tạo từ khóa video để tạo từ khóa có cấu trúc từ những ý tưởng đơn giản, sau đó tối ưu hóa thủ công
Hướng dẫn đầy đủ về các từ khóa riêng của nền tảng Seedance (bao gồm hơn 50 ví dụ), tham khảo Hướng dẫn từ khóa Seedance.
Sora(OpenAI)
Ưu điểm: Tính chân thực về mặt vật lý, chuyển động tự nhiên, hiểu ngôn ngữ tự nhiên trong văn bản dài.
Kỹ thuật tối ưu hóa:
- Sử dụng các đoạn văn mô tả mạch lạc thay vì danh sách có cấu trúc — Sora giỏi phân tích ngôn ngữ tự nhiên
- Nhấn mạnh chi tiết vật lý: trọng lực, trọng lượng, thuộc tính vật liệu, động lực học chất lỏng
- Mô tả " cảm giác khi chạm vào" - Mô tả kết cấu và chất liệu giúp tăng độ chân thực về mặt vật lý
- Sử dụng rõ ràng tỷ lệ chiều rộng và chiều cao cũng như thông số thời lượng
- Mô tả chi tiết về vật lý: "Vải nặng rủ xuống theo từng bước đi, bị trì hoãn bởi trọng lượng của chính nó" tạo ra hiệu ứng tốt hơn so với "váy bay bổng".
Keling Kling (Kuaishou)
Ưu điểm: Tốc độ tạo hình nhanh, biểu hiện động tác và chuyển động mạnh mẽ, tính nhất quán trên khuôn mặt tốt.
Kỹ thuật tối ưu hóa:
- Giữ cho từ gợi ý ngắn gọn — Keeling phản hồi tốt hơn với các từ gợi ý tập trung và dẫn đầu bằng hành động (50-80 từ là khoảng tối ưu)
- Bắt đầu bằng hành động:
A dancer leaps and spins(Vũ công nhảy và xoay) thay vì đề cập đến hành động sau một mô tả cảnh dài - Chỉ định rõ hướng chuyển động:
moves from left to right(di chuyển từ trái sang phải),approaches camera(tiến về phía máy quay),turns away(quay lưng đi) - Keeling xử lý chuyển động cơ thể và nét mặt rất tốt - tận dụng điều này để viết từ gợi ý cảm xúc cận cảnh
- Hướng dẫn chuyển động máy quay hiệu quả nhưng mỗi từ gợi ý chỉ nên có một hoặc hai động tác chuyển động máy quay
Thông Nghĩa Vạn Tượng / Runway (Gen-3 Alpha / Gen-4)
Kỹ thuật tối ưu hóa Tongyi Wanshang:
- Hỗ trợ nhập trực tiếp từ khóa tiếng Trung, mang lại hiệu quả dịch tốt hơn
- Hiểu biết sâu sắc về các yếu tố thẩm mỹ truyền thống Trung Quốc - mực nước, phong cách quốc gia, bối cảnh trang phục cổ đại
- Hiệu quả tốt với các thẻ phong cách đơn giản và rõ ràng
Kỹ thuật tối ưu hóa Runway:
- Kết hợp mô tả văn bản và thẻ phong cách — Runway có khả năng hiểu phong cách mạnh mẽ
- Mô tả chuyển động bằng vectơ không gian:
movement from bottom-left to top-right(chuyển động từ góc dưới bên trái sang góc trên bên phải) - Khi sử dụng Motion Brush, gợi ý văn bản tập trung vào toàn bộ cảnh và phong cách, sử dụng cọ vẽ để xử lý khu vực chuyển động cụ thể
- Runway hiểu rất tốt về mô tả phong cách nghệ thuật - "in the style of a Terrence Malick film" (phong cách của Terrence Malick) có thể tạo ra hiệu ứng rất tốt
- Giữ cho gợi ý tập trung - mỗi lần tạo ra một cảnh rõ ràng, thay vì một chuỗi nhiều cảnh
Veo 3(Google DeepMind)
Ưu điểm: Hiểu biết về âm thanh, mô phỏng vật lý, chất lượng điện ảnh, chuỗi dài hơn.
Kỹ thuật tối ưu hóa:
- Bao gồm mô tả âm thanh chi tiết — Veo 3 tạo âm thanh đồng bộ từ văn bản
- Mô tả chi tiết tương tác vật lý: cách các vật thể va chạm, cách vật liệu biến dạng, cách ánh sáng tương tác với bề mặt
- Sử dụng thuật ngữ chuyên ngành điện ảnh — Dữ liệu đào tạo của Veo 3 chủ yếu tập trung vào phim chuyên nghiệp
- Chỉ định thời lượng và nhịp độ:
the scene unfolds slowly over 10 seconds(cảnh diễn ra chậm trong 10 giây) - Mô tả vật lý giúp cải thiện hiệu quả đáng kể:
water splashes upward on impact, droplets catching backlight(nước bắn lên khi va chạm, các giọt nước bắt ánh sáng ngược) chứ không chỉ là "nước bắn"
Để biết chi tiết về so sánh giữa Seedance và Sora về khả năng giải thích từ gợi ý và chất lượng đầu ra, hãy tham khảo So sánh Seedance và Sora.
Hoặc, hãy để AI giúp bạn viết từ gợi ý
Bạn vừa hoàn thành việc học khung cơ bản để viết lời nhắc video từ đầu. Kiến thức này rất có giá trị — nó giúp bạn trở thành người đánh giá chất lượng lời nhắc tốt hơn và cho phép bạn kiểm soát hoàn toàn từng chi tiết. Tuy nhiên, bạn không cần phải viết từng lời nhắc một cách thủ công mỗi lần.

Quy trình làm việc kết hợp: Để AI xử lý cấu trúc và thuật ngữ kỹ thuật, sau đó đưa góc nhìn sáng tạo của bạn vào giai đoạn tối ưu hóa.
Khi nào nên viết tay và khi nào nên sử dụng AI
| Tình huống | Phương pháp tối ưu |
|---|---|
| Bạn có tầm nhìn sáng tạo chính xác và biết rõ mình muốn gì | Viết tay — bạn sẽ nhanh hơn và chính xác hơn so với chỉnh sửa bản nháp AI |
| Bạn có ý tưởng tổng quát nhưng cần cấu trúc | AI tạo ra → Tối ưu hóa thủ công |
| Bạn cần tạo nhanh nhiều biến thể từ khóa | AI tạo hàng loạt → Chọn và tối ưu hóa những từ tốt nhất |
| Bạn đang học và muốn nghiên cứu cấu trúc từ khóa | AI tạo → Đọc và phân tích — đây là cách bạn tích lũy từ vựng |
| Bạn cần khớp với hình ảnh tham khảo cụ thể | Viết tay — mô tả chính xác những gì bạn thấy trong hình tham khảo |
Quy trình làm việc kết hợp (được khuyến nghị)
Quy trình viết từ khóa hiệu quả nhất kết hợp giữa tạo ra bởi AI và tối ưu hóa thủ công:
-
Bắt đầu với AI. Truy cập Seedance Trình tạo từ khóa video, mô tả ý tưởng của bạn bằng một hoặc hai câu, chọn phong cách và tạo ra.
-
Đọc kỹ nội dung đầu ra. AI sẽ tạo ra một gợi ý có cấu trúc bao gồm ngôn ngữ chuyển động máy quay, dòng thời gian, ánh sáng và âm thanh. Đọc kỹ nội dung. Chuyển động máy quay có phù hợp với cảm xúc bạn muốn truyền tải không? Hướng ánh sáng có tạo ra bầu không khí phù hợp không? Có chi tiết nào bạn muốn sửa đổi không?
-
Tối ưu hóa thủ công. Đây là nơi kiến thức của bạn về công thức, ngôn ngữ chuyển động máy quay và từ khóa không khí phát huy tác dụng. Thay thế các chuyển động máy quay do AI chọn bằng những chuyển động phù hợp hơn với tầm nhìn của bạn. Điều chỉnh các từ khóa ánh sáng và bóng tối. Thêm các chi tiết cụ thể mà AI không thể biết được — đặc điểm riêng biệt của nhân vật, yêu cầu cụ thể của thương hiệu, và những sắc thái cảm xúc tinh tế.
-
Tạo video. Gửi các từ khóa đã được tối ưu hóa đến trình tạo video. Kết quả sẽ tốt hơn nhiều so với các từ khóa do người mới bắt đầu tạo hoàn toàn thủ công hoặc các từ khóa do AI tạo ra mà chưa được kiểm duyệt.
Hướng dẫn sử dụng đầy đủ công cụ tạo từ khóa AI, tham khảo Hướng dẫn sử dụng công cụ tạo từ khóa video AI.
Hiệu ứng điện ảnh: Hòa quyện hoàn hảo
Hãy viết một lời nhắc cuối cùng, áp dụng tất cả nội dung của hướng dẫn này — công thức, ngôn ngữ quay phim, từ khóa tạo không khí, thiết kế âm thanh — để tạo ra một hiệu ứng thực sự đẳng cấp điện ảnh.
Bản tóm tắt ý tưởng: Một phi hành gia cô đơn phát hiện ra sự sống thực vật trên sao Hỏa.

Các gợi ý được chỉ định hoàn toàn ở cấp độ điện ảnh tạo ra hiệu ứng như thể được đạo diễn chỉ đạo - vì thực tế là như vậy. Mỗi yếu tố đều phục vụ cho câu chuyện.
Gợi ý đầy đủ:
Subject: A solitary astronaut in a dusty, sun-bleached EVA suit — visor partially reflective, scratched from use, mission patches barely legible. The suit is not pristine Hollywood white; it is a working tool, weathered by months on the Martian surface.
Action: The astronaut crouches beside a small crack in the rust-red basalt. Inside the crack, a single tiny green sprout — two delicate leaves, almost translucent — pushes up through the red soil. The astronaut's gloved hand reaches toward it, hesitates, trembles slightly, then gently touches the soil beside it.
Environment: The Martian surface — a flat, rust-red plain scattered with dark basalt rocks, stretching to low eroded hills on the horizon. The sky is a pale butterscotch-pink. Dust devils move in the far distance. The scene feels vast and achingly empty — except for this one tiny green thing.
Camera: Opens with an extreme wide shot — the astronaut is a small figure in the immense Martian landscape. Slow dolly in over 4 seconds to a medium shot. As the astronaut crouches, camera drops to ground level and continues to a close-up of the gloved hand and the sprout. Rack focus: pull from the hand to the astronaut's visor, where we see the sprout's reflection. 65mm lens, anamorphic.
Lighting: Late Martian afternoon — low sun from camera-right, casting long amber-red shadows. The side light sculpts the EVA suit's texture. The sprout's translucent leaves glow with subsurface scattering as sunlight passes through them — the only green in a world of red. Volumetric dust particles drift through the light beam.
Style: Ridley Scott's The Martian meets Terrence Malick's The Tree of Life. Cinematic, anamorphic, muted Martian color palette with the single point of vivid green as deliberate contrast. Subtle film grain.
Sound: Wind — thin, high-pitched Martian wind, unlike Earth wind. The astronaut's breathing inside the suit — measured at first, then quickening. A single sustained low note from a cello enters as the hand reaches for the sprout. No dialogue. No narration.(Một phi hành gia cô độc, mặc bộ đồ không gian EVA bám đầy bụi và phai màu dưới ánh nắng mặt trời — mặt nạ phản chiếu một phần, vết xước do sử dụng, huy hiệu nhiệm vụ gần như không thể nhìn thấy. Bộ đồ không gian không còn là màu trắng mới tinh của Hollywood, nó là một công cụ làm việc đã trải qua nhiều tháng bị phong hóa trên bề mặt sao Hỏa. Phi hành gia ngồi xổm bên một vết nứt nhỏ trên đá bazan màu đỏ gỉ. Trong vết nứt, một chồi non màu xanh lá cây - hai chiếc lá mỏng manh, gần như trong suốt - mọc lên từ đất đỏ. Găng tay của phi hành gia vươn về phía nó, do dự, run rẩy nhẹ, rồi nhẹ nhàng chạm vào đất bên cạnh nó.)
Cụm từ gợi ý này sử dụng tất cả bảy yếu tố công thức, ngôn ngữ quay phim cụ thể (cảnh toàn cảnh, tiến gần, chuyển trọng tâm), từ khóa không khí (ánh sáng thể tích, tán xạ dưới bề mặt, màn hình rộng biến dạng), thiết kế âm thanh (tiếng gió môi trường, tiếng thở, nốt nhạc cello đơn) và tham chiếu phong cách (Ridley Scott, Terrence Malick). Mỗi chi tiết đều phục vụ cho đường cong cảm xúc: cô đơn → khám phá → kinh ngạc.
Đây chính là dự án từ khóa video.
Câu hỏi thường gặp
AI video prompt words should be how long?
Không có tiêu chuẩn chiều dài thống nhất. Chiều dài phù hợp phụ thuộc vào độ phức tạp của ý tưởng sáng tạo và nền tảng bạn sử dụng. Cấp độ V1 (15-30 từ) cho kết quả chung trên mọi nền tảng. Cấp độ V2 (50-80 từ) là khoảng tối ưu cho hầu hết các nền tảng — đủ cụ thể mà không làm quá tải mô hình. Cấp độ V3 (100-200 từ) tạo ra kết quả dễ kiểm soát nhất trên các nền tảng hỗ trợ từ gợi ý dài (như Seedance và Sora). Khi sử dụng Keyling, hãy giữ khoảng 50-80 từ. Chỉ số quan trọng không phải là số từ — mà là liệu mỗi yếu tố của công thức có được bao phủ hay không.
Có cần phải hiểu về nhiếp ảnh để viết tốt các gợi ý cho video không?
Không cần thiết, nhưng hiểu rõ sẽ giúp ích rất nhiều — và hướng dẫn này vừa cung cấp cho bạn những kiến thức cốt lõi. Bạn không cần bằng cấp về điện ảnh, mà cần biết tên của 10-15 kiểu quay phim, hiểu tác động cảm xúc của các loại ánh sáng khác nhau, và có vốn từ vựng để miêu tả không khí. Hãy lưu lại các phần [Ngôn ngữ quay phim](#Ngôn ngữ quay phim bí mật) và [Từ điển từ khóa không khí](#Từ điển từ khóa không khí), tham khảo lại nhiều lần cho đến khi những thuật ngữ này trở thành bản năng thứ hai của bạn.
Một từ khóa có thể được sử dụng trên các nền tảng video AI khác nhau không?
Có thể — công thức chung áp dụng cho mọi trường hợp. Tuy nhiên, mỗi nền tảng có cách diễn giải từ gợi ý khác nhau. Từ gợi ý được tối ưu hóa cho Sora (dài, mượt mà, nhấn mạnh vật lý) có thể cần được sắp xếp lại cho Ke Ling (ngắn hơn, ưu tiên hành động). Phần [Kỹ thuật riêng cho nền tảng](#Kỹ thuật từ gợi ý riêng cho nền tảng) giới thiệu cách điều chỉnh. Công thức cốt lõi không thay đổi, chỉ điều chỉnh định dạng giao hàng.
Hướng dẫn này có gì khác với hướng dẫn từ khóa Seedance?
Hướng dẫn từ khóa Seedance là tài liệu dành riêng cho nền tảng này — nó hướng dẫn bạn về định dạng phân cảnh của Seedance, cách tham chiếu hình ảnh và hơn 50 từ khóa sẵn sàng sử dụng. Hướng dẫn này là tài liệu chung — nó hướng dẫn bạn các kỹ năng cơ bản để viết từ khóa cho bất kỳ nền tảng nào. Hãy xem hướng dẫn này như một cuốn sách giáo khoa, còn hướng dẫn Seedance như một cuốn sổ tay thực hành cho một công cụ cụ thể.
Nếu không biết thuật ngữ quay phim, làm thế nào để mô tả chuyển động của ống kính?
Trước tiên, hãy mô tả những gì bạn muốn khán giả nhìn thấy và cảm nhận. "Máy quay từ từ tiến gần đến khuôn mặt của chủ thể" là dolly in (tiến lên). "Máy quay theo dõi người này đi bộ từ bên cạnh" là tracking shot (quay theo). Nền tảng AI hiểu khá tốt các mô tả bằng ngôn ngữ tự nhiên. Tuy nhiên, việc học các thuật ngữ kỹ thuật (sử dụng [tham khảo ngôn ngữ quay phim](#vũ khí bí mật của ngôn ngữ quay phim) ở trên) sẽ mang lại kết quả tốt hơn rõ rệt, vì mô hình AI được huấn luyện bằng các video được mô tả bằng các thuật ngữ chuyên môn này.
Có nên bao gồm từ gợi ý ngược (không muốn gì) không?
Một số nền tảng hỗ trợ các từ khóa ngược - các hướng dẫn về những điều cần tránh. Chúng có thể hữu ích: Không có lớp phủ văn bản, không có dấu watermark, không có khung hình mờ. Tuy nhiên, hầu hết các trình tạo video AI hiện đại xử lý các vấn đề về chất lượng tốt hơn thông qua các chỉ định tích cực. Thay vì viết "không có ánh sáng xấu", hãy viết "ánh sáng Rembrandt từ camera bên trái". Thay vì viết "không có cảnh quay rung lắc", hãy viết "chuyển động steadicam mượt mà". Lời nhắc tích cực hướng AI đến những gì bạn muốn; lời nhắc tiêu cực chỉ cho nó biết những gì cần tránh, để lại các lựa chọn thay thế cho sự ngẫu nhiên.
Làm thế nào để duy trì tính nhất quán của nhân vật giữa nhiều từ gợi ý?
Giữ tính nhất quán của nhân vật qua nhiều lần tạo video AI là một trong những thách thức khó khăn nhất trong việc viết lời nhắc. Ba chiến lược sau đây có thể giúp ích: (1) Sử dụng mô tả nhân vật cực kỳ cụ thể và lặp lại từng từ giữa các lời nhắc — một phụ nữ ở độ tuổi cuối 20, người Nhật, tóc đen dài, áo khoác len than oversized, áo len cổ lọ màu kem. (2) Sử dụng quy trình làm việc tạo video từ hình ảnh - tải lên hình ảnh tham chiếu nhân vật để AI tạo hoạt hình. Seedance hỗ trợ tính năng này thông qua tham chiếu @Image. (3) Tạo tất cả các đoạn video của cùng một nhân vật trong một phiên duy nhất, sử dụng cùng một hạt giống hoặc cài đặt phong cách.
Có công cụ nào có thể giúp tôi viết lời nhắc video không?
Có. [Trình tạo từ khóa video] của Seedance chấp nhận mô tả bằng ngôn ngữ tự nhiên và tạo ra từ khóa phân cảnh có cấu trúc hoàn chỉnh, bao gồm ngôn ngữ chuyển động máy quay, dòng thời gian, ánh sáng và thiết kế âm thanh. Hướng dẫn sử dụng chi tiết, vui lòng tham khảo Hướng dẫn sử dụng trình tạo từ khóa video AI. Quy trình làm việc được khuyến nghị: Tạo bằng AI → Tối ưu hóa thủ công → Tạo video.
Bắt đầu viết lời nhắc video hay hơn ngay bây giờ
Bạn hiện đã sở hữu bộ công cụ hoàn chỉnh: công thức bảy yếu tố, tài liệu tham khảo ngôn ngữ quay phim bao gồm hơn 15 cách quay phim, thư viện từ khóa bốn chiều bao gồm hơn 50 thuật ngữ, năm ví dụ tiến bộ từ cơ bản đến cấp độ điện ảnh, phương pháp thiết kế âm thanh, và kỹ thuật tối ưu hóa dành riêng cho nền tảng.
Sự khác biệt giữa sản phẩm video AI nghiệp dư và chuyên nghiệp không nằm ở công cụ, mà nằm ở từ khóa. Viết từ khóa là một kỹ năng có thể cải thiện qua quá trình luyện tập.
Ba cách bắt đầu:
-
Thực hành công thức. Chọn bất kỳ chủ đề nào, viết ra các phiên bản V1 → V2 → V3. So sánh kết quả đầu ra. Sự cải thiện sẽ là tức thì và đáng kể.
-
Sử dụng trình tạo từ khóa. Để AI xử lý cấu trúc, sau đó áp dụng kiến thức về góc quay và không khí của bạn để tối ưu hóa kết quả. Thử nghiệm trình tạo từ khóa video →
-
Tạo video đầu tiên của bạn. Hãy lấy những từ khóa tốt nhất của bạn và bắt đầu tạo video ngay bây giờ.Mở trình tạo video →
Thêm gợi ý từ khóa và ví dụ sẵn sàng sử dụng:
- 10 từ gợi ý video AI hữu ích — Từ gợi ý đã được thử nghiệm, kèm theo các phiên bản V1→V2→V3
- Hướng dẫn đầy đủ về Text to Video AI — Hiểu công nghệ đằng sau công cụ
- Hướng dẫn tạo từ khóa video AI — Để AI giúp bạn viết từ khóa
- Hướng dẫn từ khóa Seedance — Hơn 50 từ khóa dành riêng cho Seedance
Video AI tốt nhất mà bạn sẽ tạo ra bắt đầu từ từ khóa tiếp theo mà bạn viết.

