TL;DR
优秀的AI视频源于优秀的提示词。本指南教你一套通用视频提示词公式——一个七要素框架,适用于所有主流AI视频平台:
[主体] + [动作] + [环境] + [运镜] + [光影] + [风格] + [声音]
你将学到:大多数提示词失败的原因(以及如何秒修)、包含15种以上运镜方式的完整运镜语言参考、按光影/色调/质感/情绪四大维度整理的氛围关键词库、五个从基础到电影级的提示词进阶示例、如何在提示词中加入声音设计、以及针对 Seedance、Sora、可灵(Kling)、Runway 和 Veo 3 的平台优化技巧。
这不是工具教程——这是一套方法论。视频提示词写作技能可以跨平台迁移,学会一次,到处适用。

同一个概念,截然不同的结果。左侧提示词写着"一个女人在雨中走路"。右侧提示词指定了运镜、光影方向、氛围和声音——AI模型以电影级品质回应。
为什么大多数AI视频提示词会失败(以及如何修复)
无论使用哪个AI视频生成器——Seedance、Sora、可灵、Runway、Veo 3——核心原理相同:文本输入越精确、结构越完整,输出就越可控、越接近电影品质。大多数人写提示词就像在跟朋友描述一张照片,但视频不是照片。视频有运动、时间、镜头行为、氛围演进和声音。
以下是提示词失败的五大常见原因,每个都附有即时修复方案。
1. 太模糊——"美丽日落"问题
最常见的提示词失败。你写下"海边的美丽日落",得到一个技术上准确但情感空洞的片段,看起来像股票屏保。
问题不在于AI不能渲染日落,而在于"美丽"和"日落"是你给它的全部信息。AI在训练数据中见过数百万个日落,它会挑选统计平均值——而平均值,本质上就是平庸。
| 修改前 | 修改后 |
|---|---|
| A beautiful sunset over the ocean(海边的美丽日落) | Golden hour light spills across a calm Pacific shore, waves lapping at volcanic rock, sun sitting two finger-widths above the horizon, sky gradient shifting from deep amber at the horizon through salmon pink to pale lavender at the zenith, long shadows stretching toward camera(黄金时段的光线洒在平静的太平洋海岸,海浪拍打火山岩,太阳悬在地平线上方两指宽的位置,天空从地平线处的深琥珀色渐变到三文鱼粉再到天顶的淡紫色,长长的影子朝镜头延伸) |
修复方法:用具体的可观察细节替换形容词("美丽""惊人""震撼")——颜色、位置、纹理、空间关系。
2. 没有运动指令——静态图片问题
你写了一个细节丰富的场景描述,AI却生成了一个看起来像照片加轻微推拉的画面——因为你描述的是一个瞬间,而不是一个运动。
视频是时间性的。没有明确的运动指令,AI会默认采用最保守的解读:缓慢推进或轻微视差。技术上这确实是"视频",但不是你想要的。
| 修改前 | 修改后 |
|---|---|
| A vintage red sports car parked on a mountain road, misty morning, cinematic(一辆复古红色跑车停在山路上,薄雾清晨,电影感) | A vintage red Porsche 911 accelerates through a winding mountain road, tires gripping wet asphalt, mist parting around the car body, camera tracking alongside at bumper height, trees blurring past in the foreground(一辆复古红色保时捷911在蜿蜒山路上加速,轮胎紧抓湿润柏油路面,雾气在车身周围分开,镜头在保险杠高度平行跟拍,前景树木虚化掠过) |
修复方法:每个视频提示词至少需要一个描述主体物理运动的动词和一个描述镜头运动的短语。主体在动,镜头也在动——两者共同创造视觉能量。
3. 矛盾的指令——"特写+远景"悖论
这种情况比你想象的常见,尤其是当人们串联一些听过但并不完全理解的电影术语时。"女人穿越广阔沙漠的极端特写,大全景,史诗感"包含两个互相矛盾的构图指令。AI会试图取平均值,产生一个既不近也不远、只是混乱的画面。
| 修改前 | 修改后 |
|---|---|
| Close-up of a woman walking through a vast desert, wide establishing shot, epic scale(女人穿过广阔沙漠的特写,大全景,史诗感) | Extreme close-up of a woman's eyes reflecting desert light, sand particles catching golden hour sun on her eyelashes, shallow depth of field with the vast dune field blurred into an amber gradient behind her(女人眼睛的极端特写,眼中映射着沙漠的光,沙粒在她的睫毛上捕捉黄金时段的阳光,浅景深使广阔的沙丘在身后虚化为琥珀色渐变) |
修复方法:每个镜头选择一个机位。如果你需要特写和远景,就写两个单独的镜头并用转场连接。对于多镜头序列,Seedance等平台支持分镜时间轴格式,让你可以独立指定每个镜头。
4. 缺少氛围——光影和情绪的空白
你的提示词描述了一个主体在某个地点做某个动作。这覆盖了七个维度中的三个。没有光影、色调、大气效果和风格指引,AI就会用中性默认值填充空白:平坦均匀的光照、暗淡的颜色、没有特定的情绪。结果看起来像高清监控画面。
| 修改前 | 修改后 |
|---|---|
| A man sitting alone in a coffee shop(一个男人独自坐在咖啡馆里) | A man in his 40s sits alone in a dimly lit corner booth, warm amber light from a single pendant lamp catching the steam rising from his coffee cup, rain streaking down the window behind him casting rippled shadow patterns across his face, muted teal-and-copper color palette, melancholic atmosphere(一个四十多岁的男人独自坐在灯光昏暗的角落卡座,一盏吊灯的暖琥珀色灯光捕捉着咖啡杯升起的蒸汽,身后窗户上的雨水条纹在他脸上投射出波纹状的影子图案,暗青铜色调,忧郁的氛围) |
修复方法:加上光源方向、色温、大气效果(雾、雨、灰尘、蒸汽)和情绪词。这四项补充将"一个场景"变成"一种感觉"。
5. 没有声音设计——无声电影问题
2026年大多数AI视频平台都支持音频生成——背景音乐、环境音效,甚至对话和口型同步。但大多数人写出的提示词完全静默,因为他们只把视频提示词当作视觉指令。
声音占据了体验的一半。没有鸟鸣和树叶沙沙声的森林场景感觉虚假。没有撞击音效的动作场景感觉轻飘飘。没有音乐的产品展示感觉像PPT。
| 修改前 | 修改后 |
|---|---|
| A cat jumping from a bookshelf and landing on a sofa(一只猫从书架跳到沙发上) | A ginger cat leaps gracefully from the top of a tall oak bookshelf, body stretching mid-air, landing softly on a velvet sofa cushion that compresses under its weight. Sound: soft paw impact on fabric, a single book sliding on the shelf, quiet ambient room tone with distant rain against windows(一只橘猫优雅地从高大橡木书架顶部跃起,身体在空中舒展,轻柔地落在天鹅绒沙发垫上,垫子在它的重量下微微压缩。声音:爪子轻拍布料的柔和撞击声,一本书在架子上滑动的声音,安静的室内环境音伴着远处窗外的雨声) |
修复方法:在提示词末尾加一行声音说明,指定背景音乐风格、环境音效和任何对话或旁白。我们在下文的声音设计部分有详细介绍。
通用视频提示词公式
无论你使用哪个平台,每个有效的视频提示词都包含相同的七个要素。有些要素是必需的(每个提示词都需要),有些是可选的(能提升效果但没有也能用)。公式:
[主体 Subject] + [动作 Action] + [环境 Environment] + [运镜 Camera] + [光影 Lighting] + [风格 Style] + [声音 Sound]

通用视频提示词公式的七大要素。每个要素都为最终输出增加一个维度的控制力。
下面逐一拆解每个要素,附带关键词库和示例短语。
要素一:主体 Subject(必需)
主体是观众注视的对象。这应该是提示词中最具体的部分——不是"一个女人",而是"一个六十多岁的女人,银色头发松散地挽成发髻,眼角有深深的笑纹,穿着一条褪色的牛仔围裙"。
关键词库:
| 类别 | 示例(英文提示词) |
|---|---|
| 人物 | a young man in his 20s, an elderly woman, a child around age 5, a dancer, a chef, a soldier |
| 动物 | a golden retriever, a snow leopard, a hummingbird, a koi fish, a monarch butterfly |
| 物品 | a vintage typewriter, a crystal perfume bottle, a leather-bound journal, a ceramic vase |
| 载具 | a matte-black motorcycle, a wooden sailboat, a weathered pickup truck, a bullet train |
| 抽象 | particles of light, ink droplets in water, geometric shapes, liquid metal |
示例短语:
A barista in her 30s with tattoo sleeves and a flour-dusted black apron(一个三十多岁的咖啡师,袖上有纹身,黑色围裙上沾着面粉)A weathered bronze compass lying open on a nautical chart(一个磨损的青铜指南针打开放在航海图上)Thousands of paper lanterns, each glowing warm amber from a candle inside(数千盏纸灯笼,每盏内部蜡烛发出暖琥珀色光芒)
要素二:动作 Action(必需)
动作是发生的事——主体在做什么以及场景如何随时间演进。这就是视频提示词和图片提示词的分界线。没有动作,你得到的只是一张会动的照片。
关键词库:
| 运动类型 | 示例(英文提示词) |
|---|---|
| 人体运动 | walking, running, turning slowly, reaching out, leaning forward, exhaling, blinking |
| 相对镜头的运动 | approaching camera, walking away from camera, crossing frame left to right |
| 物体运动 | rotating, falling, floating, shattering, assembling, unfolding, melting |
| 环境运动 | wind moving through grass, clouds rolling, rain falling, leaves drifting, tide coming in |
| 变化过程 | day turning to night, flower blooming, ice forming, paint spreading, light shifting |
示例短语:
Slowly reaches down and picks up a fallen autumn leaf, turning it in her fingers(慢慢弯腰捡起一片落下的秋叶,在指间翻转)The compass needle trembles, then swings decisively north(指南针指针颤动,然后果断地指向北方)Lanterns lift off one by one from the ground, rising into the dark sky at different speeds(灯笼从地面一个接一个地升起,以不同速度升入暗空)
要素三:环境 Environment(必需)
环境是场景发生的地方。描述即时场景(前景)和更广的背景。在相关时包含天气、时间和季节。
关键词库:
| 场景类型 | 示例(英文提示词) |
|---|---|
| 自然 | dense forest, desert dunes, ocean cliff, alpine meadow, volcanic beach, bamboo grove |
| 城市 | narrow Tokyo alley, brutalist concrete plaza, rooftop garden, subway platform, neon-lit avenue |
| 室内 | candlelit library, industrial loft, greenhouse conservatory, vintage darkroom, marble atrium |
| 奇幻 | floating islands, crystal cavern, bioluminescent reef, ruined temple, cloud city |
| 时间/天气 | pre-dawn twilight, overcast midday, thunderstorm, first snow, humid summer evening |
示例短语:
In a narrow Kyoto side street, stone lanterns lining both sides, cherry blossom petals drifting across wet cobblestones(在京都一条狭窄的小巷中,两侧排列着石灯笼,樱花花瓣飘过湿润的鹅卵石路面)Inside a cavernous abandoned cathedral, shafts of dusty light piercing through broken stained glass(在一座巨大的废弃大教堂内,尘埃中的光柱穿透破碎的彩色玻璃窗)On the edge of a volcanic cliff at blue hour, sulfurous steam rising from cracks in the black rock(蓝色时刻,火山悬崖边缘,硫磺蒸汽从黑色岩石的裂缝中升起)
要素四:运镜 Camera(重要)
运镜指令告诉AI观众如何观看场景,包括构图(多近)、角度(从哪里看)和运动(视角如何随时间变化)。运镜语言是提升提示词质量最关键的杠杆——我们在下方的专门章节中有深入介绍。
快速关键词库:
| 方面 | 英文术语及中文对照 |
|---|---|
| 构图 Framing | extreme close-up(极端特写), close-up(特写), medium shot(中景), full shot(全景), wide shot(远景), extreme wide shot(大远景) |
| 角度 Angle | eye level(平视), low angle(仰角), high angle(俯角), bird's eye(鸟瞰), worm's eye(蚁视角), Dutch angle(荷兰角/倾斜角) |
| 运动 Movement | dolly in/out(推/拉), pan left/right(水平摇), tilt up/down(垂直摇), tracking shot(跟拍), orbit(环绕), crane(升降) |
| 镜头 Lens | 24mm wide angle(广角), 50mm standard(标准), 85mm portrait(人像), 200mm telephoto(长焦), macro lens(微距), anamorphic(变形宽银幕) |
要素五:光影 Lighting(重要)
光影定义每一帧的情绪。专业摄影师会花数小时布光。在提示词写作中,几个精准的词就能获得同样的控制力。
关键词库:
| 光影类型(英文/中文) | 视觉效果 |
|---|---|
| Golden hour 黄金时段 | 温暖、长阴影、橙琥珀色调、人像非常好看 |
| Blue hour 蓝色时刻 | 冷调、忧郁、深蓝天空,地平线残留暖色 |
| Backlit 逆光/背光 | 边缘发光、剪影效果、与背景强烈分离 |
| Side light 侧光 | 面部一半亮一半暗,高对比,戏剧感 |
| Rembrandt lighting 伦勃朗光 | 阴影侧眼下出现三角形亮区,经典肖像感 |
| Volumetric 体积光 | 可见光束穿透灰尘、雾气或烟雾 |
| Tyndall effect 丁达尔效应 | 光在微粒中散射,雾气或尘埃中出现明确光束 |
| Neon 霓虹光 | 彩色人造光源、湿面反射、赛博朋克美学 |
要素六:风格 Style(推荐)
风格告诉AI使用什么视觉语言——电影胶片、纪录片写实、动漫、油画或其他。没有风格声明,AI会默认使用通用写实风格。
关键词库:
| 风格(英文/中文) | 视觉特征 |
|---|---|
| Cinematic 电影感 | 浅景深、胶片色彩分级、2.39:1宽银幕感 |
| Documentary 纪录片 | 手持镜头感、自然光、观察性构图 |
| Commercial 商业广告 | 干净、明亮、产品聚焦、精确布光、丝滑运动 |
| Anime 动漫 | 赛璐珞风格、鲜艳色彩、夸张运动、动态线条 |
| Film noir 黑色电影 | 高对比黑白、百叶窗阴影、低调照明 |
| Ink wash 水墨 | 黑墨在白底上、流动的渐变、极简、东方美学 |
| Vintage film 复古胶片 | 胶片颗粒感、略微减饱和、暖色调、柔焦边缘 |
| Cyberpunk 赛博朋克 | 霓虹灯浸染、高对比、全息元素、都市末世感 |
要素七:声音 Sound(可选)
声音添加听觉维度。并非所有平台都支持音频生成,但在提示词中加入声音设计不仅面向未来,还往往能提升视觉效果——因为AI会利用音频线索来影响视觉的情绪和节奏。
关键词库:
| 声音类型 | 示例(英文提示词) |
|---|---|
| 音乐风格 | orchestral(管弦乐), lo-fi hip hop, ambient electronic(氛围电子), jazz piano, acoustic guitar, cinematic score(电影配乐) |
| 环境音效 | rain on glass(雨打窗玻璃), wind through trees(风穿树林), city traffic hum(城市交通声), ocean waves(海浪), fire crackling(篝火噼啪声) |
| 动作音效 | footsteps on gravel(脚步踩碎石声), door creaking(门吱呀声), glass shattering(玻璃破碎), engine revving(引擎轰鸣) |
| 人声 | whispered narration(耳语旁白), dialogue(对话), breathing(呼吸声), laughter(笑声) |
运镜语言:秘密武器
运镜语言是你作为视频提示词写作者能培养的最具影响力的技能。当你写 dolly in slowly(缓慢推进)而不是 zoom in(放大),你说的是AI模型的原生词汇——因为这些模型是在数百万小时的专业拍摄视频上训练的,那些视频中的镜头运动有特定的名称和特定的视觉效果。
这一部分是你的综合参考手册。建议收藏。

镜头运动不是可以互换的——每种都产生独特的情感效果。知道正确的术语会彻底改变你的提示词效果。
核心运镜
Dolly In / Dolly Out(推镜头 / 拉镜头)
镜头物理地向主体移近(推进)或远离(拉出)。与变焦不同,透视关系会改变——前景物体按比例增大,创造深度感和物理接近感。
- 情感效果: 推进创造亲密感、聚焦、揭示。拉出创造孤独感、语境、离别。
- 何时使用: 推进用于情感特写、角色时刻、揭示细节。拉出用于展示规模、结尾、从主体撤离。
- 提示词短语:
Camera dollies in slowly from medium shot to extreme close-up on the subject's hands(镜头从中景缓慢推进到主体手部的极端特写)
Pan Left / Pan Right(水平摇镜)
镜头保持原地不动,水平旋转,像转动你的头。视角扫过场景。
- 情感效果: 巡视、发现、横向跟随动作、连接场景中的两个元素。
- 何时使用: 展示风景、跟随行走的角色、展示空间的广度。
- 提示词短语:
Slow pan right across the workshop, revealing rows of handcrafted instruments on the wall(缓慢向右摇镜扫过工作坊,展示墙上一排排手工制作的乐器)
Tilt Up / Tilt Down(垂直摇镜/俯仰)
镜头保持原地不动,垂直旋转——像点头一样。上摇展示高度;下摇展示地面细节。
- 情感效果: 上摇创造敬畏、壮阔、向往。下摇创造落地感、发现、对表面的亲近。
- 何时使用: 上摇用于高大建筑、角色站起、展示天空。下摇用于揭示桌上物品、从天空过渡到地面。
- 提示词短语:
Camera tilts up from the roots of the ancient tree, following the massive trunk to the canopy(镜头从古树根部上摇,沿着巨大的树干到达树冠)
Tracking Shot(跟拍/侧跟镜头)
镜头在主体旁边移动,保持相同的距离和角度,仿佛安装在与主体路径平行的导轨上。
- 情感效果: 陪伴感、旅程、沉浸。观众与主体一同旅行。
- 何时使用: 跟随行走或奔跑的角色、穿越空间、沿表面展示产品。
- 提示词短语:
Camera tracks alongside the runner at shoulder height, keeping pace as she sprints through the alley(镜头在肩膀高度平行跟拍奔跑者,保持与她在巷子中冲刺的速度一致)
Orbit / Arc(环绕镜头)
镜头围绕主体旋转,同时保持主体在画面中心。可以是完整的360度环绕或部分弧线。
- 情感效果: 英雄感、力量感、展示感、三维立体展示。
- 何时使用: 产品展示(展示所有角度)、英雄镜头、戏剧性角色介绍、决定性时刻。
- 提示词短语:
Camera orbits 180 degrees around the chess player, starting from behind and ending face-on(镜头围绕棋手180度环绕,从背后开始到正面结束)
Crane Up / Crane Down(升降镜头/摇臂镜头)
镜头垂直移动——物理地上升或下降——通常结合俯仰来保持主体在画面内。
- 情感效果: 上升创造超越感、解放感、视野拓展。下降创造落地感、到达感、注意力聚焦。
- 何时使用: 上升用于结尾、胜利时刻、过渡到航拍视角。下降用于开始、到达、从全景过渡到亲密构图。
- 提示词短语:
Camera cranes up from ground level, rising above the crowd, revealing the full scale of the festival(镜头从地面上升,升高到人群之上,展示节日的全部规模)
Handheld(手持镜头)
镜头有微妙的有机晃动——没有安装在三脚架或稳定器上。模拟人类摄影师手持的感觉。
- 情感效果: 即时感、紧迫感、纪录片真实感、紧张、亲近。
- 何时使用: 动作场景、情感对话、纪录片风格、恐怖片、任何需要身临其境感觉的场景。
- 提示词短语:
Handheld camera follows the character through the crowded market, slightly unsteady(手持镜头跟随角色穿过拥挤的市场,略有不稳)
Steadicam / Gimbal(斯坦尼康/稳定器镜头)
平滑、悬浮式的镜头运动,在空间中滑行。不像手持镜头那样有晃动——运动流畅而连续。
- 情感效果: 梦幻、优雅、沉浸、轻松探索。
- 何时使用: 穿越建筑空间、跟随角色穿过复杂环境、一镜到底、奢侈品和美感镜头。
- 提示词短语:
Steadicam glides behind the dancer as she moves through the empty ballroom(斯坦尼康在舞者身后滑行,跟随她穿过空旷的舞厅)
进阶运镜技术
Hitchcock Zoom 希区柯克变焦(Dolly Zoom / Vertigo Effect 眩晕效果)
镜头推进的同时拉远焦距(或反之)。主体保持相同大小但背景剧烈变形——拉伸或压缩。
- 情感效果: 迷失方向、顿悟、恐惧、世界在固定点周围移动。
- 提示词短语:
Dolly zoom on the character's face — camera pushes in as the lens zooms out, background stretching away, creating a vertigo effect
Whip Pan 甩镜头
极快的水平摇移,在运动过程中整个画面模糊。常用作两个场景之间的转场。
- 情感效果: 能量、惊喜、紧迫、喜剧节奏。
- 提示词短语:
Whip pan from the speaker's face to the audience's reaction, motion blur during the transition
Rack Focus 焦点转移(Pull Focus 拉焦)
焦点在单个镜头内从一个深度平面转移到另一个。前景变模糊而背景变清晰,或反之。
- 情感效果: 重新引导注意力、揭示信息、连接前景和背景元素。
- 提示词短语:
Rack focus from the blurred foreground flowers to the woman's face in the background
Dutch Angle 荷兰角(倾斜角度)
镜头沿横滚轴倾斜,创造对角线地平线。世界看起来歪斜了。
- 情感效果: 不安、不稳定、紧张、风格化戏剧、疯狂。
- 提示词短语:
Dutch angle close-up of the detective's face, 15-degree tilt, harsh side lighting
Speed Ramp 变速(Time Ramping 时间变速)
播放速度在单个镜头内变化——通常在关键时刻减速,然后再加速。
- 情感效果: 强调、冲击力、给特定时刻赋予戏剧性重量。
- 提示词短语:
Motion ramps to slow motion at the moment of impact, then accelerates back to real time
One-Take 一镜到底(Long Take 长镜头)
连续拍摄不剪辑。镜头穿过空间、跟随动作、发现元素,全程不切换角度。
- 情感效果: 沉浸、实时体验、技术精湛感、持续建立紧张。
- 提示词短语:
Continuous one-take shot: camera enters through the front door, glides through the hallway, and arrives at the garden
First Person / POV 第一人称视角
镜头代表角色的眼睛。观众看到角色看到的,包括他们的手进入画面。
- 情感效果: 最强沉浸感、主观体验、游戏美学。
- 提示词短语:
First-person POV: hands push open a heavy wooden door, revealing a sunlit meadow
关于Seedance特有的运镜控制以及如何在分镜时间轴中组合使用,请参阅 Seedance提示词指南。
氛围关键词库
氛围是将技术上正确的视频转化为情感共鸣作品的关键。它是"一个房间"和"一个让你有感觉的房间"之间的差别。本关键词库按四个维度整理——光影、色调、质感和情绪——让你可以混搭组合,精确创造你想要的感觉。

氛围关键词库:从每个维度各选一个关键词,定义你视频的情感签名。
光影关键词
光影是氛围的基础。改变提示词中的光影可以在保持其他所有元素不变的情况下,完全改变情绪。
| 关键词(英文/中文) | 视觉效果 | 适用场景 |
|---|---|---|
| Golden hour 黄金时段 | 温暖琥珀光、柔和长阴影、讨好的肤色 | 浪漫、怀旧、旅行、美妆 |
| Blue hour 蓝色时刻 | 深蓝环境光,地平线残留暖色 | 忧郁、沉思、过渡、都市情绪 |
| Backlit 逆光 | 主体被后方光源勾勒,面部阴影或剪影 | 戏剧、神秘、英雄镜头、美感 |
| Side light 侧光 | 强方向光从一侧照射,一半亮一半暗 | 紧张、人物特写、戏剧性肖像 |
| Rembrandt lighting 伦勃朗光 | 经典肖像光——一侧亮,暗侧眼下有小三角形亮区 | 肖像、优雅、古典氛围 |
| Volumetric 体积光 | 可见光束穿过灰尘、雾气或烟雾 | 神圣感、戏剧、森林场景、舞台光 |
| Tyndall effect 丁达尔效应 | 光在细微粒子中散射,雾气中形成明确光束 | 自然、清晨场景、空灵、梦幻 |
| Neon 霓虹光 | 人造彩色光源,常为粉、蓝、青、品红 | 赛博朋克、夜生活、都市、当代 |
| Candlelight 烛光 | 温暖、闪烁、橙琥珀色点光源 | 亲密、历史、晚餐场景、温馨 |
| Silhouette 剪影 | 主体完全暗化,仅由轮廓在明亮背景前定义 | 神秘、匿名、视觉冲击、叙事 |
| Bioluminescent 生物荧光 | 自发光有机光源,通常为蓝绿色 | 奇幻、水下、外星世界、梦幻 |
色调关键词
色调设定整个画面的情感温度。暖色调感觉亲切;冷色调感觉疏离。高饱和感觉活力;低饱和感觉含蓄。
| 关键词(英文/中文) | 视觉效果 | 情感联系 |
|---|---|---|
| Warm palette 暖色调 | 琥珀、橙、金、偏红色调主导 | 舒适、怀旧、亲密、秋天 |
| Cool palette 冷色调 | 蓝、青、青石色调主导 | 距离、平静、悲伤、冬天、科技 |
| High saturation 高饱和 | 鲜艳、浓烈、强烈的颜色 | 能量、青春、奇幻、流行文化 |
| Desaturated 低饱和 | 柔和、褪色、粉彩般的颜色 | 忧郁、写实、回忆、复古 |
| Teal and orange 青橙调 | 经典电影色彩分级——暗影偏青、高光偏暖 | 好莱坞大片、商业、电影感 |
| Cyberpunk palette 赛博朋克色调 | 霓虹粉、电光蓝、深紫对暗色背景 | 未来感、夜生活、数字、前卫 |
| Vintage 复古 | 略微褪色、暖色调倾向、提亮的暗部 | 怀旧、70-80年代、独立电影、回忆 |
| Earth tones 大地色 | 棕、绿、赭石、赤陶 | 自然、扎根感、有机、纪录片 |
| Kodachrome 柯达克罗姆 | 浓郁的红绿、温暖肤色、深黑 | 新闻摄影、1960-70年代、美国风情 |
质感/画质关键词
质感关键词定义视频的视觉表面——它看起来像35mm胶片、精致的广告、纪录片还是油画。
| 关键词(英文/中文) | 视觉效果 | 适用场景 |
|---|---|---|
| Cinematic 电影感 | 宽画幅感、浅景深、胶片色彩 | 叙事、戏剧、故事 |
| Documentary 纪录片 | 自然光、略有不完美的构图 | 写实、新闻、教育 |
| Commercial 商业广告 | 干净、明亮、精确布光、丝滑运镜 | 产品展示、广告、企业 |
| Film grain 胶片颗粒 | 有机噪点纹理覆盖在画面上 | 复古、模拟、独立、温暖 |
| Anamorphic 变形宽银幕 | 水平镜头光晕、椭圆形散景、轻微边缘畸变 | 电影戏剧、科幻、史诗感 |
| Oil painting texture 油画质感 | 可见的笔触纹理、丰富的厚涂感 | 艺术、奇幻、梦境、古典 |
| Ink wash 水墨 | 黑墨渐变在白底上、流动有机 | 东方美学、极简、宁静 |
| 8mm / Super 8 | 重颗粒、漏光、不稳定画面、褪色 | 回忆、闪回、家庭录像、怀旧 |
情绪关键词
情绪关键词是你给AI的情感方向。它们影响一切——节奏、色彩选择、镜头行为和整体感觉。
| 关键词(英文/中文) | 唤起的情感 | 搭配建议 |
|---|---|---|
| Cozy 温馨 | 温暖、舒适、安全、家 | 烛光、暖色调、室内场景 |
| Tense 紧张 | 焦虑、期待、即将发生的事 | 侧光、手持镜头、紧密构图 |
| Suspenseful 悬疑 | 恐惧、不确定、缓慢积累 | 低调灯光、缓慢推进、低饱和 |
| Joyful 欢乐 | 幸福、庆祝、轻盈 | 黄金时段、高饱和、远景 |
| Melancholic 忧郁 | 悲伤、渴望、悲伤中的美 | 蓝色时刻、冷色调、慢动作 |
| Epic 史诗 | 宏大、英雄、令人敬畏 | 广角、升降镜头、管弦乐 |
| Healing 治愈 | 平和、恢复、温柔修复 | 柔光、粉彩、自然、慢节奏 |
| Horror 恐怖 | 恐惧、怪异、不安 | 深阴影、荷兰角、低饱和、寂静 |
| Romantic 浪漫 | 爱、渴望、温柔、亲密 | 逆光、暖色调、浅景深、特写 |
| Energetic 活力 | 速度、兴奋、肾上腺素 | 甩镜、变速、高饱和、广角 |
| Nostalgic 怀旧 | 对过去的渴望、苦乐参半的回忆 | 胶片颗粒、复古色调、过曝高光 |
氛围关键词组合:三个示例
真正的力量来自于从每个维度各选一两个关键词进行组合。以下三种组合对同一个主体——"一个女人站在窗前"——产生截然不同的氛围:
组合一:温暖怀旧
Golden hour backlighting, warm palette with amber and honey tones, film grain texture, nostalgic mood
组合二:冷冽紧张
Side light from a single source, cool teal palette, clean digital texture, tense mood
组合三:空灵梦幻
Tyndall effect light beams through sheer curtains, pastel palette, watercolor texture, healing mood
同一主体,三个截然不同的视频。氛围关键词就是控制面板。
从一句话到电影级提示词:5个进阶示例
学习提示词写作最好的方式是看提示词的进化过程。下面每个示例从基础V1(大多数人写的那种)开始,改进到V2(增加具体性和运镜),最终达到V3(完全指定的电影级提示词)。注意每个层级发生了什么变化以及为什么。
更多即用型视频提示词示例,请参阅 10个实用AI视频提示词。

提示词进化实战。V1几乎不给AI任何信息。V3给它一切——效果天差地别。
示例1:人像/情绪 —— "雨中行走的女人"
V1 — 基础版(18词)
A woman walking in the rain at night in a city, cinematic, beautiful你会得到:一个通用的女人、通用的城市、通用的雨、平坦的灯光、没有情感共鸣。AI用统计平均值填充每一个空白。
V2 — 改进版(62词)
A young Asian woman in a long dark coat walks slowly through a rain-soaked Tokyo backstreet at night. Neon signs reflect in the wet pavement, casting pink and blue light. She carries a transparent umbrella. Camera tracks beside her at shoulder height. Shallow depth of field. Melancholic mood.改进了什么:具体的主体身份、具体的地点、具体的光源、镜头位置、情感方向。AI现在有足够信息生成独特的画面。
V3 — 电影级(138词)
A woman in her late 20s, Japanese, long black hair partially wet and clinging to her neck, wearing an oversized charcoal wool coat over a cream turtleneck, walks alone through a narrow Shinjuku backstreet at 2am. Rain falls in fine sheets, catching neon light from izakaya signs overhead — warm amber kanji characters and cold blue beer advertisements. The wet asphalt mirrors everything, creating a double world beneath her feet. She carries a transparent vinyl umbrella, water beading and streaming down its surface.
Camera: tracking shot at shoulder height, moving alongside her at walking pace, shallow depth of field at f/1.4, foreground rain droplets occasionally crossing the lens out of focus.
Lighting: practical neon sources only — no fill light. Rim light from signs behind her outlines her coat collar and umbrella edge. Her face catches intermittent warm light as she passes each shopfront.
Style: cinematic, Kodak Vision3 500T film stock, slight grain, teal-and-amber color grade, Wong Kar-wai atmosphere.
Sound: rain on umbrella surface, distant muffled jazz from a bar, her footsteps on wet stone, no dialogue, no music score.(一个二十多岁的日本女性,长黑发部分湿透贴在脖子上,穿着超大号碳灰色羊毛大衣内搭奶油色高领毛衣,凌晨2点独自走在新宿狭窄的小巷中。细密的雨丝在空中捕捉着头顶居酒屋招牌的霓虹光——暖琥珀色的日文字符和冷蓝色的啤酒广告。湿润的柏油路面映射着一切,在她脚下创造出一个镜像世界。她撑着一把透明塑料伞,水珠在伞面上凝结并流淌。)
V3之所以有效:公式的每个要素都被指定了。AI没有猜测的空间——当AI不猜测时,它精确渲染你描述的内容。
示例2:产品展示 —— "桌上的手表"
V1 — 基础版(14词)
A luxury watch sitting on a table, product shot, high quality, 4KV2 — 改进版(58词)
A stainless steel dive watch with a dark blue dial rests on a slab of raw gray marble. Camera orbits slowly around the watch, 15 degrees above. Single key light from the upper left creates a defined shadow. The watch's crystal catches the light and creates a brief flare. Commercial style, clean background.V3 — 电影级(126词)
A stainless steel dive watch with a sunburst navy-blue dial and ceramic bezel sits on a rough-cut block of Carrara marble, positioned at the golden-ratio intersection of the frame. The second hand sweeps continuously. Micro water droplets bead on the crystal surface and the steel bracelet links, catching light.
Camera: begins in macro extreme close-up on the dial — the indices and lume dots fill the frame — then slowly dollies out while simultaneously orbiting clockwise, completing a 270-degree arc over 8 seconds until the full watch and marble base are revealed in a three-quarter beauty shot.
Lighting: single hard key light at 10 o'clock position, 45 degrees above. No fill — deep shadows on the right side. A subtle rim light from behind separates the watch from the dark charcoal background.
Style: high-end commercial, ultra-sharp 8K downscaled to 4K, zero grain, clinical precision. Color: cool steel tones with warm gold accents from the lume.
Sound: near silence — only the faint mechanical tick of the movement, a single clean chime at the flare moment.(一块不锈钢潜水表,太阳纹海军蓝表盘配陶瓷表圈,放在一块粗切的卡拉拉大理石上,位于画面的黄金分割交叉点。秒针持续走动。微小水滴在水晶表面和钢链节上凝结,捕捉光线。)
示例3:风景旅行 —— "日出的山脉"
V1 — 基础版(12词)
Beautiful mountains at sunrise, drone shot, epic landscape, cinematicV2 — 改进版(55词)
Snow-capped mountain peaks emerging from a sea of clouds at sunrise. The first rays of sun paint the peaks golden while the valleys remain in blue shadow. Camera cranes up slowly from the cloud layer, revealing the full mountain range. Wide angle, epic scale, warm-to-cool color gradient.V3 — 电影级(134词)
The Dolomites at sunrise in late autumn. Jagged limestone spires — the Tre Cime di Lavaredo — pierce through a thick layer of valley clouds, their east-facing faces catching the first horizontal rays of sun and turning from cold blue-gray to blazing amber-gold. The cloud layer below is a rolling ocean of soft white and pale peach, filling the valleys completely.
Camera: starts buried inside the cloud layer — visibility near zero, soft white diffusion everywhere — then cranes upward at a steady pace, breaking through the cloud surface to reveal the peaks and the vast sky above. The transition from claustrophobic fog to infinite horizon takes 4 seconds. Continue rising to a high aerial wide shot. 24mm wide angle lens.
Lighting: first light of day — sun at 5 degrees above the eastern horizon, casting extreme raking light across the mountain faces. Golden hour warmth on lit surfaces, blue hour coolness in shadowed areas. Volumetric light beams visible where sun cuts between peaks.
Style: National Geographic cinematic, IMAX-quality, ultra-wide dynamic range, vivid but natural color, no filters.
Sound: wind at altitude — a sustained low whisper with occasional gusts, no music, no human sounds. The silence amplifies the scale.(深秋日出时分的多洛米蒂山脉。锯齿状的石灰岩尖塔——三峰山——刺穿山谷中厚厚的云层,它们朝东的面捕捉第一缕水平阳光,从冷蓝灰色变为炽热的琥珀金。)
示例4:动作场景 —— "武术家出拳"
V1 — 基础版(15词)
A martial artist doing a spinning kick, action movie style, slow motionV2 — 改进版(64词)
A female martial artist in a dark training hall performs a spinning back kick. Her bare foot connects with a hanging heavy bag, sending it swinging violently. Camera captures the kick from a low angle, slightly slow motion at the point of impact, then returns to real-time as she recovers her stance. Side lighting creates dramatic shadows.V3 — 电影级(141词)
A woman in her 30s, lean and muscular, wearing a fitted black tank top and loose gray training pants, stands in a dimly lit martial arts gym. Worn wooden floor, heavy bags hanging in rows, chalk dust suspended in the air. She explodes from stillness — a spinning hook kick that arcs through 360 degrees, her back heel striking a leather heavy bag at head height.
Camera: starts medium shot at 45-degree angle. As the spin begins, camera speed-ramps to 240fps slow motion — her hair whips in an arc, chalk dust traces the path of her foot, the bag surface ripples visibly on impact. Hold for one beat, then ramp back to real-time as she plants her foot. Slight handheld energy.
Lighting: single harsh side light from camera-left, no fill. Chalk dust and sweat particles glow in the light beam.
Style: David Fincher / Fight Club aesthetic — desaturated, greenish-teal undertone, high contrast, gritty. Anamorphic lens with subtle horizontal flares.
Sound: silence before the kick — ambient gym hum, a breath in. The kick: explosive fabric snap, heavy leather impact, chain rattle. Her sharp exhale on contact. No music.(一个三十多岁的女性,精瘦且肌肉分明,穿着贴身黑色背心和宽松灰色训练裤,站在灯光昏暗的武馆中。磨损的木地板,沙袋成排悬挂,粉尘悬浮在空气中。她从静止中爆发——360度旋转勾踢,脚后跟击中头部高度的皮质沙袋。)
示例5:情感叙事 —— "祖母和孙子"
V1 — 基础版(16词)
A grandmother and her grandchild spending time together, heartwarming, emotional, beautiful momentV2 — 改进版(71词)
An elderly grandmother with silver hair and weathered hands teaches her 5-year-old granddaughter how to knead bread dough in a sunlit country kitchen. The child stands on a wooden step stool, flour on her cheeks, laughing. The grandmother guides her small hands through the dough. Golden morning light through a window. Warm color palette. Intimate, cozy atmosphere.V3 — 电影级(147词)
A Japanese grandmother in her 80s, silver hair in a soft bun, deep expression lines around smiling eyes, wearing an indigo apron over a cream linen blouse, stands beside her granddaughter — age 4 or 5, round cheeks, short black hair with a red clip — at a low wooden table in a traditional kitchen. Shoji screen doors are slid open to a small garden where morning light enters. They are making mochi together. The grandmother's large, weathered hands wrap around the child's tiny ones, guiding them to fold and press the soft rice dough. Flour dust floats in the shaft of sunlight between them.
Camera: close-up on their four hands working the dough — the contrast of old and young skin. Slowly dolly out to a medium shot including both faces. Rack focus between them — first sharp on the grandmother's eyes, then pulling to the child's smile. 85mm portrait lens, f/2.0, creamy bokeh.
Lighting: natural morning sunlight from the garden, soft and directional, Tyndall effect through the flour dust. No artificial light. The light creates a warm halo around the grandmother's silver hair.
Style: Hirokazu Kore-eda film quality — observational, unhurried, documentary intimacy with cinematic beauty. Kodachrome-inspired color. 16:9.
Sound: the soft rhythmic sound of hands pressing dough, birds outside in the garden, a distant wind chime, the child's occasional giggle, the grandmother humming a folk melody under her breath. No score — only diegetic sound.(一位八十多岁的日本祖母,银发挽成松散的发髻,笑眼周围有深深的表情纹,穿着靛蓝色围裙罩在奶油色亚麻衬衫外。她站在四五岁的孙女旁边——圆脸蛋、短黑发别着红色发夹——在传统厨房的矮木桌前。障子门拉开朝向小花园,晨光从那里涌入。她们一起做麻糬。祖母那双布满岁月痕迹的大手包裹着孩子的小手,引导她们折叠按压柔软的糯米面团。面粉尘在她们之间那束阳光中飘浮。是枝裕和式的电影品质——观察性的、不急不躁的,纪录片式的亲密与电影之美。)
在提示词中写入声音设计
声音设计是视频提示词写作中最被忽视的维度。2026年,Seedance、Veo 3和可灵等平台都支持视频同步音频生成——包含声音指示和不包含之间的质量差距是巨大的。
这样想:一个没有环境音的美丽森林场景感觉像GIF动图。加上鸟鸣、树叶沙沙声和远处的溪流声,它就变成了一个你想走进去的地方。
声音设计格式
在提示词末尾以单独段落或行添加声音指令,涵盖三个层次:
第一层:背景音乐 — 整体情绪和风格
Background music: slow ambient piano, minor key, sparse notes with reverb
(背景音乐:缓慢的氛围钢琴,小调,稀疏的音符带混响)第二层:环境音效 — 建立场景的环境声音
Ambient: light rain on leaves, distant thunder rolls, wet road traffic hum
(环境音:轻柔的雨打树叶声、远处的雷声滚动、湿路上的交通嗡嗡声)第三层:动作音效和对话 — 与视频中事件关联的特定声音
SFX: footsteps on wet pavement, umbrella opening with a click
Dialogue: none
(音效:湿路面上的脚步声、雨伞咔嗒打开的声音。对话:无)声音关键词参考
不同情绪的音乐风格:
| 情绪 | 音乐方向(英文提示词) |
|---|---|
| 平和 | Ambient, soft piano, acoustic guitar fingerpicking, lo-fi |
| 紧张 | Low drone, dissonant strings, minimal percussive pulse |
| 欢快 | Upbeat acoustic, ukulele, light percussion, major key |
| 史诗 | Orchestral crescendo, taiko drums, brass fanfare, choir |
| 浪漫 | String quartet, gentle jazz, bossa nova |
| 神秘 | Dark ambient, reverb-heavy piano, distant bell tones |
| 活力 | Electronic beat, driving drums, bass-heavy, uptempo |
| 忧伤 | Solo cello, slow piano in minor key, sparse guitar |
环境声音:
| 环境 | 声音层次(英文提示词) |
|---|---|
| 森林 | Birdsong, rustling leaves, distant woodpecker, stream |
| 城市夜晚 | Traffic hum, distant sirens, neon buzzing, footsteps |
| 海洋 | Waves breaking, seagulls, wind, distant boat engine |
| 室内咖啡馆 | Coffee machine, murmured conversation, spoon on ceramic, jazz |
| 雨天 | Rain intensity (light patter / heavy downpour), thunder, drips |
| 工作坊 | Tool sounds, wood shavings, machinery hum, radio in background |
何时使用寂静
寂静不是声音设计的缺失——它是一个刻意的选择。策略性的寂静可以创造:
- 冲击力时刻:戏剧性节拍前的寂静会放大这个节拍
- 规模感:只有风声的广阔风景传达出浩瀚
- 紧张感:移除预期的声音会制造不安
- 聚焦:寂静把所有注意力引向视觉
在提示词中明确写出:Sound: silence — no music, no ambient, only the subject's breathing.(声音:寂静——没有音乐,没有环境音,只有主体的呼吸声)
关于AI音乐视频制作中音频生成的更多信息,参阅 AI音乐视频生成器指南。
平台专属提示词技巧
通用公式到处适用,但每个AI视频平台在解读提示词方面有各自的特点。针对你使用的平台优化提示词,可以显著提升效果。

同一个概念——"雨夜中行走的女人"——针对五个不同平台优化。同一公式,不同侧重。
Seedance
优势: 分镜时间轴格式、多镜头序列、图生视频引用、内置提示词生成器。
优化技巧:
- 对复杂序列使用分镜时间轴结构——将视频分成带时间戳的镜头:
Shot 1 (0-3s): [描述]
Shot 2 (3-6s): [描述]
Shot 3 (6-10s): [描述]- 使用
@Image1、@Image2引用上传的图像实现风格和角色一致性 - 运镜语言效果极好——使用具体术语(dolly、track、orbit)而非笼统说法("移向")
- 包含声音设计——Seedance会处理音频线索
- 最高效的工作流:使用视频提示词生成器从简单想法创建结构化提示词,然后手动优化
Seedance完整的平台专属提示词指南(含50+示例),参阅 Seedance提示词指南。
Sora(OpenAI)
优势: 物理真实感、自然运动、长文本自然语言理解。
优化技巧:
- 用流畅的描述性段落而非结构化列表——Sora擅长解析自然语言
- 强调物理细节:重力、重量、材质属性、流体动力学
- 描述某物"摸起来像什么样子"——纹理和材质描述提升物理保真度
- 明确使用宽高比和时长规格
- 详细描述物理学:"沉重的布料随每一步垂坠摆动,因自身重量而延迟"比"飘逸的裙子"产生更好的效果
可灵 Kling(快手)
优势: 生成速度快、动作和运动表现强、面部一致性好。
优化技巧:
- 保持提示词简洁——可灵对聚焦、以动作为先导的提示词响应更好(50-80词是最佳区间)
- 以动作开头:
A dancer leaps and spins(舞者跳跃旋转)而不是在长长的场景描述后才提到动作 - 清晰指定运动方向:
moves from left to right(从左向右移动)、approaches camera(走向镜头)、turns away(转身离开) - 可灵对人体运动和面部表情的处理特别好——利用这一点写特写情感提示词
- 运镜指令有效但每个提示词保持一到两个运镜动作
通义万相 / Runway(Gen-3 Alpha / Gen-4)
通义万相优化技巧:
- 支持中文提示词直接输入,比翻译效果更好
- 对中国传统美学元素理解优秀——水墨、国风、古装场景
- 简洁明确的风格标签效果好
Runway优化技巧:
- 结合文字描述和风格标签——Runway有强大的风格理解力
- 用空间向量描述运动:
movement from bottom-left to top-right(从左下到右上的运动) - 使用Motion Brush时,文字提示聚焦于整体场景和风格,用画笔处理具体运动区域
- Runway对艺术风格描述的理解很好——"in the style of a Terrence Malick film"(特伦斯·马力克式风格)可以产生很好的效果
- 保持提示词聚焦——每次生成一个清晰的场景,而非多镜头序列
Veo 3(Google DeepMind)
优势: 音频理解、物理模拟、电影品质、更长序列。
优化技巧:
- 包含详细的音频描述——Veo 3从文字生成同步音频
- 详细描述物理交互:物体如何碰撞、材料如何变形、光如何与表面互动
- 使用电影摄影专业术语——Veo 3的训练数据大量偏向专业电影
- 指定时长和节奏:
the scene unfolds slowly over 10 seconds(场景在10秒内缓慢展开) - 物理描述大幅提升效果:
water splashes upward on impact, droplets catching backlight(水花在撞击时向上溅起,水滴捕捉逆光)而不仅是"水花"
关于Seedance与Sora在提示词解读和输出质量上的详细对比,参阅 Seedance vs Sora对比。
或者,让AI帮你写提示词
你刚刚学完了从头写视频提示词的完整框架。这些知识非常有价值——它让你成为更好的提示词质量评判者,并给你完全控制每个细节的能力。但你不必每次都手动写每个提示词。

混合工作流:让AI处理结构和技术词汇,然后在优化步骤中注入你的创意视角。
何时手写 vs. 使用AI
| 场景 | 最佳方法 |
|---|---|
| 你有精确的创意愿景,确切知道你想要什么 | 手写——你会比编辑AI草稿更快更准确 |
| 你有大致想法但需要结构 | AI生成 → 手动优化 |
| 你需要快速生成多个提示词变体 | AI批量生成 → 挑选并优化最好的 |
| 你在学习,想研究提示词结构 | AI生成 → 阅读分析——这就是你积累词汇的方式 |
| 你需要匹配特定的参考画面 | 手写——精确描述你在参考中看到的内容 |
混合工作流(推荐)
最高效的提示词写作流程将AI生成与人工优化结合:
-
从AI开始。 前往 Seedance 视频提示词生成器,用一两句话描述你的想法,选择风格,生成。
-
批判性地阅读输出。 AI会生成一个包含运镜语言、时间线、光影和声音的结构化提示词。通读一遍。运镜是否匹配你想要的情绪?光影方向是否创造了正确的氛围?有没有你想改的细节?
-
手动优化。 这就是你对公式、运镜语言和氛围关键词的知识发挥作用的地方。将AI选择的运镜替换为更符合你愿景的运镜。调整光影关键词。添加AI无法得知的具体细节——角色特有的特征、品牌特定的需求、情感上的细微差别。
-
生成视频。 将优化后的提示词发送到视频生成器。结果会远好于完全手动的新手提示词或完全AI生成的未经审核的提示词。
AI提示词生成工具的完整操作指南,参阅 AI视频提示词生成器指南。
电影级效果:融会贯通
让我们写一个最终提示词,运用本指南的所有内容——公式、运镜语言、氛围关键词、声音设计——来产生一个真正的电影级效果。
创意简报: 一位孤独的宇航员在火星上发现了植物生命。

完全指定的电影级提示词产出的效果就像经过导演指导一样——因为确实如此。每个元素都服务于故事。
完整提示词:
Subject: A solitary astronaut in a dusty, sun-bleached EVA suit — visor partially reflective, scratched from use, mission patches barely legible. The suit is not pristine Hollywood white; it is a working tool, weathered by months on the Martian surface.
Action: The astronaut crouches beside a small crack in the rust-red basalt. Inside the crack, a single tiny green sprout — two delicate leaves, almost translucent — pushes up through the red soil. The astronaut's gloved hand reaches toward it, hesitates, trembles slightly, then gently touches the soil beside it.
Environment: The Martian surface — a flat, rust-red plain scattered with dark basalt rocks, stretching to low eroded hills on the horizon. The sky is a pale butterscotch-pink. Dust devils move in the far distance. The scene feels vast and achingly empty — except for this one tiny green thing.
Camera: Opens with an extreme wide shot — the astronaut is a small figure in the immense Martian landscape. Slow dolly in over 4 seconds to a medium shot. As the astronaut crouches, camera drops to ground level and continues to a close-up of the gloved hand and the sprout. Rack focus: pull from the hand to the astronaut's visor, where we see the sprout's reflection. 65mm lens, anamorphic.
Lighting: Late Martian afternoon — low sun from camera-right, casting long amber-red shadows. The side light sculpts the EVA suit's texture. The sprout's translucent leaves glow with subsurface scattering as sunlight passes through them — the only green in a world of red. Volumetric dust particles drift through the light beam.
Style: Ridley Scott's The Martian meets Terrence Malick's The Tree of Life. Cinematic, anamorphic, muted Martian color palette with the single point of vivid green as deliberate contrast. Subtle film grain.
Sound: Wind — thin, high-pitched Martian wind, unlike Earth wind. The astronaut's breathing inside the suit — measured at first, then quickening. A single sustained low note from a cello enters as the hand reaches for the sprout. No dialogue. No narration.(一位孤独的宇航员,穿着积满灰尘、被太阳晒褪色的EVA太空服——面罩半反光、使用痕迹的划痕、任务臂章几乎看不清。太空服不是崭新的好莱坞白色,它是一个工作工具,经历了数月的火星表面风化。宇航员蹲在锈红色玄武岩的一条小裂缝旁。裂缝里,一棵小小的绿色嫩芽——两片纤细的叶子,几乎透明——从红色土壤中破土而出。宇航员的手套伸向它,犹豫,微微颤抖,然后温柔地触摸它旁边的土壤。)
这个提示词使用了全部七个公式要素、具体的运镜语言(大远景、推进、焦点转移)、氛围关键词(体积光、次表面散射、变形宽银幕)、声音设计(环境风声、呼吸声、单一大提琴音符)和风格参考(雷德利·斯科特、特伦斯·马力克)。每个细节都服务于情感弧线:孤独 → 发现 → 敬畏。
这就是视频提示词工程。
常见问题
AI视频提示词应该写多长?
没有统一的长度标准。合适的长度取决于你的创意复杂度和使用的平台。V1级别(15-30词)在任何平台上都产生通用结果。V2级别(50-80词)是大多数平台的最佳区间——足够具体而不会让模型过载。V3级别(100-200词)在支持长提示词的平台(如Seedance和Sora)上产生最可控的结果。使用可灵时保持在50-80词左右。关键指标不是字数——而是公式的每个要素是否都被覆盖。
需要懂摄影才能写好视频提示词吗?
不需要,但懂了会有巨大帮助——而本指南刚刚教了你核心知识。你不需要电影学位,你需要知道10-15种运镜方式的名称、理解不同光影类型的情感效果、拥有描述氛围的词汇。收藏运镜语言和氛围关键词库章节,反复参考,直到这些术语成为你的第二天性。
同一个提示词能在不同的AI视频平台上使用吗?
可以——通用公式到处适用。但每个平台解读提示词的方式不同。为Sora优化的提示词(长篇、流畅、强调物理)可能需要为可灵重新组织(更短、动作优先)。平台专属技巧部分介绍了如何调整。核心公式不变,交付格式适配。
这篇指南和Seedance提示词指南有什么区别?
Seedance提示词指南是平台专属的——它教你Seedance的分镜格式、图像引用和50+即用型提示词。本指南是通用的——它教你适用于任何平台的提示词写作底层技能。把本指南看作教科书,Seedance指南看作一个具体工具的实验手册。
如果不知道运镜术语怎么描述镜头运动?
先描述你想让观众看到和感受到什么。"镜头慢慢接近主体的脸"就是 dolly in(推进)。"镜头从侧面跟随这个人走路"就是 tracking shot(跟拍)。AI平台对自然语言描述的理解相当不错。但学习技术术语(使用上方的运镜语言参考)会产生明显更好的结果,因为AI模型是在使用这些专业术语描述的视频上训练的。
应该包含反向提示词(不想要什么)吗?
一些平台支持反向提示词——关于要避免什么的指令。它们可以有帮助:No text overlays, no watermarks, no blurry frames(无文字叠加、无水印、无模糊帧)。然而,大多数现代AI视频生成器通过正向指定来更好地处理质量问题。与其写"不要糟糕的灯光",不如写"Rembrandt lighting from camera-left"(从左侧的伦勃朗光)。与其写"不要晃动的镜头",不如写"smooth steadicam movement"(平滑的斯坦尼康运动)。正向提示词引导AI走向你想要的;反向提示词只告诉它要避免什么,把替代方案留给偶然。
如何在多个提示词之间保持角色一致性?
跨多次AI视频生成保持角色一致性是提示词写作中最困难的挑战之一。三种策略有帮助:(1)使用极其具体的角色描述,并在提示词之间逐字重复——a woman in her late 20s, Japanese, long black hair, oversized charcoal wool coat, cream turtleneck。(2)使用图生视频工作流——上传角色参考图让AI进行动画化。Seedance通过 @Image 引用支持此功能。(3)尽可能在单个会话中生成同一角色的所有片段,使用相同的种子或风格设置。
有没有工具能帮我写视频提示词?
有。Seedance的视频提示词生成器接受自然语言描述,生成完整的结构化分镜提示词,包含运镜语言、时间线、光影和声音设计。详细操作指南参阅 AI视频提示词生成器指南。推荐工作流:AI生成 → 手动优化 → 生成视频。
现在就开始写更好的视频提示词
你现在拥有了完整的工具包:七要素公式、包含15种以上运镜方式的运镜语言参考、涵盖50多个术语的四维度氛围关键词库、展示从基础到电影级进化的五个递进示例、声音设计方法论,以及平台专属优化技巧。
业余和专业AI视频产出之间的差距不在于工具——而在于提示词。而提示词写作是一个随练习不断进步的技能。
三种开始方式:
-
练习公式。 选择任何主题,写出V1 → V2 → V3版本。对比输出结果。提升会是即时且显著的。
-
使用提示词生成器。 让AI处理结构,然后运用你的运镜和氛围知识来优化输出。试用视频提示词生成器 →
-
生成你的第一段视频。 拿出你最好的提示词,现在就创建一段视频。打开视频生成器 →
更多提示词灵感和即用型示例:
- 10个实用AI视频提示词 — 经过测试的提示词,附V1→V2→V3迭代
- Text to Video AI完整指南 — 理解工具背后的技术
- AI视频提示词生成器指南 — 让AI帮你写提示词
- Seedance提示词指南 — 50+Seedance专属提示词
你将制作的最好的AI视频,始于你写的下一个提示词。

