10个真正有效的AI视频Prompt:附迭代过程与效果对比(2026)

2026/02/17

摘要

绝大多数 AI 视频 prompt 效果不好,原因不外乎三个:太笼统、指令矛盾、缺少运动描述。本文用 10 个真实场景的 prompt 告诉你到底该怎么写——每一个都从薄弱的 V1 一路迭代到精调后的 V3,让你清楚地看到每次改了什么、为什么改、效果差在哪里。所有 prompt 可直接复制粘贴到 Seedance、Sora、可灵(Kling)、Runway 等主流生成器中使用。读完之后,你将掌握 prompt 的核心结构,拥有覆盖电影人像、产品广告、动漫、美食、时尚、体育、图生视频、品牌 TVC 等场景的实战素材库。立即打开 Seedance 试试这些 prompt →

提示:目前几乎所有主流 AI 视频生成器(包括国产的可灵、即梦等)都支持英文 prompt 输入,且英文 prompt 通常效果更好。本文的 prompt 示例保留英文原文,同时附中文说明,方便你理解每条 prompt 的设计意图后直接复制使用。

对比:模糊prompt与优化prompt生成的AI视频效果差异

同一个创意,模糊 prompt 和精调 prompt 的效果天差地别。


为什么大多数 AI 视频 Prompt 效果不好

你在 AI 视频工具里输入一段话,点击生成,结果和你脑海中的画面完全是两回事。几乎每个人都经历过这种落差,而背后的原因其实是可预测、可解决的。

三种最常见的失败模式

1. 描述太笼统。"a beautiful sunset"这类 prompt 几乎没有给 AI 任何方向——镜头在哪里、主体是什么、光线如何变化、想传达什么情绪,全部缺失。笼统的 prompt 只能换来平庸、毫无记忆点的画面。

2. 指令互相矛盾。"An extreme close-up wide-angle shot of a person sprinting in slow motion fast"——特写和广角矛盾,慢动作和快速矛盾。AI 试图同时满足不可能的指令,结果就是画面混乱。

**3. 没有运动描述。**文生视频不是文生图。如果你只描述一个静态场景,不告诉 AI 什么东西在动、怎么动,很多生成器会输出一张像是加了微妙呼吸效果的静止图片。你必须明确告诉 AI 画面中的运动方式。

好 Prompt 的三大支柱

一个出色的 AI 视频 prompt 包含三个核心要素:

  • 清晰的主体:AI 确切知道要渲染什么。不是"a person",而是"a woman in her 30s with silver-streaked black hair wearing a weathered leather jacket"。
  • 明确的运动:画面里有事情在发生。主体在动、镜头在动、粒子在飘、布料在飞、光线在变。运动才是视频的意义所在。
  • 确定的氛围:光线、色温、情绪、风格不是可选项,而是决定画面到底是"技术 demo"还是"专业作品"的关键。

迭代思维

最好的 prompt 写手不会一次写出完美的 prompt,他们靠迭代。本文每个 prompt 都遵循三个版本的递进:

  • V1 —— 基础尝试。大多数人第一次输入的内容。能生成画面,但泛泛而缺乏控制。
  • V2 —— 补充细节。加入具体的场景、光线、运镜或情绪。效果明显提升。
  • V3 —— 最终版本。主体、运动、氛围、镜头、灯光、画质修饰词全部到位,各元素协同工作,输出一个完整、有说服力的画面。

这个迭代过程教给你的东西远比任何一条"完美 prompt"要多。你会理解每一处补充带来的变化,以及为什么它重要。


AI 视频 Prompt 的解剖结构

所有优秀的 prompt 都遵循同一个公式:

[主体 Subject] + [动作/运动 Action] + [风格/情绪 Style] + [运镜 Camera] + [光线 Lighting] + [画质 Quality]

每个要素各有分工:

要素控制什么示例
主体 Subject画面中是谁/什么"A young woman with flowing auburn hair in a charcoal wool coat"
动作 Action发生了什么、什么在动"walks slowly through falling snow, breath visible in the cold air"
风格 Style视觉美学与情绪基调"melancholic, muted earth tones, indie film aesthetic"
运镜 Camera景别与镜头运动"medium tracking shot following from the side, slow dolly"
光线 Lighting光源、质感、方向"overcast winter light, soft diffused shadows, cool blue undertones"
画质 Quality技术规格"8K, shallow depth of field, anamorphic lens, film grain"

不是每条 prompt 都必须写满六个要素,但你覆盖得越多,对生成结果的控制力就越强。下面用 10 个真实场景来展示这套方法的实战效果。


Prompt #1:电影人像——"活过来的照片"

场景设定

一个电影级别的人像画面,像是从获奖影片中截取的一帧。主角不是在摆拍——她在经历一个瞬间。风吹起她的头发,表情带着某种分量,光线像文艺复兴绘画一样塑造她的面部轮廓。

V1 —— 基础尝试

A woman looking at camera

这是大部分初学者会输入的内容。结果是一张平淡的、类似证件照的正面人脸:表情中性、灯光默认、完全没有场景感和故事感。AI 没有收到任何关于情绪、场景或视觉风格的信息,你得到的只是随机输出。

V2 —— 补充细节

A woman with dark curly hair looks directly at the camera with a slight
smile. Wind blows her hair across her face. She stands in a golden wheat
field at sunset. Warm light on her skin.

进步明显。现在有了场景(麦田)、时间(日落)、物理交互(风吹发丝)和表情(微笑)。但仍然缺少具体的镜头参数、精确的光线方向和画质修饰词。

V3 —— 最终版本

Cinematic close-up portrait of a woman in her late 20s with dark curly
hair and deep brown eyes. She gazes directly into the camera with quiet
intensity, lips slightly parted. A warm breeze lifts strands of hair
across her face. She stands in a vast golden wheat field stretching to
the horizon. Golden hour backlighting creates a luminous halo around her
hair and shoulders. Warm amber fill light from a reflector below. Slow,
subtle dolly in. Shallow depth of field, f/1.4, 85mm lens. Gentle lens
flare from the low sun. Film grain, anamorphic bokeh. Ultra-realistic
cinematic 4K quality.
电影人像prompt三阶段迭代对比:从基础到优化的效果变化

V1 到 V3 迭代过程:同一个概念从普通人脸变成了有光线、运镜和氛围感的电影级人像。

为什么这条 Prompt 有效

  • 85mm 镜头 + f/1.4 光圈指示 AI 生成压缩透视和奶油般的背景虚化——这是专业人像摄影的标志性质感。
  • 逆光 + 琥珀色补光构建了立体的灯光层次。逆光将主体从背景中分离,补光确保面部不会变成剪影。
  • **缓慢推进(slow dolly in)**为画面增加了微妙的动态感,同时不会分散对主体的注意力,让观众产生一种被"吸引过去"的感觉。
  • **"quiet intensity, lips slightly parted"**给 AI 一个情绪目标,而不仅仅是物理描述。

变体

变体 A —— 雨夜都市人像:

Cinematic close-up of a man in his 30s with a shaved head and stubble,
standing still on a rain-soaked city street at night. Rain streams down
his face. He stares into the distance with exhausted resolve. Neon signs
reflect pink and blue on the wet pavement behind him. Shallow depth of
field. Slow push-in. Anamorphic lens flares. Cool blue tones with warm
neon accents. Ultra-realistic 4K, film grain.

变体 B —— 雪中老人肖像:

Tight close-up of an elderly woman with silver hair and deep laugh lines,
eyes glistening with emotion. She stands outdoors in gently falling snow.
Snowflakes settle on her dark wool shawl. Overcast soft light. A single
warm tear traces down her weathered cheek. Extremely shallow depth of
field. Static camera, no movement. 85mm lens. Muted, desaturated color
palette. Cinematic 4K, photorealistic.

Prompt #2:产品展示——"悬浮的奢侈品"

场景设定

一瓶高端香水像珠宝一样呈现——悬浮、旋转、捕捉光线。这类镜头在传统制作中需要品牌花费数万元请专业工作室拍摄。用对 prompt,AI 可以在几秒钟内生成商业级别的产品视频。无论你是电商卖家还是品牌方,这类画面在抖音和小红书上的转化率极高。

V1 —— 基础尝试

A perfume bottle on a table

结果:一瓶灯光平淡的香水放在一个随机桌面上。没有戏剧感、没有欲望感、没有购买冲动。当你给 AI 一条平庸的指令时,它也只能给你平庸的画面。

V2 —— 补充细节

A luxury glass perfume bottle with gold accents floating in mid-air against
a dark background. Soft light reflects off the glass surface. The bottle
slowly rotates. Professional product photography style.

明显进步。有了悬浮运动、暗色背景形成对比、光线反射和风格参考。但还可以通过精确的灯光布局、大气元素和镜头动作进一步提升。

V3 —— 最终版本

A luxury crystal perfume bottle with faceted edges and a gold cap floats
weightlessly in a void of deep matte black. The bottle rotates slowly on
its vertical axis, completing a quarter turn. Razor-sharp caustic light
refractions dance across the glass surface. Two opposing strip lights --
one warm amber, one cool white -- create dramatic dual-tone reflections on
the faceted crystal. Tiny golden particles drift lazily through the air
around the bottle. A single droplet of amber liquid clings to the bottle's
shoulder, catching the light. Smooth orbiting camera movement. Extreme
product close-up. 8K commercial quality, ultra-sharp focus throughout,
professional studio lighting.
产品展示prompt三阶段迭代对比:香水瓶从基础到商业级画质

V1 到 V3:一瓶香水从平淡的桌面快照变成了有专业灯光和大气细节的商业级产品展示。

为什么这条 Prompt 有效

  • "Matte black"纯黑背景消除了所有干扰,强制将注意力集中到产品上。这是奢侈品摄影的标准做法。
  • **双灯带(暖琥珀 + 冷白)**创造出让玻璃产品显得高级的多色调反射。单一光源会让成品看起来廉价而平板。
  • **"Caustic light refractions"(焦散光折射)**是一个专业术语,AI 模型对此理解很好。它触发透明物体产生的复杂光线图案。
  • 金色粒子增添了环境层次感,同时不会与产品争夺注意力。

变体

变体 A —— 科技产品发布:

A matte black wireless earbud case floats against a gradient of deep
navy to black. The case slowly opens, revealing pearl-white earbuds inside.
Volumetric blue light emanates from within the case. Tiny light particles
drift upward. Orbiting camera. Edge-lit rim lighting in electric blue.
Ultra-clean, Apple-style product aesthetic. 8K, ultra-sharp.

变体 B —— 美妆产品广告:

A rose-gold lipstick tube rotates slowly against soft pink studio
backdrop. The cap twists off and separates, floating beside the tube.
Creamy lipstick bullet catches soft ring light. Rose petals in soft focus
drift across the foreground. Smooth macro close-up. Beauty commercial
lighting with soft key and gentle fill. Ultra-realistic 4K.

Prompt #3:自然史诗——"大气的风光镜头"

场景设定

一个让人屏住呼吸的史诗级风光镜头——你在自然纪录片或《指环王》式电影的开场镜头中见过的那种。这类画面的核心是尺度感、大气层次和宏伟感。用来做 B 站或抖音上的风光类视频开场,极具视觉冲击力。

V1 —— 基础尝试

Mountains with clouds

你会得到山脉。你会得到云。你不会得到震撼。AI 没有关于时间、天气动态、尺度感、镜头或情绪的任何引导,结果就是一张系统默认桌面壁纸。

V2 —— 补充细节

Dramatic mountain range at sunrise with clouds flowing through the valleys.
Golden light hits the peaks. Aerial drone shot slowly moving forward.
Mist and fog in the valleys below. Epic landscape photography.

强了很多。有了时间(日出)、光线方向、大气效果、镜头运动和风格参考。但要达到真正的电影级效果,还需要具体的地理参考、天气动态和制作级别的画质关键词。

V3 —— 最终版本

Epic aerial establishing shot of a jagged snow-capped mountain range
resembling the Dolomites at dawn. The camera drifts slowly forward over
a sea of low-lying clouds that fill the valleys like white rivers.
Golden-pink alpenglow illuminates the highest peaks while the valleys
remain in cool blue shadow. Wisps of cloud catch on rocky spires and
trail into the wind. A single eagle soars far below the camera, its
wings outstretched against the cloud sea. Volumetric god rays break
through a gap between two peaks. Slow, majestic forward dolly. IMAX
quality, ultra-wide 21:9 aspect ratio, photorealistic, extreme detail
in rock textures and snow patterns. 8K resolution.
自然风光prompt三阶段迭代对比:山脉从基础到IMAX级别画质

V1 到 V3:普通的山景变成了有体积光、流动云海和宏大尺度感的 IMAX 级建立镜头。

为什么这条 Prompt 有效

  • **"Resembling the Dolomites"(类似多洛米蒂山脉)**给 AI 一个具体的地理参考。真实地貌比抽象的"mountains"能产生更连贯的地质结构。
  • **"Alpenglow"(日照金山)**是一种特定的光线现象——太阳还未升过地平线时,山顶被暖粉色光照亮。AI 的训练数据中有大量自然摄影,它理解这个术语。
  • 老鹰提供了活的尺度参照。没有它,画面可能看起来像微缩模型。一只鸟在广阔风景中飞翔,传达出的是"巨大"。
  • **"God rays break through a gap"(丁达尔光穿过山隙)**在构图中创造了视觉焦点,引导观众的视线。

变体

变体 A —— 暴风来临:

Dramatic time-lapse-style shot of a vast Icelandic black sand desert.
Towering cumulonimbus storm clouds roll in from the horizon, their bases
dark and heavy with rain. Lightning flickers within the cloud mass.
A solitary volcanic peak stands defiant in the middle distance. The light
shifts from warm gold to ominous green-grey as the storm advances.
Wide-angle static camera. 4K cinematic, photorealistic.

变体 B —— 热带宁静:

Aerial overhead shot drifting slowly over a turquoise tropical lagoon.
Crystal-clear water reveals coral reefs and white sand below. A small
wooden boat with a red sail drifts lazily across the lagoon. Palm trees
line the crescent beach. Gentle ripples catch sunlight and create dancing
caustic patterns on the seabed. Golden afternoon light. Smooth, dreamlike
camera movement. 4K ultra-realistic, vivid but natural colors.

Prompt #4:都市街景——"城市脉搏"

场景设定

一条充满能量的夜间城市街道。雨水、霓虹、地面反射和行人的运动交织在一起,打造出那种让你仿佛站在凌晨两点街角的沉浸感。这类画面在抖音和 B 站的"城市漫步"类视频中非常受欢迎。

V1 —— 基础尝试

A city street at night

结果:一团模糊的深色建筑,也许有几盏灯。没有氛围、没有叙事、没有视觉辨识度。"城市夜景"可以是安静的郊区小路,也可以是时代广场——AI 完全无法判断。

V2 —— 补充细节

A rainy city street at night with neon signs reflecting on the wet
pavement. People walk with umbrellas. A taxi passes through a puddle,
splashing water. Colorful lights everywhere. Cinematic look.

有了天气、反射、人物活动和车辆。场景开始有生命力。但还需要锁定具体的美学风格、镜头行为和灯光层次才能真正出彩。

V3 —— 最终版本

A rain-soaked Tokyo side street at night. The narrow road glistens with
reflections of dozens of vertical neon signs in Japanese characters --
hot pink, electric blue, acid green. A lone figure in a black trench coat
walks away from the camera, their silhouette dark against the neon glow.
Steam rises from a ramen shop's exhaust vent on the left. A bicycle
leans against a vending machine glowing soft white. Rain falls steadily,
each drop catching neon color as it descends. Slow tracking shot following
the figure from behind. Shallow depth of field: the figure is sharp, the
distant neon blurs into bokeh circles. Wet pavement acts as a mirror,
doubling every light source. Anamorphic lens flares. Blade Runner meets
Lost in Translation atmosphere. 4K cinematic, film grain, moody cool
blue-purple color grade.
都市街景prompt三阶段迭代对比:从基础夜景到电影级霓虹雨夜

V1 到 V3:模糊的夜间场景变成了有精心构图、天气动态和电影参考的霓虹雨夜街头。

为什么这条 Prompt 有效

  • **"Tokyo side street"(东京小巷)**将 AI 锚定到一个具体的视觉词汇体系:窄街、密集的竖向招牌、自动贩卖机。笼统的"city"缺少这种连贯性。
  • **"Lone figure in a black trench coat walks away"(穿风衣的孤独身影背对镜头走去)**为画面提供了叙事焦点和跟踪镜头的运动路径。
  • **"Wet pavement acts as a mirror"(湿润路面充当镜子)**明确告诉 AI 生成反射倍增效果——这是雨夜摄影中最有视觉冲击力的单一元素。
  • **电影参考(《银翼杀手》+《迷失东京》)**给 AI 一个精确的美学目标,比笼统的"cinematic"有效得多。

变体

变体 A —— 白天市集街道:

Bustling narrow market street in Marrakech at midday. Colorful fabric
awnings in saffron, cobalt, and crimson create dappled shade patterns on
the ground. Merchants arrange pyramids of spices in copper bowls. Dust
motes float in shafts of sunlight. A cat sits atop a stack of woven
rugs. Steady handheld camera walking slowly through the market. Warm,
saturated color palette. Documentary-style 4K, natural lighting.

变体 B —— 未来都市:

A massive elevated highway cuts through a futuristic megalopolis at dusk.
Flying vehicles stream along neon-lit lanes above and below. Holographic
advertisements flicker on the sides of impossibly tall buildings.
A distant megastructure disappears into clouds. Rain falls sideways in
the wind. Low-angle wide shot from a pedestrian bridge. Teal and orange
color palette. Cyberpunk 2077 aesthetic. 4K ultra-detailed.

Prompt #5:动漫与奇幻——"武士的最后一站"

场景设定

一个动漫风格的武士在不可能的战斗前坚定伫立。樱花花瓣、能量光效和戏剧性天空共同构成一个画面,看起来就像高预算动画电影的关键帧。对于经常在 B 站看番的读者来说,这类画面非常容易产生共鸣。

V1 —— 基础尝试

An anime character with a sword

结果:一个僵硬的、泛泛的人物拿着一把刀。没有动态姿势、没有环境、没有风格定义。"Anime"是一个涵盖几十种子风格的大类,AI 只会默认输出最普通的那种。

V2 —— 补充细节

A female anime warrior in ornate samurai armor stands on a cliff edge
holding a glowing katana. Cherry blossoms fall around her. A dramatic
sunset sky behind her. Detailed anime art style with clean line work.

进步明显。有了具体的铠甲、武器细节(发光)、环境元素(樱花、悬崖)和天空。但还需要推动视觉特效、指定精确的美术风格、加入运动。

V3 —— 最终版本

A fierce female samurai warrior stands at the edge of a shattered cliff
overlooking a burning battlefield far below. She wears battle-worn
crimson and black lacquered armor with gold filigree, one shoulder plate
cracked. Her long white hair whips violently in a supernatural wind.
She grips a katana that radiates crackling blue-white energy along its
blade. Cherry blossom petals swirl upward in a vortex around her. The
sky is a dramatic gradient from blood-red at the horizon through deep
violet to black overhead. Lightning forks across the clouds. The camera
slowly orbits around her in a dramatic reveal. High-detail cel-shaded
anime style with dynamic ink-line edges. Ufotable studio quality.
Vibrant color palette. 4K ultra-detailed.
动漫角色prompt三阶段迭代对比:从基础到工作室级别动漫画面

V1 到 V3:普通的动漫人物变成了带有超自然特效、环境叙事和电影运镜的工作室级关键帧。

为什么这条 Prompt 有效

  • **"Ufotable studio quality"(飞碟社画质)**引用了以视觉效果闻名的动画工作室(《鬼灭之刃》《Fate》系列)。AI 模型理解工作室特有的美学风格。
  • 战斗痕迹细节("one shoulder plate cracked"——肩甲碎裂)增加了叙事深度。这个武士经历过战斗,不用对话就讲了一个故事。
  • **"Cherry blossom petals swirl upward in a vortex"(樱花花瓣向上旋转形成涡旋)**给出了明确的运动方向。"Cherry blossoms falling"是静态的老套表达,而向上的涡旋暗示超自然力量。
  • **"Crackling blue-white energy along the blade"(刀刃上噼啪作响的蓝白能量)**增加了动态光效——这是将动漫场景从插画提升为动画的关键元素。

变体

变体 A —— 暗黑奇幻法师:

A hooded dark elf sorcerer floats cross-legged above a stone altar in
an ancient underground temple. Runes carved into the floor pulse with
deep emerald light. Dozens of ancient tomes orbit slowly around the
sorcerer, their pages fluttering. Dark energy coils from the sorcerer's
outstretched hands like living smoke. Candlelight flickers on obsidian
walls. Slow push-in camera. Dark Souls meets Studio Ghibli aesthetic.
Painterly digital art style. 4K ultra-detailed.

变体 B —— 机甲驾驶员:

Dramatic low-angle shot of a massive humanoid mech standing in a
destroyed cityscape. Rain pours down its scarred titanium armor. The
cockpit glows warm amber. One hand grips a massive energy cannon, still
smoking from a recent shot. Sparks shower from a damaged joint. The
pilot is visible as a small silhouette through the cockpit glass.
Lightning illuminates the scene. Gundam-inspired mecha design.
Cel-shaded anime with hyper-detailed mechanical rendering. 4K.

Prompt #6:美食特写——"完美的倒注"

场景设定

一个让你隔着屏幕都能闻到香气的咖啡倒注特写。每一条美食广告都靠这类镜头吃饭:液体缓慢倾泻、蒸汽袅袅上升、暖色调触发食欲。在专业制作中,这类镜头需要特殊的拍摄支架和微距镜头。有了 AI,你只需要描述它。特别适合小红书和抖音上的美食博主素材。

V1 —— 基础尝试

Coffee being poured

结果:棕色液体倒进杯子里。没有感官层次、没有诱人感、没有特写细节、没有蒸汽。AI 把它当成了一个功能性动作,而不是一个感官体验。

V2 —— 补充细节

A close-up of rich dark coffee being poured from a ceramic pitcher into
a white cup. Steam rises from the cup. Warm morning light from a window
illuminates the scene. Cozy kitchen background. Slow motion pour.

有了特写、具体的容器、蒸汽、有方向性的光线和慢动作。画面会看起来诱人。但美食广告级别的品质要求微距级别的细节和对质感、光线交互、运动动态的精确控制。

V3 —— 最终版本

Extreme macro close-up of dark espresso being poured in slow motion from
a brushed copper Turkish coffee pot into a handmade ceramic cup with a
crackle-glaze finish. The liquid cascades in a thick, syrupy ribbon,
creating a swirling crema pattern as it hits the surface. Delicate
wisps of steam curl and dance upward, backlit by warm golden morning
light streaming through a frosted window to the right. Individual micro-
bubbles form and pop on the crema surface. A cinnamon stick and star
anise rest on the saucer beside the cup. Shallow depth of field with the
pour in razor-sharp focus and the background melting into warm bokeh.
The camera slowly drifts downward to follow the pour. Food commercial
cinematography. Warm amber-brown color grade. 8K ultra-realistic,
appetizing, sensory.
美食特写prompt三阶段迭代对比:咖啡倒注从基础到广告级画质

V1 到 V3:普通的咖啡倒注变成了有蒸汽动态、油脂纹理细节和诱人灯光的美食广告级微距镜头。

为什么这条 Prompt 有效

  • **"Syrupy ribbon"(糖浆般的缎带状液流)**描述了一种特定的黏稠质感,传递出品质感。稀薄、水状的液流看起来廉价,而浓厚、可控的液流看起来奢华。
  • **"Micro-bubbles form and pop on the crema"(微气泡在油脂表面生成和破裂)**把 AI 推向只有在微距美食摄影中才能看到的表面细节。这种颗粒度代表着专业级制作水平。
  • 逆光蒸汽是美食摄影中最"诱人"的视觉技巧。蒸汽只有在逆光时才可见,明确提出这一点确保 AI 正确放置光源。
  • **道具(肉桂棒、八角)**增添了感官语境,让观众几乎能闻到画面。

变体

变体 A —— 巧克力瀑布:

Extreme slow motion close-up of liquid dark chocolate pouring over a
stack of fresh strawberries on a marble slab. The chocolate flows in
thick rivulets over the red fruit, glistening under warm studio
spotlights. A dusting of gold leaf catches the light. Chocolate drips
from the edge of the marble in slow motion. Macro lens, razor-sharp
focus on the pour point. Dark moody background. Luxury food commercial
quality. 4K ultra-realistic.

变体 B —— 精酿啤酒:

Close-up of an amber craft beer being poured into a tulip glass at a
45-degree angle. Golden liquid flows down the inside of the glass,
building a creamy white head of foam. Tiny bubbles stream upward through
the beer. Warm backlight makes the liquid glow like amber. Condensation
forms on the outside of the cold glass. A wooden bar surface with
scattered hops visible in soft focus. Slow motion. 4K commercial quality.

Prompt #7:时尚与美妆——"秀场瞬间"

场景设定

一个时尚大片的瞬间——飞扬的布料、雕塑感的灯光、充满控制力的华丽感。这不是随手一拍,而是一个态度宣言。无论是用于时尚类小红书内容还是品牌宣传片,这类画面都能立刻抓住眼球。

V1 —— 基础尝试

A model walking

一个人在走路。没有服装细节、没有场景、没有灯光情绪、没有大片质感。AI 输出的是一个普通行人(字面意义上的),没有任何时尚感。

V2 —— 补充细节

A tall female model walks down a minimalist white runway in a flowing
red silk gown. The dress moves dramatically with each step. Bright
fashion show lighting from above. Audience blurred in the background.
Editorial photography style.

有了服装、场景、面料运动和灯光方向。可以生成一个可辨认的秀场画面。但要达到大片品质,还需要面料物理效果、精确的灯光技法和电影级运镜。

V3 —— 最终版本

A statuesque model strides confidently down a stark white runway in a
floor-length haute couture gown of flowing crimson organza layered over
structured black satin. The sheer fabric billows dramatically behind
her like a wave, catching air with each powerful step. Her expression
is fierce and unwavering. A sharp wind machine effect lifts the fabric
into a sculptural shape to her left. Overhead fashion spotlights create
hard, defined shadows on the runway floor. Rim lighting from behind
outlines her silhouette in white. The front row audience is a blurred
mosaic of camera flashes. Low-angle tracking shot from runway level,
moving with her pace. Shallow depth of field. Vogue editorial style.
Alexander McQueen show energy. 4K cinematic, crisp detail on fabric
textures, high-fashion color grading with deep blacks and saturated
red.
时尚秀场prompt三阶段迭代对比:从基本行走到高定大片级别

V1 到 V3:普通的走路变成了有雕塑感面料、大片灯光和秀场级制作品质的高定时刻。

为什么这条 Prompt 有效

  • **"Crimson organza layered over structured black satin"(猩红欧根纱覆盖在结构化黑缎上)**给 AI 两种对比面料:轻薄飘逸 vs 硬挺深色。这种反差创造了视觉复杂度。
  • **"Wind machine effect"(鼓风机效果)**是 AI 模型与时尚摄影制作关联的术语,触发标志性的面料飞扬效果。
  • **"Low-angle tracking shot from runway level"(从秀场地面水平的低角度跟拍)**将镜头放在真实时装摄影师坐的位置,这个视角赋予模特力量感和存在感。
  • **"Alexander McQueen show energy"(Alexander McQueen 秀的能量)**引用了以戏剧性、震撼性秀场著称的设计品牌,给 AI 一个情绪和美学目标。

变体

变体 A —— 街拍大片:

A woman in an oversized camel cashmere coat, vintage denim, and white
sneakers walks along a cobblestone Parisian street in autumn. Fallen
leaves blow past her feet. She adjusts round sunglasses with one hand.
The camera tracks alongside her at walking speed. Soft, overcast Parisian
light. Muted earth-tone color palette. The Row meets Celine aesthetic.
Natural, effortless, editorial. 4K, film grain, shallow depth of field.

变体 B —— 美妆特写:

Extreme close-up beauty shot of a model's face with flawless dewy skin,
bold graphic black eyeliner, and glossy burgundy lips. She slowly turns
her head from profile to three-quarter view. Light catches the highlight
on her cheekbone. Her expression shifts from serene to subtly powerful.
Ring light reflected in her eyes. Clean white background. Beauty
editorial lighting with soft key and sharp catch light. 4K ultra-sharp,
skin texture visible.

Prompt #8:动作与体育——"定格瞬间"

场景设定

一个运动的巅峰瞬间,带有超级碗转播般的冲击力。汗水、肌肉紧绷、最大力量输出的那一毫秒。体育摄影讲究时机,体育视频则是让这个时机停留更久。

V1 —— 基础尝试

A person playing basketball

一个人在运球。没有具体动作、没有巅峰瞬间、没有运动戏剧感。AI 不知道该展示上篮、运球还是系鞋带。

V2 —— 补充细节

A basketball player in mid-air going for a slam dunk. Sweat flies off
his body. Arena lights are bright. Crowd in the background cheering.
Dramatic angle. Slow motion.

AI 有了具体动作(扣篮)、身体细节(汗水)、场景(球馆)和时间修饰(慢动作)。可以生成可辨认的体育瞬间。但要达到转播级品质,需要精确的人体解剖细节、灯光设计和粒子物理。

V3 —— 最终版本

Ultra-dramatic slow motion capture of a muscular basketball player at
the apex of a powerful one-handed slam dunk. His body is fully extended,
arm reaching above the rim, fingers gripping the ball as it meets the
net. Every muscle fiber in his forearm is visible. Individual droplets of
sweat spray off his shaved head and outstretched arm, frozen in mid-air
and catching arena light like tiny prisms. The orange ball compresses
slightly against the backboard glass. Below, defenders look up
helplessly with blurred motion. Overhead arena lights create sharp
downward shadows and brilliant rim lighting on the player's shoulders.
The crowd is a bokeh wall of color and camera flashes. Low-angle shot
from below the basket looking up. Extreme slow motion, 1000fps feel.
8K ultra-sharp, hyper-realistic detail in skin texture, fabric wrinkles,
and sweat droplets. ESPN broadcast cinematic quality.
体育动作prompt三阶段迭代对比:篮球扣篮从基础到转播级画质

V1 到 V3:普通的打篮球变成了有汗水粒子物理效果、人体解剖细节和球馆灯光设计的转播级定格瞬间。

为什么这条 Prompt 有效

  • **"Apex of a powerful one-handed slam dunk"(单手暴力扣篮的最高点)**指定了动作中最具视觉张力的那一毫秒。巅峰帧永远是最有冲击力的。
  • **"Individual droplets of sweat... frozen in mid-air catching arena light like tiny prisms"(单个汗滴悬浮在空中,像微型棱镜一样折射球馆灯光)**给 AI 一个具体的粒子行为目标。这些微观细节让慢动作效果更加逼真。
  • **"Low-angle from below the basket looking up"(从篮下仰视)**是扣篮的标志性转播机位,最大化高度感和力量感。
  • **"1000fps feel"**告诉 AI 慢动作应该有多慢,它引用了真实高速摄影机的参数,AI 能将其关联到特定的视觉特征。

变体

变体 A —— 足球射门瞬间:

Extreme slow motion of a soccer striker's foot connecting with the ball
in a full-power volley shot. The boot compresses the ball's surface on
impact. Grass and mud spray upward from the follow-through. The
goalkeeper dives desperately in the background, fingers outstretched.
Side-angle shot at ground level. Rain falls in frozen droplets. Stadium
floodlights create god rays through the rain. 4K ultra-realistic,
hyper-detailed.

变体 B —— 拳击冲击:

Ultra slow motion close-up of a boxer's right hook connecting with a
heavy bag. The leather surface of the bag deforms dramatically on impact,
creating a ripple wave across its surface. Sweat explodes outward from
the glove in a mist. The boxer's wrapped knuckles and taped wrist are
in razor-sharp focus. Gym environment with hard overhead fluorescent
lighting. Dust particles hang in the air. Low-angle. Gritty, raw
aesthetic. 4K cinematic.

Prompt #9:图生视频——"让照片活起来"

场景设定

这条 prompt 和前八条不同。它不是文生视频,而是图生视频(Image-to-Video / I2V)——上传一张现有照片,然后告诉 AI 添加什么运动。这个工作流对于让人像照片、产品图和艺术作品"活过来"极其强大。挑战在于给出既能保留原图精华又能增添自然运动的指令。

完整的图生视频工作流请参考我们的图生视频详细教程

V1 —— 基础尝试

Make the person move

这是最常见的图生视频错误。"Move"不是一个运动指令。AI 可能让人物晃动、面部变形、手臂随机挥舞,或添加诡异的全身运动。模糊的 I2V prompt 产生不自然、"恐怖谷"般的结果。

V2 —— 补充细节

The woman slowly turns her head to the right and smiles gently. Her hair
shifts naturally with the movement. Soft breeze moves the fabric of her
dress slightly.

AI 有了具体运动(转头)、方向(向右)、表情变化(微笑)和次要运动(头发、布料)。结果会自然得多。但还可以通过微妙的氛围变化、镜头运动和精确的运动速度进一步优化。

V3 —— 最终版本

The woman slowly turns her head from looking slightly left to gazing
directly into the camera. Her expression transitions from contemplative
to a warm, knowing smile. A gentle breeze lifts wisps of her hair across
her forehead. She subtly exhales, her shoulders relaxing slightly
downward. The fabric of her linen blouse ripples faintly at the collar.
Background leaves on a tree behind her sway gently with the breeze. Warm
afternoon light intensifies slightly as if a cloud has passed, deepening
the golden tones on her skin. Very slow, almost imperceptible dolly in.
Natural, lifelike motion -- no exaggerated movement. Maintain the
photographic quality of the original image. Smooth 24fps.
图生视频prompt三阶段迭代对比:人像照片从基础到自然的动态效果

V1 到 V3:"make the person move"产生不自然的伪影,而精调的 I2V prompt 通过具体、微妙的运动指令从静态照片创造出自然、逼真的视频。

为什么这条 Prompt 有效

  • 明确的运动方向("from looking slightly left to gazing directly into camera"——从微微朝左看到直视镜头)避免了随机运动。AI 知道起始状态和结束状态。
  • 多尺度分层运动:转头(大幅)、微笑(中幅)、发丝飘动(小幅)、衬衫领口微颤(微幅)、背景树叶摇摆(环境)。多个运动尺度的叠加创造出自然感。
  • **"As if a cloud has passed"(仿佛云朵飘过)**给 AI 权限微妙调整光线,增添生命力而不改变原图已建立的视觉基调。
  • **"No exaggerated movement"(不要夸张的运动)**对 I2V 至关重要。没有这个约束,AI 模型倾向于过度动画化,产生恐怖谷效应。克制才是令人信服的 I2V 的关键。

变体

变体 A —— 风景照片变视频:

Clouds drift slowly from left to right across the sky. Water in the lake
ripples gently with a breeze. Grass in the foreground sways. A flock of
birds crosses the distant sky. The light subtly shifts as if time is
passing -- a slow golden hour transition. Very slow, meditative motion.
Maintain the photographic color grade and sharpness of the original.

变体 B —— 产品图变视频:

The watch face catches a moving light source that slowly sweeps from
left to right, creating a traveling highlight across the polished metal
bezel and glass face. The second hand ticks smoothly. Subtle reflections
shift on the brushed steel bracelet links. Background remains perfectly
still. Macro-level detail preserved. Smooth, professional product
motion.

Prompt #10:品牌与营销——"TVC 级别的镜头"

场景设定

一支奢侈品牌广告,在一个镜头内讲完一个微型故事。这不仅是产品视频,更是一种生活方式宣言。手表、佩戴者、那个瞬间、他所处的世界——同时传达品牌价值。关于如何将 AI 视频用于电商和产品营销的深入指南,请参考我们的电商产品视频教程

V1 —— 基础尝试

A luxury watch advertisement

结果:一块手表漂浮在白色背景上或平放在桌面上。没有语境、没有向往感、没有叙事。这是商品目录图,不是广告片。

V2 —— 补充细节

A man wearing a luxury silver watch leans against a yacht railing at
sunset. The camera focuses on the watch on his wrist. Ocean in the
background. Warm golden light. Premium feel. Commercial style.

有了语境(游艇)、生活方式(奢华)、焦点(手腕上的手表)和时间(日落)。可以产出有向往感的画面。但广告级品质要求精确的叙事、运动编排和制作级细节。

V3 —— 最终版本

A distinguished man in his 40s in a perfectly tailored navy linen suit
stands at the polished teak railing of a luxury sailing yacht at golden
hour. He gazes at the horizon with quiet confidence. The camera starts
as a wide establishing shot showing the yacht slicing through
crystalline Mediterranean water, then slowly pushes in to a medium
close-up, finally settling on an extreme close-up of the brushed
titanium dive watch on his left wrist. The watch face reflects the
orange-gold sky. His fingers tap once on the railing -- the watch catches
the light. Sea spray glitters in the air behind him, backlit by the low
sun. The yacht's white sails billow softly overhead. Wind ruffles his
hair and the lapels of his jacket. Warm amber key light from the setting
sun. Cool blue fill light from the reflected ocean. Cinematic
commercial quality. Omega or Rolex brand film aesthetic. Anamorphic
lens, shallow depth of field transitioning with the push-in. 4K,
ultra-premium production value.
品牌广告prompt三阶段迭代对比:奢侈手表广告从基础到TVC级制作品质

V1 到 V3:笼统的"奢侈手表广告"变成了有叙事性镜头运动、生活方式语境和顶级制作品质的品牌广告片。

为什么这条 Prompt 有效

  • **镜头叙事路径(全景→中景→特写)**在单一镜头内创造了叙事结构。先建立环境,再聚焦人物,最后落在产品上。这是奢侈品广告的标准叙事弧。
  • **"Fingers tap once on the railing"(手指在栏杆上轻叩一下)**是一个微小而刻意的人物动作,将视线自然引向手表,避免了刻意展示手腕的尴尬。
  • **双光源(琥珀色主光 + 蓝色补光)**模拟了黄金时段海面上的真实光线条件。这种组合是游艇生活方式广告的标志性视觉。
  • **"Omega or Rolex brand film aesthetic"(欧米茄或劳力士品牌广告美学)**给 AI 一个精确的制作品质参考——传达了预算级别、调色方向和整体视觉哲学。

变体

变体 A —— 香水品牌广告:

A woman in a flowing white silk dress walks barefoot through a sunlit
lavender field in Provence. She trails one hand through the lavender
tops as she walks, releasing a visible shimmer of pollen. A crystal
perfume bottle sits on a weathered stone wall in the foreground, the
lavender field reflected in its surface. The camera starts on the bottle,
racks focus to the woman approaching, then returns to the bottle as she
passes. Golden afternoon light. Soft lens flare. Chanel No. 5 campaign
aesthetic. Airy, dreamlike, aspirational. 4K cinematic.

变体 B —— 汽车品牌广告:

A matte black luxury sedan glides silently along a winding coastal
highway carved into dramatic sea cliffs at dusk. The last light of day
reflects off the car's polished roofline. Headlights carve through
gathering twilight. The camera tracks alongside the vehicle from a low
drone angle, keeping pace. Ocean waves crash against rocks far below.
Subtle interior glow visible through tinted windows. Smooth, powerful,
inevitable. Mercedes or Audi brand film quality. 4K cinematic,
anamorphic, teal and orange color grade.

速查表:10 条 Prompt 总览

#场景核心 Prompt 要素推荐模型最佳比例
1电影人像女性、麦田、黄金时段、85mm、推近Seedance 2.016:9
2产品展示水晶香水瓶、双灯带、环绕镜头Seedance 2.0 / 1.0 Pro16:9 或 1:1
3自然史诗多洛米蒂黎明、云海、老鹰、丁达尔光、IMAXSeedance 2.021:9
4都市街景东京雨夜、霓虹反射、孤独身影、跟拍Seedance 2.016:9 或 9:16
5动漫奇幻女武士、能量刀、樱花、环绕揭示Seedance 2.016:9
6美食特写浓缩咖啡微距、蒸汽、油脂细节、慢动作Seedance 1.0 Pro16:9 或 1:1
7时尚美妆高定秀场、欧根纱飞扬、低角度跟拍Seedance 2.09:16 或 16:9
8动作体育扣篮、汗水粒子、篮下仰视、1000fpsSeedance 2.016:9
9图生视频人像动画、分层运动、微妙光线变化Seedance 2.0 (I2V)匹配源图
10品牌营销游艇生活、全景到特写镜头叙事、双色光源Seedance 2.016:9 或 21:9

建议收藏这张表以备随时查阅。本文中的每条 prompt 都可以直接复制粘贴使用——根据你的具体项目调整细节即可。这些 prompt 在国产工具(如可灵 Kling、即梦)上同样有效,直接粘贴英文 prompt 即可。


Prompt 优化的五个核心技巧

这五条原则适用于任何 AI 视频生成器,掌握它们能加速你的 prompt 写作能力。

1. 从短开始,逐步加细节

不要试图一次写出完美的百字 prompt。从 15-20 个词开始,生成、评估、然后每次加一层细节。这种迭代方式帮助你理解哪些补充影响最大。有些细节会显著改善输出,有些几乎没有变化。不测试你永远不知道。

2. 每次只改一个变量

从 V1 到 V2 迭代时,忍住同时改所有东西的冲动。如果你一次修改了灯光、镜头、主体和场景,你无法知道哪个改动改善(或损害)了结果。每次迭代只改一个元素。这需要耐心,但能建立你对生成器如何理解语言的真正认知。

3. 保存你的"黄金 Prompt"

当一条 prompt 产生了出色的结果,立刻保存它。按类别建立个人 prompt 库:人像、产品、风景、抽象等等。随着时间积累,这个素材库会成为你最有价值的创作资产。你会复用结构、替换主体、重新组合已验证的元素。建议用笔记工具(如 Notion 或备忘录)分类管理你的 prompt 库。

4. 镜头比主体描述更重要

这是一条反直觉的真理:镜头和灯光指令通常比主体描述更重要。详细描述了主体但使用默认镜头,效果平平。简单的主体搭配精确的运镜、镜头选择和灯光设计,效果远超预期。当你的 prompt 长度有限时,把字数投资到"怎么拍"而不是"拍什么"上。

5. 用否定表述排除不想要的元素

许多 AI 视频生成器对排除性语言反应良好。加入"no text overlays""no watermarks""avoid flat lighting""no static camera"等短语可以帮助模型避开常见问题。当你在多次生成中发现了一个反复出现的问题时特别有用。不要只描述你想要什么,也描述你不想要什么。


常见问题

什么样的 AI 视频 prompt 才算好?

好的 AI 视频 prompt 具备三个核心特征:具体、有结构、包含运动描述。它应该包含清晰的主体描述、明确的动作或运动、氛围性场景设定、镜头指令(景别和运动方式)、光线方向和画质修饰词。最重要的原则是具体性——"a woman with silver-streaked black hair in a charcoal coat walking through falling snow"永远比"a woman outside"表现更好。同样关键的是:必须包含运动描述。视频 prompt 必须告诉 AI 什么在动、怎么动,否则输出接近静止图像。

AI 视频 prompt 应该多长?

理想区间是 40 到 80 个英文单词。少于 20 个词给 AI 太多自由度,产出不可预测的泛泛结果。超过 150 个词则可能自相矛盾或给模型造成困惑。对于大多数生成器,一段涵盖主体、运动、镜头、灯光和画质的 50-70 词集中段落能产出最好的结果。细节的质量比字数更重要。

这些 prompt 可以用在其他 AI 视频工具上吗?

可以。本文每条 prompt 都可以在 Seedance、Sora、可灵(Kling)、Runway、Pika、HaiLuo(海螺) 等主流文生视频工具上使用。核心原则——具体的主体、明确的运动、镜头指令和灯光描述——是通用的。不过不同模型对语言的理解方式略有差异,在 Seedance 上效果惊艳的 prompt 在其他工具上可能需要微调。把这些 prompt 当作强力起点,根据你使用的具体工具进行迭代。值得注意的是,即使是国产工具如可灵、即梦等,使用英文 prompt 通常也能获得更好的效果。

为什么我的生成结果和示例不同?

AI 视频生成包含随机性。同一条 prompt 每次生成都会产出不同结果,即使在同一个模型、同一个设置下也是如此。这是设计如此——它让创意探索成为可能。如果结果和预期不同,用同一条 prompt 生成 3-5 个变体,再决定是否需要修改 prompt。很多时候模型会在几次尝试内产出一个出色的版本。同时检查你的画面比例和模型版本设置,这些会显著影响输出。

如何在 prompt 中描述镜头运动?

使用真实的电影摄影术语。AI 模型的训练数据包含大量真实影视和摄影文本,因此它们理解专业术语。常用镜头运动:slow dolly in(缓慢推进)、tracking shot(跟踪镜头)、orbiting(环绕)、crane shot(升降镜头)、pan(水平摇镜)、tilt(垂直摇镜)、whip pan(甩镜头)。务必指定速度:slow dolly、gentle orbit、rapid whip pan。如果想要最精准的镜头控制,可以使用 Seedance 2.0 的参考视频功能,上传一段包含你想要的镜头运动的视频作为参考。

需要使用反向 prompt 吗?

取决于生成器。有些 AI 视频工具有专门的反向 prompt 输入框。没有这个功能的工具也没关系。当有反向 prompt 功能时,它对排除特定问题非常有效:"no text""no watermarks""no blurry faces""no static camera"。没有专门输入框时,你可以在主 prompt 中加入否定性描述:"avoid flat lighting"或"no visible artifacts"。不要在反向 prompt 中写几十条排除项——专注于你在之前的生成中遇到的 2-3 个具体问题。

一条 prompt 应该迭代多少次?

三到五次是实际项目中的最佳区间。本文的 V1 到 V3 框架不是随意设定的——它对应一个真实的工作流。V1 确立概念,V2 细化细节,V3 打磨制作品质。V3 之后通常只是调整微小元素。如果五次迭代仍未产出满意结果,问题很可能不在 prompt——可能是模型对这类特定内容的能力局限。尝试换一个方法来呈现这个场景,而不是往同一条 prompt 里加更多的词。

哪个 AI 视频生成器的 prompt 控制力最好?

Seedance 2.0 目前提供最全面的 prompt 控制力,原因如下:支持文生视频和图生视频,且结果一致性好。镜头运动关键词被可靠执行。灯光指令能准确转化为输出效果。支持多种画面比例(16:9、9:16、1:1、3:4、4:3、21:9),分辨率可达 2K。角色一致性功能意味着对同一角色的多次生成能保持视觉连贯性。完整的生成器对比请参考我们的 2026 年最佳 AI 视频生成器对比


结语

写好 AI 视频 prompt 是一项可学习的技能,不是天赋。本文的 10 条 prompt 证明了一个规律:从简单开始,逐步增加细节,始终把镜头、灯光和运动放在最优先的位置。

每一条 prompt 都可以直接复制使用。拿任意一条 V3 粘贴到你的生成器中,把它当作起点。然后迭代——换主体、换灯光、换镜头角度。每一次生成都会教你模型如何理解语言。这些 prompt 在 Seedance 上效果最佳,同时在可灵、即梦等国产工具上也可以直接使用英文 prompt。

提升最快的方法是大量生成并关注什么有效。保存你最好的 prompt,建立素材库。一段时间后,你会养成一种直觉,知道什么语言产出什么结果。不妨在小红书或 B 站上分享你的 prompt 迭代过程——AI 视频创作者社区正在快速成长,你的实践经验对其他人也很有价值。

打开 Seedance 开始尝试这些 prompt → —— 注册即送免费额度,无需信用卡。

想深入学习?我们的**完整 Seedance Prompt 指南**包含 50+ 额外 prompt,覆盖所有场景类别。


更多内容推荐:阅读我们的Seedance 完整 Prompt 指南(50+ 示例)。刚接触 Seedance?从如何使用 Seedance 完整教程开始。想把现有照片转成视频?查看我们的图生视频 AI 教程。用 AI 视频做电商?阅读产品视频制作指南。规划营销活动?查看AI 视频营销指南

Seedance 2.0 AI

Seedance 2.0 AI

AI 视频与创意技术