Abstrakt
Drtivá většina podnětů pro AI videa přináší špatné výsledky, a to především ze tří důvodů: nadměrná vágnost, protichůdné pokyny a nedostatečné popisy pohybu. Tento článek využívá 10 podnětů z reálných scénářů k demonstraci účinných technik psaní – každý z nich byl opakovaně upravován od nedostatečně výkonného V1 až po jemně vyladěný V3, což jasně ilustruje, co bylo upraveno, proč a kde byly nedostatky. Všechny podněty jsou připraveny k zkopírování a vložení do běžných generátorů, jako jsou Seedance, Sora, Kling a Runway. Po přečtení zvládnete základní strukturu podnětů a získáte praktickou knihovnu pokrývající scénáře, jako jsou filmové portréty, produktové reklamy, animace, jídlo, móda, sport, generování obrazu do videa a televizní reklamy značek. Otevřete Seedance a vyzkoušejte tyto podněty →
Poznámka: V současné době téměř všechny běžné generátory videí s umělou inteligencí (včetně domácích produktů, jako jsou KeLing a JiMeng) podporují zadávání pokynů v angličtině, přičemž anglické pokyny obvykle přinášejí lepší výsledky. Příklady pokynů v tomto článku zachovávají původní anglický text a jsou doplněny čínským vysvětlením, což vám umožní pochopit záměr každého pokynu předtím, než je zkopírujete a přímo použijete.

Stejný kreativní koncept může přinést velmi odlišné výsledky v závislosti na tom, zda je zadání vágní, nebo přesně definované.
Proč většina AI video promptů nefunguje dobře
Zadáte pasáž do nástroje pro tvorbu videí s umělou inteligencí, kliknete na „Generovat“ a zjistíte, že výsledek vůbec neodpovídá představám, které jste měli. Téměř každý už zažil tento rozpor, jehož příčiny jsou ve skutečnosti předvídatelné a řešitelné.
Tři nejčastější vzorce selhání
- Popis je příliš vágní. Pokyny jako „krásný západ slunce“ neposkytují AI prakticky žádné informace – místo pořízení snímku, předmět, měnící se světlo, požadovaná atmosféra – to vše zcela chybí. Takový vágní pokyn může vést pouze k průměrným, zapomenutelným obrazům.
2. Protichůdné pokyny. „Extrémní detailní širokoúhlý záběr osoby sprintující ve zpomaleném tempu“ – detailní záběr a širokoúhlý záběr jsou protichůdné; zpomalené tempo a rychlé tempo jsou protichůdné. Umělá inteligence se pokouší současně splnit nemožné pokyny, což vede k chaotickému vizuálnímu výsledku.
- Žádný popis pohybu. Text-to-video není text-to-image. Pokud pouze popíšete statickou scénu, aniž byste AI sdělili, co se pohybuje a jak se to pohybuje, mnoho generátorů vygeneruje statický obrázek s jemným efektem dýchání. Musíte AI výslovně sdělit, jak se pohyb ve scéně odehrává.
Tři pilíře dobrých podnětů
Vynikající AI video prompt se skládá ze tří základních prvků:
- Jasně definovaný objekt: Umělá inteligence přesně ví, co má vykreslit. Ne „osoba“, ale „žena ve věku kolem 30 let se stříbrnými prameny ve vlasech, která má na sobě opotřebovanou koženou bundu“.
- Výrazný pohyb: V záběru se něco děje. Objekt se pohybuje, kamera se pohybuje, částice se vznášejí, látka se vlní, světlo se mění. Pohyb je to, co dává videu smysl.
- Definovaná atmosféra: Osvětlení, teplota barev, nálada a styl nejsou volitelnými doplňky; jsou to klíčové faktory, které určují, zda je finální dílo „technickou ukázkou“ nebo „profesionální prací“.
Iterativní myšlení
Nejlepší autoři zadání nikdy nevytvoří dokonalé zadání na první pokus; spoléhají se na opakování. Každé zadání v tomto článku se řídí postupným přístupem ve třech verzích:
- V1 —— Základní pokus. To, co většina lidí zadává na začátku. Generuje obrazy, ale zůstává obecné a postrádá kontrolu.
- V2 —— Vylepšené detaily. Zahrnuje konkrétní nastavení, osvětlení, pohyb kamery nebo náladu. Výrazně vylepšené výsledky.
- V3 —— Finální verze. Modifikátory předmětu, pohybu, atmosféry, rámování, osvětlení a vizuální kvality jsou pečlivě propracovány. Každý prvek spolupracuje s ostatními a vytváří ucelený, působivý vizuál.
Tento iterativní proces vás naučí mnohem více než jakákoli jednotlivá „dokonalá nápověda“. Pochopíte změny, které každé přidání přináší, a proč jsou důležité.
Anatomie video výzev AI
Všechny vynikající podněty se řídí stejným vzorcem:
[主体 Subject] + [动作/运动 Action] + [风格/情绪 Style] + [运镜 Camera] + [光线 Lighting] + [画质 Quality]Každý prvek má svou specifickou roli:
| Prvek | Ovládací prvky | Příklad | |------|-------- -|------| | Předmět | Kdo/co je v záběru | „Mladá žena s vlajícími kaštanovými vlasy v uhlově šedém vlněném kabátě“ | | Akce | Co se děje, co se pohybuje | „pomalu kráčí padajícím sněhem, v chladném vzduchu je vidět její dech“ | | Styl | Vizuální estetika a emocionální tón | „melancholické, tlumené zemité tóny, estetika nezávislého filmu“ | | Kamera | Velikost záběru a pohyb | „střední sledovací záběr ze strany, pomalý dolly“ | | Osvětlení | Světelný zdroj, textura, směr | „zatažená zimní světla, měkké rozptýlené stíny, chladné modré podtóny“ | | Kvalita | Technické specifikace | „8K, malá hloubka ostrosti, anamorfní objektiv, filmové zrno“ |
Ne každá výzva musí obsahovat všech šest prvků, ale čím více jich pokryjete, tím větší kontrolu budete mít nad generovaným výstupem. Níže je uvedeno deset scénářů z reálného života, které demonstrují praktickou účinnost této metodiky.
Zadání č. 1: Filmové portréty – „Fotografie ožívají“
Nastavení
Filmový portrét, jako by byl zachycen z oceněného filmu. Subjekt nepózuje – prožívá okamžik. Vítr jí čechrá vlasy, její výraz má určitou váhu a světlo tvaruje její rysy jako renesanční malba.
V1 — Počáteční pokusy
A woman looking at cameraTo je to, co většina začátečníků obvykle zadává. Výsledkem je nevýrazný čelní portrét ve stylu pasové fotografie: neutrální výraz, standardní osvětlení, zcela bez jakéhokoli pocitu prostředí nebo příběhu. Umělá inteligence nedostává žádné informace o emocích, scéně nebo vizuálním stylu, takže výsledek je pouze náhodný výstup.
V2 — Další podrobnosti
A woman with dark curly hair looks directly at the camera with a slight
smile. Wind blows her hair across her face. She stands in a golden wheat
field at sunset. Warm light on her skin.Bylo dosaženo významného pokroku. Scéna (pšeničné pole), čas (západ slunce), fyzická interakce (vítr čechrající vlasy) a výraz (úsměv) jsou nyní přítomny. Stále však chybí konkrétní parametry kamery, přesný směr světla a modifikátory kvality obrazu.
V3 — Finální verze
Cinematic close-up portrait of a woman in her late 20s with dark curly
hair and deep brown eyes. She gazes directly into the camera with quiet
intensity, lips slightly parted. A warm breeze lifts strands of hair
across her face. She stands in a vast golden wheat field stretching to
the horizon. Golden hour backlighting creates a luminous halo around her
hair and shoulders. Warm amber fill light from a reflector below. Slow,
subtle dolly in. Shallow depth of field, f/1.4, 85mm lens. Gentle lens
flare from the low sun. Film grain, anamorphic bokeh. Ultra-realistic
cinematic 4K quality.
Iterativní proces V1 až V3: stejný koncept se vyvinul z obyčejného portrétu do portrétu v kinematografické kvalitě s osvětlením, pohybem kamery a atmosférickým prostředím.
Proč je tento pokyn účinný
- Objektiv 85 mm + clona f/1,4 znamená komprimovanou perspektivu generovanou umělou inteligencí a krémové rozostření pozadí – charakteristickou texturu profesionální portrétní fotografie.
- Proti světlo + jantarové doplňkové světlo vytváří dimenzionální vrstvy osvětlení. Proti světlo odděluje objekt od pozadí, zatímco doplňkové světlo zabraňuje tomu, aby se obličej stal siluetou.
- Pomalý posun kamery přidává jemný pohyb, aniž by odváděl pozornost od objektu, a vytváří pocit, že je divák vtažen do záběru.
- „Tichá intenzita, mírně pootevřené rty“ poskytuje AI emocionální cíl, nikoli pouze fyzický popis.
Varianty
Varianta A — Městské portréty v deštivé noci:
Cinematic close-up of a man in his 30s with a shaved head and stubble,
standing still on a rain-soaked city street at night. Rain streams down
his face. He stares into the distance with exhausted resolve. Neon signs
reflect pink and blue on the wet pavement behind him. Shallow depth of
field. Slow push-in. Anamorphic lens flares. Cool blue tones with warm
neon accents. Ultra-realistic 4K, film grain.Varianta B — Portrét starého muže ve sněhu:
Tight close-up of an elderly woman with silver hair and deep laugh lines,
eyes glistening with emotion. She stands outdoors in gently falling snow.
Snowflakes settle on her dark wool shawl. Overcast soft light. A single
warm tear traces down her weathered cheek. Extremely shallow depth of
field. Static camera, no movement. 85mm lens. Muted, desaturated color
palette. Cinematic 4K, photorealistic.Zadání č. 2: Prezentace produktu – „Plovoucí luxus“
Nastavení
Láhev prémiového parfému prezentovaná jako šperk – zavěšená, otáčející se, zachycující světlo. Takové záběry tradičně vyžadovaly, aby značky utratily desítky tisíc liber za pronájem profesionálních studií. Se správným podnětem může AI během několika sekund vygenerovat produktová videa v komerční kvalitě. Ať už jste prodejce v e-commerce nebo majitel značky, tyto vizuály dosahují mimořádně vysokých konverzních poměrů na TikToku a Xiaohongshu.
V1 — Počáteční pokusy
A perfume bottle on a tableVýsledek: Na náhodném stole leží láhev nevýrazného parfému. Žádné drama, žádný půvab, žádná touha koupit. Když dáte AI průměrný pokyn, může vám dodat pouze průměrný obrázek.
V2 — Další podrobnosti
A luxury glass perfume bottle with gold accents floating in mid-air against
a dark background. Soft light reflects off the glass surface. The bottle
slowly rotates. Professional product photography style.Významný pokrok. Mezi funkce patří levitační efekty, kontrast s tmavým pozadím, odrazy světla a stylistické odkazy. Další vylepšení je však možné dosáhnout pomocí přesného uspořádání osvětlení, atmosférických prvků a pohybu kamery.
V3 — Finální verze
A luxury crystal perfume bottle with faceted edges and a gold cap floats
weightlessly in a void of deep matte black. The bottle rotates slowly on
its vertical axis, completing a quarter turn. Razor-sharp caustic light
refractions dance across the glass surface. Two opposing strip lights --
one warm amber, one cool white -- create dramatic dual-tone reflections on
the faceted crystal. Tiny golden particles drift lazily through the air
around the bottle. A single droplet of amber liquid clings to the bottle's
shoulder, catching the light. Smooth orbiting camera movement. Extreme
product close-up. 8K commercial quality, ultra-sharp focus throughout,
professional studio lighting.
V1 až V3: Láhev parfému se promění z nevýrazného snímku na stole v komerční produktovou prezentaci s profesionálním osvětlením a atmosférickými detaily.
Proč je tento pokyn účinný
- „Matně černé“ čistě černé pozadí eliminuje všechny rušivé prvky a upoutává pozornost na produkt. Jedná se o standardní postup v luxusní fotografii.
- Dvojité světelné pruhy (teplá jantarová + studená bílá) vytvářejí vícebarevné odrazy, které skleněným výrobkům dodávají sofistikovaný vzhled. Jediný zdroj světla by způsobil, že by hotový produkt působil lacině a plochě.
- „Kaustické refrakce světla“ je technický termín, kterému AI modely dobře rozumějí. Spouští složité světelné vzory generované průhlednými objekty.
- Zlaté částice dodávají prostředí hloubku, aniž by konkurovaly produktu v upoutávání pozornosti.
Varianty
Varianta A — Uvedení technologického produktu na trh:
A matte black wireless earbud case floats against a gradient of deep
navy to black. The case slowly opens, revealing pearl-white earbuds inside.
Volumetric blue light emanates from within the case. Tiny light particles
drift upward. Orbiting camera. Edge-lit rim lighting in electric blue.
Ultra-clean, Apple-style product aesthetic. 8K, ultra-sharp.Varianta B — Reklama na kosmetický výrobek:
A rose-gold lipstick tube rotates slowly against soft pink studio
backdrop. The cap twists off and separates, floating beside the tube.
Creamy lipstick bullet catches soft ring light. Rose petals in soft focus
drift across the foreground. Smooth macro close-up. Beauty commercial
lighting with soft key and gentle fill. Ultra-realistic 4K.Podnět č. 3: Přírodní epos – „Atmosférické letecké záběry“
Nastavení
Dechberoucí epický záběr krajiny – takový, jaký byste očekávali v přírodopisných dokumentech nebo v úvodních sekvencích filmů ve stylu Pána prstenů. Jádrem takových obrazů je pocit rozlehlosti, atmosférické hloubky a naprosté velkoleposti. Použitý jako úvod k videím s krajinami na Bilibili nebo Douyin, má obrovský vizuální dopad.
V1 — Počáteční pokusy
Mountains with cloudsDostanete hory. Dostanete mraky. Nedostanete úžas. Umělá inteligence postrádá jakékoli vodítko ohledně času, dynamiky počasí, smyslu pro měřítko, kompozice nebo nálady, což vede k výchozímu nastavení tapety na ploše.
V2 — Další podrobnosti
Dramatic mountain range at sunrise with clouds flowing through the valleys.
Golden light hits the peaks. Aerial drone shot slowly moving forward.
Mist and fog in the valleys below. Epic landscape photography.Výrazně vylepšeno. S ohledem na čas (východ slunce), směr osvětlení, atmosférické efekty, pohyb kamery a stylistické reference. K dosažení skutečně filmové kvality jsou však stále zapotřebí konkrétní geografické reference, dynamické povětrnostní podmínky a klíčová slova pro vizuální věrnost na úrovni produkce.
V3 — Finální verze
Epic aerial establishing shot of a jagged snow-capped mountain range
resembling the Dolomites at dawn. The camera drifts slowly forward over
a sea of low-lying clouds that fill the valleys like white rivers.
Golden-pink alpenglow illuminates the highest peaks while the valleys
remain in cool blue shadow. Wisps of cloud catch on rocky spires and
trail into the wind. A single eagle soars far below the camera, its
wings outstretched against the cloud sea. Volumetric god rays break
through a gap between two peaks. Slow, majestic forward dolly. IMAX
quality, ultra-wide 21:9 aspect ratio, photorealistic, extreme detail
in rock textures and snow patterns. 8K resolution.
V1 až V3: Obyčejné horské výhledy se proměňují v záběry v kvalitě IMAX s objemovým osvětlením, vlnícími se mraky a pocitem monumentální velikosti.
Proč je tento pokyn účinný
- „Připomínající Dolomity“ poskytuje AI konkrétní geografický odkaz. Skutečná topografie poskytuje soudržnější geologické struktury než abstraktní „hory“.
- „Alpenglow“ označuje konkrétní světelný jev, kdy vrcholky hor září teplou růžovou barvou předtím, než slunce vyjde nad obzor. Díky rozsáhlé sbírce přírodních fotografií v trénovacích datech AI tento termín chápe.
- Orel poskytuje živou referenci měřítka. Bez něj by scéna mohla vypadat jako miniaturní model. Pták vznášející se v rozsáhlé krajině vyvolává pocit „nekonečnosti“.
- „Boží paprsky prorážející mezeru“ vytvářejí vizuální ohnisko kompozice, které vede pohled diváka.
Varianty
Varianta A — Blížící se bouře:
Dramatic time-lapse-style shot of a vast Icelandic black sand desert.
Towering cumulonimbus storm clouds roll in from the horizon, their bases
dark and heavy with rain. Lightning flickers within the cloud mass.
A solitary volcanic peak stands defiant in the middle distance. The light
shifts from warm gold to ominous green-grey as the storm advances.
Wide-angle static camera. 4K cinematic, photorealistic.Varianta B — Tropický klid:
Aerial overhead shot drifting slowly over a turquoise tropical lagoon.
Crystal-clear water reveals coral reefs and white sand below. A small
wooden boat with a red sail drifts lazily across the lagoon. Palm trees
line the crescent beach. Gentle ripples catch sunlight and create dancing
caustic patterns on the seabed. Golden afternoon light. Smooth, dreamlike
camera movement. 4K ultra-realistic, vivid but natural colors.Zadání č. 4: Městské ulice – „Puls města“
Nastavení
Živá městská ulice v noci. Déšť, neonová světla, odrazy na zemi a pohyb chodců se prolínají a vytvářejí pohlcující pocit, jako byste stáli na rohu ulice ve dvě hodiny ráno. Takové scény jsou nesmírně populární v kategorii videí „městská procházka“ na Douyin a Bilibili.
V1 — Počáteční pokusy
A city street at nightVýsledek: Rozmazaná masa tmavých budov, možná s několika světly. Žádná atmosféra, žádný příběh, žádná vizuální jedinečnost. „Noční panorama města“ může být klidná předměstská ulička nebo Times Square – AI není vůbec schopná rozeznat rozdíl.
V2 — Další podrobnosti
A rainy city street at night with neon signs reflecting on the wet
pavement. People walk with umbrellas. A taxi passes through a puddle,
splashing water. Colorful lights everywhere. Cinematic look.S počasím, odrazy, aktivitami postav a vozidly na místě začíná scéna ožívat. Aby však skutečně zazářila, je třeba stanovit konkrétní estetický styl, chování kamery a hierarchii osvětlení.
V3 — Finální verze
A rain-soaked Tokyo side street at night. The narrow road glistens with
reflections of dozens of vertical neon signs in Japanese characters --
hot pink, electric blue, acid green. A lone figure in a black trench coat
walks away from the camera, their silhouette dark against the neon glow.
Steam rises from a ramen shop's exhaust vent on the left. A bicycle
leans against a vending machine glowing soft white. Rain falls steadily,
each drop catching neon color as it descends. Slow tracking shot following
the figure from behind. Shallow depth of field: the figure is sharp, the
distant neon blurs into bokeh circles. Wet pavement acts as a mirror,
doubling every light source. Anamorphic lens flares. Blade Runner meets
Lost in Translation atmosphere. 4K cinematic, film grain, moody cool
blue-purple color grade.
V1 až V3: Zamlžená noční scéna se promění v neonově osvětlenou deštivou ulici s pečlivou kompozicí, dynamickými povětrnostními efekty a filmovými odkazy.
Proč je tento pokyn účinný
- „Tokijská boční ulice“ ukotvuje AI ke konkrétnímu vizuálnímu slovníku: úzké uličky, hustě rozmístěné vertikální nápisy, prodejní automaty. Obecné „město“ tuto soudržnost postrádá.
- „Osamělá postava v černém trenčkotu odchází“ poskytuje narativní těžiště a dráhu pohybu sledovacího záběru.
- „Mokrý chodník funguje jako zrcadlo“ explicitně instruuje AI, aby generovala efekt znásobení odrazů – vizuálně nejvýraznější prvek kinematografie deštivé noci.
- Filmové odkazy (Blade Runner + Lost in Translation) dávají AI přesný estetický cíl, který je mnohem účinnější než vágní pokyn „filmový“.
Varianty
Varianta A — Denní tržiště:
Bustling narrow market street in Marrakech at midday. Colorful fabric
awnings in saffron, cobalt, and crimson create dappled shade patterns on
the ground. Merchants arrange pyramids of spices in copper bowls. Dust
motes float in shafts of sunlight. A cat sits atop a stack of woven
rugs. Steady handheld camera walking slowly through the market. Warm,
saturated color palette. Documentary-style 4K, natural lighting.Varianta B — Budoucí metropole:
A massive elevated highway cuts through a futuristic megalopolis at dusk.
Flying vehicles stream along neon-lit lanes above and below. Holographic
advertisements flicker on the sides of impossibly tall buildings.
A distant megastructure disappears into clouds. Rain falls sideways in
the wind. Low-angle wide shot from a pedestrian bridge. Teal and orange
color palette. Cyberpunk 2077 aesthetic. 4K ultra-detailed.Podnět č. 5: Anime a fantasy — „Poslední bitva samuraje“
Nastavení
Samuraj v anime stylu stojí odhodlaně před nemožnou bitvou. Okvětní lístky třešňových květů, energetické efekty a dramatická obloha se spojují a vytvářejí scénu, která připomíná klíčový snímek z animovaného filmu s vysokým rozpočtem. Pro čtenáře, kteří často sledují anime na Bilibili, mají takové obrazy hluboký význam.
V1 — Počáteční pokusy
An anime character with a swordVýsledek: Tuhá, generická postava držící nůž. Žádná dynamická póza, žádné prostředí, žádná stylistická definice. „Anime“ je široká kategorie zahrnující desítky podžánrů; AI bude ve výchozím nastavení generovat pouze nejběžnější variantu.
V2 — Další podrobnosti
A female anime warrior in ornate samurai armor stands on a cliff edge
holding a glowing katana. Cherry blossoms fall around her. A dramatic
sunset sky behind her. Detailed anime art style with clean line work.Bylo dosaženo významného pokroku. Byly stanoveny konkrétní podrobnosti týkající se brnění a zbraní (včetně světelných efektů), prvků prostředí (třešňové květy, útesy) a oblohy. Je však třeba dále pracovat na vylepšení vizuálních efektů, definování přesného uměleckého stylu a začlenění pohybu.
V3 — Finální verze
A fierce female samurai warrior stands at the edge of a shattered cliff
overlooking a burning battlefield far below. She wears battle-worn
crimson and black lacquered armor with gold filigree, one shoulder plate
cracked. Her long white hair whips violently in a supernatural wind.
She grips a katana that radiates crackling blue-white energy along its
blade. Cherry blossom petals swirl upward in a vortex around her. The
sky is a dramatic gradient from blood-red at the horizon through deep
violet to black overhead. Lightning forks across the clouds. The camera
slowly orbits around her in a dramatic reveal. High-detail cel-shaded
anime style with dynamic ink-line edges. Ufotable studio quality.
Vibrant color palette. 4K ultra-detailed.
V1 až V3: Obyčejné anime postavy se proměnily v klíčové snímky ve studiové kvalitě s nadpřirozenými efekty, environmentálním vyprávěním a filmovou kamerou.
Proč je tento pokyn účinný
- „Kvalita studia Ufotable“ odkazuje na animační studio proslulé svými vizuálními efekty (Demon Slayer, série Fate). Model AI chápe charakteristickou estetiku studia.
- Detaily bitevních jizev („jedna ramenní deska prasklá“) zvyšují hloubku příběhu. Tento válečník zažil boj a vypráví příběh bez dialogů.
- „Okvětní lístky třešňových květů víří vzhůru ve víru“ poskytuje explicitní směr pohybu. „Padající třešňové květy“ jsou statickým klišé, zatímco vír směřující nahoru naznačuje nadpřirozené síly.
- „Praskající modrobílá energie podél čepele“ představuje dynamické světelné efekty – klíčový prvek, který povyšuje anime scénu z ilustrace na animaci.
Varianty
Varianta A — Temný fantasy mág:
A hooded dark elf sorcerer floats cross-legged above a stone altar in
an ancient underground temple. Runes carved into the floor pulse with
deep emerald light. Dozens of ancient tomes orbit slowly around the
sorcerer, their pages fluttering. Dark energy coils from the sorcerer's
outstretched hands like living smoke. Candlelight flickers on obsidian
walls. Slow push-in camera. Dark Souls meets Studio Ghibli aesthetic.
Painterly digital art style. 4K ultra-detailed.Varianta B — Pilot mecha:
Dramatic low-angle shot of a massive humanoid mech standing in a
destroyed cityscape. Rain pours down its scarred titanium armor. The
cockpit glows warm amber. One hand grips a massive energy cannon, still
smoking from a recent shot. Sparks shower from a damaged joint. The
pilot is visible as a small silhouette through the cockpit glass.
Lightning illuminates the scene. Gundam-inspired mecha design.
Cel-shaded anime with hyper-detailed mechanical rendering. 4K.Úkol č. 6: Kulinářský detail – „Dokonalé nalití“
Nastavení
Detailní záběr nalévání kávy, tak živý, že téměř cítíte její vůni přes obrazovku. Každá reklama na potraviny se opírá o záběry jako tento: tekutina pomalu stékající, stoupající páry, teplé tóny vyvolávající chuť k jídlu. V profesionální produkci vyžadují takové záběry speciální vybavení a makroobjektivy. S AI stačí pouze popsat, co chcete. Ideální pro obsah food blogerů na platformách jako Xiaohongshu a Douyin.
V1 — Počáteční pokusy
Coffee being pouredVýsledek: Hnědá tekutina nalitá do šálku. Žádné smyslové vrstvy, žádný půvab, žádné detaily zblízka, žádná pára. Umělá inteligence to považovala spíše za funkční činnost než za smyslový zážitek.
V2 — Další podrobnosti
A close-up of rich dark coffee being poured from a ceramic pitcher into
a white cup. Steam rises from the cup. Warm morning light from a window
illuminates the scene. Cozy kitchen background. Slow motion pour.Detailní záběry, konkrétní nádoby, pára, směrové osvětlení a zpomalené záběry přispívají k lákavému vizuálnímu dojmu. Dosáhnout kvality reklam na potraviny však vyžaduje detaily na makroúrovni a přesnou kontrolu nad texturou, interakcí světla a dynamikou pohybu.
V3 — Finální verze
Extreme macro close-up of dark espresso being poured in slow motion from
a brushed copper Turkish coffee pot into a handmade ceramic cup with a
crackle-glaze finish. The liquid cascades in a thick, syrupy ribbon,
creating a swirling crema pattern as it hits the surface. Delicate
wisps of steam curl and dance upward, backlit by warm golden morning
light streaming through a frosted window to the right. Individual micro-
bubbles form and pop on the crema surface. A cinnamon stick and star
anise rest on the saucer beside the cup. Shallow depth of field with the
pour in razor-sharp focus and the background melting into warm bokeh.
The camera slowly drifts downward to follow the pour. Food commercial
cinematography. Warm amber-brown color grade. 8K ultra-realistic,
appetizing, sensory.
V1 až V3: Obyčejné překapávané kávy se proměnily v gurmánské makrofotografie reklamní kvality s dynamickou párou, složitými vzory cremy a lákavým osvětlením.
Proč je tento pokyn účinný
- „Sirupovitá stuha“ popisuje specifickou viskózní texturu, která vyvolává dojem kvality. Tenké, vodnaté proudy působí lacině, zatímco husté, kontrolované proudy vyvolávají dojem luxusu.
- „Mikrobublinky se tvoří a praskají na cremě“ posouvá AI směrem k detailům povrchu, které jsou viditelné pouze v makrofotografii jídla. Tato granularita symbolizuje profesionální řemeslné zpracování.
- Prosvětlená pára je nejvíce „poutavou“ vizuální technikou v fotografování jídla. Pára je viditelná pouze proti protisvětlu; výslovné uvedení tohoto faktu zajišťuje, že AI správně umístí zdroje světla.
- Rekvizity (tyčinky skořice, badyán) přidávají smyslový kontext, díky kterému diváci téměř cítí vůni scény.
Varianty
Varianta A — Čokoládový vodopád:
Extreme slow motion close-up of liquid dark chocolate pouring over a
stack of fresh strawberries on a marble slab. The chocolate flows in
thick rivulets over the red fruit, glistening under warm studio
spotlights. A dusting of gold leaf catches the light. Chocolate drips
from the edge of the marble in slow motion. Macro lens, razor-sharp
focus on the pour point. Dark moody background. Luxury food commercial
quality. 4K ultra-realistic.Varianta B — Řemeslné pivo:
Close-up of an amber craft beer being poured into a tulip glass at a
45-degree angle. Golden liquid flows down the inside of the glass,
building a creamy white head of foam. Tiny bubbles stream upward through
the beer. Warm backlight makes the liquid glow like amber. Condensation
forms on the outside of the cold glass. A wooden bar surface with
scattered hops visible in soft focus. Slow motion. 4K commercial quality.Zadání č. 7: Móda a krása – „Momenty z módních přehlídek“
Nastavení
Módní editorial – vlající látky, sochařské osvětlení a působivý pocit luxusu. Nejedná se o náhodný snímek, ale o vyjádření záměru. Ať už jde o módní obsah na Xiaohongshu nebo propagační filmy značek, takové snímky okamžitě upoutají pozornost.
V1 — Počáteční pokusy
A model walkingČlověk kráčí. Nejsou zde žádné detaily oblečení, žádné prostředí, žádné atmosférické osvětlení, žádná filmová kvalita. Výstup AI zobrazuje obyčejného chodce (v doslovném smyslu), který postrádá jakýkoli smysl pro módu.
V2 — Další podrobnosti
A tall female model walks down a minimalist white runway in a flowing
red silk gown. The dress moves dramatically with each step. Bright
fashion show lighting from above. Audience blurred in the background.
Editorial photography style.S oděvy, kulisami, pohybem látek a nasvícením lze vytvořit rozpoznatelnou scénu z módní přehlídky. K dosažení kvality celovečerního filmu jsou však zapotřebí další prvky: fyzikální efekty látek, přesné techniky nasvícení a filmová kamera.
V3 — Finální verze
A statuesque model strides confidently down a stark white runway in a
floor-length haute couture gown of flowing crimson organza layered over
structured black satin. The sheer fabric billows dramatically behind
her like a wave, catching air with each powerful step. Her expression
is fierce and unwavering. A sharp wind machine effect lifts the fabric
into a sculptural shape to her left. Overhead fashion spotlights create
hard, defined shadows on the runway floor. Rim lighting from behind
outlines her silhouette in white. The front row audience is a blurred
mosaic of camera flashes. Low-angle tracking shot from runway level,
moving with her pace. Shallow depth of field. Vogue editorial style.
Alexander McQueen show energy. 4K cinematic, crisp detail on fabric
textures, high-fashion color grading with deep blacks and saturated
red.
V1 až V3: Obyčejná chůze se proměnila v haute couture momenty s plastickými látkami, dramatickým osvětlením a řemeslnou zručností na úrovni módních přehlídek.
Proč je tento pokyn účinný
- „Karmínová organza vrstvená přes strukturovaný černý satén“ představuje AI dvě kontrastní látky: průsvitnou a splývavou versus tuhou a tmavou. Tento kontrast vytváří vizuální komplexnost.
- „Efekt větrného stroje“ je termín, který spojuje model AI s produkcí módní fotografie a vyvolává charakteristický efekt vlnění látky.
- „Nízký úhel sledování z úrovně přehlídkového mola“ umisťuje kameru do výšky skutečného módního fotografa, což modelu dodává pocit síly a přítomnosti.
- „Energie přehlídky Alexandra McQueena“ odkazuje na módní dům proslulý svými dramatickými a elektrizujícími přehlídkami, které poskytují AI emocionální a estetický měřítko.
Varianty
Varianta A — Street Style Shoot:
A woman in an oversized camel cashmere coat, vintage denim, and white
sneakers walks along a cobblestone Parisian street in autumn. Fallen
leaves blow past her feet. She adjusts round sunglasses with one hand.
The camera tracks alongside her at walking speed. Soft, overcast Parisian
light. Muted earth-tone color palette. The Row meets Celine aesthetic.
Natural, effortless, editorial. 4K, film grain, shallow depth of field.Varianta B — Detailní záběr krásy:
Extreme close-up beauty shot of a model's face with flawless dewy skin,
bold graphic black eyeliner, and glossy burgundy lips. She slowly turns
her head from profile to three-quarter view. Light catches the highlight
on her cheekbone. Her expression shifts from serene to subtly powerful.
Ring light reflected in her eyes. Clean white background. Beauty
editorial lighting with soft key and sharp catch light. 4K ultra-sharp,
skin texture visible.Zadání č. 8: Akce a sport – „Zmrazené okamžiky“
Nastavení
Vrcholný okamžik sportovního výkonu, přenesený s dopadem přenosu Super Bowlu. Ta zlomková vteřina potu, napnutých svalů a maximálního výkonu. Sportovní fotografie vyžaduje dokonalé načasování; sportovní video umožňuje, aby ten okamžik trval déle.
V1 — První pokusy
A person playing basketballPostava dribluje. Nejsou zde žádné konkrétní akce, žádné vrcholné momenty, žádné dramatické prvky. Umělá inteligence neví, zda má zobrazit lay-up, driblování nebo zavazování tkaniček.
V2 — Další podrobnosti
A basketball player in mid-air going for a slam dunk. Sweat flies off
his body. Arena lights are bright. Crowd in the background cheering.
Dramatic angle. Slow motion.Umělá inteligence nyní zahrnuje konkrétní akce (slam dunks), tělesné detaily (pot), prostředí (sportovní arény) a časové prvky (zpomalené záběry). Dokáže generovat rozpoznatelné sportovní momenty. K dosažení vizuální kvality vysílání jsou však zapotřebí přesné anatomické detaily lidského těla, návrh osvětlení a částicová fyzika.
V3 — Finální verze
Ultra-dramatic slow motion capture of a muscular basketball player at
the apex of a powerful one-handed slam dunk. His body is fully extended,
arm reaching above the rim, fingers gripping the ball as it meets the
net. Every muscle fiber in his forearm is visible. Individual droplets of
sweat spray off his shaved head and outstretched arm, frozen in mid-air
and catching arena light like tiny prisms. The orange ball compresses
slightly against the backboard glass. Below, defenders look up
helplessly with blurred motion. Overhead arena lights create sharp
downward shadows and brilliant rim lighting on the player's shoulders.
The crowd is a bokeh wall of color and camera flashes. Low-angle shot
from below the basket looking up. Extreme slow motion, 1000fps feel.
8K ultra-sharp, hyper-realistic detail in skin texture, fabric wrinkles,
and sweat droplets. ESPN broadcast cinematic quality.
V1 až V3: Běžná basketbalová hra se promění v záběry v televizní kvalitě s fyzikálními efekty potních kapek, anatomickými detaily a osvětlením arény.
Proč je tento pokyn účinný
- „Vrchol mohutného smeče jednou rukou“ zachycuje tu milisekundu maximálního vizuálního napětí. Vrcholový snímek je vždy nejúčinnější.
- „Jednotlivé kapky potu... zamrzlé ve vzduchu, které zachycují světlo arény jako malé hranoly“ poskytují AI konkrétní cíl pro chování částic. Tyto mikroskopické detaily činí zpomalené sekvence autentičtějšími.
- „Nízký úhel pod košem směřující nahoru“ představuje typický úhel záběru pro smeče, který maximalizuje pocit výšky a síly.
- „Pocit 1000 fps“ dává AI pokyn k požadovanému tempu zpomaleného záběru s odkazem na parametry skutečné vysokorychlostní kamery, které AI může spojit s konkrétními vizuálními charakteristikami.
Varianty
Varianta A — Fotbalový moment:
Extreme slow motion of a soccer striker's foot connecting with the ball
in a full-power volley shot. The boot compresses the ball's surface on
impact. Grass and mud spray upward from the follow-through. The
goalkeeper dives desperately in the background, fingers outstretched.
Side-angle shot at ground level. Rain falls in frozen droplets. Stadium
floodlights create god rays through the rain. 4K ultra-realistic,
hyper-detailed.Varianta B — Boxerský úder:
Ultra slow motion close-up of a boxer's right hook connecting with a
heavy bag. The leather surface of the bag deforms dramatically on impact,
creating a ripple wave across its surface. Sweat explodes outward from
the glove in a mist. The boxer's wrapped knuckles and taped wrist are
in razor-sharp focus. Gym environment with hard overhead fluorescent
lighting. Dust particles hang in the air. Low-angle. Gritty, raw
aesthetic. 4K cinematic.Podnět č. 9: Video TuSheng – „Oživování fotografií“
Nastavení scény
Tento příkaz se liší od předchozích osmi. Nejedná se o převod textu na video, ale spíše o převod obrázku na video (I2V) – nahrajte existující fotografii a dejte AI pokyn, jaký pohyb má přidat. Tento pracovní postup se ukazuje jako mimořádně účinný pro oživení portrétních fotografií, obrázků produktů a uměleckých děl. Výzva spočívá v poskytnutí pokynů, které zachovají podstatu původního obrázku a zároveň zavedou přirozeně vypadající pohyb.
Kompletní postup převodu obrázků na videa najdete v našem podrobném návodu k převodu obrázků na videa.
V1 — Počáteční pokusy
Make the person moveToto je nejčastější chyba v generativním videu. „Pohyb“ není pokyn k pohybu. Umělá inteligence může způsobit, že se postavy budou kývat, tváře se budou deformovat, paže budou náhodně mávat nebo se přidají bizarní pohyby celého těla. Nejednoznačné pokyny I2V vedou k nepřirozeným výsledkům připomínajícím efekt „uncanny valley“.
V2 — Další podrobnosti
The woman slowly turns her head to the right and smiles gently. Her hair
shifts naturally with the movement. Soft breeze moves the fabric of her
dress slightly.Umělá inteligence nyní zahrnuje specifické pohyby (otáčení hlavy), směr (doprava), změny výrazu obličeje (úsměv) a sekundární pohyby (vlasy, látka). Výsledek působí podstatně přirozeněji. Lze jej však dále optimalizovat pomocí jemných atmosférických změn, pohybů kamery a přesných rychlostí pohybu.
V3 — Finální verze
The woman slowly turns her head from looking slightly left to gazing
directly into the camera. Her expression transitions from contemplative
to a warm, knowing smile. A gentle breeze lifts wisps of her hair across
her forehead. She subtly exhales, her shoulders relaxing slightly
downward. The fabric of her linen blouse ripples faintly at the collar.
Background leaves on a tree behind her sway gently with the breeze. Warm
afternoon light intensifies slightly as if a cloud has passed, deepening
the golden tones on her skin. Very slow, almost imperceptible dolly in.
Natural, lifelike motion -- no exaggerated movement. Maintain the
photographic quality of the original image. Smooth 24fps.
V1 až V3: „make the person move“ (pohyb osoby) vytváří nepřirozené artefakty, zatímco jemně vyladěný příkaz I2V generuje přirozené, fotorealistické video ze statických fotografií pomocí konkrétních, nuancovaných pokynů pro pohyb.
Proč je tento pokyn účinný
- Definovaný směr pohybu (od pohledu mírně doleva po pohled přímo do kamery) zabraňuje náhodným pohybům. AI rozpoznává počáteční i konečný stav.
- Víceúrovňový vrstvený pohyb: otáčení hlavy (velký rozsah), úsměv (střední rozsah), vlající vlasy (malý rozsah), vlající límeček košile (mikro rozsah), vlající listí v pozadí (rozsah prostředí). Vrstvení více měřítek pohybu vytváří naturalismus.
- „Jako by prošla mrak“ dává AI povolení jemně upravit osvětlení, čímž přidává vitalitu, aniž by měnila zavedený vizuální tón původního obrazu.
- „Žádné přehnané pohyby“ je pro I2V zásadní. Bez tohoto omezení mají AI modely tendenci k nadměrné animaci, což vyvolává efekt „uncanny valley“. Omezení je základním kamenem přesvědčivého I2V.
Varianty
Varianta A — Fotografie krajiny do videa:
Clouds drift slowly from left to right across the sky. Water in the lake
ripples gently with a breeze. Grass in the foreground sways. A flock of
birds crosses the distant sky. The light subtly shifts as if time is
passing -- a slow golden hour transition. Very slow, meditative motion.
Maintain the photographic color grade and sharpness of the original.Varianta B — Obrázek produktu ve formě videa:
The watch face catches a moving light source that slowly sweeps from
left to right, creating a traveling highlight across the polished metal
bezel and glass face. The second hand ticks smoothly. Subtle reflections
shift on the brushed steel bracelet links. Background remains perfectly
still. Macro-level detail preserved. Smooth, professional product
motion.Podnět č. 10: Branding a marketing — „Televizní reklama v kinematografické kvalitě“
Nastavení
Reklama luxusní značky, která vypráví mikropříběh v jediném záběru. Nejedná se pouze o produktové video, ale o manifest životního stylu. Hodinky, jejich nositel, daný okamžik, svět, ve kterém žije – to vše současně vyjadřuje hodnoty značky. Podrobný průvodce využíváním AI videa pro e-commerce a produktový marketing naleznete v našem E-commerce Product Video Tutorial.
V1 — První pokusy
A luxury watch advertisementVýsledek: Hodinky plovoucí na bílém pozadí nebo ležící na stole. Žádný kontext, žádný pocit aspirace, žádný příběh. Jedná se o obrázek z produktového katalogu, nikoli o reklamní film.
V2 — Další podrobnosti
A man wearing a luxury silver watch leans against a yacht railing at
sunset. The camera focuses on the watch on his wrist. Ocean in the
background. Warm golden light. Premium feel. Commercial style.S kontextem (jachta), životním stylem (luxus), ústředním bodem (náramkové hodinky) a časem (západ slunce) lze vytvořit sugestivní obrazy. Kvalita na úrovni reklamy však vyžaduje přesné vyprávění příběhu, choreograficky propracované pohyby a detaily na úrovni produkce.
V3 — Finální verze
A distinguished man in his 40s in a perfectly tailored navy linen suit
stands at the polished teak railing of a luxury sailing yacht at golden
hour. He gazes at the horizon with quiet confidence. The camera starts
as a wide establishing shot showing the yacht slicing through
crystalline Mediterranean water, then slowly pushes in to a medium
close-up, finally settling on an extreme close-up of the brushed
titanium dive watch on his left wrist. The watch face reflects the
orange-gold sky. His fingers tap once on the railing -- the watch catches
the light. Sea spray glitters in the air behind him, backlit by the low
sun. The yacht's white sails billow softly overhead. Wind ruffles his
hair and the lapels of his jacket. Warm amber key light from the setting
sun. Cool blue fill light from the reflected ocean. Cinematic
commercial quality. Omega or Rolex brand film aesthetic. Anamorphic
lens, shallow depth of field transitioning with the push-in. 4K,
ultra-premium production value.
V1 až V3: Obecná „reklama na luxusní hodinky“ se vyvinula v reklamní film s narativními kamerovými pohyby, kontexty životního stylu a špičkovou produkční kvalitou.
Proč je tento pokyn účinný
- Narativní trajektorie záběru (široký úhel → střední záběr → detailní záběr) vytváří narativní strukturu v rámci jediného snímku. Nejprve se stanoví prostředí, poté se zaměří na předmět a nakonec se soustředí na produkt. To představuje standardní narativní oblouk pro reklamu na luxusní zboží.
- „Prsty jednou poklepou na zábradlí“ je jemná, ale záměrná akce postavy, která přirozeně nasměruje pohled diváka na hodinky a vyhnete se tak trapnosti explicitního předvádění zápěstí.
- Dvojité osvětlení (jantarové klíčové světlo + modré doplňkové světlo) simuluje autentické osvětlení mořské krajiny v hodině zlaté. Tato kombinace tvoří ikonický vizuál pro reklamu na jachtařský životní styl.
- „Estetika filmů značek Omega nebo Rolex“ poskytuje AI přesný odkaz na kvalitu produkce – vyjadřuje úroveň rozpočtu, směr barevného odstupňování a celkovou vizuální filozofii.
Varianty
Varianta A — Reklama na parfémovou značku:
A woman in a flowing white silk dress walks barefoot through a sunlit
lavender field in Provence. She trails one hand through the lavender
tops as she walks, releasing a visible shimmer of pollen. A crystal
perfume bottle sits on a weathered stone wall in the foreground, the
lavender field reflected in its surface. The camera starts on the bottle,
racks focus to the woman approaching, then returns to the bottle as she
passes. Golden afternoon light. Soft lens flare. Chanel No. 5 campaign
aesthetic. Airy, dreamlike, aspirational. 4K cinematic.Varianta B — Reklama automobilové značky:
A matte black luxury sedan glides silently along a winding coastal
highway carved into dramatic sea cliffs at dusk. The last light of day
reflects off the car's polished roofline. Headlights carve through
gathering twilight. The camera tracks alongside the vehicle from a low
drone angle, keeping pace. Ocean waves crash against rocks far below.
Subtle interior glow visible through tinted windows. Smooth, powerful,
inevitable. Mercedes or Audi brand film quality. 4K cinematic,
anamorphic, teal and orange color grade.Stručný referenční průvodce: 10 přehledů výzev
| # | Scéna | Základní prvky výzvy | Doporučený model | Optimální poměr | |---|------|---------------- -|---------|---------| | 1 | Filmový portrét | Žena, pšeničné pole, zlatá hodina, 85 mm, push close | Seedance 2.0 | 16:9 | | 2 | Prezentace produktu | Křišťálová lahvička parfému, dvojité světelné pásky, objektiv s širokým úhlem | Seedance 2.0 / 1.0 Pro | 16:9 nebo 1:1 | | 3 | Přírodní epos | Dolomity za úsvitu, moře mraků, orel, Tyndallův efekt, IMAX | Seedance 2.0 | 21:9 | | 4 | Městské ulice | Deštivá noc v Tokiu, odrazy neonů, osamělá silueta, sledovací záběr | Seedance 2.0 | 16:9 nebo 9:16 | | 5 | Anime fantasy | Ženská válečnice, energetický meč, třešňové květy, odhalení okolí | Seedance 2.0 | 16:9 | | 6 | Kulinářské detaily | Makro espresso, pára, kapky tuku, zpomalené záběry | Seedance 1.0 Pro | 16:9 nebo 1:1 | | 7 | Móda a krása | Haute couture přehlídka, vlající organza, sledování z nízkého úhlu | Seedance 2.0 | 9:16 nebo 16:9 | | 8 | Akce a sport | Slam dunks, kapky potu, záběry z nízkého úhlu pod košem, 1000 fps | Seedance 2.0 | 16:9 | | 9 | Image-to-Video | Animace portrétů, vrstvený pohyb, jemné přechody světla | Seedance 2.0 (I2V) | Porovnání zdrojového obrazu | | 10 | Marketing značky | Jachtingový životní styl, panoramatické až detailní záběry, dvoubarevné osvětlení | Seedance 2.0 | 16:9 nebo 21:9 |
Doporučujeme si tuto tabulku uložit do záložek pro budoucí použití. Každý pokyn v tomto článku lze zkopírovat a vložit přímo pro použití – stačí upravit podrobnosti podle vašeho konkrétního projektu. Tyto pokyny jsou stejně účinné i v domácích nástrojích (například Kling nebo Jiemeng), kde můžete anglické pokyny vložit přímo.
Pět základních technik pro optimalizaci výzev
Těchto pět zásad platí pro jakýkoli generátor videí s umělou inteligencí; jejich zvládnutí urychlí vaše schopnosti psaní promptů.
- Začněte stručně a postupně přidávejte podrobnosti.
Nepokoušejte se napsat perfektní stovku slov najednou. Začněte s 15–20 slovy, vytvořte, vyhodnoťte a poté přidávejte po jedné vrstvě detailů. Tento iterativní přístup vám pomůže pochopit, které doplňky mají největší dopad. Některé detaily výrazně zlepší výsledek, zatímco jiné budou mít jen malý vliv. To se nedozvíte, dokud to nevyzkoušíte.
- Měníte vždy pouze jednu proměnnou.
Při přechodu z verze V1 na V2 odolejte nutkání měnit vše najednou. Pokud byste upravili osvětlení, úhly kamery, objekty a scény najednou, nemohli byste rozpoznat, která změna výsledek vylepšila (nebo zhoršila). Při každém přechodu měňte pouze jeden prvek. To vyžaduje trpělivost, ale pomůže vám to lépe pochopit, jak generátor interpretuje jazyk.
- Uložte si svůj „zlatý podnět“
Když vám nějaký podnět přinese vynikající výsledky, okamžitě si ho uložte. Vytvořte si osobní knihovnu podnětů rozdělenou podle témat: portréty, produkty, krajiny, abstrakce atd. Postupem času se tato sbírka stane vaším nejcennějším kreativním aktivem. Budete opakovaně používat struktury, měnit témata a kombinovat osvědčené prvky. Zvažte použití nástroje pro pořizování poznámek (například Notion nebo Notes), abyste mohli svou knihovnu podnětů uspořádat podle kategorií.
4. Objektiv je důležitější než popis předmětu
Toto je pravda, která je v rozporu s intuicí: pokyny týkající se kamery a osvětlení mají často větší váhu než popisy objektů. Pečlivě detailně popsaný objekt v kombinaci s výchozím nastavením kamery přináší průměrné výsledky. Naopak jednoduchý objekt v kombinaci s přesným pohybem kamery, výběrem objektivu a návrhem osvětlení může překonat očekávání. Pokud máte omezený prostor pro zadání, věnujte slova spíše „jak fotografovat“ než „co fotografovat“.
- Používejte negativní formulace k vyloučení nežádoucích prvků.
Mnoho generátorů videí s umělou inteligencí dobře reaguje na vylučující jazyk. Zahrnutí frází jako „žádné textové překryvy“, „žádné vodoznaky“, „vyhnout se plochému osvětlení“ a „žádná statická kamera“ může modelu pomoci vyhnout se běžným úskalím. To se ukazuje jako obzvláště užitečné, když identifikujete opakující se problém napříč několika generacemi. Nepopisujte pouze to, co chcete, ale také specifikujte, co nechcete.
Často kladené otázky
Co tvoří dobrý podnět pro video s umělou inteligencí?
Účinný video prompt pro AI má tři základní charakteristiky: konkrétnost, strukturu a zahrnutí popisu pohybu. Měl by obsahovat jasný popis předmětu, explicitní akce nebo pohyb, atmosférické nastavení scény, pokyny pro kompozici (velikost záběru a typ pohybu), směr světla a modifikátory vizuální kvality. Nejdůležitějším principem je specifičnost – „žena se stříbrnými prameny v černých vlasech v uhlově šedém kabátě kráčející padajícím sněhem“ vždy předčí „ženu venku“. Stejně důležité je zahrnutí popisu pohybu. Video podněty musí AI explicitně sdělit, co se pohybuje a jak se pohybuje; jinak bude výstup připomínat téměř statický obraz.
Jak dlouhý by měl být video prompt pro AI?
Ideální rozsah je 40 až 80 anglických slov. Méně než 20 slov dává AI příliš velkou volnost, což vede k nepředvídatelným, obecně formulovaným výstupům. Překročení 150 slov může vést k rozporům nebo zmatení modelu. U většiny generátorů přináší nejlepší výsledky soustředěný odstavec o 50–70 slovech, který pokrývá téma, pohyb, úhly kamery, osvětlení a kvalitu obrazu. Kvalita detailů je důležitější než počet slov.
Lze tyto pokyny použít s jinými nástroji pro tvorbu videí s umělou inteligencí?
Jistě. Každý pokyn v tomto článku lze použít v běžných nástrojích pro převod textu na video, jako jsou Seedance, Sora, Kling, Runway, Pika a HaiLuo (海螺). Základní principy – konkrétní témata, jasný pohyb, směr kamery a popis osvětlení – zůstávají univerzální. Různé modely však interpretují jazyk mírně odlišně, takže pokyny, které přinášejí ohromující výsledky v Seedance, mohou vyžadovat jemné doladění na jiných platformách. Berte tyto pokyny jako silné výchozí body a poté je opakujte na základě vašeho konkrétního nástroje. Stojí za zmínku, že i u domácích nástrojů, jako jsou Kling nebo Jiemeng, použití anglických pokynů často přináší lepší výsledky.
Proč se moje generované výsledky liší od příkladů?
Generování videa pomocí AI zahrnuje náhodnost. Stejný příkaz bude při každém spuštění generovat odlišné výsledky, i když použijete stejný model a identická nastavení. Je to záměrné – umožňuje to kreativní zkoumání. Pokud se výsledek liší od očekávání, vygenerujte 3–5 variant pomocí stejného příkazu, než se rozhodnete, zda jej upravit. Model často vyprodukuje vynikající verzi již po několika pokusech. Současně zkontrolujte nastavení poměru stran a verze modelu, protože tyto parametry mají významný vliv na výstup.
Jak popsat pohyb kamery v pokynu?
Používejte autentickou filmovou terminologii. Modely AI jsou trénovány na rozsáhlých textech z reálného světa filmu a fotografie, což jim umožňuje porozumět odbornému žargonu. Mezi běžné pohyby kamery patří: pomalý dolly in, tracking shot, orbiting, crane shot, pan, tilt, whip pan. Vždy specifikujte rychlost: pomalý dolly, jemný orbit, rychlý whip pan. Pro co nejpřesnější ovládání záběru využijte referenční video funkci Seedance 2.0 a nahrajte klip obsahující požadovaný pohyb kamery jako referenci.
Je nutné zadat zpětnou výzvu?
Záleží na generátoru. Některé nástroje pro tvorbu videí s umělou inteligencí mají speciální pole pro zadávání reverzních pokynů. Nástroje, které tuto funkci nemají, jsou naprosto přijatelné. Pokud jsou reverzní pokyny k dispozici, jsou velmi účinné pro vyloučení konkrétních problémů: „žádný text“, „žádné vodoznaky“, „žádné rozmazané tváře“, „žádná statická kamera“. Bez speciálního pole pro zadávání můžete negativní popisy zahrnout do hlavního pokynu: „vyhnout se plochému osvětlení“ nebo „žádné viditelné artefakty“. Vyhněte se uvádění desítek kritérií pro vyloučení v reverzním promptu – zaměřte se místo toho na 2–3 konkrétní problémy, které se vyskytly v předchozích generacích.
Kolik iterací by měl prompt podstoupit?
Tři až pět iterací představuje optimální rozsah pro praktické projekty. Rámec V1 až V3 popsaný v tomto dokumentu není definován libovolně – odpovídá skutečnému pracovnímu postupu. V1 stanoví koncept, V2 upřesňuje detaily a V3 vylepšuje kvalitu produkce. Nad rámec V3 se úpravy obvykle týkají pouze drobných prvků. Pokud ani po pěti iteracích nedosáhnete uspokojivých výsledků, problém pravděpodobně nespočívá v zadání, ale v omezeních modelu při zpracování tohoto konkrétního typu obsahu. Zkuste scénář prezentovat jinak, místo abyste do stejného zadání přidávali další slova.
Který generátor videí s umělou inteligencí nabízí nejlepší ovládání příkazů?
Seedance 2.0 v současné době nabízí nejkomplexnější možnosti ovládání promptů z následujících důvodů: podporuje generování textu do videa i obrázku do videa s vynikající konzistencí výsledků. Klíčová slova pro pohyb kamery jsou spolehlivě prováděna. Pokyny pro osvětlení se přesně promítají do výstupních efektů. Podporuje více poměrů stran (16:9, 9:16, 1:1, 3:4, 4:3, 21:9) s rozlišením až 2K. Konzistence postav zajišťuje vizuální kontinuitu napříč několika generacemi stejné postavy. Komplexní srovnání generátorů najdete v našem článku Srovnání nejlepších generátorů AI videa v roce 2026.
Závěr
Vytváření účinných pokynů pro AI video je dovednost, kterou se lze naučit, nejde o přirozený talent. Deset pokynů v tomto článku vykazuje konzistentní vzorec: začněte jednoduše, postupně přidávejte detaily a vždy upřednostňujte úhly kamery, osvětlení a pohyb před vším ostatním.
Každý podnět lze zkopírovat a použít přímo. Vezměte libovolný podnět V3 a vložte jej do generátoru jako výchozí bod. Poté opakujte – měňte předměty, osvětlení nebo úhly kamery. Každá generace učí model, jak interpretovat jazyk. Tyto podněty fungují nejlépe na Seedance, ale lze je také použít přímo s anglickými podněty v domácích nástrojích, jako jsou Keeling a Jiemeng.
Nejrychlejší způsob, jak se zlepšit, je vytvářet a sledovat, co funguje efektivně. Ukládejte si své nejlepší podněty a vytvořte si knihovnu materiálů. Po určité době si vyvinete intuici pro to, jaký jazyk přináší jaké výsledky. Zvažte sdílení svého procesu iterace podnětů na platformách jako Xiaohongshu nebo Bilibili – komunita tvůrců videí s využitím umělé inteligence rychle roste a vaše praktické zkušenosti mají pro ostatní významnou hodnotu.
Otevřete Seedance a vyzkoušejte tyto podněty → — Zaregistrujte se a získejte kredity zdarma, není potřeba kreditní karta.
Chcete se ponořit hlouběji? Náš Kompletní průvodce Seedance Prompt obsahuje více než 50 dalších podnětů pokrývajících všechny kategorie scénářů.
Další informace: Prohlédněte si naši Kompletní příručku Seedance (50+ příkladů). Jste novým uživatelem Seedance? Začněte s naším Kompletním návodem k použití Seedance. Chcete převést stávající fotografie na videa? Podívejte se na náš Návod k AI pro převod obrázků na videa. Používáte AI videa pro e-commerce? Přečtěte si náš Průvodce produkcí produktových videí. Plánujete marketingové kampaně? Podívejte se na náš Průvodce marketingem pomocí AI videí.

