TL;DR
Fantastiske AI-videoer kommer fra fantastiske instruksjoner. Denne guiden lærer deg en universell formel for videoinstruksjoner – et rammeverk med syv elementer som kan brukes på alle vanlige AI-videoplattformer:
[Emne] + [Handling] + [Innstillinger] + [Kamerabevegelse] + [Belysning] + [Stil] + [Lyd]
Du vil lære: De viktigste årsakene til at feil oppstår (og hvordan du kan fikse dem umiddelbart), en omfattende referanse til kameraspråk som dekker over 15 kamerabevegelsesteknikker, et atmosfære-nøkkelordbibliotek organisert i fire dimensjoner: belysning/fargegradering/tekstur/stemning, fem progressive eksempler på prompt fra grunnleggende til kinokvalitet, hvordan du kan innlemme lyddesign i prompt, og plattformspesifikke optimaliseringsteknikker for Seedance, Sora, Kling, Runway og Veo 3.
Dette er ikke en veiledning i bruk av verktøy – det er en metodikk. Ferdigheter i å skrive videomanus kan overføres mellom plattformer; lær dem én gang, bruk dem overalt.
Automatisk genererte spørsmål →

Samme konsept, men helt forskjellige resultater. Oppgaven til venstre lyder: «En kvinne som går i regnet.» Oppgaven til høyre spesifiserer kamerabevegelse, lysretning, atmosfære og lyd – som AI-modellen responderer på med kinokvalitet.
Hvorfor de fleste AI-videoprompter mislykkes (og hvordan du kan fikse dem)
Uansett hvilken AI-videogenerator du bruker – Seedance, Sora, Keeling, Runway, Veo 3 – er grunnprinsippet det samme: jo mer presis og strukturelt fullstendig tekstinngangen din er, desto mer kontrollerbar og filmisk blir resultatet. De fleste skriver instruksjoner som om de beskriver et fotografi til en venn, men video er ikke et fotografi. Video involverer bevegelse, tid, kamerabevegelser, atmosfærisk utvikling og lyd.
Nedenfor er de fem vanligste årsakene til hurtigfeil, hver ledsaget av en umiddelbar løsning.
- For vagt — problemet med «den vakre solnedgangen»
Den vanligste feilen. Du skriver «en vakker solnedgang ved havet» og får et teknisk korrekt, men følelsesmessig tomt utdrag som ligner på standard skjermsparere.
Problemet er ikke at AI ikke kan gjengi en solnedgang, men at «skjønnhet» og «solnedgang» er den eneste informasjonen du har gitt. Etter å ha sett millioner av solnedganger i treningsdataene sine, velger AI det statistiske gjennomsnittet – og gjennomsnittet er, i sin natur, middelmådighet.
| Før endring | Etter endring |
|---|---|
| En vakker solnedgang over havet | Gyllent lys sprer seg over en rolig stillehavskyst, bølger slår mot vulkansk stein, solen står to fingre over horisonten, himmelens farger skifter fra dyp ravfarge ved horisonten til laksefarget rosa og blek lavendel ved zenit, lange skygger strekker seg mot kameraet Solen henger to fingerbredder over horisonten, himmelens farger skifter fra dyp ravfarge ved horisonten til lakserosa og blek lavendel ved zenit, lange skygger strekker seg mot kameraet) |
Løsning: Erstatt adjektiver («vakker», «fantastisk», «imponerende») med spesifikke, observerbare detaljer – farge, posisjon, tekstur, romlige forhold.
- Manglende bevegelsesinstruksjoner – problemer med statiske bilder
Du skrev en detaljert scenebeskrivelse, men AI-en genererte et bilde som ser ut som et fotografi med en svak push-pull-effekt – fordi du beskrev et øyeblikk, ikke en bevegelse.
Video er tidsavhengig. Uten eksplisitte bevegelsesinstruksjoner bruker AI-en den mest konservative tolkningen som standard: langsom fremgang eller svak parallakse. Teknisk sett er dette riktignok «video», men det er ikke det du ønsker.
| Før modifisering | Etter modifisering | |--------|------- -| | En vintage rød sportsbil parkert på en fjellvei, tåkete morgen, filmisk (一辆复古红色跑车停在山路上,薄雾清晨,电影感) | En vintage rød Porsche 911 akselererer gjennom en svingete fjellvei, dekkene griper tak i den våte asfalten, tåken deler seg rundt karosseriet, kameraet følger etter på støtfangerhøyde, trærne suser forbi i forgrunnen |
Rettelsesmetode: Hver videoprompt krever minst ett verb som beskriver motivets fysiske bevegelse og én setning som beskriver kamerabevegelsen. Motivet beveger seg, kameraet beveger seg – sammen skaper de visuell energi.
3. Det motstridende direktivet — «Nærbilde + totalbilde»-paradokset
Denne situasjonen er mer vanlig enn du kanskje tror, spesielt når folk setter sammen filmuttrykk de har hørt, men ikke helt forstår. «Ekstrem nærbilde av en kvinne som krysser en vidstrakt ørken, vidvinkelbilde, episk følelse» inneholder to motstridende komposisjonsdirektiver. AI-en vil forsøke å ta gjennomsnittet og produsere et bilde som verken er nært eller fjernt, men rett og slett kaotisk.
| Før revisjon | Etter revisjon |
|---|---|
| Nærbilde av en kvinne som krysser en vidstrakt ørken, bredt etableringsbilde, episk skala | Ekstrem nærbilde av en kvinnes øyne som reflekterer ørkenlyset, sandpartikler som fanger solnedgangens gyldne lys på øyevippene hennes, kort dybdeskarphet med det enorme sanddynelandskapet uskarpt i en ravfarget gradient bak henne (Kvinnens øyne i ekstrem nærbilde, som reflekterer ørkenlyset; sandpartikler som fanger solnedgangens gyldne lys på øyevippene hennes; lav dybdeskarphet som gjengir de vidstrakte sanddynene bak henne i en ravfarget gradient) |
Fikseringsmetode: Velg én kameraposisjon per opptak. Hvis du trenger nærbilder og langskudd, skriv to separate opptak og koble dem sammen med en overgang. For sekvenser med flere opptak støtter plattformer som Seedance storyboard-tidslinjeformatet, slik at du kan spesifisere hvert opptak uavhengig av hverandre.
- Mangel på atmosfære — Et vakuum av lys, skygge og følelser
Din beskrivelse beskriver et motiv som utfører en handling på et bestemt sted. Dette dekker tre av de syv dimensjonene. Uten veiledning om belysning, fargepalett, atmosfæriske effekter eller stilistisk retning, vil AI fylle ut hullene med nøytrale standardinnstillinger: flat, jevn belysning, dempede farger og ingen spesiell stemning. Resultatet ligner på høyoppløselige CCTV-opptak.
| Før revisjon | Etter revisjon | |--------|------- -| | En mann som sitter alene på en kafé | En mann i førtiårene sitter alene i et svakt opplyst hjørnebord, varmt ravfarget lys fra en enkelt pendellampe fanger dampen som stiger opp fra kaffekoppen hans, regn renner ned vinduet bak ham og kaster bølgende skyggemønstre over ansiktet hans, dempet blågrønn og kobberfarget fargepalett, melankolsk atmosfære |
Rettelsesmetode: Inkorporer lysretning, fargetemperatur, atmosfæriske effekter (tåke, regn, støv, damp) og stemningsord. Disse fire tilleggene forvandler «en scene» til «en følelse».
- Fravær av lyddesign — Problemet med stumfilmer
Innen 2026 vil de fleste AI-videoplattformer støtte lydgenerering – bakgrunnsmusikk, omgivelseslydeffekter og til og med dialog med leppesynkronisering. Likevel lager de fleste brukere helt lydløse instruksjoner, og behandler videoinstruksjoner utelukkende som visuelle instruksjoner.
Lyd utgjør halvparten av opplevelsen. En skogscene uten fuglesang og raslende blader føles kunstig. Actionsekvenser uten effektlyder føles substansløse. Produktdemonstrasjoner uten musikk ligner PowerPoint-presentasjoner.
| Før endring | Etter endring | |------- -|--------| | En katt som hopper fra en bokhylle og lander på en sofa | En rødbrun katt hopper grasiøst fra toppen av en høy bokhylle i eik, strekker kroppen i luften og lander mykt på en fløyelssofa som gir etter under vekten. Lyd: myk pote som treffer stoff, en enkelt bok som glir på hyllen, stille romlyd med fjern regn mot vinduene Lyd: myk pote som treffer stoffet, en enkelt bok som glir på hyllen, stille romlyd med fjernt regn mot vinduene) |
Løsning: Legg til en linje med lydinstruksjoner på slutten av instruksjonen, der du spesifiserer bakgrunnsmusikkstilen, omgivelseslydeffekter og eventuelle dialoger eller fortellinger. Vi gir detaljert veiledning i [delen om lyddesign](#Inkorporere lyddesign i instruksjoner) nedenfor.
Universell formel for videoprompt
Uansett hvilken plattform du bruker, inneholder alle effektive videoprompter de samme syv elementene. Noen er essensielle (kreves i alle prompter), mens andre er valgfrie (forbedrer effektiviteten, men er ikke obligatoriske). Formelen:
[Emne] + [Handling] + [Miljø] + [Kamerabruk] + [Belysning] + [Stil] + [Lyd]

De syv nøkkelelementene i en universell formel for videoprompt. Hvert element gir en ekstra dimensjon av kontroll til det endelige resultatet.
Nedenfor finner du en trinnvis oversikt over hvert element, sammen med et nøkkelordbibliotek og eksempler på setninger.
Element én: Emne (påkrevd)
Motivet er gjenstand for publikums blikk. Dette bør være den mest spesifikke delen av oppgaven – ikke «en kvinne», men «en kvinne i sekstiårene, med sølvgrått hår løst samlet i en knute, dype latterlinjer i øynene og iført et bleknet denimforkle».
Nøkkelordbibliotek:
| Kategori | Eksempel (engelsk prompt) | |------|------------------ -| | Karakterer | en ung mann i tjueårene, en eldre kvinne, et barn på rundt fem år, en danser, en kokk, en soldat | | Dyr | en golden retriever, en snøleopard, en kolibri, en koifisk, en monarkfugl | | Gjenstander | en gammel skrivemaskin, en krystallparfymeflaske, en lærinnbundet dagbok, en keramisk vase | | Kjøretøy | en matt svart motorsykkel, en trebåt, en slitt pickup, et høyhastighetstog | | Abstrakt | lyspartikler, blekkdråper i vann, geometriske former, flytende metall |
Eksempler på setninger:
- «En barista i trettiårene med tatoveringer på armene og et melbestrøket svart forkle»
Et værbitt bronsekompass som ligger åpent på et sjøkart-Tusenvis av papirlykter, hver og en med et varmt, gult lys fra et stearinlys inni
Element to: Handling (påkrevd)
Handling er det som utspiller seg – hva personen gjør og hvordan scenen utvikler seg over tid. Dette er skillet mellom videoprompter og bildeprompter. Uten handling sitter du igjen med ikke mer enn et bevegelig fotografi.
Nøkkelordbibliotek:
| Bevegelsestype | Eksempel (engelsk prompt) | |--------- -|-------------------| | Menneskelig bevegelse | gå, løpe, snu seg sakte, strekke seg ut, lene seg fremover, puste ut, blunke | | I forhold til kamerabevegelse | nærme seg kameraet, gå bort fra kameraet, krysse bildet fra venstre til høyre | | Objektbevegelse | rotere, falle, flyte, knuses, monteres, brettes ut, smelte | | Miljøbevegelse | vind som beveger seg gjennom gress, skyer som ruller, regn som faller, blader som driver, tidevann som kommer inn | | Overgangsprosesser | dag blir til natt, blomster blomstrer, is dannes, maling sprer seg, lys skifter |
Eksempler på setninger:
- «Langsomt bøyer hun seg ned og plukker opp et høstløv som har falt, og snur det mellom fingrene.»
Kompassnålen dirrer, og svinger deretter bestemt mot nordLanterner løfter seg en etter en fra bakken, og stiger opp i den mørke himmelen i forskjellige hastigheter
Element tre: Miljø (essensielt)
Omgivelsene er stedet hvor scenen utspiller seg. Beskriv både de umiddelbare omgivelsene (forgrunnen) og den bredere bakgrunnen. Ta med vær, tid på dagen og årstid når det er relevant.
Nøkkelordbibliotek:
| Scenetype | Eksempel (engelsk prompt) | |----------|------------------ -| | Natur | tett skog, ørken sanddyner, havklippe, alpin eng, vulkansk strand, bambusskog | | Urban | smal bakgate i Tokyo, brutalistisk betongplass, takhage, T-baneplattform, neonbelyst avenue | | Innendørs | bibliotek med levende lys, industriell loft, drivhus, vintage mørkerom, marmoratrium | | Fantasi | flytende øyer, krystallhule, bioluminescerende rev, ødelagt tempel, skyby | | Tid/Vær | skumring før daggry, overskyet middagstid, tordenvær, første snø, fuktig sommerkveld |
Eksempler på setninger:
- «I en smal sidegate i Kyoto, med steinlykter på begge sider, flyter kirsebærblomsterblader over våte brostein.»
- «Inne i en hul, forlatt katedral trenger støvete lysstråler gjennom knuste glassmalerier»
- «På kanten av en vulkansk klippe i den blå timen stiger svovelholdig damp opp fra sprekker i den svarte fjellveggen»
Element fire: Kamerabevegelse (viktig)
Kamerainstruksjoner veileder AI-publikummet i hvordan de skal oppfatte en scene, og omfatter komposisjon (hvor nær), vinkel (hvorfra) og bevegelse (hvordan synsvinkelen endres over tid). Kameraspråk er den viktigste faktoren for å forbedre kvaliteten på instruksjonene – vi utforsker dette nærmere i den dedikerte delen nedenfor.
Hurtig søkeordbibliotek:
| Aspekt | Engelsk terminologi og kinesisk ekvivalent | |------|------------------ -| | Bildeutsnitt | ekstrem nærbilde, nærbilde, mellomstort bilde, helbilde, vidvinkelbilde, ekstremt vidvinkelbilde (ekstremt langt bilde) | | Vinkel | øyehøyde, lav vinkel, høy vinkel, fugleperspektiv, ormeperspektiv, nederlandsk vinkel | | Bevegelse | dolly inn/ut, panorering til venstre/høyre, tilt opp/ned, tracking shot, orbit, kran (høyde) | | Objektiv | 24 mm vidvinkel, 50 mm standard, 85 mm portrett, 200 mm tele, makroobjektiv, anamorfisk |
Element fem: Belysning (viktig)
Lys og skygge definerer stemningen i hvert bilde. Profesjonelle fotografer bruker timer på å arrangere belysningen. I hurtigskriving kan noen få presise ord oppnå samme grad av kontroll.
Nøkkelordbibliotek:
| Belysningstype (engelsk/kinesisk) | Visuelle effekter | |--------------------- -|----------| | Gulltime | Varme toner, lange skygger, oransje-gule fargetoner, svært flatterende for portretter | | Blåtime | Kule toner, melankolsk atmosfære, dypblå himmel med gjenværende varme langs horisonten | | Motlys | Kantbelysning, silhuetteffekt, tydelig skille fra bakgrunnen | | Sidelys | Halvt opplyst, halvt skyggelagt ansikt; høy kontrast, dramatisk effekt | | Rembrandt-belysning | Trekantet høydepunkt under det skyggelagte øyet; klassisk portretteffekt | | Volumetrisk belysning | Synlige stråler som trenger gjennom støv, tåke eller røyk | | Tyndall-effekt | Lys spres i partikler og skaper tydelige stråler i tåke eller støv | | Neon | Fargede kunstige lyskilder, refleksjoner fra våte overflater, cyberpunk-estetikk |
Element seks: Stil (anbefalt)
Stilen bestemmer det visuelle språket som brukes av AI – enten det er film, dokumentarisk realisme, animasjon, oljemaleri eller annet. Uten en stilangivelse bruker AI som standard en generisk fotorealistisk stil.
Nøkkelordbibliotek:
| Stil (engelsk/kinesisk) | Visuelle egenskaper | |----------------- -|----------| | Filmisk | Lav dybdeskarphet, filmkvalitets fargegradering, 2,39:1 bredformat | | Dokumentar | Håndholdt kamera, naturlig belysning, observasjonsrammer | | Reklamer | Rent, lyst, produktfokusert, presis belysning, jevn bevegelse | | Anime | Cell-shaded stil, livlige farger, overdrevne bevegelser, dynamiske linjer | | Film noir | Høy kontrast, monokrom, persienneskygger, lavmælt belysning | | Tusjmaling | Svart tusj på hvit bakgrunn, flytende overganger, minimalisme, østlig estetikk | | Vintage Film | Filmkorn, litt desaturert, varme toner, myke kanter | | Cyberpunk | Neonfarget, høy kontrast, holografiske elementer, urban apokalyptisk følelse |
Element syv: Lyd (valgfritt)
Lyd tilfører en auditiv dimensjon. Selv om ikke alle plattformer støtter lydgenerering, er det ikke bare fremtidsrettet å innlemme lyddesign i instruksjoner, men det forbedrer også ofte den visuelle effekten, da AI bruker lydsignaler for å påvirke den emosjonelle tonen og tempoet i det visuelle.
Nøkkelordbibliotek:
| Lydtype | Eksempel (engelsk prompt) |
|---|---|
| Musikkstil | orkester, lo-fi hiphop, ambient elektronisk, jazzpiano, akustisk gitar, filmmusikk (filmmusikk) |
| Omgivelseslyder | regn på glass, vind i trærne, bytrafikk, bølgeskvulp, knitrende ild |
| Actionlydeffekter | fotspor på grus, knirkende dør, knust glass, motor som går på tomgang |
| Stemmer | hvisket fortelling, dialog, pusting, latter |
Filmisk språk: Det hemmelige våpenet
Filmisk språk er den mest innflytelsesrike ferdigheten du kan utvikle som forfatter av videoprompter. Når du skriver «dolly in slowly» i stedet for «zoom in», bruker du det naturlige vokabularet til AI-modeller – for disse modellene er trent på millioner av timer med profesjonelt filmet materiale, hvor kamerabevegelser har spesifikke navn og tydelige visuelle effekter.
Denne delen fungerer som en omfattende referanseguide. Vi anbefaler at du legger den til i bokmerkene dine.

Kamerabevegelser er ikke utskiftbare – hver av dem gir en distinkt emosjonell effekt. Å kjenne til riktig terminologi vil forandre effekten av dine instruksjoner.
Kjernefilmkunst
Dolly inn / Dolly ut (push shot / pull shot)
Kameraet beveger seg fysisk nærmere motivet (push) eller lenger bort (pull). I motsetning til zooming endres perspektivet – objekter i forgrunnen vises proporsjonalt større, noe som skaper en følelse av dybde og fysisk nærhet.
- Emosjonell effekt: Fremmer intimitet, fokus og avsløring. Fremkaller isolasjon, kontekst og avskjed.
- Når skal det brukes: Brukes for emosjonelle nærbilder, karakterøyeblikk og avslørende detaljer. Trekk tilbake for å vise skala, konkludere eller trekke seg tilbake fra motivet.
- Nøkkeluttrykk: «Kameraet glir sakte inn fra mellomdistanseskudd til ekstrem nærbilde av motivets hender».
Panorer til venstre / Panorer til høyre (horisontal panorering)
Kameraet forblir stasjonært og roterer horisontalt, som om du snur hodet. Synsvinkelen sveiper over scenen.
- Emosjonell effekt: Undersøkelse, oppdagelse, lateral sporingsbevegelse, kobling av to elementer i en scene.
- Når skal det brukes: Visning av landskap, sporing av bevegelige karakterer, demonstrasjon av romlig bredde.
- Stikkord: «Sakte panorering til høyre over verkstedet, som avslører rader med håndlagde instrumenter på veggen».
Vipp opp/vipp ned (vertikal panorering/vipping)
Kameraet forblir stasjonært og roterer vertikalt – som om det nikker. En panorering oppover avslører høyden; en panorering nedover viser detaljene på bakken.
- Følelsesmessig effekt: En oppadgående vinkel fremkaller ærefrykt, storhet og lengsel. En nedadgående vinkel skaper en følelse av forankring, oppdagelse og intimitet med overflaten.
- Når skal den brukes: En oppadgående vinkel brukes for høye strukturer, figurer som reiser seg eller for å vise himmelen. Nedadgående panoreringer avslører gjenstander på et bord eller overgangen fra himmel til bakke.
- Hjælpeuttrykk:
Kameraet panorerer opp fra røttene til det gamle treet og følger den massive stammen til trekronen
Sporingsopptak (følgeopptak/sidesporingsopptak)
Kameraet beveger seg langs motivet og holder en konstant avstand og vinkel, som om det var montert på et spor som løper parallelt med motivets bane.
- Emosjonell effekt: Fellesskap, reise, fordypning. Publikum reiser sammen med hovedpersonen.
- Når skal det brukes: For karakterer som går eller løper, krysser rom eller viser frem produkter langs overflater.
- Stikkord: «Kameraet følger løperen i skulderhøyde og holder tritt mens hun sprinter gjennom smuget».
Bane / Bue (sirkulær sporingsopptak)
Kameraet roterer rundt motivet mens det holdes sentrert i bildet. Dette kan innebære en fullstendig 360-graders rotasjon eller en delvis bue.
- Emosjonell effekt: Heroisk tilstedeværelse, følelse av makt, utstillingskvalitet, tredimensjonal visning.
- Når skal det brukes: Produktutstillinger (viser alle vinkler), hero shots, dramatiske karakterintroduksjoner, avgjørende øyeblikk.
- Stikkord: «Kameraet roterer 180 grader rundt sjakkspilleren, starter bakfra og ender forfra».
Kran opp / kran ned (heving av kamera / jibb-opptak)
Vertikal kamerabevegelse – fysisk heving eller senking – kombineres vanligvis med tilt for å holde motivet innenfor rammen.
- Emosjonell effekt: Oppstigning skaper en følelse av transcendens, frigjøring og utvidet perspektiv. Nedstigning fremmer en jordnær følelse, en følelse av ankomst og fokusert oppmerksomhet.
- Når skal det brukes: Oppstigning brukes til konklusjoner, triumfmomenter og overganger til luftperspektiver. Nedadgående bilder brukes til åpninger, ankomster og overganger fra vidvinkelbilder til intime komposisjoner.
- Stikkord: «Kameraet kranes opp fra bakkenivå, stiger over mengden og avslører festivalens fulle omfang».
Håndholdt (håndholdt objektiv)
Objektivet viser en subtil organisk bevegelse – det er ikke montert på et stativ eller en stabilisator. Dette simulerer følelsen av en menneskelig fotograf som holder kameraet i hånden.
- Følelsesmessig effekt: Umiddelbarhet, hastverk, dokumentarisk autentisitet, spenning, intimitet.
- Når skal det brukes: Handlingssekvenser, emosjonell dialog, dokumentarstil, skrekkfilmer, alle scener som krever en oppslukende følelse.
- Stikkord: «Håndholdt kamera følger karakteren gjennom det overfylte markedet, litt ustøtt».
Steadicam / Gimbal (Steadicam/stabilisatorobjektiv)
Jevne, flytende kamerabevegelser glir gjennom rommet. I motsetning til håndholdte opptak er det ingen rystelser – bevegelsen er jevn og kontinuerlig.
- Følelsesmessig effekt: Drømmeaktig, elegant, oppslukende, avslappet utforskning.
- Når skal den brukes: Navigering i arkitektoniske rom, følge karakterer gjennom intrikate miljøer, enkeltopptak, luksuriøs og estetisk kinematografi.
- Stikkord: «Steadicam glir bak danseren mens hun beveger seg gjennom den tomme ballsalen».
Avanserte filmteknikker
Hitchcock-zoom (dolly-zoom / vertigo-effekt)
Når kameraet zoomer inn, øker brennvidden (eller omvendt). Motivet forblir like stort, men bakgrunnen blir dramatisk forvrengt – enten ved å strekkes eller komprimeres.
- Følelsesmessig effekt: Desorientering, åpenbaring, frykt, verden som forandrer seg rundt et fast punkt.
- Stikkord:
Dolly zoom på karakterens ansikt — kameraet zoomer inn mens linsen zoomer ut, bakgrunnen strekker seg bort og skaper en svimmelhetseffekt
Piskpanne
Ekstremt rask horisontal panorering, som resulterer i at hele bildet blir uskarpt under bevegelsen. Brukes ofte som overgang mellom to scener.
- Emosjonell effekt: Energi, overraskelse, hastverk, komisk timing.
- Stikkord:
Whip pan fra talerens ansikt til publikums reaksjon, bevegelsesuskarphet under overgangen
Rack Focus (Pull Focus)
Fokuset skifter fra ett dybdeplan til et annet innenfor ett enkelt bilde. Forgrunnen blir uskarp mens bakgrunnen blir skarpere, eller omvendt.
- Emosjonell effekt: Omdirigerer oppmerksomheten, avslører informasjon, kobler sammen elementer i forgrunnen og bakgrunnen.
- Hjælpetext:
Flytt fokus fra de uskarpe blomstene i forgrunnen til kvinnens ansikt i bakgrunnen
Hollands vinkel (skrå vinkel)
Objektivet vipper langs rulleaksen, og skaper en diagonal horisont. Verden fremstår som skjev.
- Følelsesmessig effekt: Uro, ustabilitet, spenning, stiliserte drama, frenesi.
- Stikkord:
Dutch angle nærbilde av detektivens ansikt, 15 graders vinkel, hardt sidebelysning
Hastighetsrampe (tidsrampe)
Avspillingshastigheten varierer innenfor ett enkelt opptak – vanligvis bremser den opp i avgjørende øyeblikk før den akselererer igjen.
- Emosjonell effekt: Vektlegging, innvirkning, dramatisk vekt på bestemte øyeblikk.
- Promptfrase: «Bevegelsen går over til sakte film i øyeblikket av innvirkningen, og akselererer deretter tilbake til normal hastighet».
One-Take (langt opptak)
Kontinuerlig filming uten redigering. Kameraet beveger seg gjennom rom, følger bevegelser og oppdager elementer, samtidig som det opprettholder et enkelt, uavbrutt perspektiv gjennom hele filmen.
- Emosjonell innvirkning: Oppslukende opplevelse i sanntid, følelse av teknisk mestring, vedvarende spenningsoppbygging.
- Promptfrase: «Kontinuerlig opptak i én tagning: kameraet kommer inn gjennom inngangsdøren, glir gjennom gangen og kommer til hagen».
Førsteperson / POV
Kameraet representerer karakterens øyne. Publikum ser det karakteren ser, inkludert hendene deres som kommer inn i bildet.
- Emosjonell effekt: Ultimat fordypning, subjektiv opplevelse, spillestetikk.
- Promptfrase:
Førstepersonsperspektiv: hender skyver opp en tung tredør og avslører en solfylt eng
For Seedances unike kamerakontrollfunksjoner og hvordan du kombinerer dem i storyboard-tidslinjen, se Seedance Prompt Guide.
Atmosfære-nøkkelordbibliotek
Atmosfære er nøkkelen til å forvandle teknisk god video til et verk som vekker følelser. Det er forskjellen mellom «et rom» og «et rom som vekker følelser». Dette nøkkelordbiblioteket er organisert i fire dimensjoner – belysning, fargepalett, tekstur og stemning – slik at du kan blande og matche for å skape akkurat den følelsen du ønsker.

Atmosfære-nøkkelordbibliotek: Velg ett nøkkelord fra hver dimensjon for å definere videoens emosjonelle signatur.
Nøkkelord om lys og skygge
Belysning danner grunnlaget for atmosfæren. Å endre belysningen i en prompt kan forandre stemningen fullstendig, mens alle andre elementer forblir uendret.
| Nøkkelord (engelsk/kinesisk) | Visuelle effekter | Egnede scenarier | |-------|----------|--------- -| | Gulltime | Varmt ravfarget lys, myke langstrakte skygger, flatterende hudtoner | Romantikk, nostalgi, reiser, skjønnhet | | Blåtime | Dypblått omgivelseslys, resterende varme fargetoner i horisonten | Melankoli, kontemplasjon, overgang, urbane stemninger | | Motlys | Motivet omgitt av bakgrunnsbelysning, ansiktsskygger eller silhuetter | Drama, mystikk, heroisk fotografering, estetisk appell | | Sidelys | Sterkt retningsbestemt lys fra én side, halvbelysning og halvskygge | Spenning, nærbilder av karakterer, dramatiske portretter | | Rembrandt-belysning | Klassisk portrettbelysning – én side opplyst, med en liten trekantet høydepunkt under øyet på skyggesiden | Portretter, eleganse, klassisk atmosfære | | Volumetrisk belysning | Synlige lysstråler som passerer gjennom støv, tåke eller røyk | Hellighet, teater, skogscener, scenebelysning | | Tyndall-effekt | Lys spres i små partikler og danner tydelige stråler i tåke | Naturlig, daggrysscener, eterisk, drømmeaktig | | Neon | Kunstige fargede lyskilder, vanligvis rosa, blå, cyan, magenta | Cyberpunk, natteliv, urbant, moderne | | Stearinlys | Varmt, flimrende, oransje-ravfarget punktlyskilde | Intimitet, historie, middagsstemning, koselig | | Silhuett | Motivet er helt mørkt, kun definert av omrisset mot en lys bakgrunn | Mystikk, anonymitet, visuell effekt, fortelling | | Bioluminescerende | Selvlysende organisk lyskilde, vanligvis blågrønn | Fantasi, undervannsverden, fremmede verdener, drømmeaktig |
Nøkkelord for fargetoner
Fargeskjemaet setter den emosjonelle temperaturen for hele komposisjonen. Varme toner føles innbydende, mens kalde toner føles fjerne. Høy metning føles levende, mens lav metning føles dempet.
| Nøkkelord (engelsk/kinesisk) | Visuelle effekter | Emosjonell resonans | |-------|----------|--------- -| | Varm palett | Dominert av ravfarger, oransje, gull og rødlige toner | Komfort, nostalgi, intimitet, høst | | Kald palett | Dominert av blå, cyan og skifertoner | Avstand, ro, melankoli, vinter, teknologi | | Høy metning | Levende, intense, sterke farger | Energi, ungdom, fantasi, popkultur | | Desaturert | Myke, falmede, pastellaktige farger | Melankoli, realisme, minner, vintage | | Teal og oransje | Klassisk filmfargegradering – kjølige skygger, varme høydepunkter | Hollywood-suksesser, reklame, film | | Cyberpunk-palett | Neonrosa, elektrisk blå, dyp lilla mot mørk bakgrunn | Futuristisk, natteliv, digitalt, avantgarde | | Vintage | Litt falmet, varme toner, løftede skygger | Nostalgi, 70- og 80-tallet, indie-filmer, minner | | Jordfarger | Brun, grønn, oker, terrakotta | Natur, forankring, organisk, dokumentar | | Kodachrome | Rike grønn- og rødfarger, varme hudtoner, dype svarte farger | Fotojournalistikk, 1960- og 70-tallet, amerikansk estetikk |
Tekstur/bildekvalitet Nøkkelord
Tekstur definerer en videos visuelle overflate – enten den ligner 35 mm film, en polert reklamefilm, en dokumentarfilm eller et oljemaleri.
| Nøkkelord (engelsk/kinesisk) | Visuelle effekter | Anvendelige scenarier | |-------|--------- -|----------| | Filmisk | Bredskjermfølelse, lav dybdeskarphet, filmisk fargepalett | Fortelling, drama, historiefortelling | | Dokumentar | Naturlig belysning, litt ufullkomne komposisjoner | Realisme, nyheter, utdanning | | Reklamer | Rent, lyst, presist lys, jevne kamerabevegelser | Produktpresentasjoner, reklame, bedrifter | | Filmkorn | Organisk støytekstur lagt over opptakene | Retro, analogt, indie, varmt | | Anamorfisk | Horisontale linsereflekser, elliptisk bokeh, subtil kantforvrengning | Filmisk drama, sci-fi, episk følelse | | Oljemaleri-tekstur | Synlige penselstrøk, rik impasto-effekt | Kunst, fantasi, drømmelandskap, klassisk | | Tusjvask | Svarte tusjgradienter på hvit bakgrunn, flytende organiske former | Orientalsk estetikk, minimalisme, ro | | 8 mm / Super 8 | Kraftig korn, lyslekkasje, ustabilt opptak, falmede farger | Minner, flashbacks, hjemmevideoer, nostalgi |
Emosjonelle nøkkelord
Emosjonelle nøkkelord gir AI-en dens emosjonelle retning. De påvirker alt – tempo, fargevalg, kamerabevegelser og den generelle stemningen.
| Nøkkelord (engelsk/kinesisk) | Fremkalte følelser | Stylingforslag | |-------|----------- -|----------| | Koselig | Varme, komfort, trygghet, hjem | Stearinlys, varme farger, innendørs scener | | Spenning | Angst, forventning, forestående hendelser | Sidelys, håndholdte opptak, tett innramming | | Spenning | Frykt, usikkerhet, langsom oppbygging | Dempet belysning, langsom progresjon, lav metning | | Glede | Lykke, feiring, Letthet | Gulltime, høy metning, lange opptak | | Melankolsk | Sorg, lengsel, skjønnhet i sorgen | Blå time, kjølige toner, sakte film | | Episk | Storslagenhet, heltemot, ærefryktinngytende | Vidvinkel, dolly-opptak, orkesterpartiturer | | Helbredende | Ro, gjenoppretting, mild helbredelse | Myk belysning, pastellfarger, naturlige toner, langsomt tempo | | Skrekk | Frykt, uhygge, uro | Dype skygger, skrå vinkler, lav metning, stillhet | | Romantisk | Kjærlighet, lengsel, ømhet, intimitet | Bakgrunnsbelysning, varme toner, lav dybdeskarphet, nærbilder | | Energisk | Hastighet, spenning, adrenalin | Kamerarystelser, variabel hastighet, høy metning, vidvinkel | | Nostalgisk | Lengsel etter fortiden, bittersøte minner | Filmkorn, vintagefarger, overeksponerte høydepunkter |
Atmosfære-nøkkelordkombinasjoner: Tre eksempler
Den virkelige kraften ligger i å velge ett eller to nøkkelord fra hver dimensjon og kombinere dem. De følgende tre kombinasjonene skaper helt forskjellige stemninger for det samme motivet – en kvinne som står ved vinduet:
Kombinasjon én: Varm nostalgi
Gylden bakgrunnsbelysning, varm fargepalett med rav- og honningtoner, filmkornstruktur, nostalgisk stemning
Kombinasjon to: Kjølig spenning
Sidelys fra én kilde, kjølig blågrønn fargepalett, ren digital tekstur, spent stemning
Kombinasjon tre: Eterisk og drømmeaktig
Tyndall-effekt lysstråler gjennom tynne gardiner, pastellfarger, akvarelltekstur, helbredende stemning
Samme tema, tre helt forskjellige videoer. Nøkkelordet for atmosfæren er kontrollpanelet.
Fra enkeltstående setninger til filmiske spørsmål: 5 avanserte eksempler
Den beste måten å lære seg å skrive prompter på er å observere utviklingsprosessen til prompter. Hvert eksempel nedenfor utvikler seg fra den grunnleggende V1 (den typen de fleste skriver) til V2 (med tillegg av spesifisitet og kamerabevegelse), og kulminerer i V3 (en fullt spesifisert prompt av filmkvalitet). Legg merke til endringene som skjer på hvert nivå, og hvorfor de er implementert.
For flere eksempler på bruksklare videoprompter, se 10 praktiske AI-videoprompter.

Rask utvikling i praksis. V1 gir AI-en praktisk talt ingen informasjon. V3 gir den alt – resultatene er milevis fra hverandre.
Eksempel 1: Portrett/stemning – «Kvinne som går i regnet»
V1 — Grunnleggende utgave (18 ord)
A woman walking in the rain at night in a city, cinematic, beautifulDu får: en generisk kvinne, en generisk by, generisk regn, flat belysning, ingen følelsesmessig resonans. AI fyller hvert tomrom med statistiske gjennomsnitt.
V2 — Forbedret versjon (62 ord)
A young Asian woman in a long dark coat walks slowly through a rain-soaked Tokyo backstreet at night. Neon signs reflect in the wet pavement, casting pink and blue light. She carries a transparent umbrella. Camera tracks beside her at shoulder height. Shallow depth of field. Melancholic mood.Hva er forbedret: Spesifikk motividentitet, spesifikk plassering, spesifikk lyskilde, kameraposisjon, emosjonell retning. AI-en har nå tilstrekkelig informasjon til å generere unike bilder.
V3 — Kinokvalitet (138 ord)
A woman in her late 20s, Japanese, long black hair partially wet and clinging to her neck, wearing an oversized charcoal wool coat over a cream turtleneck, walks alone through a narrow Shinjuku backstreet at 2am. Rain falls in fine sheets, catching neon light from izakaya signs overhead — warm amber kanji characters and cold blue beer advertisements. The wet asphalt mirrors everything, creating a double world beneath her feet. She carries a transparent vinyl umbrella, water beading and streaming down its surface.
Camera: tracking shot at shoulder height, moving alongside her at walking pace, shallow depth of field at f/1.4, foreground rain droplets occasionally crossing the lens out of focus.
Lighting: practical neon sources only — no fill light. Rim light from signs behind her outlines her coat collar and umbrella edge. Her face catches intermittent warm light as she passes each shopfront.
Style: cinematic, Kodak Vision3 500T film stock, slight grain, teal-and-amber color grade, Wong Kar-wai atmosphere.
Lyd: regn på paraplyoverflaten, fjern, dempet jazz fra en bar, hennes fotspor på våt stein, ingen dialog, ingen musikk.(En japansk kvinne i tjueårene, med langt svart hår som er delvis gjennomvåt og henger fast i nakken, iført en overdimensjonert kullgrå ullkåpe over en kremfarget turtleneck, går alene gjennom de trange smugene i Shinjuku klokka 2 om natten. Fine regntråder fanget neonglansen fra izakaya-skiltene over hodet – varme, ravfargede japanske tegn og kjølige, blå ølreklamer. Den fuktige asfalten speilet alt og skapte en speilverden under føttene hennes. Hun holdt en gjennomsiktig plastparaply, med dråper som kondenserte og rant nedover overflaten.)
Hvorfor V3 fungerer: hvert element i formelen er eksplisitt definert. Det er ikke rom for AI å gjette – når AI ikke gjetter, gjengir den nøyaktig det du beskriver.
Eksempel 2: Produktpresentasjon – «Klokken på skrivebordet»
V1 — Grunnleggende utgave (14 ord)
A luxury watch sitting on a table, product shot, high quality, 4KV2 — Revidert utgave (58 ord)
A stainless steel dive watch with a dark blue dial rests on a slab of raw gray marble. Camera orbits slowly around the watch, 15 degrees above. Single key light from the upper left creates a defined shadow. The watch's crystal catches the light and creates a brief flare. Commercial style, clean background.V3 — Kinokvalitet (126 ord)
A stainless steel dive watch with a sunburst navy-blue dial and ceramic bezel sits on a rough-cut block of Carrara marble, positioned at the golden-ratio intersection of the frame. The second hand sweeps continuously. Micro water droplets bead on the crystal surface and the steel bracelet links, catching light.
Camera: begins in macro extreme close-up on the dial — the indices and lume dots fill the frame — then slowly dollies out while simultaneously orbiting clockwise, completing a 270-degree arc over 8 seconds until the full watch and marble base are revealed in a three-quarter beauty shot.
Lighting: single hard key light at 10 o'clock position, 45 degrees above. No fill — deep shadows on the right side. A subtle rim light from behind separates the watch from the dark charcoal background.
Style: high-end commercial, ultra-sharp 8K downscaled to 4K, zero grain, clinical precision. Color: cool steel tones with warm gold accents from the lume.
Lyd: nesten stillhet — bare det svake mekaniske tikket fra urverket, et enkelt klart klokkeslag i det øyeblikket lyset blusser opp.(En dykkerklokke i rustfritt stål, med solstråleblå urskive og keramisk ramme, hviler på en blokk av grovt hugget Carrara-marmor plassert i rammenes gyldne snitt. Sekundviseren fortsetter sin bevegelse. Små dråper kondenserer på glassoverflaten og stålarmbåndets ledd og fanger lyset.)
Eksempel 3: Naturskjønne reiser — «Fjell ved soloppgang»
V1 — Grunnleggende utgave (12 ord)
Beautiful mountains at sunrise, drone shot, epic landscape, cinematicV2 — Forbedret versjon (55 ord)
Snow-capped mountain peaks emerging from a sea of clouds at sunrise. The first rays of sun paint the peaks golden while the valleys remain in blue shadow. Camera cranes up slowly from the cloud layer, revealing the full mountain range. Wide angle, epic scale, warm-to-cool color gradient.V3 — Kinokvalitet (134 ord)
The Dolomites at sunrise in late autumn. Jagged limestone spires — the Tre Cime di Lavaredo — pierce through a thick layer of valley clouds, their east-facing faces catching the first horizontal rays of sun and turning from cold blue-gray to blazing amber-gold. The cloud layer below is a rolling ocean of soft white and pale peach, filling the valleys completely.
Camera: starts buried inside the cloud layer — visibility near zero, soft white diffusion everywhere — then cranes upward at a steady pace, breaking through the cloud surface to reveal the peaks and the vast sky above. The transition from claustrophobic fog to infinite horizon takes 4 seconds. Continue rising to a high aerial wide shot. 24mm wide angle lens.
Lighting: first light of day — sun at 5 degrees above the eastern horizon, casting extreme raking light across the mountain faces. Golden hour warmth on lit surfaces, blue hour coolness in shadowed areas. Volumetric light beams visible where sun cuts between peaks.
Style: National Geographic cinematic, IMAX-quality, ultra-wide dynamic range, vivid but natural color, no filters.
Lyd: vind i høyden — en vedvarende lav hvisken med sporadiske vindkast, ingen musikk, ingen menneskelige lyder. Stillheten forsterker omfanget.(Sen høstsoloppgang i Dolomittene. Takkede kalksteinstorner — De tre toppene — stikker gjennom tykke dalskyer, og deres østlige sider fanger de første horisontale solstrålene, som skifter fra kald blågrå til glødende ravgull.)
Eksempel 4: Actionscene – «Kampsportutøver som slår»
V1 — Grunnleggende utgave (15 ord)
A martial artist doing a spinning kick, action movie style, slow motionV2 — Forbedret versjon (64 ord)
A female martial artist in a dark training hall performs a spinning back kick. Her bare foot connects with a hanging heavy bag, sending it swinging violently. Camera captures the kick from a low angle, slightly slow motion at the point of impact, then returns to real-time as she recovers her stance. Side lighting creates dramatic shadows.V3 — Kinokvalitet (141 ord)
A woman in her 30s, lean and muscular, wearing a fitted black tank top and loose gray training pants, stands in a dimly lit martial arts gym. Worn wooden floor, heavy bags hanging in rows, chalk dust suspended in the air. She explodes from stillness — a spinning hook kick that arcs through 360 degrees, her back heel striking a leather heavy bag at head height.
Camera: starts medium shot at 45-degree angle. As the spin begins, camera speed-ramps to 240fps slow motion — her hair whips in an arc, chalk dust traces the path of her foot, the bag surface ripples visibly on impact. Hold for one beat, then ramp back to real-time as she plants her foot. Slight handheld energy.
Lighting: single harsh side light from camera-left, no fill. Chalk dust and sweat particles glow in the light beam.
Style: David Fincher / Fight Club aesthetic — desaturated, greenish-teal undertone, high contrast, gritty. Anamorphic lens with subtle horizontal flares.
Lyd: stillhet før sparket — omgivende gymbrum, et innånding. Sparket: eksplosiv stoffsmell, tungt skinnslag, kjettingrasling. Hennes skarpe utpust ved kontakt. Ingen musikk.(En kvinne i trettiårene, slank og muskuløs, kledd i en tettsittende svart vest og løse grå treningsbukser, står i den svakt opplyste kampsportshallen. Slitte tregulv, rader med hengende boksesekker, støv som henger i luften. Hun eksploderer fra stillhet – et 360-graders spinnende hook-spark, hælen treffer skinnsekken i hodehøyde.)
Eksempel 5: Emosjonell fortelling – «Bestemor og barnebarn»
V1 — Grunnleggende utgave (16 ord)
A grandmother and her grandchild spending time together, heartwarming, emotional, beautiful momentV2 — Revidert utgave (71 ord)
An elderly grandmother with silver hair and weathered hands teaches her 5-year-old granddaughter how to knead bread dough in a sunlit country kitchen. The child stands on a wooden step stool, flour on her cheeks, laughing. The grandmother guides her small hands through the dough. Golden morning light through a window. Warm color palette. Intimate, cozy atmosphere.V3 — Kinokvalitet (147 ord)
A Japanese grandmother in her 80s, silver hair in a soft bun, deep expression lines around smiling eyes, wearing an indigo apron over a cream linen blouse, stands beside her granddaughter — age 4 or 5, round cheeks, short black hair with a red clip — at a low wooden table in a traditional kitchen. Shoji screen doors are slid open to a small garden where morning light enters. They are making mochi together. The grandmother's large, weathered hands wrap around the child's tiny ones, guiding them to fold and press the soft rice dough. Flour dust floats in the shaft of sunlight between them.
Camera: close-up on their four hands working the dough — the contrast of old and young skin. Slowly dolly out to a medium shot including both faces. Rack focus between them — first sharp on the grandmother's eyes, then pulling to the child's smile. 85mm portrait lens, f/2.0, creamy bokeh.
Lighting: natural morning sunlight from the garden, soft and directional, Tyndall effect through the flour dust. No artificial light. The light creates a warm halo around the grandmother's silver hair.
Style: Hirokazu Kore-eda film quality — observational, unhurried, documentary intimacy with cinematic beauty. Kodachrome-inspired color. 16:9.
Lyd: den myke rytmiske lyden av hender som presser deig, fugler utenfor i hagen, en fjern vindklokke, barnets sporadiske latter, bestemoren som nynner en folkemelodi under pusten. Ingen musikk – bare diegetisk lyd.(En japansk bestemor i åttitallet, med sølvgrått hår samlet i en løs knute, dype uttrykkslinjer rundt de smilende øynene, iført et indigoblått forkle over en kremfarget linskjorte. Hun står ved siden av sin fire- eller fem år gamle barnebarn – runde kinn, kort svart hår festet med en rød hårklemme – ved det lave trebordet i det tradisjonelle kjøkkenet. Shoji-dørene glir åpne mot den lille hagen, hvor morgenlyset strømmer inn. Sammen lager de mochi. Bestemorens store hender, preget av årene, omslutter barnets små hender og veileder dem i å brette og presse den myke, klebrige risdeigen. Melstøv svevde i solstrålen mellom dem. Det hadde den Hirokazu Kore-eda-aktige filmiske kvaliteten – observasjonell, uten hastverk, dokumentarisk intimitet blandet med filmisk skjønnhet.
Inkorporer lyddesign i prompten
Lyddesign er den mest oversette dimensjonen i skriving av videoprompter. I 2026 støttet plattformer som Seedance, Veo 3 og Keeling alle synkron lydgenerering for videoer – kvalitetsforskjellen mellom prompter med lydsignaler og uten viste seg å være enorm.
Tenk på dette: en vakker skogscene uten omgivelseslyder føles som en GIF-animasjon. Legg til fuglesang, rasling av blader og fjernt murring fra en bekk, og det blir et sted du ønsker å gå rett inn i.
Lyddesignformat
Legg til talekommandoer på slutten av meldingen i et eget avsnitt eller en egen linje, som dekker tre nivåer:
Første lag: Bakgrunnsmusikk — Generell stemning og stil
Background music: slow ambient piano, minor key, sparse notes with reverb
(背景音乐:缓慢的氛围钢琴,小调,稀疏的音符带混响)Andre lag: Omgivelseslydeffekter — Etablering av bakgrunnslydene i scenen
Ambient: light rain on leaves, distant thunder rolls, wet road traffic hum
(环境音:轻柔的雨打树叶声、远处的雷声滚动、湿路上的交通嗡嗡声)Tredje lag: Action-lydeffekter og dialog — Spesifikke lyder knyttet til hendelser i videoen
SFX: footsteps on wet pavement, umbrella opening with a click
Dialogue: none
(音效:湿路面上的脚步声、雨伞咔嗒打开的声音。对话:无)Referanse for lydnøkkelord
Musikkstiler for ulike følelser:
| Stemning | Musikalsk retning (engelsk prompt) |
|---|---|
| Rolig | Ambient, mykt piano, akustisk gitar fingerpicking, lo-fi |
| Spent | Lav drone, dissonante strykere, minimal perkusjon |
| Munter | Oppbeat akustisk, ukulele, lett perkusjon, dur-toneart |
| Episk | Orkesterkrescendo, taiko-trommer, brassfanfare, kor |
| Romantisk | Strykekvartett, mild jazz, bossa nova |
| Mystisk | Mørk ambient, piano med mye reverb, fjerne klokketoner |
| Energisk | Elektronisk beat, drivende trommer, bass-tung, uptempo |
| Melankolsk | Solo cello, langsomt piano i moll, sparsom gitar |
Omgivelseslyder:
| Miljø | Lydlag (engelske instruksjoner) | |------|--------------------- -| | Skog | Fuglesang, raslende blader, fjern hakkespet, bekk | | Byen om natten | Trafikkstøy, fjerne sirener, neonlys, fotspor | | Havet | Bølger som bryter, måker, vind, fjern båtmotor | | Innendørs kafé | Kaffemaskin, mumling, skje på keramikk, jazz | | Regnværsdag | Regnintensitet (lett drypp / kraftig regn), torden, drypp | | Verksted | Verktøyljud, trespon, maskinbrum, radio i bakgrunnen |
Når skal man bruke stillhet?
Stillhet er ikke fravær av lyddesign – det er et bevisst valg. Strategisk stillhet kan skape:
- Impact Moment: Stillheten som går forut for et dramatisk øyeblikk forsterker det øyeblikket
- Sense of Scale: Bare lyden av vinden over vidstrakte landskap formidler uendelighet
- Tension: Å fjerne forventede lyder skaper uro
- Focus: Stillhet retter all oppmerksomhet mot det visuelle
I instruksjonen skal du uttrykkelig oppgi: «Lyd: stillhet – ingen musikk, ingen omgivelseslyder, bare personens pust.»
For mer informasjon om lydgenerering i produksjon av AI-musikkvideoer, se AI Music Video Generator Guide.
Plattformspesifikke promptteknikker
Den universelle formelen gjelder generelt, men hver AI-videoplattform har sine egne særtrekk når det gjelder tolkning av kommandoer. Å optimalisere kommandoer spesielt for plattformen du bruker, kan gi betydelig bedre resultater.

Det samme konseptet – «Kvinne som går i regnet» – optimalisert for fem forskjellige plattformer. Samme formel, ulik vektlegging.
Seedance
Fordeler: Storyboard-tidslinjeformat, sekvenser med flere bilder, konvertering av bilder til video, innebygd promptgenerator.
Optimaliseringsteknikker:
- Bruk en storyboard-tidslinjestruktur for komplekse sekvenser – del videoer inn i tidsstemplede opptak:
Shot 1 (0-3s): [描述]
Shot 2 (3-6s): [描述]
Shot 3 (6-10s): [描述]- Oppretthold stilistisk og karaktermessig konsistens ved å referere til opplastede bilder med
@Image1,@Image2 - Filmisk språk gir utmerkede resultater – bruk spesifikke termer (dolly, track, orbit) i stedet for vage beskrivelser («beveg deg mot»)
- Inkluderer lyddesign – Seedance håndterer lydsignaler
- Mest effektiv arbeidsflyt: Bruk Video Prompt Generator til å lage strukturerte instruksjoner fra enkle ideer, og finpuss dem deretter manuelt
Seedances omfattende plattformspesifikke promptguide (med over 50 eksempler), se Seedance Prompt Guide.
Sora(OpenAI)
Fordeler: Fysisk realistisk oppførsel, naturlige bevegelser og naturlig språkforståelse av lange tekster.
Optimaliseringsteknikker:
- Bruk flytende, beskrivende avsnitt i stedet for strukturerte lister – Sora er svært god til å analysere naturlig språk
- Legg vekt på fysiske detaljer: tyngdekraft, vekt, materialegenskaper, fluid dynamikk
- Beskriv hvordan noe « føles som» – Beskrivelser av tekstur og materiale forbedrer den fysiske troverdigheten
- Spesifiser sideforhold og varighet
- Detaljerte fysiske egenskaper: «Tungt stoff svinger med hvert skritt og henger etter på grunn av sin egen vekt» gir bedre resultater enn «flytende skjørt»
Ke Ling Kling (Kuaishou)
Fordeler: Rask genereringshastighet, sterk handling og bevegelsesytelse, utmerket ansiktskonsistens.
Optimaliseringstips:
- Hold instruksjonene korte – Keli reagerer bedre på fokuserte, handlingsorienterte instruksjoner (50–80 ord er optimalt)
- Begynn med handling: «En danser hopper og snurrer» i stedet for å nevne bevegelsen etter lange scenebeskrivelser
- Angi bevegelsesretningen tydelig: «beveger seg fra venstre til høyre», «nærmer seg kameraet», «vender seg bort»
- Keeling er svært dyktig til å håndtere menneskelige bevegelser og ansiktsuttrykk – utnytt dette til nærbilder med emosjonelle instruksjoner
- Instruksjoner for kamerabevegelser er effektive, men hvert signal bør inneholde én eller to tydelige kamerabevegelser.
Universell betydning, universell form / Runway (Gen-3 Alpha / Gen-4)
Optimaliseringsteknikker for Tongyi Wanshang:
- Støtter direkte innspill av kinesiske kommandoer, noe som gir overlegne resultater sammenlignet med oversettelse
- Viser utmerket forståelse av tradisjonelle kinesiske estetiske elementer – tusjmaling, nasjonal stil, kostymescener fra ulike epoker
- Oppnår effektive resultater med konsise og klare stilmerker
Teknikker for optimalisering av catwalken:
- Kombiner tekstbeskrivelser med stilkoder — Catwalken har robust stilforståelse
- Beskriv bevegelse ved hjelp av romlige vektorer:
bevegelse fra nederst til venstre til øverst til høyre - Når du bruker Motion Brush, fokuserer du på den generelle scenen og stilen, og bruker penselen til å finjustere bestemte bevegelsesområder
- Runway er svært god til å tolke beskrivelser av kunstnerisk stil – «i stil med en Terrence Malick-film» gir utmerkede resultater
- Oppretthold fokus – generer én distinkt scene per prompt i stedet for sekvenser med flere bilder
Veo 3(Google DeepMind)
Fordeler: Lydforståelse, fysisk simulering, kinokvalitet, utvidede sekvenser.
Optimaliseringsteknikker:
- Inkluder detaljerte lydbeskrivelser – Veo 3 genererer synkronisert lyd fra tekst
- Beskriv fysiske interaksjoner i detalj: hvordan objekter kolliderer, materialer deformeres og lyset interagerer med overflater
- Bruk filmterminologi – Veo 3s treningsdata favoriserer i stor grad profesjonell filmproduksjon
- Spesifiser varighet og tempo: «scenen utspiller seg sakte over 10 sekunder»
- Fysiske beskrivelser forbedrer effekten betydelig: «vann spruter oppover ved sammenstøt, dråper fanger bakgrunnsbelysning» i stedet for bare «spruter»
For en detaljert sammenligning av Seedance og Sora når det gjelder tolkning av kommandoer og utskriftskvalitet, se Seedance vs Sora Comparison.
Eller la AI skrive instruksjoner for deg
Du har nettopp fullført læringen av hele rammeverket for å lage videoprompter fra bunnen av. Denne kunnskapen er utrolig verdifull – den gir deg muligheten til å bedre vurdere kvaliteten på prompter og gir deg full kontroll over alle detaljer. Likevel trenger du ikke å skrive hver enkelt prompt manuelt hver gang.

Hybrid arbeidsflyt: La AI håndtere strukturell og teknisk terminologi, og tilfør deretter ditt kreative perspektiv i optimaliseringsfasen.
Når skal man skrive for hånd og når skal man bruke AI?
| Scenario | Beste tilnærming |
|---|---|
| Du har en presis kreativ visjon og vet nøyaktig hva du vil | Håndskrift — du vil være raskere og mer nøyaktig enn å redigere AI-utkast |
| Du har en grov idé, men trenger struktur | AI-generering → Manuell finpussing |
| Du trenger å generere flere varianter av prompten raskt | AI-batchgenerering → Velg og finpuss det beste |
| Du lærer og ønsker å studere promptstrukturer | AI-generering → Les og analyser – slik bygger du opp ordforrådet ditt |
| Du trenger å matche spesifikke referansebilder | Håndskrevet – beskriv nøyaktig hva du ser i referansen |
Hybrid arbeidsflyt (anbefalt)
Den mest effektive arbeidsflyten for hurtig skriving kombinerer AI-generering med menneskelig finpussing:
-
Start med AI. Gå til Seedance Video Prompt Generator, beskriv ideen din i en eller to setninger, velg en stil og generer.
-
Gjennomgå resultatet kritisk. AI-en vil generere en strukturert prompt som inneholder kamerabevegelsesspråk, tidslinjer, belysning og lyd. Les den grundig gjennom. Stemmer kameraarbeidet med den ønskede følelsesmessige tonen? Skaper belysningsretningen den tiltenkte atmosfæren? Er det noen detaljer du ønsker å endre?
-
Manuell optimalisering. Her kommer din kunnskap om formler, filmterminologi og atmosfæriske nøkkelord til nytte. Erstatt AI-valgte bilder med bilder som er mer i tråd med din visjon. Juster nøkkelord for belysning. Legg til spesifikke detaljer som AI ikke kan vite – karakteristiske trekk, merkevarespesifikke krav, emosjonelle nyanser.
-
Generer videoen. Send den optimaliserte prompten til videogeneratoren. Resultatene vil være langt bedre enn helt manuelle nybegynnerprompter eller helt AI-genererte, uredigerte prompter.
En omfattende guide til bruk av AI-promptgeneratorer finner du i AI Video Prompt Generator Guide.
Filmiske effekter: Mestring gjennom integrering
La oss lage en endelig prompt som bruker alt som er dekket i denne guiden – formler, filmisk språk, atmosfæriske nøkkelord, lyddesign – for å skape en virkelig filmisk effekt.
Kreativ brief: En ensom astronaut oppdager planteliv på Mars.

Fullt spesifiserte filmiske instruksjoner gir resultater som om de var regissert av en filmskaper – for det er faktisk det de er. Hvert element tjener fortellingen.
Fullstendig prompt:
Subject: A solitary astronaut in a dusty, sun-bleached EVA suit — visor partially reflective, scratched from use, mission patches barely legible. The suit is not pristine Hollywood white; it is a working tool, weathered by months on the Martian surface.
Action: The astronaut crouches beside a small crack in the rust-red basalt. Inside the crack, a single tiny green sprout — two delicate leaves, almost translucent — pushes up through the red soil. The astronaut's gloved hand reaches toward it, hesitates, trembles slightly, then gently touches the soil beside it.
Environment: The Martian surface — a flat, rust-red plain scattered with dark basalt rocks, stretching to low eroded hills on the horizon. The sky is a pale butterscotch-pink. Dust devils move in the far distance. The scene feels vast and achingly empty — except for this one tiny green thing.
Camera: Opens with an extreme wide shot — the astronaut is a small figure in the immense Martian landscape. Slow dolly in over 4 seconds to a medium shot. As the astronaut crouches, camera drops to ground level and continues to a close-up of the gloved hand and the sprout. Rack focus: pull from the hand to the astronaut's visor, where we see the sprout's reflection. 65mm lens, anamorphic.
Lighting: Late Martian afternoon — low sun from camera-right, casting long amber-red shadows. The side light sculpts the EVA suit's texture. The sprout's translucent leaves glow with subsurface scattering as sunlight passes through them — the only green in a world of red. Volumetric dust particles drift through the light beam.
Style: Ridley Scott's The Martian meets Terrence Malick's The Tree of Life. Cinematic, anamorphic, muted Martian color palette with the single point of vivid green as deliberate contrast. Subtle film grain.
Sound: Wind — thin, high-pitched Martian wind, unlike Earth wind. The astronaut's breathing inside the suit — measured at first, then quickening. A single sustained low note from a cello enters as the hand reaches for the sprout. No dialogue. No narration.En ensom astronaut, kledd i en støvbelagt EVA-drakt som er bleknet av solen – visiret er halvreflekterende, med riper etter bruk, og oppdragsmerket er knapt synlig. Denne drakten er ikke den uberørte Hollywood-hvite; den er et arbeidsverktøy, forvitret av måneder på Mars-overflaten. Krummet sammen ved siden av en smal sprekk i rustrød basalt, observerer astronauten en liten grønn spire – to slanke, nesten gjennomsiktige blader – som kommer frem fra den rødbrune jorda. En hansket hånd strekker seg mot den, nøler, skjelver litt, og berører så forsiktig jorda ved siden av den.
Denne instruksjonen inneholder alle syv formelelementer, spesifikt filmisk språk (ekstremt langt kamera, kamerabevegelse, fokusendring), atmosfæriske nøkkelord (volumetrisk belysning, spredning under overflaten, anamorfisk linse), lyddesign (omgivende vind, pustelyder, ensom cellotone) og stilistiske referanser (Ridley Scott, Terrence Malick). Hver detalj tjener den emosjonelle bua: ensomhet → oppdagelse → ærefrykt.
Dette er videoprompt-ingeniørprosjektet.
Ofte stilte spørsmål
Hvor lange bør AI-videoprompter være?
Det finnes ingen universell standard for lengde. Den passende lengden avhenger av kompleksiteten i det kreative konseptet og plattformen som brukes. Nivå V1 (15–30 ord) gir universelle resultater på alle plattformer. Nivå V2 (50–80 ord) representerer det optimale området for de fleste plattformer – tilstrekkelig spesifikt uten å overbelaste modellen. Nivå V3 (100–200 ord) gir de mest kontrollerbare resultatene på plattformer som støtter lange kommandoer, for eksempel Seedance og Sora. Når du bruker Keeling, bør du holde deg til omtrent 50–80 ord. Det avgjørende målet er ikke antall ord, men om alle elementene i formelen er omfattende behandlet.
Er bakgrunn i fotografering avgjørende for å lage effektive videoprompter?
Det er ikke avgjørende, men det vil være svært nyttig å forstå det – og denne guiden har nettopp lært deg det viktigste. Du trenger ikke en filmutdannelse; det du trenger er å kjenne navnene på 10–15 typer kamerabevegelser, forstå den emosjonelle effekten av ulike lysstiler og ha et vokabular for å beskrive atmosfæren. Lag et bokmerke for seksjonene [Kameraspråk](#Kameraspråk – hemmelig våpen) og Atmosfære-nøkkelordbibliotek, og gå tilbake til dem gjentatte ganger til disse begrepene blir en del av deg.
Kan samme prompt brukes på forskjellige AI-videoplattformer?
Absolutt – den universelle formelen gjelder universelt. Imidlertid tolker hver plattform instruksjoner forskjellig. Instruksjoner som er optimalisert for Sora (langform, flytende, med vekt på fysikk) kan kreve omstrukturering for Keeling (kortere, handling først). Avsnittet Plattformspesifikke teknikker beskriver hvordan du kan tilpasse deg. Kjerneformelen forblir uendret; bare leveringsformatet tilpasses.
Hva skiller denne guiden fra Seedance-promptguiden?
Seedance Prompt Guide er plattformspesifikk – den lærer deg Seedances storyboard-format, bildereferanser og over 50 bruksklare prompter. Denne guiden er universell – den lærer deg grunnleggende ferdigheter i å skrive prompter som kan brukes på alle plattformer. Betrakt denne guiden som læreboken din, og Seedance-guiden som din praktiske håndbok for et spesifikt verktøy.
Hvordan beskrive kamerabevegelser hvis man ikke er kjent med filmterminologi?
Beskriv først hva du vil at publikum skal se og føle. «Kameraet nærmer seg sakte motivets ansikt» er en dolly i «Kameraet følger personen som går fra siden» er en tracking shot. AI-plattformer forstår naturlige språkbeskrivelser ganske godt. Imidlertid gir læring av teknisk terminologi (ved hjelp av [referansen til kamerabevegelsesspråk](#kamera bevegelsesspråk hemmelig våpen) ovenfor) betydelig bedre resultater, da AI-modeller er trent på videoer som er beskrevet ved hjelp av nettopp disse profesjonelle begrepene.
Bør omvendte instruksjoner (hva som ikke skal inkluderes) inkluderes?
Visse plattformer støtter omvendte instruksjoner – instruksjoner som spesifiserer hva som skal unngås. Disse kan være nyttige: «Ingen tekstoverlegg, ingen vannmerker, ingen uskarpe rammer». De fleste moderne AI-videogeneratorer håndterer imidlertid kvalitetsproblemer mer effektivt gjennom positive spesifikasjoner. I stedet for å skrive «ingen dårlig belysning», spesifiser «Rembrandt-belysning fra kameraets venstre side». I stedet for «ingen rystende opptak», skriv «jevn steadicam-bevegelse». Positive instruksjoner veileder AI-en mot det ønskede resultatet, mens negative instruksjoner bare forteller den hva den skal unngå, og overlater alternativene til tilfeldighetene.
Hvordan opprettholde karakterkonsistens på tvers av flere spørsmål?
Å opprettholde karakterkonsistens på tvers av flere AI-videogenerasjoner er en av de mest utfordrende aspektene ved prompt-skriving. Tre strategier har vist seg å være nyttige: (1) Bruk en ekstremt spesifikk karakterbeskrivelse, og gjenta den ordrett mellom promptene – «en kvinne i slutten av 20-årene, japansk, langt svart hår, oversized kullgrå ullfrakk, kremfarget turtleneck». (2) Bruk bilde-til-video-arbeidsflyter – last opp referansebilder av karakteren for AI-animasjon. Seedance støtter dette via @Image-referanser. (3) Generer alle klipp for samme karakter i én enkelt økt når det er mulig, ved å bruke konsistente frø eller stilinnstillinger.
Finnes det noe verktøy som kan hjelpe meg med å skrive videoprompter?
Ja. Seedance's Video Prompt Generator aksepterer beskrivelser i naturlig språk for å generere komplette, strukturerte opptakslister som omfatter kamerabevegelser, tidslinjer, belysning og lyddesign. For detaljert veiledning, se AI Video Prompt Generator Guide. Anbefalt arbeidsflyt: AI-generering → manuell finjustering → videoproduksjon.
Begynn å skrive bedre videoprompter i dag
Du har nå et omfattende verktøysett: formelen med syv elementer, en referanse for kamerabevegelsesspråk som omfatter over 15 teknikker, et firedimensjonalt nøkkelordbibliotek for atmosfære som dekker mer enn 50 begreper, fem progressive eksempler som illustrerer utviklingen fra grunnleggende til filmiske standarder, metodikk for lyddesign og plattformspesifikke optimaliseringsteknikker.
Forskjellen mellom amatør- og profesjonell AI-videoproduksjon ligger ikke i verktøyene, men i instruksjonene. Og å skrive instruksjoner er en ferdighet som forbedres med øvelse.
Tre måter å begynne på:
-
Øv deg på formelen. Velg et hvilket som helst emne og utarbeid versjonene V1 → V2 → V3. Sammenlign resultatene. Forbedringen vil være umiddelbar og betydelig.
-
Bruk en promptgenerator. La AI-en håndtere strukturen, og bruk deretter din kunnskap om kamerabevegelser og atmosfære til å finpusse resultatet. Prøv videopromptgeneratoren →
-
Lag din første video. Velg din beste prompt og lag en video nå. Åpne videogeneratoren →
Mer umiddelbar inspirasjon og bruksklare eksempler:
- 10 praktiske AI-videoprompter — Testede prompter med V1→V2→V3-iterasjoner
- Komplett guide til tekst-til-video-AI — Forstå teknologien bak verktøyene
- Guide til AI-videopromptgenerator — La AI lage prompts for deg
- Guide til Seedance-prompts — Over 50 Seedance-spesifikke prompts
Den beste AI-videoen du noensinne vil lage, begynner med den neste prompten du skriver.

