TL;DR
Fantastiska AI-videor skapas utifrån fantastiska uppmaningar. Den här guiden lär dig en universell formel för videouppmaningar – ett ramverk med sju element som kan användas på alla vanliga AI-videoplattformar:
[Ämne] + [Handling] + [Miljö] + [Kamerarörelse] + [Belysning] + [Stil] + [Ljud]
Du kommer att lära dig: De främsta orsakerna till att promptfel uppstår (och hur du åtgärdar dem direkt), en omfattande referensguide för kameratermer som täcker över 15 kamerarörelsestekniker, ett bibliotek med nyckelord för atmosfär organiserat i fyra dimensioner: belysning, färgpalett, textur och stämning, fem progressiva promptsexempel från grundläggande till filmisk kvalitet, hur du integrerar ljuddesign i prompts och plattformsspecifika optimeringstekniker för Seedance, Sora, Kling, Runway och Veo 3.
Detta är inte en verktygsguide – det är en metodik. Färdigheter i att skriva videomanus kan överföras mellan olika plattformar; lär dig dem en gång, så kan du använda dem överallt.
Automatiskt genererade uppmaningar →

Samma koncept, men helt olika resultat. Uppgiften till vänster lyder: "En kvinna som går i regnet." Uppgiften till höger specificerar kamerarörelser, ljusriktning, atmosfär och ljud – vilket AI-modellen svarar på med filmisk kvalitet.
Varför de flesta AI-videoprompter misslyckas (och hur man åtgärdar dem)
Oavsett vilken AI-videogenerator du använder – Seedance, Sora, Keeling, Runway eller Veo 3 – är grundprincipen densamma: ju mer precis och strukturellt komplett din textinmatning är, desto mer kontrollerbart och filmiskt blir resultatet. De flesta skriver uppmaningar som om de skulle beskriva ett fotografi för en vän, men video är inte ett fotografi. Video involverar rörelse, tid, kamerans beteende, atmosfärisk utveckling och ljud.
Nedan följer de fem vanligaste orsakerna till snabba fel, var och en åtföljd av en omedelbar lösning.
- För vagt – problemet med den ”vackra solnedgången”
Det vanligaste felet. Du skriver "en vacker solnedgång vid havet" och får ett tekniskt korrekt men känslomässigt tomt utdrag som liknar en standardskärmsläckare.
Problemet är inte att AI inte kan återge en solnedgång, utan att "skönhet" och "solnedgång" är den enda information du har gett. Efter att ha stött på miljontals solnedgångar i sina träningsdata väljer AI det statistiska medelvärdet – och medelvärdet är, till sin natur, mediokert.
| Före modifiering | Efter modifiering |
|---|---|
| En vacker solnedgång över havet | Gyllene ljus sprids över en lugn stillahavskust, vågor slår mot vulkaniska klippor, solen står två fingertjocklekar över horisonten, himlens färgskiftningar går från djup bärnstensfärg vid horisonten till laxrosa och blek lavendel vid zenit, långa skuggor sträcker sig mot kameran Solen hänger två fingertoppar över horisonten, himlens färgskiftningar övergår från djup bärnstensfärg vid horisonten till laxrosa och blek lavendel vid zenit, långa skuggor sträcker sig mot kameran) |
Rättningsmetod: Ersätt adjektiv ("vacker", "häpnadsväckande", "fantastisk") med specifika, observerbara detaljer – färg, position, struktur, rumsliga relationer.
- Avsaknad av rörelseinstruktioner – problem med statiska bilder
Du skrev en mycket detaljerad scenbeskrivning, men AI genererade en bild som ser ut som ett fotografi med en lätt push-pull-effekt – eftersom du beskrev ett ögonblick, inte en rörelse.
Video är tidsberoende. Utan tydliga rörelseinstruktioner använder AI som standard den mest konservativa tolkningen: långsam framåtrörelse eller liten parallax. Tekniskt sett är detta visserligen "video", men det är inte vad du önskar.
| Före modifiering | Efter modifiering | |--------|------- -| | En vintage röd sportbil parkerad på en bergsväg, dimmig morgon, filmisk (一辆复古红色跑车停在山路上,薄雾清晨,电影感) | En vintage röd Porsche 911 accelererar längs en slingrande bergsväg, däcken griper tag i den våta asfalten, dimman skingras runt karossen, kameran följer med i höjd med stötfångaren, träden suddas ut i förgrunden |
Åtgärdsmetod: Varje videoklipp kräver minst ett verb som beskriver motivets fysiska rörelse och en fras som beskriver kamerans rörelse. Motivet rör sig, kameran rör sig – tillsammans skapar de visuell energi.
3. Den motsägelsefulla riktlinjen – paradoxen med ”närbild + totalbild”
Denna situation är vanligare än man kan tro, särskilt när människor strängar ihop filmtermer som de har hört men inte helt förstår. "Extrem närbild av en kvinna som korsar en vidsträckt öken, vidvinkel, episk känsla" innehåller två motstridiga kompositionsdirektiv. AI:n kommer att försöka ta ett genomsnitt och producera en bild som varken är nära eller avlägsen, utan helt enkelt kaotisk.
| Före revidering | Efter revidering |
|---|---|
| Närbild av en kvinna som korsar en vidsträckt öken, vid etableringsbild, episk skala | Extrem närbild av en kvinnas ögon som reflekterar ökenljuset, sandpartiklar som fångar solnedgångens gyllene ljus på hennes ögonfransar, kort skärpedjup med det vidsträckta sanddynerna suddiga i en bärnstensfärgad gradient bakom henne (Extrem närbild av kvinnan, ögonen reflekterar ökenljuset, sandpartiklar som fångar solnedgångens gyllene ljus på hennes ögonfransar, kort skärpedjup som gör de vidsträckta sanddynerna bakom henne till en bärnstensfärgad gradient) |
Fixeringsmetod: Välj en kameraposition per tagning. Om du behöver närbilder och långa tagningar, skriv två separata tagningar och koppla ihop dem med en övergång. För sekvenser med flera tagningar stöder plattformar som Seedance storyboard-tidslinjeformatet, vilket gör att du kan ange varje tagning separat.
- Brist på atmosfär — ett vakuum av ljus, skuggor och känslor
Din uppmaning beskriver ett motiv som utför en handling på en specifik plats. Detta täcker tre av de sju dimensionerna. Utan vägledning om belysning, färgpalett, atmosfäriska effekter eller stilistisk inriktning kommer AI att fylla i luckorna med neutrala standardinställningar: platt, enhetlig belysning, dämpade färger och ingen särskild stämning. Resultatet liknar högupplösta CCTV-bilder.
| Före revidering | Efter revidering | |--------|------- -| | En man som sitter ensam på ett kafé | En man i fyrtioårsåldern sitter ensam i ett svagt upplyst hörnbås, varmt bärnstensfärgat ljus från en enda pendellampa fångar ångan som stiger upp från hans kaffekopp, regn rinner nerför fönstret bakom honom och kastar vågiga skuggmönster över hans ansikte, dämpade färger i blågrönt och koppar, melankolisk atmosfär |
Åtgärdsmetod: Inkorporera ljusriktning, färgtemperatur, atmosfäriska effekter (dimma, regn, damm, ånga) och stämningsord. Dessa fyra tillägg förvandlar "en scen" till "en känsla".
- Avsaknaden av ljuddesign – problemet med stumfilmer
År 2026 kommer de flesta AI-videoplattformar att stödja ljudgenerering – bakgrundsmusik, omgivande ljudeffekter och till och med dialog med läppsynkronisering. Ändå förblir de flesta människors instruktioner helt tysta, eftersom de behandlar videoinstruktioner enbart som visuella instruktioner.
Ljudet utgör hälften av upplevelsen. En skogsscen utan fågelsång och lövrask känns artificiell. Actionsekvenser utan effektljud känns intetsägande. Produktdemonstrationer utan musik liknar PowerPoint-presentationer.
| Före modifiering | Efter modifiering | |------- -|--------| | En katt hoppar från en bokhylla och landar på en soffa | En rödbrun katt hoppar graciöst från toppen av en hög bokhylla i ek, sträcker ut kroppen i luften och landar mjukt på en sammetskudde som trycks ihop under dess vikt. Ljud: mjuka tassklappar på tyget, en enda bok som glider på hyllan, tyst omgivningsljud med regn som smattrar mot fönstren i fjärran Ljud: mjuka tassavtryck på tyget, en enda bok som glider på hyllan, tyst omgivningsljud med avlägset regn mot fönstren) |
Lösning: Lägg till en rad med ljudinstruktioner i slutet av prompten, där du anger bakgrundsmusikens stil, omgivande ljudeffekter och eventuella dialoger eller berättarröster. Vi ger detaljerade riktlinjer i avsnittet [Ljuddesign](#Inkorporera ljuddesign i promptar) nedan.
Universell formel för videoprompt
Oavsett vilken plattform du använder innehåller varje effektiv videoprompt samma sju element. Vissa är väsentliga (krävs i varje prompt), medan andra är valfria (förbättrar effektiviteten men är inte obligatoriska). Formeln:
[Ämne] + [Åtgärd] + [Miljö] + [Kamera] + [Belysning] + [Stil] + [Ljud]

De sju nyckelelementen i en universell formel för videoprompt. Varje element tillför en ytterligare dimension av kontroll till det slutliga resultatet.
Nedan kommer vi att gå igenom varje element i tur och ordning, tillsammans med ett nyckelordsbibliotek och exempelmeningar.
Element ett: Ämne (obligatoriskt)
Motivet är föremålet för publikens blickar. Detta bör vara den mest specifika delen av uppgiften – inte ”en kvinna”, utan ”en kvinna i 60-årsåldern, med silvergrått hår som är löst uppsatt i en knut, djupa skrattrynkor i ögonvrån och klädd i ett blekt denimförkläde”.
Nyckelordsbibliotek:
| Kategori | Exempel (engelsk prompt) | |------|------------------ -| | Karaktärer | en ung man i tjugoårsåldern, en äldre kvinna, ett barn i femårsåldern, en dansare, en kock, en soldat | | Djur | en golden retriever, en snöleopard, en kolibri, en koi-fisk, en monarkfjäril | | Föremål | en gammal skrivmaskin, en kristallparfymflaska, en läderinbunden dagbok, en keramikvas | | Fordon | en matt svart motorcykel, en träbåt, en sliten pickup, ett höghastighetståg | | Abstrakt | ljuspartiklar, bläckdroppar i vatten, geometriska former, flytande metall |
Exempel på fraser:
En barista i 30-årsåldern med tatueringar på armarna och ett mjölbestrött svart förklädeEn väderbiten bronskompass som ligger öppen på en sjökort-Tusentals papperslyktor, var och en lysande med ett varmt gult sken från ett ljus inuti
Element två: Åtgärd (obligatoriskt)
Handling är det som utspelar sig – vad personen gör och hur scenen utvecklas över tid. Detta är skillnaden mellan videoklipp och bilder. Utan handling är det bara ett rörligt fotografi.
Nyckelordsbibliotek:
| Rörelsetyp | Exempel (engelsk prompt) | |--------- -|-------------------| | Mänsklig rörelse | gå, springa, vända sig långsamt, sträcka sig, luta sig framåt, andas ut, blinka | | Relativt till kamerarörelse | närma sig kameran, gå bort från kameran, korsa bildrutan från vänster till höger | | Objektrörelse | rotera, falla, sväva, splittras, monteras, veckas ut, smälta | | Miljörörelse | vind som rör sig genom gräs, moln som rullar, regn som faller, löv som flyger, tidvatten som kommer in | | Övergångsprocesser | dag som övergår till natt, blomma som blommar, is som bildas, färg som sprids, ljus som skiftar |
Exempel på fraser:
Hon böjer sig långsamt ner och plockar upp ett fallet höstlöv, som hon vänder och vrider mellan fingrarnaKompassnålen darrar, sedan svänger den bestämt mot norrLyktor lyfter en efter en från marken och stiger upp i den mörka himlen i olika hastigheter
Element tre: Miljö (väsentligt)
Miljön är den plats där scenen utspelar sig. Beskriv både den omedelbara miljön (förgrunden) och den mer omfattande bakgrunden. Ange väder, tid på dygnet och årstid när det är relevant.
Nyckelordsbibliotek:
| Scentyp | Exempel (engelsk prompt) | |----------|------------------ -| | Natur | tät skog, öken sanddyner, havsklippa, alpäng, vulkanstrand, bambuskog | | Stadsmiljö | smal gränd i Tokyo, brutalistisk betongtorg, takterrass, tunnelbanestation, neonbelyst avenyn | | Inomhus | bibliotek med levande ljus, industriell loftvåning, växthus, vintage mörkrum, marmoratrium | | Fantasi | flytande öar, kristallgrotta, självlysande rev, förstört tempel, molnstad | | Tid/Väder | skymning före gryningen, mulen middagstid, åskväder, första snön, fuktig sommarkväll |
Exempel på fraser:
I en smal sidogata i Kyoto, med stenlyktor på båda sidor, flyter körsbärsblommor över våta kullerstenarInuti en cavernös övergiven katedral tränger dammiga ljusstrålar igenom trasiga mångfärgade glasfönsterVid kanten av en vulkanisk klippa under den blå timmen stiger svavelhaltig ånga upp från sprickorna i den svarta klippan
Element fyra: Kamerarörelser (viktigt)
Kamerainstruktioner guidar AI-publiken i hur de ska betrakta en scen, inklusive komposition (hur nära), vinkel (varifrån) och rörelse (hur synvinkeln förändras över tid). Kameraspråket är den viktigaste faktorn för att förbättra kvaliteten på uppmaningar – vi utforskar detta mer ingående i det särskilda avsnittet nedan.
Snabbnyckelordsbibliotek:
| Aspekt | Engelsk terminologi och kinesisk motsvarighet | |------|------------------ -| | Bildkomposition | extrem närbild, närbild, mellanbild, helbild, vidbild, extrem vidbild (extremt långt avstånd) | | Vinkel | ögonhöjd, låg vinkel, hög vinkel, fågelperspektiv, maskinsyn, sned vinkel | | Rörelse | dolly in/ut, panorering åt vänster/höger, tilt upp/ner, tracking shot, orbit, kran (höjd) | | Objektiv | 24 mm vidvinkel, 50 mm standard, 85 mm porträtt, 200 mm tele, makroobjektiv, anamorfiskt |
Element fem: Belysning (viktigt)
Ljus och skugga avgör stämningen i varje bildruta. Professionella fotografer lägger timmar på att ordna belysningen. I snabbskrivning kan några få precisa ord uppnå samma nivå av kontroll.
Nyckelordsbibliotek:
| Belysningstyp (engelska/kinesiska) | Visuella effekter | |--------------------- -|----------| | Gyllene timmen | Varma toner, långa skuggor, orange-bärnstensfärgade nyanser, smickrande för porträtt | | Blå timmen | Kalla toner, melankolisk atmosfär, djupblå himmel med kvarvarande värme vid horisonten | | Bakgrundsbelysning | Konturlinjer, silhuetteffekt, tydlig separation från bakgrunden | | Sidoljus | Halvt upplyst, halvt skuggat ansikte; hög kontrast, dramatisk effekt | | Rembrandtbelysning | Triangulär höjdpunkt under det skuggade ögat; klassisk porträtt effekt | | Volymetrisk belysning | Synliga strålar som tränger igenom damm, dimma eller rök | | Tyndalleffekt | Ljus som sprids inom partiklar och ger tydliga strålar inom dimma eller damm | | Neon | Färgade artificiella ljuskällor, reflektioner på våta ytor, cyberpunk-estetik |
Element sex: Stil (rekommenderas)
Stilen avgör vilket visuellt språk som används av AI – film, dokumentärrealism, animation, oljemålning eller annat. Utan någon stilriktlinje använder AI som standard en generisk fotorealistisk stil.
Nyckelordsbibliotek:
| Stil (engelska/kinesiska) | Visuella egenskaper | |----------------- -|----------| | Filmisk | Kort skärpedjup, filmfärgkorrigering, bredbildsformat 2,39:1 | | Dokumentär | Handhållen kamera, naturlig belysning, observationsramar | | Reklam | Rent, ljust, produktfokuserat, exakt belysning, jämna rörelser | | Anime | Cellskuggad stil, livfulla färger, överdrivna rörelser, dynamiska linjer | | Film noir | Högkontrastig monokrom, persiennskuggor, lågmäld belysning | | Tuschmålning | Svart tusch på vit bakgrund, flytande övergångar, minimalism, östlig estetik | | Vintagefilm | Filmkorn, något avmätt, varma toner, mjuka kanter | | Cyberpunk | Neonbelysning, hög kontrast, holografiska element, urban apokalyptisk känsla |
Element sju: Ljud (valfritt)
Ljud tillför en auditiv dimension. Även om inte alla plattformar stöder ljudgenerering är det inte bara framåtblickande att integrera ljuddesign i uppmaningar, utan det förstärker ofta också den visuella effekten – eftersom AI använder ljudsignaler för att påverka den emotionella tonen och takten i det visuella.
Nyckelordsbibliotek:
| Ljudtyp | Exempel (engelsk prompt) |
|---|---|
| Musikstil | orkester, lo-fi hiphop, ambient elektronisk, jazzpiano, akustisk gitarr, filmmusik (filmmusik) |
| Omgivande ljudeffekter | regn på glas, vind i träd, stadstrafikens surr, havsvågor, sprakande eld |
| Actionljudeffekter | fotsteg på grus, dörr som knakar, glas som krossas, motor som varvar |
| Röster | viskad berättarröst, dialog, andning, skratt |
Filmens språk: det hemliga vapnet
Filmiskt språk är den mest inflytelserika färdigheten du kan utveckla som författare av videomanus. När du skriver ”dolly in slowly” istället för ”zoom in” talar du AI-modellernas modersmål – dessa modeller är nämligen tränade på miljontals timmar av professionellt filmat material, där kamerarörelser har specifika namn och ger specifika visuella effekter.
Det här avsnittet fungerar som din omfattande referensguide. Vi rekommenderar att du bokmärker det.

Kamerarörelser är inte utbytbara – varje rörelse ger en specifik känslomässig effekt. Att känna till rätt terminologi kommer att förändra effekten av dina instruktioner.
Kärnfilmkonst
Dolly In / Dolly Out (push shot / pull shot)
Kameran flyttas fysiskt närmare motivet (push) eller längre bort (pull). Till skillnad från zoomning förändras perspektivet – objekt i förgrunden visas proportionellt större, vilket skapar en känsla av djup och fysisk närhet.
- Emotionell effekt: Skapar intimitet, fokus och avslöjande. Framkallar isolering, sammanhang och avsked.
- När man ska använda det: Använd för emotionella närbilder, karaktärsögonblick och avslöjande detaljer. Dra tillbaka för att visa skala, avsluta eller dra sig tillbaka från motivet.
- Stödfras:
Kameran rullar långsamt in från medellångt avstånd till extrem närbild på motivets händer
Panorer åt vänster/panorer åt höger (horisontell panorering)
Kameran förblir stillastående och roterar horisontellt som om du vänder på huvudet. Synvinkeln sveper över scenen.
- Emotionell effekt: Undersökning, upptäckt, lateral spårningsrörelse, koppling mellan två element inom en scen.
- När ska det användas: För att visa landskap, spåra rörliga karaktärer, demonstrera rumslig bredd.
- Stödfras:
Långsam panorering åt höger över verkstaden, som avslöjar rader av handgjorda instrument på väggen
Tilt upp/tilt ner (vertikal panorering/tilt)
Kameran förblir stillastående och roterar vertikalt – som om den nickar. En panorering uppåt visar höjden; en panorering nedåt visar detaljerna på marken.
- Emotionell effekt: En uppåtvinkling väcker vördnad, storhet och längtan. En nedåtvinkling förmedlar en känsla av jordnärahet, upptäckt och intimitet med ytan.
- När man använder det: En uppåtvinkling används för höga byggnader, karaktärer som reser sig upp eller för att visa himlen. Nedåtgående panoreringar avslöjar föremål på ett bord eller övergången från himmel till mark.
- Stödmening:
Kameran panorerar uppåt från det gamla trädets rötter och följer den massiva stammen till trädkronan
Följningsbild (följningsbild/sidföljningsbild)
Kameran rör sig parallellt med motivet och håller ett konstant avstånd och en konstant vinkel, som om den var monterad på en skena som löper parallellt med motivets väg.
- Emotionell effekt: Kamratskap, resa, fördjupning. Publiken reser tillsammans med motivet.
- När ska det användas: För karaktärer som går eller springer, rör sig genom utrymmen eller visar upp produkter längs ytor.
- Stödfras:
Kameran följer löparen i axelhöjd och håller samma tempo när hon springer genom gränden
Bana/båge (cirkulär följningsbild)
Kameran roterar runt motivet samtidigt som det hålls centrerat i bildrutan. Detta kan innebära en fullständig 360-graders rotation eller en partiell båge.
- Emotionell effekt: Heroisk närvaro, känsla av makt, utställningskvalitet, tredimensionell visning.
- När ska den användas: Produktdemonstrationer (visar alla vinklar), hero shots, dramatiska karaktärspresentationer, avgörande ögonblick.
- Stödfras:
Kameran roterar 180 grader runt schackspelaren, med start bakifrån och avslutning framifrån
Kran upp / Kran ner (höjningsbild / jibbild)
Vertikal kamerarörelse – fysisk höjning eller sänkning – kombineras vanligtvis med tilt för att hålla motivet inom ramen.
- Emotionell effekt: Uppåtgående rörelser skapar en känsla av transcendens, befrielse och ett vidgat perspektiv. Nedåtgående rörelser främjar jordnära känsla, ankomst och fokuserad uppmärksamhet.
- När man ska använda det: Uppåtgående rörelser för slutsatser, triumfögonblick eller övergångar till luftiga perspektiv. Nedåtgående tagningar används för öppningar, ankomster och övergångar från vidvinkelbilder till intima kompositioner.
- Stödfras:
Kamerakranen lyfter från marknivå, stiger över folkmassan och avslöjar festivalens fulla omfattning
Handhållen (handhållen lins)
Linsen uppvisar en subtil organisk vackling – den är inte monterad på ett stativ eller en stabilisator. Detta simulerar känslan av en mänsklig fotograf som håller kameran i handen.
- Emotionell effekt: Omedelbarhet, brådska, dokumentär äkthet, spänning, intimitet.
- När ska det användas: Actionsekvenser, känslomässiga dialoger, dokumentärstil, skräckfilmer, alla scener som kräver en uppslukande känsla.
- Starthänvisning:
Handhållen kamera följer karaktären genom den trånga marknaden, något ostadigt
Steadicam / Gimbal (Steadicam/stabiliserande objektiv)
Jämna, flytande kamerarörelser glider genom rummet. Till skillnad från handhållna bilder finns det ingen skakning – rörelsen är flytande och kontinuerlig.
- Emotionell effekt: Drömlik, elegant, uppslukande, avslappnad utforskning.
- När man använder det: Navigera i arkitektoniska utrymmen, följa karaktärer genom komplexa miljöer, tagningar i en enda tagning, lyxig och estetisk filmfotografi.
- Promptfras:
Steadicam glider bakom dansaren när hon rör sig genom den tomma balsalen
Avancerade kamerarörelsestekniker
Hitchcock-zoom (dollyzoom/vertigo-effekt)
När kameran zoomar in ökar brännvidden (eller vice versa). Motivet förblir samma storlek, men bakgrunden genomgår en dramatisk förvrängning – antingen sträcks den ut eller komprimeras.
- Emotionell effekt: Desorientering, uppenbarelse, fasa, världen som skiftar runt en fast punkt.
- Stimulansfras:
Dolly zoom på karaktärens ansikte — kameran zoomar in medan linsen zoomar ut, bakgrunden sträcker sig bort och skapar en svindlande effekt
Whip Pan
Extremt snabb horisontell panorering, vilket resulterar i att hela bilden blir suddig under rörelsen. Används ofta som övergång mellan två scener.
- Emotionell effekt: Energi, överraskning, brådska, komisk rytm.
- Signalfrase:
Snabbt kameraskift från talarens ansikte till publikens reaktion, rörelseoskärpa under övergången
Rack Focus (Pull Focus)
Fokus flyttas från ett djupplan till ett annat inom en och samma bild. Förgrunden blir suddig medan bakgrunden blir skarpare, eller tvärtom.
- Emotionell effekt: Omdirigerar uppmärksamheten, avslöjar information, kopplar samman element i förgrunden och bakgrunden.
- Promptfras:
Flytta fokus från de suddiga blommorna i förgrunden till kvinnans ansikte i bakgrunden
Holländsk vinkel (lutande vinkel)
Linsen lutar längs rullningsaxeln, vilket skapar en diagonal horisont. Världen ser sned ut.
- Emotionell effekt: Obehag, instabilitet, spänning, stiliserad dramatik, frenesi.
- Promptfras:
Dutch angle-närbild av detektivens ansikte, 15 graders lutning, hård sidobelysning
Hastighetsramp (tidsrampning)
Uppspelningshastigheten varierar inom en och samma tagning – vanligtvis saktar den ner vid avgörande ögonblick innan den accelererar igen.
- Emotionell effekt: Betonar, påverkar, ger dramatisk tyngd åt specifika ögonblick.
- Promptfras:
Rörelsen övergår till slow motion vid ögonblicket för påverkan, sedan accelererar den tillbaka till realtid
One-Take (lång tagning)
Kontinuerlig filmning utan redigering. Kameran rör sig genom rum, följer rörelser och upptäcker element, samtidigt som den bibehåller ett enda oavbrutet perspektiv genom hela filmen.
- Emotionell påverkan: Uppslukande upplevelse i realtid, känsla av teknisk skicklighet, ihållande spänningsuppbyggnad.
- Promptfras:
Kontinuerlig tagning i en enda tagning: kameran kommer in genom ytterdörren, glider genom hallen och anländer till trädgården
Första person / POV
Kameran representerar karaktärens ögon. Publiken ser vad karaktären ser, inklusive deras händer som kommer in i bild.
- Emotionell effekt: Ultimat fördjupning, subjektiv upplevelse, spelestetik.
- Promptfras:
Första personperspektiv: händerna trycker upp en tung trädörr och avslöjar en solbelyst äng
För information om Seedances unika kamerastyrningsfunktioner och hur du kombinerar dem i storyboard-tidslinjen, se Seedance Prompt Guide.
Atmosfär Nyckelordsbibliotek
Atmosfären är nyckeln till att förvandla tekniskt felfri video till ett verk som väcker känslor. Det är skillnaden mellan ”ett rum” och ”ett rum som får dig att känna något”. Detta nyckelordsbibliotek är organiserat i fyra dimensioner – belysning, färgpalett, textur och stämning – så att du kan mixa och matcha för att precisera den känsla du önskar.

Atmosfärnyckelordsbibliotek: Välj ett nyckelord från varje dimension för att definiera din videos emotionella signatur.
Nyckelord om ljus och skugga
Belysningen utgör grunden för atmosfären. Genom att ändra belysningen i en prompt kan man helt förändra stämningen utan att ändra på några andra element.
| Nyckelord (engelska/kinesiska) | Visuella effekter | Lämpliga scenarier | |-------|----------|--------- -| | Gyllene timmen | Varmt bärnstensfärgat ljus, mjuka långsträckta skuggor, smickrande hudtoner | Romantik, nostalgi, resor, skönhet | | Blå timmen | Djupblått omgivande ljus, kvarvarande varma nyanser vid horisonten | Melankoli, kontemplation, övergång, urban stämning | | Bakgrundsbelysning | Motivet kontrasteras av en bakomliggande ljuskälla, ansiktsskuggor eller silhuetter | Drama, mystik, heroiska bilder, estetisk tilltalande | | Sidoljus | Starkt riktat ljus från ena sidan, halvbelysning och halvskugga | Spänning, närbilder av karaktärer, dramatiska porträtt | | Rembrandtbelysning | Klassisk porträttbelysning – en sida belyst, med en liten triangulär höjdpunkt under ögat på skuggsidan | Porträtt, elegans, klassisk atmosfär | | Volymetrisk belysning | Synliga strålar som passerar genom damm, dimma eller rök | Helighet, teater, skogsscener, scenbelysning | | Tyndall-effekt | Ljuset sprids i små partiklar och bildar tydliga strålar i dimman | Naturligt, gryningsscener, eteriskt, drömlikt | | Neon | Konstgjorda färgade ljuskällor, vanligtvis rosa, blå, cyan, magenta | Cyberpunk, nattliv, urban, samtida | | Stearinljus | Varmt, fladdrande, orange-bärnstensfärgat punktljus | Intimitet, historia, middagsmiljöer, mysighet | | Silhuett | Motivet helt mörklagt, definieras enbart av konturerna mot en ljus bakgrund | Mystik, anonymitet, visuell effekt, berättande | | Bioluminescerande | Självlysande organisk ljuskälla, vanligtvis blågrön | Fantasi, undervattensvärld, främmande världar, drömlik |
Nyckelord för färgtoner
Färgschemat sätter den emotionella tonen för hela kompositionen. Varma toner känns välkomnande, kalla toner känns distanserade. Hög mättnad känns livfull, låg mättnad känns dämpad.
| Nyckelord (engelska/kinesiska) | Visuella effekter | Emotionell resonans | |-------|----------|--------- -| | Varm palett | Dominanta toner av bärnsten, orange, guld och rött | Tröst, nostalgi, intimitet, höst | | Kall palett | Dominanta toner av blått, cyan och skiffer | Avstånd, lugn, melankoli, vinter, teknik | | Hög mättnad | Levande, intensiva, starka färger | Energi, ungdom, fantasi, popkultur | | Avmättnad | Mjuka, bleka, pastellliknande färger | Melankoli, realism, minnen, vintage | | Turkos och orange | Klassisk filmfärgskalning – svala skuggor, varma höjdpunkter | Hollywood-blockbusters, reklam, film | | Cyberpunk-palett | Neonrosa, elektrisk blå, djup lila mot mörka bakgrunder | Futuristiskt, nattliv, digitalt, avantgarde | | Vintage | Lite blek, varmtonad, lyfta skuggor | Nostalgi, 70-80-tal, indiefilmer, minnen | | Jordfärger | Brunt, grönt, ockra, terrakotta | Natur, rotfasthet, organiskt, dokumentär | | Kodachrome | Rika gröna och röda toner, varma hudtoner, djupa svarta toner | Fotojournalistik, 1960-70-talet, amerikansk estetik |
Textur/bildkvalitet Nyckelord
Texturen definierar en videos visuella yta – oavsett om den liknar 35 mm-film, en polerad reklamfilm, en dokumentär eller en oljemålning.
| Nyckelord (engelska/kinesiska) | Visuella effekter | Tillämpliga scenarier | |-------|--------- -|----------| | Filmisk | Bredbildskänsla, kort skärpedjup, filmisk färgpalett | Berättande, drama, storytelling | | Dokumentär | Naturligt ljus, något ofullkomliga kompositioner | Realism, nyheter, utbildning | | Reklam | Ren, ljus, precis belysning, smidiga kamerarörelser | Produktpresentation, reklam, företag | | Filmkorn | Överlagring av organisk brusstruktur | Retro, analog, indie, varm | | Anamorfisk | Horisontella linsreflexer, elliptisk bokeh, subtil kantförvrängning | Filmdrama, sci-fi, episk känsla | | Oljemålningsstruktur | Synliga penseldrag, rik impasto-effekt | Konst, fantasy, drömlandskap, klassiskt | | Tuschlavering | Svarta tuschgradienter på vit bakgrund, flytande organiska former | Orientalisk estetik, minimalism, lugn | | 8 mm / Super 8 | Kraftig kornighet, ljusläckage, instabil film, blekta färger | Minnen, flashbacks, hemvideor, nostalgi |
Känslomässiga nyckelord
Emotionella nyckelord ger AI:n dess emotionella riktning. De påverkar allt – tempo, färgval, kamerans beteende och den övergripande känslan.
| Nyckelord (engelska/kinesiska) | Framkallade känslor | Förslag på kombinationer | |-------|----------- -|----------| | Mysig | Värme, komfort, trygghet, hem | Stearinljus, varma toner, inomhusscener | | Spänd | Ångest, förväntan, överhängande händelser | Sidobelysning, handhållna bilder, snäv inramning | | Spännande | Rädsla, osäkerhet, långsam uppbyggnad | Dämpad belysning, långsam progression, låg mättnad | | Glad | Lycka, firande, Lätthet | Gyllene timme, hög mättnad, långa tagningar | | Melankoliskt | Sorg, längtan, skönhet i sorgen | Blå timme, kalla toner, slow motion | | Episk | Storslagenhet, hjältemod, vördnadsbjudande | Vidvinkel, dolly-tagningar, orkesterpartitur | | Healing | Lugn, återhämtning, mild läkning | Mjuk belysning, pastellfärger, naturliga toner, långsamt tempo | | Skräck | Rädsla, kuslighet, oro | Djupa skuggor, sneda vinklar, låg mättnad, tystnad | | Romantisk | Kärlek, längtan, ömhet, intimitet | Bakgrundsbelysning, varma toner, kort skärpedjup, närbilder | | Energisk | Hastighet, spänning, adrenalin | Kameraskakningar, varierande hastighet, hög mättnad, vidvinkel | | Nostalgisk | Längtan efter det förflutna, bittersöta minnen | Filmkorn, vintagefärger, överexponerade höjdpunkter |
Atmosfäriska nyckelordskombinationer: Tre exempel
Den verkliga kraften ligger i att välja ett eller två nyckelord från varje dimension och kombinera dem. Följande tre kombinationer skapar helt olika stämningar för samma motiv – en kvinna som står vid fönstret:
Kombination ett: Varm nostalgi
Gyllene timmes bakgrundsbelysning, varm palett med bärnstens- och honungstoner, filmkornstruktur, nostalgisk stämning
Kombination två: Kylig spänning
Sidoljus från en enda källa, sval blågrön färgskala, ren digital textur, spänd stämning
Kombination tre: Etärisk och drömlik
Tyndall-effekt ljusstrålar genom tunna gardiner, pastellfärger, akvarellstruktur, helande stämning
Samma ämne, tre helt olika videor. Nyckelordet för atmosfären är kontrollpanelen.
Från enstaka fraser till filmiska uppmaningar: 5 avancerade exempel
Det bästa sättet att lära sig skriva promptar är att observera utvecklingsprocessen för promptar. Varje exempel nedan utvecklas från den grundläggande V1 (den typ som de flesta skriver) till V2 (med tillägg av specificitet och kamerarörelser) och kulminerar i V3 (en fullständigt specificerad prompt av filmkvalitet). Notera förändringarna som sker på varje nivå och varför de implementeras.
För fler exempel på färdiga videoprompter, se 10 praktiska AI-videoprompter.

Snabb utveckling i praktiken. V1 ger AI praktiskt taget ingen information. V3 ger den allt – resultaten är som natt och dag.
Exempel 1: Porträtt/Stämning – ”Kvinna som går i regnet”
V1 — Grundversion (18 ord)
A woman walking in the rain at night in a city, cinematic, beautifulDu får: en generisk kvinna, en generisk stad, generiskt regn, platt belysning, ingen emotionell resonans. AI fyller varje tomrum med statistiska genomsnitt.
V2 — Förbättrad version (62 ord)
A young Asian woman in a long dark coat walks slowly through a rain-soaked Tokyo backstreet at night. Neon signs reflect in the wet pavement, casting pink and blue light. She carries a transparent umbrella. Camera tracks beside her at shoulder height. Shallow depth of field. Melancholic mood.Vad har förbättrats: Specifik ämnesidentitet, specifik plats, specifik ljuskälla, kameraposition, emotionell riktning. AI:n har nu tillräcklig information för att generera unika bilder.
V3 — Filmisk kvalitet (138 ord)
A woman in her late 20s, Japanese, long black hair partially wet and clinging to her neck, wearing an oversized charcoal wool coat over a cream turtleneck, walks alone through a narrow Shinjuku backstreet at 2am. Rain falls in fine sheets, catching neon light from izakaya signs overhead — warm amber kanji characters and cold blue beer advertisements. The wet asphalt mirrors everything, creating a double world beneath her feet. She carries a transparent vinyl umbrella, water beading and streaming down its surface.
Camera: tracking shot at shoulder height, moving alongside her at walking pace, shallow depth of field at f/1.4, foreground rain droplets occasionally crossing the lens out of focus.
Lighting: practical neon sources only — no fill light. Rim light from signs behind her outlines her coat collar and umbrella edge. Her face catches intermittent warm light as she passes each shopfront.
Style: cinematic, Kodak Vision3 500T film stock, slight grain, teal-and-amber color grade, Wong Kar-wai atmosphere.
Ljud: regn på paraplyets yta, dämpad jazz från en bar i fjärran, hennes fotsteg på våt sten, ingen dialog, ingen musik.(En japansk kvinna i tjugoårsåldern, med långt svart hår som delvis är genomblött och klibbar fast vid hennes nacke, klädd i en överdimensionerad kolgrå ullkappa över en krämfärgad polotröja, går ensam genom de smala gränderna i Shinjuku klockan två på natten. Fina regndroppar fångade neonskylten från izakaya-skyltarna ovanför – varma bärnstensfärgade japanska tecken och svala blå ölreklam. Den fuktiga asfalten speglade allt och skapade en spegelvärld under hennes fötter. Hon höll ett genomskinligt plastparaply, droppar kondenserade och rann ner längs ytan.)
Varför V3 fungerar: varje del av formeln är tydligt definierad. Det finns inget utrymme för AI att gissa – när AI inte gissar återger den exakt det du beskriver.
Exempel 2: Produktpresentation – ”Klockan på skrivbordet”
V1 — Grundversion (14 ord)
A luxury watch sitting on a table, product shot, high quality, 4KV2 — Förbättrad version (58 ord)
A stainless steel dive watch with a dark blue dial rests on a slab of raw gray marble. Camera orbits slowly around the watch, 15 degrees above. Single key light from the upper left creates a defined shadow. The watch's crystal catches the light and creates a brief flare. Commercial style, clean background.V3 — Filmisk kvalitet (126 ord)
A stainless steel dive watch with a sunburst navy-blue dial and ceramic bezel sits on a rough-cut block of Carrara marble, positioned at the golden-ratio intersection of the frame. The second hand sweeps continuously. Micro water droplets bead on the crystal surface and the steel bracelet links, catching light.
Camera: begins in macro extreme close-up on the dial — the indices and lume dots fill the frame — then slowly dollies out while simultaneously orbiting clockwise, completing a 270-degree arc over 8 seconds until the full watch and marble base are revealed in a three-quarter beauty shot.
Lighting: single hard key light at 10 o'clock position, 45 degrees above. No fill — deep shadows on the right side. A subtle rim light from behind separates the watch from the dark charcoal background.
Style: high-end commercial, ultra-sharp 8K downscaled to 4K, zero grain, clinical precision. Color: cool steel tones with warm gold accents from the lume.
Ljud: nästan tystnad — endast det svaga mekaniska tickandet från urverket, en enda ren klang vid flammans ögonblick.(En dykarklocka i rostfritt stål, solstråleblå urtavla med keramisk bezel, vilar på en block av grovt huggen Carrara-marmor placerad vid ramens gyllene snittpunkt. Sekundvisaren fortsätter sin rörelse. Små vattendroppar kondenserar på kristallytan och stålarmbandets länkar och fångar ljuset.)
Exempel 3: Scenic Travel – ”Bergen vid soluppgången”
V1 — Basic Edition (12 ord)
Beautiful mountains at sunrise, drone shot, epic landscape, cinematicV2 — Reviderad utgåva (55 ord)
Snow-capped mountain peaks emerging from a sea of clouds at sunrise. The first rays of sun paint the peaks golden while the valleys remain in blue shadow. Camera cranes up slowly from the cloud layer, revealing the full mountain range. Wide angle, epic scale, warm-to-cool color gradient.V3 — Filmisk kvalitet (134 ord)
The Dolomites at sunrise in late autumn. Jagged limestone spires — the Tre Cime di Lavaredo — pierce through a thick layer of valley clouds, their east-facing faces catching the first horizontal rays of sun and turning from cold blue-gray to blazing amber-gold. The cloud layer below is a rolling ocean of soft white and pale peach, filling the valleys completely.
Camera: starts buried inside the cloud layer — visibility near zero, soft white diffusion everywhere — then cranes upward at a steady pace, breaking through the cloud surface to reveal the peaks and the vast sky above. The transition from claustrophobic fog to infinite horizon takes 4 seconds. Continue rising to a high aerial wide shot. 24mm wide angle lens.
Lighting: first light of day — sun at 5 degrees above the eastern horizon, casting extreme raking light across the mountain faces. Golden hour warmth on lit surfaces, blue hour coolness in shadowed areas. Volumetric light beams visible where sun cuts between peaks.
Style: National Geographic cinematic, IMAX-quality, ultra-wide dynamic range, vivid but natural color, no filters.
Ljud: vind på hög höjd — ett ihållande lågt sus med sporadiska vindbyar, ingen musik, inga mänskliga ljud. Tystnaden förstärker storleken.(Sen höstsoluppgång i Dolomiterna. Kantiga kalkstensklippor – de tre topparna – sticker upp genom tjocka dalmoln, och deras östra sidor fångar de första horisontella solstrålarna och skiftar från kallt blågrått till eldigt bärnstensgult.)
Exempel 4: Actionscen – ”Kampsportare slår med näven”
V1 — Basic Edition (15 ord)
A martial artist doing a spinning kick, action movie style, slow motionV2 — Förbättrad version (64 ord)
A female martial artist in a dark training hall performs a spinning back kick. Her bare foot connects with a hanging heavy bag, sending it swinging violently. Camera captures the kick from a low angle, slightly slow motion at the point of impact, then returns to real-time as she recovers her stance. Side lighting creates dramatic shadows.V3 — Filmisk kvalitet (141 ord)
A woman in her 30s, lean and muscular, wearing a fitted black tank top and loose gray training pants, stands in a dimly lit martial arts gym. Worn wooden floor, heavy bags hanging in rows, chalk dust suspended in the air. She explodes from stillness — a spinning hook kick that arcs through 360 degrees, her back heel striking a leather heavy bag at head height.
Camera: starts medium shot at 45-degree angle. As the spin begins, camera speed-ramps to 240fps slow motion — her hair whips in an arc, chalk dust traces the path of her foot, the bag surface ripples visibly on impact. Hold for one beat, then ramp back to real-time as she plants her foot. Slight handheld energy.
Lighting: single harsh side light from camera-left, no fill. Chalk dust and sweat particles glow in the light beam.
Style: David Fincher / Fight Club aesthetic — desaturated, greenish-teal undertone, high contrast, gritty. Anamorphic lens with subtle horizontal flares.
Ljud: tystnad före sparken — omgivande gymbuller, ett andetag. Spark: explosivt tygknäpp, tung läderpåverkan, kedjeklirrande. Hennes skarpa utandning vid kontakt. Ingen musik.(En kvinna i trettioårsåldern, smal och muskulös, klädd i en åtsittande svart väst och lösa grå träningsbyxor, står i en svagt upplyst kampsportshall. Slitna trägolv, rader av upphängda boxningssäckar, damm som svävar i luften. Hon exploderar ur stillheten – en 360-graders snurrande krokspark, hälen träffar lädersäcken i huvudhöjd.)
Exempel 5: Emotionell berättelse – ”Mormor och sonson”
V1 — Grundversion (16 ord)
A grandmother and her grandchild spending time together, heartwarming, emotional, beautiful momentV2 — Reviderad utgåva (71 ord)
An elderly grandmother with silver hair and weathered hands teaches her 5-year-old granddaughter how to knead bread dough in a sunlit country kitchen. The child stands on a wooden step stool, flour on her cheeks, laughing. The grandmother guides her small hands through the dough. Golden morning light through a window. Warm color palette. Intimate, cozy atmosphere.V3 — Filmisk kvalitet (147 ord)
A Japanese grandmother in her 80s, silver hair in a soft bun, deep expression lines around smiling eyes, wearing an indigo apron over a cream linen blouse, stands beside her granddaughter — age 4 or 5, round cheeks, short black hair with a red clip — at a low wooden table in a traditional kitchen. Shoji screen doors are slid open to a small garden where morning light enters. They are making mochi together. The grandmother's large, weathered hands wrap around the child's tiny ones, guiding them to fold and press the soft rice dough. Flour dust floats in the shaft of sunlight between them.
Camera: close-up on their four hands working the dough — the contrast of old and young skin. Slowly dolly out to a medium shot including both faces. Rack focus between them — first sharp on the grandmother's eyes, then pulling to the child's smile. 85mm portrait lens, f/2.0, creamy bokeh.
Lighting: natural morning sunlight from the garden, soft and directional, Tyndall effect through the flour dust. No artificial light. The light creates a warm halo around the grandmother's silver hair.
Style: Hirokazu Kore-eda film quality — observational, unhurried, documentary intimacy with cinematic beauty. Kodachrome-inspired color. 16:9.
Ljud: det mjuka rytmiska ljudet av händer som knådar deg, fåglar ute i trädgården, ett avlägset vindspel, barnets sporadiska skratt, mormodern som nynnar en folkmelodi för sig själv. Ingen musik – bara diegetiska ljud.(En japansk mormor i åttioårsåldern, med silvergrått hår uppsatt i en lös knut, djupa uttryckslinjer runt sina leende ögon, klädd i en indigoblå förkläde över en krämfärgad linneskjorta. Hon står bredvid sin fyra- eller femåriga barnbarn – med runda kinder och kort svart hår uppsatt med en röd hårklämma – vid det låga träbordet i det traditionella köket. Shoji-dörrarna glider upp mot den lilla trädgården, där morgonljuset strömmar in. Tillsammans gör de mochi. Mormors stora händer, präglade av åldern, omsluter barnets små händer och guidar dem när de viker och pressar den mjuka, klibbiga risdegen. Mjölstoft svävade i solstrålen mellan dem. Det hade den där Hirokazu Kore-eda-liknande filmiska kvaliteten – observant, lugn, dokumentärliknande intimitet blandad med filmisk skönhet.
Inkorporera ljuddesign i prompten
Ljuddesign är den dimension som oftast förbises vid skrivandet av videomanus. År 2026 stödde plattformar som Seedance, Veo 3 och Keeling alla synkron ljudgenerering för videor – skillnaden i kvalitet mellan de som använde ljudsignaler och de som inte gjorde det var enorm.
Tänk på detta: en vacker skogsmiljö utan omgivande ljud känns som en GIF-animation. Lägg till fågelsång, lövras och det avlägsna porlandet från en bäck, så blir det en plats du vill kliva rakt in i.
Ljuddesignformat
Lägg till röstkommandon i slutet av prompten i ett separat stycke eller en separat rad, som täcker tre nivåer:
Första lagret: Bakgrundsmusik — Allmän stämning och stil
Background music: slow ambient piano, minor key, sparse notes with reverb
(背景音乐:缓慢的氛围钢琴,小调,稀疏的音符带混响)Andra lagret: Omgivande ljudeffekter — Skapa bakgrundsljud för scenen
Ambient: light rain on leaves, distant thunder rolls, wet road traffic hum
(环境音:轻柔的雨打树叶声、远处的雷声滚动、湿路上的交通嗡嗡声)Tredje lagret: Ljudeffekter och dialog — Specifika ljud som är kopplade till händelser i videon
SFX: footsteps on wet pavement, umbrella opening with a click
Dialogue: none
(音效:湿路面上的脚步声、雨伞咔嗒打开的声音。对话:无)Referens för ljudnyckelord
Musikstilar för olika känslor:
| Stämning | Musikalisk inriktning (engelsk prompt) |
|---|---|
| Lugn | Ambient, mjukt piano, akustisk gitarr, lo-fi |
| Spänd | Låg drönande ton, dissonanta strängar, minimal perkussiv puls |
| Glad | Uppåtgående akustisk gitarr, ukulele, lätt percussion, durtonart |
| Episk | Orkestral crescendo, taikotrummor, brassfanfar, kör |
| Romantisk | Stråkkvartett, mild jazz, bossa nova |
| Mystisk | Mörk ambient, piano med mycket reverb, avlägsna klocktoner |
| Energisk | Elektronisk beat, drivande trummor, basdominerad, uptempo |
| Melankolisk | Solocello, långsamt piano i moll, sparsam gitarr |
Omgivningsljud:
| Miljö | Ljudlager (engelsk prompt) | |------|--------------------- -| | Skog | Fågelsång, prasslande löv, avlägsen hackspett, bäck | | Stadsnatt | Trafikbrus, avlägsen sirener, neonljus, fotsteg | | Hav | Vågor som bryter, måsar, vind, avlägsen båtmotor | | Inomhuscafé | Kaffemaskin, mumlande samtal, sked på keramik, jazz | | Regnig dag | Regnintensitet (lätt smattrande / kraftigt skyfall), åska, droppar | | Verkstad | Verktygsljud, träspån, maskinbrus, radio i bakgrunden |
När man ska använda tystnad
Tystnad är inte frånvaron av ljuddesign – det är ett medvetet val. Strategisk tystnad kan skapa:
- Effektfullt ögonblick: Tystnaden som föregår en dramatisk händelse förstärker den händelsen
- Känsla av storhet: Endast ljudet av vinden över vidsträckta landskap förmedlar en känsla av oändlighet
- Spänning: Att ta bort förväntade ljud skapar en känsla av oro⟧NLBR⟧ - Fokus: Tystnaden riktar all uppmärksamhet mot det visuella
Ange tydligt i instruktionen: Ljud: tystnad – ingen musik, inga omgivningsljud, endast personens andning.
För mer information om ljudgenerering i AI-musikvideoproduktion, se AI Music Video Generator Guide.
Plattformsspecifika prompttekniker
Den universella formeln gäller allmänt, men varje AI-videoplattform har sina egna särdrag när det gäller tolkning av uppmaningar. Genom att optimera uppmaningarna specifikt för den plattform du använder kan du förbättra resultaten avsevärt.

Samma koncept – ”Kvinna som går i regnet” – optimerat för fem olika plattformar. Samma formel, olika betoning.
Seedance
Fördelar: Storyboard-tidslinjeformat, sekvenser med flera bilder, referenser från bild till video, inbyggd promptgenerator.
Optimeringsmetoder:
- Använd en scenbaserad tidslinjestruktur för komplexa sekvenser – dela upp videor i scener med tidsstämplar:
Shot 1 (0-3s): [描述]
Shot 2 (3-6s): [描述]
Shot 3 (6-10s): [描述]- Bibehåll stilistisk och karaktärsmässig konsistens genom att referera till uppladdade bilder med
@Image1,@Image2 - Filmiskt språk är mycket effektivt – använd specifik terminologi (dolly, track, orbit) istället för vaga beskrivningar ("röra sig mot")
- Inkluderar ljuddesign – Seedance hanterar ljudsignaler
- Mest effektivt arbetsflöde: Använd Video Prompt Generator för att skapa strukturerade uppmaningar från enkla idéer och finjustera dem sedan manuellt
Seedances omfattande plattformsspecifika promptguide (med över 50 exempel), se Seedance Prompt Guide.
Sora(OpenAI)
Fördelar: Fysiskt realistiskt beteende, naturliga rörelser och naturlig språkförståelse av långa texter.
Optimeringstekniker:
- Använd flytande, beskrivande stycken istället för strukturerade listor – Sora är mycket bra på att analysera naturligt språk
- Betona fysiska detaljer: tyngdkraft, vikt, materialegenskaper, fluidmekanik
- Beskriv hur något " känns som" – Beskrivningar av textur och material förbättrar den fysiska trovärdigheten
- Ange bildförhållanden och varaktighet
- Detaljerad fysik: "Tungt tyg svajar vid varje steg och släpar efter på grund av sin egen vikt" ger bättre resultat än "svävande kjol"
Ke Ling Kling (Kuaishou)
Fördelar: Snabb genereringshastighet, robust rörelse- och rörelseprestanda, utmärkt ansiktskonsistens.
Optimerings tips:
- Håll uppmaningarna kortfattade – Keli svarar bättre på fokuserade, handlingsinriktade uppmaningar (50–80 ord är optimalt)
- Börja med handlingen: ”En dansare hoppar och snurrar” istället för att nämna rörelsen efter långa scenbeskrivningar
- Ange tydligt rörelseriktningen: ”rör sig från vänster till höger”, ”närmar sig kameran”, ”vänder sig bort”
- Keeling är utmärkt på att återge mänskliga rörelser och ansiktsuttryck – utnyttja detta för närbilder med känslomässiga instruktioner
- Instruktioner för kamerarörelser är effektiva, men varje signal bör begränsas till en eller två tydliga kamerarörelser.
Universell mening, oändliga former / Runway (Gen-3 Alpha / Gen-4)
Optimeringsmetoder för Tongyi Wanshang:
- Stöder direktinmatning av kinesiska uppmaningar, vilket ger överlägsna resultat jämfört med översättning
- Visar utmärkt förståelse för traditionella kinesiska estetiska element – tuschmålning, nationell stil, kostymscener från olika epoker
- Uppnår effektiva resultat med koncisa och tydliga stiltecken
Tekniker för optimering av Runway:
- Kombinera textbeskrivningar med stiltaggar — Runway har en robust stilförståelse
- Beskriv rörelse med hjälp av rumsliga vektorer:
rörelse från nedre vänstra hörnet till övre högra hörnet - När du använder Motion Brush, fokusera textprompten på den övergripande scenen och stilen, medan du använder penseln för att hantera specifika rörelseområden
- Runway visar utmärkt förståelse för beskrivningar av konstnärlig stil — "i stil med en film av Terrence Malick" - När du använder Motion Brush, fokusera på den övergripande scenen och stilen och använd penseln för att förfina specifika rörelseområden
- Runway är utmärkt på att tolka beskrivningar av konstnärlig stil – "i stil med en film av Terrence Malick" ger utmärkta resultat
- Behåll fokus – skapa en distinkt scen per prompt istället för sekvenser med flera bilder
Veo 3(Google DeepMind)
Fördelar: Ljudförståelse, fysisk simulering, filmisk kvalitet, utökade sekvenser.
Optimeringsmetoder:
- Inkludera detaljerade ljudbeskrivningar – Veo 3 genererar synkroniserat ljud från text
- Beskriv fysiska interaktioner i detalj: hur objekt kolliderar, material deformeras och ljus interagerar med ytor
- Använd filmterminologi – Veo 3:s träningsdata gynnar i hög grad professionell filmproduktion
- Ange varaktighet och tempo:
scenen utvecklas långsamt under 10 sekunder - Fysiska beskrivningar förstärker effekten avsevärt:
vatten stänker uppåt vid nedslaget, droppar fångar bakgrundsbelysningenistället för bara "stänker"
För en detaljerad jämförelse mellan Seedance och Sora när det gäller snabb tolkning och utskriftskvalitet, se Seedance vs Sora Comparison.
Eller låt AI skriva uppmaningar åt dig
Du har just lärt dig hela ramverket för att skapa videoprompter från grunden. Denna kunskap är oerhört värdefull – den ger dig möjlighet att bättre bedöma kvaliteten på prompter och ger dig fullständig kontroll över varje detalj. Men du behöver inte skriva varje prompt manuellt varje gång.

Hybridarbetsflöde: Låt AI hantera strukturell och teknisk terminologi, och tillför sedan din kreativa synvinkel under optimeringsfasen.
När ska man skriva för hand och när ska man använda AI?
| Scenario | Bästa tillvägagångssätt |
|---|---|
| Du har en tydlig kreativ vision och vet exakt vad du vill ha | Handskrift – du blir snabbare och mer exakt än om du redigerar AI-utkast |
| Du har en grov idé men behöver struktur | AI-generering → Manuell finjustering |
| Du behöver snabbt generera flera olika varianter av prompten | AI-batchgenerering → Välj och förfina den bästa |
| Du lär dig och vill studera promptstrukturer | AI-generering → Läs och analysera – så bygger du upp ditt ordförråd |
| Du behöver matcha specifika referensbilder | Handskriven – beskriv exakt vad du ser i referensen |
Hybridarbetsflöde (rekommenderas)
Det mest effektiva arbetsflödet för snabb skrivning kombinerar AI-generering med mänsklig förfining:
-
Börja med AI. Gå till Seedance Video Prompt Generator, beskriv din idé i en eller två meningar, välj en stil och generera.
-
Granska resultatet kritiskt. AI:n genererar en strukturerad prompt som innehåller kameraspråk, tidslinje, belysning och ljud. Läs igenom den noggrant. Stämmer kamerarbetet överens med den önskade känslomässiga tonen? Skapar belysningen den atmosfär som är avsedd? Finns det några detaljer som du vill ändra?
-
Manuell optimering. Här kommer dina kunskaper om formler, filmens språk och atmosfäriska nyckelord till nytta. Ersätt AI-valda bilder med sådana som bättre stämmer överens med din vision. Justera nyckelord för belysning. Lägg till specifika detaljer som AI inte kan känna till – karaktärsspecifika egenskaper, varumärkesspecifika krav, emotionella nyanser.
-
Skapa videon. Skicka den optimerade prompten till videogeneratorn. Resultaten blir betydligt bättre än helt manuella nybörjarprompter eller helt AI-genererade, okontrollerade prompter.
En omfattande guide till hur man använder AI-promptgeneratorer finns i AI Video Prompt Generator Guide.
Filmiska effekter: Mästerskap genom integration
Låt oss skapa en slutlig prompt som använder allt som behandlas i denna guide – formler, filmiskt språk, atmosfäriska nyckelord, ljuddesign – för att skapa en verkligt filmisk effekt.
Kreativ brief: En ensam astronaut upptäcker växtliv på Mars.

Fullständigt specificerade filmiska instruktioner ger resultat som om de vore regisserade av en filmskapare – för det är precis vad de är. Varje element tjänar berättelsen.
Fullständig uppmaning:
Subject: A solitary astronaut in a dusty, sun-bleached EVA suit — visor partially reflective, scratched from use, mission patches barely legible. The suit is not pristine Hollywood white; it is a working tool, weathered by months on the Martian surface.
Action: The astronaut crouches beside a small crack in the rust-red basalt. Inside the crack, a single tiny green sprout — two delicate leaves, almost translucent — pushes up through the red soil. The astronaut's gloved hand reaches toward it, hesitates, trembles slightly, then gently touches the soil beside it.
Environment: The Martian surface — a flat, rust-red plain scattered with dark basalt rocks, stretching to low eroded hills on the horizon. The sky is a pale butterscotch-pink. Dust devils move in the far distance. The scene feels vast and achingly empty — except for this one tiny green thing.
Camera: Opens with an extreme wide shot — the astronaut is a small figure in the immense Martian landscape. Slow dolly in over 4 seconds to a medium shot. As the astronaut crouches, camera drops to ground level and continues to a close-up of the gloved hand and the sprout. Rack focus: pull from the hand to the astronaut's visor, where we see the sprout's reflection. 65mm lens, anamorphic.
Lighting: Late Martian afternoon — low sun from camera-right, casting long amber-red shadows. The side light sculpts the EVA suit's texture. The sprout's translucent leaves glow with subsurface scattering as sunlight passes through them — the only green in a world of red. Volumetric dust particles drift through the light beam.
Style: Ridley Scott's The Martian meets Terrence Malick's The Tree of Life. Cinematic, anamorphic, muted Martian color palette with the single point of vivid green as deliberate contrast. Subtle film grain.
Sound: Wind — thin, high-pitched Martian wind, unlike Earth wind. The astronaut's breathing inside the suit — measured at first, then quickening. A single sustained low note from a cello enters as the hand reaches for the sprout. No dialogue. No narration.En ensam astronaut, klädd i en dammbelagd EVA-dräkt som blekts av solen – visiret halvreflekterande, med repor från användning, uppdragets emblem knappt urskiljbart. Denna dräkt är inte den prydliga Hollywood-vita; den är ett arbetsredskap, väderbitet av månader på Mars yta. Hukande bredvid en smal spricka i rostfärgad basalt observerar astronauten en liten grön grodd – två känsliga, nästan genomskinliga blad – som bryter igenom den röda jorden. En hand med handske sträcks ut, tvekar, darrar lätt och rör sedan försiktigt vid jorden bredvid den.
Denna uppmaning innehåller alla sju formelelement, specifikt filmiskt språk (extremt långa tagningar, kamerarörelser, fokusförskjutning), atmosfäriska nyckelord (volymetrisk belysning, spridning under ytan, anamorfisk lins), ljuddesign (omgivande vind, andningsljud, ensam celloton) och stilistiska referenser (Ridley Scott, Terrence Malick). Varje detalj tjänar den emotionella bågen: ensamhet → upptäckt → vördnad.
Detta är videoprojektet för teknik.
Vanliga frågor
Hur långa ska AI-videomeddelanden vara?
Det finns ingen universell standard för längd. Lämplig längd beror på komplexiteten i ditt kreativa koncept och den plattform som används. Nivå V1 (15–30 ord) ger universella resultat på alla plattformar. Nivå V2 (50–80 ord) är det optimala intervallet för de flesta plattformar – tillräckligt specifikt utan att överbelasta modellen. Nivå V3 (100–200 ord) ger de mest kontrollerbara resultaten på plattformar som stöder långa uppmaningar, såsom Seedance och Sora. När du använder Keeling bör du hålla dig till cirka 50–80 ord. Det avgörande måttet är inte ordantalet, utan snarare om varje del av formeln behandlas på ett heltäckande sätt.
Är en bakgrund inom fotografi nödvändig för att skapa effektiva videoklipp?
Det är inte nödvändigt, men det är oerhört hjälpsamt att förstå det – och den här guiden har just lärt dig grunderna. Du behöver inte ha en filmutbildning; det du behöver är att känna till namnen på 10–15 typer av kamerarörelser, förstå den emotionella effekten av olika belysningsstilar och ha ett ordförråd för att beskriva stämningen. Bokmärk avsnitten om [Kamerarörelsens språk](#Kamerarörelsens språk Hemligt vapen) och [Stämningens nyckelordsbibliotek](#Stämningens nyckelordsbibliotek) och gå tillbaka till dem upprepade gånger tills dessa termer blir en självklarhet.
Kan samma prompt användas på olika AI-videoplattformar?
Visst – den universella formeln gäller universellt. Men varje plattform tolkar uppmaningar på olika sätt. Uppmaningar som är optimerade för Sora (långa, flytande, med betoning på fysik) kan behöva omstruktureras för Keeling (kortare, handling först). Avsnittet Plattformsspecifika tekniker beskriver hur man anpassar sig. Den grundläggande formeln förblir oförändrad, endast leveransformatet anpassas.
Vad skiljer denna guide från Seedance-promptguiden?
Seedance Prompt Guide är plattformsspecifik – den lär dig Seedances storyboardformat, bildreferenser och över 50 färdiga promptar. Den här guiden är universell – den lär dig grundläggande färdigheter i att skriva promptar som kan användas på alla plattformar. Betrakta den här guiden som din lärobok och Seedance-guiden som din praktiska handbok för ett specifikt verktyg.
Hur beskriver man kamerarörelser om man inte är bekant med filmterminologi?
Beskriv först vad du vill att publiken ska se och känna. "Kameran närmar sig långsamt motivets ansikte" är en dolly i "Kameran följer personen som går från sidan" är en tracking shot. AI-plattformar förstår naturliga språkbeskrivningar ganska bra. Att lära sig teknisk terminologi (med hjälp av [referensen till kamerarörelsespråk](#kamerarörelsespråkets hemliga vapen) ovan) ger dock betydligt bättre resultat, eftersom AI-modeller tränas på videor som beskrivs med just dessa professionella termer.
Bör omvända uppmaningar (vad som inte ska inkluderas) inkluderas?
Vissa plattformar stöder omvända instruktioner – instruktioner som anger vad som ska undvikas. Dessa kan vara användbara: Inga textöverlägg, inga vattenstämplar, inga suddiga bildrutor. De flesta moderna AI-videogeneratorer hanterar dock kvalitetsproblem mer effektivt genom positiva specifikationer. I stället för att skriva ”ingen dålig belysning” anger du ”Rembrandt-belysning från kamerans vänstra sida”. I stället för ”inga skakiga bilder” anger du ”jämn steadicam-rörelse”. Positiva instruktioner guidar AI:n mot det önskade resultatet, medan negativa instruktioner bara talar om vad som ska undvikas och lämnar alternativen åt slumpen.
Hur upprätthåller man karaktärskonsistens över flera promptar?
Att upprätthålla karaktärskonsistens över flera AI-videogenerationer är en av de mest utmanande aspekterna av snabbskrivning. Tre strategier har visat sig vara till hjälp: (1) Använd en extremt specifik karaktärsbeskrivning och upprepa den ordagrant mellan promptarna – ”en kvinna i slutet av 20-årsåldern, japansk, långt svart hår, överdimensionerad kolsvart ullkappa, krämfärgad polotröja”. (2) Använd arbetsflöden från bild till video – ladda upp referensbilder på karaktären för AI-animering. Seedance stöder detta via @Image-referenser. (3) Generera alla klipp för samma karaktär inom en och samma session när det är möjligt, med identiska frön eller stilinställningar.
Finns det något verktyg som kan hjälpa mig att skriva videomanus?
Ja. Seedances Video Prompt Generator accepterar beskrivningar i naturligt språk för att generera fullständigt strukturerade instruktioner för tagningslistan, inklusive kamerarörelser, tidslinjer, belysning och ljuddesign. För detaljerad användarvägledning, se AI Video Prompt Generator Guide. Rekommenderat arbetsflöde: AI-generering → manuell finjustering → videoproduktion.
Börja skriva bättre videomanus redan idag
Du har nu tillgång till ett omfattande verktygslåda: formeln med sju element, en referensguide för filmens språk som omfattar över 15 kamerarörelsestekniker, ett fyrdimensionellt nyckelordsbibliotek med över 50 termer, fem progressiva exempel som illustrerar utvecklingen från grundläggande till filmiska standarder, metodik för ljuddesign och plattformsspecifika optimeringstekniker.
Skillnaden mellan amatörers och professionella AI-videoproduktioner ligger inte i verktygen, utan i uppmaningarna. Och att skriva uppmaningar är en färdighet som förbättras med övning.
Tre sätt att börja:
-
Öva på formeln. Välj ett ämne och skriv utkast till versionerna V1 → V2 → V3. Jämför resultaten. Förbättringen kommer att vara omedelbar och betydande.
-
Använd en promptgenerator. Låt AI hantera strukturen och använd sedan dina kunskaper om kamerarörelser och atmosfär för att förfina resultatet. Prova videopromptgeneratorn →
-
Skapa din första video. Välj din bästa prompt och skapa en video direkt. Öppna videogeneratorn →
Mer snabb inspiration och färdiga exempel:
- 10 praktiska AI-videoprompter — Testade prompter med V1→V2→V3-iterationer
- Komplett guide till text-till-video-AI — Förstå tekniken bakom verktygen
- Guide till AI-videopromptgenerator — Låt AI skapa prompts åt dig
- Guide till Seedance-prompts — Över 50 Seedance-specifika prompts
Den bästa AI-videon du någonsin kommer att skapa börjar med nästa prompt du skriver.

