TL;DR
I video AI di alta qualità derivano da prompt di alta qualità. Questa guida ti insegna una formula universale per i prompt video: un framework composto da sette elementi applicabile a tutte le principali piattaforme video AI:
[Soggetto] + [Azione] + [Ambientazione] + [Movimento della telecamera] + [Illuminazione] + [Stile] + [Suono]
Imparerai: Le ragioni principali che causano errori nei prompt (e come risolverli immediatamente), un riferimento linguistico completo sulla fotografia che copre oltre 15 tecniche fotografiche, una libreria di parole chiave sull'atmosfera organizzata in quattro dimensioni: illuminazione, tavolozza dei colori, texture e mood, cinque esempi di prompt progressivi dalla qualità di base a quella cinematografica, come incorporare il sound design nei prompt e tecniche di ottimizzazione specifiche per le piattaforme Seedance, Sora, Kling, Runway e Veo 3.
Questo non è un tutorial su uno strumento, ma una metodologia. Le competenze di scrittura di prompt video sono trasferibili su tutte le piattaforme: imparale una volta e applicale ovunque.
Suggerimenti generati automaticamente →

Lo stesso concetto, ma risultati completamente diversi. Il prompt a sinistra recita: "Una donna che cammina sotto la pioggia". Il prompt a destra specifica il movimento della telecamera, la direzione dell'illuminazione, l'atmosfera e il suono, a cui il modello di IA risponde con una qualità cinematografica.
Perché la maggior parte dei prompt video AI falliscono (e come risolverli)
Indipendentemente dal generatore di video AI che utilizzi (Seedance, Sora, Keeling, Runway o Veo 3), il principio di base rimane lo stesso: più il testo inserito è preciso e strutturalmente completo, più il risultato sarà controllabile e cinematografico. La maggior parte delle persone scrive i prompt come se descrivesse una fotografia a un amico, ma un video non è una fotografia. Il video coinvolge movimento, tempo, comportamento della telecamera, evoluzione dell'atmosfera e suono.
Di seguito sono riportati i cinque motivi più comuni di guasto immediato, ciascuno accompagnato da una soluzione immediata.
- Troppo vago: il problema del "bellissimo tramonto"
Il guasto più comune. Scrivi "un bellissimo tramonto sul mare" e ricevi un frammento tecnicamente accurato ma emotivamente vuoto che ricorda gli screensaver di repertorio.
Il problema non è che l'IA non sia in grado di riprodurre un tramonto, ma che "bellezza" e "tramonto" sono le uniche informazioni che le sono state fornite. Avendo incontrato milioni di tramonti nei suoi dati di addestramento, l'IA seleziona la media statistica e la media, per sua stessa natura, è mediocrità.
| Prima della modifica | Dopo la modifica |
|---|---|
| Uno splendido tramonto sull'oceano | La luce dell'ora dorata si riversa su una tranquilla costa del Pacifico, le onde lambiscono le rocce vulcaniche, il sole è a due dita di distanza dall'orizzonte, il cielo passa da un ambra intenso all'orizzonte al rosa salmone e al lavanda pallido allo zenit, lunghe ombre si allungano verso la fotocamera il sole sospeso a due dita sopra l'orizzonte, il cielo che sfuma dall'ambra intenso all'orizzonte al rosa salmone fino al lavanda chiaro allo zenit, lunghe ombre che si allungano verso la fotocamera) |
Metodo di correzione: sostituire gli aggettivi ("bello", "fantastico", "splendido") con dettagli specifici e osservabili: colore, posizione, consistenza, relazioni spaziali.
- Assenza di istruzioni di movimento — problemi relativi alle immagini statiche
Hai scritto una descrizione della scena ricca di dettagli, ma l'IA ha generato un'immagine che sembra una fotografia con un leggero effetto push-pull, perché hai descritto un momento, non un movimento.
Il video dipende dal tempo. Senza istruzioni esplicite sul movimento, l'IA ricorre all'interpretazione più conservativa: progressione lenta o leggero parallasse. Tecnicamente, si tratta effettivamente di un "video", ma non è quello che desideri.
| Prima della modifica | Dopo la modifica | |--------|------- -| | Un'auto sportiva vintage rossa parcheggiata su una strada di montagna, mattina nebbiosa, effetto cinematografico (一辆复古红色跑车停在山路上,薄雾清晨,电影感) | Una Porsche 911 vintage rossa accelera su una strada di montagna tortuosa, le gomme aderiscono all'asfalto bagnato, la nebbia si dirada intorno alla carrozzeria, la telecamera la segue all'altezza del paraurti, gli alberi sfocati sfilano in primo piano |
Metodo di correzione: ogni suggerimento video richiede almeno un verbo che descriva il movimento fisico del soggetto e una frase che descriva il movimento della telecamera. Il soggetto si muove, la telecamera si muove: insieme creano energia visiva.
3. La direttiva contraddittoria — Il paradosso "Primo piano + Piano generale"
Questa situazione è più comune di quanto si possa immaginare, in particolare quando le persone mettono insieme termini cinematografici che hanno sentito ma che non comprendono appieno. "Primo piano estremo di una donna che attraversa un vasto deserto, a schermo intero, atmosfera epica" contiene due direttive compositive contrastanti. L'IA cercherà di trovare una media tra le due, producendo un'immagine che non è né vicina né lontana, ma semplicemente caotica.
| Prima della revisione | Dopo la revisione |
|---|---|
| Primo piano di una donna che attraversa un vasto deserto, ampia inquadratura, scala epica | Primo piano estremo degli occhi di una donna che riflettono la luce del deserto, particelle di sabbia che catturano il sole dell'ora dorata sulle sue ciglia, profondità di campo ridotta con il vasto campo di dune sfocato in una sfumatura ambrata dietro di lei (Occhi della donna in primo piano estremo, che riflettono la luce del deserto; particelle di sabbia che catturano il sole dell'ora dorata sulle sue ciglia; Profondità di campo ridotta che rende le vaste dune dietro di lei in una sfumatura ambrata) |
Metodo di correzione: seleziona una posizione della telecamera per ogni ripresa. Se hai bisogno di primi piani e campi lunghi, scrivi due riprese separate e collegale con una transizione. Per le sequenze multi-ripresa, piattaforme come Seedance supportano il formato timeline storyboard, che ti consente di specificare ogni ripresa in modo indipendente.
- Mancanza di atmosfera — Un vuoto di luce, ombra ed emozione
La tua richiesta descrive un soggetto che compie un'azione in un luogo specifico. Ciò copre tre delle sette dimensioni. Senza indicazioni relative all'illuminazione, alla tavolozza dei colori, agli effetti atmosferici o alla direzione stilistica, l'IA colmerà le lacune con impostazioni predefinite neutre: illuminazione piatta e uniforme, colori tenui e nessun'atmosfera particolare. Il risultato assomiglia alle riprese di una telecamera a circuito chiuso ad alta definizione.
| Prima della revisione | Dopo la revisione | |--------|------- -| | Un uomo seduto da solo in un bar | Un uomo sulla quarantina è seduto da solo in un angolo poco illuminato, la calda luce ambrata di una lampada a sospensione cattura il vapore che sale dalla sua tazza di caffè, la pioggia che scorre lungo la finestra dietro di lui proietta ombre increspate sul suo viso, colori tenui verde acqua e rame, atmosfera malinconica |
Metodo di correzione: incorporare la direzione della luce, la temperatura del colore, gli effetti atmosferici (nebbia, pioggia, polvere, vapore) e parole evocative. Queste quattro aggiunte trasformano "una scena" in "una sensazione".
- Assenza di sound design — Il problema dei film muti
Entro il 2026, la maggior parte delle piattaforme video basate sull'intelligenza artificiale supporterà la generazione audio: musica di sottofondo, effetti sonori ambientali e persino dialoghi con sincronizzazione labiale. Tuttavia, la maggior parte degli utenti crea prompt completamente silenziosi, trattando i prompt video esclusivamente come istruzioni visive.
Il suono costituisce metà dell'esperienza. Una scena nella foresta senza il canto degli uccelli e il fruscio delle foglie sembra artificiale. Le sequenze d'azione prive di effetti sonori sembrano inconsistenti. Le dimostrazioni di prodotti senza musica assomigliano a presentazioni PowerPoint.
| Prima della modifica | Dopo la modifica | |------- -|--------| | Un gatto che salta da una libreria e atterra su un divano | Un gatto rosso salta con grazia dalla cima di un'alta libreria in quercia, allungando il corpo a mezz'aria, atterrando dolcemente su un cuscino di velluto che si comprime sotto il suo peso. Suono: leggero impatto delle zampe sul tessuto, un libro che scivola sullo scaffale, rumore ambientale silenzioso con pioggia lontana contro le finestre Suono: leggero impatto delle zampe sul tessuto, un libro che scivola sullo scaffale, rumore ambientale silenzioso con pioggia lontana contro le finestre) |
Soluzione: aggiungere una riga di istruzioni audio alla fine del prompt, specificando lo stile della musica di sottofondo, gli effetti sonori ambientali ed eventuali dialoghi o narrazioni. Forniamo indicazioni dettagliate nella sezione [Sound Design](#Incorporating Sound Design into Prompts) riportata di seguito.
Formula universale per i messaggi video
Indipendentemente dalla piattaforma utilizzata, ogni prompt video efficace contiene gli stessi sette elementi. Alcuni sono essenziali (richiesti in ogni prompt), mentre altri sono opzionali (migliorano l'efficacia ma non sono obbligatori). La formula:
[Soggetto] + [Azione] + [Ambiente] + [Fotocamera] + [Illuminazione] + [Stile] + [Suono]

I sette elementi chiave di una formula universale per i prompt video. Ogni elemento aggiunge un'ulteriore dimensione di controllo al risultato finale.
Di seguito analizzeremo ciascun elemento, accompagnato da un elenco di parole chiave e frasi di esempio.
Elemento uno: Oggetto (obbligatorio)
Il soggetto è l'oggetto dello sguardo del pubblico. Questa dovrebbe essere la parte più specifica del prompt: non semplicemente "una donna", ma "una donna sulla sessantina, con capelli argentati raccolti in una crocchia morbida, profonde rughe di espressione agli angoli degli occhi, che indossa un grembiule di jeans scolorito".
Libreria delle parole chiave:
| Categoria | Esempio (prompt in inglese) | |------|------------------ -| | Personaggi | un giovane ventenne, una donna anziana, un bambino di circa cinque anni, una ballerina, uno chef, un soldato | | Animali | un golden retriever, un leopardo delle nevi, un colibrì, una carpa koi, una farfalla monarca | | Oggetti | una macchina da scrivere vintage, un flacone di profumo in cristallo, un diario rilegato in pelle, un vaso di ceramica | | Veicoli | una motocicletta nero opaco, una barca a vela in legno, un pick-up malandato, un treno proiettile | | Astratto | particelle di luce, gocce d'inchiostro nell'acqua, forme geometriche, metallo liquido |
Esempi di frasi:
Una barista sulla trentina con tatuaggi sulle braccia e un grembiule nero ricoperto di farinaUna bussola di bronzo consumata dal tempo aperta su una carta nautica-Migliaia di lanterne di carta, ognuna delle quali emana una calda luce ambrata proveniente da una candela al suo interno
Elemento due: Azione (obbligatorio)
L'azione è ciò che si svolge: ciò che il soggetto sta facendo e come la scena si evolve nel tempo. Questa è la linea di demarcazione tra i suggerimenti video e quelli immagine. Senza azione, non rimane altro che una fotografia in movimento.
Libreria delle parole chiave:
| Tipo di movimento | Esempio (prompt in inglese) | |--------- -|-------------------| | Movimento umano | camminare, correre, girarsi lentamente, allungare le braccia, sporgersi in avanti, espirare, sbattere le palpebre | | Relativo al movimento della telecamera | avvicinarsi alla telecamera, allontanarsi dalla telecamera, attraversare l'inquadratura da sinistra a destra | | Movimento di oggetti | ruotare, cadere, fluttuare, frantumarsi, assemblarsi, dispiegarsi, sciogliersi | | Movimento ambientale | vento che soffia tra l'erba, nuvole che si muovono, pioggia che cade, foglie che volano, marea che sale | | Processi di transizione | il giorno che volge alla notte, fiori che sbocciano, ghiaccio che si forma, vernice che si diffonde, luce che cambia |
Esempi di frasi:
Si china lentamente e raccoglie una foglia autunnale caduta, rigirandola tra le ditaL'ago della bussola trema, poi oscilla decisamente verso nordLe lanterne si sollevano una ad una da terra, salendo nel cielo buio a velocità diverse
Elemento tre: Ambiente (essenziale)
L'ambientazione è il luogo in cui si svolge la scena. Descrivi sia l'ambientazione immediata (primo piano) che lo sfondo più ampio. Includi il tempo atmosferico, l'ora del giorno e la stagione, se pertinenti.
Libreria delle parole chiave:
| Tipo di scena | Esempio (prompt in inglese) | |----------|------------------ -| | Natura | foresta fitta, dune desertiche, scogliera oceanica, prato alpino, spiaggia vulcanica, boschetto di bambù | | Urbano | vicolo stretto di Tokyo, piazza brutalista in cemento, giardino pensile, binario della metropolitana, viale illuminato da luci al neon | | Interni | biblioteca illuminata da candele, loft industriale, serra, camera oscura vintage, atrio in marmo | | Fantasia | isole galleggianti, caverna di cristallo, barriera corallina bioluminescente, tempio in rovina, città tra le nuvole | | Tempo/Clima | crepuscolo prima dell'alba, mezzogiorno nuvoloso, temporale, prima neve, umida serata estiva |
Esempi di frasi:
In una stretta stradina secondaria di Kyoto, con lanterne di pietra allineate su entrambi i lati, petali di fiori di ciliegio fluttuano sui ciottoli bagnatiAll'interno di una cattedrale abbandonata e cavernosa, fasci di luce polverosa penetrano attraverso le vetrate colorate rotteSull'orlo di una scogliera vulcanica all'ora blu, vapore solforoso sale dalle fessure della roccia nera
Elemento quattro: Riprese (importante)
Le istruzioni relative alla direzione della telecamera guidano lo spettatore AI su come percepire la scena, comprendendo la composizione (quanto da vicino), l'angolazione (da dove) e il movimento (come cambia il punto di vista nel tempo). Il linguaggio della telecamera rappresenta la leva più importante per migliorare la qualità dei prompt: lo approfondiamo nella sezione dedicata qui sotto.
Libreria delle parole chiave rapide:
| Aspetto | Terminologia inglese ed equivalente cinese | |------|------------------ -| | Inquadratura | primo piano estremo, primo piano, campo medio, campo lungo, campo largo, campo grandangolare (campo lunghissimo) | | Angolazione | all'altezza degli occhi, angolazione bassa, angolazione alta, vista dall'alto, vista dal basso, angolazione olandese | | Movimento | carrellata in avanti/indietro, panoramica a sinistra/destra, inclinazione verso l'alto/verso il basso, carrellata, orbita, gru (elevazione) | | Obiettivo | grandangolo 24 mm, standard 50 mm, ritratto 85 mm, teleobiettivo 200 mm, obiettivo macro, anamorfico |
Elemento cinque: illuminazione (importante)
Luci e ombre definiscono l'atmosfera di ogni fotogramma. I fotografi professionisti trascorrono ore a sistemare l'illuminazione. Nella scrittura immediata, poche parole precise possono ottenere lo stesso livello di controllo.
Libreria delle parole chiave:
| Tipo di illuminazione (inglese/cinese) | Effetti visivi | |--------------------- -|----------| | Ora d'oro | Toni caldi, ombre lunghe, sfumature arancione-ambra, lusinghiere per i ritratti | | Ora blu | Toni freddi, atmosfera malinconica, cielo blu intenso con calore persistente all'orizzonte | | Controluce | Contorni delineati, effetto silhouette, netta separazione dallo sfondo | | Luce laterale | Volto per metà illuminato e per metà in ombra; contrasto elevato, effetto drammatico | | Illuminazione Rembrandt | Riflesso triangolare sotto l'occhio in ombra; effetto ritratto classico | | Illuminazione volumetrica | Raggi visibili che penetrano polvere, nebbia o fumo | | Effetto Tyndall | Dispersione della luce all'interno delle particelle, che produce raggi distinti all'interno della nebbia o della polvere | | Neon | Fonti di luce artificiale colorata, riflessi su superfici bagnate, estetica cyberpunk |
Elemento sei: Stile (consigliato)
Lo stile determina il linguaggio visivo utilizzato dall'IA: film cinematografico, realismo documentaristico, animazione, pittura a olio o altro. Senza una dichiarazione di stile, l'IA utilizza per impostazione predefinita uno stile fotorealistico generico.
Libreria delle parole chiave:
| Stile (inglese/cinese) | Caratteristiche visive | |----------------- -|----------| | Cinematografico | Profondità di campo ridotta, gradazione dei colori di livello cinematografico, formato widescreen 2,39:1 | | Documentario | Effetto telecamera a mano, illuminazione naturale, inquadratura osservativa | | Pubblicitario | Pulito, luminoso, incentrato sul prodotto, illuminazione precisa, movimento fluido | | Anime | Stile cell-shading, colori vivaci, movimento esagerato, linee dinamiche | | Film noir | Monocromatico ad alto contrasto, ombre da tende veneziane, illuminazione low-key | | Inchiostro diluito | Inchiostro nero su fondo bianco, sfumature fluide, minimalismo, estetica orientale | | Film vintage | Grana cinematografica, leggermente desaturato, toni caldi, bordi sfocati | | Cyberpunk | Neon, alto contrasto, elementi olografici, atmosfera urbana apocalittica |
Elemento sette: Suono (facoltativo)
Il suono aggiunge una dimensione uditiva. Sebbene non tutte le piattaforme supportino la generazione audio, incorporare il sound design nei prompt non solo è lungimirante, ma spesso migliora l'impatto visivo, poiché l'IA utilizza segnali audio per influenzare il tono emotivo e il ritmo delle immagini.
Libreria delle parole chiave:
| Tipo di suono | Esempio (prompt in inglese) |
|---|---|
| Stile musicale | orchestrale, hip hop lo-fi, elettronica ambient, piano jazz, chitarra acustica, colonna sonora cinematografica (colonna sonora cinematografica) |
| Effetti sonori ambientali | pioggia sul vetro, vento tra gli alberi, rumore del traffico cittadino, onde dell'oceano, crepitio del fuoco |
| Effetti sonori d'azione | passi sulla ghiaia, cigolio di porte, vetri che si rompono, rombo di motori |
| Voci | narrazione sussurrata, dialoghi, respiro, risate |
Il linguaggio cinematografico: l'arma segreta
Il linguaggio cinematografico è la competenza più influente che puoi coltivare come autore di prompt video. Quando scrivi "dolly in slowly" invece di "zoom in", stai parlando il vocabolario nativo dei modelli di IA, poiché questi modelli sono addestrati su milioni di ore di riprese professionali, in cui i movimenti della telecamera hanno nomi specifici ed effetti visivi distinti.
Questa sezione funge da guida di riferimento completa. Ti consigliamo di aggiungerla ai preferiti.

I movimenti della telecamera non sono intercambiabili: ognuno produce un effetto emotivo distinto. Conoscere la terminologia corretta trasformerà l'impatto delle tue indicazioni.
Cinematografia di base
Dolly In / Dolly Out (spinta / trazione)
La telecamera si avvicina fisicamente al soggetto (push) o si allontana (pull). A differenza dello zoom, la prospettiva cambia: gli oggetti in primo piano appaiono proporzionalmente più grandi, creando un senso di profondità e vicinanza fisica.
- Effetto emotivo: la spinta crea intimità, concentrazione e rivelazione. L'attrazione crea isolamento, contesto e allontanamento.
- Quando usare: spingere per primi piani emotivi, momenti caratteriali e dettagli rivelatori. Allontanarsi per mostrare la scala, concludere o ritirarsi dal soggetto.
- Frase chiave:
La telecamera si avvicina lentamente da un'inquadratura media a un primo piano estremo sulle mani del soggetto
Panoramica sinistra / Panoramica destra (panoramica orizzontale)
La telecamera rimane fissa, ruotando orizzontalmente come se si girasse la testa. Il punto di vista spazia su tutta la scena.
- Effetto emotivo: Indagine, scoperta, movimento di tracciamento laterale, collegamento di due elementi all'interno di una scena.
- Quando utilizzarlo: Per mostrare paesaggi, seguire personaggi che camminano, dimostrare l'ampiezza spaziale.
- Frase di riferimento:
Lenta panoramica verso destra attraverso l'officina, rivelando file di strumenti artigianali appesi alla parete
Inclinazione verso l'alto/verso il basso (panoramica/inclinazione verticale)
La telecamera rimane fissa, ruotando verticalmente, come se annuisse. Una panoramica verso l'alto rivela l'altezza; una panoramica verso il basso mostra i dettagli a livello del suolo.
- Effetto emotivo: un'inclinazione verso l'alto evoca stupore, grandiosità e desiderio. Un'inclinazione verso il basso crea un senso di radicamento, scoperta e intimità con la superficie.
- Quando usarla: un'inclinazione verso l'alto viene utilizzata per strutture torreggianti, personaggi che si alzano in piedi o per rivelare il cielo. Le inquadrature verso il basso rivelano oggetti su un tavolo o la transizione dal cielo al suolo.
- Frase chiave:
La telecamera si inclina verso l'alto dalle radici dell'albero secolare, seguendo il tronco massiccio fino alla chioma
Tracking Shot (Follow Shot/Side Tracking Shot)
La telecamera si muove parallelamente al soggetto, mantenendo una distanza e un angolo costanti, come se fosse montata su un binario che corre parallelo al percorso del soggetto.
- Effetto emotivo: Compagnia, viaggio, immersione. Il pubblico viaggia insieme al soggetto.
- Quando usare: Per personaggi che camminano o corrono, attraversano spazi o mostrano prodotti lungo superfici.
- Frase suggerita:
La telecamera segue la corritrice all'altezza delle spalle, mantenendo il passo mentre lei corre lungo il vicolo
Orbita / Arco (ripresa circolare)
La telecamera ruota attorno al soggetto mantenendolo al centro dell'inquadratura. Ciò può comportare una rotazione completa di 360 gradi o un arco parziale.
- Effetto emotivo: presenza eroica, senso di potere, qualità espositiva, visualizzazione tridimensionale.
- Quando utilizzarlo: dimostrazioni di prodotti (mostrando tutti gli angoli), riprese eroiche, presentazioni drammatiche dei personaggi, momenti decisivi.
- Frase di prompt:
La telecamera ruota di 180 gradi attorno al giocatore di scacchi, partendo da dietro e terminando frontalmente
Crane Up / Crane Down (Ripresa dall'alto / Ripresa con braccio telescopico)
Il movimento verticale della telecamera, ovvero l'innalzamento o l'abbassamento fisico, viene solitamente combinato con l'inclinazione per mantenere il soggetto all'interno dell'inquadratura.
- Effetto emotivo: l'ascesa crea un senso di trascendenza, liberazione e prospettiva ampliata. La discesa favorisce una sensazione di concretezza, un senso di arrivo e un'attenzione concentrata.
- Quando utilizzarlo: l'ascesa viene impiegata per le conclusioni, i momenti di trionfo e le transizioni verso prospettive aeree. Le riprese discendenti sono utilizzate per le aperture, gli arrivi e le transizioni da riprese ampie a composizioni intime.
- Frase suggerita:
La telecamera si alza dal livello del suolo, elevandosi sopra la folla e rivelando l'intera portata del festival
Portatile (obiettivo portatile)
L'obiettivo presenta una leggera oscillazione organica, non essendo montato su un treppiede o uno stabilizzatore. Ciò simula la sensazione di un fotografo umano che tiene la fotocamera a mano libera.
- Effetto emotivo: immediatezza, urgenza, autenticità documentaristica, tensione, intimità.
- Quando usare: sequenze d'azione, dialoghi emotivi, estetica documentaristica, film horror, qualsiasi scena che richieda una sensazione di immersione.
- Frase guida:
La telecamera a mano segue il personaggio attraverso il mercato affollato, leggermente instabile
Steadicam / Gimbal (Steadicam/Obiettivo stabilizzatore)
I movimenti fluidi e fluttuanti della telecamera scivolano nello spazio. A differenza delle riprese con la telecamera a mano, non ci sono vibrazioni: il movimento è fluido e continuo.
- Effetto emotivo: esplorazione onirica, elegante, coinvolgente, rilassata.
- Quando utilizzarlo: navigazione in spazi architettonici, seguire personaggi attraverso ambienti complessi, riprese in un'unica ripresa, cinematografia lussuosa ed estetica.
- Frase di prompt:
La Steadicam scivola dietro la ballerina mentre si muove nella sala da ballo vuota
Tecniche avanzate di movimento della telecamera
Zoom Hitchcock (Dolly Zoom / Effetto Vertigo)
Quando la fotocamera esegue uno zoom in avanti, la lunghezza focale aumenta (o viceversa). Il soggetto rimane delle stesse dimensioni, ma lo sfondo subisce una distorsione notevole, allungandosi o comprimendosi.
- Effetto emotivo: disorientamento, epifania, terrore, il mondo che ruota attorno a un punto fisso.
- Frase di spunto:
Dolly zoom sul volto del personaggio: la telecamera si avvicina mentre l'obiettivo zoomma all'indietro, lo sfondo si allontana creando un effetto vertiginoso
Whip Pan
Panoramica orizzontale estremamente rapida, che rende sfocata l'intera inquadratura durante il movimento. Comunemente utilizzata come transizione tra due scene.
- Effetto emotivo: Energia, sorpresa, urgenza, tempismo comico.
- Frase chiave:
Dalla faccia di chi parla alla reazione del pubblico, con un movimento veloce e sfocato durante la transizione
Messa a fuoco su rack (Pull Focus)
La messa a fuoco passa da un piano di profondità all'altro all'interno di una singola ripresa. Il primo piano diventa sfocato mentre lo sfondo diventa nitido, o viceversa.
- Effetto emotivo: reindirizza l'attenzione, rivela informazioni, collega elementi in primo piano e sullo sfondo.
- Frase guida:
Spostare la messa a fuoco dai fiori sfocati in primo piano al volto della donna sullo sfondo
Angolo olandese (angolo inclinato)
L'obiettivo si inclina lungo l'asse orizzontale, creando un orizzonte diagonale. Il mondo appare distorto.
- Effetto emotivo: disagio, instabilità, tensione, drammaticità stilizzata, frenesia.
- Frase di riferimento:
Primo piano con angolazione olandese del volto del detective, inclinazione di 15 gradi, illuminazione laterale intensa
Rampa di velocità (rampa temporale)
La velocità di riproduzione varia all'interno di una singola ripresa, rallentando in genere nei momenti cruciali prima di accelerare nuovamente.
- Effetto emotivo: enfasi, impatto, conferendo peso drammatico a momenti specifici.
- Frase di suggerimento:
Il movimento rallenta fino a diventare al rallentatore nel momento dell'impatto, poi accelera nuovamente fino a tornare al tempo reale
One-Take (Long Take)
Riprese continue senza montaggio. La telecamera attraversa gli spazi, segue i movimenti e scopre elementi, mantenendo una prospettiva unica e ininterrotta per tutta la durata del filmato.
- Effetto emotivo: immersione, esperienza in tempo reale, senso di padronanza tecnica, aumento sostenuto della tensione.
- Frase di prompt:
Ripresa continua in un'unica inquadratura: la telecamera entra dalla porta principale, scivola lungo il corridoio e arriva al giardino
Prima persona / POV
La telecamera rappresenta gli occhi del personaggio. Il pubblico vede ciò che vede il personaggio, comprese le sue mani che entrano nell'inquadratura.
- Effetto emotivo: immersione totale, esperienza soggettiva, estetica del gioco.
- Frase di spunto:
Punto di vista in prima persona: le mani spingono una pesante porta di legno, rivelando un prato illuminato dal sole
Per le funzionalità esclusive di controllo della telecamera di Seedance e per sapere come combinarle nella timeline dello storyboard, consulta la Guida ai prompt di Seedance.
Libreria delle parole chiave relative all'atmosfera
L'atmosfera è la chiave per trasformare video tecnicamente validi in opere emotivamente coinvolgenti. È la differenza tra "una stanza" e "una stanza che ti fa provare qualcosa". Questa libreria di parole chiave è organizzata in quattro dimensioni: illuminazione, tavolozza dei colori, texture e atmosfera, consentendoti di mescolare e abbinare per creare con precisione la sensazione desiderata.

Libreria delle parole chiave relative all'atmosfera: seleziona una parola chiave da ciascuna dimensione per definire la firma emotiva del tuo video.
Parole chiave di luce e ombra
L'illuminazione è fondamentale per creare l'atmosfera. Modificando l'illuminazione nel prompt è possibile trasformare completamente l'atmosfera lasciando invariati tutti gli altri elementi.
| Parole chiave (inglese/cinese) | Effetti visivi | Scenari adatti | |-------|----------|--------- -| | Ora d'oro | Luce calda color ambra, ombre morbide e allungate, tonalità della pelle lusinghiere | Romanticismo, nostalgia, viaggi, bellezza | | Ora blu | Luce ambientale blu intenso, tonalità calde residue all'orizzonte | Malinconia, contemplazione, transizione, atmosfera urbana | | Controluce | Soggetto delineato da una fonte di luce posteriore, ombre sul viso o sagome | Drammatico, misterioso, scatti eroici, fascino estetico | | Luce laterale | Forte luce direzionale da un lato, metà illuminata e metà in ombra | Tensione, primi piani dei personaggi, ritratti drammatici | | Illuminazione Rembrandt | Classica illuminazione da ritratto: un lato illuminato, con un piccolo riflesso triangolare sotto l'occhio sul lato in ombra | Ritratti, eleganza, atmosfera classica | | Illuminazione volumetrica | Fasci di luce visibili che attraversano polvere, nebbia o fumo | Sacralità, teatro, scene nella foresta, illuminazione scenica | | Effetto Tyndall | La luce si diffonde all'interno di particelle minuscole, formando fasci distinti all'interno della nebbia | Naturale, scene dell'alba, etereo, onirico | | Neon | Fonti di luce artificiale colorata, spesso rosa, blu, ciano, magenta | Cyberpunk, vita notturna, urbano, contemporaneo | | Luce di candela | Calda, tremolante, arancio-ambra | Intimità, storia, scene di cena, intimità | | Sagoma | Soggetto completamente oscurato, definito esclusivamente dal contorno su uno sfondo luminoso | Mistero, anonimato, impatto visivo, narrativa | | Bioluminescente | Sorgente luminosa organica autoilluminante, tipicamente blu-verde | Fantasia, mondo sottomarino, mondi alieni, onirico |
Parole chiave relative alla tonalità di colore
La combinazione di colori determina la temperatura emotiva dell'intera composizione. I toni caldi trasmettono un senso di accoglienza, mentre quelli freddi danno una sensazione di distanza. Un'elevata saturazione conferisce vivacità, mentre una bassa saturazione trasmette sobrietà.
| Parole chiave (inglese/cinese) | Effetti visivi | Risonanza emotiva | |-------|----------|--------- -| | Tonalità calde | Prevalgono i toni dell'ambra, dell'arancio, dell'oro e del rosso | Comfort, nostalgia, intimità, autunno | | Tonalità fredde | Prevalgono i toni del blu, del ciano e dell'ardesia | Distanza, tranquillità, malinconia, inverno, tecnologia | | Alta saturazione | Colori vividi, intensi, forti | Energia, giovinezza, fantasia, cultura pop | | Desaturato | Colori tenui, sbiaditi, simili ai pastelli | Malinconia, realismo, reminiscenza, retrò | | Verde acqua e arancione | Classica gradazione di colori dei film: ombre fredde, luci calde | Blockbuster hollywoodiani, pubblicità, cinema | | Tavolozza cyberpunk | Rosa neon, blu elettrico, viola intenso su sfondi scuri | Futuristico, vita notturna, digitale, avanguardia | | Vintage | Leggermente sbiadito, tonalità calde, ombre accentuate | Nostalgia, anni '70-'80, film indipendenti, ricordi | | Toni della terra | Marrone, verde, ocra, terracotta | Natura, radicamento, organico, documentario | | Kodachrome | Verdi e rossi intensi, toni della pelle caldi, neri profondi | Fotogiornalismo, anni '60-'70, estetica americana |
Parole chiave relative alla qualità della texture/immagine
La texture definisce la superficie visiva di un video, che assomigli a una pellicola da 35 mm, a una pubblicità patinata, a un documentario o a un dipinto a olio.
| Parole chiave (inglese/cinese) | Effetti visivi | Scenari applicabili | |-------|--------- -|----------| | Cinematografico | Effetto widescreen, profondità di campo ridotta, tavolozza di colori cinematografica | Narrativa, dramma, storytelling | | Documentario | Illuminazione naturale, composizioni leggermente imperfette | Realismo, attualità, istruzione | | Pubblicità | Illuminazione pulita, brillante e precisa, movimenti fluidi della telecamera | Presentazione di prodotti, pubblicità, corporate | | Grana cinematografica | Texture organica di rumore sovrapposta alle riprese | Retrò, analogico, indie, caldo | | Anamorfico | Riflessi orizzontali dell'obiettivo, bokeh ellittico, sottile distorsione dei bordi | Dramma cinematografico, fantascienza, atmosfera epica | | Texture pittorica ad olio | Texture delle pennellate visibili, ricco effetto impasto | Arte, fantasy, paesaggi onirici, classico | | Acquerello | Sfumature di inchiostro nero su sfondo bianco, forme organiche fluide | Estetica orientale, minimalismo, tranquillità | | 8 mm / Super 8 | Grana pesante, perdite di luce, riprese instabili, colori sbiaditi | Ricordi, flashback, filmati amatoriali, nostalgia |
Parole chiave emotive
Le parole chiave emotive forniscono all'IA la sua direzione emotiva. Influenzano tutto: il ritmo, la scelta dei colori, il comportamento della telecamera e l'atmosfera generale.
| Parole chiave (inglese/cinese) | Emozioni evocate | Suggerimenti di stile | |-------|----------- -|----------| | Accogliente | Calore, comfort, sicurezza, casa | Luce di candela, toni caldi, scene in interni | | Teso | Ansia, anticipazione, eventi imminenti | Illuminazione laterale, riprese a mano, inquadrature strette | | Suspense | Paura, incertezza, lento crescendo | Illuminazione soffusa, progressione graduale, bassa saturazione | | Gioia | Felicità, festa, Leggerezza | Ora dorata, alta saturazione, riprese panoramiche | | Malinconico | Tristezza, nostalgia, bellezza nel dolore | Ora blu, toni freddi, rallentatore | | Epico | Grandiosità, eroismo, stupore | Grandangoli, riprese con carrellata, colonne sonore orchestrali | | Guarigione | Pace, recupero, dolce ricomposizione | Illuminazione soffusa, tonalità pastello, toni naturali, ritmo lento | | Horror | Paura, inquietudine, disagio | Ombre profonde, angolazioni olandesi, bassa saturazione, silenzio | | Romantico | Amore, desiderio, tenerezza, intimità | Controluce, toni caldi, profondità di campo ridotta, primi piani | | Energico | Velocità, eccitazione, adrenalina | Vibrazioni della fotocamera, velocità variabile, alta saturazione, grandangolo | | Nostalgico | Nostalgia del passato, ricordi agrodolci | Grana della pellicola, toni vintage, luci sovraesposte |
Combinazioni di parole chiave relative all'atmosfera: tre esempi
Il vero potere sta nel selezionare una o due parole chiave da ciascuna dimensione e combinarle tra loro. Le seguenti tre combinazioni creano atmosfere completamente diverse per lo stesso soggetto: "una donna in piedi alla finestra":
Combinazione uno: calda nostalgia
Retroilluminazione dell'ora dorata, tavolozza calda con toni ambrati e miele, texture granulosa, atmosfera nostalgica
Combinazione due: tensione agghiacciante
Luce laterale da un'unica fonte, palette di colori freddi verde acqua, texture digitale pulita, atmosfera tesa
Combinazione tre: eterea e onirica
Effetto Tyndall dei raggi di luce attraverso tende trasparenti, palette pastello, texture acquerellata, atmosfera rilassante
Stesso argomento, tre video completamente distinti. La parola chiave dell'atmosfera è il pannello di controllo.
Da singole frasi a suggerimenti cinematografici: 5 esempi avanzati
Il modo migliore per imparare a scrivere prompt è osservare il processo evolutivo dei prompt. Ogni esempio riportato di seguito passa dalla versione base V1 (quella che la maggior parte delle persone scrive) alla V2 (aggiungendo specificità e movimenti di macchina), per culminare nella V3 (un prompt completamente specificato, di livello cinematografico). Si notino i cambiamenti che avvengono a ogni livello e il motivo per cui vengono implementati.
Per ulteriori esempi di prompt video pronti all'uso, consulta 10 prompt video pratici basati sull'intelligenza artificiale.

Evoluzione rapida nella pratica. La versione V1 non fornisce praticamente alcuna informazione all'IA. La versione V3 le fornisce tutto: i risultati sono agli antipodi.
Esempio 1: Ritratto/Atmosfera — "Donna che cammina sotto la pioggia"
V1 — Edizione base (18 parole)
A woman walking in the rain at night in a city, cinematic, beautifulOtterrai: una donna generica, una città generica, una pioggia generica, un'illuminazione piatta, nessuna risonanza emotiva. L'intelligenza artificiale riempie ogni vuoto con medie statistiche.
V2 — Versione migliorata (62 parole)
A young Asian woman in a long dark coat walks slowly through a rain-soaked Tokyo backstreet at night. Neon signs reflect in the wet pavement, casting pink and blue light. She carries a transparent umbrella. Camera tracks beside her at shoulder height. Shallow depth of field. Melancholic mood.Cosa è stato migliorato: identità specifica del soggetto, posizione specifica, fonte di luce specifica, posizione della fotocamera, direzione emotiva. L'IA ora possiede informazioni sufficienti per generare immagini uniche.
V3 — Qualità cinematografica (138 parole)
A woman in her late 20s, Japanese, long black hair partially wet and clinging to her neck, wearing an oversized charcoal wool coat over a cream turtleneck, walks alone through a narrow Shinjuku backstreet at 2am. Rain falls in fine sheets, catching neon light from izakaya signs overhead — warm amber kanji characters and cold blue beer advertisements. The wet asphalt mirrors everything, creating a double world beneath her feet. She carries a transparent vinyl umbrella, water beading and streaming down its surface.
Camera: tracking shot at shoulder height, moving alongside her at walking pace, shallow depth of field at f/1.4, foreground rain droplets occasionally crossing the lens out of focus.
Lighting: practical neon sources only — no fill light. Rim light from signs behind her outlines her coat collar and umbrella edge. Her face catches intermittent warm light as she passes each shopfront.
Style: cinematic, Kodak Vision3 500T film stock, slight grain, teal-and-amber color grade, Wong Kar-wai atmosphere.
Suono: pioggia sulla superficie dell'ombrello, jazz ovattato proveniente da un bar in lontananza, i suoi passi sulla pietra bagnata, nessun dialogo, nessuna colonna sonora.(Una donna giapponese sui vent'anni, con lunghi capelli neri parzialmente bagnati che le ricadono sul collo, indossa un cappotto oversize di lana grigio antracite sopra un dolcevita color crema e cammina da sola per i vicoli stretti di Shinjuku alle 2 del mattino. I fili di pioggia sottile riflettevano il bagliore al neon delle insegne degli izakaya sopra di lei: caldi caratteri giapponesi color ambra e fredde pubblicità di birra blu. L'asfalto umido rifletteva tutto, creando un mondo speculare sotto i suoi piedi. Teneva in mano un ombrello di plastica trasparente, con goccioline che si condensavano e scivolavano lungo la superficie.
Perché V3 funziona: ogni elemento della formula è definito in modo esplicito. Non c'è spazio per le ipotesi dell'IA: quando l'IA non deve fare ipotesi, riproduce esattamente ciò che descrivi.
Esempio 2: Presentazione del prodotto — "L'orologio sulla scrivania"
V1 — Edizione base (14 parole)
A luxury watch sitting on a table, product shot, high quality, 4KV2 — Edizione riveduta (58 parole)
A stainless steel dive watch with a dark blue dial rests on a slab of raw gray marble. Camera orbits slowly around the watch, 15 degrees above. Single key light from the upper left creates a defined shadow. The watch's crystal catches the light and creates a brief flare. Commercial style, clean background.V3 — Qualità cinematografica (126 parole)
A stainless steel dive watch with a sunburst navy-blue dial and ceramic bezel sits on a rough-cut block of Carrara marble, positioned at the golden-ratio intersection of the frame. The second hand sweeps continuously. Micro water droplets bead on the crystal surface and the steel bracelet links, catching light.
Camera: begins in macro extreme close-up on the dial — the indices and lume dots fill the frame — then slowly dollies out while simultaneously orbiting clockwise, completing a 270-degree arc over 8 seconds until the full watch and marble base are revealed in a three-quarter beauty shot.
Lighting: single hard key light at 10 o'clock position, 45 degrees above. No fill — deep shadows on the right side. A subtle rim light from behind separates the watch from the dark charcoal background.
Style: high-end commercial, ultra-sharp 8K downscaled to 4K, zero grain, clinical precision. Color: cool steel tones with warm gold accents from the lume.
Suono: quasi silenzio — solo il leggero ticchettio meccanico del movimento, un singolo rintocco pulito al momento del bagliore.(Un orologio subacqueo in acciaio inossidabile, con quadrante blu navy sunburst e lunetta in ceramica, poggia su un blocco di marmo di Carrara tagliato grossolanamente, posizionato all'intersezione del rapporto aureo della cornice. La lancetta dei secondi continua il suo movimento. Piccole goccioline d'acqua si condensano sulla superficie del cristallo e sulle maglie del bracciale in acciaio, riflettendo la luce.)
Esempio 3: Viaggio panoramico — "Montagne all'alba"
V1 — Edizione base (12 parole)
Beautiful mountains at sunrise, drone shot, epic landscape, cinematicV2 — Edizione riveduta (55 parole)
Snow-capped mountain peaks emerging from a sea of clouds at sunrise. The first rays of sun paint the peaks golden while the valleys remain in blue shadow. Camera cranes up slowly from the cloud layer, revealing the full mountain range. Wide angle, epic scale, warm-to-cool color gradient.V3 — Qualità cinematografica (134 parole)
The Dolomites at sunrise in late autumn. Jagged limestone spires — the Tre Cime di Lavaredo — pierce through a thick layer of valley clouds, their east-facing faces catching the first horizontal rays of sun and turning from cold blue-gray to blazing amber-gold. The cloud layer below is a rolling ocean of soft white and pale peach, filling the valleys completely.
Camera: starts buried inside the cloud layer — visibility near zero, soft white diffusion everywhere — then cranes upward at a steady pace, breaking through the cloud surface to reveal the peaks and the vast sky above. The transition from claustrophobic fog to infinite horizon takes 4 seconds. Continue rising to a high aerial wide shot. 24mm wide angle lens.
Lighting: first light of day — sun at 5 degrees above the eastern horizon, casting extreme raking light across the mountain faces. Golden hour warmth on lit surfaces, blue hour coolness in shadowed areas. Volumetric light beams visible where sun cuts between peaks.
Style: National Geographic cinematic, IMAX-quality, ultra-wide dynamic range, vivid but natural color, no filters.
Suono: vento in quota — un sussurro basso e prolungato con raffiche occasionali, nessuna musica, nessun suono umano. Il silenzio amplifica la grandezza.(Alba di fine autunno sulle Dolomiti. Le guglie frastagliate di calcare — le Tre Cime — squarciano le dense nuvole della valle, mentre le loro pareti orientali catturano i primi raggi orizzontali del sole, passando dal freddo grigio-blu al caldo oro ambrato.)
Esempio 4: Scena d'azione — "Artista marziale che sferra un pugno"
V1 — Edizione base (15 parole)
A martial artist doing a spinning kick, action movie style, slow motionV2 — Versione migliorata (64 parole)
A female martial artist in a dark training hall performs a spinning back kick. Her bare foot connects with a hanging heavy bag, sending it swinging violently. Camera captures the kick from a low angle, slightly slow motion at the point of impact, then returns to real-time as she recovers her stance. Side lighting creates dramatic shadows.V3 — Qualità cinematografica (141 parole)
A woman in her 30s, lean and muscular, wearing a fitted black tank top and loose gray training pants, stands in a dimly lit martial arts gym. Worn wooden floor, heavy bags hanging in rows, chalk dust suspended in the air. She explodes from stillness — a spinning hook kick that arcs through 360 degrees, her back heel striking a leather heavy bag at head height.
Camera: starts medium shot at 45-degree angle. As the spin begins, camera speed-ramps to 240fps slow motion — her hair whips in an arc, chalk dust traces the path of her foot, the bag surface ripples visibly on impact. Hold for one beat, then ramp back to real-time as she plants her foot. Slight handheld energy.
Lighting: single harsh side light from camera-left, no fill. Chalk dust and sweat particles glow in the light beam.
Style: David Fincher / Fight Club aesthetic — desaturated, greenish-teal undertone, high contrast, gritty. Anamorphic lens with subtle horizontal flares.
Suono: silenzio prima del calcio — rumore di fondo della palestra, un respiro. Il calcio: schiocco esplosivo del tessuto, forte impatto della pelle, tintinnio della catena. Il suo respiro affannoso al momento dell'impatto. Nessuna musica.(Una donna sulla trentina, snella e muscolosa, vestita con una canottiera nera aderente e pantaloni da allenamento grigi larghi, è in piedi in una sala di arti marziali poco illuminata. Pavimento in legno consumato, file di sacchi da boxe sospesi, polvere sospesa nell'aria. Lei esplode dall'immobilità: un calcio rotante a 360 gradi, il tallone che colpisce il sacco di pelle all'altezza della testa.)
Esempio 5: Racconto emotivo — "Nonna e nipote"
V1 — Edizione base (16 parole)
A grandmother and her grandchild spending time together, heartwarming, emotional, beautiful momentV2 — Edizione riveduta (71 parole)
An elderly grandmother with silver hair and weathered hands teaches her 5-year-old granddaughter how to knead bread dough in a sunlit country kitchen. The child stands on a wooden step stool, flour on her cheeks, laughing. The grandmother guides her small hands through the dough. Golden morning light through a window. Warm color palette. Intimate, cozy atmosphere.V3 — Qualità cinematografica (147 parole)
A Japanese grandmother in her 80s, silver hair in a soft bun, deep expression lines around smiling eyes, wearing an indigo apron over a cream linen blouse, stands beside her granddaughter — age 4 or 5, round cheeks, short black hair with a red clip — at a low wooden table in a traditional kitchen. Shoji screen doors are slid open to a small garden where morning light enters. They are making mochi together. The grandmother's large, weathered hands wrap around the child's tiny ones, guiding them to fold and press the soft rice dough. Flour dust floats in the shaft of sunlight between them.
Camera: close-up on their four hands working the dough — the contrast of old and young skin. Slowly dolly out to a medium shot including both faces. Rack focus between them — first sharp on the grandmother's eyes, then pulling to the child's smile. 85mm portrait lens, f/2.0, creamy bokeh.
Lighting: natural morning sunlight from the garden, soft and directional, Tyndall effect through the flour dust. No artificial light. The light creates a warm halo around the grandmother's silver hair.
Style: Hirokazu Kore-eda film quality — observational, unhurried, documentary intimacy with cinematic beauty. Kodachrome-inspired color. 16:9.
Suono: il suono morbido e ritmico delle mani che impastano, gli uccelli fuori in giardino, un lontano carillon eolico, le risatine occasionali del bambino, la nonna che canticchia sottovoce una melodia popolare. Nessuna colonna sonora, solo suoni diegetici.(Una nonna giapponese ottantenne, con i capelli argentati raccolti in una morbida crocchia, profonde rughe d'espressione intorno agli occhi sorridenti, indossa un grembiule blu indaco sopra una camicia di lino color crema. È in piedi accanto alla nipotina di quattro o cinque anni, dalle guance rotonde e dai capelli neri corti raccolti con un fermaglio rosso, al tavolo basso di legno nella cucina tradizionale. Le porte shoji si aprono scorrendo verso il piccolo giardino, dove entra la luce del mattino. Insieme preparano il mochi. Le grandi mani della nonna, segnate dagli anni, avvolgono quelle piccole della bambina, guidandole mentre piegano e pressano la morbida pasta di riso glutinoso. La polvere di farina fluttuava nel raggio di sole tra loro. Aveva quella qualità cinematografica tipica di Hirokazu Kore-eda: osservativa, senza fretta, un'intimità simile a quella di un documentario mescolata alla bellezza cinematografica.
Incorporare il sound design nel prompt
Il sound design rappresenta l'aspetto più trascurato nella scrittura dei prompt video. Nel 2026, piattaforme come Seedance, Veo 3 e Keeling supportavano tutte la generazione audio sincrona per i video: la disparità di qualità tra quelli che incorporavano segnali sonori e quelli che ne erano privi si rivelò enorme.
Considerate questo: una splendida scena boschiva senza suoni ambientali sembra un'animazione GIF. Aggiungete il canto degli uccelli, il fruscio delle foglie e il mormorio lontano di un ruscello, e diventa un luogo in cui vorreste entrare.
Formato di progettazione audio
Aggiungi i comandi vocali alla fine del prompt in un paragrafo o una riga separati, coprendo tre livelli:
Primo livello: musica di sottofondo — Atmosfera generale e stile
Background music: slow ambient piano, minor key, sparse notes with reverb
(背景音乐:缓慢的氛围钢琴,小调,稀疏的音符带混响)Secondo livello: effetti sonori ambientali — Creazione dei suoni di sottofondo della scena
Ambient: light rain on leaves, distant thunder rolls, wet road traffic hum
(环境音:轻柔的雨打树叶声、远处的雷声滚动、湿路上的交通嗡嗡声)Terzo livello: effetti sonori dell'azione e dialoghi — Suoni specifici associati agli eventi nel video
SFX: footsteps on wet pavement, umbrella opening with a click
Dialogue: none
(音效:湿路面上的脚步声、雨伞咔嗒打开的声音。对话:无)Riferimento alle parole chiave audio
Stili musicali per emozioni diverse:
| Atmosfera | Direzione musicale (prompt in inglese) |
|---|---|
| Tranquilla | Ambient, pianoforte morbido, fingerpicking con chitarra acustica, lo-fi |
| Teso | Ronzio basso, archi dissonanti, percussioni minimaliste |
| Allegro | Acustica vivace, ukulele, percussioni leggere, tonalità maggiore |
| Epico | Crescendo orchestrale, tamburi taiko, fanfara di ottoni, coro |
| Romantico | Quartetto d'archi, jazz delicato, bossa nova |
| Misterioso | Ambient cupo, pianoforte con forte riverbero, suoni di campane in lontananza |
| Energico | Beat elettronico, batteria incisiva, basso potente, uptempo |
| Malinconico | Violoncello solista, pianoforte lento in tonalità minore, chitarra sparsa |
Suoni ambientali:
| Ambiente | Livelli sonori (prompt in inglese) | |------|--------------------- -| | Foresta | Canto degli uccelli, fruscio delle foglie, picchio in lontananza, ruscello | | Notte urbana | Rumore del traffico, sirene in lontananza, ronzio dei neon, passi | | Oceano | Onde che si infrangono, gabbiani, vento, motore di barca in lontananza | | Caffè al chiuso | Macchina del caffè, conversazioni sommesse, cucchiaio sulla ceramica, jazz | | Giornata piovosa | Intensità della pioggia (leggero picchiettio / forte acquazzone), tuoni, gocce | | Officina | Rumori di attrezzi, trucioli di legno, ronzio dei macchinari, radio in sottofondo |
Quando ricorrere al silenzio
Il silenzio non è l'assenza di sound design, ma una scelta deliberata. Il silenzio strategico può creare:
- Momento di impatto: il silenzio che precede un momento drammatico amplifica tale momento
- Senso di grandezza: solo il suono del vento che soffia su vasti paesaggi trasmette un senso di immensità
- Tensione: l'assenza dei suoni attesi crea disagio⟧NLBR⟧ - Attenzione: il silenzio concentra tutta l'attenzione sull'immagine
Nel prompt, indicare esplicitamente: "Suono: silenzio — nessuna musica, nessun rumore ambientale, solo il respiro del soggetto".
Per ulteriori informazioni sulla generazione audio nella produzione di video musicali con IA, consultare la Guida al generatore di video musicali con IA.
Tecniche di prompt specifiche per piattaforma
La formula universale si applica universalmente, ma ogni piattaforma video AI possiede caratteristiche distintive nell'interpretazione dei prompt. Ottimizzare i prompt specificamente per la piattaforma che utilizzi può migliorare significativamente i risultati.

Lo stesso concetto – "Donna che cammina sotto la pioggia di notte" – ottimizzato per cinque piattaforme distinte. Stessa formula, enfasi diverse.
Seedance
Vantaggi: formato timeline storyboard, sequenze multi-shot, conversione da immagine a video, [generatore di prompt] integrato.
Tecniche di ottimizzazione:
- Utilizza una struttura temporale storyboard per sequenze complesse: dividi i video in riprese contrassegnate da timestamp:
Shot 1 (0-3s): [描述]
Shot 2 (3-6s): [描述]
Shot 3 (6-10s): [描述]- Mantieni la coerenza stilistica e dei personaggi facendo riferimento alle immagini caricate con
@Image1,@Image2 - Il linguaggio cinematografico produce risultati eccellenti: utilizza terminologia specifica (dolly, track, orbit) piuttosto che descrizioni vaghe ("muoversi verso").
- Incorpora il sound design: Seedance gestisce i segnali audio
- Flusso di lavoro più efficiente: utilizza il Video Prompt Generator per creare prompt strutturati da idee semplici, quindi perfezionali manualmente
Guida completa ai prompt specifici per piattaforma di Seedance (con oltre 50 esempi), consultare Guida ai prompt di Seedance.
Sora(OpenAI)
Vantaggi: Comportamento fisicamente realistico, movimenti naturali e comprensione naturale del linguaggio in testi lunghi.
Tecniche di ottimizzazione:
- Utilizzare paragrafi fluidi e descrittivi piuttosto che elenchi strutturati: Sora eccelle nell'analisi del linguaggio naturale
- Enfatizzare i dettagli fisici: gravità, peso, proprietà dei materiali, fluidodinamica
- Descrivere come qualcosa " sembra" - Le descrizioni della consistenza e dei materiali migliorano la fedeltà fisica
- Specificare le proporzioni e la durata
- Dettagli fisici: "Il tessuto pesante ondeggia ad ogni passo, rallentando a causa del proprio peso" produce risultati superiori rispetto a "gonna fluttuante"
Ke Ling Kling (Kuaishou)
Vantaggi: Velocità di generazione rapida, prestazioni di movimento e motricità robuste, eccellente coerenza facciale.
Suggerimenti per l'ottimizzazione:
- Mantieni i prompt concisi: Keli risponde meglio a prompt mirati e orientati all'azione (50-80 parole è l'ottimale)
- Inizia con l'azione: "Un ballerino salta e gira" piuttosto che menzionare il movimento dopo lunghe descrizioni della scena
- Specificare chiaramente la direzione del movimento: "si sposta da sinistra a destra", "si avvicina alla telecamera", "si allontana"
- Keeling eccelle nella gestione dei movimenti umani e delle espressioni facciali: sfruttate questa caratteristica per prompt emotivi ravvicinati
- Le istruzioni relative al movimento della telecamera sono efficaci, ma ogni indicazione dovrebbe mantenere una o due azioni distinte della telecamera.
Significato universale, forma universale / Pista (Gen-3 Alpha / Gen-4)
Tecniche di ottimizzazione per Tongyi Wanshang:
- Supporta l'inserimento diretto di prompt in cinese, producendo risultati superiori rispetto alla traduzione
- Dimostra un'eccellente comprensione degli elementi estetici tradizionali cinesi: acquerello, stile nazionale, scene in costume d'epoca
- Ottiene risultati efficaci con tag di stile concisi e chiari
Tecniche di ottimizzazione Runway:
- Combina descrizioni testuali con tag di stile — Runway possiede una solida comprensione dello stile
- Descrivi il movimento utilizzando vettori spaziali:
movimento da sinistra in basso a destra in alto - Quando si utilizza il Motion Brush, concentrarsi sulla scena e sullo stile complessivi, utilizzando il pennello per perfezionare aree di movimento specifiche
- Runway eccelle nell'interpretazione delle descrizioni dello stile artistico: "nello stile di un film di Terrence Malick" produce risultati eccellenti
- Mantenere l'attenzione sul prompt: generare una scena distinta per ogni prompt piuttosto che sequenze multi-shot
Veo 3(Google DeepMind)
Vantaggi: Comprensione audio, simulazione fisica, qualità cinematografica, sequenze estese.
Tecniche di ottimizzazione:
- Includere descrizioni audio dettagliate: Veo 3 genera audio sincronizzato dal testo
- Descrivere in dettaglio le interazioni fisiche: come gli oggetti si scontrano, i materiali si deformano e la luce interagisce con le superfici
- Utilizzare la terminologia cinematografica: i dati di addestramento di Veo 3 privilegiano fortemente la produzione cinematografica professionale
- Specificare la durata e il ritmo:
la scena si svolge lentamente nell'arco di 10 secondi - Le descrizioni fisiche migliorano significativamente l'impatto:
l'acqua schizza verso l'alto al momento dell'impatto, le goccioline riflettono la luce di fondopiuttosto che semplicemente "schizza"
Per un confronto dettagliato tra Seedance e Sora in termini di interpretazione dei prompt e qualità dell'output, fare riferimento a Confronto tra Seedance e Sora.
Oppure, lascia che sia l'IA a scrivere i prompt per te
Hai appena completato l'apprendimento dell'intero framework per la creazione di prompt video da zero. Questa conoscenza è estremamente preziosa: ti consente di valutare meglio la qualità dei prompt e ti garantisce il controllo completo su ogni dettaglio. Tuttavia, non è necessario scrivere manualmente ogni singolo prompt ogni volta.

Flusso di lavoro ibrido: lascia che l'intelligenza artificiale gestisca la terminologia strutturale e tecnica, quindi aggiungi la tua prospettiva creativa durante la fase di ottimizzazione.
Quando scrivere a mano e quando usare l'intelligenza artificiale
| Scenario | Approccio ottimale |
|---|---|
| Hai una visione creativa precisa e sai esattamente cosa vuoi | Scrittura a mano: sarai più veloce e preciso rispetto alla modifica delle bozze generate dall'IA |
| Hai un'idea di massima ma hai bisogno di una struttura | Generazione IA → Perfezionamento manuale |
| Hai bisogno di generare rapidamente più varianti di prompt | Generazione batch AI → Seleziona e perfeziona il migliore |
| Stai imparando e desideri studiare le strutture dei prompt | Generazione AI → Leggi e analizza: è così che costruisci il tuo vocabolario |
| Hai bisogno di abbinare immagini di riferimento specifiche | Scrittura a mano: descrivi con precisione ciò che vedi nel riferimento |
Flusso di lavoro ibrido (consigliato)
Il flusso di lavoro di scrittura rapida più efficiente combina la generazione tramite IA con il perfezionamento umano:
-
Inizia con l'IA. Vai su Seedance Video Prompt Generator, descrivi la tua idea in una o due frasi, seleziona uno stile e genera.
-
Esamina criticamente il risultato. L'IA genererà un prompt strutturato contenente il linguaggio dei movimenti della telecamera, le tempistiche, l'illuminazione e il suono. Leggilo attentamente. Il movimento della telecamera è in linea con il tono emotivo desiderato? La direzione dell'illuminazione crea l'atmosfera desiderata? Ci sono dettagli che desideri modificare?
-
Ottimizzazione manuale. È qui che entra in gioco la tua conoscenza delle formule, del linguaggio cinematografico e delle parole chiave atmosferiche. Sostituisci le inquadrature selezionate dall'IA con altre che si allineano meglio alla tua visione. Modifica le parole chiave relative all'illuminazione. Aggiungi dettagli specifici che l'IA non è in grado di considerare, come tratti caratteristici dei personaggi, requisiti specifici del marchio e sfumature emotive.
-
Genera il video. Invia il prompt ottimizzato al generatore di video. I risultati saranno di gran lunga superiori rispetto ai prompt completamente manuali creati da principianti o ai prompt generati interamente dall'intelligenza artificiale e non controllati.
Una guida completa all'utilizzo dei generatori di prompt AI è disponibile nella Guida al generatore di prompt video AI.
Effetti cinematografici: padronanza attraverso l'integrazione
Creiamo un prompt finale che utilizzi tutto ciò che è stato trattato in questa guida (formule, linguaggio cinematografico, parole chiave evocative, sound design) per produrre un effetto davvero cinematografico.
Brief creativo: Un astronauta solitario scopre forme di vita vegetale su Marte.

I suggerimenti cinematografici completamente specificati producono risultati come se fossero diretti da un regista, perché in effetti lo sono. Ogni elemento è al servizio della narrazione.
Prompt completo:
Subject: A solitary astronaut in a dusty, sun-bleached EVA suit — visor partially reflective, scratched from use, mission patches barely legible. The suit is not pristine Hollywood white; it is a working tool, weathered by months on the Martian surface.
Action: The astronaut crouches beside a small crack in the rust-red basalt. Inside the crack, a single tiny green sprout — two delicate leaves, almost translucent — pushes up through the red soil. The astronaut's gloved hand reaches toward it, hesitates, trembles slightly, then gently touches the soil beside it.
Environment: The Martian surface — a flat, rust-red plain scattered with dark basalt rocks, stretching to low eroded hills on the horizon. The sky is a pale butterscotch-pink. Dust devils move in the far distance. The scene feels vast and achingly empty — except for this one tiny green thing.
Camera: Opens with an extreme wide shot — the astronaut is a small figure in the immense Martian landscape. Slow dolly in over 4 seconds to a medium shot. As the astronaut crouches, camera drops to ground level and continues to a close-up of the gloved hand and the sprout. Rack focus: pull from the hand to the astronaut's visor, where we see the sprout's reflection. 65mm lens, anamorphic.
Lighting: Late Martian afternoon — low sun from camera-right, casting long amber-red shadows. The side light sculpts the EVA suit's texture. The sprout's translucent leaves glow with subsurface scattering as sunlight passes through them — the only green in a world of red. Volumetric dust particles drift through the light beam.
Style: Ridley Scott's The Martian meets Terrence Malick's The Tree of Life. Cinematic, anamorphic, muted Martian color palette with the single point of vivid green as deliberate contrast. Subtle film grain.
Sound: Wind — thin, high-pitched Martian wind, unlike Earth wind. The astronaut's breathing inside the suit — measured at first, then quickening. A single sustained low note from a cello enters as the hand reaches for the sprout. No dialogue. No narration.Un astronauta solitario, vestito con una tuta EVA incrostata di polvere e sbiadita dal sole: la visiera è semiriflettente, presenta graffi dovuti all'uso e la toppa della missione è appena distinguibile. Questa tuta non è del candido bianco hollywoodiano; è uno strumento di lavoro, consumato da mesi sulla superficie marziana. Accovacciato accanto a una stretta fessura nel basalto rosso ruggine, l'astronauta osserva un minuscolo germoglio verde, due foglie delicate e quasi traslucide, che spuntano dal terreno cremisi. Una mano guantata si allunga, esita, trema leggermente, poi tocca delicatamente la terra accanto ad esso.
Questo prompt incorpora tutti e sette gli elementi formali, il linguaggio cinematografico specifico (campo lunghissimo, carrellata, spostamento focale), parole chiave atmosferiche (illuminazione volumetrica, diffusione subsuperficiale, lente anamorfica), sound design (vento ambientale, suoni di respiro, nota solitaria di violoncello) e riferimenti stilistici (Ridley Scott, Terrence Malick). Ogni dettaglio è al servizio dell'arco emotivo: solitudine → scoperta → stupore.
Questo è il progetto di ingegneria video prompt.
Domande frequenti
Quanto dovrebbero durare i prompt video dell'IA?
Non esiste uno standard universale per la lunghezza. La lunghezza appropriata dipende dalla complessità del concetto creativo e dalla piattaforma utilizzata. Il livello V1 (15-30 parole) produce risultati universali su qualsiasi piattaforma. Il livello V2 (50-80 parole) rappresenta l'intervallo ottimale per la maggior parte delle piattaforme: sufficientemente specifico senza sovraccaricare il modello. Il livello V3 (100-200 parole) produce i risultati più controllabili su piattaforme che supportano prompt lunghi, come Seedance e Sora. Quando si utilizza Keeling, mantenere circa 50-80 parole. La metrica critica non è il conteggio delle parole, ma se ogni elemento della formula è trattato in modo completo.
È indispensabile conoscere la fotografia per creare video efficaci?
Non è essenziale, ma comprenderlo sarà estremamente utile e questa guida ti ha appena insegnato le nozioni fondamentali. Non è necessario avere una laurea in cinema; ciò che serve è conoscere i nomi di 10-15 tipi di movimenti della telecamera, comprendere l'impatto emotivo dei diversi stili di illuminazione e possedere il vocabolario per descrivere l'atmosfera. Aggiungi ai preferiti le sezioni su Linguaggio cinematografico e Libreria di parole chiave sull'atmosfera e consultale ripetutamente fino a quando questi termini non diventeranno naturali.
È possibile utilizzare lo stesso prompt su diverse piattaforme video AI?
Certamente, la formula universale si applica universalmente. Tuttavia, ogni piattaforma interpreta i prompt in modo diverso. I prompt ottimizzati per Sora (lunghi, fluidi, che enfatizzano la fisica) potrebbero richiedere una ristrutturazione per Ke Ling (più brevi, incentrati sull'azione). La sezione Tecniche specifiche per piattaforma descrive in dettaglio come adattarli. La formula di base rimane invariata, solo il formato di consegna viene personalizzato.
Cosa distingue questa guida dalla guida rapida Seedance?
La Guida ai prompt Seedance è specifica per la piattaforma: ti insegna il formato dello storyboard di Seedance, i riferimenti alle immagini e oltre 50 prompt pronti all'uso. Questa guida è universale: ti insegna le competenze di base per la scrittura di prompt applicabili a qualsiasi piattaforma. Considera questa guida come il tuo libro di testo e la guida Seedance come il tuo manuale pratico per uno strumento specifico.
Come descrivere il movimento della telecamera se non si ha familiarità con la terminologia cinematografica?
Descrivi innanzitutto ciò che desideri che il pubblico veda e provi. "La telecamera si avvicina lentamente al volto del soggetto" è una carrellata in "La telecamera segue la persona che cammina lateralmente" è una ripresa in movimento. Le piattaforme AI comprendono abbastanza bene le descrizioni in linguaggio naturale. Tuttavia, l'apprendimento della terminologia tecnica (utilizzando il [riferimento al linguaggio dei movimenti della telecamera](#arma segreta del linguaggio dei movimenti della telecamera) sopra riportato) produce risultati significativamente migliori, poiché i modelli AI sono addestrati su video descritti utilizzando questi termini professionali.
È opportuno includere i suggerimenti inversi (cosa non includere)?
Alcune piattaforme supportano i prompt inversi, ovvero istruzioni che specificano cosa evitare. Questi possono rivelarsi utili: "Nessuna sovrapposizione di testo, nessuna filigrana, nessun fotogramma sfocato". Tuttavia, la maggior parte dei moderni generatori di video basati sull'intelligenza artificiale gestisce i problemi di qualità in modo più efficace attraverso specifiche positive. Invece di scrivere "nessuna illuminazione scadente", specificare "illuminazione Rembrandt dalla sinistra della telecamera". Invece di "nessuna ripresa mossa", specificare "movimento fluido della steadicam". I prompt positivi guidano l'IA verso il risultato desiderato; i prompt negativi si limitano a indicare cosa evitare, lasciando le alternative al caso.
Come mantenere la coerenza dei personaggi in più prompt?
Mantenere la coerenza dei personaggi attraverso più generazioni di video AI rappresenta uno degli aspetti più impegnativi della scrittura di prompt. Tre strategie si dimostrano utili: (1) Utilizzare una descrizione del personaggio estremamente specifica, ripetendola parola per parola tra i prompt: "una donna sulla trentina, giapponese, capelli lunghi neri, cappotto oversize in lana color carbone, dolcevita color crema". (2) Utilizzare flussi di lavoro da immagine a video: caricare immagini di riferimento dei personaggi per l'animazione AI. Seedance supporta questa funzione tramite riferimenti @Image. (3) Generare tutti i clip per lo stesso personaggio in un'unica sessione, quando possibile, utilizzando seed o impostazioni di stile identici.
Esiste uno strumento che mi aiuti a scrivere i suggerimenti per i video?
Sì. Il Video Prompt Generator di Seedance accetta descrizioni in linguaggio naturale per generare prompt completamente strutturati per la lista delle riprese, che comprendono il linguaggio dei movimenti della telecamera, le tempistiche, l'illuminazione e il sound design. Per una guida operativa dettagliata, consultare la Guida al Video Prompt Generator AI. Flusso di lavoro consigliato: generazione AI → perfezionamento manuale → produzione video.
Inizia oggi stesso a scrivere prompt video migliori
Ora disponi di un kit di strumenti completo: la formula dei sette elementi, un riferimento linguistico cinematografico che comprende oltre 15 tecniche di movimento della telecamera, una libreria di parole chiave quadridimensionale che copre più di 50 termini, cinque esempi progressivi che illustrano l'evoluzione dagli standard di base a quelli cinematografici, la metodologia di progettazione del suono e le tecniche di ottimizzazione specifiche per piattaforma.
Il divario tra i video realizzati con l'intelligenza artificiale amatoriale e quelli professionali non risiede negli strumenti, ma nei prompt. E la scrittura dei prompt è un'abilità che migliora con la pratica.
Tre modi per iniziare:
-
Esercitati con la formula. Scegli un argomento qualsiasi, redigi le bozze V1 → V2 → V3. Confronta i risultati. Il miglioramento sarà immediato e significativo.
-
Utilizza un generatore di prompt. Lascia che sia l'IA a occuparsi della struttura, poi applica le tue conoscenze sui movimenti della telecamera e sull'atmosfera per perfezionare il risultato. Prova il generatore di prompt video →
-
Crea il tuo primo video. Scegli il tuo prompt migliore e crea subito un video. Apri il generatore di video →
Ispirazione più immediata ed esempi pronti all'uso:
- 10 suggerimenti pratici per i video AI — Suggerimenti testati con iterazioni V1→V2→V3
- Guida completa all'AI da testo a video — Comprendere la tecnologia alla base degli strumenti
- Guida al generatore di prompt video AI — Lascia che sia l'AI a creare i prompt per te
- Guida ai prompt Seedance — Oltre 50 prompt specifici per Seedance
Il miglior video AI che potrai mai creare inizia con il prossimo prompt che scriverai.

