Guia de redação de prompts de vídeo com IA: do iniciante à qualidade cinematográfica

Feb 22, 2026

TL;DR

Vídeos de IA excelentes resultam de prompts excelentes. Este guia ensina uma fórmula universal para prompts de vídeo — uma estrutura de sete elementos aplicável a todas as principais plataformas de vídeo de IA:

[Assunto] + [Ação] + [Cenário] + [Movimento da câmara] + [Iluminação] + [Estilo] + [Som]

Irá aprender: As principais razões pelas quais ocorrem falhas imediatas (e como corrigi-las instantaneamente), uma referência abrangente da linguagem da câmara que engloba mais de 15 técnicas de movimento da câmara, uma biblioteca de palavras-chave atmosféricas organizada em quatro dimensões: iluminação, paleta de cores, textura e ambiente, cinco exemplos progressivos de prompts, desde o básico até à qualidade cinematográfica, como incorporar o design de som nos prompts e técnicas de otimização específicas para as plataformas Seedance, Sora, Kling, Runway e Veo 3.

Isto não é um tutorial sobre ferramentas, mas sim uma metodologia. As competências de escrita de prompts de vídeo são transferíveis entre plataformas; aprenda-as uma vez e aplique-as em qualquer lugar.

Sugestões geradas automaticamente →

Demonstração contrastante: prompts vagos de vídeo com IA produzem resultados genéricos e sem graça, enquanto prompts estruturados e com qualidade cinematográfica produzem vídeos com qualidade profissional.

O mesmo conceito, mas resultados totalmente diferentes. A sugestão à esquerda diz: «Uma mulher a caminhar na chuva». A sugestão à direita especifica o movimento da câmara, a direção da iluminação, a atmosfera e o som — aos quais o modelo de IA responde com qualidade cinematográfica.


Por que a maioria das sugestões de vídeo com IA falham (e como corrigi-las)

Independentemente do gerador de vídeo de IA que você usa — Seedance, Sora, Keeling, Runway ou Veo 3 —, o princípio básico permanece o mesmo: quanto mais preciso e estruturalmente completo for o seu texto de entrada, mais controlável e cinematográfico será o resultado. A maioria das pessoas escreve prompts como se estivesse a descrever uma fotografia a um amigo, mas o vídeo não é uma fotografia. O vídeo envolve movimento, tempo, comportamento da câmara, evolução atmosférica e som.

Abaixo estão as cinco razões mais comuns para falhas imediatas, cada uma acompanhada de uma solução imediata.

  1. Muito vago — o problema do «belo pôr do sol»

A falha mais comum. Escreve-se «um belo pôr do sol à beira-mar» e recebe-se um trecho tecnicamente preciso, mas emocionalmente vazio, que se assemelha a protetores de ecrãs comuns.

A questão não é que a IA não consiga reproduzir um pôr do sol, mas que «beleza» e «pôr do sol» são as únicas informações que você forneceu. Tendo encontrado milhões de pores do sol nos seus dados de treino, a IA seleciona a média estatística — e a média, por sua própria natureza, é a mediocridade.

Antes da modificaçãoApós a modificação
Um belo pôr do sol sobre o oceanoA luz do pôr do sol se espalha pela costa tranquila do Pacífico, as ondas batem nas rochas vulcânicas, o sol está a dois dedos de distância acima do horizonte, o céu muda de um tom âmbar profundo no horizonte para um rosa salmão e, no zénite, para um lavanda claro, com longas sombras se estendendo em direção à câmara o sol suspenso a dois dedos acima do horizonte, o gradiente do céu mudando de âmbar profundo no horizonte para rosa salmão e lavanda pálida no zénite, longas sombras estendendo-se em direção à câmara)

Método de correção: Substitua os adjetivos («bonito», «incrível», «deslumbrante») por detalhes específicos e observáveis — cor, posição, textura, relações espaciais.

  1. Ausência de instruções de movimento — problemas com imagens estáticas

Você escreveu uma descrição de cena ricamente detalhada, mas a IA gerou uma imagem que parece uma fotografia com um leve efeito push-pull — porque você descreveu um momento, não um movimento.

O vídeo depende do tempo. Sem instruções explícitas de movimento, a IA recorre à interpretação mais conservadora: progressão lenta ou ligeiro paralaxe. Tecnicamente, trata-se efetivamente de «vídeo», mas não é o que se deseja.

| Antes da modificação | Após a modificação | |--------|------- -| | Um carro desportivo vermelho vintage estacionado numa estrada de montanha, manhã enevoada, cinematográfico (一辆复古红色跑车停在山路上,薄雾清晨,电影感) | Um Porsche 911 vermelho vintage acelera por uma estrada sinuosa de montanha, os pneus agarram-se ao asfalto molhado, o nevoeiro dispersa-se à volta da carroçaria, a câmara acompanha ao nível do pára-choques, as árvores passam desfocadas em primeiro plano |

Método de correção: Cada vídeo requer pelo menos um verbo que descreva o movimento físico do sujeito e uma frase que descreva o movimento da câmara. O sujeito está em movimento e a câmara está em movimento — juntos, eles criam energia visual.

3. A diretiva contraditória — O paradoxo «close-up + plano geral»

Essa situação é mais comum do que se imagina, especialmente quando as pessoas juntam termos cinematográficos que ouviram, mas não compreendem totalmente. «Close-up extremo de uma mulher atravessando um vasto deserto, enquadramento completo, sensação épica» contém duas diretrizes composicionais conflitantes. A IA tentará obter uma média, produzindo uma imagem que não é nem próxima nem distante, apenas caótica.

Antes da revisãoApós a revisão
Close-up de uma mulher atravessando um vasto deserto, plano geral amplo, escala épicaGrande plano dos olhos de uma mulher refletindo a luz do deserto, partículas de areia captando o sol do entardecer em seus cílios, profundidade de campo rasa com o vasto campo de dunas desfocado em um gradiente âmbar atrás dela (Olhos da mulher em grande plano, refletindo a luz do deserto; partículas de areia captando o sol do entardecer em seus cílios; profundidade de campo rasa transformando as dunas expansivas atrás dela num gradiente âmbar)

Método de correção: Selecione uma posição de câmara por tomada. Se precisar de grandes planos e planos gerais, escreva duas tomadas separadas e conecte-as com uma transição. Para sequências com várias tomadas, plataformas como o Seedance suportam o formato de linha do tempo do storyboard, permitindo que especifique cada tomada independentemente.

  1. Falta de atmosfera — Um vácuo de luz, sombra e emoção

A sua sugestão descreve um sujeito realizando uma ação em um local específico. Isso abrange três das sete dimensões. Sem orientações sobre iluminação, paleta de cores, efeitos atmosféricos ou direção estilística, a IA preencherá as lacunas com padrões neutros: iluminação plana e uniforme; cores suaves; e nenhum clima específico. O resultado se assemelha a imagens de vigilância em alta definição.

| Antes da revisão | Após a revisão | |--------|------- -| | Um homem sentado sozinho num café | Um homem na casa dos quarenta está sentado sozinho numa mesa escura num canto, a luz âmbar quente de um único candeeiro suspenso refletindo o vapor que sobe da sua chávena de café, a chuva escorrendo pela janela atrás dele projetando sombras onduladas no seu rosto, paleta de cores suaves em tons de azul-petróleo e cobre, atmosfera melancólica |

Método de correção: Incorpore a direção da luz, a temperatura da cor, os efeitos atmosféricos (neblina, chuva, poeira, vapor) e palavras que transmitam emoção. Essas quatro adições transformam «uma cena» em «uma sensação».

  1. Ausência de design de som — O problema dos filmes mudos

Até 2026, a maioria das plataformas de vídeo com IA suportará a geração de áudio — música de fundo, efeitos sonoros ambientais e até mesmo diálogos com sincronização labial. No entanto, as instruções que a maioria das pessoas escreve permanecem totalmente silenciosas, pois tratam as instruções de vídeo apenas como instruções visuais.

O som constitui metade da experiência. Uma cena na floresta sem o canto dos pássaros e o farfalhar das folhas parece artificial. Sequências de ação sem sons de impacto parecem insubstanciais. Demonstrações de produtos sem música parecem apresentações em PowerPoint.

| Antes da modificação | Após a modificação | |------- -|--------| | Um gato a saltar de uma estante para um sofá | Um gato ruivo salta graciosamente do topo de uma estante alta de carvalho, esticando o corpo no ar e aterrando suavemente numa almofada de veludo do sofá, que se comprime sob o seu peso. Som: impacto suave das patas no tecido, um único livro a deslizar na estante, som ambiente silencioso com chuva distante contra as janelas Som: impacto suave das patas no tecido, um único livro a deslizar na prateleira, ruído ambiente silencioso com chuva distante contra as janelas) |

Solução: Adicione uma linha de instruções de áudio no final do prompt, especificando o estilo da música de fundo, os efeitos sonoros ambientais e qualquer diálogo ou narração. Fornecemos orientações detalhadas na [secção Design de som](#Incorporando design de som nos prompts) abaixo.


Fórmula universal para solicitação de vídeo

Independentemente da plataforma que utiliza, todos os prompts de vídeo eficazes contêm os mesmos sete elementos. Alguns são essenciais (obrigatórios em todos os prompts), enquanto outros são opcionais (aumentam a eficácia, mas não são obrigatórios). A fórmula:

[Assunto] + [Ação] + [Ambiente] + [Câmara] + [Iluminação] + [Estilo] + [Som]

Diagrama visual detalhado dos sete elementos de uma fórmula universal para criação de vídeos, ilustrando os elementos tema, ação, cenário, movimento da câmara, iluminação, estilo e som, juntamente com palavras-chave de exemplo.

Os sete elementos-chave de uma fórmula universal de prompt de vídeo. Cada elemento adiciona uma dimensão adicional de controlo ao resultado final.

A seguir, analisaremos cada elemento individualmente, acompanhado de uma biblioteca de palavras-chave e frases de exemplo.

Elemento Um: Assunto (Obrigatório)

O sujeito é o objeto do olhar do público. Esta deve ser a parte mais específica da sugestão — não «uma mulher», mas «uma mulher na casa dos sessenta, com cabelos grisalhos presos num coque solto, rugas profundas nos cantos dos olhos, vestindo um avental de ganga desbotado».

Biblioteca de palavras-chave:

| Categoria | Exemplo (prompt em inglês) | |------|------------------ -| | Personagens | um jovem na casa dos vinte anos, uma mulher idosa, uma criança com cerca de cinco anos, uma dançarina, um chef, um soldado | | Animais | um golden retriever, um leopardo-das-neves, um beija-flor, um peixe koi, uma borboleta monarca | | Objetos | uma máquina de escrever vintage, um frasco de perfume de cristal, um diário com capa de couro, um vaso de cerâmica | | Veículos | uma motocicleta preta fosca, um veleiro de madeira, uma carrinha pickup desgastada, um comboio de alta velocidade | | Abstrato | partículas de luz, gotículas de tinta na água, formas geométricas, metal líquido |

Exemplos de frases:

  • «Uma barista na casa dos trinta, com tatuagens nas mangas e um avental preto coberto de farinha»
  • Uma bússola de bronze desgastada aberta sobre uma carta náutica - Milhares de lanternas de papel, cada uma brilhando com uma luz âmbar quente proveniente de uma vela no seu interior

Elemento Dois: Ação (Obrigatório)

A ação é o que se desenrola — o que o sujeito está a fazer e como a cena evolui ao longo do tempo. Isso marca a linha divisória entre prompts de vídeo e prompts de imagem. Sem ação, você fica com nada mais do que uma fotografia em movimento.

Biblioteca de palavras-chave:

| Tipo de movimento | Exemplo (prompt em inglês) | |--------- -|-------------------| | Movimento humano | caminhar, correr, virar lentamente, esticar o braço, inclinar-se para a frente, expirar, piscar | | Relativo ao movimento da câmara | aproximar-se da câmara, afastar-se da câmara, atravessar o enquadramento da esquerda para a direita | | Movimento de objetos | girar, cair, flutuar, quebrar, montar, desdobrar, derreter | | Movimento ambiental | vento soprando na relva, nuvens passando, chuva caindo, folhas caindo, maré subindo | | Processos de transição | dia virando noite, flor desabrochando, gelo se formando, tinta se espalhando, luz mudando |

Exemplos de frases:

  • «Lentamente, ela se abaixa e apanha uma folha de outono caída, girando-a entre os dedos»
  • A agulha da bússola treme, depois oscila decididamente para o norte
  • As lanternas levantam-se uma a uma do chão, subindo para o céu escuro a diferentes velocidades

Elemento três: Ambiente (essencial)

O cenário é o local onde a cena se desenrola. Descreva tanto o cenário imediato (primeiro plano) como o contexto mais amplo. Inclua o tempo, a hora do dia e a estação do ano, quando relevante.

Biblioteca de palavras-chave:

| Tipo de cena | Exemplo (prompt em inglês) | |----------|------------------ -| | Natureza | floresta densa, dunas do deserto, falésia oceânica, prado alpino, praia vulcânica, bosque de bambu | | Urbano | beco estreito de Tóquio, praça de betão brutalista, jardim no telhado, plataforma do metro, avenida iluminada por néons | | Interior | biblioteca à luz de velas, loft industrial, estufa, câmara escura vintage, átrio de mármore | | Fantasia | ilhas flutuantes, caverna de cristal, recife bioluminescente, templo em ruínas, cidade nas nuvens | | Tempo/Clima | crepúsculo antes do amanhecer, meio-dia nublado, tempestade, primeira neve, noite úmida de verão |

Exemplos de frases:

  • «Numa rua estreita de Quioto, lanternas de pedra alinhadas em ambos os lados, pétalas de cerejeira flutuando sobre os paralelepípedos molhados»
  • «Dentro de uma catedral abandonada e cavernosa, feixes de luz empoeirados penetram através dos vitrais partidos»
  • «À beira de um penhasco vulcânico na hora azul, vapor sulfuroso a subir das fendas na rocha negra»

Elemento Quatro: Trabalho de Câmera (Importante)

As instruções de direção da câmara orientam o público da IA sobre como perceber uma cena, abrangendo a composição (quão perto), o ângulo (de onde) e o movimento (como o ponto de vista muda ao longo do tempo). A linguagem da câmara representa a alavanca mais crítica para melhorar a qualidade do prompt — exploramos isso em profundidade na secção dedicada abaixo.

Biblioteca rápida de palavras-chave:

| Aspecto | Terminologia em inglês e equivalente em chinês | |------|------------------ -| | Enquadramento | grande plano, plano próximo, plano médio, plano geral, plano aberto, plano muito aberto (plano geral extremo) | | Ângulo | nível dos olhos, ângulo baixo, ângulo alto, vista aérea, vista inferior, ângulo holandês | | Movimento | dolly para dentro/fora, panorâmica para a esquerda/direita, inclinação para cima/baixo, travelling, órbita, grua (elevação) | | Lente | grande angular de 24 mm, padrão de 50 mm, retrato de 85 mm, teleobjetiva de 200 mm, lente macro, anamórfica |

Elemento Cinco: Iluminação (Importante)

A luz e a sombra definem o clima de cada quadro. Os fotógrafos profissionais passam horas a ajustar a iluminação. Na escrita rápida, algumas palavras precisas podem exercer o mesmo nível de controlo.

Biblioteca de palavras-chave:

| Tipo de iluminação (inglês/chinês) | Efeitos visuais | |--------------------- -|----------| | Hora dourada | Tons quentes, sombras longas, tons laranja-âmbar, favorecedores para retratos | | Hora azul | Tons frios, atmosfera melancólica, céu azul profundo com calor persistente no horizonte | | Contraluz | Contornos definidos, efeito de silhueta, separação nítida do fundo | | Luz lateral | Rosto meio iluminado, meio sombreado; alto contraste, efeito dramático | | Iluminação Rembrandt | Realce triangular sob o olho sombreado; efeito clássico de retrato | | Iluminação volumétrica | Feixes visíveis a penetrar poeira, névoa ou fumo | | Efeito Tyndall | Dispersão da luz dentro das partículas, produzindo feixes distintos dentro da névoa ou poeira | | Neon | Fontes de luz artificial colorida, reflexos em superfícies molhadas, estética cyberpunk |

Elemento Seis: Estilo (Recomendado)

O estilo determina a linguagem visual empregada pela IA — cinema, realismo documental, animação, pintura a óleo ou outros. Sem uma declaração de estilo, a IA usa por padrão um estilo realista genérico.

Biblioteca de palavras-chave:

| Estilo (inglês/chinês) | Características visuais | |----------------- -|----------| | Cinematográfico | Profundidade de campo reduzida, gradação de cores de qualidade cinematográfica, proporção de ecrã panorâmico 2,39:1 | | Documentário | Sensação de câmara portátil, iluminação natural, enquadramento observacional | | Comercial | Limpo, brilhante, focado no produto, iluminação precisa, movimento suave | | Anime | Estilo cell-shaded, cores vibrantes, movimento exagerado, linhas dinâmicas | | Filme noir | Monocromático de alto contraste, sombras de persianas venezianas, iluminação discreta | | Tinta aquarela | Tinta preta sobre fundo branco, gradientes fluidos, minimalismo, estética oriental | | Filme vintage | Grão de filme, ligeiramente desaturado, tons quentes, bordas com foco suave | | Cyberpunk | Neon intenso, alto contraste, elementos holográficos, sensação apocalíptica urbana |

Elemento Sete: Som (Opcional)

O som adiciona uma dimensão auditiva. Embora nem todas as plataformas suportem a geração de áudio, incorporar o design de som nas instruções não é apenas inovador, mas muitas vezes aumenta o impacto visual, já que a IA utiliza pistas de áudio para influenciar o tom emocional e o ritmo dos visuais.

Biblioteca de palavras-chave:

Tipo de somExemplo (prompt em inglês)
Estilo musicalorquestral, hip hop lo-fi, eletrónica ambiente, piano jazz, guitarra acústica, trilha sonora cinematográfica (trilha sonora de filme)
Efeitos sonoros ambientaischuva no vidro, vento nas árvores, ruído do trânsito da cidade, ondas do mar, crepitar do fogo
Efeitos sonoros de açãopassos em cascalho, porta rangendo, vidro se estilhaçando, motor acelerando
Vozesnarração sussurrada, diálogo, respiração, risadas

Linguagem cinematográfica: a arma secreta

A linguagem cinematográfica é a competência mais influente que pode cultivar como redator de prompts de vídeo. Quando escreve «dolly in slowly» em vez de «zoom in», está a falar a linguagem nativa dos modelos de IA — pois esses modelos são treinados com milhões de horas de filmagens profissionais, nas quais os movimentos da câmara possuem nomes específicos e efeitos visuais distintos.

Esta secção serve como um guia de referência abrangente. Recomendamos que a adicione aos seus favoritos.

Guia de referência sobre movimentos de câmara Ilustra os nomes, trajetórias e efeitos emocionais de doze movimentos distintos de câmara, incluindo: planos de aproximação/afastamento, planos panorâmicos, planos de acompanhamento, planos com dolly, planos elevados e planos com câmara na mão.

Os movimentos da câmara não são intercambiáveis — cada um produz um efeito emocional distinto. Conhecer a terminologia correta transformará o impacto das suas instruções.

Cinematografia essencial

Dolly In / Dolly Out (plano de aproximação / plano de afastamento)

A câmara aproxima-se fisicamente do objeto (push) ou afasta-se (pull). Ao contrário do zoom, a perspetiva muda – os objetos em primeiro plano parecem proporcionalmente maiores, criando uma sensação de profundidade e proximidade física.

  • Efeito emocional: Empurra para promover intimidade, foco e revelação. Puxa para evocar isolamento, contexto e separação.
  • Quando usar: Empurre para close-ups emocionais, momentos de personagens e detalhes reveladores. Afasta-se para demonstrar escala, concluir ou retirar-se do assunto.
  • Frase-chave: «A câmara aproxima-se lentamente de um plano médio para um grande plano das mãos do sujeito».

Panorâmica para a esquerda / Panorâmica para a direita (panorâmica horizontal)

A câmara permanece imóvel, rodando horizontalmente como se estivesse a virar a cabeça. O ponto de vista percorre toda a cena.

  • Efeito emocional: Exploração, descoberta, movimento lateral de acompanhamento, ligação de dois elementos dentro de uma cena.
  • Quando usar: Mostrar paisagens, acompanhar personagens em movimento, demonstrar amplitude espacial.
  • Frase de sugestão: Panorâmica lenta à direita pela oficina, revelando fileiras de instrumentos artesanais na parede

Inclinação para cima/para baixo (panorâmica/inclinação vertical)

A câmara permanece imóvel, rodando verticalmente, como se estivesse a acenar com a cabeça. Uma panorâmica para cima revela a altura; uma panorâmica para baixo mostra os detalhes ao nível do solo.

  • Efeito emocional: Uma inclinação para cima evoca admiração, grandiosidade e desejo. Uma inclinação para baixo cria uma sensação de estabilidade, descoberta e intimidade com a superfície.
  • Quando usar: Uma inclinação para cima é usada para estruturas imponentes, personagens que se levantam ou para revelar o céu. As inclinações para baixo revelam objetos sobre uma mesa ou a transição do céu para o solo.
  • Frase de sugestão: «A câmara inclina-se para cima a partir das raízes da árvore antiga, seguindo o tronco maciço até à copa».

Tomada em movimento (tomada de acompanhamento/tomada lateral em movimento)

A câmara move-se ao lado do objeto, mantendo uma distância e um ângulo constantes, como se estivesse montada numa calha paralela ao percurso do objeto.

  • Efeito emocional: Companheirismo, viagem, imersão. O público viaja ao lado do sujeito.
  • Quando usar: Para personagens que caminham ou correm lado a lado, atravessam espaços ou exibem produtos ao longo de superfícies.
  • Frase de sugestão: «A câmara acompanha a corredora à altura dos ombros, mantendo o ritmo enquanto ela corre pelo beco».

Órbita / Arco (Toma Circular)

A câmara gira em torno do objeto, mantendo-o centralizado no enquadramento. Isso pode envolver uma rotação completa de 360 graus ou um arco parcial.

  • Efeito emocional: Presença heróica, sensação de poder, qualidade de vitrine, exibição tridimensional.
  • Quando usar: Vitrines de produtos (exibindo todos os ângulos), fotos heroicas, apresentações dramáticas de personagens, momentos decisivos.
  • Frase de prompt: A câmara orbita 180 graus em torno do jogador de xadrez, começando por trás e terminando de frente

Crane Up / Crane Down (Câmera elevada / Câmera com braço articulado)

O movimento vertical da câmara — elevação ou abaixamento físico — é normalmente combinado com a inclinação para manter o objeto dentro do enquadramento.

  • Efeito emocional: A ascensão cria uma sensação de transcendência, libertação e perspectiva ampliada. A descida promove uma sensação de estabilidade, de chegada e de atenção focada.
  • Quando usar: A ascensão é empregada para conclusões, momentos de triunfo e transições para perspectivas aéreas. As tomadas descendentes são utilizadas para aberturas, chegadas e transições de tomadas amplas para composições íntimas.
  • Frase de sugestão: «A câmara sobe do nível do solo, elevando-se acima da multidão, revelando a escala total do festival».

Portátil (lente portátil)

A lente apresenta uma ligeira oscilação orgânica, não estando montada num tripé ou estabilizador. Isto simula a sensação de um fotógrafo humano a segurar a câmara com as mãos.

  • Efeito emocional: Imediatismo, urgência, autenticidade documental, tensão, intimidade.
  • Quando usar: Sequências de ação, diálogos emocionais, estilos documentais, filmes de terror, qualquer cena que exija uma sensação de imersão.
  • Frase de sugestão: «Câmara portátil segue a personagem pelo mercado lotado, ligeiramente instável».

Steadicam / Gimbal (Steadicam/Lente estabilizadora)

Movimentos suaves e flutuantes da câmara deslizam pelo espaço. Ao contrário das filmagens feitas com a câmara na mão, não há tremulação — o movimento é fluido e contínuo.

  • Efeito emocional: Exploração onírica, elegante, imersiva e relaxante.
  • Quando usar: Navegar por espaços arquitetónicos, seguir personagens por ambientes complexos, filmagens em plano único, cinematografia luxuosa e estética.
  • Frase de sugestão: «A Steadicam desliza atrás da dançarina enquanto ela se move pelo salão de baile vazio».

Técnicas avançadas de movimento de câmara

Zoom Hitchcock (Dolly Zoom / Efeito Vertigo)

À medida que a câmara aproxima o zoom, a distância focal aumenta (ou vice-versa). O objeto permanece com o mesmo tamanho, enquanto o fundo sofre uma distorção dramática — seja alongando-se ou comprimindo-se.

  • Efeito emocional: Desorientação, epifania, pavor, o mundo a mudar em torno de um ponto fixo.
  • Frase de sugestão: Zoom dolly no rosto da personagem — a câmara aproxima-se enquanto a lente afasta, o fundo estende-se, criando um efeito de vertigem

Whip Pan

Panorâmica horizontal extremamente rápida, resultando em todo o quadro aparecer desfocado durante o movimento. Comumente empregada como transição entre duas cenas.

  • Efeito emocional: Energia, surpresa, urgência, timing cômico.
  • Frase de referência: Panorâmica rápida do rosto do orador para a reação do público, com desfoque de movimento durante a transição

Foco em rack (Pull Focus)

O foco muda de um plano de profundidade para outro dentro de uma única imagem. O primeiro plano fica desfocado enquanto o fundo fica nítido, ou vice-versa.

  • Efeito emocional: Redireciona a atenção, revela informações, conecta elementos em primeiro e segundo plano.
  • Frase de prompt: Mude o foco das flores desfocadas em primeiro plano para o rosto da mulher em segundo plano

Ângulo holandês (ângulo inclinado)

A lente inclina-se ao longo do eixo de rotação, criando um horizonte diagonal. O mundo parece distorcido.

  • Efeito emocional: Desconforto, instabilidade, tensão, drama estilizado, frenesi.
  • Frase de sugestão: «Close-up em ângulo holandês do rosto do detetive, inclinação de 15 graus, iluminação lateral forte».

Rampa de velocidade (rampa de tempo)

A velocidade de reprodução varia dentro de uma única cena — normalmente diminuindo em momentos cruciais antes de acelerar novamente.

  • Efeito emocional: Ênfase, impacto, conferindo peso dramático a momentos específicos.
  • Frase de prompt: «O movimento acelera para câmera lenta no momento do impacto, depois acelera de volta ao tempo real».

One-Take (Long Take)

Filmagem contínua sem edição. A câmara atravessa espaços, segue movimentos e descobre elementos, mantendo uma única perspetiva ininterrupta ao longo de todo o filme.

  • Impacto emocional: Experiência imersiva em tempo real, sensação de domínio técnico, aumento sustentado da tensão.
  • Frase de sugestão: «Filmagem contínua em uma única tomada: a câmara entra pela porta da frente, desliza pelo corredor e chega ao jardim».

Primeira pessoa / POV

A câmara representa os olhos da personagem. O público vê o que a personagem vê, incluindo as suas mãos a entrarem no enquadramento.

  • Efeito emocional: Imersão total, experiência subjetiva, estética do jogo.
  • Frase de prompt: Perspetiva em primeira pessoa: as mãos empurram uma pesada porta de madeira, revelando um prado ensolarado

Para conhecer os recursos exclusivos de controle de câmera do Seedance e saber como combiná-los na linha do tempo do storyboard, consulte o Guia de prompts do Seedance.


Biblioteca de palavras-chave sobre atmosfera

A atmosfera é a chave para transformar um vídeo tecnicamente perfeito numa obra emocionalmente comovente. É a diferença entre «uma sala» e «uma sala que te faz sentir algo». Esta biblioteca de palavras-chave está organizada em quatro dimensões — iluminação, paleta de cores, textura e ambiente —, permitindo-te misturar e combinar para criar exatamente a sensação que desejas.

Tabela de referência de palavras-chave para vídeos com IA para criar atmosfera, categorizada em quatro dimensões: iluminação, tom de cor, textura e humor, acompanhada de exemplos visuais.

Biblioteca de palavras-chave Atmosphere: Selecione uma palavra-chave de cada dimensão para definir a assinatura emocional do seu vídeo.

Palavras-chave de luz e sombra

A iluminação é a base da atmosfera. Alterar a iluminação num prompt pode transformar completamente o ambiente, mantendo todos os outros elementos inalterados.

| Palavras-chave (inglês/chinês) | Efeitos visuais | Cenários adequados | |-------|----------|--------- -| | Hora dourada | Luz âmbar quente, sombras suaves e alongadas, tons de pele favorecedores | Romance, nostalgia, viagem, beleza | | Hora azul | Luz ambiente azul profunda, tons quentes residuais no horizonte | Melancolia, contemplação, transição, ambientes urbanos | | Contraluz | Objeto delineado por fonte de luz traseira, sombras faciais ou silhuetas | Drama, mistério, fotos heróicas, apelo estético | | Luz lateral | Luz direcional forte de um lado, metade iluminada, metade sombreada | Tensão, close-ups de personagens, retratos dramáticos | | Iluminação Rembrandt | Iluminação clássica para retratos – um lado iluminado, com um pequeno destaque triangular sob o olho no lado sombreado | Retratos, elegância, ambiente clássico | | Iluminação volumétrica | Feixes de luz visíveis passando através de poeira, névoa ou fumo | Sacralidade, teatro, cenas na floresta, iluminação de palco | | Efeito Tyndall | A luz dispersa-se em partículas minúsculas, formando feixes distintos na névoa | Natural, cenas do amanhecer, etéreo, onírico | | Neon | Fontes de luz coloridas artificiais, normalmente rosa, azul, ciano, magenta | Cyberpunk, vida noturna, urbano, contemporâneo | | Luz de vela | Quente, cintilante, laranja-âmbar | Intimidade, história, cenas de jantar, aconchego | | Silhueta | Objeto totalmente escurecido, definido apenas pelo contorno contra um fundo claro | Mistério, anonimato, impacto visual, narrativa | | Bioluminescente | Fonte de luz orgânica autoiluminada, normalmente azul-esverdeada | Fantasia, subaquático, mundos alienígenas, onírico |

Palavras-chave relacionadas com tons de cor

O esquema de cores define a temperatura emocional de toda a composição. Os tons quentes transmitem uma sensação acolhedora; os tons frios transmitem uma sensação de distância. A saturação elevada transmite uma sensação vibrante; a saturação baixa transmite uma sensação suave.

| Palavras-chave (inglês/chinês) | Efeitos visuais | Ressonância emocional | |-------|----------|--------- -| | Paleta quente | Tons dominantes de âmbar, laranja, dourado e avermelhado | Conforto, nostalgia, intimidade, outono | | Paleta fria | Tons dominantes de azul, ciano e ardósia | Distância, tranquilidade, melancolia, inverno, tecnologia | | Alta saturação | Cores vivas, intensas e fortes | Energia, juventude, fantasia, cultura pop | | Desaturado | Cores suaves, desbotadas, semelhantes a tons pastel | Melancolia, realismo, reminiscência, vintage | | Azul-petróleo e laranja | Gradação de cores clássica do cinema — sombras frias, realces quentes | Sucessos de bilheteira de Hollywood, comerciais, cinematográficos | | Paleta cyberpunk | Rosa néon, azul elétrico, roxo profundo contra fundos escuros | Futurista, vida noturna, digital, vanguardista | | Vintage | Ligeiramente desbotado, tons quentes, sombras realçadas | Nostalgia, anos 70-80, filmes independentes, reminiscência | | Tons terra | Castanho, verde, ocre, terracota | Natureza, enraizamento, orgânico, documentário | | Kodachrome | Verdes e vermelhos ricos, tons de pele quentes, pretos profundos | Fotojornalismo, anos 60-70, estética americana |

Palavras-chave relacionadas com textura/qualidade de imagem

A textura define a superfície visual de um vídeo — quer se assemelhe a um filme de 35 mm, a um anúncio publicitário polido, a um documentário ou a uma pintura a óleo.

| Palavras-chave (inglês/chinês) | Efeitos visuais | Cenários aplicáveis | |-------|--------- -|----------| | Cinematográfico | Sensação de ecrã panorâmico, profundidade de campo reduzida, paleta de cores cinematográfica | Narrativa, drama, contação de histórias | | Documentário | Iluminação natural, composições ligeiramente imperfeitas | Realismo, notícias, educação | | Comercial | Iluminação limpa, brilhante e precisa, movimento suave da câmara | Apresentação de produtos, publicidade, corporativo | | Grão de filme | Textura de ruído orgânico sobreposta à filmagem | Retro, analógico, indie, acolhedor | | Anamórfico | Reflexos horizontais da lente, bokeh elíptico, distorção sutil das bordas | Drama cinematográfico, ficção científica, sensação épica | | Textura de pintura a óleo | Texturas de pinceladas visíveis, efeito impasto rico | Arte, fantasia, paisagens oníricas, clássico | | Tinta aquarela | Gradientes de tinta preta sobre fundo branco, formas orgânicas fluidas | Estética oriental, minimalismo, tranquilidade | | 8 mm / Super 8 | Grão pesado, fugas de luz, filmagem instável, cores desbotadas | Memórias, flashbacks, vídeos caseiros, nostalgia |

Palavras-chave emocionais

As palavras-chave emocionais fornecem à IA a sua orientação emocional. Elas influenciam tudo: ritmo, escolha de cores, comportamento da câmara e sensação geral.

| Palavras-chave (inglês/chinês) | Emoções evocadas | Sugestões de combinações | |-------|----------- -|----------| | Aconchegante | Calor, conforto, segurança, lar | Luz de velas, tons quentes, cenas internas | | Tenso | Ansiedade, expectativa, eventos iminentes | Iluminação lateral, filmagens com câmera na mão, enquadramento apertado | | Suspense | Medo, incerteza, desenvolvimento lento | Iluminação suave, progressão lenta, baixa saturação | | Alegria | Felicidade, celebração, leveza | Hora dourada, alta saturação, planos longos | | Melancólico | Tristeza, saudade, beleza na dor | Hora azul, tons frios, câmera lenta | | Épico | Grandiosidade, heroísmo, inspirador | Ângulos amplos, tomadas com dolly, trilhas orquestrais | | Cura | Tranquilidade, restauração, reparação suave | Iluminação suave, tons pastel, tons naturais, ritmo lento | | Horror | Medo, estranheza, inquietação | Sombras profundas, ângulos holandeses, baixa saturação, silêncio | | Romântico | Amor, saudade, ternura, intimidade | Contraluz, tons quentes, profundidade de campo rasa, grandes planos | | Energético | Velocidade, excitação, adrenalina | Tremulação da câmara, velocidade variável, alta saturação, grande angular | | Nostálgico | Saudade do passado, memórias agridoces | Grão de filme, tons vintage, realces superexpostos |

Combinações de palavras-chave relacionadas à atmosfera: três exemplos

O verdadeiro poder reside em selecionar uma ou duas palavras-chave de cada dimensão e combiná-las. As três combinações a seguir criam atmosferas totalmente diferentes para o mesmo tema — uma mulher em pé à janela:

Combinação Um: Nostalgia Quente

Luz de fundo dourada, paleta quente com tons âmbar e mel, textura granulada de filme, clima nostálgico

Combinação dois: Tensão arrepiante

Luz lateral proveniente de uma única fonte, paleta de tons frios em azul-petróleo, textura digital limpa, clima tenso

Combinação Três: Etéreo e Onírico

Feixes de luz com efeito Tyndall através de cortinas transparentes, paleta pastel, textura aquarela, ambiente relaxante

O mesmo tema, três vídeos totalmente distintos. A palavra-chave da atmosfera é o painel de controlo.


De frases isoladas a sugestões cinematográficas: 5 exemplos avançados

A melhor maneira de aprender a escrever prompts é observar o processo evolutivo dos prompts. Cada exemplo abaixo progride da versão básica V1 (o tipo que a maioria das pessoas escreve) para a V2 (adicionando especificidade e movimento de câmara), culminando na V3 (um prompt totalmente especificado, com qualidade cinematográfica). Observe as mudanças que ocorrem em cada nível e por que elas são implementadas.

Para mais exemplos de prompts de vídeo prontos a usar, consulte 10 prompts práticos de vídeo com IA.

Comparação da evolução das sugestões em três fases, apresentando as sugestões básicas da V1, as sugestões melhoradas da V2 (incorporando movimento da câmara e efeitos de iluminação) e as sugestões de nível cinematográfico da V3 (totalmente especificadas), cada uma demonstrando melhorias correspondentes na qualidade do vídeo.

Evolução rápida na prática. A versão V1 fornece praticamente nenhuma informação à IA. A versão V3 fornece tudo – os resultados são completamente diferentes.

Exemplo 1: Retrato/Estado de espírito — «Mulher a caminhar na chuva»

V1 — Edição Básica (18 palavras)

A woman walking in the rain at night in a city, cinematic, beautiful

O resultado é: uma mulher genérica, uma cidade genérica, chuva genérica, iluminação plana, sem ressonância emocional. A IA preenche todos os vazios com médias estatísticas.

V2 — Versão melhorada (62 palavras)

A young Asian woman in a long dark coat walks slowly through a rain-soaked Tokyo backstreet at night. Neon signs reflect in the wet pavement, casting pink and blue light. She carries a transparent umbrella. Camera tracks beside her at shoulder height. Shallow depth of field. Melancholic mood.

O que foi melhorado: Identidade específica do objeto, Localização específica, Fonte de luz específica, Posição da câmara, Direção emocional. A IA agora possui informações suficientes para gerar imagens únicas.

V3 — Qualidade cinematográfica (138 palavras)

A woman in her late 20s, Japanese, long black hair partially wet and clinging to her neck, wearing an oversized charcoal wool coat over a cream turtleneck, walks alone through a narrow Shinjuku backstreet at 2am. Rain falls in fine sheets, catching neon light from izakaya signs overhead — warm amber kanji characters and cold blue beer advertisements. The wet asphalt mirrors everything, creating a double world beneath her feet. She carries a transparent vinyl umbrella, water beading and streaming down its surface.

Camera: tracking shot at shoulder height, moving alongside her at walking pace, shallow depth of field at f/1.4, foreground rain droplets occasionally crossing the lens out of focus.

Lighting: practical neon sources only — no fill light. Rim light from signs behind her outlines her coat collar and umbrella edge. Her face catches intermittent warm light as she passes each shopfront.

Style: cinematic, Kodak Vision3 500T film stock, slight grain, teal-and-amber color grade, Wong Kar-wai atmosphere.

Som: chuva na superfície do guarda-chuva, jazz abafado ao longe vindo de um bar, os seus passos na pedra molhada, sem diálogo, sem trilha sonora.

(Uma mulher japonesa na casa dos vinte anos, cabelos longos e pretos parcialmente encharcados e colados ao pescoço, vestindo um casaco de lã cinza-carvão grande demais sobre uma blusa de gola alta creme, caminha sozinha pelas ruelas estreitas de Shinjuku às 2 da manhã. Fios de chuva fina refletiam o brilho neon dos letreiros dos izakayas acima dela — caracteres japoneses em âmbar quente e anúncios de cerveja em azul frio. O asfalto úmido refletia tudo, criando um mundo espelhado sob seus pés. Ela segurava um guarda-chuva de plástico transparente, com gotas condensando-se e escorrendo pela sua superfície.)

Por que o V3 funciona: cada elemento da fórmula é explicitamente definido. Não há margem para a IA adivinhar – quando a IA não está a adivinhar, ela reproduz exatamente o que você descreve.

Exemplo 2: Vitrine do produto — «O relógio na secretária»

V1 — Edição Básica (14 palavras)

A luxury watch sitting on a table, product shot, high quality, 4K

V2 — Edição revista (58 palavras)

A stainless steel dive watch with a dark blue dial rests on a slab of raw gray marble. Camera orbits slowly around the watch, 15 degrees above. Single key light from the upper left creates a defined shadow. The watch's crystal catches the light and creates a brief flare. Commercial style, clean background.

V3 — Qualidade cinematográfica (126 palavras)

A stainless steel dive watch with a sunburst navy-blue dial and ceramic bezel sits on a rough-cut block of Carrara marble, positioned at the golden-ratio intersection of the frame. The second hand sweeps continuously. Micro water droplets bead on the crystal surface and the steel bracelet links, catching light.

Camera: begins in macro extreme close-up on the dial — the indices and lume dots fill the frame — then slowly dollies out while simultaneously orbiting clockwise, completing a 270-degree arc over 8 seconds until the full watch and marble base are revealed in a three-quarter beauty shot.

Lighting: single hard key light at 10 o'clock position, 45 degrees above. No fill — deep shadows on the right side. A subtle rim light from behind separates the watch from the dark charcoal background.

Style: high-end commercial, ultra-sharp 8K downscaled to 4K, zero grain, clinical precision. Color: cool steel tones with warm gold accents from the lume.

Som: quase silêncio — apenas o leve tique-taque mecânico do movimento, um único toque claro no momento do clarão.

(Um relógio de mergulho em aço inoxidável, com mostrador azul-marinho sunburst e luneta em cerâmica, repousa sobre um bloco de mármore de Carrara bruto posicionado na intersecção da proporção áurea da moldura. O ponteiro dos segundos continua o seu movimento. Pequenas gotículas condensam-se na superfície do cristal e nos elos da bracelete de aço, captando a luz.)

Exemplo 3: Viagem panorâmica — «Montanhas ao nascer do sol»

V1 — Edição Básica (12 palavras)

Beautiful mountains at sunrise, drone shot, epic landscape, cinematic

V2 — Edição revista (55 palavras)

Snow-capped mountain peaks emerging from a sea of clouds at sunrise. The first rays of sun paint the peaks golden while the valleys remain in blue shadow. Camera cranes up slowly from the cloud layer, revealing the full mountain range. Wide angle, epic scale, warm-to-cool color gradient.

V3 — Qualidade cinematográfica (134 palavras)

The Dolomites at sunrise in late autumn. Jagged limestone spires — the Tre Cime di Lavaredo — pierce through a thick layer of valley clouds, their east-facing faces catching the first horizontal rays of sun and turning from cold blue-gray to blazing amber-gold. The cloud layer below is a rolling ocean of soft white and pale peach, filling the valleys completely.

Camera: starts buried inside the cloud layer — visibility near zero, soft white diffusion everywhere — then cranes upward at a steady pace, breaking through the cloud surface to reveal the peaks and the vast sky above. The transition from claustrophobic fog to infinite horizon takes 4 seconds. Continue rising to a high aerial wide shot. 24mm wide angle lens.

Lighting: first light of day — sun at 5 degrees above the eastern horizon, casting extreme raking light across the mountain faces. Golden hour warmth on lit surfaces, blue hour coolness in shadowed areas. Volumetric light beams visible where sun cuts between peaks.

Style: National Geographic cinematic, IMAX-quality, ultra-wide dynamic range, vivid but natural color, no filters.

Som: vento em altitude — um sussurro baixo e contínuo com rajadas ocasionais, sem música, sem sons humanos. O silêncio amplifica a escala.

(Nascer do sol no final do outono nas Dolomitas. Pináculos calcários irregulares — os Três Picos — perfuram as densas nuvens do vale, com as suas faces orientais captando os primeiros raios horizontais de sol, mudando de um azul-acinzentado frio para um âmbar dourado ardente.)

Exemplo 4: Cena de ação — «Artista marcial a dar um soco»

V1 — Edição Básica (15 palavras)

A martial artist doing a spinning kick, action movie style, slow motion

V2 — Versão melhorada (64 palavras)

A female martial artist in a dark training hall performs a spinning back kick. Her bare foot connects with a hanging heavy bag, sending it swinging violently. Camera captures the kick from a low angle, slightly slow motion at the point of impact, then returns to real-time as she recovers her stance. Side lighting creates dramatic shadows.

V3 — Qualidade cinematográfica (141 palavras)

A woman in her 30s, lean and muscular, wearing a fitted black tank top and loose gray training pants, stands in a dimly lit martial arts gym. Worn wooden floor, heavy bags hanging in rows, chalk dust suspended in the air. She explodes from stillness — a spinning hook kick that arcs through 360 degrees, her back heel striking a leather heavy bag at head height.

Camera: starts medium shot at 45-degree angle. As the spin begins, camera speed-ramps to 240fps slow motion — her hair whips in an arc, chalk dust traces the path of her foot, the bag surface ripples visibly on impact. Hold for one beat, then ramp back to real-time as she plants her foot. Slight handheld energy.

Lighting: single harsh side light from camera-left, no fill. Chalk dust and sweat particles glow in the light beam.

Style: David Fincher / Fight Club aesthetic — desaturated, greenish-teal undertone, high contrast, gritty. Anamorphic lens with subtle horizontal flares.

Som: silêncio antes do pontapé — zumbido ambiente do ginásio, uma inspiração. O pontapé: estalo explosivo do tecido, impacto pesado do couro, chocalho da corrente. Sua expiração aguda no contato. Sem música.

(Uma mulher na casa dos trinta, magra e musculosa, vestida com um colete preto justo e calças de treino cinzentas largas, está em pé num salão de artes marciais mal iluminado. Piso de madeira gasto, fileiras de sacos de boxe suspensos, poeira suspensa no ar. Ela explode da quietude — um pontapé giratório de 360 graus, o calcanhar atingindo o saco de couro na altura da cabeça.)

Exemplo 5: Narrativa emocional — «Avó e neto»

V1 — Edição Básica (16 palavras)

A grandmother and her grandchild spending time together, heartwarming, emotional, beautiful moment

V2 — Versão melhorada (71 palavras)

An elderly grandmother with silver hair and weathered hands teaches her 5-year-old granddaughter how to knead bread dough in a sunlit country kitchen. The child stands on a wooden step stool, flour on her cheeks, laughing. The grandmother guides her small hands through the dough. Golden morning light through a window. Warm color palette. Intimate, cozy atmosphere.

V3 — Qualidade cinematográfica (147 palavras)

A Japanese grandmother in her 80s, silver hair in a soft bun, deep expression lines around smiling eyes, wearing an indigo apron over a cream linen blouse, stands beside her granddaughter — age 4 or 5, round cheeks, short black hair with a red clip — at a low wooden table in a traditional kitchen. Shoji screen doors are slid open to a small garden where morning light enters. They are making mochi together. The grandmother's large, weathered hands wrap around the child's tiny ones, guiding them to fold and press the soft rice dough. Flour dust floats in the shaft of sunlight between them.

Camera: close-up on their four hands working the dough — the contrast of old and young skin. Slowly dolly out to a medium shot including both faces. Rack focus between them — first sharp on the grandmother's eyes, then pulling to the child's smile. 85mm portrait lens, f/2.0, creamy bokeh.

Lighting: natural morning sunlight from the garden, soft and directional, Tyndall effect through the flour dust. No artificial light. The light creates a warm halo around the grandmother's silver hair.

Style: Hirokazu Kore-eda film quality — observational, unhurried, documentary intimacy with cinematic beauty. Kodachrome-inspired color. 16:9.

Som: o som suave e rítmico das mãos a amassar a massa, os pássaros no jardim, um sino de vento distante, o riso ocasional da criança, a avó a cantarolar baixinho uma melodia folclórica. Sem partitura — apenas som diegético.

(Uma avó japonesa de oitenta e poucos anos, cabelos grisalhos presos num coque solto, rugas profundas ao redor dos olhos sorridentes, vestindo um avental azul índigo sobre uma camisa de linho creme. Ela está ao lado da sua neta de quatro ou cinco anos — bochechas redondas, cabelo preto curto preso com um gancho vermelho — na mesa baixa de madeira da cozinha tradicional. As portas shoji deslizam para abrir para o pequeno jardim, onde a luz da manhã entra. Juntas, elas fazem mochi. As mãos grandes da avó, marcadas pelos anos, envolvem as pequenas mãos da criança, guiando-as enquanto dobram e pressionam a massa macia de arroz glutinoso. O pó da farinha flutuava no feixe de luz solar entre elas. Possuía aquela qualidade cinematográfica ao estilo de Hirokazu Kore-eda — observacional, sem pressa, intimidade documental misturada com beleza cinematográfica.


Incorpore o design de som na solicitação

O design de som representa a dimensão mais negligenciada na criação de prompts de vídeo. Em 2026, plataformas como Seedance, Veo 3 e Keeling já suportavam a geração de áudio síncrono para vídeos – a diferença de qualidade entre aqueles que incorporavam pistas sonoras e aqueles sem elas era substancial.

Considere o seguinte: uma bela cena florestal sem sons ambientais parece uma animação GIF. Adicione o canto dos pássaros, o farfalhar das folhas e o murmúrio distante de um riacho, e ela se torna um lugar onde você deseja entrar.

Formato de design de som

Adicione comandos de voz no final do prompt, num parágrafo ou linha separada, abrangendo três níveis:

Primeira camada: Música de fundo — Clima geral e estilo

Background music: slow ambient piano, minor key, sparse notes with reverb
(背景音乐:缓慢的氛围钢琴,小调,稀疏的音符带混响)

Segunda camada: efeitos sonoros ambientais — Estabelecer os sons de fundo da cena

Ambient: light rain on leaves, distant thunder rolls, wet road traffic hum
(环境音:轻柔的雨打树叶声、远处的雷声滚动、湿路上的交通嗡嗡声)

Terceira camada: efeitos sonoros de ação e diálogos — sons específicos associados a eventos no vídeo

SFX: footsteps on wet pavement, umbrella opening with a click
Dialogue: none
(音效:湿路面上的脚步声、雨伞咔嗒打开的声音。对话:无)

Referência de palavras-chave de áudio

Estilos musicais para diferentes emoções:

HumorDireção musical (prompt em inglês)
TranquiloAmbiente, piano suave, dedilhado de guitarra acústica, lo-fi
TensoZumbido grave, cordas dissonantes, pulsação percussiva mínima
AlegreAcústico animado, ukulele, percussão leve, tom maior
ÉpicoCrescendo orquestral, tambores taiko, fanfarra de metais, coro
RomânticoQuarteto de cordas, jazz suave, bossa nova
MisteriosoAmbiente sombrio, piano com muito reverb, sons distantes de sinos
EnergéticoBatida eletrónica, bateria forte, graves pesados, ritmo acelerado
MelancólicoVioloncelo solo, piano lento em tom menor, guitarra esparsa

Sons ambientais:

| Ambiente | Camadas sonoras (prompt em inglês) | |------|--------------------- -| | Floresta | Canto dos pássaros, folhas a sussurrar, pica-pau distante, riacho | | Noite urbana | Zumbido do trânsito, sirenes distantes, zumbido de néons, passos | | Oceano | Ondas a quebrar, gaivotas, vento, motor de barco distante | | Café interior | Máquina de café, conversas murmuradas, colher em cerâmica, jazz | | Dia chuvoso | Intensidade da chuva (chuva fraca/chuva forte), trovões, pingos | | Oficina | Sons de ferramentas, aparas de madeira, zumbido de máquinas, rádio ao fundo |

Quando empregar o silêncio

O silêncio não é a ausência de design de som — é uma escolha deliberada. O silêncio estratégico pode criar:

  • Momento de impacto: O silêncio que antecede um momento dramático amplifica esse momento
  • Sensação de escala: Apenas o som do vento soprando sobre vastas paisagens transmite a sensação de imensidão
  • Tensão: Remover sons esperados cria uma sensação de inquietação⟧NLBR⟧ - Foco: O silêncio direciona toda a atenção para o visual

No prompt, indique explicitamente: «Som: silêncio — sem música, sem sons ambientais, apenas a respiração do sujeito».

Para mais informações sobre a geração de áudio na produção de vídeos musicais com IA, consulte o Guia do Gerador de Vídeos Musicais com IA.


Técnicas de prompt específicas da plataforma

A fórmula universal aplica-se universalmente, mas cada plataforma de vídeo de IA possui as suas próprias características distintas na interpretação de prompts. Otimizar os prompts especificamente para a plataforma que utiliza pode melhorar significativamente os resultados.

Comparação de otimizações imediatas para o mesmo conceito de vídeo em cinco plataformas de vídeo de IA distintas (Seedance, Sora, Keeling, Runway e Veo 3)

O mesmo conceito — «Mulher caminhando à noite na chuva» — otimizado para cinco plataformas distintas. A mesma fórmula, ênfases diferentes.

Seedance

Vantagens: Formato de cronograma de storyboard, sequências com várias tomadas, referências de imagem para vídeo, [gerador de prompts] integrado.

Técnicas de otimização:

  • Empregue uma estrutura de storyboard com linha do tempo para sequências complexas — divida os vídeos em cenas com marcação de tempo:
 Shot 1 (0-3s): [描述]
 Shot 2 (3-6s): [描述]
 Shot 3 (6-10s): [描述]
  • Mantenha a consistência estilística e dos personagens referenciando as imagens carregadas com @Image1, @Image2
  • A linguagem cinematográfica produz excelentes resultados — use termos específicos (dolly, track, orbit) em vez de descrições vagas ("move towards")
  • Incorpora design de som — a Seedance lida com sinais de áudio
  • Fluxo de trabalho mais eficiente: use o Video Prompt Generator para criar prompts estruturados a partir de ideias simples e, em seguida, refine manualmente

Guia completo de prompts específicos da plataforma Seedance (com mais de 50 exemplos), consulte Guia de prompts Seedance.

Sora(OpenAI)

Vantagens: Comportamento fisicamente realista, movimentos naturais e compreensão natural da linguagem em textos longos.

Técnicas de otimização:

  • Use parágrafos fluidos e descritivos em vez de listas estruturadas — o Sora é excelente na análise de linguagem natural
  • Enfatize detalhes físicos: gravidade, peso, propriedades dos materiais, dinâmica dos fluidos
  • Descreva como algo " parece" — Descrições de textura e material aumentam a fidelidade física
  • Especifique proporções e duração
  • Detalhe a física: "Tecido pesado balança a cada passo, arrastando devido ao seu próprio peso" produz resultados superiores em comparação com "saia flutuante"

Ke Ling Kling (Kuaishou)

Vantagens: Velocidade de geração rápida, forte ação e desempenho de movimento, excelente consistência facial.

Dicas de otimização:

  • Mantenha as instruções concisas — Keli responde melhor a instruções focadas e orientadas para a ação (50-80 palavras é o ideal)
  • Comece com a ação: «Um dançarino salta e gira», em vez de mencionar o movimento após longas descrições da cena
  • Especifique claramente a direção do movimento: «move-se da esquerda para a direita», «aproxima-se da câmara», «afasta-se»
  • O Keeling é excelente a lidar com movimentos humanos e expressões faciais — aproveite isso para prompts emocionais em close-up
  • As instruções de movimento da câmara são eficazes, mas cada indicação deve manter uma ou duas ações distintas da câmara.

Visão Universal / Pista (Gen-3 Alpha / Gen-4)

Técnicas de otimização para Tongyi Wanshang:

  • Suporta a entrada direta de prompts em chinês, produzindo resultados superiores em comparação com a tradução
  • Demonstra excelente compreensão dos elementos estéticos tradicionais chineses — pintura a tinta, estilo nacional e cenas com trajes de época
  • Alcança resultados eficazes com tags de estilo concisas e claras

Técnicas de otimização do Runway:

  • Combine descrições textuais com tags de estilo — O Runway possui uma compreensão robusta de estilos
  • Descreva o movimento usando vetores espaciais: movimento da parte inferior esquerda para a parte superior direita
  • Ao usar o Motion Brush, concentre o prompt de texto na cena e no estilo gerais, enquanto emprega o pincel para lidar com áreas de movimento específicas
  • O Runway demonstra excelente compreensão de descrições de estilos artísticos — "no estilo de um filme de Terrence Malick" - Ao utilizar o Pincel de Movimento, concentre-se na cena e no estilo gerais, utilizando o pincel para refinar áreas de movimento específicas
  • O Runway é excelente na interpretação de descrições de estilo artístico — «no estilo de um filme de Terrence Malick» produz excelentes resultados
  • Mantenha o foco — gere uma cena distinta por prompt, em vez de sequências com várias tomadas

Veo 3(Google DeepMind)

Vantagens: compreensão áudio, simulação física, qualidade cinematográfica, sequências prolongadas.

Técnicas de otimização:

  • Inclua descrições áudio detalhadas — o Veo 3 gera áudio sincronizado a partir do texto
  • Descreva as interações físicas em detalhe: como os objetos colidem, os materiais se deformam e a luz interage com as superfícies
  • Empregue terminologia cinematográfica — os dados de treino do Veo 3 privilegiam fortemente a produção cinematográfica profissional
  • Especifique a duração e o ritmo: «a cena desenrola-se lentamente ao longo de 10 segundos»
  • As descrições físicas aumentam significativamente o impacto: «a água salpica para cima com o impacto, as gotículas refletem a luz de fundo» em vez de simplesmente «salpica»

Para uma comparação detalhada entre o Seedance e o Sora em termos de interpretação rápida e qualidade de saída, consulte Comparação entre Seedance e Sora.


Ou deixe a IA escrever prompts para si

Acabou de concluir a aprendizagem da estrutura completa para criar prompts de vídeo a partir do zero. Este conhecimento é extremamente valioso, pois permite-lhe avaliar melhor a qualidade dos prompts e dá-lhe controlo total sobre todos os detalhes. No entanto, não precisa escrever manualmente cada prompt todas as vezes.

O diagrama do fluxo de trabalho ilustra uma abordagem híbrida: a IA gera um prompt estruturado inicial, que é então revisto e otimizado por humanos para elementos específicos. O prompt refinado produz subsequentemente o vídeo final.

Fluxo de trabalho híbrido: deixe a IA lidar com a terminologia estrutural e técnica e, em seguida, insira a sua perspetiva criativa durante a fase de otimização.

Quando escrever à mão e quando usar IA

CenárioMelhor abordagem
Possui uma visão criativa precisa e sabe exatamente o que querEscrita à mão — será mais rápido e preciso do que editar rascunhos de IA
Tem uma ideia geral, mas precisa de estruturaGeração de IA → Refinamento manual
Precisa de gerar rapidamente várias variações de promptsGeração em lote por IA → Selecione e refine o melhor
Está a aprender e deseja estudar estruturas de promptsGeração por IA → Leia e analise — é assim que constrói o seu vocabulário
Precisa de corresponder imagens de referência específicasManuscrito — descreva com precisão o que vê na referência

Fluxo de trabalho híbrido (recomendado)

O fluxo de trabalho de escrita mais eficiente combina a geração por IA com o refinamento humano:

  1. Comece com IA. Aceda ao Seedance Gerador de sugestões de vídeo, descreva a sua ideia em uma ou duas frases, selecione um estilo e gere.

  2. Analise criticamente o resultado. A IA irá gerar um prompt estruturado contendo linguagem de movimento da câmara, cronogramas, iluminação e som. Leia-o atentamente. O trabalho da câmara corresponde ao tom emocional desejado? A direção da iluminação cria a atmosfera pretendida? Há algum detalhe que deseja alterar?

  3. Otimização manual. É aqui que o seu conhecimento de fórmulas, linguagem cinematográfica e palavras-chave atmosféricas entra em ação. Substitua as imagens selecionadas pela IA por outras mais alinhadas com a sua visão. Ajuste as palavras-chave de iluminação. Adicione detalhes específicos que a IA não pode saber — características específicas dos personagens, requisitos específicos da marca, nuances emocionais.

  4. Gere o vídeo. Envie o prompt otimizado para o gerador de vídeo. Os resultados serão muito superiores aos prompts totalmente manuais de novatos ou aos prompts gerados inteiramente por IA e não verificados.

Um guia completo sobre como operar geradores de prompts de IA pode ser encontrado no Guia do Gerador de Prompts de Vídeo de IA.


Efeitos cinematográficos: domínio através da integração

Vamos criar uma sugestão final que utilize tudo o que foi abordado neste guia — fórmulas, linguagem cinematográfica, palavras-chave atmosféricas, design de som — para produzir um efeito verdadeiramente cinematográfico.

Brief criativo: Um astronauta solitário descobre vida vegetal em Marte.

A impressionante saída de vídeo com qualidade cinematográfica da IA mostra um astronauta solitário ajoelhado no meio do terreno vermelho de Marte, descobrindo uma pequena planta verde, renderizada com iluminação lateral dramática e efeitos volumétricos de poeira.

As instruções cinematográficas totalmente especificadas produzem resultados como se fossem dirigidas por um cineasta — porque, na verdade, são. Cada elemento serve à narrativa.

Prompt completo:

Subject: A solitary astronaut in a dusty, sun-bleached EVA suit — visor partially reflective, scratched from use, mission patches barely legible. The suit is not pristine Hollywood white; it is a working tool, weathered by months on the Martian surface.

Action: The astronaut crouches beside a small crack in the rust-red basalt. Inside the crack, a single tiny green sprout — two delicate leaves, almost translucent — pushes up through the red soil. The astronaut's gloved hand reaches toward it, hesitates, trembles slightly, then gently touches the soil beside it.

Environment: The Martian surface — a flat, rust-red plain scattered with dark basalt rocks, stretching to low eroded hills on the horizon. The sky is a pale butterscotch-pink. Dust devils move in the far distance. The scene feels vast and achingly empty — except for this one tiny green thing.

Camera: Opens with an extreme wide shot — the astronaut is a small figure in the immense Martian landscape. Slow dolly in over 4 seconds to a medium shot. As the astronaut crouches, camera drops to ground level and continues to a close-up of the gloved hand and the sprout. Rack focus: pull from the hand to the astronaut's visor, where we see the sprout's reflection. 65mm lens, anamorphic.

Lighting: Late Martian afternoon — low sun from camera-right, casting long amber-red shadows. The side light sculpts the EVA suit's texture. The sprout's translucent leaves glow with subsurface scattering as sunlight passes through them — the only green in a world of red. Volumetric dust particles drift through the light beam.

Style: Ridley Scott's The Martian meets Terrence Malick's The Tree of Life. Cinematic, anamorphic, muted Martian color palette with the single point of vivid green as deliberate contrast. Subtle film grain.

Sound: Wind — thin, high-pitched Martian wind, unlike Earth wind. The astronaut's breathing inside the suit — measured at first, then quickening. A single sustained low note from a cello enters as the hand reaches for the sprout. No dialogue. No narration.

Um astronauta solitário, vestido com um fato EVA coberto de poeira e desbotado pelo sol — a viseira semi-reflexiva, com arranhões de uso, a insígnia da missão quase imperceptível. Este fato não é do branco imaculado de Hollywood; é uma ferramenta de trabalho, desgastada por meses na superfície marciana. Agachado ao lado de uma estreita fissura no basalto vermelho-ferrugem, o astronauta observa um pequeno rebento verde — duas folhas finas, quase translúcidas — a romper o solo carmesim. Uma mão enluvada estende-se na sua direção, hesita, treme ligeiramente e, em seguida, toca suavemente a terra ao seu lado.

Esta sugestão incorpora todos os sete elementos formulaicos, linguagem cinematográfica específica (plano geral extremo, travelling, mudança de foco), palavras-chave atmosféricas (iluminação volumétrica, dispersão subsuperficial, lente anamórfica), design de som (vento ambiente, sons de respiração, nota solitária de violoncelo) e referências estilísticas (Ridley Scott, Terrence Malick). Cada detalhe serve ao arco emocional: solidão → descoberta → admiração.

Este é o projeto de engenharia de vídeo prompt.


Perguntas frequentes

Qual deve ser a duração das mensagens de vídeo da IA?

Não existe um padrão universal para o comprimento. O comprimento adequado depende da complexidade do seu conceito criativo e da plataforma utilizada. O nível V1 (15-30 palavras) produz resultados universais em qualquer plataforma. O nível V2 (50–80 palavras) representa o intervalo ideal para a maioria das plataformas — suficientemente específico sem sobrecarregar o modelo. O nível V3 (100–200 palavras) produz os resultados mais controláveis em plataformas que suportam prompts longos, como Seedance e Sora. Ao utilizar o Keeling, mantenha aproximadamente 50–80 palavras. A métrica crítica não é a contagem de palavras, mas sim se cada elemento da fórmula é abordado de forma abrangente.

É essencial ter experiência em fotografia para criar prompts de vídeo eficazes?

Não é essencial, mas compreender isso será extremamente útil — e este guia acabou de lhe ensinar o conhecimento básico. Não precisa de um diploma em cinema; o que precisa é saber os nomes de 10 a 15 tipos de movimentos de câmara, compreender o impacto emocional de diferentes estilos de iluminação e possuir vocabulário para descrever a atmosfera. Marque as secções sobre [Linguagem dos movimentos de câmara](#Linguagem dos movimentos de câmara Arma secreta) e [Biblioteca de palavras-chave da atmosfera](#Biblioteca de palavras-chave da atmosfera) e consulte-as repetidamente até que esses termos se tornem naturais.

O mesmo prompt pode ser usado em diferentes plataformas de vídeo com IA?

Certamente — a fórmula universal aplica-se universalmente. No entanto, cada plataforma interpreta os prompts de forma diferente. Os prompts otimizados para o Sora (longos, fluidos, enfatizando a física) podem precisar de reestruturação para o Ke Ling (mais curtos, com ação em primeiro lugar). A secção Técnicas específicas da plataforma detalha como adaptar. A fórmula principal permanece inalterada; apenas o formato de entrega é adaptado.

O que distingue este guia do guia de prompts do Seedance?

O Guia de Prompts do Seedance é específico para a plataforma — ele ensina o formato de storyboard do Seedance, referências de imagens e mais de 50 prompts prontos para usar. Este guia é universal — ele ensina as habilidades básicas de escrita de prompts aplicáveis a qualquer plataforma. Considere este guia como o seu livro didático e o guia do Seedance como o seu manual prático para uma ferramenta específica.

Como descrever o movimento da câmara se não estiver familiarizado com a terminologia cinematográfica?

Primeiro, descreva o que você quer que o público veja e sinta. "A câmara aproxima-se lentamente do rosto do sujeito" é um dolly em «A câmara segue a pessoa que caminha de lado» é uma travellings. As plataformas de IA compreendem muito bem as descrições em linguagem natural. No entanto, aprender terminologia técnica (usando a [referência de linguagem de movimento de câmara](#arma secreta da linguagem de movimento de câmara) acima) produz resultados significativamente melhores, pois os modelos de IA são treinados em vídeos descritos usando precisamente esses termos profissionais.

Devem ser incluídas instruções inversas (o que não incluir)?

Certas plataformas suportam prompts reversos — instruções que especificam o que deve ser evitado. Estes podem ser úteis: «Sem sobreposições de texto, sem marcas d'água, sem quadros desfocados». No entanto, a maioria dos geradores de vídeo com IA modernos lida com questões de qualidade de forma mais eficaz através de especificações positivas. Em vez de escrever «sem iluminação fraca», especifique «iluminação Rembrandt da esquerda da câmara». Em vez de «sem imagens tremidas», indique «movimento suave da câmara». As instruções positivas orientam a IA para o resultado desejado; as instruções negativas apenas dizem o que evitar, deixando as alternativas ao acaso.

Como manter a consistência dos personagens em várias instruções?

Manter a consistência dos personagens em várias gerações de vídeos de IA é um dos aspetos mais desafiadores da escrita de prompts. Três estratégias se mostram úteis: (1) Empregar descrições extremamente específicas dos personagens, repetindo-as literalmente entre os prompts – «uma mulher na casa dos 20 anos, japonesa, cabelo preto comprido, casaco de lã cinza escuro grande, camisola de gola alta creme». (2) Empregar fluxos de trabalho de imagem para vídeo — carregar imagens de referência dos personagens para animação de IA. O Seedance suporta isso através de referências @Image. (3) Gerar todos os clipes para o mesmo personagem numa única sessão, sempre que possível, usando sementes ou configurações de estilo idênticas.

Existe alguma ferramenta que me ajude a escrever prompts para vídeos?

Sim. O Gerador de Prompts de Vídeo da Seedance aceita descrições em linguagem natural para gerar prompts completos e estruturados de listas de filmagens, abrangendo linguagem de movimento de câmara, cronogramas, iluminação e design de som. Para obter orientações operacionais detalhadas, consulte o Guia do Gerador de Prompts de Vídeo com IA. Fluxo de trabalho recomendado: geração com IA → refinamento manual → produção de vídeo.


Comece hoje mesmo a escrever melhores prompts para vídeos

Agora você possui um kit de ferramentas completo: a fórmula dos sete elementos, uma referência de linguagem de movimentos de câmara que abrange mais de 15 técnicas, uma biblioteca de palavras-chave de atmosfera quadridimensional com mais de 50 termos, cinco exemplos progressivos que ilustram a evolução dos padrões básicos aos padrões cinematográficos, metodologia de design de som e técnicas de otimização específicas para cada plataforma.

A diferença entre a produção de vídeos com IA amadora e profissional não está nas ferramentas, mas nas instruções. E escrever instruções é uma habilidade que melhora com a prática.

Três maneiras de começar:

  1. Pratique a fórmula. Selecione qualquer assunto e redija as versões V1 → V2 → V3. Compare os resultados finais. A melhoria será imediata e significativa.

  2. Use um gerador de prompts. Deixe a IA cuidar da estrutura e, em seguida, aplique o seu conhecimento sobre movimentos de câmara e atmosfera para refinar o resultado. Experimente o gerador de prompts de vídeo →

  3. Crie o seu primeiro vídeo. Escolha a sua melhor sugestão e crie um vídeo agora mesmo. Abra o gerador de vídeo →

Mais inspiração imediata e exemplos prontos a usar:

Explore o Seedance 2.0 →

O melhor vídeo de IA que você já criou começa com o próximo prompt que você escrever.

Seedance 2.0 IA

Seedance 2.0 IA

Vídeo com IA e tecnologia criativa