AI動画プロンプト作成ガイド:入門から映画級効果まで

Feb 22, 2026

TL;DR

優れたAI動画は優れたプロンプトから生まれる。本ガイドでは、すべての主要AI動画プラットフォームに適用可能な汎用動画プロンプト公式——7要素フレームワークを紹介します:

[主体] + [動作] + [環境] + [カメラワーク] + [光と影] + [スタイル] + [音]

学べる内容:プロンプトが失敗する主な原因(および即座に修正する方法)、15種類以上のカメラワーク手法を網羅した完全なカメラ言語リファレンス、光と影/色調/質感/情緒の4大次元で整理された雰囲気キーワードライブラリ、基礎から映画級まで進化する5つのプロンプト応用例、プロンプトへのサウンドデザイン組み込み方法、そしてSeedance、Sora、可灵(Kling)、Runway、Veo 3の各プラットフォーム向け最適化テクニック。

これはツールのチュートリアルではありません——これは方法論です。動画のヒント文作成スキルはプラットフォームを横断して応用可能で、一度習得すればどこでも活用できます。

自動生成プロンプト →

比較展示:曖昧なAI動画プロンプトは平凡な汎用結果を生む一方、構造化された映画級プロンプトはプロ品質の動画出力を生み出す

同じコンセプトでも、結果は全く異なる。左側のプロンプトには「雨の中を歩く女性」と書かれている。右側のプロンプトはカメラワーク、光の向き、雰囲気、音まで指定——AIモデルは映画級のクオリティで応答した。


なぜほとんどのAI動画プロンプトは失敗するのか(そしてその修正方法)

どのAI動画生成ツール——Seedance、Sora、可霊、Runway、Veo 3——を使用する場合でも、その核心原理は同じです:テキスト入力がより正確で構造がより完全であればあるほど、出力はより制御可能になり、映画品質に近づきます。多くの人はプロンプトを書く際、友人に写真の説明をするように扱いますが、動画は写真ではありません。動画には動き、時間、カメラワーク、雰囲気の展開、そして音があります。

以下はプロンプト失敗の5つの主な原因であり、それぞれに即時修正策を付記しています。

  1. 曖昧すぎる——「美しい夕焼け」問題

最もよくあるプロンプトの失敗例。あなたが「海辺の美しい夕焼け」と書き込むと、技術的には正確だが感情的に空虚な断片が返ってきて、まるでストックスクリーンセーバーのようだ。

問題はAIが夕焼けを描けないことではなく、「美しい」と「夕焼け」が与えられた情報全てである点だ。AIはトレーニングデータで数百万の夕焼けを見てきた。統計的な平均値を選ぶだろう——そして平均値とは、本質的に凡庸なのである。

修正前修正後
海辺の美しい夕日ゴールデンアワーの光が穏やかな太平洋の海岸に降り注ぎ、波が火山岩を打ち、太陽が地平線から指二本分の高さにある。空のグラデーションは地平線の深い琥珀色からサーモンピンクを経て天頂の淡いラベンダーへと移り変わり、長い影がカメラに向かって伸びている。太陽は地平線から指二本分の高さに位置し、空は地平線の深い琥珀色からサーモンピンクを経て天頂の淡いラベンダーへとグラデーションを描き、長い影がカメラに向かって伸びている)

修復方法:形容詞(「美しい」「驚くべき」「衝撃的」)を具体的な観察可能な詳細(色、位置、質感、空間関係)に置き換える。

  1. 動作指示なし——静止画の問題

あなたは細部まで豊かな情景描写を書いたのに、AIが生成したのは写真にわずかな手ぶれを加えたような画像だった——なぜならあなたが描写したのは瞬間であって、動きではなかったからだ。

動画は時間依存性を持つ。明確な運動指示がない場合、AIは最も保守的な解釈をデフォルトで採用する:ゆっくりとした前進またはわずかな視差。技術的には確かに「動画」だが、あなたが望むものではない。

修正前修正後
山道に停められたヴィンテージレッドのスポーツカー、霧の朝、映画のような(一辆复古红色跑车停在山路上,薄雾清晨,电影感)ヴィンテージレッドのポルシェ911が曲がりくねった山道を加速する。タイヤが濡れたアスファルトを噛み、車体の周囲で霧が分かれる。カメラはバンパーの高さで並走し、前景の木々がぼやけて過ぎていく(レトロな赤いポルシェ911が曲がりくねった山道を加速する。タイヤが濡れたアスファルトを噛みしめ、車体の周囲で霧が分かれる。カメラはバンパーの高さで並走し、前景の木々がぼやけて通り過ぎる)

修復方法:各動画のヒントには、少なくとも主体の物理的運動を表す動詞と、カメラの動きを表すフレーズが必要です。主体が動いており、カメラも動いている——両者が共に視覚的なエネルギーを生み出します。

3. 矛盾した指示——「クローズアップ+ロングショット」のパラドックス

この状況は想像以上に頻繁に起こります。特に、聞いたことはあるが完全に理解していない映画用語をつなぎ合わせた場合です。「女性が広大な砂漠を横断する極端なクローズアップ、ワイドショット、叙事詩的な感覚」という指示には、互いに矛盾する構図の指示が含まれています。AIは平均値を取ろうとし、近すぎず遠すぎず、ただ混乱した画面を生成してしまうのです。

修正前修正後
広大な砂漠を歩く女性のクローズアップ、ワイドな全景ショット、壮大なスケール(女性が大砂漠を歩くクローズアップ、ワイドな全景ショット、叙事詩的なスケール)砂漠の光を映す女性の目の極限クローズアップ、まつ毛に黄金の時間帯の陽光を捉えた砂粒、浅い被写界深度で背後の広大な砂丘地帯が琥珀色のグラデーションにぼやける(女性の目の極限クローズアップ、目に映る砂漠の光、まつ毛に黄金の時間帯の陽光を捉えた砂粒、浅い被写界深度で背後の広大な砂丘が琥珀色のグラデーションにぼける)

修復方法:各ショットごとに1つのカメラポジションを選択します。クローズアップとロングショットが必要な場合は、2つの独立したショットを記述し、トランジションで接続します。マルチショットシーケンスの場合、Seedanceなどのプラットフォームはショットタイムライン形式をサポートしており、各ショットを個別に指定できます。

4. 雰囲気の欠如——光と影、そして情緒の空白

あなたのプロンプトは、ある場所で主体が特定の動作を行う様子を描写しています。これは7つの次元のうち3つをカバーしています。光と影、トーン、大気効果、スタイルの指示がない場合、AIは空白を中立的なデフォルト値で埋めます:均一でフラットな照明、くすんだ色調、特定の感情を伴わない表現です。その結果は、高精細な監視カメラ映像のように見えるでしょう。

修正前修正後
コーヒーショップに一人で座る男(一个男人独自坐在咖啡馆里)40代の男が薄暗い角のブースに一人で座っている。一本のペンダントランプから漏れる温かな琥珀色の光が、彼のコーヒーカップから立ち上る湯気を捉えている。背後にある窓を流れ落ちる雨の筋が、彼の顔に波打つ影の模様を投げかけている。落ち着いた青緑と銅色の配色、憂いを帯びた雰囲気(四十代の男性が薄暗い隅のブースに一人で座っている。一灯のペンダントライトが放つ温かな琥珀色の光が、コーヒーカップから立ち上る湯気を捉えている。背後にある窓を流れ落ちる雨の筋が、彼の顔に波紋状の影の模様を映し出す。くすんだ青銅色のトーン、憂いを帯びた雰囲気)

修復方法:光源の方向、色温度、大気効果(霧、雨、塵、蒸気)、そして情緒的な言葉を加える。この四つの要素が「一つのシーン」を「一つの感覚」へと昇華させる。

  1. サウンドデザインの欠如——サイレント映画の問題

2026年、ほとんどのAI動画プラットフォームは音声生成をサポートしている——BGM、環境音、さらには会話や口パクの同期まで。しかし、多くの人が書くプロンプトは完全に無音だ。なぜなら彼らは動画プロンプトを視覚的な指示としてしか捉えていないからだ。

音は体験の半分を占める。鳥のさえずりや葉のざわめきがない森のシーンは不自然に感じられる。衝撃音のないアクションシーンは軽薄に映る。音楽のない製品紹介はPPTのようだ。

修正前修正後
本棚から飛び降りてソファに着地する猫(一只猫从书架跳到沙发上)オーク材の本棚の頂上から、オレンジ色の猫が優雅に跳び降りる。空中で体を伸ばし、その重みでへこむベルベットのソファクッションに柔らかく着地する。 音:柔らかな足音、棚で滑る一冊の本、窓に当たる遠くの雨音と静かな室内環境音音:布地を軽く叩く柔らかな足音、本が棚の上を滑る音、遠く窓の外で降る雨を伴う静かな室内環境音)

修復方法:プロンプトの末尾に音声説明を追加し、BGMのスタイル、環境音、および会話やナレーションを指定します。詳細は下記のサウンドデザインセクションで説明しています。


汎用動画プロンプト公式

どのプラットフォームを使用する場合でも、効果的な動画プロンプトには同じ7つの要素が含まれています。必須要素(すべてのプロンプトに必要)とオプション要素(効果を高めるがなくても使用可能)があります。公式:

[主題 Subject] + [動作 Action] + [環境 Environment] + [カメラワーク Camera] + [照明 Lighting] + [スタイル Style] + [音響 Sound]

汎用動画プロンプト公式の7要素可視化分解図:主体・動作・環境・カメラワーク・光影・スタイル・音の各要素と例示キーワードを提示

汎用動画プロンプト公式の7つの要素。各要素が最終出力に新たな制御次元を加える。

以下に各要素を一つずつ分解し、キーワードライブラリと例文を付記する。

要素一:主体 Subject(必須)

主体は観客の注視の対象である。これはヒントの中で最も具体的な部分である——「一人の女性」ではなく、「60代半ばの女性で、銀色の髪がゆるくまとめられ、目尻に深い笑いじわがあり、色あせたデニムエプロンを着ている」と。

キーワードライブラリ:

カテゴリ例(英語のヒント)
人物20代の青年、年配の女性、5歳前後の子供、ダンサー、シェフ、兵士
動物ゴールデンレトリバー、ユキヒョウ、ハチドリ、コイ、オオカバマダラ
物品アンティークタイプライター、クリスタル香水瓶、革表紙の日記帳、陶器の花瓶
乗り物マットブラックのオートバイ、木製帆船、風化したピックアップトラック、新幹線
抽象光の粒子、水中のインク滴、幾何学模様、液体金属

例文:

  • 30代のバリスタ。袖にはタトゥーが入り、小麦粉のついた黒いエプロンを着ている
  • A weathered bronze compass lying open on a nautical chart(海図の上に開かれたままの、風化した青銅のコンパス)
  • Thousands of paper lanterns, each glowing warm amber from a candle inside(数千の紙灯籠、それぞれ内部のろうそくが温かな琥珀色の光を放っている)

要素二:動作 Action(必須)

動作は起きている出来事——主体が何をしているか、そしてシーンが時間とともにどう展開するか。これが動画プロンプトと画像プロンプトの境界線だ。動作がなければ、得られるのは動く写真に過ぎない。

キーワードライブラリ:

運動タイプ例(英語のヒント)
人体動作歩行、走行、ゆっくり回転、手を伸ばす、前傾、呼気、瞬き
カメラに対する相対動作カメラに接近、カメラから離れる、画面左から右へ横切る
物体の動き回転、落下、浮遊、粉砕、組み立て、展開、溶解
環境の動き草を揺らす風、流れる雲、降る雨、舞う葉、満ちてくる潮
変化のプロセス日が夜へ変わる、花が咲く、氷が形成される、絵の具が広がる、光が移り変わる

例文:

  • ゆっくりと腰をかがめて落ちた紅葉を拾い上げ、指の間でひっくり返す
  • The compass needle trembles, then swings decisively north(コンパスの針が震え、そして確信を持って北を指す)
  • Lanterns lift off one by one from the ground, rising into the dark sky at different speeds(提灯が一つずつ地面から浮かび上がり、それぞれ異なる速度で暗い空へと昇っていく)

要素三:環境 Environment(必須)

環境はシーンが展開される場所である。直近のシーン(前景)とより広い背景を描写する。関連する場合、天候、時間、季節を含める。

キーワードライブラリ:

シーンタイプ例(英語プロンプト)
自然密林、砂漠の砂丘、海の断崖、高山草原、火山性海岸、竹林
都市東京の路地裏、ブルータリズムのコンクリート広場、屋上庭園、地下鉄ホーム、ネオン輝く大通り
室内キャンドルライツの図書館、インダストリアル風ロフト、温室、ビンテージ暗室、大理石のアトリウム
ファンタジー浮遊する島々、水晶の洞窟、生物発光するサンゴ礁、廃墟の寺院、雲の都
時間/天候夜明け前の薄明、曇り空の真昼、雷雨、初雪、蒸し暑い夏の夕べ

例文:

  • 京都の狭い路地で、両側に石灯籠が並び、濡れた石畳の上を桜の花びらが舞う
  • 廃墟となった大聖堂の内部、粉塵に覆われた光線が割れたステンドグラスを貫く
  • 青い時間の火山崖の縁で、黒い岩の裂け目から硫黄の蒸気が立ち上る

要素四:カメラワーク Camera(重要)

カメラワーク指示はAI視聴者にシーンの見方を指示し、構図(どの程度クローズアップか)、角度(どこから見るか)、動き(視点が時間とともにどう変化するか)を含む。カメラワーク言語はプロンプト品質を向上させる最も重要な要素であり、詳細は以下の専用セクションで詳しく解説している。

クイックキーワードライブラリ:

方面英文術語及び中文対照
構図 Framing極限クローズアップ(極端特写), クローズアップ(特写), ミディアムショット(中景), フルショット(全景), ワイドショット(遠景), 極限ワイドショット(大遠景)
角度 Angleeye level(平視), low angle(仰角), high angle(俯角), bird's eye(鳥瞰), worm's eye(蟻視点), Dutch angle(オランダ角/傾斜角)
運動 Movementドリーイン/アウト(推/拉), パン左/右(水平揺れ), ティルト上下(垂直揺れ), トラッキングショット(追跡撮影), オービット(周回), クレーン(昇降)
レンズ Lens24mm 広角(広角), 50mm 標準(標準), 85mm ポートレート(人像), 200mm テレフォト(長焦点), マクロレンズ(微距), アナモルフィック(変形ワイドスクリーン)

要素五:光と影 Lighting(重要)

光と影が各フレームの情緒を定義する。プロのカメラマンは数時間かけて照明をセットする。プロンプトライティングでは、数語の的確な言葉で同等のコントロール力を得られる。

キーワードライブラリ:

光影タイプ(英語/中国語)視覚効果
ゴールデンアワー(黄金時)暖色調、長い影、オレンジ・琥珀色のトーン、人物写真が非常に美しく映える
ブルーアワー(青の時間帯)クールトーン、憂いを帯びた雰囲気、深い青空、地平線に残る暖色
逆光/バックライト輪郭発光、シルエット効果、背景との強い分離
サイドライト 側光顔の半分が明るく半分が暗く、高コントラストでドラマチック
レンブラント照明 レンブラント光影の側の目の下に三角形のハイライトが現れ、古典的な肖像画風
Volumetric 体積光可視光線が塵・霧・煙を透過
Tyndall effect ティンダル効果微粒子内での光散乱、霧や塵の中に明確な光線が現れる
ネオン光カラー人工光源、濡れた面の反射、サイバーパンク美学

要素六:スタイル Style(推奨)

スタイルはAIにどのような視覚言語を使用するかを指示します——フィルム風、ドキュメンタリー写実、アニメ、油絵、その他。スタイル指定がない場合、AIはデフォルトで汎用写実スタイルを使用します。

キーワードライブラリ:

スタイル(英語/中国語)視覚的特徴
Cinematic 映画的浅い被写界深度、フィルム調のカラーグレーディング、2.39:1のワイドスクリーン感
Documentary ドキュメンタリー手持ちカメラ感、自然光、観察的な構図
Commercial 商業広告清潔感、明るさ、製品フォーカス、精密な照明、滑らかな動き
Anime アニメセラト風、鮮やかな色彩、誇張された動き、ダイナミックなライン
フィルム・ノワール高コントラストのモノクロ、ブラインドの影、控えめな照明
水墨画白地に墨、流れるようなグラデーション、ミニマル、東洋美学
ビンテージフィルムフィルムの粒子感、やや彩度抑え、暖色系、ソフトフォーカスエッジ
サイバーパンクネオンに染まる、高コントラスト、ホログラフィック要素、都市の終末感

要素7:サウンド Sound(オプション)

音声は聴覚的な次元を加える。すべてのプラットフォームが音声生成をサポートしているわけではないが、プロンプトにサウンドデザインを組み込むことは未来志向であるだけでなく、視覚効果を高めることにもつながる。AIは音声の手がかりを利用して、視覚の情緒やリズムに影響を与えるからだ。

キーワードライブラリ:

音声タイプ例(英語プロンプト)
音楽スタイルオーケストラ, ローファイヒップホップ, アンビエントエレクトロニック, ジャズピアノ, アコースティックギター, シネマティックスコア(映画音楽)
環境音rain on glass(雨の窓ガラス音), wind through trees(木々の間を吹き抜ける風音), city traffic hum(都市の交通騒音), ocean waves(波の音), fire crackling(焚き火のパチパチ音)
アクション効果音砂利の上の足音, ドアのきしむ音, ガラスの破片音, エンジンの轟音
人声ささやきナレーション, 会話, 呼吸音, 笑い声(笑い声)

カメラワークの言語:秘密兵器

カメラワークの言語は、動画プロンプターとしてあなたが培える最も影響力のあるスキルです。dolly in slowly(ゆっくりとドリーイン)と書くことで、zoom in(ズームイン)ではなく、AIモデルのネイティブ言語を話していることになります。なぜならこれらのモデルは、数百万時間に及ぶプロの撮影動画で訓練されており、それらの映像におけるカメラの動きには特定の名称と特定の視覚効果が存在するからです。

この部分はあなたの総合参考マニュアルです。ブックマークすることをお勧めします。

カメラワーク参考ガイド:12種類のショットの動きの名称、運動経路、感情効果を紹介。ズームイン/アウト、パン、追跡、旋回、昇降、手持ちショットを含む。

カメラワークは互換性がない——それぞれが独特の感情効果を生み出す。正しい用語を知ることが、あなたのプロンプトの効果を根本から変える。

コアカメラワーク

ドリーイン/ドリーアウト(クローズアップ/ロングショット)

レンズが物理的に被写体に近づく(プッシュ)または遠ざかる(プル)。ズームとは異なり、遠近関係が変化する——前景の物体が比例的に拡大し、奥行き感と物理的な接近感を生み出す。

  • 感情効果: 推進は親密感、焦点化、暴露を創出。引きは孤独感、文脈、別れを創出。
  • 使用タイミング: 推進は感情クローズアップ、キャラクターの瞬間、詳細の暴露に。引きはスケールの提示、終幕、主題からの離脱に使用。
  • ヒントフレーズ: カメラが中景から主題の手の極限クローズアップへゆっくりとドリーインする

パン左 / パン右(水平パン)

カメラは固定されたまま水平方向に回転し、まるで頭を回すように。視点がシーンを横切る。

  • 感情効果: 巡視、発見、横方向の追従動作、シーン内の二つの要素を繋ぐ。
  • 使用タイミング: 風景の展示、歩行するキャラクターの追従、空間の広がりの表現。
  • プロンプトフレーズ: Slow pan right across the workshop, revealing rows of handcrafted instruments on the wall(ワークショップを右方向にゆっくりとパンし、壁に並んだ手作りの楽器を映し出す)

ティルトアップ/ティルトダウン(垂直パン/俯仰)

レンズは固定したまま、垂直方向に回転させる——うなずくように。上向きにパンして高さを表現し、下向きにパンして地上の細部を映す。

  • 感情効果: 上方へのカメラ移動は畏敬、壮大さ、憧憬を創出。下方への移動は地に足がついた感覚、発見、表面への親近感を生む。
  • 使用タイミング: 上方移動は高層建築、キャラクターの立ち上がり、空の描写に。下方向のティルトは、机上の物体の提示や、空から地面への移行に使用する。
  • ヒントフレーズ: Camera tilts up from the roots of the ancient tree, following the massive trunk to the canopy(カメラは古代の木の根元から上方向へティルトし、巨大な幹に沿って樹冠まで追う)

トラッキングショット(追跡ショット/サイドトラッキングショット)

レンズは被写体の横を移動し、同じ距離と角度を保ち、まるで被写体の経路と平行なレールに取り付けられているかのようだ。

  • 感情効果: 同伴感、旅路、没入感。観客は主体と共に旅をする。
  • 使用タイミング: 歩行や疾走するキャラクターの追従、空間の移動、表面に沿った製品展示。
  • ヒントフレーズ: カメラは肩の高さでランナーに並走し、路地を疾走する彼女のペースに合わせて移動する

オービット/アーク(周回ショット)

レンズが被写体の周囲を回転しながら、被写体を画面中央に保持する。完全な360度回転または部分的な弧を描くことが可能である。

  • 感情効果: ヒーロー感、力強さ、展示感、立体的な表現。
  • 使用タイミング: 製品展示(全角度の表示)、ヒーローショット、ドラマチックなキャラクター紹介、決定的瞬間。
  • プロンプトフレーズ: カメラがチェスプレイヤーの背後から始まり正面で終わる180度の軌道を描く

クレーンアップ/クレーンダウン(昇降ショット/クレーンショット)

レンズの垂直移動——物理的な上昇または下降——は通常、俯仰と組み合わせて被写体を画面内に保持する。

  • 感情効果: 上昇は超越感、解放感、視野の広がりを創出。下降は着地感、到達感、注意力の集中を創出。
  • 使用タイミング: 上昇は終盤、勝利の瞬間、空撮視点への移行に使用。下降は開始時、到達時、パノラマからクローズアップ構図への移行に使用。
  • ヒントフレーズ: Camera cranes up from ground level, rising above the crowd, revealing the full scale of the festival(カメラが地面から上昇し、群衆の上空へ昇り、祭りの全貌を映し出す)

Handheld(手持ちレンズ)

レンズには微妙な有機的な揺れがある——三脚やスタビライザーに固定されていない。人間のカメラマンが手持ちで撮影する感覚を再現している。

  • 感情効果: 即時性、緊迫感、ドキュメンタリーのようなリアルさ、緊張感、親密さ。
  • 使用シーン: アクションシーン、感情的な会話、ドキュメンタリー風、ホラー映画、没入感が必要なあらゆる場面。
  • ヒントフレーズ: Handheld camera follows the character through the crowded market, slightly unsteady(手持ちカメラが混雑した市場を歩くキャラクターを追う、わずかに揺れながら)

ステディカム/ジンバル(スタビライザーレンズ)

滑らかで浮遊感のあるカメラワークが空間を滑るように移動する。手持ちカメラのような揺れはなく、動きは滑らかで連続的だ。

  • 感情効果: 幻想的、優雅、没入感、軽やかな探索。
  • 使用シーン: 建築空間の移動、複雑な環境をキャラクターが通過する追跡、ワンカット撮影、ラグジュアリーや美意識を表現するショット。
  • ヒントフレーズ: Steadicam glides behind the dancer as she moves through the empty ballroom(ステディカムがダンサーの後ろを滑るように移動し、彼女が空っぽの舞踏場を通り抜ける様子を追う)

上級カメラワーク技術

ヒッチコック・ズーム(ドリー・ズーム/ヴェルティゴ効果)

レンズを前進させながら焦点距離を遠ざける(またはその逆)。被写体は同じ大きさを保つが、背景は激しく歪む——引き伸ばされたり圧縮されたりする。

  • 感情効果: 方向感覚の喪失、悟り、恐怖、世界が固定点を中心に移動する。
  • プロンプトフレーズ: キャラクターの顔にドリーズーム — カメラが押し寄せながらレンズがズームアウトし、背景が遠ざかり、めまい効果を生み出す

ウィップパン(Whip Pan)

非常に速い水平パン。動きの過程で画面全体がぼやける。二つのシーン間のトランジションとしてよく用いられる。

  • 感情効果: エネルギー、驚き、緊迫感、コメディのリズム。
  • ヒントフレーズ: 話者の顔から観客の反応へウィップパン、トランジション中にモーションブラー

ラックフォーカス(焦点移動)

焦点が単一ショット内で一つの深度面から別の深度面へ移行する。前景がぼやけ背景が鮮明になる、あるいはその逆。

  • 感情効果: 注意を再誘導し、情報を明らかにし、前景と背景の要素を結びつける。
  • プロンプトフレーズ: ぼやけた前景の花から背景の女性の顔へ焦点を移す

Dutch Angle オランダ角(傾斜角度)

レンズが横回転軸に沿って傾き、斜めの地平線を作り出す。世界が歪んで見える。

  • 感情効果: 不安、不安定、緊張、様式化されたドラマ、狂気。
  • プロンプトフレーズ: 探偵の顔を捉えたダッチアングルのクローズアップ、15度の傾き、鋭いサイドライト

スピードランプ(速度変化)(タイムランピング(時間変化))

再生速度が単一のショット内で変化する——通常は重要な瞬間に減速し、その後加速する。

  • 感情効果: 強調、衝撃力、特定の瞬間に劇的な重みを与える。
  • プロンプトフレーズ: 衝撃の瞬間にモーションがスローモーションへ移行し、その後リアルタイム速度へ加速する

ワンテイク(ロングテイク)

連続撮影で編集なし。カメラが空間を貫き、動きを追跡し、要素を発見する。全編を通してアングルを切り替えない。

  • 感情効果: 没入感、リアルタイム体験、技術的精巧さ、持続的な緊張感の構築。
  • プロンプトフレーズ: 連続ワンカットショット:カメラが玄関から入り、廊下を滑るように移動し、庭に到着する

一人称視点 / POV

レンズはキャラクターの目を表す。観客はキャラクターが見ているものを見る。これには彼らが画面に手を入れ込むことも含まれる。

  • 感情効果: 最高の没入感、主観的体験、ゲーム美学。
  • プロンプトフレーズ: 一人称視点:重い木戸を両手で押し開けると、陽光に満ちた草原が現れる

Seedance特有のカメラ制御およびストーリーボードタイムラインでの組み合わせ方については、Seedanceプロンプトガイドをご参照ください。


雰囲気キーワードライブラリ

雰囲気は、技術的に正しい動画を感情に訴える作品へと昇華させる鍵です。それは「単なる部屋」と「心に響く部屋」の違いです。このキーワードライブラリは、光と影、トーン、質感、ムードという4つの次元で整理されており、自由に組み合わせて理想の雰囲気を精密に創り出せます。

AI動画プロンプト用雰囲気キーワード参考図表光と影、色調、質感、情緒の4次元で分類視覚的サンプル付き

雰囲気キーワードライブラリ:各次元から1つずつキーワードを選び、動画の感情的特徴を定義します。

光と影のキーワード

光と影は雰囲気の基盤である。プロンプト内の光と影を変更することで、他の要素を一切変えずに、感情を完全に変えることができる。

キーワード(英語/中国語)ビジュアル効果適用シーン
ゴールデンアワー(黄金時)温かみのある琥珀色の光、柔らかな長い影、好ましい肌色ロマンチック、ノスタルジック、旅行、ビューティー
ブルーアワー(青の時刻)深い青の環境光、地平線に残る暖色憂鬱、思索、過渡期、都市の情緒
逆光被写体が後方光源で輪郭を描かれ、顔に影またはシルエットドラマティック、神秘的、ヒーローショット、美感
サイドライト強い方向性光が片側から照射、半分が明るく半分が暗い緊張感、人物クローズアップ、ドラマティックな肖像
レンブラント照明クラシックな肖像光——片側明、暗部には目の下に小さな三角形のハイライト肖像、優雅、古典的雰囲気
Volumetric ボリュームライト可視光線が塵・霧・煙を透過神聖感、演劇、森林シーン、舞台照明
ティンダル効果微粒子による光の散乱、霧の中での明確な光線形成自然、朝景、幽玄、幻想的
ネオン光人工的なカラー光源、ピンク、青、マゼンタが主流サイバーパンク、ナイトライフ、都市、現代
キャンドルライト暖かく、揺らめく、オレンジ琥珀色の点光源親密、歴史、夕食シーン、温もり
Silhouette シルエット主体は完全に暗く、明るい背景の前で輪郭のみで定義される神秘、匿名性、視覚的インパクト、物語性
Bioluminescent 生物発光自発光する有機光源、通常は青緑色幻想的、水中、異星世界、夢幻的

色調キーワード

色調は画面全体の情緒的な温度感を決定する。暖色系は親しみを感じさせ、寒色系は距離感を与える。高彩度は活力を、低彩度は控えめな印象を醸し出す。

キーワード(英語/中国語)視覚効果感情的つながり
Warm palette 暖色系琥珀、オレンジ、ゴールド、赤みがかったトーンが主体快適、ノスタルジー、親密さ、秋
Cool palette 冷色系青、シアン、青石トーンが主体距離感、静けさ、悲しみ、冬、テクノロジー
高彩度鮮やかで強烈な色エネルギー、青春、ファンタジー、ポップカルチャー
低彩度柔らかく、色あせたパステル調憂鬱、写実、回想、レトロ
ティールとオレンジクラシック映画の色調——影は青みがかり、ハイライトは暖色ハリウッド大作、商業、映画的質感
サイバーパンクパレットネオンピンク、電光ブルー、深紫を暗い背景に未来感、ナイトライフ、デジタル、アバンギャルド
Vintage ヴィンテージやや退色、暖色系傾向、明るめのシャドウノスタルジア、70-80年代、インディペンデント映画、回想
アーストーンブラウン、グリーン、セピア、テラコッタ自然、根ざした感覚、有機的、ドキュメンタリー
Kodachrome コダクローム濃厚な赤緑、温かみのある肌色、深い黒報道写真、1960-70年代、アメリカンテイスト

質感/画質キーワード

質感キーワードは映像の視覚的表面を定義する——それは35mmフィルム、洗練された広告、ドキュメンタリー、あるいは油絵のように見える。

キーワード(英語/中国語)視覚効果適用シーン
Cinematic 映画的ワイドスクリーン感、浅い被写界深度、フィルム調カラー物語性、ドラマ、ストーリー
Documentary ドキュメンタリー自然光、やや不完全な構図リアリズム、ニュース、教育
Commercial 商業広告清潔感、明るさ、精密な照明、滑らかなカメラワーク製品展示、広告、企業
Film grain フィルムグレイン画面全体に有機的なノイズテクスチャレトロ、アナログ、インディーズ、温かみ
アナモルフィック 変形ワイドスクリーン水平レンズフレア、楕円形のボケ、軽微な周辺歪み映画ドラマ、SF、叙事詩的
Oil painting texture 油絵テクスチャ筆跡のテクスチャ、豊かな厚塗り感アート、ファンタジー、夢、古典
Ink wash 水墨白地に黒墨のグラデーション、流動的で有機的東洋美学、ミニマル、静寂
8mm / Super 8粗い粒子、漏光、不安定な映像、褪色回想、フラッシュバック、ホームビデオ、ノスタルジア

感情キーワード

感情キーワードはAIに与える感情の方向性です。これらは全てに影響を与えます——リズム、色彩選択、カメラワーク、そして全体の雰囲気です。

キーワード(英語/中国語)喚起される感情組み合わせ提案
Cozy 温かい暖かさ、快適さ、安心感、家庭キャンドルライト、暖色系、室内シーン
Tense 緊張感不安、期待、差し迫った出来事サイドライト、手持ち撮影、クローズアップ構図
Suspenseful 緊張感恐怖、不確実性、徐々に高まる緊張控えめな照明、ゆっくりとした展開、低彩度
Joyful 喜び幸福、祝賀、軽やかさゴールデンアワー、高彩度、ロングショット
Melancholic 憂鬱悲しみ、切望、悲しみの中の美ブルーアワー、寒色系、スローモーション
Epic 壮大雄大、英雄的、畏敬広角、昇降ショット、オーケストラ
Healing 癒し平和、回復、優しい修復ソフトライト、パステル調、自然、スローテンポ
ホラー恐怖、不気味、不安深い影、オランダ角、低彩度、静寂
ロマンティック愛、憧れ、優しさ、親密さ逆光、暖色系、浅い被写界深度、クローズアップ
エネルギッシュ 活力速度、興奮、アドレナリンレンズスウィープ、速度変化、高彩度、広角
ノスタルジック 懐古過去への憧憬、甘酸っぱい記憶フィルムグレイン、レトロトーン、ハイライトオーバー

雰囲気キーワードの組み合わせ:3つの例

真の力は、各次元から一、二つのキーワードを選んで組み合わせることから生まれる。以下の三つの組み合わせは、同じ主題——「窓辺に立つ一人の女性」——に対して全く異なる雰囲気を生み出す:

セット1:温もりとノスタルジア

ゴールデンアワーの逆光、琥珀色と蜂蜜色の温かみのある色調、フィルムグレインの質感、ノスタルジックなムード

組み合わせ二:冷たく緊張感あふれる

単一光源からのサイドライト、クールなティール調の配色、クリーンなデジタルテクスチャー、緊張感あふれるムード

セット3:空霊で夢幻的

薄手のカーテンを透過するティンダル効果の光線、パステル調の配色、水彩画のような質感、癒しのムード

同一の主体、三つの全く異なる動画。雰囲気のキーワードはコントロールパネルである。


一文から映画レベルのプロンプトへ:5つのステップアップ例

プロンプトライティングを学ぶ最良の方法は、プロンプトの進化過程を観察することです。以下の各例は、基礎的なV1(多くの人が書くタイプ)から始まり、V2(具体性とカメラワークの追加)へと改良され、最終的にV3(完全に指定された映画級プロンプト)に到達します。各段階で何が変化し、その理由に注目してください。

さらに多くの即用型動画プロンプトの例については、10個の実用的なAI動画プロンプトをご覧ください。

三段階のプリセット進化比較:V1基本プリセット、V2改良プリセット(カメラワークと光影を追加)、V3映画級プリセット(完全指定)を提示。それぞれに対応する動画品質の向上を実現。

プロンプト進化の実践。V1はAIにほとんど情報を与えない。V3は全てを与える——効果は雲泥の差。

例1:人物/感情 —— 「雨の中を歩く女性」

V1 — 基本版(18語)

A woman walking in the rain at night in a city, cinematic, beautiful

あなたは得るもの:普遍的な女性、普遍的な都市、普遍的な雨、平板な光、感情の共鳴なし。AIは統計的平均値であらゆる空白を埋める。

V2 — 改良版(62語)

A young Asian woman in a long dark coat walks slowly through a rain-soaked Tokyo backstreet at night. Neon signs reflect in the wet pavement, casting pink and blue light. She carries a transparent umbrella. Camera tracks beside her at shoulder height. Shallow depth of field. Melancholic mood.

改善点:具体的な主体のアイデンティティ、具体的な場所、具体的な光源、レンズ位置、感情の方向性。AIは現在、ユニークな画面を生成するのに十分な情報を有している。

V3 — 映画級(138語)

A woman in her late 20s, Japanese, long black hair partially wet and clinging to her neck, wearing an oversized charcoal wool coat over a cream turtleneck, walks alone through a narrow Shinjuku backstreet at 2am. Rain falls in fine sheets, catching neon light from izakaya signs overhead — warm amber kanji characters and cold blue beer advertisements. The wet asphalt mirrors everything, creating a double world beneath her feet. She carries a transparent vinyl umbrella, water beading and streaming down its surface.

Camera: tracking shot at shoulder height, moving alongside her at walking pace, shallow depth of field at f/1.4, foreground rain droplets occasionally crossing the lens out of focus.

Lighting: practical neon sources only — no fill light. Rim light from signs behind her outlines her coat collar and umbrella edge. Her face catches intermittent warm light as she passes each shopfront.

Style: cinematic, Kodak Vision3 500T film stock, slight grain, teal-and-amber color grade, Wong Kar-wai atmosphere.

音:傘の表面に当たる雨音、バーから聞こえる遠くのジャズの音、濡れた石の上を歩く彼女の足音。台詞なし、BGMなし。

(20代の日本人女性。長い黒髪の一部が濡れて首に張り付いている。オーバーサイズのカーボングレーのウールコートに、クリーム色のタートルネックセーターを着ている。午前2時、新宿の狭い路地を一人で歩いている。細かい雨粒が空中を舞う。頭上にある居酒屋のネオン看板——温かな琥珀色の日本語文字と冷たい青色のビール広告——を捉える。濡れたアスファルトは全てを映し出し、彼女の足元に鏡像の世界を作り出す。彼女は透明なプラスチック傘をさしている。水滴が傘の表面に凝結し、流れ落ちる。)

V3が効果的な理由:式における各要素が明確に指定されているためです。AIに推測の余地はありません——推測しないAIは、あなたが記述した内容を正確に再現します。

例2:製品展示 —— 「机の上の時計」

V1 — 基本版(14語)

A luxury watch sitting on a table, product shot, high quality, 4K

V2 — 改良版(58語)

A stainless steel dive watch with a dark blue dial rests on a slab of raw gray marble. Camera orbits slowly around the watch, 15 degrees above. Single key light from the upper left creates a defined shadow. The watch's crystal catches the light and creates a brief flare. Commercial style, clean background.

V3 — 映画級(126語)

A stainless steel dive watch with a sunburst navy-blue dial and ceramic bezel sits on a rough-cut block of Carrara marble, positioned at the golden-ratio intersection of the frame. The second hand sweeps continuously. Micro water droplets bead on the crystal surface and the steel bracelet links, catching light.

Camera: begins in macro extreme close-up on the dial — the indices and lume dots fill the frame — then slowly dollies out while simultaneously orbiting clockwise, completing a 270-degree arc over 8 seconds until the full watch and marble base are revealed in a three-quarter beauty shot.

Lighting: single hard key light at 10 o'clock position, 45 degrees above. No fill — deep shadows on the right side. A subtle rim light from behind separates the watch from the dark charcoal background.

Style: high-end commercial, ultra-sharp 8K downscaled to 4K, zero grain, clinical precision. Color: cool steel tones with warm gold accents from the lume.

音:ほぼ無音——ムーブメントのかすかな機械的なカチカチ音のみ、発光瞬間の一つの澄んだチャイム。

(ステンレススチール製ダイバーズウォッチ。サンレイ仕上げのネイビーブルー文字盤にセラミックベゼル。画面の黄金分割交点に位置する粗削りのカララ大理石の上に置かれている。秒針が絶え間なく動く。水晶ガラス表面とステンレスチェーンリンクに凝縮した微小な水滴が、光を捉えている。)

例3:風景旅行 —— 「日の出の山脈」

V1 — 基本版(12語)

Beautiful mountains at sunrise, drone shot, epic landscape, cinematic

V2 — 改良版(55語)

Snow-capped mountain peaks emerging from a sea of clouds at sunrise. The first rays of sun paint the peaks golden while the valleys remain in blue shadow. Camera cranes up slowly from the cloud layer, revealing the full mountain range. Wide angle, epic scale, warm-to-cool color gradient.

V3 — 映画級(134語)

The Dolomites at sunrise in late autumn. Jagged limestone spires — the Tre Cime di Lavaredo — pierce through a thick layer of valley clouds, their east-facing faces catching the first horizontal rays of sun and turning from cold blue-gray to blazing amber-gold. The cloud layer below is a rolling ocean of soft white and pale peach, filling the valleys completely.

Camera: starts buried inside the cloud layer — visibility near zero, soft white diffusion everywhere — then cranes upward at a steady pace, breaking through the cloud surface to reveal the peaks and the vast sky above. The transition from claustrophobic fog to infinite horizon takes 4 seconds. Continue rising to a high aerial wide shot. 24mm wide angle lens.

Lighting: first light of day — sun at 5 degrees above the eastern horizon, casting extreme raking light across the mountain faces. Golden hour warmth on lit surfaces, blue hour coolness in shadowed areas. Volumetric light beams visible where sun cuts between peaks.

Style: National Geographic cinematic, IMAX-quality, ultra-wide dynamic range, vivid but natural color, no filters.

音:高地の風——持続する低いささやきに時折突風が混じる。音楽も人の声もない。 静寂がスケールを増幅させる。

(深秋の日の出時、ドロミテ山脈。鋸歯状の石灰岩の尖塔——ツェントシュテッフェン——が谷間の厚い雲を突き抜け、東向きの面が水平に差し込む最初の陽光を捉え、冷たい青灰色から灼熱の琥珀色へと変わる。)

例4:アクションシーン —— 「武術家が拳を繰り出す」

V1 — 基本版(15語)

A martial artist doing a spinning kick, action movie style, slow motion

V2 — 改良版(64語)

A female martial artist in a dark training hall performs a spinning back kick. Her bare foot connects with a hanging heavy bag, sending it swinging violently. Camera captures the kick from a low angle, slightly slow motion at the point of impact, then returns to real-time as she recovers her stance. Side lighting creates dramatic shadows.

V3 — 映画級(141語)

A woman in her 30s, lean and muscular, wearing a fitted black tank top and loose gray training pants, stands in a dimly lit martial arts gym. Worn wooden floor, heavy bags hanging in rows, chalk dust suspended in the air. She explodes from stillness — a spinning hook kick that arcs through 360 degrees, her back heel striking a leather heavy bag at head height.

Camera: starts medium shot at 45-degree angle. As the spin begins, camera speed-ramps to 240fps slow motion — her hair whips in an arc, chalk dust traces the path of her foot, the bag surface ripples visibly on impact. Hold for one beat, then ramp back to real-time as she plants her foot. Slight handheld energy.

Lighting: single harsh side light from camera-left, no fill. Chalk dust and sweat particles glow in the light beam.

Style: David Fincher / Fight Club aesthetic — desaturated, greenish-teal undertone, high contrast, gritty. Anamorphic lens with subtle horizontal flares.

音:蹴り前の静寂——ジムの環境音、息を吸う。蹴り:布地が弾ける爆発音、重厚な革の衝撃音、鎖のガタガタ音。接触時の鋭い吐息。音楽なし。

(30代半ばの女性。引き締まった筋肉が浮き出た体躯に、体にフィットした黒のタンクトップとゆったりした灰色のトレーニングパンツを纏い、薄暗い武道館に立つ。磨耗した木製床、列をなすサンドバッグ、空気中に舞う粉塵。彼女は静止状態から爆発的に動き出す——360度回転フックキック、かかとが頭の高さに吊るされた革製サンドバッグを叩きつける。)

例5:情感叙事 —— 「祖母と孫」

V1 — 基本版(16語)

A grandmother and her grandchild spending time together, heartwarming, emotional, beautiful moment

V2 — 改良版(71語)

An elderly grandmother with silver hair and weathered hands teaches her 5-year-old granddaughter how to knead bread dough in a sunlit country kitchen. The child stands on a wooden step stool, flour on her cheeks, laughing. The grandmother guides her small hands through the dough. Golden morning light through a window. Warm color palette. Intimate, cozy atmosphere.

V3 — 映画級(147語)

A Japanese grandmother in her 80s, silver hair in a soft bun, deep expression lines around smiling eyes, wearing an indigo apron over a cream linen blouse, stands beside her granddaughter — age 4 or 5, round cheeks, short black hair with a red clip — at a low wooden table in a traditional kitchen. Shoji screen doors are slid open to a small garden where morning light enters. They are making mochi together. The grandmother's large, weathered hands wrap around the child's tiny ones, guiding them to fold and press the soft rice dough. Flour dust floats in the shaft of sunlight between them.

Camera: close-up on their four hands working the dough — the contrast of old and young skin. Slowly dolly out to a medium shot including both faces. Rack focus between them — first sharp on the grandmother's eyes, then pulling to the child's smile. 85mm portrait lens, f/2.0, creamy bokeh.

Lighting: natural morning sunlight from the garden, soft and directional, Tyndall effect through the flour dust. No artificial light. The light creates a warm halo around the grandmother's silver hair.

Style: Hirokazu Kore-eda film quality — observational, unhurried, documentary intimacy with cinematic beauty. Kodachrome-inspired color. 16:9.

音:生地をこねる手の柔らかなリズミカルな音、庭の外の鳥の声、遠くで鳴る風鈴、時折漏れる子供の笑い声、祖母が口ずさむ民謡のメロディ。 音楽なし — 劇中音のみ。

(80代半ばの日本人祖母。銀髪をゆるく結い、笑う目元には深い表情の皺。紺色のエプロンをクリーム色のリネンシャツの上に羽織っている。四、五歳の孫娘のそばに立つ——丸い頬、赤いヘアクリップをつけた短い黒髪——伝統的な台所の低い木製のテーブルの前で。障子戸が開き小さな庭に向かい、そこから朝の日差しが溢れ込む。二人は一緒に餅をついている。祖母の歳月の痕跡に満ちた大きな手が、子どもの小さな手を包み込み、柔らかい餅の生地を折りたたみ、押しつぶすように導く。小麦粉の粉塵が、二人の間にある一筋の陽光の中で舞っていた。是枝裕和的な映画の質——観察的で、焦らず、ドキュメンタリー的な親密さと映画の美しさ。


プロンプトにサウンドデザインを記述する

音声デザインは動画プロンプト作成において最も見過ごされがちな要素である。2026年、Seedance、Veo 3、可霊などのプラットフォームはいずれも動画同期音声生成をサポートする——音声指示を含む場合と含まない場合では品質の差が極めて大きい。

こう考えてみてください:環境音が一切ない美しい森の風景は、まるでGIFアニメーションのようです。そこに鳥のさえずり、葉のざわめき、遠くで流れる小川のせせらぎが加わると、それはまさに足を踏み入れたくなる場所へと変わるのです。

サウンドデザインフォーマット

プロンプトの末尾に、単独の段落または行で音声コマンドを追加し、以下の3つのレベルをカバーします:

第一層:BGM — 全体の雰囲気とスタイル

Background music: slow ambient piano, minor key, sparse notes with reverb
(背景音乐:缓慢的氛围钢琴,小调,稀疏的音符带混响)

第二層:環境音 — シーンの環境音を構築する

Ambient: light rain on leaves, distant thunder rolls, wet road traffic hum
(环境音:轻柔的雨打树叶声、远处的雷声滚动、湿路上的交通嗡嗡声)

第三層:動作効果音と会話 — 動画内のイベントに関連付けられた特定の音

SFX: footsteps on wet pavement, umbrella opening with a click
Dialogue: none
(音效:湿路面上的脚步声、雨伞咔嗒打开的声音。对话:无)

音声キーワード参考

異なる感情を表現する音楽スタイル:

情緒音楽の方向性(英語のヒント)
平穏アンビエント、ソフトなピアノ、アコースティックギターのフィンガーピッキング、ローファイ
緊張低音ドローン、不協和弦、ミニマルな打楽器のパルス
陽気アップビートなアコースティック、ウクレレ、軽快なパーカッション、長調
叙事詩的オーケストラのクレッシェンド、太鼓、ブラスファンファーレ、合唱
ロマンティック弦楽四重奏、優しいジャズ、ボサノバ
ミステリアスダークアンビエント、リバーブ強めのピアノ、遠くで鳴る鐘の音
エネルギッシュエレクトロニックビート、ドライブ感のあるドラム、重低音、アップテンポ
憂いソロチェロ、マイナーキーのゆっくりとしたピアノ、控えめなギター

環境音:

環境音の階層(英語のヒント)
森林鳥のさえずり、葉のざわめき、遠くのキツツキ、小川
夜の街車の騒音、遠くのサイレン、ネオンのブーンという音、足音
海洋波が砕ける音、カモメ、風、遠くの船のエンジン
屋内カフェコーヒーマシン、ささやき声、陶器にスプーン、ジャズ
雨天雨の強さ(小雨/豪雨)、雷、滴り音
工房工具音、木屑、機械のうなり、バックグラウンドのラジオ

いつ沈黙を使うか

静寂はサウンドデザインの欠如ではない——それは意図的な選択である。戦略的な静寂は創造をもたらす:

  • 衝撃の瞬間:劇的なビート前の静寂がそのビートを増幅させる
  • スケールの感覚:風の音だけが響く広大な風景が無限の広がりを伝える
  • 緊張感:予期される音を排除することで不安を醸成する
  • 焦点化:静寂が全ての注意を視覚へと導く

プロンプトに明記:Sound: silence — no music, no ambient, only the subject's breathing.(音:静寂——音楽なし、環境音なし、被写体の呼吸音のみ)

AI音楽動画制作における音声生成の詳細については、AI音楽動画生成ガイドを参照してください。


プラットフォーム専用プロンプトテクニック

汎用的な公式はどこでも適用できますが、各AI動画プラットフォームはプロンプトの解釈において独自の特徴を持っています。使用するプラットフォームに合わせてプロンプトを最適化することで、効果を大幅に向上させることができます。

同一動画コンセプトに対する5つの異なるAI動画プラットフォーム(Seedance、Sora、可霊、Runway、Veo 3)向けに最適化されたプロンプトの比較

同じコンセプト——「雨夜の道を歩く女性」——を5つの異なるプラットフォーム向けに最適化。同じ公式、異なる重点。

Seedance

強み: ストーリーボード形式のタイムライン、マルチショットシーケンス、画像から動画への参照、内蔵プロンプト生成ツール

最適化テクニック:

  • 複雑なシーケンスにはスナップショットタイムライン構造を使用——動画をタイムスタンプ付きショットに分割:
 Shot 1 (0-3s): [描述]
 Shot 2 (3-6s): [描述]
 Shot 3 (6-10s): [描述]
  • @Image1@Image2でアップロード画像を引用し、スタイルとキャラクターの一貫性を実現
  • カメラワークの表現が極めて効果的——「移動」といった漠然とした表現ではなく、具体的な用語(ドリー、トラック、オービット)を使用
  • サウンドデザインを含む——Seedanceがオーディオの伏線を処理
  • 最も効率的なワークフロー:動画プロンプトジェネレーターでシンプルなアイデアから構造化されたプロンプトを作成し、手動で最適化

Seedance完全版プラットフォーム専用プロンプトガイド(50以上の例付き)。詳細はSeedanceプロンプトガイドを参照。

Sora(OpenAI)

強み: 物理的なリアリズム、自然な動き、長文の自然言語理解。

最適化テクニック:

  • 構造化されたリストではなく、流れるような描写的な段落を使用——Soraは自然言語の解析に長けている
  • 物理的詳細を強調:重力、重量、材質特性、流体力学
  • 何かが「触った感触」を表現する——質感や素材の描写が物理的リアリティを高める
  • アスペクト比と再生時間の仕様を明記する
  • 物理的な動きを詳細に記述:「重い布地が一歩ごとにたわみ揺れ、自重によって動きが遅延する」という表現は「ひらひらしたスカート」よりも効果的

可灵 Kling(快手)

強み: 生成速度が速い、動作と運動表現が優れている、顔の一貫性が良い。

最適化テクニック:

  • プロンプトを簡潔に保つ——焦点を絞り、動作を先導するプロンプトに良く反応する(50-80語が最適範囲)
  • 動作で始める:A dancer leaps and spins(ダンサーが跳躍し回転する)長い情景描写の後に動作を述べるのではなく
  • 移動方向を明確に指定:moves from left to right(左から右へ移動)、approaches camera(カメラに向かって接近)、turns away(背を向けて去る)
  • 身体動作と表情の処理に特に優れる——この特性を活かしたクローズアップ感情プロンプトを作成
  • カメラワーク指示は有効だが、各ヒントは1~2つの動作に留める

通義万相 / Runway(Gen-3 Alpha / Gen-4)

通義万相の最適化テクニック:

  • 中国語のヒントを直接入力可能、翻訳よりも優れた効果を発揮
  • 中国伝統美学要素への理解が優れている——水墨画、中国風、古装シーン
  • 簡潔で明確なスタイルタグの効果が高い

Runway最適化テクニック:

  • テキスト説明とスタイルタグを組み合わせる——Runwayは強力なスタイル理解力を有する
  • 空間ベクトルで動きを記述:movement from bottom-left to top-right(左下から右上への動き)
  • Motion Brush使用時は、テキストプロンプトで全体的なシーンとスタイルに焦点を当て、具体的な動きの領域はブラシで処理
  • Runwayは芸術的スタイルの記述を理解する能力に優れる——"in the style of a Terrence Malick film"(テレンス・マリック風のスタイル)で優れた効果を得られる
  • プロンプトの焦点を維持——複数のショットのシーケンスではなく、毎回明確な単一シーンを生成する

Veo 3(Google DeepMind)

強み: 音声理解、物理シミュレーション、映画品質、より長いシーケンス。

最適化テクニック:

  • 詳細な音声説明を含む——Veo 3はテキストから同期音声を生成
  • 物理的相互作用の詳細な描写:物体の衝突方法、素材の変形方法、光と表面の相互作用
  • 映画撮影の専門用語を使用——Veo 3のトレーニングデータは専門的な映画に大きく偏っている
  • 持続時間とリズムを指定:the scene unfolds slowly over 10 seconds(シーンは10秒かけてゆっくりと展開する)
  • 物理描写が効果を大幅に向上:water splashes upward on impact, droplets catching backlight(水しぶきは衝撃で上方に跳ね上がり、水滴が逆光を捉える)単に「水しぶき」と記述するだけでは不十分

SeedanceとSoraのヒント解釈と出力品質に関する詳細な比較については、Seedance vs Sora比較を参照してください。


あるいは、AIにプロンプトの作成を任せる

あなたは先ほど、動画プロンプトを一から書くための完全なフレームワークを学び終えました。この知識は非常に価値があります——プロンプトの品質をより良く評価できるようになり、細部まで完全に制御する力を与えてくれます。しかし、毎回手動でプロンプトを一つ一つ書く必要はありません。

ワークフロー図はハイブリッド手法を示す:AIが初期構造化プロンプトを生成し、人間が特定の要素をレビュー・最適化し、最適化されたプロンプトが最終動画を生成する

ハイブリッドワークフロー:AIに構造と技術用語を処理させ、最適化ステップであなたの創造的な視点を注入する。

手書き vs. AI使用のタイミング

シナリオ最適な方法
明確なクリエイティブビジョンがあり、求めるものが正確にわかっている手書き——AIが作成した下書きを編集するより速く正確に作成できる
大まかなアイデアはあるが構造が必要AI生成 → 手動で最適化
複数のプロンプトバリエーションを迅速に生成する必要があるAI一括生成 → 最適なものを選別・最適化
プロンプト構造を研究しながら学習中AI生成 → 分析・読解——これが語彙力を蓄積する方法
特定の参照画像に一致させる必要がある手書き——参照画像で見た内容を正確に記述

ハイブリッドワークフロー(推奨)

最も効率的なプロンプト作成プロセスは、AI生成と手動最適化を組み合わせます:

  1. AIから始めよう。 Seedance 動画プロンプト生成ツールにアクセスし、アイデアを1~2文で説明してスタイルを選択し、生成してください。

  2. 批判的に出力を読み解く。 AIはカメラワークの指示、タイムライン、照明、音響を含む構造化されたプロンプトを生成します。全体を通読してください。カメラワークは意図した感情に合致していますか?照明の方向は適切な雰囲気を創出していますか?修正したい細部はありますか?

  3. 手動による最適化。 ここで、あなたの公式、カメラワーク言語、雰囲気キーワードに関する知識が活きてきます。AIが選択したカメラワークを、あなたのビジョンにより合致するものと置き換えます。光と影のキーワードを調整します。AIが把握できない具体的なディテールを追加します——キャラクター固有の特徴、ブランド固有の要件、感情のニュアンスなどです。

  4. 動画を生成する。 最適化されたプロンプトを動画生成ツールに送信します。結果は、完全に手動で作成した初心者向けプロンプトや、完全にAI生成された未検証のプロンプトよりもはるかに優れています。

AIプロンプト生成ツールの完全な操作ガイドについては、AI動画プロンプト生成ツールガイドを参照してください。


映画級効果:見事に融合

最終的なプロンプトを作成しましょう。このガイドのすべて——公式、カメラワークの言語、雰囲気のキーワード、サウンドデザイン——を活用して、真に映画のような効果を生み出します。

**クリエイティブブリーフ:**孤独な宇宙飛行士が火星で植物生命を発見した。

衝撃的な映画品質のAI動画が、孤独な宇宙飛行士が赤い火星の地形にひざまずき、小さな緑の植物を発見する瞬間を捉える。ドラマチックなサイドライティングと立体感のある塵が演出されている。

完全に指定された映画レベルのヒントが生み出す効果は、まるで監督の指示を受けたかのようだ——実際その通りだからだ。あらゆる要素が物語に奉仕している。

完全なプロンプト:

Subject: A solitary astronaut in a dusty, sun-bleached EVA suit — visor partially reflective, scratched from use, mission patches barely legible. The suit is not pristine Hollywood white; it is a working tool, weathered by months on the Martian surface.

Action: The astronaut crouches beside a small crack in the rust-red basalt. Inside the crack, a single tiny green sprout — two delicate leaves, almost translucent — pushes up through the red soil. The astronaut's gloved hand reaches toward it, hesitates, trembles slightly, then gently touches the soil beside it.

Environment: The Martian surface — a flat, rust-red plain scattered with dark basalt rocks, stretching to low eroded hills on the horizon. The sky is a pale butterscotch-pink. Dust devils move in the far distance. The scene feels vast and achingly empty — except for this one tiny green thing.

Camera: Opens with an extreme wide shot — the astronaut is a small figure in the immense Martian landscape. Slow dolly in over 4 seconds to a medium shot. As the astronaut crouches, camera drops to ground level and continues to a close-up of the gloved hand and the sprout. Rack focus: pull from the hand to the astronaut's visor, where we see the sprout's reflection. 65mm lens, anamorphic.

Lighting: Late Martian afternoon — low sun from camera-right, casting long amber-red shadows. The side light sculpts the EVA suit's texture. The sprout's translucent leaves glow with subsurface scattering as sunlight passes through them — the only green in a world of red. Volumetric dust particles drift through the light beam.

Style: Ridley Scott's The Martian meets Terrence Malick's The Tree of Life. Cinematic, anamorphic, muted Martian color palette with the single point of vivid green as deliberate contrast. Subtle film grain.

Sound: Wind — thin, high-pitched Martian wind, unlike Earth wind. The astronaut's breathing inside the suit — measured at first, then quickening. A single sustained low note from a cello enters as the hand reaches for the sprout. No dialogue. No narration.

(孤独な宇宙飛行士が、埃を被り太陽で色褪せたEVA宇宙服を着ている——半透明のマスク、使用痕の刻まれた傷、任務の腕章はほとんど判別できない。宇宙服はハリウッド映画のような真っ白な新品ではなく、数ヶ月にわたる火星表面の風化に耐えた作業用具だ。宇宙飛行士は錆びた赤色の玄武岩の小さな裂け目のそばにしゃがみ込んでいる。裂け目からは、小さな緑の若芽——二枚の細い葉はほとんど透明——が赤い土壌から顔をのぞかせている。宇宙飛行士の手袋がそれに向かって伸び、ためらい、わずかに震え、そしてそっとその横の土に触れる。)

このプロンプトは、7つの公式要素すべて、具体的なカメラワーク言語(ロングショット、クローズアップ、焦点移動)、雰囲気キーワード(ボリュームライト、サブサーフェススキャタリング、ワイルドスクリーン)、サウンドデザイン(環境風音、呼吸音、単一のチェロ音)、スタイル参照(リドリー・スコット、テレンス・マリック)を使用しています。各ディテールは感情の弧線——孤独→発見→畏敬——に奉仕しています。

これが動画プロンプトプロジェクトです。


よくある質問

AI動画のプロンプトはどのくらいの長さにするべきか?

統一された長さ基準はありません。適切な長さは、クリエイティブの複雑さと使用するプラットフォームによって異なります。V1レベル(15-30語)はどのプラットフォームでも汎用的な結果を生成します。V2レベル(50-80語)はほとんどのプラットフォームで最適な範囲です——十分に具体的でありながらモデルを過負荷にしません。V3レベル(100-200語)はSeedanceやSoraなど長いプロンプトをサポートするプラットフォームで最も制御可能な結果を生みます。可霊を使用する際は50-80語程度に抑えてください。重要な指標は文字数ではなく——式の各要素がすべて網羅されているかどうかです。

動画のヒントを書くのに写真撮影の知識は必要ですか?

必要ありませんが、理解すれば非常に役立ちます——そしてこのガイドではまさにその核心知識を教えました。映画学の学位は必要ありません。必要なのは、10~15種類のカメラワーク技法の名称を知り、異なる照明効果の感情的効果を理解し、雰囲気を表現する語彙を身につけることです。カメラワーク用語集雰囲気キーワード集の章をブックマークし、これらの用語が自然に使えるようになるまで繰り返し参照してください。

同じプロンプトは異なるAI動画プラットフォームで使えるのか?

はい——汎用的な公式はどこでも適用できます。ただし、各プラットフォームがプロンプトを解釈する方法は異なります。Sora向けに最適化されたプロンプト(長文・流暢・物理表現重視)は、可霊向けに再構成する必要があるかもしれません(より短く・動作優先)。プラットフォーム固有のテクニックセクションで調整方法を紹介しています。中核となる公式は変わらず、出力形式を適応させるのです。

このガイドとSeedanceプロンプトガイドの違いは何ですか?

Seedanceプロンプトガイドはプラットフォーム固有のものです——Seedanceのショット構成フォーマット、画像参照方法、50以上の即戦力プロンプトを解説します。本ガイドは汎用的なものです——あらゆるプラットフォームで活用できるプロンプト作成の基礎スキルを伝授します。本ガイドを教科書と捉え、Seedanceガイドを特定ツールの実験マニュアルとしてお使いください。

カメラワークの専門用語を知らない場合、どのようにレンズの動きを説明すればよいですか?

まず、観客に見せたいものや感じさせたいことを描写する。「カメラがゆっくりと被写体の顔に近づく」はドリーイン(dolly in)である。(前進)。「カメラが横から人物の歩行を追う」はトラッキングショット(追跡撮影)です。AIプラットフォームは自然言語の説明をかなり理解できます。しかし技術用語(上記のカメラワーク用語集を参照)を学ぶと、明らかに優れた結果が得られます。AIモデルはこれらの専門用語で記述された動画で訓練されているからです。

逆のヒント(望まないもの)を含めるべきですか?

一部のプラットフォームでは逆方向の指示——避けるべき事項に関する指示——をサポートしています。これらは有用です:No text overlays, no watermarks, no blurry frames(文字オーバーレイなし、透かしなし、ぼやけたフレームなし)。しかし、現代のAI動画生成ツールの大半は、品質問題をより効果的に処理するために正方向の指定を推奨します。「悪い照明を避ける」と書く代わりに、「カメラ左からのレンブラント照明」と記述します。「揺れるショットを避ける」ではなく、「滑らかなステディカム運動」と指定します。肯定的指示はAIを望む方向へ導きますが、否定的指示は単に避けるべきことを伝えるだけで、代替案は偶然に委ねられてしまいます。

複数のプロンプト間でキャラクターの一貫性を保つには?

複数回のAI動画生成においてキャラクターの一貫性を保つことは、プロンプト作成における最も困難な課題の一つである。以下の3つの戦略が有効である:(1)極めて具体的なキャラクター描写を使用し、プロンプト間で文字通り繰り返す——20代後半の日本人女性、長い黒髪、オーバーサイズのチャコールグレーウールコート、クリーム色のタートルネック。(2)画像から動画を生成するワークフローを活用する——キャラクターの参照画像をアップロードし、AIにアニメーション化させる。Seedanceは@Image参照でこの機能をサポートしている。(3)可能な限り同一セッション内で同一キャラクターの全クリップを生成し、同じシードまたはスタイル設定を使用する。

動画のキャプション作成を手伝ってくれるツールはありますか?

Seedanceの動画プロンプト生成ツールは自然言語の記述を受け付け、カメラワーク言語、タイムライン、照明、音響デザインを含む完全な構造化されたショットリストプロンプトを生成します。詳細な操作手順はAI動画プロンプト生成ツールガイドをご参照ください。推奨ワークフロー:AI生成 → 手動最適化 → 動画生成。


今すぐより良い動画プロンプトの作成を始めましょう

あなたは今、完全なツールキットを手に入れました:7要素の公式、15種類以上のカメラワーク手法を含むカメラ言語リファレンス、50以上の用語を網羅した4次元の雰囲気キーワードライブラリ、基礎から映画級への進化を示す5段階の進歩的サンプル、サウンドデザインの方法論、そしてプラットフォーム固有の最適化テクニックです。

アマチュアとプロのAI動画制作の差はツールにあるのではなく、プロンプトにある。そしてプロンプト作成は練習を重ねることで上達するスキルである。

三つの開始方法:

  1. 公式の練習。 任意のテーマを選び、V1 → V2 → V3のバージョンを作成する。出力結果を比較する。改善は即座に顕著に現れる。

  2. プロンプトジェネレーターを使用する。 AIに構造を処理させ、カメラワークや雰囲気に関する知識を活用して出力を最適化する。動画プロンプトジェネレーターを試す →

  3. 最初の動画を生成しましょう。 最高のプロンプトを用意して、今すぐ動画を作成してください。動画生成ツールを開く →

より多くのプロンプトのインスピレーションとすぐに使える例:

Seidance 2.0を探索 →

あなたが作る最高のAI動画は、次に書くプロンプトから始まります。

Seedance 2.0 AI

Seedance 2.0 AI

AI動画とクリエイティブ技術