Abstrak
Sebagian besar prompt video AI menghasilkan hasil yang buruk, terutama karena tiga alasan: ketidakjelasan, instruksi yang bertentangan, dan deskripsi gerakan yang tidak memadai. Artikel ini menggunakan 10 prompt skenario dunia nyata untuk menunjukkan cara membuat prompt yang efektif—masing-masing diiterasi dari versi V1 yang lemah hingga versi V3 yang disesuaikan, dengan jelas menunjukkan apa yang diubah, mengapa diubah, dan di mana kelemahannya. Semua prompt siap untuk disalin dan ditempelkan ke generator utama seperti Seedance, Sora, Kling, dan Runway. Setelah membaca, Anda akan menguasai struktur inti prompt dan mendapatkan perpustakaan praktis yang mencakup skenario seperti potret film, iklan produk, animasi, makanan, mode, olahraga, generasi gambar ke video, dan iklan TV merek. Buka Seedance sekarang untuk mencoba prompt ini →
Catatan: Saat ini, hampir semua generator video AI utama (termasuk produk lokal seperti KeLing dan JiMeng) mendukung masukan prompt dalam bahasa Inggris, dengan prompt bahasa Inggris umumnya menghasilkan hasil yang lebih baik. Contoh prompt dalam artikel ini tetap menggunakan bahasa Inggris asli sambil menyertakan penjelasan dalam bahasa Mandarin, sehingga Anda dapat memahami tujuan desain di balik setiap prompt sebelum menyalin dan menggunakannya secara langsung.

Konsep kreatif yang sama dapat menghasilkan hasil yang sangat berbeda antara prompt yang samar dan prompt yang dirancang dengan cermat.
Mengapa Kebanyakan Prompt Video AI Tidak Berfungsi dengan Baik
Anda memasukkan teks ke dalam alat video AI, mengklik 'Generate', namun hasilnya sama sekali tidak mirip dengan gambaran yang ada di benak Anda. Hampir semua orang pernah mengalami kesenjangan ini, dan alasan di baliknya sebenarnya dapat diprediksi dan diatasi.
Tiga Pola Kegagalan yang Paling Umum
- Deskripsi tersebut terlalu samar. Prompt seperti "matahari terbenam yang indah" memberikan AI hampir tidak ada petunjuk sama sekali—lokasi pengambilan gambar, subjek, perubahan cahaya, atau suasana yang diinginkan semuanya tidak ada. Prompt yang terlalu umum seperti itu hanya akan menghasilkan gambar yang biasa-biasa saja dan mudah dilupakan.
2. Instruksi yang bertentangan. "Sebuah bidikan close-up sudut lebar dari seseorang yang berlari kencang dalam gerakan lambat" — close-up dan sudut lebar bertentangan, begitu pula gerakan lambat dan gerakan cepat. AI mencoba memenuhi instruksi yang tidak mungkin ini secara bersamaan, menghasilkan visual yang kacau.
- Tidak ada deskripsi gerakan. Konversi teks ke video bukanlah konversi teks ke gambar. Jika Anda hanya mendeskripsikan adegan statis tanpa memberitahu AI apa yang bergerak atau bagaimana gerakannya, banyak generator akan menghasilkan gambar statis dengan efek pernapasan yang halus. Anda harus secara eksplisit memberitahu AI bagaimana gerakan terjadi dalam adegan tersebut.
Tiga Pilar Prompt yang Baik
Sebuah prompt video AI yang baik terdiri dari tiga unsur utama:
- Subjek yang Jelas: AI secara tepat mengetahui apa yang harus ditampilkan. Bukan "seorang manusia", tetapi "seorang wanita berusia 30-an dengan rambut hitam bergaris perak yang mengenakan jaket kulit yang sudah usang".
- Gerakan yang Terdefinisi: Aksi berlangsung di dalam bingkai. Subjek bergerak, kamera bergerak, partikel berterbangan, kain berkibar, cahaya berubah. Gerakanlah yang memberikan makna pada video.
- Atmosfer yang terdefinisi: Pencahayaan, suhu warna, suasana, dan gaya bukanlah tambahan opsional; mereka adalah faktor kunci yang menentukan apakah hasil akhir adalah "demo teknis" atau "karya profesional".
Pemikiran Iteratif
Penulis prompt terbaik tidak pernah membuat prompt yang sempurna dalam satu kali coba; mereka mengandalkan proses iterasi. Setiap prompt dalam artikel ini mengikuti pendekatan tiga versi yang progresif:
- V1 —— Upaya dasar. Apa yang kebanyakan orang masukkan pada awalnya. Menghasilkan gambar tetapi tetap generik dan kurang kontrol.
- V2 —— Rincian tambahan. Mengintegrasikan pengaturan spesifik, pencahayaan, pergerakan kamera, atau suasana. Hasil yang secara signifikan lebih baik.
- V3 —— Versi akhir. Subjek, gerakan, suasana, komposisi, pencahayaan, dan pengatur kualitas visual semuanya sudah terpasang. Setiap elemen bekerja secara sinergis untuk menghasilkan gambar yang lengkap dan menarik.
Proses iteratif ini mengajarkan Anda jauh lebih banyak daripada sekadar 'prompt sempurna' apa pun. Anda akan memahami perubahan yang dibawa oleh setiap penambahan, dan mengapa hal itu penting.
Anatomi Prompt Video AI
Semua prompt yang bagus mengikuti formula yang sama:
[主体 Subject] + [动作/运动 Action] + [风格/情绪 Style] + [运镜 Camera] + [光线 Lighting] + [画质 Quality]Setiap elemen memiliki peran spesifiknya masing-masing:
| Elemen | Kontrol | Contoh | |------|-------- -|------| | Subjek | Siapa/apa yang ada dalam bingkai | "Seorang wanita muda dengan rambut merah kecokelatan yang bergelombang mengenakan mantel wol abu-abu gelap" | | Aksi | Apa yang terjadi, apa yang bergerak | "berjalan perlahan melalui salju yang turun, napas terlihat di udara dingin" | | Gaya | Estetika visual dan nada emosional | "melankolis, warna bumi yang lembut, estetika film indie" | | Kamera | Ukuran bidikan dan gerakan | "shot pelacakan sedang dari samping, dolly lambat" | | Pencahayaan | Sumber cahaya, tekstur, arah | "cahaya musim dingin yang mendung, bayangan lembut yang tersebar, nada biru yang sejuk" | | Kualitas | Spesifikasi teknis | "8K, kedalaman bidang yang dangkal, lensa anamorphic, butiran film" |
Tidak setiap prompt perlu mencakup keenam elemen tersebut, tetapi semakin banyak elemen yang Anda sertakan, semakin besar kendali yang Anda miliki atas output yang dihasilkan. Di bawah ini, kami menunjukkan efektivitas praktis pendekatan ini melalui sepuluh skenario dunia nyata.
Prompt #1: Potret Sinematik — "Foto yang Diberikan Kehidupan"
Membuat Latar Belakang
Sebuah potret sinematik, seolah-olah diambil dari film pemenang penghargaan. Subjeknya tidak berpose—dia sedang menjalani momen tersebut. Angin mengacak-acak rambutnya, ekspresinya memancarkan kedalaman tertentu, dan cahaya membentuk fitur wajahnya seperti lukisan Renaisans.
V1 — Upaya Awal
A woman looking at cameraInilah yang biasanya dimasukkan oleh pemula. Hasilnya adalah potret depan yang monoton, mirip paspor: ekspresi netral, pencahayaan default, dan sama sekali tidak ada nuansa latar belakang atau narasi. AI tidak menerima informasi tentang emosi, adegan, atau gaya visual, jadi yang Anda dapatkan hanyalah output acak.
V2 — Rincian Tambahan
A woman with dark curly hair looks directly at the camera with a slight
smile. Wind blows her hair across her face. She stands in a golden wheat
field at sunset. Warm light on her skin.Kemajuan yang signifikan telah dicapai. Adegan (ladang gandum), waktu (matahari terbenam), interaksi fisik (angin yang menerpa rambut), dan ekspresi wajah (senyuman) kini telah hadir. Namun, parameter kamera spesifik, arah cahaya yang tepat, dan pengatur kualitas gambar masih belum tersedia.
V3 — Versi Final
Cinematic close-up portrait of a woman in her late 20s with dark curly
hair and deep brown eyes. She gazes directly into the camera with quiet
intensity, lips slightly parted. A warm breeze lifts strands of hair
across her face. She stands in a vast golden wheat field stretching to
the horizon. Golden hour backlighting creates a luminous halo around her
hair and shoulders. Warm amber fill light from a reflector below. Slow,
subtle dolly in. Shallow depth of field, f/1.4, 85mm lens. Gentle lens
flare from the low sun. Film grain, anamorphic bokeh. Ultra-realistic
cinematic 4K quality.
Proses iteratif V1 hingga V3: konsep yang sama berkembang dari potret biasa menjadi potret berkualitas sinematik yang menampilkan pencahayaan, pergerakan kamera, dan kedalaman atmosferik.
Mengapa prompt ini efektif
- Lensa 85mm + bukaan f/1.4 menandakan perspektif terkompresi yang dihasilkan AI dan kabur latar belakang yang lembut—tekstur khas potret profesional.
- Pencahayaan belakang + cahaya pengisi berwarna amber menciptakan lapisan pencahayaan tiga dimensi. Pencahayaan belakang memisahkan subjek dari latar belakang, sementara cahaya pengisi mencegah wajah menjadi siluet.
- Gerakan dolly lambat memperkenalkan gerakan halus tanpa mengganggu subjek, menciptakan kesan seolah-olah tertarik ke dalam bingkai.
- "Intensitas tenang, bibir sedikit terbuka" memberikan target emosional kepada AI daripada sekadar deskripsi fisik.
Varian
Varian A — Potret Kota di Malam Hujan:
Cinematic close-up of a man in his 30s with a shaved head and stubble,
standing still on a rain-soaked city street at night. Rain streams down
his face. He stares into the distance with exhausted resolve. Neon signs
reflect pink and blue on the wet pavement behind him. Shallow depth of
field. Slow push-in. Anamorphic lens flares. Cool blue tones with warm
neon accents. Ultra-realistic 4K, film grain.Varian B — Potret Seorang Lansia di Salju:
Tight close-up of an elderly woman with silver hair and deep laugh lines,
eyes glistening with emotion. She stands outdoors in gently falling snow.
Snowflakes settle on her dark wool shawl. Overcast soft light. A single
warm tear traces down her weathered cheek. Extremely shallow depth of
field. Static camera, no movement. 85mm lens. Muted, desaturated color
palette. Cinematic 4K, photorealistic.Prompt #2: Tampilan Produk — "Kemewahan yang Mengapung"
Pengaturan
Sebotol parfum premium yang dipamerkan layaknya perhiasan—digantung, berputar, dan memantulkan cahaya. Adegan semacam ini secara tradisional mengharuskan merek untuk mengeluarkan puluhan ribu poundsterling untuk menyewa studio profesional. Dengan prompt yang tepat, AI dapat menghasilkan video produk berkualitas komersial dalam hitungan detik. Baik Anda penjual e-commerce maupun pemilik merek, visual ini mampu mencapai tingkat konversi yang sangat tinggi di TikTok dan Xiaohongshu.
V1 — Upaya Awal
A perfume bottle on a tableHasil: Sebotol parfum biasa-biasa saja tergeletak di atas meja yang tidak mencolok. Tidak ada drama, tidak ada daya tarik, tidak ada keinginan untuk membelinya. Ketika Anda memberikan instruksi yang biasa-biasa saja kepada AI, ia hanya dapat menghasilkan gambar yang biasa-biasa saja.
V2 — Rincian Tambahan
A luxury glass perfume bottle with gold accents floating in mid-air against
a dark background. Soft light reflects off the glass surface. The bottle
slowly rotates. Professional product photography style.Kemajuan yang signifikan. Fitur-fiturnya meliputi efek levitasi, kontras dengan latar belakang gelap, pantulan cahaya, dan referensi gaya. Namun, peningkatan lebih lanjut masih mungkin dilakukan melalui pengaturan pencahayaan yang presisi, elemen atmosferik, dan pergerakan kamera.
V3 — Versi Final
A luxury crystal perfume bottle with faceted edges and a gold cap floats
weightlessly in a void of deep matte black. The bottle rotates slowly on
its vertical axis, completing a quarter turn. Razor-sharp caustic light
refractions dance across the glass surface. Two opposing strip lights --
one warm amber, one cool white -- create dramatic dual-tone reflections on
the faceted crystal. Tiny golden particles drift lazily through the air
around the bottle. A single droplet of amber liquid clings to the bottle's
shoulder, catching the light. Smooth orbiting camera movement. Extreme
product close-up. 8K commercial quality, ultra-sharp focus throughout,
professional studio lighting.
V1 hingga V3: Sebotol parfum berkembang dari foto meja biasa menjadi tampilan produk komersial berkualitas tinggi yang dilengkapi dengan pencahayaan profesional dan detail atmosferik.
Mengapa prompt ini efektif
- "Matte black" latar belakang hitam murni menghilangkan semua gangguan, memfokuskan perhatian sepenuhnya pada produk. Ini merupakan praktik standar dalam fotografi mewah.
- Dua strip cahaya (amber hangat + putih dingin) menciptakan pantulan multi-tonal yang memberikan kesan elegan pada produk kaca. Sumber cahaya tunggal akan membuat produk jadi terlihat murahan dan datar.
- "Refleksi cahaya caustic" adalah istilah teknis yang dipahami dengan baik oleh model AI. Istilah ini memicu pola cahaya rumit yang dihasilkan oleh objek transparan.
- Partikel emas menambahkan kedalaman lingkungan tanpa bersaing dengan produk untuk menarik perhatian.
Varian
Varian A — Peluncuran Produk Teknologi:
A matte black wireless earbud case floats against a gradient of deep
navy to black. The case slowly opens, revealing pearl-white earbuds inside.
Volumetric blue light emanates from within the case. Tiny light particles
drift upward. Orbiting camera. Edge-lit rim lighting in electric blue.
Ultra-clean, Apple-style product aesthetic. 8K, ultra-sharp.Varian B — Iklan Produk Kosmetik:
A rose-gold lipstick tube rotates slowly against soft pink studio
backdrop. The cap twists off and separates, floating beside the tube.
Creamy lipstick bullet catches soft ring light. Rose petals in soft focus
drift across the foreground. Smooth macro close-up. Beauty commercial
lighting with soft key and gentle fill. Ultra-realistic 4K.Prompt #3: Epik Alam — "Pemandangan Udara"
Pengaturan
Sebuah pemandangan epik yang memukau—seperti yang biasa Anda lihat dalam dokumenter alam atau adegan pembuka film bergenre Lord of the Rings. Di balik gambar-gambar tersebut terdapat rasa skala, kedalaman atmosfer, dan keagungan yang luar biasa. Digunakan sebagai pembuka video pemandangan di Bilibili atau Douyin, pemandangan ini memberikan dampak visual yang luar biasa.
V1 — Upaya Awal
Mountains with cloudsAnda akan mendapatkan pegunungan. Anda akan mendapatkan awan. Anda tidak akan mendapatkan keagungan. AI tidak memiliki panduan mengenai waktu, dinamika cuaca, rasa skala, komposisi, atau suasana, sehingga menghasilkan wallpaper desktop default sistem.
V2 — Rincian Tambahan
Dramatic mountain range at sunrise with clouds flowing through the valleys.
Golden light hits the peaks. Aerial drone shot slowly moving forward.
Mist and fog in the valleys below. Epic landscape photography.Peningkatan yang signifikan. Dengan mempertimbangkan waktu (matahari terbit), arah cahaya, efek atmosfer, pergerakan kamera, dan referensi gaya yang telah diterapkan. Namun, untuk mencapai kualitas sinematik yang sesungguhnya, referensi geografis spesifik, kondisi cuaca dinamis, dan kata kunci fidelitas visual tingkat produksi tetap menjadi hal yang esensial.
V3 — Versi Final
Epic aerial establishing shot of a jagged snow-capped mountain range
resembling the Dolomites at dawn. The camera drifts slowly forward over
a sea of low-lying clouds that fill the valleys like white rivers.
Golden-pink alpenglow illuminates the highest peaks while the valleys
remain in cool blue shadow. Wisps of cloud catch on rocky spires and
trail into the wind. A single eagle soars far below the camera, its
wings outstretched against the cloud sea. Volumetric god rays break
through a gap between two peaks. Slow, majestic forward dolly. IMAX
quality, ultra-wide 21:9 aspect ratio, photorealistic, extreme detail
in rock textures and snow patterns. 8K resolution.
V1 hingga V3: Pemandangan pegunungan biasa diubah menjadi adegan pembuka berstandar IMAX yang menampilkan pencahayaan volumetrik, lautan awan yang mengalir, dan kesan skala monumental.
Mengapa prompt ini efektif
- "Mirip dengan Dolomites" memberikan referensi geografis spesifik kepada AI. Topografi nyata menghasilkan struktur geologis yang lebih kohesif daripada gunung-gunung abstrak.
- "Alpenglow" merujuk pada fenomena cahaya spesifik—di mana puncak gunung bersinar merah muda hangat sebelum matahari terbit. Data pelatihan AI mencakup fotografi alam yang luas, memungkinkan AI memahami istilah ini.
- Seekor elang memberikan referensi skala hidup. Tanpa itu, adegan mungkin terlihat seperti model miniatur. Seekor burung yang terbang di lanskap yang luas menyampaikan rasa "keagungan".
- "Sinar Tuhan menembus celah" menciptakan titik fokus visual dalam komposisi, mengarahkan pandangan penonton.
Varian
Varian A — Badai Mendekat:
Dramatic time-lapse-style shot of a vast Icelandic black sand desert.
Towering cumulonimbus storm clouds roll in from the horizon, their bases
dark and heavy with rain. Lightning flickers within the cloud mass.
A solitary volcanic peak stands defiant in the middle distance. The light
shifts from warm gold to ominous green-grey as the storm advances.
Wide-angle static camera. 4K cinematic, photorealistic.Varian B — Ketenangan Tropis:
Aerial overhead shot drifting slowly over a turquoise tropical lagoon.
Crystal-clear water reveals coral reefs and white sand below. A small
wooden boat with a red sail drifts lazily across the lagoon. Palm trees
line the crescent beach. Gentle ripples catch sunlight and create dancing
caustic patterns on the seabed. Golden afternoon light. Smooth, dreamlike
camera movement. 4K ultra-realistic, vivid but natural colors.Prompt #4: Pemandangan Jalanan Kota — "Nadi Kota"
Pengaturan
Sebuah jalan kota yang ramai pada malam hari. Hujan, lampu neon, pantulan di tanah, dan pergerakan pejalan kaki saling berpadu untuk menciptakan sensasi yang mendalam, seolah-olah Anda berdiri di sudut jalan pada pukul dua pagi. Adegan-adegan semacam ini sangat populer dalam kategori "urban stroll" di platform Douyin dan Bilibili.
V1 — Upaya Awal
A city street at nightHasil: Sebuah massa bangunan gelap yang kabur, mungkin dengan beberapa lampu. Tidak ada suasana, tidak ada narasi, tidak ada keunikan visual. "Pemandangan malam kota" bisa saja merupakan jalan perumahan yang tenang atau Times Square—AI sama sekali tidak mampu membedakannya.
V2 — Rincian Tambahan
A rainy city street at night with neon signs reflecting on the wet
pavement. People walk with umbrellas. A taxi passes through a puddle,
splashing water. Colorful lights everywhere. Cinematic look.Dengan cuaca, pantulan, aktivitas karakter, dan kendaraan yang sudah ditempatkan, adegan mulai hidup. Namun, untuk benar-benar menonjol, diperlukan penetapan gaya estetika tertentu, perilaku kamera, dan hierarki pencahayaan.
V3 — Versi Final
A rain-soaked Tokyo side street at night. The narrow road glistens with
reflections of dozens of vertical neon signs in Japanese characters --
hot pink, electric blue, acid green. A lone figure in a black trench coat
walks away from the camera, their silhouette dark against the neon glow.
Steam rises from a ramen shop's exhaust vent on the left. A bicycle
leans against a vending machine glowing soft white. Rain falls steadily,
each drop catching neon color as it descends. Slow tracking shot following
the figure from behind. Shallow depth of field: the figure is sharp, the
distant neon blurs into bokeh circles. Wet pavement acts as a mirror,
doubling every light source. Anamorphic lens flares. Blade Runner meets
Lost in Translation atmosphere. 4K cinematic, film grain, moody cool
blue-purple color grade.
V1 hingga V3: Pemandangan malam yang kabur berubah menjadi pemandangan jalanan hujan yang diterangi neon, dengan komposisi bingkai yang rapi, efek cuaca dinamis, dan referensi sinematik.
Mengapa prompt ini efektif
- "Gang kecil di Tokyo" mengaitkan AI dengan leksikon visual spesifik: lorong-lorong sempit, papan iklan vertikal yang padat, dan mesin penjual otomatis. Istilah yang samar "kota" tidak memiliki kohesi ini.
- "Sosok tunggal dalam mantel hujan hitam berjalan menjauh" memberikan titik fokus naratif dan jalur pergerakan dalam adegan pelacakan.
- "Trotoar basah bertindak sebagai cermin" secara eksplisit menginstruksikan AI untuk menghasilkan efek penggandaan pantulan—elemen visual paling berdampak dalam sinematografi malam hujan.
- Referensi film (Blade Runner + Lost in Translation) memberikan AI target estetika yang tepat, jauh lebih efektif daripada arahan samar "sinematik".
Varian
Varian A — Pasar Siang Hari:
Bustling narrow market street in Marrakech at midday. Colorful fabric
awnings in saffron, cobalt, and crimson create dappled shade patterns on
the ground. Merchants arrange pyramids of spices in copper bowls. Dust
motes float in shafts of sunlight. A cat sits atop a stack of woven
rugs. Steady handheld camera walking slowly through the market. Warm,
saturated color palette. Documentary-style 4K, natural lighting.Varian B — Kota Metropolis Masa Depan:
A massive elevated highway cuts through a futuristic megalopolis at dusk.
Flying vehicles stream along neon-lit lanes above and below. Holographic
advertisements flicker on the sides of impossibly tall buildings.
A distant megastructure disappears into clouds. Rain falls sideways in
the wind. Low-angle wide shot from a pedestrian bridge. Teal and orange
color palette. Cyberpunk 2077 aesthetic. 4K ultra-detailed.Prompt #5: Anime dan Fantasi — "Pertempuran Terakhir Samurai"
Pengaturan
Seorang samurai bergaya anime berdiri teguh di hadapan pertempuran yang mustahil. Kelopak bunga sakura, efek energi, dan langit yang dramatis bersatu membentuk adegan yang mirip dengan adegan kunci dari film animasi beranggaran besar. Bagi pembaca yang sering menonton anime di Bilibili, gambaran semacam ini sangat berkesan.
V1 — Upaya Awal
An anime character with a swordHasil: Sebuah figur kaku dan generik yang memegang pisau. Tidak ada pose dinamis, tidak ada latar belakang, dan tidak ada definisi gaya. "Anime" adalah kategori luas yang mencakup puluhan sub-gaya; AI hanya akan secara default menghasilkan variasi yang paling umum.
V2 — Rincian Tambahan
A female anime warrior in ornate samurai armor stands on a cliff edge
holding a glowing katana. Cherry blossoms fall around her. A dramatic
sunset sky behind her. Detailed anime art style with clean line work.Kemajuan yang signifikan telah dicapai. Rincian spesifik untuk armor dan senjata (termasuk pencahayaan), elemen lingkungan (bunga sakura, tebing), dan langit telah ditetapkan. Namun, masih diperlukan penyempurnaan lebih lanjut dalam efek visual, spesifikasi gaya seni yang presisi, dan integrasi gerakan.
V3 — Versi Final
A fierce female samurai warrior stands at the edge of a shattered cliff
overlooking a burning battlefield far below. She wears battle-worn
crimson and black lacquered armor with gold filigree, one shoulder plate
cracked. Her long white hair whips violently in a supernatural wind.
She grips a katana that radiates crackling blue-white energy along its
blade. Cherry blossom petals swirl upward in a vortex around her. The
sky is a dramatic gradient from blood-red at the horizon through deep
violet to black overhead. Lightning forks across the clouds. The camera
slowly orbits around her in a dramatic reveal. High-detail cel-shaded
anime style with dynamic ink-line edges. Ufotable studio quality.
Vibrant color palette. 4K ultra-detailed.
V1 hingga V3: Karakter anime biasa diubah menjadi keyframe berkualitas studio yang menampilkan efek supranatural, narasi lingkungan, dan teknik pengambilan gambar sinematik.
Mengapa prompt ini efektif
- "Kualitas studio Ufotable" merujuk pada studio animasi yang terkenal karena efek visualnya (Demon Slayer, Fate series). Model AI memahami estetika khas studio tersebut.
- Detail luka pertempuran ("satu pelat bahu retak") memperkaya kedalaman naratif. Pejuang ini telah mengalami pertempuran, menceritakan kisah tanpa dialog.
- "Kelopak bunga sakura berputar ke atas dalam pusaran" memberikan arah gerak yang jelas. "Bunga sakura yang jatuh" adalah klise statis, sedangkan pusaran ke atas menyiratkan kekuatan supernatural.
- "Energi biru-putih yang berkilauan di sepanjang bilah" memperkenalkan efek cahaya dinamis—elemen krusial yang mengangkat adegan anime dari ilustrasi menjadi animasi.
Varian
Varian A — Penyihir Fantasi Gelap:
A hooded dark elf sorcerer floats cross-legged above a stone altar in
an ancient underground temple. Runes carved into the floor pulse with
deep emerald light. Dozens of ancient tomes orbit slowly around the
sorcerer, their pages fluttering. Dark energy coils from the sorcerer's
outstretched hands like living smoke. Candlelight flickers on obsidian
walls. Slow push-in camera. Dark Souls meets Studio Ghibli aesthetic.
Painterly digital art style. 4K ultra-detailed.Varian B — Pilot Mekanik:
Dramatic low-angle shot of a massive humanoid mech standing in a
destroyed cityscape. Rain pours down its scarred titanium armor. The
cockpit glows warm amber. One hand grips a massive energy cannon, still
smoking from a recent shot. Sparks shower from a damaged joint. The
pilot is visible as a small silhouette through the cockpit glass.
Lightning illuminates the scene. Gundam-inspired mecha design.
Cel-shaded anime with hyper-detailed mechanical rendering. 4K.Prompt #6: Fokus Kuliner — "Tuangan Sempurna"
Pengaturan
Sebuah close-up kopi yang dituang, begitu hidup hingga Anda hampir bisa mencium aromanya melalui layar. Setiap iklan makanan mengandalkan adegan seperti ini: cairan yang mengalir perlahan, uap yang naik dalam gumpalan, dan warna hangat yang memicu nafsu makan. Dalam produksi profesional, adegan semacam ini membutuhkan rig khusus dan lensa makro. Dengan AI, Anda hanya perlu mendeskripsikannya. Sempurna untuk konten food blogger di platform seperti Xiaohongshu dan Douyin.
V1 — Upaya Awal
Coffee being pouredHasil: Cairan cokelat dituangkan ke dalam cangkir. Tidak ada lapisan sensorik, tidak ada daya tarik, tidak ada detail close-up, tidak ada uap. AI menganggapnya sebagai tindakan fungsional daripada pengalaman sensorik.
V2 — Rincian Tambahan
A close-up of rich dark coffee being poured from a ceramic pitcher into
a white cup. Steam rises from the cup. Warm morning light from a window
illuminates the scene. Cozy kitchen background. Slow motion pour.Close-ups, objek tertentu, uap, pencahayaan arah, dan gerakan lambat semuanya berkontribusi pada visual yang menarik. Namun, untuk mencapai kualitas sekelas iklan makanan, diperlukan detail tingkat mikro dan kontrol presisi atas tekstur, interaksi cahaya, dan dinamika gerakan.
V3 — Versi Final
Extreme macro close-up of dark espresso being poured in slow motion from
a brushed copper Turkish coffee pot into a handmade ceramic cup with a
crackle-glaze finish. The liquid cascades in a thick, syrupy ribbon,
creating a swirling crema pattern as it hits the surface. Delicate
wisps of steam curl and dance upward, backlit by warm golden morning
light streaming through a frosted window to the right. Individual micro-
bubbles form and pop on the crema surface. A cinnamon stick and star
anise rest on the saucer beside the cup. Shallow depth of field with the
pour in razor-sharp focus and the background melting into warm bokeh.
The camera slowly drifts downward to follow the pour. Food commercial
cinematography. Warm amber-brown color grade. 8K ultra-realistic,
appetizing, sensory.
V1 hingga V3: Seduhan kopi biasa diubah menjadi foto makro berkualitas iklan yang menampilkan uap dinamis, pola crema yang rumit, dan pencahayaan yang memikat.
Mengapa prompt ini efektif
- "Pita sirup" menggambarkan tekstur kental spesifik yang menyampaikan kesan kualitas. Aliran tipis dan encer terlihat murahan, sedangkan aliran tebal dan terkontrol menyampaikan kesan mewah.
- "Gelembung mikro terbentuk dan meletus di atas crema" mendorong AI untuk fokus pada detail permukaan yang hanya terlihat dalam fotografi makanan makro. Tingkat detail ini menandakan keahlian profesional.
- Uap yang diterangi dari belakang adalah teknik visual paling "menarik" dalam fotografi makanan. Uap hanya terlihat dengan pencahayaan belakang; menyatakan hal ini secara eksplisit memastikan AI menempatkan sumber cahaya dengan benar.
- Props (batang kayu manis, bintang adas) menambahkan konteks sensorik, memungkinkan penonton hampir mencium aroma adegan tersebut.
Varian
Varian A — Air Terjun Cokelat:
Extreme slow motion close-up of liquid dark chocolate pouring over a
stack of fresh strawberries on a marble slab. The chocolate flows in
thick rivulets over the red fruit, glistening under warm studio
spotlights. A dusting of gold leaf catches the light. Chocolate drips
from the edge of the marble in slow motion. Macro lens, razor-sharp
focus on the pour point. Dark moody background. Luxury food commercial
quality. 4K ultra-realistic.Varian B — Bir Kerajinan:
Close-up of an amber craft beer being poured into a tulip glass at a
45-degree angle. Golden liquid flows down the inside of the glass,
building a creamy white head of foam. Tiny bubbles stream upward through
the beer. Warm backlight makes the liquid glow like amber. Condensation
forms on the outside of the cold glass. A wooden bar surface with
scattered hops visible in soft focus. Slow motion. 4K commercial quality.Prompt #7: Mode dan Kecantikan – "Momen di Catwalk"
Pengaturan
Momen editorial mode—kain yang berkibar, pencahayaan yang artistik, dan kesan kemewahan yang mendominasi. Ini bukan sekadar foto biasa, melainkan pernyataan niat yang kuat. Baik untuk konten mode di Xiaohongshu maupun film promosi merek, gambar-gambar semacam ini langsung menarik perhatian.
V1 — Upaya Awal
A model walkingSeorang pria sedang berjalan. Tidak ada detail pakaian, tidak ada latar belakang, tidak ada pencahayaan atmosferik, dan tidak ada kualitas sinematik. Output AI menggambarkan seorang pejalan kaki biasa (dalam arti harfiah), tanpa sedikit pun selera fashion.
V2 — Rincian Tambahan
A tall female model walks down a minimalist white runway in a flowing
red silk gown. The dress moves dramatically with each step. Bright
fashion show lighting from above. Audience blurred in the background.
Editorial photography style.Dengan pakaian, latar belakang, gerakan kain, dan arah pencahayaan yang sudah ditentukan, sebuah adegan runway yang dapat dikenali dapat dihasilkan. Namun, untuk mencapai kualitas film layar lebar, elemen tambahan diperlukan: efek fisika kain, teknik pencahayaan yang presisi, dan pengambilan gambar kamera yang sinematik.
V3 — Versi Final
A statuesque model strides confidently down a stark white runway in a
floor-length haute couture gown of flowing crimson organza layered over
structured black satin. The sheer fabric billows dramatically behind
her like a wave, catching air with each powerful step. Her expression
is fierce and unwavering. A sharp wind machine effect lifts the fabric
into a sculptural shape to her left. Overhead fashion spotlights create
hard, defined shadows on the runway floor. Rim lighting from behind
outlines her silhouette in white. The front row audience is a blurred
mosaic of camera flashes. Low-angle tracking shot from runway level,
moving with her pace. Shallow depth of field. Vogue editorial style.
Alexander McQueen show energy. 4K cinematic, crisp detail on fabric
textures, high-fashion color grading with deep blacks and saturated
red.
V1 hingga V3: Langkah-langkah biasa diubah menjadi momen haute couture, dengan bahan-bahan bertekstur artistik, pencahayaan dramatis, dan keahlian pengerjaan yang layak untuk catwalk.
Mengapa prompt ini efektif
- "Organza merah tua bertumpuk di atas satin hitam yang struktural" memperkenalkan AI pada dua jenis kain yang kontras: transparan dan mengalir versus kaku dan gelap. Kontras ini menciptakan kompleksitas visual.
- "Efek mesin angin" adalah istilah yang menghubungkan model AI dengan produksi fotografi mode, memicu efek khas kain yang melambai.
- "Pengambilan gambar pelacakan sudut rendah dari level runway" menempatkan kamera pada ketinggian fotografer mode sungguhan, memberikan model rasa kekuatan dan kehadiran.
- "Energi pertunjukan Alexander McQueen" merujuk pada rumah mode yang terkenal dengan presentasi runway dramatis dan mengagumkan, memberikan AI acuan emosional dan estetika.
Varian
Varian A — Pemotretan Gaya Jalanan:
A woman in an oversized camel cashmere coat, vintage denim, and white
sneakers walks along a cobblestone Parisian street in autumn. Fallen
leaves blow past her feet. She adjusts round sunglasses with one hand.
The camera tracks alongside her at walking speed. Soft, overcast Parisian
light. Muted earth-tone color palette. The Row meets Celine aesthetic.
Natural, effortless, editorial. 4K, film grain, shallow depth of field.Varian B — Close-Up Kecantikan:
Extreme close-up beauty shot of a model's face with flawless dewy skin,
bold graphic black eyeliner, and glossy burgundy lips. She slowly turns
her head from profile to three-quarter view. Light catches the highlight
on her cheekbone. Her expression shifts from serene to subtly powerful.
Ring light reflected in her eyes. Clean white background. Beauty
editorial lighting with soft key and sharp catch light. 4K ultra-sharp,
skin texture visible.Prompt #8: Aksi dan Olahraga — "Momen Beku"
Menetapkan Latar Belakang
Momen puncak kehebatan atletik, dengan dampak yang setara dengan siaran Super Bowl. Detik-detik singkat keringat, otot yang tegang, dan pengeluaran tenaga maksimal. Fotografi olahraga membutuhkan timing yang sempurna; video olahraga memungkinkan momen tersebut bertahan lebih lama.
V1 — Upaya Awal
A person playing basketballSeorang pemain menggiring bola sendirian. Tidak ada aksi khusus, tidak ada momen puncak, tidak ada drama atletik. AI tidak tahu apakah harus menampilkan lay-up, menggiring bola, atau mengikat tali sepatu.
V2 — Rincian Tambahan
A basketball player in mid-air going for a slam dunk. Sweat flies off
his body. Arena lights are bright. Crowd in the background cheering.
Dramatic angle. Slow motion.AI kini mengintegrasikan aksi spesifik (dunks), detail fisik (keringat), latar belakang (stadion olahraga), dan elemen waktu (gerakan lambat). AI ini mampu menghasilkan momen olahraga yang dapat dikenali. Namun, untuk mencapai standar kualitas siaran, diperlukan detail anatomi manusia yang presisi, desain pencahayaan, dan fisika partikel.
V3 — Versi Final
Ultra-dramatic slow motion capture of a muscular basketball player at
the apex of a powerful one-handed slam dunk. His body is fully extended,
arm reaching above the rim, fingers gripping the ball as it meets the
net. Every muscle fiber in his forearm is visible. Individual droplets of
sweat spray off his shaved head and outstretched arm, frozen in mid-air
and catching arena light like tiny prisms. The orange ball compresses
slightly against the backboard glass. Below, defenders look up
helplessly with blurred motion. Overhead arena lights create sharp
downward shadows and brilliant rim lighting on the player's shoulders.
The crowd is a bokeh wall of color and camera flashes. Low-angle shot
from below the basket looking up. Extreme slow motion, 1000fps feel.
8K ultra-sharp, hyper-realistic detail in skin texture, fabric wrinkles,
and sweat droplets. ESPN broadcast cinematic quality.
V1 hingga V3: Permainan basket biasa diubah menjadi adegan beku berkualitas siaran yang menampilkan efek fisika partikel keringat, detail anatomi, dan desain pencahayaan arena.
Mengapa prompt ini efektif
- "Titik puncak dari sebuah slam dunk satu tangan yang kuat" menyoroti detik-detik puncak ketegangan visual. Frame puncak selalu menjadi yang paling berdampak.
- "Tetesan keringat individu... beku di udara, menangkap cahaya arena seperti prisma kecil" memberikan AI target konkret untuk perilaku partikel. Rincian mikroskopis ini membuat adegan slow-motion lebih autentik.
- "Sudut rendah dari bawah ring basket yang mengarah ke atas" merupakan sudut siaran klasik untuk slam dunk, memaksimalkan persepsi ketinggian dan kekuatan.
- "1000fps feel" menginstruksikan AI tentang kecepatan slow-motion yang diinginkan, merujuk pada spesifikasi kamera berkecepatan tinggi yang dapat dihubungkan AI dengan karakteristik visual tertentu.
Varian
Varian A — Momen Tendangan Sepak Bola:
Extreme slow motion of a soccer striker's foot connecting with the ball
in a full-power volley shot. The boot compresses the ball's surface on
impact. Grass and mud spray upward from the follow-through. The
goalkeeper dives desperately in the background, fingers outstretched.
Side-angle shot at ground level. Rain falls in frozen droplets. Stadium
floodlights create god rays through the rain. 4K ultra-realistic,
hyper-detailed.Varian B — Dampak Tinju:
Ultra slow motion close-up of a boxer's right hook connecting with a
heavy bag. The leather surface of the bag deforms dramatically on impact,
creating a ripple wave across its surface. Sweat explodes outward from
the glove in a mist. The boxer's wrapped knuckles and taped wrist are
in razor-sharp focus. Gym environment with hard overhead fluorescent
lighting. Dust particles hang in the air. Low-angle. Gritty, raw
aesthetic. 4K cinematic.Prompt #9: TuSheng Video — "Menghidupkan Foto-Foto"
Pengaturan
Prompt ini berbeda dari delapan prompt sebelumnya. Ini bukan generasi teks ke video, melainkan image-to-video (I2V) — unggah foto yang sudah ada dan berikan instruksi kepada AI tentang gerakan apa yang ingin ditambahkan. Alur kerja ini terbukti sangat powerful untuk menghidupkan foto potret, gambar produk, dan karya seni. Tantangannya terletak pada memberikan instruksi yang tidak hanya mempertahankan esensi gambar asli tetapi juga memperkenalkan gerakan yang terlihat alami.
Untuk alur kerja lengkap dari gambar ke video, silakan merujuk ke panduan terperinci kami Image-to-Video Detailed Tutorial.
V1 — Upaya Awal
Make the person moveIni adalah kesalahan paling umum dalam video generatif. "Move" bukanlah perintah gerakan. AI dapat menyebabkan karakter bergoyang, wajah terdistorsi, lengan berayun secara acak, atau menambahkan gerakan tubuh yang aneh. Prompt I2V yang tidak jelas menghasilkan hasil yang tidak alami dan mirip dengan efek uncanny valley.
V2 — Rincian Tambahan
The woman slowly turns her head to the right and smiles gently. Her hair
shifts naturally with the movement. Soft breeze moves the fabric of her
dress slightly.AI kini mengintegrasikan gerakan spesifik (memutar kepala), arah (ke kanan), perubahan ekspresi wajah (senyum), dan gerakan sekunder (rambut, kain). Hasilnya tampak jauh lebih alami. Namun, hal ini dapat dioptimalkan lebih lanjut melalui perubahan atmosfer yang halus, pergerakan kamera, dan penyesuaian kecepatan gerakan yang presisi.
V3 — Versi Final
The woman slowly turns her head from looking slightly left to gazing
directly into the camera. Her expression transitions from contemplative
to a warm, knowing smile. A gentle breeze lifts wisps of her hair across
her forehead. She subtly exhales, her shoulders relaxing slightly
downward. The fabric of her linen blouse ripples faintly at the collar.
Background leaves on a tree behind her sway gently with the breeze. Warm
afternoon light intensifies slightly as if a cloud has passed, deepening
the golden tones on her skin. Very slow, almost imperceptible dolly in.
Natural, lifelike motion -- no exaggerated movement. Maintain the
photographic quality of the original image. Smooth 24fps.
V1 hingga V3: "membuat orang bergerak" menghasilkan artefak yang tidak alami, sedangkan prompt I2V yang disesuaikan dengan presisi menghasilkan video yang alami dan realistis dari foto statis melalui instruksi gerakan yang spesifik dan halus.
Mengapa prompt ini efektif
- Arah gerakan yang ditentukan (dari melihat sedikit ke kiri hingga menatap langsung ke kamera) menghindari gerakan acak. AI mengenali baik keadaan awal maupun akhir.
- Gerakan berlapis multi-skala: memutar kepala (skala besar), tersenyum (skala sedang), rambut bergoyang (skala kecil), kerah kemeja bergetar (skala mikro), daun latar belakang berdesir (skala lingkungan). Penumpukan skala gerakan yang beragam menciptakan kesan alami.
- "Seolah-olah awan telah lewat" memberi izin pada AI untuk menyesuaikan pencahayaan secara halus, menambahkan vitalitas tanpa mengubah nada visual asli gambar.
- "Tidak ada gerakan berlebihan" merupakan hal yang paling penting untuk I2V. Tanpa batasan ini, model AI cenderung menuju animasi berlebihan, menimbulkan efek uncanny valley. Pengendalian diri adalah landasan utama I2V yang meyakinkan.
Varian
Varian A — Foto-foto Pemandangan Diubah Menjadi Video:
Clouds drift slowly from left to right across the sky. Water in the lake
ripples gently with a breeze. Grass in the foreground sways. A flock of
birds crosses the distant sky. The light subtly shifts as if time is
passing -- a slow golden hour transition. Very slow, meditative motion.
Maintain the photographic color grade and sharpness of the original.Varian B — Gambar Produk ke Video:
The watch face catches a moving light source that slowly sweeps from
left to right, creating a traveling highlight across the polished metal
bezel and glass face. The second hand ticks smoothly. Subtle reflections
shift on the brushed steel bracelet links. Background remains perfectly
still. Macro-level detail preserved. Smooth, professional product
motion.Prompt #10: Branding dan Pemasaran — "Sinematografi berkualitas iklan televisi"
Pengaturan
Iklan merek mewah yang menceritakan kisah singkat dalam satu adegan. Ini bukan sekadar video produk, melainkan manifesto gaya hidup. Jam tangan, pemakainya, momen tersebut, dan dunia yang ia tempati—semua secara bersamaan menyampaikan nilai-nilai merek. Untuk panduan mendalam tentang penggunaan video AI dalam e-commerce dan pemasaran produk, silakan merujuk ke tutorial kami E-commerce Product Video Tutorial.
V1 — Upaya Awal
A luxury watch advertisementHasil: Sebuah jam tangan mengapung di latar belakang putih atau terbaring datar di atas meja. Tanpa konteks, tanpa rasa aspirasi, tanpa narasi. Ini adalah gambar katalog produk, bukan film iklan.
V2 — Rincian Tambahan
A man wearing a luxury silver watch leans against a yacht railing at
sunset. The camera focuses on the watch on his wrist. Ocean in the
background. Warm golden light. Premium feel. Commercial style.Dengan konteks (kapal pesiar), gaya hidup (kemewahan), titik fokus (jam tangan), dan waktu (matahari terbenam), seseorang dapat menciptakan gambar yang menggugah. Namun, kualitas iklan yang tinggi membutuhkan narasi yang presisi, gerakan yang terkoordinasi, dan detail produksi yang teliti.
V3 — Versi Final
A distinguished man in his 40s in a perfectly tailored navy linen suit
stands at the polished teak railing of a luxury sailing yacht at golden
hour. He gazes at the horizon with quiet confidence. The camera starts
as a wide establishing shot showing the yacht slicing through
crystalline Mediterranean water, then slowly pushes in to a medium
close-up, finally settling on an extreme close-up of the brushed
titanium dive watch on his left wrist. The watch face reflects the
orange-gold sky. His fingers tap once on the railing -- the watch catches
the light. Sea spray glitters in the air behind him, backlit by the low
sun. The yacht's white sails billow softly overhead. Wind ruffles his
hair and the lapels of his jacket. Warm amber key light from the setting
sun. Cool blue fill light from the reflected ocean. Cinematic
commercial quality. Omega or Rolex brand film aesthetic. Anamorphic
lens, shallow depth of field transitioning with the push-in. 4K,
ultra-premium production value.
V1 hingga V3: Iklan jam tangan mewah yang generik berkembang menjadi film merek yang menampilkan gerakan kamera naratif, konteks gaya hidup, dan kualitas produksi kelas atas.
Mengapa prompt ini efektif
- Lintasan naratif dari bidikan (sudut lebar → bidikan sedang → close-up) menciptakan struktur naratif dalam satu bingkai. Pertama menetapkan latar belakang, kemudian fokus pada subjek, dan akhirnya berfokus pada produk. Ini merupakan busur naratif standar untuk iklan barang mewah.
- "Jari-jari menepuk sekali pada pegangan" adalah tindakan karakter yang halus dan disengaja yang secara alami menarik perhatian ke arah jam tangan, menghindari ketidaknyamanan menampilkan pergelangan tangan secara eksplisit.
- Pencahayaan ganda (cahaya utama amber + cahaya pengisi biru) meniru pencahayaan lanskap laut pada golden hour yang autentik. Kombinasi ini membentuk visual ikonik untuk iklan gaya hidup yacht.
- "Estetika film merek Omega atau Rolex" memberikan AI referensi yang tepat untuk kualitas produksi—menyampaikan tingkat anggaran, arah grading warna, dan filosofi visual secara keseluruhan.
Varian
Varian A — Iklan Merek Parfum:
A woman in a flowing white silk dress walks barefoot through a sunlit
lavender field in Provence. She trails one hand through the lavender
tops as she walks, releasing a visible shimmer of pollen. A crystal
perfume bottle sits on a weathered stone wall in the foreground, the
lavender field reflected in its surface. The camera starts on the bottle,
racks focus to the woman approaching, then returns to the bottle as she
passes. Golden afternoon light. Soft lens flare. Chanel No. 5 campaign
aesthetic. Airy, dreamlike, aspirational. 4K cinematic.Varian B — Iklan Merek Otomotif:
A matte black luxury sedan glides silently along a winding coastal
highway carved into dramatic sea cliffs at dusk. The last light of day
reflects off the car's polished roofline. Headlights carve through
gathering twilight. The camera tracks alongside the vehicle from a low
drone angle, keeping pace. Ocean waves crash against rocks far below.
Subtle interior glow visible through tinted windows. Smooth, powerful,
inevitable. Mercedes or Audi brand film quality. 4K cinematic,
anamorphic, teal and orange color grade.Panduan Referensi Cepat: Ringkasan 10 Prompt
| # | Adegan | Elemen Prompt Utama | Model yang Direkomendasikan | Rasio Optimal | |---|------|---------------- -|---------|---------| | 1 | Potret Sinematik | Wanita, ladang gandum, golden hour, 85mm, zoom dekat | Seedance 2.0 | 16:9 | | 2 | Tampilan Produk | Botol parfum kristal, dua strip cahaya, lensa melingkar | Seedance 2.0 / 1.0 Pro | 16:9 atau 1:1 | | 3 | Epik Alam | Dolomites di fajar, lautan awan, elang, Efek Tyndall, IMAX | Seedance 2.0 | 21:9 | | 4 | Pemandangan Jalan Kota | Malam Hujan Tokyo, Pantulan Neon, Siluet Sendiri, Pengambilan Gambar Pelacakan | Seedance 2.0 | 16:9 atau 9:16 | | 5 | Fantasi Anime | Prajurit Wanita, Pedang Energi, Bunga Sakura, Pengungkapan Lingkungan | Seedance 2.0 | 16:9 | | 6 | Close-up Kuliner | Makro espresso, uap, detail lemak, gerak lambat | Seedance 1.0 Pro | 16:9 atau 1:1 | | 7 | Mode & Kecantikan | Panggung Haute Couture, Tulle yang Terbang, Pelacakan Sudut Rendah | Seedance 2.0 | 9:16 atau 16:9 | | 8 | Aksi & Olahraga | Slam dunk, tetesan keringat, bidikan sudut rendah dari bawah ring, 1000fps | Seedance 2.0 | 16:9 | | 9 | Gambar ke Video | Animasi potret, gerakan berlapis, transisi cahaya halus | Seedance 2.0 (I2V) | Pencocokan gambar sumber | | 10 | Pemasaran Merek | Gaya hidup yachting, narasi dari panorama ke close-up, pencahayaan dua nada | Seedance 2.0 | 16:9 atau 21:9 |
Kami menyarankan untuk menyimpan tabel ini sebagai bookmark untuk referensi di masa mendatang. Setiap prompt dalam artikel ini dapat disalin dan ditempelkan langsung untuk digunakan—cukup sesuaikan detailnya sesuai dengan proyek spesifik Anda. Prompt-prompt ini sama efektifnya pada alat-alat lokal (seperti Kling atau Jiemeng), di mana Anda dapat menempelkan prompt-prompt berbahasa Inggris secara langsung.
Lima Teknik Utama untuk Mengoptimalkan Prompt
Lima prinsip ini berlaku untuk semua generator video AI; menguasainya akan mempercepat kemampuan Anda dalam menulis prompt.
- Mulailah dengan ringkas, lalu tambahkan detail secara bertahap.
Jangan mencoba menulis prompt yang sempurna dengan 100 kata sekaligus. Mulailah dengan 15–20 kata, buatlah, evaluasi, lalu tambahkan satu lapisan detail pada satu waktu. Pendekatan berulang ini membantu Anda memahami tambahan mana yang memiliki dampak terbesar. Beberapa detail akan secara signifikan meningkatkan hasil, sementara yang lain mungkin tidak memberikan perbedaan yang berarti. Anda tidak akan tahu kecuali Anda mencobanya.
- Ubah hanya satu variabel pada satu waktu.
Saat melakukan iterasi dari V1 ke V2, tahanlah keinginan untuk mengubah segalanya secara bersamaan. Jika Anda mengubah pencahayaan, sudut kamera, subjek, dan adegan secara bersamaan, Anda tidak dapat menentukan perubahan mana yang memperbaiki (atau merusak) hasilnya. Ubah hanya satu elemen per iterasi. Hal ini membutuhkan kesabaran, tetapi akan membangun pemahaman Anda yang sebenarnya tentang cara generator menafsirkan bahasa.
- Simpan "Golden Prompt" Anda
Ketika sebuah prompt menghasilkan hasil yang luar biasa, simpan segera. Bangun perpustakaan prompt pribadi Anda yang dikategorikan berdasarkan subjek: potret, produk, lanskap, abstrak, dan sebagainya. Seiring waktu, koleksi ini akan menjadi aset kreatif paling berharga Anda. Anda akan menggunakan kembali struktur, mengganti subjek, dan menggabungkan kembali elemen yang telah teruji. Pertimbangkan untuk menggunakan alat pencatat (seperti Notion atau Notes) untuk mengorganisir perpustakaan prompt Anda berdasarkan kategori.
4. Lensa lebih penting daripada deskripsi subjek
Ini adalah kebenaran yang bertentangan dengan intuisi: petunjuk kamera dan pencahayaan seringkali lebih berpengaruh daripada deskripsi subjek. Deskripsi subjek yang detail disertai pengaturan kamera default menghasilkan hasil yang biasa-biasa saja. Sebaliknya, subjek yang sederhana dikombinasikan dengan pergerakan kamera yang presisi, pemilihan lensa, dan desain pencahayaan yang tepat dapat melampaui ekspektasi. Ketika panjang prompt Anda terbatas, alokasikan kata-kata Anda untuk "bagaimana memotret" daripada "apa yang akan dipotret".
- Gunakan kalimat negatif untuk menghilangkan unsur-unsur yang tidak diinginkan.
Banyak generator video AI merespons dengan baik terhadap bahasa yang bersifat eksklusif. Menambahkan frasa seperti "tanpa teks overlay", "tanpa watermark", "hindari pencahayaan datar", dan "tanpa kamera statis" dapat membantu model menghindari masalah umum. Hal ini terbukti sangat berguna ketika Anda menghadapi masalah yang berulang di beberapa generasi. Jangan hanya mendeskripsikan apa yang Anda inginkan; juga spesifikasikan apa yang tidak Anda inginkan.
Pertanyaan yang Sering Diajukan
Apa yang membuat sebuah prompt video AI yang baik?
Sebuah prompt video AI yang efektif memiliki tiga karakteristik inti: khusus, terstruktur, dan termasuk deskripsi gerakan. Prompt tersebut harus mencakup deskripsi subjek yang jelas, aksi atau gerakan yang eksplisit, pengaturan adegan atmosferik, instruksi bingkai (ukuran bidikan dan jenis gerakan), arah cahaya, serta modifikator kualitas visual. Prinsip utama adalah spesifik – "seorang wanita berambut hitam bergaris perak mengenakan mantel arang berjalan di tengah salju yang turun" secara konsisten lebih unggul daripada "seorang wanita di luar". Sama pentingnya adalah penyertakan deskripsi gerakan. Prompt video harus secara eksplisit memberitahu AI apa yang bergerak dan bagaimana gerakannya; jika tidak, outputnya akan mirip dengan gambar statis.
Seberapa panjang seharusnya prompt video AI?
Rentang ideal adalah 40 hingga 80 kata dalam bahasa Inggris. Kurang dari 20 kata memberikan kebebasan berlebihan pada AI, menghasilkan output yang tidak terduga dan generik. Melebihi 150 kata dapat menyebabkan kontradiksi atau membingungkan model. Untuk sebagian besar generator, paragraf yang terfokus dengan 50–70 kata yang mencakup subjek, gerakan, sudut kamera, pencahayaan, dan kualitas gambar menghasilkan hasil terbaik. Kualitas detail lebih penting daripada jumlah kata.
Apakah prompt-prompt ini dapat digunakan dengan alat video AI lainnya?
Tentu saja. Setiap prompt dalam artikel ini dapat digunakan pada alat teks-ke-video utama seperti Seedance, Sora, Kling, Runway, Pika, dan HaiLuo (海螺). Prinsip dasar—topik spesifik, gerakan yang jelas, arah kamera, dan deskripsi pencahayaan—tetap berlaku secara universal. Namun, model yang berbeda menafsirkan bahasa dengan cara yang sedikit berbeda, sehingga prompt yang menghasilkan hasil menakjubkan di Seedance mungkin memerlukan penyesuaian di platform lain. Anggap prompt ini sebagai titik awal yang kuat, lalu sesuaikan berdasarkan alat spesifik yang Anda gunakan. Perlu dicatat bahwa bahkan dengan alat lokal seperti Kling atau Jiemeng, menggunakan prompt dalam bahasa Inggris seringkali menghasilkan hasil yang lebih baik.
Mengapa hasil yang dihasilkan berbeda dengan contoh?
Pembuatan video AI melibatkan unsur acak. Prompt yang sama akan menghasilkan hasil yang berbeda setiap kali dijalankan, bahkan saat menggunakan model dan pengaturan yang sama. Hal ini disengaja—ini memungkinkan eksplorasi kreatif. Jika hasilnya berbeda dari yang diharapkan, buatlah 3–5 variasi menggunakan prompt yang sama sebelum memutuskan untuk mengubahnya. Seringkali, model akan menghasilkan versi yang sangat baik dalam beberapa percobaan. Secara bersamaan, periksa pengaturan rasio aspek dan versi model Anda, karena hal ini sangat memengaruhi hasil keluaran.
Bagaimana cara menggambarkan pergerakan kamera dalam prompt?
Gunakan istilah sinematografi yang autentik. Model AI dilatih menggunakan teks film dan fotografi dunia nyata yang luas, memungkinkan mereka memahami istilah teknis profesional. Gerakan kamera umum meliputi: slow dolly in, tracking shot, orbiting, crane shot, pan, tilt, whip pan. Selalu tentukan kecepatan: slow dolly, gentle orbit, rapid whip pan. Untuk kontrol bidikan yang paling presisi, gunakan fitur video referensi Seedance 2.0 dengan mengunggah klip yang berisi gerakan kamera yang diinginkan sebagai referensi.
Apakah prompt terbalik diperlukan?
Tergantung pada generatornya. Beberapa alat video AI dilengkapi dengan bidang masukan prompt terbalik yang khusus. Alat yang tidak memiliki fungsi ini tetap dapat diterima. Ketika prompt terbalik tersedia, fitur ini terbukti sangat efektif untuk menghilangkan masalah tertentu: "tidak ada teks", "tidak ada watermark", "tidak ada wajah buram", "tidak ada kamera statis". Tanpa bidang masukan khusus, Anda dapat memasukkan deskripsi negatif dalam prompt utama: "hindari pencahayaan datar" atau "tidak ada artefak yang terlihat". Hindari mencantumkan puluhan kriteria pengecualian dalam prompt terbalik—fokuslah pada 2-3 masalah spesifik yang ditemukan pada generasi sebelumnya.
Berapa banyak iterasi yang harus dilalui oleh sebuah prompt?
Tiga hingga lima iterasi mewakili rentang optimal untuk proyek praktis. Kerangka kerja V1 hingga V3 yang dijelaskan di sini tidak didefinisikan secara sembarangan—ia sesuai dengan alur kerja yang sebenarnya. V1 menetapkan konsep, V2 memperhalus detail, dan V3 memperbaiki kualitas produksi. Di luar V3, penyesuaian biasanya hanya melibatkan elemen-elemen minor. Jika lima iterasi masih gagal menghasilkan hasil yang memuaskan, masalahnya kemungkinan besar tidak terletak pada prompt—mungkin model memiliki keterbatasan bawaan dalam menangani jenis konten spesifik ini. Cobalah menyajikan skenario secara berbeda daripada menambahkan lebih banyak kata ke prompt yang sama.
Manakah generator video AI yang menawarkan kontrol prompt terbaik?
Seedance 2.0 saat ini menawarkan kemampuan kontrol prompt paling komprehensif untuk alasan berikut: mendukung generasi teks-ke-video dan gambar-ke-video dengan konsistensi hasil yang sangat baik. Kata kunci gerakan kamera dieksekusi dengan andal. Instruksi pencahayaan diterjemahkan secara akurat ke dalam efek output. Mendukung rasio aspek multiple (16:9, 9:16, 1:1, 3:4, 4:3, 21:9) dengan resolusi hingga 2K. Konsistensi karakter memastikan kesinambungan visual di seluruh generasi karakter yang sama. Untuk perbandingan generator AI video yang komprehensif, silakan merujuk ke Perbandingan Generator Video AI Terbaik 2026.
Kesimpulan
Menciptakan prompt video AI yang efektif adalah keterampilan yang dapat dipelajari, bukan bakat alami. Sepuluh prompt dalam artikel ini menunjukkan pola yang konsisten: mulailah dengan sederhana, tambahkan detail secara bertahap, dan selalu prioritaskan sudut kamera, pencahayaan, dan gerakan di atas segalanya.
Setiap prompt dapat disalin dan digunakan langsung. Ambil prompt V3 apa pun dan tempelkan ke generator Anda sebagai titik awal. Kemudian lakukan iterasi—ganti subjek, pencahayaan, atau sudut kamera. Setiap generasi mengajarkan model cara menginterpretasikan bahasa. Prompt-prompt ini bekerja paling baik di Seedance, meskipun juga dapat digunakan langsung dengan prompt bahasa Inggris di alat-alat lokal seperti Keeling dan Jiemeng.
Cara paling efektif untuk meningkatkan kemampuan adalah dengan menghasilkan dan mengamati apa yang efektif pada skala besar. Simpan prompt terbaik Anda dan bangun perpustakaan materi. Setelah beberapa waktu, Anda akan mengembangkan intuisi tentang bahasa mana yang menghasilkan hasil tertentu. Pertimbangkan untuk membagikan proses iterasi prompt Anda di platform seperti Xiaohongshu atau Bilibili—komunitas pembuat video AI sedang berkembang pesat, dan pengalaman praktis Anda memiliki nilai yang signifikan bagi orang lain.
Buka Seedance untuk mencoba prompt ini → — Daftar untuk mendapatkan kredit gratis, tidak memerlukan kartu kredit.
Ingin mengetahui lebih lanjut? Panduan Lengkap Seedance Prompt kami (Complete Seedance Prompt Guide) mencakup lebih dari 50 prompt tambahan yang mencakup semua kategori skenario.
Bacaan tambahan: Jelajahi panduan lengkap Seedance kami Seedance Complete Prompt Guide (50+ Contoh). Baru menggunakan Seedance? Mulailah dengan panduan lengkap kami Cara Menggunakan Seedance Complete. Ingin mengubah foto menjadi video? Lihat panduan Image-to-Video AI. Menggunakan video AI untuk e-commerce? Baca panduan Panduan Produksi Video Produk AI. Merencanakan kampanye pemasaran? Lihat panduan Panduan Pemasaran Video AI.

