雖然 Sora 2 只需要簡單的提示詞,就能生成出不錯的影片,但影片的呈現方式,有可能不是你想要的,因此如何詳細撰寫提示詞就相當重要,不過不是每個人都知道怎麼寫,為了幫助用戶能快速獲得想要的影片,近日 OpenAI 官方就釋出「Sora 2 提示詞指南」,文中就有提供一些範例格式讓你參考。
OpenAI 釋出官方「Sora 2 提示詞指南」,提供兩個範本格式
OpenAI 在這份「Sora 2 提示詞指南」一開始就特別強調,可以把影片生成看成是跟「一位沒看過分鏡的攝影師」溝通,這也意味著,細節講得越清楚,你越能得到可控和穩定的結果。而留白越多,則越可能產生一些出乎意料的變化。
就實際操作來說,你需要在「控制」與「創意」之間找到一個平衡點,然後多次小幅度的修改和生成,如:添加鏡頭、燈光、動作等,進而逐步獲得理想成品。所以說,不要想說能夠一次生成到你想要的影片,而是透過不斷修改、添加你原本的提示詞,然後再次嘗試生成。
- 短提示=創意空間大,但不可控;長提示=可控與一致,但未必每次都完全精準。
- 提示詞持續小幅調整,直到獲得滿意成果。
這個做法對於有影片額度限制的工具來說,似乎有一點難,好消息是,Sora 2 現在是免費生成,代表說你不用擔心額度滿的問題(不過據說每日還是有上限)。
而在提示詞部分,OpenAI 表示影片的解析度、時間長度、使用哪一款模型等,只能在 API 參數設定,是無法靠文字描述更改的,而鏡頭、景色、主體行為、光影與風格等,則是提示詞的核心。
寫法上,先用確切的「視覺風格」與「鏡頭語言」,然後再把主體與動作,拆分成各個部分,光線與色盤則用具體名詞描述。
- 提示詞定義:鏡頭與拍攝角度、景深、主體與場景、動作節拍、燈光與色盤。
- 多鏡頭也可放同一段提示,但每個鏡頭要獨立(一個機位、一個動作、一個燈光配方),方便後製拼接或一次生成連續段落。
- 每鏡頭只放一個清楚的運鏡+一個清楚的主體動作。
OpenAI 舉例說簡單的「走到窗邊」,可以改成更詳細的「走四步、停頓、最後一秒拉開窗簾」;「明亮房間」可以改成「窗側柔光+暖色檯燈補光+走廊冷邊緣;色盤:琥珀、米白、胡桃木棕」。
對話方面,需要在提示中獨立提到,記得句子不能太長,如果是不同角色講的話,也清楚標示角色。4 秒可容納 1–2 句短台詞,8 秒可多一點。
文章 OpenAI 提供兩個模板給大家,首先是一般通用的,內容會稍微簡單一點
[以自然語言撰寫場景描述。描述角色、服裝、場景、天氣與其他細節。盡量具體一點,讓生成出的影片更貼近你想像。]
- Cinematography(攝影)
- Camera shot(鏡頭)
- Mood(情緒氛圍)
- Actions(動作節拍)
- Dialogue(對白,可選)
這是範例格式:
Style:手繪感 2D/3D 混合動畫,柔和筆觸與暖鎢絲照明,帶有可觸感的定格質地。整體風格近 2000 年代中期繪本動畫——溫馨、不完美、充滿機械魅力。淡淡水彩洗染與畫布質感;調色在暖/冷之間取得平衡;以電影式動態模糊增添動畫寫實感。
在雜亂的工作坊裡,層層書架擠滿齒輪、螺栓與泛黃藍圖。中央的木製長凳上,坐著一台圓滾滾的小機器人,鈑金凹痕處被不同比例的補片與舊漆覆蓋。它的大眼微微發出淡藍光,緊張地把玩一顆嗡嗡作響的燈泡。空氣裡充滿細微的機械運轉聲;窗外雨聲拍打;背景的時鐘穩定嘀嗒。
Cinematography:
Camera:中近景,緩慢推近;吊掛工具形成輕微視差
Lens:虛擬 35 mm;淺景深柔化後景雜物
Lighting:頂部實景燈為暖主光;窗側冷溢光做對比
Mood:溫柔、奇趣,帶一點懸念Actions:
– 機器人輕彈燈泡,冒出些許火花。
– 它一驚,手滑落下燈泡,雙眼睜大。
– 燈泡慢動作下墜;它在最後一刻接住。
– 胸口噴出一小縷蒸汽——鬆口氣又有點得意。
– 機器人小聲說:「差點掉了……但我接住了!」Background Sound:
雨聲、時鐘滴答、柔和機械嗡鳴、燈泡細微滋滋聲。
我用這提示詞生成的影片:
再來是比較豐富的專業提示詞模板
- Format & Look(格式與質感)
- Lenses & Filtration(鏡頭與濾鏡)
- Grade / Palette(調光與色盤)
- Lighting & Atmosphere(燈光與氛圍)
- Location & Framing(場景與構圖)
- Wardrobe / Props / Extras(服裝/道具/群演)
- Sound(聲音)
- Optimized Shot List(最佳化分鏡,N 鏡/總長度)
- Camera Notes(可讀性說明)
- Finishing(成片處理)
這是範例格式:
Format & Look
時長 4s;180° 快門;數位拍攝,模擬 65 mm 膠片對比;細緻顆粒;高光處輕微暈染;無 gate weave。Lenses & Filtration
32 mm/50 mm 球面定焦;Black Pro-Mist 1/4;輕微調整偏光鏡角度以控制列車車窗的反射。Grade / Palette
高光:乾淨的晨光並帶有琥珀色提升。
中間調:中性平衡,陰影略帶青綠。
黑位:柔和中性,略微抬升以保留薄霧。Lighting & Atmosphere
主自然光自左側、低角度射入(07:30 AM)。
反光:月光銀 4×4 反射板於軌道側。
對側負補光。
實景:站台鈉燈微弱漸亮。
氛圍:輕霧;列車尾氣穿過光束。Location & Framing
都市通勤月台,黎明。
前景:黃色安全線、長椅上的咖啡杯。
中景:在薄霧中剪影的等車乘客。
遠景:進站減速的列車。
避免任何標識或企業品牌。Wardrobe / Props / Extras
主角:三十多歲旅人,海軍藍大衣,單肩揹後背包,手邊鬆握手機。
群演:低飽和通勤風;一位推車的單車騎士。
道具:紙杯咖啡、行李箱、LED 出發資訊板(通用目的地)。Sound
僅場景聲:輕微鋼軌摩擦聲、列車剎車氣聲、遠處廣播被壓低至 −20 LUFS、低頻環境嗡鳴。
腳步與紙張摩擦;無配樂與額外擬音。Optimized Shot List(共 2 鏡/4 s)
0.00–2.40 —「到站漂移」(32 mm,肩扛機,慢速左向移動)
鏡頭從站牌邊緣滑過;淺景深顯露中框旅人望向軌道。晨光在鏡面綻放;列車頭燈於薄霧中柔和炫光。目的:建立場景與基調,營造將至的期待。2.40–4.00 —「轉身停頓」(50 mm,慢速弧形內推)
切到較緊的過肩弧移;列車停下時,旅人微轉向鏡頭,臉頰出現陽光邊緣光與手機螢幕反射。眼神上移看向未示之物。目的:以最小運動創造人性焦點瞬間。Camera Notes(可讀性)
視線保持低且靠近鏡頭軸以強化親密感。
允許列車玻璃的小炫光作為美學質感。
保留細微手持不完美以增寫實。
避免過曝炫光破壞剪影清晰;維持皮膚高光的平順滾降。Finishing
覆蓋細顆粒與輕微彩色雜訊以增真實;對實景燈採節制暈染;以暖/冷分離色調呈現清晨對比。
混音:優先呈現列車與環境細節,壓低腳步瞬態。
海報幀:旅人轉身中,金色邊緣光,後景進站列車在薄霧中柔焦。
用這提示詞生成的影片:
如果你使用以上提示詞後,生成出的影片還是失敗,不符合你預期,那就先簡化,然後再逐步添加複雜度。
OpenAI 在這篇「Sora 2 提示詞指南」還有提到很多細節,有興趣的人可以花時間閱讀一下。