隨著 Sora 2 推出之後,Google 的 Veo 3 影片生成模型的討論度可說降低不少,似乎是爲了不讓這種的狀況持續下去,很快的,稍早 Google 釋出了新版 Veo 3.1 影片生成模型,各方面都有改進,包括對提示詞的理解能力更好、更豐富的音效,更強的敘事控制,以及更真實的質感呈現,現在可以在 Flow、Gemini 和 Gemini API 上使用。
Google 推出新版 Veo 3.1 影片生成模型,這些是新特色
根據 Google 介紹:「Veo 3.1 是建立於 Veo 3 的基礎上,具備更精準的提示理解能力,並在影像與音訊品質上進一步提升。」整體來看,主要提升的點是在音效,影像部分我測試沒有說很明顯,但理解能力確實有好一點。
隨著 Veo 3.1 推出,透過 Flow 來製作影片也變得更簡單,像是你現在可以利用:
- 「素材生成影片」功能可透過多張參考圖像控制角色、物件與風格,讓 Flow 依據這些素材生成與想像一致的最終畫面。
- 「影格生成影片」提供起始與結尾影像,Flow 會自動生成流暢過渡的影片,適合用於藝術感強或史詩感的轉場。
- 「延伸場景」可讓影片持續延長,甚至超過一分鐘,並無縫銜接前一支影片的最後一秒,非常適合拍攝長鏡頭或開場畫面。
實際效果可以參考下方 Google 官方影片:
除此之外,Flow 也加入了兩個新的編輯功能,包括:
- 「為場景加入全新元素」可幫助你加入想像中的任何事物,無論是真實還是奇幻生物,Flow 都能自然處理陰影與光線,讓新元素完美融入場景。
- 「無縫移除不需要的物件或角色」能用於移除畫面中的任意元素,移除後,Flow 會自動重建背景與周圍環境。
雖然官方新聞稿中,Google 只有提到 Flow 和 Gemini API 可以體驗到 Veo 3.1,但我測試 Gemini 也已經更新到 Veo 3.1 了,如果你的還沒,再等一下子應該就會有。
如果你打開 Gemini 後,下方有看到「新功能!Veo 3.1 的影片生成功能又更強了」,就代表你的也更新到 Veo 3.1 了:
Flow 部分就已經都升級 Veo 3.1 了,一樣有 Veo 3.1 – Fast 和 Veo 3.1 – Quality 兩種選項。另外可以注意到,Veo 2 已經快結束支援了,猜測之後搞不好會換成 Veo 3:
而我也測試了一下 Veo 3 和 Veo 3.1 的生成影片差異,提供給大家參考,以下是我使用的提示詞:
「一支高質感日系美食廣告短片。主角為一位 25 歲台灣優雅女性,白或米色短袖上衣、自然日系妝容與親切微笑。背景全程純色並保持乾淨:第一場景淡米黃、第二場景淺粉或薄荷綠。採柔和漫射光與微側光,色調明亮清新。鏡頭語言:每個場景一開始遠景,女士雙手端盤展示;展示時鏡頭平滑推近至食物特寫,景深淺,食物清晰、背景柔化;場景之間以快速白閃+whoosh轉場。
場景 1:日式炸豬排飯,強調金黃酥脆麵衣、切面與醬汁光澤;女士微轉托盤角度配合高光。
場景 2:牛肉丼飯,強調油澤、洋蔥與溫泉蛋,可用筷子輕提牛肉纖維。
最後:回中近景,女士看鏡頭說中文『你喜歡吃哪一個?』。音樂為輕快清新日系 BGM,轉場有輕 whoosh。整體節奏俐落、色彩溫柔、畫面乾淨有食慾與幸福感
Veo 3 Fast 影片:
Veo 3.1 Fast 影片:
Veo 3.1 影片: