在稍早的 I/O 2025 活動中,Google 也發表了新一代 Imagen 4 圖片生成模型、Veo 3 影片生成模型,影像質感不僅都大幅提升,生成速度也變更快,尤其是圖片,據說快達 10 倍。
Google 推出新一代 Imagen 4 圖片生成模型
Imagen 4 是目前 Google 最新且最強大的影像生成模型,帶來了不少提升,像是影像質感更豐富,色彩層次更細膩,細節呈現度大幅提升,如:光影變化、水珠質感等:
特別是文字,Google 在發表會上強調這模型「對文字與排版支援更佳」,而且不只是正確生成字詞,還可以進行創意化設計,像是在音樂節海報中,運用恐龍骨骼元素作為字型,讓海報效果更生動。不過對中文字的支援性如何,還有待測試:
跟前一代相比,Imagen 4 生成速度快了 10 倍,這點相當不錯,圖片生成完不滿意時,就能快速進行修改,無需擔心等太久的情況。搭配上 Gemini 的編輯能力,還可以針對小部分進行修改:
Google 新一代 Veo 3 影片生成模型登場
Veo 3 是 Google 最新推出的新一代影片生成模型,相較於前代 Veo2 也有不少升級。
現在 Veo3 不僅能產生高品質影片,還可以同步生成場景音效、環境聲及對話,意味著影片生成好後,裡面的角色也配音完成,甚至還有背景聲音:
而影像畫面細節、光影與物理行為(如水波、風動等)等,當然也更為逼真,帶來如臨其境的視覺體驗。Google 也強調,Veo 3 擁有更強的物理理解,可更自然處理動態物件與環境互動。Veo 3 今日就開放使用。
結合 Imagen 4、Veo 3 和 Gemini 的 Flow 創作工具
為了方便電影創作者使用 Google 的各項 AI 生成工具,這次還推出一個全新 Flow 工具,結合 Imagen 4、Veo 3 和 Gemini 能力,用戶透過自然語言,就能生成出一部出色的作品:
Google 也舉例工作流程,像是製作一部爺爺與一隻雞駕駛一輛飛行汽車的影片。首先上傳老人和汽車的圖片,但他手邊沒有雞的素材,因此使用 Imagen 來生成:
接著就輸入提示詞,讓 Veo 將所有素材整合,然後生成出一部短片:
影片後續如果不知道該怎麼敘述,也能讓 AI 自行判斷和生成:
當然,生成的影片可以輸出下載下來,匯入到任何你常用的剪輯軟體裡進行後製。
以上所有動作都在 Flow 平台中完成,無需切換來切換過去。
針對這次 Flow 推出,Google 也宣布二個全新付費訂閱計劃,分別是「Google AI Pro」,每月 19.99 美元,可獲得 Flow 和 Veo 2 的使用權限,這方案只會在美國推出:
另一個「Google AI Ultra」則是全球推出,每月 249.99 美元,可獲得 Flow 和 Veo 3 使用權限,以及 Gemini App 2.5 Pro 的 Deep Think 功能,另外還包含 YouTube Premium、30TB 儲存空間、Project Mariner 等特色: