相信最近應該不少人都瘋狂在使用 Google Gemini 的 Nano Banana 製作各種圖片吧?我們寫了許多相關教學,阿達前陣子也製作了很詳細的教學影片,不過在當時我就覺得 Nano Banana 雖然表現相當接近完美,但它有一個蠻大的問題就是製作影像時會受到原始圖片的比例影響,如果想製作指定比例的圖片,就必須手動自己餵圖有點不太方便。不過根據 Google 開發者部落格最新消息指出,現在這個問題已經解決了。
Google Gemini Nano Banana 加入圖片比例設定等新功能
根據 Google 開發者部落格的最新資訊,這次 Gemini 2.5 Flash Image 針對內容創作者的需求,增加了調整圖片比例的新功能(目前限 Google AI Studio 以及 Vertex AI 平台)。它現在支援 10 種不同的影像比例,從超寬螢幕的 21:9 電影畫幅,到適合社群媒體的 9:16 垂直比例,甚至支援多種常見的方形與接近方形比例,幾乎涵蓋所有常用的圖片比例。
使用也很簡單,只要使用 AI Studio 選擇 Gemini 2.5 Flash Image (nano banana)製作圖片,在畫面右側就會看到多出來的比例尺設定,預設值是 Auto(應該是與原圖片同比例):
原本的畫面是沒有比例尺設定的:
現在共有 1:1、9:16、16:9….共有十種圖片比例可以設定選擇,不管是 YouTube製作首圖橫幅影像,還是為 TikTok 與 Instagram Reels 製作垂直短片封面,幾乎該有的都有了:
舉例來說,現在上傳一張1:1的圖片給他做三視圖,比例設定 16:9 的話,現在產生的圖片就是我們要求的比例,這對經常用 Gemini 做圖的人來說方便太多了,不用再先處理一張指定比例的圖片給 AI 參考:
不過如果你在 Gemini 裡面調用 nano banana 做圖的話,就算在提示詞指定了圖片比例也沒用,所以如果要做圖還是去 AI Studio 比較好用:
不過最近 Gemini 做圖比較大的新問題是 AI 都會給你擺爛,一張圖經常要催促N次才會做,甚至死活都不做,這點比較困擾,希望 Google 快點處理(應該是大模型偷懶的通病):
除了圖片比例新功能以外,這次官方文章中也提到 Gemini 2.5 Flash Image 的影響力已經在創業團隊與遊戲開發社群中展現。並提供兩個案例,清楚說明了它如何重新定義影像創作的可能性。
Cartwheel:突破「拉霸機式體驗」,讓藝術家真正掌控創作
Cartwheel 長期致力於改善 AI 圖像生成的「隨機性」,認為藝術家應該能夠更精準地控制角色的姿勢與呈現方式。他們打造了「Pose Mode」功能,嘗試與各種生成模型結合,但過去的系統總是無法兼顧角色的一致性與模型的世界知識。直到 Gemini 2.5 Flash Image 出現,Cartwheel 才找到解答。將自家 3D 姿勢工具與該模型結合後,他們成功創造了一個能夠從任意攝影角度生成角色,並且維持動作忠實與畫面真實感的新系統。
Cartwheel 聯合創辦人 Andrew Carr 指出:
「其他模型無法在保持姿勢準確性的同時,兼顧完整的世界知識。但 Gemini 2.5 Flash Image 做到了。」
Volley:即時遊戲影像生成,推動互動娛樂
另一個令人矚目的應用來自 Volley,這家公司開發了 AI 驅動的地城探險遊戲 《Wit’s End》。透過 Gemini 2.5 Flash Image,他們能夠在遊戲進行中即時生成角色肖像、場景畫面,甚至多角色組合影像,並支援快速的多輪編輯。
Volley 的 CTO James Wilsterman 表示:
「這個模型在遵循美學指引的同時,延遲依然維持在 10 秒以內,使得即時應用成為可能。玩家甚至可以透過語音或文字,反覆迭代出想要的風格。」
這樣的能力不僅大幅縮短了美術設計的迭代時間,也為遊戲玩家帶來前所未有的沉浸式體驗。
對於開發者而言,Google 也提供了詳細的開發文件與範例程式,並在 Google AI Studio 中內建「Build Mode」,讓使用者只需輸入一個提示詞,就能即時生成 AI 應用。
舉例來說,輸入「建立一個具備濾鏡的影像編輯應用程式」,AI Studio 就能直接生成原型,並允許開發者將其部署或同步至 GitHub。這種「零摩擦」的創作流程,對新創團隊與獨立開發者特別友好。
官方甚至還推出了一系列示範應用,例如:
-
Bananimate:利用 Nano Banana 角色,從圖片與提示中生成動畫 GIF。
-
Enhance:具備「無限放大」功能的創意影像放大器,還藏有彩蛋(提示:🍌)。
-
Fit Check:上傳個人照片與服裝,即可生成試穿效果的虛擬更衣室。