近日 OpenAI 推出目前最強 ChatGPT Image 2.0,代號 gpt-image-2 的新一代影像生成模型,以驚人的文字渲染能力、O 系列推理整合與 4K 解析度支援,一舉超越了 Nano Banana Pro 橫掃了 Image Arena 排行榜,上線 12 小時內就以 +242 分的差距奪冠 。但是多數使用者只把它當作「更強的繪圖工具」:下提示詞、等圖、下載、結束。最近 Image 2 被一些專業設計師發現了一個隱藏能力:GPT Image 2 能夠生成帶有 Alpha 通道的透明圖片,甚至能透過後處理腳本直接輸出 Photoshop 分層 PSD 檔案。

一道指令就能將照片「拆圖分層」輸出 PSD
多數人對 AI 影像生成的想像還停留在「下提示詞 → 產出一張圖」,但 GPT Image 2 真正的殺手級應用其實是反向操作:不是畫圖,而是拆圖。
OpenAI 在官方技術文件中明確將 PNG 格式列為 gpt-image-2 API 的標準輸出選項之一,支援透明度(Transparency),與 JPEG(不支援透明)和 WEBP(支援透明)並列 。這項能力早在 GPT Image 1 時代就已存在,但在 2.0 版本中由於模型對構圖與語意的理解大幅提升,生成結果的實用性已完全不同。這意味著它可以產出「真正透明背景」的 PNG 檔案,而非像其他模型那樣只是在白色背景上模擬透明效果。使用方法也很簡單,在 ChatGPT 對話頁面選擇「創作圖像」並輸入提示詞即可:
使用者可以直接要求 GPT Image 2 「在透明背景上生成文字」,就能一鍵產出 YouTube 影片封面或社群貼文用的標題圖層,不需任何去背工序。代表了當你將圖片導入 Photoshop、After Effects 或其他後製軟體時,帶有原生透明通道的圖片可以直接疊加與編輯,不需要手動去背。
這個技巧的關鍵在於提示詞的精確撰寫,並非所有「透明背景」的要求都會被正確執行。根據 OpenAI 的文件,gpt-image-2 採用「O 系列推理」機制,當模型判斷使用者需要編輯或局部修改既有圖片時,會啟動更精細的圖層處理流程 。
對於頻繁產出社群內容的創作者而言,這意味著過去需要 Photoshop 多步驟處理的工作(打字 → 去背 → 調整透明度 → 匯出),現在一句話就能完成。
AI 自動去背:人物完美摳出、背景智慧補全
另一個令人驚豔的應用是 GPT Image 2 的「隔空取物」能力:上傳一張普通照片,要求模型將特定人物或物體提取出來,模型不僅能精準摳圖,甚至會「智慧補全」被遮擋的背景(把這張圖人物和背景分離開來,並補全背景畫面,完成後給我一個分層的PSD圖片)。下達簡單指令要求提取人物,GPT Image 2 不僅將人物完美分割為獨立圖層,同時也產出了一張「補全背景後的乾淨場景圖」。這在傳統工作流程中需要 Photoshop 的「內容感知填滿」(Content-Aware Fill)搭配精細的手動遮罩,耗時至少數分鐘,而且必須是訂閱 Adobe 會員。
不過想使用 GPT Image 2 的 Thinking 模式(僅限 Plus 與 Pro 訂閱者使用)整合了 O 系列推理能力,使其能夠在執行圖像任務前先「思考」佈局策略、搜尋網路參考、甚至分析上傳文件的內容。這解釋了為什麼模型能夠在摳圖時做出「補全背景」這類需要理解場景邏輯的決策。
不但如此,你也可以另外要求 GPT Image 2 將這些拆開的透明 PNG 圖層封裝為標準的 Photoshop 分層檔案,GPT 會透過 Python 的 psd-tools 套件,將 GPT Image 2 生成的多張透明 PNG 圖層封裝為標準的 PSD 檔案,如果失敗的話開新對話或重新要求應該都可以搞定:
其他的玩法還有很多,有興趣的朋友可以自己試試,由於 OpenAI 現在的 Image 2 生圖能力超強,而且還可以養龍蝦養馬,能力又很好,現在性價比已經遠比動不動就封號罰錢的 Anthropic Claude 好,一般人用一個月 20美金的 Plus 會員也很夠用了,推薦大家可以訂閱,Google 也很值得訂閱,因為生圖能力也不差(雖然現在動不動就限制而且還降智),不過有送 5TB 空間,預算有限只能選一個的話,我現在推 OpenAI。






