除了 GPT 5.2,ChatGPT 終於也更新了圖片生成模型,稍早正式推出全新 GPT Image 1.5,其特色跟 Nano Banana Pro 差不多,擁有精準的編輯能力,且能保持角色一致性,更重要是生成速度跟舊版比,提升多達 4 倍,我測試確實快超多。雖然 OpenAI 提到文字生成部分也有提升,但主要是加強 “密集的文字”,中文字還是不太行。
不過這也是有解決辦法,有鑒於 ChatGPT 現在能精準編輯,就要求重新生成錯誤的字就好,我測試效果還不錯。
ChatGPT 迎來全新 GPT Image 1.5 圖片生成模型,具備精準編輯、保持角色一致性、且速度大幅提升
稍早 OpenAI 宣布正式推出 GPT Image 1.5 圖片生成模型,這模型能在保留重要細節的同時,進行高度精確的修改,同時生成速度最高提升至 4 倍。ChatGPT 和 API 同步開放,所有 ChatGPT 用戶現在就能體驗到新模型。
GPT Image 1.5 的編輯能力表現很出色,跟最初的版本相比,在指令理解與遵循方面更可靠,能完成更精確的修改,也能在原創構圖中維持元素之間的關係。簡單來說,就是能針對你的需求進行圖片編輯,並保留其他不變的區域。
為此我也測試一下,我使用阿達的大頭照片,我先要求 ChatGPT 把服裝換成西裝,果然完美執行,其他細節都保留下來,不過皮膚部分稍微變白一些:
這是生成後的圖片:
再來我接著要求,將阿達的手錶給去除,ChatGPT 也成功執行,手上的手錶消失了::
我使用同一張大頭照,然後要求 ChatGPT 根據以下提示詞生成圖片,效果也相當不錯:
使用我上傳的圖片,製作一張超寫實電影風格的編輯肖像,比例為16:9。採用低角度拍攝——鏡頭靠近地面,向上拍攝一名男子(使用圖片1),他坐著並靠在一個巨大的、毀壞的鋼彈頭部上。
他穿著一套風化的末日風格編輯服裝:多層深色工裝外套,邊緣破損,配有戰術腰帶、褪色的內襯上衣,以及磨損的戰鬥靴。
這是 Gemini 生成的結果:
文字生成方面也更進一步,能處理更密集、更細小的文字內容。像是:將 Markdown 內容自然排版成報紙文章、精準呈現標題、段落、粗體與表格、在影像中保留完整格式與數字資訊等等。
這是 OpenAI 提供的範例圖片:
我也快速測試新版模型的中文字生成能力,以下是提示詞:
幫我生成一張「咖啡買一送一」的海報,上面有「咖啡買一送一」、「限時優惠」、「買越多省越多,還可以寄杯」的繁體中文字,真實風格
明顯有幾個中文字不太對,由此可見這點還是比不上 Gemini。不過這是首次生成,透過後續的編輯修改,也能生成出中文字無誤的圖片:
如下圖,我要求 ChatGPT 將圖中的「省」、「還」重新生成,原本的錯字就變正確了:
也不得不說,ChatGPT 的設計和配色很棒,相較於下方 Gemini 生成的圖,我更喜歡 ChatGPT,也更有海報的氛圍:
此外,ChatGPT 側邊欄也推出專屬的圖像(Images)創作空間,有以下幾個特色:
- 多種預設濾鏡與熱門提示(十種預設濾鏡)
- 定期更新以反映最新趨勢
- 一次性外觀上傳功能,讓你可在後續創作中重複使用相同外貌,而無需反覆從相簿挑選










