隨著 AI 發展快速,現階段已經有很多 AI 模型能夠生成出高品質的圖片,甚至連真假難辨的真實圖片也沒問題,因此戰場也漸漸轉向 AI 的圖片編輯能力強不強。如果你覺得 ChatGPT、Gemini 已經很不錯了,那 Black Forest Labs 近日推出的 FLUX.1 Kontext 模型一定會讓你更滿意,推薦大家玩玩看。
FLUX.1 Kontext 模型介紹
FLUX.1 Kontext 是一套以生成式流匹配為基礎的模型,不僅能生成影像,還能進行編輯。與現有的文字轉圖片模型不同,FLUX.1 Kontext 支援「語境內」圖片生成,也就是能同時使用文字與圖片作為提示,產出全新且一致的圖片內容。
Black Forest Labs 表示,FLUX.1 Kontext 模型能理解現有圖片,並以簡單的文字指令進行修改,可做到角色一致、局部編輯性、以及風格參考,並且支援逐步添加指令與編輯,可在不犧牲品質與一致性的情況下,逐步創作內容。
更值得一提的是,推理速度還比當前主流模型還快上 8 倍,我測試速度確實很快。
Black Forest Lab 也有分享範例圖片,像下圖最左邊是最初的圖片,中間輸入提示詞「讓她的頭傾向鏡頭」,右邊則是「讓她笑起來」:
再來是修改圖片上的文字,左邊是原圖,中間輸入提示詞將『YOU HAD ME AT BEER』改為『YOU HAD ME AT CONTEXT』」,右邊為:「將場景改為夜店」:
當然,光看官方介紹不準,一定要自己測試才知道,而在 FLUX Playground 就能免費體驗。
如何免費體驗 FLUX.1 Kontext 的圖片編輯功能
FLUX Playground 是 FLUX 推出的互動式平台,用戶可在這邊體驗到最新 AI 模型,來生成與編輯圖片,目前也已經加入 FLUX.1 Kontext 系列。
按上方連結進到 FLUX Playground 後,如果你還沒有 FLUX 帳號,就免費註冊一下,也支援 Google 帳號快速註冊:
登入之後,會進到 FLUX Playground 的主介面,左邊為功能選單,右邊則是生成器,下方也有一些範例可參考。生成器預設就是使用 FLUX.1 Kontext 模型:
把你要修改的照片或圖片上傳,我測試阿達騎著駱駝的照片,然後要求它把阿達的臉轉向正面,表情緊張,並且背後有一隻蟒蛇在追他,提示詞目前僅支援英文,可以用 ChatGPT 或其他翻譯工具翻成英文:
接著就會獲得結果,預設會一次生成 4 張,你也能改成 1~2 張。不過這張照片的編輯效果我覺得沒有很好,雖然我要求的變化都有做到,像是臉變正面、表情緊張、後面有蟒蛇,但阿達的臉不對,變成另一個人:
我也拿同一張圖和提示詞,去測試 Gemini 和 ChatGPT 4o 的編輯效果,FLUX.1 Kontext 全勝。
Gemini 完全不行:
ChatGPT 4o 除了臉不對,這表情也沒到很緊張,不過蟒蛇追逐感是這三張最好的:
再來我測試另一張簡單一點的,把阿達的衣服改成吊嘎,也就是封面那張圖,這效果就很棒,不過左邊那張阿達的頭髮不見了(笑):
同樣的我也測試 Gemini,這張 Gemini 也做很好,不一樣的吊嘎風格:
ChatGPT 反而不行,臉又變了:
再來我還有測試這張圖改成阿達張開嘴巴,左邊還不錯,右邊臉就變另一個人:
除了局部修改,FLUX.1 Kontext 的生成圖片品質也不錯,可以多玩玩看。左下角可以查看你還剩下多少 Credits: