大家可能都聽過許多老舊程式因為一再疊代加上多人接手導致程式碼複雜到沒人能解,大部分情況工程師會選擇「只要程式還能動就別動它」,不過這也導致某些問題成為後面接手的工程師想解決但毫無頭緒萬年臭蟲。近期一位擁有30年C++ 開發經驗的老牌程式工程師在 Reddit 上分享了自己如何靠 Anthropic 最新的 Claude Opus 4 模型,僅用數小時就修正了之前自己四年以來卻一直解決不了的「白鯨bug」的故事,讓人驚嘆 Claude Opus 4的程式編寫能力。
AI除錯新時代!國外工程師用Claude Opus 4修正多年無解老BUG
這位 Reddit 帳號為 ShelZuuz 是一位擁有30年的 C++ 資深開發者,曾任職於FAANG(Meta、亞馬遜、蘋果、奈飛與Google)等大型公司,現今則是公司團隊中不可或缺的技術支援角色。
四年前,他在一次大規模重構60,000行程式碼的專案中,意外地發現了一個極為隱蔽的bug。該問題僅會在某一特定 shader 於某一極端邊界條件下,才會觸發渲染錯誤。這類bug平時幾乎無法重現,一旦發生卻導致系統異常,因此他將其戲稱為「白鯨bug」(white whale bug;靈感源自小說《白鯨記》中,哈克船長追逐難以捉摸的巨鯨)。
ShelZuuz 為此前後投入了超過200個小時的排查時間,嘗試使用各類AI模型協助分析,包括GPT-4.1、Gemini 2.5與Claude 3.7,皆無功而返。直到最近更新的 Claude Opus 4 與其強化的 Claude Code 功能問世,ShelZuuz 決定再試一次。這回,他使用了33個精心設計的 prompt(提示詞)與一次重啟,配合完整的重構前後代碼,這次 Claude Opus 4 成功定位並解釋了 bug 的成因。
AI診斷出的核心問題不在於傳統的邏輯錯誤,而是架構層面上的兼容性遺失:
-
舊架構:在未有意識設計的情況下,巧合性地支援了該shader的特殊用法。
-
新架構:因未考慮這種非設計行為的使用方式,導致原本可運作的情境在新架構下失效。
這類程式碼過於老舊複雜的問題極難以純人力排查與重現,AI則透過跨檔案的深層關聯分析與架構邏輯推演,快速提出合理解釋與修改建議,完成一次堪稱教科書等級的debug過程。有開發者粗略計算,像 ShelZuuz 這樣的資深工程師,200小時的工時成本至少為25,000美元;而Claude Opus 4的訂閱費僅為200美元/月。這不僅是一個顯著的成本落差,更凸顯了AI在解決某類技術難題上的潛力。
當然,也有工程師指出,Claude Opus 4之所以能成功,與prompt設計的品質高度相關。換言之,AI仍需依賴有經驗的開發者設計合理問題、提供正確上下文。但無論如何,Claude Opus 4在此事件中展現出的能力,毫無疑問地提升了人們對AI編碼輔助的認知上限。
Claude Opus 4所搭載的Claude Code,是此次事件的幕後功臣。這項功能讓AI不只是回答問題,而是能夠真正理解、遍覽、修改甚至重構大型代碼庫。
其應用包括但不限於:
-
錯誤修復(bug fix)
-
新功能實作(feature development)
-
單元測試編寫(unit testing)
-
橫跨檔案的代碼修改與重構(cross-file refactoring)
根據Anthropic的官方 Demo,Claude Code 可實現持續七小時的獨立程式設計、或24小時不間斷的讓 AI 玩寶可夢等高難度任務,顯示其在理解與生成層面的突破性進展。
在這起「白鯨bug」事件後,全球許多開發者紛紛開始嘗試使用Claude解決自己遇到的bug,而且都有很正面的回饋,目前看起來 Claude Opus 4 在程式編寫除錯方面的確很有一套,相信現在開始應該會有更多工程師用它來解決一些歷史因素累積難解的程式 BUG(編按:不過也是要當事人要懂程式啦,不然全靠AI解決了沒瞭解原因之後也許會有更大的麻煩也難說…)。
C++ dev and ex-FAANG staff engineer with 30+yrs of experience was stuck on a bug for ~200hrs over 4 years.
Claude Opus 4 solved it, and was the only model that could. pic.twitter.com/QSJnesC90S
— Deedy (@deedydas) May 27, 2025