Anthropic 在 4 月初發表了號稱「太危險而不能公開」,專為企業級網路安全漏洞偵測打造的最強 AI 模型 Claude Mythos Preview,目前僅開放給蘋果、亞馬遜、摩根大通等約 40 家經過審核的大型科技與金融機構使用。然而根據彭博社近日的獨家報導,理應嚴格限制使用權限的 Claude Mythos 模型卻因為 Anthropic 的疏失,讓一個活躍於 Discord 的小型群組在未公布前就取得了未授權存取權限,並持續使用至今,這起事件讓 Anthropic 打造的「資安守護神」形象變成一場幽默的鬧劇。

Claude Mythos 因低級錯誤被業餘玩家破解搶先玩
4 月 7 日,Anthropic 高調發表 Claude Mythos Preview,宣稱這是一款專為企業資安打造的前沿 AI 模型,能夠主動偵測與修補系統漏洞。英國 AI 安全研究所評估後認定,Mythos 的能力「明顯優於先前的前沿模型」。Anthropic 自己也在技術文件中承認,這款模型若遭濫用,可能成為「強大的駭客工具」。
既然這麼危險,Anthropic 祭出了代號「Project Glasswing」的限制發行計畫,僅開放給蘋果、亞馬遜、摩根大通、高盛、花旗、美國銀行、摩根士丹利等超過 40 家經審核的機構。美國財政部長 Scott Bessent 甚至為此召開專門會議,鼓勵銀行業者用 Mythos 來強化自身防禦。陣仗之大,彷彿在守護核武級別的機密。
然而,這整套精心設計的保密機制,卻在最基本的地方翻了車。
三個低級錯誤,一場荒唐鬧劇
根據彭博社的獨家報導,一個活躍於 Discord 的小型群組,靠著三招就突破了 Anthropic 的防線:
第一招:猜網址:沒錯,就是猜。這群人研究了 Anthropic 過去發布其他模型時使用的網址命名規則,然後「有根據地猜測」了 Mythos 的線上位置,居然就猜對了。一家號稱頂尖 AI 安全公司的秘密模型端點,竟然遵循著可預測的命名慣例,這就好比銀行金庫的密碼是「bank1234」一樣離譜。
第二招:翻外洩資料:先前人力資源平台 Mercor 發生資料外洩,而外洩的資料中恰好包含了 Anthropic 模型位置的格式資訊。換句話說,Anthropic 的模型部署資訊,因為第三方平台的資安事故而間接曝光,但 Anthropic 顯然沒有在 Mercor 事件後重新檢視自家的端點安全。
第三招:借用承包商權限:群組成員還利用了一家 Anthropic 第三方承包商員工的存取權限,一款被定義為「太危險」的模型,其存取權限卻能透過外部承包商輕易取得,這在資安圈簡直是教科書級的反面教材。
最諷刺的是,這三招沒有任何一招稱得上高明。沒有零日漏洞攻擊、沒有社交工程、沒有精密駭客手法,就是最基本的資訊蒐集加上一點推理能力。彭博社報導中形容這群人的動機時用了一句話:「只是對新模型感興趣,想玩玩看,並非要搞破壞」。他們甚至主動向彭博社提供了螢幕截圖和即時操作示範來證明自己的存取權限。
用了好幾個禮拜,沒人發現
如果說「被猜到網址就闖入」已經夠尷尬,那接下來的事實更讓人無語:這群人從 Mythos 上線第一天就開始使用,一直用到彭博社 4 月 21 日發出報導,中間長達數週,Anthropic 竟然毫無察覺。更令人震驚的是,這個 Discord 群組存取的不只是 Mythos,他們還取得了 Anthropic 其他尚未發布的模型。也就是說,Anthropic 的模型安全問題可能不是個案,而是系統性的管理漏洞。
這群人至少還算「善良」,告訴彭博社他們並未利用 Mythos 去挖掘新的安全漏洞。但問題是:如果一群業餘愛好者都能輕鬆進入,真正有惡意的駭客組織會進不去嗎?
Anthropic 的官方回應:都是供應商的錯
面對這場公關災難,Anthropic 發言人的聲明顯得相當制式:「我們正在調查一份聲稱透過我們的第三方供應商環境未授權存取 Claude Mythos Preview 的報告。」同時強調「目前沒有證據顯示這些未授權活動影響到 Anthropic 自身的系統」。
把責任推給第三方供應商,技術上或許說得通,但邏輯上站不住腳。既然 Anthropic 自己都認定 Mythos「太危險而不能公開」,那確保每一個接觸點的安全,本來就是 Anthropic 自己的責任。你不能一邊說「這把刀太鋒利了,只能讓特定的人碰」,一邊又把鑰匙交給管理鬆散的第三方保管。
小結
這起事件最大的諷刺在於 Anthropic 的品牌定位。這是一家從創立第一天就把「AI 安全」掛在嘴邊的公司,其創辦人 Dario Amodei 三天兩頭在公開場合談論 AI 風險與負責任的開發。Anthropic 甚至因為過度強調安全,對外一直以「資安守護神」的形象自居。
結果現在,這家「資安守護神」連自家最核心的產品都保護不好。而且這不是第一次了,先前 Anthropic 就曾傳出 Claude Code 內部原始碼外洩的事件。接連兩次安全事故,對一家以安全為賣點的公司而言,打臉力道不可謂不大。歸根結底,這場鬧劇的核心教訓很簡單:再好的保密計畫,都經不起最基本的疏忽。當你宣稱手上有一款「太危險」的技術時,至少先確保存放它的地方,不會被人靠猜的就找到。結果搞了半天 Claude Mythos Preview 也許在找漏洞真的很神,但自家的員工的低級錯誤卻卻把它的臉打腫了。


