Anthropic 於 5 月 28 日無預警發布 Claude Opus 4.8,距離上一代 Opus 4.7 僅相隔 41 天,創下該公司旗艦模型最短換代紀錄。新模型在程式碼撰寫、代理任務和專業工作方面全面提升,同時推出名為「動態工作流」(Dynamic Workflows)的全新功能,可協調數百個平行子代理處理大規模任務。

Anthropic 無預警發布 Claude Opus 4.8
41 天急切換代:Opus 4.7 反應不佳是主因
Opus 4.8 的推出節奏明顯快於 Anthropic 過往慣例。Opus 4.7 於 4 月 17 日發布,而 Sonnet 和 Haiku 的最新版本分別已推出 3 個月和 7 個月。TechCrunch 指出,如此急切的換代節奏,可能與 Opus 4.7 上市後部分使用者認為「表現令人失望」有關。
同期間,OpenAI 推出了 Codex 重大更新,Google 也發布了新版 Gemini Flash 模型,競爭壓力持續升高。Anthropic 與 OpenAI 今年都規劃公開上市(IPO),模型競爭已成為估值戰場的核心。
核心升級:更誠實、更擅長程式碼
根據 Anthropic 官方公告,Opus 4.8 的代理式程式碼撰寫(agentic coding)基準分數從前代的 64.3% 進一步提升至 69.2%。更關鍵的變化在於模型處理不確定資料的方式:Anthropic 表示 Opus 4.8「更傾向於主動標記工作中的不確定性,較不會提出缺乏根據的主張」。
橋水基金(Bridgewater Associates)在見證測試中表示,升級後最大的差異在於「Opus 4.8 主動標記分析輸入和輸出中的問題,這是其他模型經常忽略、留給使用者自行發現的」。
動態工作流:數百個子代理同時作業
Opus 4.8 同步推出「動態工作流」(Dynamic Workflows)功能,目前以研究預覽(Research Preview)形式開放。這項功能讓 Claude 能在 Claude Code 中管理跨越數百個平行子代理的大規模複雜任務。
Anthropic 在官方部落格中說明:「Claude Code 搭配 Opus 4.8,現在可以從啟動到合併,完成跨數十萬行程式碼的整個程式碼庫遷移,以現有測試套件作為驗證基準。」
新增「努力程度」控制與中斷指令更新
Opus 4.8 還帶來兩項實用更新:
第一、模型預設採用「高努力」(high effort)模式,Anthropic 表示這與 Opus 4.7 的 token 消耗量相近。使用者可選擇「extra」(在 Claude Code 中為 xhigh)或「max」等級,模型會花費更多 token 以獲得更好的結果。Anthropic 建議對困難任務和長時間非同步工作流程使用「extra」設定。
第二、開發者現在可以在任務進行中更新 Claude 的指令,而不會破壞提示快取(prompt cache)或需要透過使用者回合傳遞更新。
價格不變,Claude Code 速率限制提高
Opus 4.8 的定價與前代相同,並沒有因為版本升級而增加成本。同時 Anthropic 提高了 Claude Code 的速率限制,以配合更高努力程度帶來的 token 消耗。
Mythos 模型「數週內」全面開放
Anthropic 在今年 4 月的 Mythos 模型初步預覽因網路安全疑慮而引發關注,官方至今僅向部分關鍵軟體平台的利益相關者提供存取權限。在 Opus 4.8 的發布公告中,Anthropic 暗示 Mythos 預覽期可能即將結束:「我們正在快速開發這些安全防護措施,預計能在未來數週內將 Mythos 級模型提供給所有客戶。」
