除了 OpenAI,Anthropic 也在稍早時間推出新版 Claude Opus 4.6 模型,標榜提升寫程式的能力,同時也是 Opus 等級模型首度在測試版中提供 100 萬 token 的超長上下文視窗,規劃更周密,能更長時間執行代理任務,在多項評測中,都達到業界最先進水準。Claude Pro 以上訂閱用戶現在就能使用了。

Claude Opus 4.6 兩大升級:長任務更穩、1M token 上下文首度導入
Claude Opus 4.6 跟前一代 Claude Opus 4.5 的差別,主要在「長任務品質」與「大上下文的穩定度」部分,意味著能提供更好的規劃、更久地維持代理式任務、在更大程式碼庫更可靠、以及更強的程式碼審查與除錯。
關於「1M token 的上下文視窗」,很多人可能對 token 沒什麼概念,你可以把它看成一次能讀進與記住的內容量,因此內容量變大後,AI 就更能在同一個對話裡同時掌握多份文件、長報告、或更大的程式碼專案脈絡。
Anthropic 表示,他們發現到 Opus 4.6 會自動把注意力集中在最困難的部分,並快速處理比較簡單的部分,如果碰到模糊問題,判斷也更加成熟,並能在長時間工作下維持高效率。
Opus 4.6 也能應用在各種日常工作上,例如:財務分析、研究,以及使用或製作文件、試算表與簡報,搭配 Cowork 更能自主完成你指定的工作。
再來看評測分數。
在 GDPval-AA(衡量金融、法律等具經濟價值知識工作的評測)中,Opus 4.6 的表現比 OpenAI 的 GPT-5.2 高出約 144 Elo 點,也比前代 Claude Opus 4.5 高出 190 點:
在 Humanity’s Last Exam(跨領域複雜推理測驗)中也領先所有前沿模型:
在 Vending-Bench 2 測試中,Opus 4.6 能長時間維持專注度,並比 Opus 4.5 多賺取 3,050.53 美元:
下圖是更多測試成績,許多方面都比 Opus 4.5 還要強,尤其是 Agentic search 和 Novel problem-solving:
圖片來源:Claude
Anthropic 也同步推出 Claude in PowerPoint,安裝後即可在 PowerPoint 側邊欄直接使用 Claude。
過去使用者本來就能讓 Claude 生成一份簡報檔案,但如果要編輯,還是需要手動匯入 PowerPoint,操作有點麻煩,隨著 Claude in PowerPoint 推出,使用者就能直接在 PowerPoint 裡完成生成和編輯,並在製作過程中持續獲得 Claude 的幫助。



