為了對應 Google 推出的 Gemini 3 Pro,先前市場就有傳出 OpenAI 會推出更強的新模型,而就如同傳聞,稍早 OpenAI 正式揭曉全新 GPT-5.2 模型,不意外的,各項測試分數都贏過 Gemini 3 Pro,唯一可惜是沒有同步更新圖片生成能力。除此之外,根據外媒報導,OpenAI 也已經預告成人模式登場的時間點,下面就整理給大家。

OpenAI 全新 GPT-5.2 模型登場,即刻起陸續推送給付費用戶
OpenAI 最新 GPT-5.2 模型各方面都有明顯提升,不僅速度更快,在資料搜尋、製作簡報、寫作和翻譯方面等,也都變得更好用。就如同前一代,ChatGPT 中的 GPT-5.2 也有三種模式,分別為
- GPT‑5.2 Instant:速度最快,在資訊查詢、操作指南、逐步說明、技術寫作與翻譯方面都有顯著提升,並延續 GPT‑5.1 Instant 所導入的溫暖對話語氣。
- GPT‑5.2 Thinking:專為更深入的工作而設計,回應結構更清晰,提供的細節也更實用。
- GPT‑5.2 Pro:目前最聰明、最可靠的模型,適合需要高品質答案、且容許較長回應時間的艱深問題。
下圖是 GPT-5.2 Thinking 和前一代 GPT-5.1 Thinking 的比較,可以看到在平時最常使用到的知識工作任務中,提升幅度超過 80%:
| 基準測試 | 領域 | GPT-5.2 Thinking | GPT-5.1 Thinking | 提升幅度 |
|---|---|---|---|---|
| GDPval(勝出或平局) | 知識工作任務 | 70.9% | 38.8% | +82.7% |
| SWE-Bench Pro(公開) | 軟體工程 | 55.6% | 50.8% | +9.4% |
| SWE-bench Verified | 軟體工程 | 80.0% | 76.3% | +4.8% |
| GPQA Diamond(無工具) | 科學問題 | 92.4% | 88.1% | +4.9% |
| CharXiv Reasoning(Python 輔助) | 科學圖表問題 | 88.7% | 80.3% | +10.5% |
| HMMT(2025 年 2 月) | 數學競賽 | 99.4% | 96.3% | +3.2% |
| FrontierMath(第 1 至 3 級) | 高等數學 | 40.3% | 31.0% | +30.0% |
| ARC-AGI-1 (Verified) | 抽象推理 | 86.2% | 72.8% | +18.4% |
| ARC-AGI-2 (Verified) | 抽象推理 | 52.9% | 17.6% | +200.6% |
而大家很在意的幻覺問題,GPT-5.2 Thinking 同樣變更低,錯誤率僅 6.2%,比起 GPT-5.1 Thinking 的 8.8%,下降達 38%:
GPT‑5.2 Thinking 也是 OpenAI 至今最強的視覺模型,在圖表推理及軟體介面理解方面的錯誤率減少約一半,這代表說,你更不用擔心 AI 辨識和判斷錯誤的問題。
科學圖表問題提升了 8.4%,準確率來到 88.7%:
圖形使用者介面螢幕截圖理解提升幅度更大,多達 22.1%,GPT-5.2 Thinking 現在準確率已經超過 86%:
那跟 Google 最強的 Gemini 3 Pro 相比呢?OpenAI 也在 X 官方社群中提供比較測試數據,GPT-5.2 Thinking 通通都領先:
OpenAI 表示在 ChatGPT 中,將於今日起陸續推出 GPT‑5.2 Instant、Thinking 和 Pro,並率先提供給付費方案(Plus、Pro、Go、Business、Enterprise)使用者,如果你還沒看到,晚點後再試試。而前一代 GPT‑5.1 也會以現行模型形式提供給付費使用者,三個月後才會正式下線。
ChatGPT 成人模式推出時間計劃
除了發表 GPT-5.2,根據外媒 The Verge 報導,在稍早的簡報會中 OpenAI 應用部門執行長 Fidji Simo,也向記者表示預期 ChatGPT 的「成人模式」將在 2026 年第一季推出。同時補充,正式推出之前,OpenAI 希望能先把「年齡預測」這件事做得更準確。
另外 Sam Altman 還在社群中預告,下週會有小小的聖誕禮物,細節則沒透露,不過幾天前市場有傳出 ChatGPT 正在測試一個「假期優惠」,免費贈送 3 個月 ChatGPT Plus 資格,不確定是不是這個:



