就在剛剛,Google 正式發布最新的 Gemini 3.1 Pro 預覽版,這是 Gemini 3 系列的重大升級版本。該模型在核心推理能力上實現顯著突破,於 ARC-AGI-2 基準測試中取得 77.1% 的成績,較前代 Gemini 3 Pro 提升超過兩倍。此次發布標誌著 Google 在 AI 大型語言模型(LLM)領域的又一次重要進展。
Google Gemini 3.1 Pro 核心能力提升
Gemini 3.1 Pro 建立在 Gemini 3 系列基礎之上,專為需要深度推理的複雜任務設計。Google 官方表示,此版本代表著核心推理能力的顯著躍進,為複雜問題解決提供了更強大的基線能力。根據數據,Gemini 3.1 Pro 在多項關鍵基準測試中表現出色:ARC-AGI-2 達到 77.1%、SWE-Bench Verified 達到 80.6%、HLE(Humanity’s Last Exam)則分別取得 44% 與 51% 的成績。這些數據顯示該模型在程式碼生成、邏輯推理以及專業知識理解等面向均達到業界領先水平。
實際應用展示
Google 在官方發布中展示了多項 Gemin 3.1 Pro 的實際應用案例,涵蓋程式碼動畫、複雜系統整合、互動設計以及創意程式碼等領域。在程式碼動畫方面,3.1 Pro 能夠直接從文字提示生成網站可用的動畫 SVG。由於這些動畫以純程式碼構建而非像素圖像,因此無論如何縮放都能保持清晰銳利,且檔案大小遠小於傳統影片格式。
在複雜系統整合應用上,該模型展示了整合公開遙測數據流的能力,成功建立即時國際太空站追蹤儀表板。這項展示凸顯了 3.1 Pro 在橋接複雜 API 與使用者友善設計之間的強大能力。
互動設計方面,3.1 Pro 編寫了複雜的 3D 椋鳥群飛模擬系統,不僅生成視覺程式碼,更建構了完整的沉浸式體驗。使用者可以透過手部追蹤操縱鳥群,並聆聽隨鳥類移動而變化的生成式配樂。這為研究人員和設計師提供了強大的感官豐富介面原型開發工具。
在創意程式碼領域,當被要求為《咆哮山莊》建立現代個人作品集網站時,3.1 Pro 不僅僅是總結文本內容,而是深入理解小說的氛圍基調,設計出時尚且能捕捉主角精髓的當代介面。
推出管道與取得方式
Gemini 3.1 Pro 即日起在多個管道開放使用:
- 開發者:Gemini API、Google AI Studio、Gemini CLI、Antigravity 代理開發平台、Android Studio
- 企業用戶:Vertex AI、Gemini Enterprise
- 消費者:Gemini App、NotebookLM(Pro 與 Ultra 訂閱用戶專屬)
Google 強調,此次以預覽形式發布 3.1 Pro 是為了驗證更新內容,並在正式全面推出前持續改進代理工作流程等領域。Gemini App 中的 3.1 Pro 即日起向 Google AI Pro 和 Ultra 方案用戶推出,並提供更高的使用額度。
本週可謂大型語言模型領域的「超級發布週」,剛好在台灣農曆新年假期這一週,各大 AI 巨頭連續發表了 Opus 4.6、Sonnet 4.6、Codex 5.3、Grok 4.2 以及 Gemini Pro 3.1 等重要模型皆於同一時間段發布,顯示 AI 產業競爭已進入白熱化階段。
Gemini 3.1 Pro API 價格與競爭對手比較
主要模型價格對照表(每百萬 token)
| 模型 | 輸入價格 | 輸出價格 | 總成本(1M in + 1M out) |
|---|---|---|---|
| Grok 4.1 Fast | $0.20 | $0.50 | $0.70 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $11.25 |
| Gemini 3 Pro | $2.00 | $12.00 | $14.00 |
| Gemini 3.1 Pro | ~$2.00* | ~$12.00* | ~$14.00 |
| GPT-4o | $5.00 | $15.00 | $20.00 |
| Claude Sonnet 4 | $3.00 | $15.00 | $18.00 |
| Claude Opus 4 | $15.00 | $75.00 | $30.00 |
* Gemini 3.1 Pro 價格預估與 3 Pro 相近(官方 Preview 版價格)
未來展望
Google 表示,自 2024 年 11 月發布 Gemini 3 Pro 以來,用戶反饋與技術進步的速度推動了這些快速改進。3.1 Pro 的預覽發布是為了在正式全面推出前驗證更新,並持續推進更具企圖心的代理工作流程。就在上週,Google 已發布 Gemini 3 Deep Think 的重大更新,專門針對科學、研究與工程領域的現代挑戰。而 3.1 Pro 正是實現這些突破的核心智慧升級版本,Google 正將這一進展帶入日常應用場景。
隨著 Gemini 3.1 Pro 的推出,Google 在大型語言模型競賽中展現了強勁的追趕態勢。無論是在推理能力、程式碼生成效率,或是多模態應用整合方面,這款新模型都為開發者與企業用戶提供了更具競爭力的選擇。市場將持續關注其正式版發布後的實際表現,以及與 Anthropic Claude、OpenAI GPT 系列等競品的長期競爭格局。

