不意外的,Google 在 I/O 2026 活動中,正式推出新一代 Gemini 3.5 系列模型,率先推出 Flash 版本,旗艦 Pro 也預告下個月會亮相。過去 Flash 系列在 Google 的產品線裡,定位都是便宜、快、但能力差一點,但這次 Gemini 3.5 Flash 很不一樣,直接可以跟競爭對手的 Opus 4.7、GPT-5.5 比較,還拿下不少領先項目,可說相當驚艷。
更重要的是,Gemini 3.5 Flash 也維持一貫的高 CP 值價格,Gemini 和 Google AI 搜尋預設模型也改成 3.5 Flash,代表說即便是免費用戶,也能輕鬆體驗這款新一代最強模型,這肯定會給 OpenAI、Anthropic 不小的壓力。

Gemini 3.5 Flash 正式登場:代理與多模態超車 Claude Opus 4.7、GPT-5.5,但長文與推理仍有差距
Google 表示,Gemini 3.5 Flash 在「AI 代理」與「程式開發」這兩部分進步最大,並形容這是他們至今最強的代理與程式開發模型。
對比前一代 Gemini 3 Flash,Gemini 3.5 Flash 在 Google 公布的所有測試項目幾乎都是大幅躍進,像是極具挑戰性的程式編寫與代理基準測試中,Terminal-bench 2.1 從 58.0% 提升到 76.2%、MCP Atlas 從 62.0% 變成 83.6%、GDPval-AA 也從 1204 Elo 大幅增加到 1656 Elo,這個進步幅度可說相當猛。更值得一提的是,Gemini 3.5 Flash 也在多數項目超越自家前一代旗艦 Gemini 3.1 Pro。
而跟競爭對手相比,在 AI 代理這塊
- 工具調用的 MCP Atlas 中 Gemini 3.5 Flash 拿到 83.6%,Claude Opus 4.7 是 79.1%、GPT-5.5 是 75.3%,意味著直接領先對手不少。
- 跨工具操作的 Toolathlon 也以 56.5% 微幅贏過 GPT-5.5 的 55.6%(Opus 4.7 此項未測)。
多模態的兩項測試也主要是 Gemini 3.5 Flash 領先
- CharXiv Reasoning(從複雜圖表抓資訊)為 84.2%,微幅超過 GPT-5.5 的 84.1% 與 Opus 4.7 的 82.1%
- MMMU-Pro 則拿到 83.6%,領先 GPT-5.5 的 81.2% 與 Opus 4.7 的 75.2%
除此之外,專家任務裡的 Finance Agent v2(金融分析與決策)Gemini 3.5 Flash 也拿到 57.9%,超越 Opus 4.7 的 51.5%、GPT-5.5 的 51.8%。
以下幾個是成績接近的測試項目
- Terminal-bench 2.1(代理化終端機編寫)為 76.2%,雖然輸給 GPT-5.5 的 78.2%,但贏過 Opus 4.7 的 66.1%
- OSWorld-Verified(代理操作電腦)為 78.4%,跟 GPT-5.5 的 78.7%、Opus 4.7 的 78.0% 幾乎一樣,三家差距都在 1% 以內
- Blueprint-Bench 2(代理空間推理)為 33.6% 也只落後 GPT-5.5 的 36.2% 一點點,但已經大幅超過 Opus 4.7 的 24.5%
至於寫程式,雖然 Gemini 3.5 Flash 確實領先前一代旗艦模型 Gemini 3.1 Pro,但跟 Opus 4.7 和 GPT-5.5 相比,還是有一些些落後:
- SWE-Bench Pro(程式碼編寫)獲得 55.1%,Claude Opus 4.7 是 64.3%,落後約 9%,GPT-5.5 則是 58.6%
完整測試成績圖表:
即便效能變強許多,Gemini 3.5 Flash 在速度上也沒有妥協,即便是處理冗長、多步驟的任務,也能在極短的時間內協助完成,而且成本往往不到其他同級模型的一半。目前看下來,真的令人期待 Gemini 3.5 Pro 的到來:
除此之外,同場公布的 Gemini Spark 自家 24 小時 AI 代理工具,目前也是由 Gemini 3.5 Flash 驅動。Google 也將自家的代理開發平台 Antigravity 升級到 2.0 版本,並支援 Gemini 3.5 Flash 模型,現在可以同時派多個子代理分工,跨編輯器、終端機與瀏覽器執行多步驟任務。
Gemini 3.5 Flash 即日起開放,可在以下平台使用:
- Gemini 應用程式
- Google 搜尋的 AI 模式
- Google Antigravity、Google AI Studio 或 Android Studio 裡的 Gemini API
- 企業可透過 Gemini Enterprise Agent Platform 與 Gemini Enterprise 接入
Gemini 3.5 Pro 目前 Google 內部已經在用,預計下個月正式推出。

