先前 Google 已經公布過 Gemini 2.5 Flash 和 Gemini 2.5 Pro,而經過一段時間,隨著 Google I/O 2025 登場,這二個模型現階段也變更強了,Gemini 2.5 Pro 加入了全新的 Deep Think 模式,Gemini 2.5 Flash 則是各層面都有提升,下面就整理給大家。
Gemini 2.5 Pro 加入 Deep Think 推理模式
Gemini 2.5 Pro 全新的 DeepThink 模式,Google 表示可以將效能推到極限,帶來突破性的成果,這模式會運用最新的思考與推理尖端研究,以及平行處理等技術,在美國數學奧林匹克(USAMO 2025)等目前最困難的數學基準測試,拿下了最高成績,也在 LiveCodebench 競賽級程式碼評測中領先其他競爭對手。
同時 Gemini 本來就是多模態模型,因此 MMMU 這類多模態測試表現也同樣優異。
下方是 Google 分享的測試成績。Gemini 2.5 Pro 的 DeepThink 模式在數學(USAMO 2025)中獲得 49.4% 的成績,比未開啟的 34.5% 還高出 15% 左右。LiveCodebenchv6 也高達 80.4%,遠遠領先 OpenAI o4-mini 的 72.5%。MMMU 則是 84.0%,也高於其他對手:
不過現階段 Gemini 2.5 Pro DeepThink 還在早期階段,Google 表示會花更多時間進行安全性評估,請安全專家進行進一步把關,因此現階段只開放給 Gemini API 提受信任的測試者,之後才會全面開放。
更強的 Gemini 2.5 Flash 登場
針對最高效模型 Gemini 2.5 Flash 部份,Google 也有持續提升能力,更新後的 2.5 Flash 在各個層面都有所提升,包括推理能力、寫程式、還是處理長文本等重要評測指標,表現都明顯進步:
LM Arena 排行榜上,Gemini 2.5 Flash 也位居第二,僅落後自家的 Gemini 2.5 Pro,不過新版 Flash 要等到 6 月初才會推出,Pro 也將隨後上線:
而 AI Studio、Vertex AI 和 Gemini App,以及有 Gemini 2.5 Flash 預覽版可以體驗,有興趣的人可以玩玩看,免費版也能用。
Gemini 2.5 Flash 和 Gemini 2.5 Pro 也獲得新一代語音能力
除了以上,Google 也宣布 Gemini 2.5 Flash 和 Gemini 2.5 Pro 的語音變得更加自然,可在同一段對話中用「兩種不同聲音」自然切換,還能模仿真實對話情境,而且不只是普通語調,還能表現出細膩語音情緒:
支援超過 24 種語言,不過看畫面上似乎沒有中文:
不過目前只有開放給 Gemini API: