2025 年 9 月 25 日,Google 宣布正式更新旗下 Gemini 2.5 Flash 與 Gemini 2.5 Flash-Lite 模型。這次升級帶來多項關鍵改善,不僅在回應精度與速度上大幅提升,同時也大幅降低了運算與使用成本,現在已經可在 Google AI Studio 和 Vertex AI 等平台上免費使用。
Gemini 2.5 Flash 與 Flash-Lite 的定位
Gemini 2.5 Flash 是一款 輕量且高性能的 AI 模型,其最大特點在於即使在免費版本的 Gemini 中,也能享受該模型的運算能力,為使用者提供門檻更低的 AI 體驗。相較之下,Gemini 2.5 Flash-Lite 則是一個專注於 降低延遲 的高速模型,特別適合需要即時回應的場景,如客服、互動應用或高頻輸入輸出的任務。
Gemini 2.5 Flash just got a few new updates:
You’ll see enhanced step-by-step help for homework, better-organized responses, and improvements in image understanding. Here’s a breakdown of what’s new 🧵 pic.twitter.com/Pzv2mYNwKB
— Google Gemini App (@GeminiApp) September 25, 2025
Google 在官方部落格中指出,這兩個模型的定位並非互相取代,而是針對不同的使用需求提供選項:Flash 注重「全面精度與功能」,而 Flash-Lite 則主打「極速回應」。
效能提升與測試數據
根據 Google 公布的比較數據,Gemini 2.5 Flash(白色數據)與 Flash-Lite(藍色數據)在更新後,均在「回應精度」與「回應速度」兩項指標上有明顯進步。
-
回應精度:更新後能更準確地理解與生成內容,避免錯誤或偏差。
-
回應速度:模型回應時間縮短,使互動更加即時與流暢。
另一項值得關注的數據是 輸出詞數的減少。由於 Gemini 系列的 API 是依據輸出詞數(Token 數量)計費,因此減少詞數代表更低的使用成本:
-
Gemini 2.5 Flash:輸出詞數減少 24%。
-
Gemini 2.5 Flash-Lite:輸出詞數減少 50%。
這意味著同樣的任務,開發者與企業可在降低支出的同時,獲得更快更準的回應,整體成本效益大幅提升。
實際功能上的改進
除了性能與成本優化,Google 也強調了 Gemini 2.5 Flash 在功能上的多項改進:
-
更清晰的教學能力
在處理教育或學習相關的任務時,模型能夠更明確地「分步驟」解釋解題過程,而非僅僅提供最終答案。這使得 Gemini 更適合作為學習輔助工具。 -
複雜資訊的結構化輸出
對於需要彙整大量或複雜資訊的情境,模型現在能將內容轉化為 列表、表格 等更直觀的格式,方便用戶快速理解。 -
圖像辨識精度提升
在影像分析方面,更新後的模型展現了更高的準確率,對於需要多模態應用(文字 + 圖像)的開發者來說,將能帶來更可靠的結果。
API 使用體驗的革新:「-latest」別名
另一項開發者社群十分關注的更新,是 Google 在 Gemini 系列 API 中引入了 「-latest」別名。
以往每次模型更新,開發者都必須在原始碼中手動修改版本號,例如從「gemini-flash-2.5」改成「gemini-flash-2.6」。現在,只要在模型名稱後加上「-latest」,如「gemini-flash-latest」,即可自動指向最新版本。
使用者回饋與挑戰:回應中斷的問題
然而,Gemini 系列並非全然沒有挑戰。Google 社群與開發者論壇中,不乏針對 「回應中斷」 的抱怨。許多用戶反映,與 Claude 或 GPT-4 等競爭對手相比,Gemini 的回應更容易在生成過程中突然中止,導致體驗不佳。
在知名技術社群 Hacker News 上,有用戶直言:
「Gemini 的回應雖然在內容上優於 Claude 或 GPT-4,但回應中斷的次數實在太多。我寧願使用『稍微遜色但能完整回應的模型』,也不會選擇『表現更好卻經常中斷的模型』。若這個問題無法解決,無論 Gemini 的基準測試多麼亮眼,仍會讓人覺得它『有缺陷』。」
這反映出 AI 模型不僅要在基準測試中勝出,更需要在實際應用場景中展現穩定性。對於開發者與企業而言,「不中斷、完整回應」往往比「速度與精度」更具實用價值。
目前 Google 在 AI 模型領域的佈局相當清楚:以 Gemini Ultra 作為高階旗艦,滿足專業與企業需求;以 Gemini Pro/Flash/Flash-Lite 滲透至更廣泛的應用場景。
這次 Flash 與 Flash-Lite 的升級,凸顯了 Google 在三大面向的戰略:
-
成本控制:透過減少輸出詞數,讓 API 使用更具成本效益。
-
開發者友好:以「-latest」簡化維護,降低導入與更新成本。
-
多樣化選擇:提供高精度、高速度兩種不同取向的模型,滿足不同應用場景。
然而,在與 OpenAI 的 GPT 系列、Anthropic 的 Claude 系列競爭的同時,Google 必須正視穩定性問題。否則即便在效能或價格上具備優勢,仍可能因使用體驗不佳而失去市場口碑。