自從 Google 把 Gemini 改成用運算量用量計算後,就引發不少付費用戶抱怨,特別是 Google AI Pro 用戶,額度消耗速度比想像中快很多,甚至做幾次重度任務就碰到上限,跟以前差非常多。因此對於經常拿 Gemini 做程式、長文件分析、Deep Research 或影片生成的人來說,感覺一定很差。
上週 Google 已經調整了 Antigravity,現在終於也開始動手修改 Gemini 了!稍早 Google 副總裁 Josh Woodward 在社群宣布,Gemini 的使用限制細節會進行變動,包括修正錯誤請求扣額度、影片生成消耗異常、重度提示吃掉太多額度等問題。
Google 調整 Gemini 使用限制:失敗請求不再扣額度、Flash-Lite 免費用,Ultra 影片生成數量加倍
這次爭議的背景,是來自 Google 從 2026 年 5 月 17 日開始調整 Gemini Apps 的使用限制,Gemini 改成以「運算量」為基礎計算使用限制,不是過去的「提示詞數量」。而運算量影響因素包含:提示詞複雜度、使用的功能、對話長度等,額度則會每 5 小時刷新一次,直到達到每週上限。
雖然這方式就跟 Claude 一樣,但由於 Google 才剛改,不知道 5 小時用量限制到底多少才合適,一開始設定太少,甚至沒有收到結果也會計算,就導致非常多付費用戶用沒多少,就爆用量額度。
其中一個最明顯的是 Omni 影片生成,很多用戶都碰到,只是做一兩次影片額度就滿了,這對想測試反覆調整影片提示的人來說,幾乎是還沒開始就先被卡住。Google 這次表示,與 Omni 影片生成相關的 Bug 已經修正,同時也提高重度使用者的額度,Google AI Ultra 用戶的 Omni 影片生成數量會立即加倍:
另一個修正重點,是比較複雜的「Pro 模型」提示,像是長提示詞、大量檔案上傳、多步驟推理這類任務,本來就比一般聊天更吃運算量,但先前的計算方式可能會讓單次請求消耗過高,因此,Google 接下來會替這類重度任務加上單次的提示詞消耗上限,避免一個特別複雜的任務直接吃掉太多可用額度:
更重要的是,失敗請求也不會再扣額度。Josh Woodward 提到,大約 1/10 的請求可能會因系統錯誤而失敗。如果使用者送出提示後 Gemini 自己出錯,過去可能會被計入使用限制,這次修正後,只要請求失敗,就不會再扣除額度:
此外,Flash-Lite 模型部分,接下來也不會再計入額度。Google 官方把 Flash-Lite 定位成速度快、適合摘要、腦力激盪等日常任務的輕量模型,如果只是整理文字、快速問答、改寫一小段內容,不用說一定要用 Pro 模型,可以改用 Flash-Lite,把額度留給真正需要推理或長上下文的任務:
Deep Research 也會有更清楚的使用量拆解與通知。Google 接下來會讓使用者更清楚看到 Deep Research 的使用狀況,至少能知道是哪一類任務消耗比較多,而不是只看到額度突然大幅下降:
還有一個小改動也蠻實用的,Gemini 現在會記住使用者選擇的模型。也就是說,如果你經常使用某個模型做寫作、研究或整理資料,下次打開 Gemini 時不用再重新選一次。不過如果碰到使用上限,系統還是會自動切到較輕量的模型,讓對話能繼續進行:
以下是這次公告的 Gemini 使用限制變化統整:
| 調整項目 | 修正內容 |
|---|---|
| 失敗請求 | 系統錯誤導致失敗的請求,不再扣除使用額度。 |
| Flash-Lite | Flash-Lite 提示不再計入使用額度。 |
| 重度 Pro 提示 | Google 會替複雜提示、長對話、大量檔案等重度請求加上單次消耗上限。 |
| Omni 影片生成 | 相關 Bug 已修正,AI Ultra 用戶的 Omni 影片生成數量也會加倍。 |
| Deep Research | Google 會改善 Deep Research 的使用量拆解與通知。 |
| 模型選擇 | Gemini 會記住使用者選擇的模型,碰到上限時仍可能自動切到較輕量模型。 |






