小米拼了!有在使用 OpenClaw 或 Hermes 的朋友注意這個好康訊息,小米 MiMo 官方於 5 月 27 日宣布,旗下 MiMo-V2.5 系列 API 即日起永久調降價格,最高降幅達 99%,同時取消長上下文倍率加價制度,所有輸入長度統一計費。這是繼 DeepSeek 三天前將 V4-Pro 永久降價至原價 1/4 之後,中國 AI 市場又一次大規模的價格調整。降價後,MiMo-V2.5 系列的海外美元定價與 DeepSeek 幾乎完全一致,兩家中國 AI 廠商在 API 價格上正式進入貼身肉搏的境界。
🚀 Better inference efficiency, lower costs, broader access.
MiMo-V2.5 Series API pricing is now permanently reduced — by up to 99% compared to previous pricing.
✨ Unified pricing across all context lengths.
MiMo Token Plans have also been upgraded:
• 5–8× more usable tokens… pic.twitter.com/E0C4MQLCzE— Xiaomi MiMo (@XiaomiMiMo) May 26, 2026
MiMo-V2.5 系列包含 V2.5 與 V2.5 Pro 兩個版本,此次調降後的新價格不再區分上下文長度,無論是 1K 的短提示還是 1M token 的長文件,通通適用同一計價公式,大幅簡化了計費規則。同時 Token Plan 預付方案也同步升級,可用額度提升 5 到 8 倍,且所有已消耗的配額全額重置。語音合成 API MiMo-V2.5-TTS 則繼續維持免費,對於有語音需求的開發者來說是一項額外紅利。
價格戰脈絡:DeepSeek 點火,全產業跟進
這波降價的直接導火線來自 DeepSeek。5 月 24 日,DeepSeek 宣布旗下旗艦模型 V4-Pro 永久降價至原參考價格的 1/4,調整後輸入價格為 $0.435/MTok、輸出 $0.87/MTok。僅三天後,小米 MiMo 就跟進宣布降價,且調整後的美元定價與 DeepSeek 完全一致。
申請 MiMo Token Plan 請點我(邀請碼輸入 PWR2ZZ 再省 2 美金)
降價幅度:最高砍掉 99%
根據 MiMo 官方公告,以人民幣計算,V2.5 Pro 的輸入快取命中價格降至每百萬 token 僅 ¥0.025,降幅達 99%;輸出價格降至 ¥6.00/MTok,降幅 86%。V2.5 基本版的輸出價格則降至 ¥2.00/MTok,降幅達 93%。
在全球美元定價方面,降價後的 MiMo-V2.5 系列與 DeepSeek 的定價幾乎完全重疊:
MiMo-V2.5 Pro(海外定價)
– 輸入(快取命中):$0.0036 | 輸入(未命中):$0.435 | 輸出:$0.87
MiMo-V2.5(海外定價)
– 輸入(快取命中):$0.0028 | 輸入(未命中):$0.14 | 輸出:$0.28
DeepSeek V4-Pro(永久降價後)
– 輸入(快取命中):$0.0145 | 輸入(未命中):$0.435 | 輸出:$0.87
DeepSeek V4 Flash
– 輸入(快取命中):$0.0028 | 輸入(未命中):$0.14 | 輸出:$0.28
從數字可以清楚看到,MiMo-V2.5 Pro 與 DeepSeek V4-Pro 的輸入/輸出價格完全相同($0.435/$0.87),MiMo-V2.5 與 DeepSeek V4 Flash 也完全相同($0.14/$0.28)。唯一的差異在快取命中價格:MiMo-V2.5 Pro 的 $0.0036 比 DeepSeek V4-Pro 的 $0.0145 便宜約 75%,對於大量使用快取的場景(如長文件重複處理、Agent 多輪對話)能省下更多成本,而且 MiMo-V2.5 還有 DeepSeek 沒有的 Token Plan 用量,而且使用量還直接提升 5~8 倍不漲價,降幅相當有感。
價格對比:中國模型已形成全球最低價梯隊
將 MiMo 與 DeepSeek 放在一起看,中國 AI 模型在海外美元市場已形成一個極具競爭力的價格梯隊。相較之下,西方主要 AI 廠商的定價仍高出數倍:
OpenAI GPT-5.5
– 輸入:$5.00 | 輸出:$30.00 | 上下文 128K
OpenAI GPT-5.4
– 輸入:$2.50 | 輸出:$15.00 | 上下文 128K
Claude Opus 4.7(Anthropic)
– 輸入:$5.00 | 輸出:$25.00 | 上下文 200K
Claude Sonnet 4.6(Anthropic)
– 輸入:$3.00 | 輸出:$15.00 | 上下文 200K
Claude Haiku 4.5(Anthropic)
– 輸入:$1.00 | 輸出:$5.00 | 上下文 200K
以最直接的對比來看,MiMo-V2.5 Pro 的輸出價格 $0.87/MTok 僅為 GPT-5.5 的 1/34、Claude Opus 4.7 的 1/28。即使與 Anthropic 最便宜的 Haiku 4.5($5.00/MTok 輸出)相比,MiMo-V2.5 Pro 仍然便宜近 5 倍。而在上下文容量方面,MiMo-V2.5 系列支援 1M token,是 Claude 200K 的 5 倍、GPT-5.5 128K 的近 8 倍。
而 MiMo 與 DeepSeek 的定價幾乎完全一致,這並非巧合。兩家廠商都在近期完成了推理效率的大幅優化,將成本下降的空間回饋給開發者,代表了中國 AI 市場的價格競爭已從過去的「燒錢補貼」轉變為「效率驅動」的結構性降價。
Token Plan 升級:額度增 5-8 倍、已消耗配額全額重置
除了 API 的即時計費調降外,MiMo 也同步升級了 Token Plan 預付方案。現有用戶的可用額度提升至原先的 5 到 8 倍,且所有在有效期內已使用的 Token 配額將會全額重置歸零重新計算。這項措施對於已經購買了年約或季約方案的開發者來說,等於直接獲得了一筆額外的預算補貼。
降價背後的技術驅動力
MiMo 官方在公告中指出,此次降價的基礎來自於持續的推理效率優化。技術團隊全面支援基於 SGLang HiCache 的 SWA(Sliding Window Attention),將 KV Cache 在 GPU 記憶體、CPU 記憶體與 SSD 等多層儲存之間的資料傳輸量降至優化前的 1/7,可快取 token 數量提升至原先的 5 倍,大幅提高了快取命中率與推理效率(其實就是使用 DeepSeek 開源的壓縮技巧)。同時透過專家並行方案的優化,進一步提升了叢集的輸入吞吐能力。
此外,V2.5 相較於 V2-Pro 在模型能力上也有所升級:長上下文檢索品質提升(200K-800K 範圍的 needle-in-haystack 準確率維持 95% 以上)、並行工具呼叫的 JSON 錯誤率降低、以及訓練資料更新至 2026 年第一季。而且更吸引人的是 MiMo V2.5 Pro 在性能上還比 DeepSeek V4 Pro 來的強不少,而且還是可以辨識圖片與影片的多模態模型,在價位相同的情況下更加吸引人。
對於台灣開發者而言,這場價格戰帶來的是實質的成本紅利。以一個典型的 Agent 應用場景為例:每天處理 1,000 次對話,每次平均 5,000 token 輸入搭配 2,000 token 輸出,使用 MiMo-V2.5 Pro 的月成本約為 $117 美元(約 NT$3,750),同樣的工作量在 Claude Sonnet 4.6 上約需 $1,350 美元(約 NT$43,200),在 GPT-5.5 上約需 $2,550 美元(約 NT$81,600),差距超過 11 到 22 倍。這使得過去因成本考量而無法負擔頂級模型的中小開發團隊,現在也能輕鬆使用高品質的 AI 服務。而且如果使用 Token Plan 的話,只是用來給 OpenClaw 或 Hermes 做 Agent 工作使用根本用不完,年繳也不到 64 美金,等於一個月才 5.33 美金就用到飽,非常值得考慮。
申請 MiMo Token Plan 請點我(邀請碼輸入 PWR2ZZ 再省 2 美金)
結語
小米 MiMo-V2.5 的降價,是本週內繼 DeepSeek 之後第二起大型 AI API 價格調整事件。降價後,MiMo 與 DeepSeek 的海外美元定價幾乎完全一致,中國 AI 模型在 API 價格上已形成全球最低價梯隊,輸出價格僅為西方主要廠商的 1/11 到 1/22。對於開發者來說,選擇正在快速增加,而更低的 API 價格意味著更便宜的 AI 應用與服務。MiMo 的快取命中價格($0.0036/MTok)較 DeepSeek($0.0145/MTok)更具優勢,對於依賴長上下文快取的 Agent 應用場景,MiMo 可能是更經濟的選擇。





