在 2025 年初引發全球 AI 震盪後,DeepSeek(深度求索)再次成為世界媒體的焦點。近日傳出消息,原本為扶植國產廠商打算不開放美國高階 AI 晶片進口的中國政府,已「有條件批准」深度求索購買 NVIDIA 目前最強大的 AI 晶片之一:H200。這項決定不僅涉及技術採購,更深刻反映了美中兩國在 AI 晶片出口管制與半導體主權上的複雜角力,標誌著 AI 競爭正式從「算力軍備競賽」進入到「效率與資源卡位」的新階段。

DeepSeek 衝擊:演算法智慧對算力神話的逆襲
過去幾年,AI 領域的成功被認為必須建立在「天文數字般的預算」與「無窮無盡的 GPU」之上。然而,去年的 DeepSeek-V3 的出現打破了這個規則。
極致的成本控制:DeepSeek-V3 的訓練成本僅約 558 萬美元,與 OpenAI 或 Google 動輒數億美元的開發成本相比,展現出驚人的「性價比」。
技術架構的創新:透過 MLA(多頭潛在注意力)與 MTP(多標記預測)等技術,DeepSeek 證明了在硬體受限的情況下,依然能透過演算法優化達成世界頂級的推理性能。這直接引發了市場對 NVIDIA 壟斷地位的重新評估。
開源的力量:隨著 DeepSeek-R1 推理模型的開源,全球開發者都能在相對較低的門檻下部署高性能 AI,這使得 DeepSeek 的行動應用在數週內便突破 3000 萬活躍用戶,成為史上成長最快的 AI 產品之一。
晶片解禁的關鍵:為何是 H200?
但儘管 DeepSeek 在演算法上取得了奇蹟,但硬體實力的落差始終是邁向通用人工智慧(AGI)的瓶頸。近日,中國政府有條件批准 DeepSeek 採購 NVIDIA H200 晶片的消息,成為了業界關注的焦點。這批晶片的實際提升如下:
| 規格項目 | NVIDIA H20 (特供版) | NVIDIA H200 (正代旗艦) | 性能差距 |
|---|---|---|---|
| 算力 (FP16/BF16) | 148 TFLOPS | 989 TFLOPS | 約 6.7 倍 |
| 記憶體容量 (VRAM) | 96 GB HBM3 | 141 GB HBM3e | 約 1.5 倍 |
| 記憶體頻寬 | 4.0 TB/s | 4.8 TB/s | 約 1.2 倍 |
根據最新外電報導,美國政府在 2026 年初開始放寬了部分 NVIDIA H200 晶片對華出口的限制,但附帶了極其嚴格的條件。隨後,中國官方也給予了 DeepSeek 等頂尖企業採購許可 。NVIDIA H200 的性能大約是目前中國合法進口版本 H20 的 6 倍。對於正在開發下一代推理模型(如傳聞中的 R2 或更強大的 V4)的 DeepSeek 來說,這批晶片無疑是強大的助燃劑,能進一步縮短訓練週期並大幅提升模型複雜度。
由於 H200 的核心運算指標是 H20 的 6 倍以上,對於 DeepSeek 來說,這不只是速度變快,而是原本需要一年的訓練計畫現在只需兩個月就能完成。同時,HBM3e 高速顯存的增加,能讓模型處理更長的上下文,並顯著提升推理時的吞吐量。
美中角力下的「算力搏奕」
這場採購批准並非單純的商業行為,而是一場精密的政經博弈:
美國的策略轉向:美方放寬 H200 出口,前提是 NVIDIA 必須確保美國本土供應充足,且中國客戶(如 DeepSeek)必須通過嚴格的最終用途核查,確保不被用於軍事 。
中國的現實取捨:雖然中國積極推動晶片自主化,但在面對 DeepSeek 這種具備全球競爭力的「AI 獨角獸」時,官方選擇了彈性應對,批准採購美製設備以換取技術領先地位。
穩定性的挑戰:儘管有了神兵利器,DeepSeek 仍面臨全球流量爆炸後的系統不穩定問題。2025 年初頻發的癱瘓事件提醒我們,除了模型本身,基礎設施的工程穩定性依然是這家公司最大的軟肋 。
結語
DeepSeek 的故事告訴我們,未來的 AI 競爭將不只是單純的「顯卡數量對決」,而是演算法效率、成本管控與地緣政治合規的綜合考驗。當這家「全球最會省資源」的 AI 公司擁有了「全球最強大」的 H200 算力時,這場賽局才真正進入了最精彩的下半場。

