近日根據知情人士消息,Meta 在自研 AI 晶片方面遭遇重大挫折,已放棄其最先進的訓練晶片項目,並將開發重點轉向結構更簡單的替代方案。這項決定標誌著這間科技巨頭多年來追求晶片自主化的努力遭遇重挫,同時也讓 Nvidia、AMD 等外部供應商的重要性更加凸顯。
Meta 自研晶片夢碎,將放棄自家先進 AI 訓練晶片開發
Meta 自研晶片屬於「Meta 訓練和推理加速器」(MTIA)項目,目標是降低對外部供應商的依賴,同時減少資料中心營運成本並增強基礎設施控制能力。
然而,Meta 的晶片開發之路並不順遂。根據報導,Meta 已經放棄了代號為「Iris」的第二代訓練晶片的一個版本,隨後又啟動了更先進晶片「Olympus」的開發,但該項目同樣遭到了夭折的命運。一名參與晶片開發的人員表示,公司內部對能否開發出可與 Nvidia 性能匹敵的晶片持懷疑態度,原因包括:
- 開發週期過長
- 設計複雜度極高
- 功耗控制難度大
該人員進一步指出:「如果功耗無法有效控制,將削弱晶片相對於 Nvidia 產品的競爭力」。
技術架構差異:SIMD 與 SIMT 之爭
在技術架構方面,Meta 的晶片發展經歷了不同的設計方向:
| 晶片代號 | 架構類型 | 特點 | 狀態 |
|---|---|---|---|
| Iris | SIMD(單指令多資料) | 硬體設計較易,但軟體開發難度較高 | 部分版本已取消 |
| Olympus | SIMT(單指令多執行緒) | 與 Nvidia 晶片類似,硬體實現複雜度更高 | 已取消 |
Olympus 採用與 Nvidia 晶片類似的 SIMT 架構,這種架構更適合 AI 訓練軟體,但硬體實現複雜度大幅提升。
Rivos 技術加持失敗:Olympus 的 GPU 原計劃採用 Meta 去(2025)年收購的 Rivos 技術,該技術可相容 Nvidia 的 Cuda 軟體生態,而 Cuda 是當前 AI 訓練的行業標準。然而,隨著項目取消,這項技術整合計劃也隨之泡湯。
Meta 調整晶片戰略:全面依賴外部供應商
隨著自研晶片項目失敗,Meta 正在加強與現有晶片供應商的合作(Google 、NVIDIA與 AMD) 合作,項目包括:
- Meta 已簽署價值數十億美元的協議,從 Google 租用 AI 晶片
- 將部署 Google 的張量處理單元(TPU)
- AMD 本週表示,將與 Meta 合作部署最多 6GW 的 Instinct AI 晶片,以支持 Meta 下一代 AI 基礎設施
- Meta 本月宣布與 Nvidia 建立跨多代合作關係,將繼續在資料中心部署 Nvidia 晶片
- 這是對 Nvidia 技術實力的再次認可
根據原本的計劃,Meta 原計劃最早於 2026 年第四季度 完成 Olympus 設計。然而,晶片設計完成後通常仍需至少 9 個月才能實現量產,這意味著即使項目順利進行,最快也要到 2027 年才能看到量產晶片。
相關發展時間線
| 時間 | 事件 |
|---|---|
| 2022 | Meta 啟動 MTIA 項目 |
| 2024 | Iris 推理晶片開始部署 |
| 2025 | Meta 收購 Rivos |
| 2025 | Olympus 項目啟動 |
| 2026.02 | Olympus 項目取消 |
| 2026.02 | 與 Google、AMD、Nvidia 達成合作 |
此外,Meta 最初計劃基於 Olympus 構建大規模 AI 訓練伺服器集群,但管理層認為存在以下風險:
- 量產難度:複雜設計可能增加量產難度
- 軟體成熟度:可能不及 Nvidia 生態系統
- 進度風險:可能影響公司在與 OpenAI 和 Google 競爭過程中訓練新模型的進度
分析師觀點:Nvidia、AMD 將受益
對於 Meta 放棄自研晶片的決定,市場分析師普遍認為將有利於現有 GPU 供應商。
Wedbush 證券分析指出:
- 「設計先進 AI 加速器需要大量資金和技術複雜度,近年來半導體行業多個高調項目已被縮減或取消」
- 「Meta 的決定凸顯了與已投入大量資金建立軟體生態系統、開發者工具和製造合作夥伴的現有晶片製造商競爭的難度」
- 對於 GPU 供應商而言,這項發展「被視為支持性」,因為它降低了主要超大規模客戶垂直整合其 AI 運算部分業務的風險
對 Broadcom 的影響較為複雜:雖然可能失去與 Olympus 相關的客製化晶片機會,但可能因增加 TPU 部署而帶來網路或連接需求。
小結
Meta 放棄自研最先進 AI 晶片,不僅是該公司的一大挫折,也為整個科技產業自研 AI 晶片路徑敲響警鐘,短時間內向 NVIDIA 與 Google 採購現成的 AI 集群方案還是比較保險的作法,也代表了 AI 圈很難擺脫對輝達方案的依賴,雖然 Meta 也與 AMD 即將進行深度合作,但實際使用情況是否能比 NVIDIA 好也是尚未可知。
對 Meta 的影響:
| 面向 | 影響 |
|---|---|
| 成本 | 每年數十億美元外部晶片採購 |
| 技術 | 仍依賴 Nvidia、AMD、Google |
| 競爭 | 與 OpenAI、Google 競爭處於劣勢 |
| 人才 | 可能導致晶片人才流失 |
對產業的啟示:
- Nvidia 地位更加鞏固:在 AI 晶片領域,Nvidia 的主導地位短期內難以撼動
- 自研晶片風險高:即使資源豐富如 Meta,也難以在短期內追上 Nvidia 的技術積累
- 軟體生態是關鍵:Cuda 生態系統的優勢是 Nvidia 的核心競爭力
值得關注的問題:
- Meta 是否會重新評估自研晶片策略?
- 其他科技巨頭會否加快自研晶片腳步?
- AI 訓練晶片的供應鏈是否會因此出現變化?



