WWDC 2026 雖然已在 6 月 13 日落幕,但其帶來的技術衝擊仍在發酵。Apple 官方於「Apple 智能與 Xcode 揭秘:特別講座」中的壓軸 demo,LM Studio 與 Apple 合作,在 4 台 Mac Studio 上成功本地運行 1 兆(1 Trillion)完整參數的 Kimi K2.6 模型,並透過 LM Link 實現 MacBook Neo 與 iPhone 的安全遠端存取。
LM Studio 在 WWDC 展示 4 台 Mac Studio 跑 1 兆參數 Kimi K2.6 模型
4 台頂規 Mac Studio 組成的 AI 叢集
這場長達 90 分鐘的特別講座於 WWDC 期間在喬布斯劇院(Steve Jobs Theater)現場錄製,內容涵蓋 Xcode 27 的 AI 輔助開發、Apple Foundation Models 框架、Core AI 框架以及升級後的 MLX 框架。其中最引人注意的是使用四台 512GB RAM 的 Mac Studio(M3 Ultra)串成叢集運行原始規模無量化的超大模型,這在以往是必須花費數百萬以上才能辦到的,我們節錄該段內容翻譯為中文提供給大家參考。
影片末尾的壓軸環節,Apple 工程師實際演示在 4 台 512GB RAM 的 Mac Studio(M3 Ultra)組成的叢集上,透過 LM Studio 本地運行 1 兆參數的 Kimi K2.6 模型。(編按:這些機器如果你現在買的到的話,總價至少約200萬台幣以上,但已經是本地端運行完整 1 兆參數尺寸大模型的最便宜方案)
RDMA-over-Thunderbolt:叢集運算的關鍵技術
能將 4 台 Mac Studio 串聯為 AI 運算叢集的關鍵,是 Apple 在 macOS Tahoe 26.2 中導入的 RDMA-over-Thunderbolt(遠端直接記憶體存取透過 Thunderbolt 介面)技術。這項技術允許多台 Mac 之間以微秒級延遲直接讀寫記憶體,大幅降低跨節點通訊的開銷,使分散式推理成為可能。
這意味著開發者不再需要昂貴的資料中心級 GPU 伺服器,只需串聯數台 Mac Studio,就能在本地部署以往只能透過雲端 API 存取的超大規模模型。對比 NVIDIA H200 或 AMD MI350 等企業級 GPU 叢集動輒數百萬台幣的建置成本,以 Mac Studio 為節點的叢集方案提供了更靈活的入門選擇,雖然單節點絕對算力不及專用 GPU 伺服器,但統一記憶體架構消除了傳統 GPU 的 VRAM 瓶頸,讓超大模型的載入與推理成為可能。
Kimi K2.6:1 兆參數的開源混合推理模型
這次 demo 所用的 Kimi K2.6,是由中國 AI 團隊月之暗面(Moonshot AI)於 2026 年 4 月 20 日發布的開源模型。作為 Kimi K2 系列的升級版本,K2.6 採用混合專家(MoE)架構與混合推理(Hybrid Thinking)設計,在程式碼生成、長程任務執行以及 Agent 協作方面均顯著提升。
Kimi K2.6 支援最高 256K token 的上下文長度,在完整精度下約需 610GB 儲存空間,即使經過 2-bit 量化動態壓縮也仍需 350GB 以上。這也是為何需要 4 台高階 Mac Studio 才能順利運行的原因:每台 Mac Studio M3 Ultra 最高搭載 512GB 統一記憶體,4 台合計可達 2TB 以上,正好滿足這類超大模型的部署需求。
LM Link:讓你的模型隨身帶著走
除了本地叢集運算,LM Studio 還同步展示了 LM Link 功能,透過端到端加密連線,使用者可以從 MacBook Neo 甚至 iPhone 安全地遠端存取 Mac Studio 上的大型模型。這項功能已隨 LM Studio 的 iPhone App 上線,讓開發者在移動中也能使用個人模型,無需將敏感資料上傳到雲端。這也是 LM Studio 今年稍早收購 Locally App 後,將其技術整合為 LM Link 的成果。
產業觀察:本地 AI 的「私有前沿級運算」時代
LM Studio 官方在貼文中將這次展示定位為「你的私有前沿級 AI 的雛形」(A glimpse of your own private, frontier-scale AI)。這句話點出了 AI 產業正在經歷的重大轉折:一直以來,前沿級模型(Frontier Model)的運算能力被鎖在雲端資料中心,使用者必須將資料傳送到外部伺服器才能獲得最佳結果。
For WWDC, we worked with Apple to run Kimi K2.6, a 1T-parameter model, across a cluster of four Mac Studios using a preview version of LM Studio.
We showcased secure remote access from a MacBook Neo and iPhone using LM Link.
A glimpse of your own private, frontier-scale AI. pic.twitter.com/AQNYcRYzDs
— LM Studio (@lmstudio) June 17, 2026
Apple 選擇與 LM Studio 這樣專注本地推理的第三方工具合作,而非僅僅展示自家模型,傳達了明確的戰略信號:Apple 認為 AI 的未來不只有雲端 API,也包括強大的本地運算基礎設施。結合 WWDC 26 推出的 Apple Foundation Models 框架與 Core AI 框架,開發者將能更靈活地在本地與雲端之間選擇運算路徑。
對於金融、醫療、法律等高度監管行業的企業用戶而言,能夠在本地部署 1 兆參數級模型、同時透過加密連線從手機遠端存取,意味著可以在完全不將資料離開自有設備的情況下享受前沿 AI 能力。無需將敏感客戶資料或商業機密上傳到第三方雲端 API,即可讓團隊全員使用頂尖 AI 助手。這正是 LM Studio 與 Apple 聯手展示的核心價值,也是 Apple 一直以來強調的「隱私即權利」理念在 AI 時代的自然延伸。
總結
WWDC 26 的這場 4 台 Mac Studio 叢集運行 1 兆參數模型展示,再到 LM Link 的移動端遠端存取,串聯起了一條完整的本地 AI 生態鏈。這是 Apple 對開發者展示技術實力,也是在為一個「無需雲端也能跑前沿模型」的未來鋪路。
隨著 RDMA-over-Thunderbolt 技術成熟、Mac Studio 統一記憶體持續擴增,我們或許很快就會看到更多開發者與企業選擇以「串聯 Mac」取代「租用 GPU 雲端」,真正實現私有、安全、高效的前沿 AI 部署。LM Studio 與 Apple 在 WWDC 26 的這次合作,或許正是這個趨勢的起點,一個由開發者桌面上的 Mac 所驅動的 AI 運算新時代。




