很多人愛用的本地端 AI 應用 LM Studio 在 6 月 4 日釋出 0.4.16 版本,正式加入 iPhone 與 iPad 專用的 Locally 應用程式,搭配全新的 LM Link 遠端連線技術。讓使用者在外出時,只需透過手機就能遠端調用家中 Mac 或 Windows 主機上運行的大型本地 AI 模型,全程端對端加密,聊天記錄不上傳任何雲端伺服器。
LM Studio 推出 iPhone 遠端存取功能
這項發布的背景是 LM Studio 在 2026 年 4 月 8 日收購了獨立開發者 Adrien Grondin 的 Locally AI 應用程式,Grondin 本人也全職加入 LM Studio 團隊,負責各平台原生 AI 體驗的開發工作,Locally + LM Link 是兩者合併後的首批成果。
Locally 與 LM Link:兩個產品,各司其職
最容易搞混的地方是把 Locally 和 LM Link 視為同一個東西。事實上它們是兩個獨立的產品:
- Locally:從 App Store 下載的 iPhone/iPad 原生應用程式,是使用者在手機上操作的介面
- LM Link:遠端連線協定,讓 Locally(或其他工具)能連接到遠端電腦運行的 LM Studio 實例。它是可重複使用的基礎設施,不只限於手機場景
LM Link 底層採用 Tailscale 的 tsnet 函式庫,這是一個以 Go 語言編寫的用戶空間程式,內嵌基於 WireGuard 的 Mesh VPN。兩台裝置通過驗證後會自動發現彼此,建立端對端加密連線,無需暴露公網端口。加密採用 ChaCha20-Poly1305 演算法搭配 Curve25519 金鑰交換,屬於業界標準的現代加密原語。
在隱私方面,LM Studio 明確表示:唯一觸及其中央伺服器的資料是「裝置發現清單」,用於讓兩台裝置找到彼此。一旦連線建立,所有提示詞、推論結果、模型資料、硬體資訊等流量都直接在兩台裝置之間傳輸,Tailscale 和 LM Studio 的後端伺服器都無法讀取。聊天記錄儲存在各自的本機裝置上。
為何 iPhone 不能自己跑模型?記憶體頻寬是關鍵
一個自然的疑問是:為何不直接在 iPhone 上跑大型模型?答案是記憶體頻寬的物理限制。
LLM 的 token 生成速度受記憶體頻寬制約。高階 iPhone(A17/A18 Pro)的統一記憶體約 8GB,頻寬約 50 至 90 GB/s。相較之下,一台搭載 M4 Ultra 的 Mac Studio 頻寬可達 800 GB/s,差距接近一個數量級。這代表同一個 7B 參數模型,在 Mac 上能流暢對話,在 iPhone 上可能會慢到無法忍受。
目前 iPhone 原生推論的實用上限是 3B 參數以下、4-bit 量化的模型。獨立分析指出,125M 參數模型在當前 iPhone 上約能跑到每秒 50 個 token,1B 模型適合短上下文任務。拿來做自動補全或小型摘要夠用,但人們真正想對話的 7B 到 30B 級模型,手機晶片目前是跑不動的。LM Link 的設計正是為了解決這個矛盾:使用者本地端電腦負責運算,iPhone 只是加密的輸入輸出終端。這不是任意的設計選擇,而是當前唯一能讓手機用到桌面級本地模型的做法。
三種移動 AI 路徑的比較
移動 AI 長期被簡化為「雲端 vs 本地」的二元對立,LM Link 提供了第三條路:
- 雲端 AI(ChatGPT、Claude 等):能力最強,但提示詞和對話記錄都經過第三方伺服器,隱私代價最高。訂閱費用約每月 20 美元(約新台幣 650 元),年費約新台幣 7,800 至 15,600 元
- 原生本地 AI(手機端運行):完全離線,隱私最高,但受限於手機晶片,只能跑小型模型
- LM Link:對話記錄留在裝置上,推理工作由家中 Mac 執行,能跑大型模型,隱私等級接近原生本地。代價是 Mac 必須開機且連網,Preview 期間免費
開發者生態:OpenAI 相容 API
LM Link 的技術亮點之一是 API 層面的相容性,LM Studio 在本機的 localhost:1234 埠提供 OpenAI 相容 API,任何支援自訂 base URL 的工具或 SDK 都能直接串接。LM Link 遠端暴露的是同一個 API 端點,代表 Claude Code、Codex CLI、OpenCode 等開發工具無需任何修改就能透過 LM Link 遠端使用家中 Mac 的模型。
LM Link 同樣支援連接 LM Studio 的無頭版本 llmster,因此運算端不限於有螢幕的 Mac 或 Windows 電腦,也可以是 Linux 伺服器或雲端 VM。手機只是「加密終端」的設計,讓整個架構具備高度彈性。
社群方案先行,官方版本收編
LM Link 並非第一個嘗試解決「手機連接本地模型」問題的方案。在此之前,社群已經出現 Off Grid、LM Mini 等第三方應用,各自實作了 iPhone 到 LM Studio 的連線功能。LM Link 的意義在於提供了官方維護、端對端加密、無第三方中繼的第一方實作。
LM Studio 本身支援 Gemma、Qwen、Llama、DeepSeek、Mistral、Phi 等主流開源模型,透過 Hugging Face 整合可下載數百款社群微調版本。推論引擎則有 llama.cpp(GGUF 格式,跨平台)和 Apple MLX(Apple Silicon 專用)兩種,社群報告指出 MLX 在 Metal 上的執行速度約比 llama.cpp 快 30% 至 50%。
注意事項與限制
幾點需要特別留意:
- LM Studio 並非開源軟體:免費使用於個人和商業場景,但授權條款比自由軟體更為嚴格。組織若對開源授權有硬性需求,應將 LM Studio 視為「免費工具」而非「開源工具」來評估
- Preview 期間免費,未來不一定:LM Link 目前處於申請制 Preview 階段,免費使用,但正式版將有免費和付費層級。App Store 定價尚未確認
- 僅限 iPhone 和 iPad:Android 版本尚未公布時程
- Mac 或電腦必須開機連網:如果您家中的 Mac 或 Windows 電腦進入睡眠或斷網,手機端無法連線
LM Studio 在近期幾個版本中持續強化推理能力:0.4.13 更新 MLX 引擎至 v1.8.1,0.4.14 將 MTP 推測式解碼穩定化,0.4.15 新增 CUDA 張量平行運算支援多 GPU 載入。Locally 和 LM Link 是 0.4.16 的主打功能,建立在一個逐步成熟的推論基礎之上。

