GLM-5.2 號稱對標 GPT-5.5 與 Claude Opus 4.8,相信很多人都會想嘗試看看,雖然它是一款開放權重模型,但參數太龐大,達到 753B,絕大多數人都沒辦法在本地運行。好消息是,NVIDIA API 現在就有開放大家免費用 GLM-5.2,而且不需要綁信用卡,你只要有 NVIDIA 帳號就能申請 API Key,下面就來一步步教你。
GLM-5.2 和 NVIDIA API 快速介紹
GLM-5.2 是 Z.ai 推出的最新旗艦大型語言模型,採用 MoE 混合專家架構,總參數量達 753B,輸入支援文字、多輪對話、工具呼叫、系統提示詞與長時間代理工作階段。
主打「長程任務」能力,也就是長時間處理、多步驟推進,並在過程中持續規劃、修正與完成目標的複雜任務,非常適合代理式工作流程、程式開發與長程推理等應用情境。
支援最高 100 萬 token 上下文長度,在推理、程式碼能力與工具使用相關基準測試上,也比前一代 GLM-5.1 有明顯進步。
而 NVIDIA API 可以理解成 NVIDIA 幫你架好的雲端模型推論入口,開發者可取得免費的 NIM API 端點進行原型開發,背後是 DGX Cloud 提供運算資源。
如何申請 NVIDIA API 來使用 GLM-5.2 模型
申請 NVIDIA API 的方式很簡單,你只要有「NVIDIA 帳號」即可,沒有的人就免費申請一下,不需填寫任何付款資料,接著就照以下步驟操作。
NVIDIA 提供的免費模型非常多,只要有標註 Free Endpoint 就代表能免費用,你可以到 Models 頁面查詢,目前第一個就是 GLM-5.2:
登入帳號後,你可以直接點上方的 NVIDIA API 連結,或是打開右上角選單,進入「API Keys」:
接著就能申請 API 了,按 Generate API Key:
輸入名稱和過期時間,預設是 12 個月,也能設定更短或永遠不過期:
再來就會獲得 API Key 了,將其複製起來,然後貼到你要使用的 AI 工具,下面我以 Hermes Agent 為例:
打開 Hermes Agent 的 Model 設定介面,選 NVIDIA NIM 這一個:
把 API Key 貼上,模型選單選擇 glm-5.2:
這樣就完成了:
打開 Hermes Agent 後,下方選單就能選擇 GLM-5.2:
實測使用成功:
也成功完成我交代的任務:
不過要注意的是,NVIDIA API 免費端點主要是提供開發者測試與原型開發使用,目前預設限制最高約為每分鐘 40 個請求,但實際模型用量額度、速度與穩定性並沒有完整公開。
因此比較適合拿來體驗 GLM-5.2 或處理一些不急著完成的任務。如果要長時間大量使用,或拿來當正式服務的主要模型,就不太建議。










