NVIDIA 於 GTC 2026 大會上發表一款號稱是 OpenClaw 搭配部署最佳模型之一的 Nemotron 3 Super 模型,相信很多人都想親自玩玩看到底有多強,雖然它是開源大型語言模型,但擁有高達 1,200 億參數(120B),就算採用高效率的架構設計,要在自己電腦上跑起來,對大多數人來說還是不可能。
好消息是,現在透過 OpenRouter 平台,你就能取得 Nemotron 3 Super 免費版的 API 來使用,在任何等級的電腦都能跑,除此之外,也提供線上聊天工具,透過瀏覽器就能體驗到這個模型。下面就來教你怎麼做到。

Nemotron 3 Super 特色介紹
對於不清楚 Nemotron 3 Super 的讀者,這邊也快速介紹一下,它是一款採用「混合 Mamba-Transformer(MoE)」的架構。聽起來很複雜,但簡單來說就是:雖然整個模型有 1,200 億(120B)個參數,但實際推論時只會啟用其中的 120 億(12B)個參數,所以在效能和速度之間取得了不錯的平衡。
而這設計帶來幾個好處,首先是速度快,NVIDIA 表示 Nemotron 3 Super 的推論吞吐量比上一代 Nemotron Super 提升超過 5 倍,跟同級的開源模型相比,Token 生成速度也顯著提升。
根據官方數據,在 8k 輸入 / 16k 輸出的條件下,它的推論吞吐量是 GPT-OSS-120B 的 2.2 倍、Qwen3.5-122B 的 7.5 倍。再來是上下文視窗很長,最高支援 100 萬個 Tokens,可一次處理非常大量的資料,對於需要長期記憶的 AI 代理應用來說非常重要。
另外,Nemotron 3 Super 還採用了「Latent MoE」技術,會在 Token 進入專家模組之前先進行壓縮,同樣的推論成本可呼叫 4 個專家,進而提升整體回答品質。記憶體需求方面,也採用了 NVFP4 這種 4-bit 浮點格式來降低記憶體用量,讓模型更容易部署在不同的硬體設備上。
至於實際表現,在 PinchBench 專門測試 OpenClaw AI 代理效能的基準測試中,Nemotron 3 Super 拿下 85.6% 的成績,是同級開源模型中最高的,也難怪 NVIDIA 會稱它為 OpenClaw 部署的最佳模型之一。
最重要的是,Nemotron 3 Super 採用 NVIDIA Open License 完全開源,包含模型權重、資料集和訓練配方都公開,開發者可以自由使用。除了 OpenRouter 之外,目前也能在 NVIDIA 的 build.nvidia.com、Amazon Bedrock、Hugging Face 等平台上取得。
如何透過 OpenRouter 來取得 Nemotron 3 Super 免費版的 API 和線上體驗
雖然 Nemotron 3 Super 是開源模型,但其大參數還是要有一定等級的硬體才能運行,因此對於多數人來說,最方便的方式是透過 OpenRouter來使用免費版 API。
OpenRouter 是一個整合多家 AI 模型的 API 平台,開發者只需要一個 API Key,即可切換使用不同的模型,包含 OpenAI、Anthropic、Google、Meta、NVIDIA 等等各家的模型都有。
不過要注意的是,免費版所有提示詞和輸出內容,都會自動被記錄,用於改善模型和服務,因此官方也建議不要上傳個人、機密或敏感資訊,也不適合用在正式的生產環境或商業關鍵系統中。
既然是免費用,當然有一些限制在,包括:
- 每日 50 次的免費模型呼叫
- 每分鐘最多只能發送 20 次呼叫
- 失敗的呼叫也會計入每日配額
- 尖峰時段可能會遇到排隊等候的情況
前往 OpenRouter 的 Nemotron 3 Super 頁面
進到 OpenRouter 的 Nemotron 3 Super 頁面後,如果你是要線上體驗,可以按 Chat 並登入 OpenRouter 帳號,就能開始聊天了:
沒有 OpenRouter 帳號的人可以免費註冊一下,支援 Google 帳號快速登入:
聊天介面長這樣:
而 API 部分,就往下滑到底部:
會看到 Create API key 按鈕,按下後一樣登入你的 OpenRouter 帳號:
會進到 API Keys 的頁面,按畫面中的 Create 建立:
輸入名稱,其他可以空白,然後按 Create:
就會獲得 API key 了:
接著就在 OpenClaw 或其他用的 LLM 軟體,選擇 OpenRouter 並貼上 API key,然後設定 Nemotron 3 Super (free):
就能開始使用 Nemotron 3 Super (free) 了:









