NVIDIA 在 2026 年 6 月 4 日正式發表 Nemotron 3 系列中最強大的 Nemotron 3 Ultra 模型,這是一顆擁有 5,500 億總參數、550 億活躍參數的巨型 MoE(混合專家)模型,採用創新的 Mamba-Transformer 混合架構,支援最高 100 萬 tokens 的超長上下文。而現在,Hermes Agent 的開發商 Nous Research 宣布加入 NVIDIA 的 Nemotron Coalition 聯盟,與 NVIDIA 及雲端運算平台 Nebius 合作,在 Nous Portal 上提供 Nemotron 3 Ultra 為期兩週的免費使用,從 6 月 4 日起至 6 月 18 日止。

NVIDIA 最強開源模型 Nemotron 3 Ultra Hermes 限時免費兩週
這對 Hermes Agent 用戶來說是一大福音。先前我們曾介紹過小米 MiMo V2 Pro 模型透過 Nous Portal 限時免費的設定方式,這次的操作流程基本相同,只是免費模型換成了 NVIDIA 的旗艦級 Nemotron 3 Ultra。如果你已經照著之前的教學設定過 Nous Portal,只需要切換模型就能直接使用。
We are excited to join Nvidia’s Nemotron Coalition of leading AI labs working together to advance open frontier foundation models.
To celebrate we have partnered with @nvidia and @nebiustf to provide 2 free weeks of the new Nemotron 3 Ultra model on the Nous Portal! pic.twitter.com/z4jFzPgY17
— Nous Research (@NousResearch) June 4, 2026
Nemotron 3 Ultra:專為 Agent 場景而生
Nemotron 3 Ultra 是 NVIDIA Nemotron 3 家族中的頂規型號,定位為「開放式前沿模型」(Open Frontier Model)。它的核心特色包含:
550B 總參數、55B 活躍參數:採用 MoE(Mixture of Experts)架構,每次推理只啟動 550 億中的 550 億參數中的 550 億活躍參數,大幅降低運算成本
Mamba-Transformer 混合架構:結合 Mamba 的線性注意力與 Transformer 的精準推理能力,實現更高效的推理吞吐量
5 倍推理速度:相較於 GLM-5.1-754B-A40B 等同級開源模型,Nemotron 3 Ultra 的推理吞吐量高出 5.9 倍
100 萬 tokens 上下文:支援超長上下文處理,在 RULER 基準測試中超越同級開源模型
專為 Agent 場景優化:在程式碼撰寫、長時間規劃、工具調用等 agentic 任務上表現特別突出
NVIDIA 在 X 上表示,Nemotron 3 Ultra 的混合架構能在相同時間預算內完成更多推理週期,讓 Agent 在更短時間內完成更多任務。這對使用 Hermes Agent 進行複雜任務的用戶來說,意味著更快的回應速度與更低的使用成本。
Today we’re shipping Nemotron 3 Ultra.
A 550B MoE frontier-intelligence open model built for long-running agents.
It delivers 5x faster inference and lowers the cost of complex agentic tasks by up to 30% versus other open frontier models. pic.twitter.com/FEXqvfzQFO
— NVIDIA AI (@NVIDIAAI) June 4, 2026
設定前的準備
開始之前,請確認以下幾點:
已安裝 Hermes Agent(桌面版或 CLI 版皆可), 有 Nous Portal 帳號(免費註冊), 這次免費方案不需要綁定信用卡,直接選 Free 方案即可。如果還沒有安裝 Hermes Agent,以下會分別介紹桌面版與 CLI 版的安裝方式。已經有 Hermes Agent 的用戶,可以直接跳到「選擇免費模型」的步驟。
方法一:桌面版(最簡單)
桌面版是最簡單的安裝方式,完全不需要接觸終端機指令。如果你之前已經有設定 Hermes 桌面版的話,本文後半段有教學。
步驟 1:下載安裝
前往 Hermes Agent 官方下載頁面,下載對應作業系統(macOS 或 Windows)的安裝檔。開啟後程式會自動完成初始化設定,通常一分鐘以內就會完成,不會的朋友可以看這篇。
步驟 2:連接 Nous Portal
首次開啟時會看到「Let’s get you set up」畫面,點選 Nous Portal(標示為 Recommended)。
接著瀏覽器會自動開啟 Nous Portal 頁面,建立帳號或登入後,選擇 Free 方案並授權 Hermes 連線,應用程式會自動完成綁定。
接著會設定登入帳號,大家自己選擇常用的帳號即可,這邊選 Google,如此就完成連線設定:
步驟 3:選擇免費模型
連接完成後,在 Default model 卡片上點選 Change:
往下滾動搜尋「nemotron 3 ultra」,選擇標示 Free tier 的版本nvidia/nemotron-3-ultra:free⚠️ 注意:一定要選擇帶有 :free 後綴的版本,這個標記才是免費方案的關鍵。選錯其他版本會被計費(不過如果你沒設定信用卡也用不了就是),Nous Portal 官方三不五時都有免費模型可用,不想花錢的可以搭配 Openrouter 的免費模型薅羊毛也可以省不少。
步驟 4:開始使用
點選 Start chatting,就可以開始免費使用 Nemotron 3 Ultra 了。
方法二:CLI 命令列(終端機用戶)
習慣使用終端機的用戶,可以透過以下步驟完成設定。
步驟 1:安裝 Hermes Agent
在終端機中輸入以下指令:
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
安裝完成後,重新載入 shell 設定:
source ~/.bashrc(或 source ~/.zshrc)
步驟 2:執行快速設定
hermes setup
選擇 Quick Setup,Hermes 會自動開啟瀏覽器頁面。
步驟 3:建立 Nous Portal 帳號
在瀏覽器中建立 Nous Portal 帳號(或登入既有帳號),選擇 Free 方案。
步驟 4:連接帳號
瀏覽器會提示你將 Nous Portal 帳號連接至 Hermes Agent,點擊 Connect 後會顯示確認畫面。
步驟 5:選擇免費模型
回到終端機,從模型列表中選擇:
nvidia/nemotron-3-ultra:free
同樣要注意,必須選擇帶有 :free 後綴的版本才能享有免費方案。
步驟 6:開始使用
完成剩餘的設定步驟後,輸入 hermes 即可啟動,開始與 Nemotron 3 Ultra 對話。
已經有 Hermes Agent 的用戶怎麼切換?
如果你之前已經設定好 Hermes Agent(例如用過 MiMo V2 Pro 限免),切換方式非常簡單:
桌面版:開啟模型選擇器(Providers ),先選「Nous Portal」搜尋「nemotron 3 ultra」,選擇 Free tier 版本即可,跟上面一樣。
– CLI / TUI:在對話中叫 Hermes 去官網設定最新的 nemotron-3-ultra:free模型,它回報完成後再輸入 /model nvidia/nemotron-3-ultra:free 直接切換,或輸入 /model 開啟選擇器手動選取
切換完成後可以輸入 /model 確認當前使用的模型是否正確。
限時免費,手腳要快
Nemotron 3 Ultra 的免費期限只到 6 月 18 日,這段期間內可以無償使用 NVIDIA 最強大的開源模型。對 Hermes Agent 用戶來說,這是體驗頂級 AI 模型的好機會,設定流程也不複雜,幾分鐘就能搞定。之前已經設定過 Nous Portal 的用戶更是省事,直接切換模型就好。
Nemotron Coalition 聯盟集結了 NVIDIA、Nous Research、Nebius 等多家頂尖 AI 實驗室,目標是共同推動開放式前沿基礎模型的發展。這次 Nemotron 3 Ultra 的限時免費活動,正是這個聯盟合作的第一波成果。對一般使用者而言,能在不花一毛錢的情況下使用到 550B 參數等級的模型,這樣的機會確實不多見。
不過要提醒的是,免費期結束前記得切換回原本的模型或設定好 Fallback,避免突然被斷線。如果你還沒試過 Hermes Agent,這次 Nemotron 3 Ultra 限免也是個不錯的入門時機。







