2026 年 6 月 1 日,NVIDIA 創辦人暨執行長黃仁勳在台北音樂中心登上 GTC Taipei 舞台,以「回家真好」揭開長達近 2 小時 20 分鐘的主題演講。這場 COMPUTEX 2026 前哨戰涵蓋了從資料中心到個人電腦、從數位代理到自駕車的完整 AI 藍圖,以下是這場演講的所有重點整理。
整場演講我們也做了雙語翻譯,也在每個重要節點都打了時間軸,有興趣的朋友可以收藏起來慢慢看,點擊以下每個段落標題也會直接到對應內容:
台灣:NVIDIA 生態系的核心
黃仁勳開場便將焦點放在台灣,他盛讚台灣擁有「全球最豐富的供應鏈生態系」。他引用數據指出,台灣今年 GDP 預計將成長近 10%,而 NVIDIA 與台灣的合作業務也在同步高速成長。
黃仁勳特別強調,NVIDIA 的生態系不只涵蓋軟體開發者,更一路延伸到上游的供應鏈,而這條供應鏈的起點就在台灣。從晶片製造到系統組裝,台灣 150 家供應鏈合作夥伴、數百萬平方英尺的廠房、數百個據點,共同支撐了 Vera Rubin 從晶圓到機架的完整生產流程。
Agentic AI 已經落地
黃仁勳回顧,兩年前他在同一個場合談到「下一波 AI 是 Agentic AI」,如今他宣告:「Agentic AI 已經到來,有用的 AI 已經到來。」他以軟體開發為例,指出全球 3,000 至 4,000 萬名軟體工程師代表著每年約 3 兆美元(約台幣 97.5 兆元)的薪資產出,而在 AI 加持下,這些薪資正創造出近 9 兆美元(約台幣 292.5 兆元)的生產力。
他用 GitHub 的 commit 數據佐證:2023 年全球 commit 數為 3 億次,2024 年成長到 4 億次,2025 年達到 5 億次,而 2026 年前幾個月「幾乎是三倍」。黃仁勳直言:「人們說 AI 會減少工作,這完全是無稽之談。」軟體工程師的數量正在增加,而不是減少。
Vera Rubin:NVIDIA 史上最浩大的工程
整場演講的核心,是下一代 GPU 平台 Vera Rubin 的全面亮相。黃仁勳稱這是「NVIDIA 公司史上最雄心勃勃的事業」,動用了全公司 40,000 名工程師。硬體規格方面,Vera Rubin 電腦搭載 6 兆個電晶體、超過 18,000 個元件集中在單一基板上,由 7 顆新晶片組成,經過數百道製程步驟成型。系統架構包含 Vera Rubin GPU、Vera CPU、NVLink 72 交換器、ConnectX-9 SuperNIC 以及 BlueField-4 DPU。
黃仁勳宣布:「Vera Rubin 已全面量產。」他指出,Vera Rubin 的供應鏈規模是 Grace Blackwell 的兩倍,而 Microsoft、Dell、CoreWeave 都已經架設起 Vera Rubin NVL72 工程機架。
Vera Rubin NVL72 的定位不只是 AI 推理或訓練,黃仁勳特別強調,它是「專為 Agentic 時代打造的多機架 Pod 規模超級電腦」。在 Vera Rubin 機架內建兩顆 Vera CPU,負責編排整個代理迴圈的思考、推理與規劃流程。
Vera CPU:為代理時代而生的處理器
黃仁勳花了相當篇幅介紹 Vera CPU,這是 NVIDIA 自研的 Arm 架構處理器,專為 AI 代理工作負載設計。他指出,Agentic AI 改變了 CPU 的角色,CPU 不再只是通用運算元件,而是代理系統中的「編排者」。
Vera CPU 的關鍵規格包括:首款採用 LPDDR5X 記憶體同時能修正多個錯誤的 CPU,透過 NVLink chip-to-chip 可擴展至多插槽架構,在代理沙箱效能上達到 x86 CPU 的 1.8 倍。黃仁驾示範了 Vera CPU 為紐約證券交易所執行即時串流處理的案例,強調因為頻寬優勢,效能達到傳統架構的 6 倍。
此外,Vera BlueField-4 STX 系統負責 AI 記憶體與儲存加速,搭配 Spectrum-X 乙太網路光子學,構成完整的資料中心基礎設施棧。黃仁勳總結:「Vera 將成為世界上最優化的代理 CPU。」
GROK LPX:低延遲推理新選擇
除了 Vera Rubin NVL72 以最高吞吐量運作外,NVIDIA 也推出 GROK LPX(LPU-30)系統,鎖定極低延遲推理場景。這款系統在富士康和廣達的產線上成形,搭載 256 顆 GROK LPU,分布在 16 個托盤上。
黃仁勳說明兩者的分工:NVL72 負責「最高吞吐量」的 token 生成,而 GROK LPX 則專攻「最低延遲」的 token 生成。兩者互補,讓 AI 工廠能同時滿足大批量與即時回應的需求。
Nemotron 3 Ultra 與開放模型策略
NVIDIA 持續押注開放模型路線。黃仁勳宣布 Nemotron 3 Ultra 正式推出,速度較前代提升 5 倍,並預告 Nemotron 4 已在開發中。他強調 Nemotron 經過全球最大規模的長時間推理模型套件訓練,是「世界上最好的開放模型系統策略」。
這與 NVIDIA 一貫的開放策略一致:開放模型、開放資料、甚至開放訓練方法,讓企業能自行微調並將其轉化為專有模型。黃仁勳也提到 NVIDIA OpenShell 已開源,Cadence 等合作夥伴正基於 Nemotron 打造晶片驗證等專業應用。
RTX Spark:33 年 PC 經驗濃縮成一顆晶片
演講後半段,黃仁勳揭曉了 RTX Spark,一款搭載 Blackwell 架構 RTX GPU 的筆記型電腦平台。他說:「RTX Spark 是筆電的重新發明。」
規格方面,RTX Spark 搭載 6,144 個 CUDA 核心、1 petaflop AI 運算效能、128GB 統一記憶體,採用台積電 3 奈米製程,內含 700 億個電晶體。黃仁勳特別提到,這是與 Microsoft 密切合作的成果,雙方共同打造了一個「專為代理設計的 Windows 平台」。
現場展示了多款 OEM 合作夥伴的 RTX Spark 筆電與迷你主機,黃仁勳強調:「40 年後,Microsoft 和 NVIDIA 將重新發明 PC。」RTX Spark 上可本地運行 Nemotron 3 Ultra 等模型,讓使用者在筆電上就能執行 AI 代理任務。

Cosmos 3:物理 AI 的前線
黃仁勳宣布 Cosmos 3 正式推出,稱其為「物理 AI 的前線」。Cosmos 3 具備四重能力:作為視覺語言模型(VLM)觀察物理世界、作為世界模型生成物理精確的合成影片、作為模擬器閉合策略訓練迴圈、以及作為 NVIDIA Omnidreams 的基礎逐幀預測未來。
黃仁勳指出,物理 AI 最難的問題是資料,機器人的感知視角與人類不同,必須從機器人的角度生成訓練資料。Cosmos 3 正是為了解決這個問題而生,且與 Nemotron 一樣採用開放策略,開發者可自行後訓練並將其轉化為專有模型。
Alpamaio 2:全球首款推理自駕車
在自駕車領域,NVIDIA 發布了 Alpamaio 2,一款開放的自駕車模型。黃仁勳稱其為「全球第一輛推理自駕車」。搭配 NVIDIA Hyperion 平台與 Halo 作業系統,Alpamaio 2 已獲得全球約 80% 汽車品牌的採用承諾。
黃仁勳將自駕車比作「物理 AI 代理機器人」,強調其技術堆疊與雲端代理系統本質上相同,都需要感知、推理、規劃的能力。
結語:從 Token 工廠到實體世界
黃仁勳在最後總結時表示:「我們對個人電腦的看法很可能會改變。」他感謝台灣生態系的合作夥伴,並預告「明年會有更多」。演講在一段 Nvidia 主題影片中落幕,歌詞唱著「這是智慧的製造方式,一種新型工廠」,正是整場演講的核心隱喻。
從 Vera Rubin 的全面量產到 RTX Spark 的 PC 革命,從 Cosmos 3 的物理 AI 到 Alpamaio 2 的推理自駕車,黃仁勳在 GTC Taipei 展示的是完整的 AI 基礎設施藍圖。台灣不只是供應鏈的起點,也是 AI 工廠走向世界的關鍵節點。












