Intel 與 AMD 這對數十年來在 CPU 市場上正面廝殺的競爭對手,正透過 x86 生態系統顧問小組(EAG)持續深化合作。繼兩天前聯合發布 ACE(AI Compute Extensions)AI 矩陣加速指令集白皮書之後,EAG 再度揭露了 APX(Advanced Performance Extensions)的最新細節。這項被稱為「x86 自 64 位元以來最大演進」的指令集擴充,將通用暫存器數量直接翻倍,並在不增加晶片面積與功耗的前提下顯著提升效能。
APX 是什麼?為什麼是 x86 的重大演進?
APX(Advanced Performance Extensions)是 Intel 與 AMD 共同制定的新一代 x86 指令集擴充標準。它的核心精神非常直接:讓 x86 指令集能夠存取更多的暫存器(Registers)。
暫存器是 CPU 內部容量極小但存取速度極快的儲存單元,負責存放正在運算的資料、指令與記憶體位址。當指令集能存取更多暫存器時,處理器就能在更短的時間內完成更多工作,因為大量資料可以直接在 CPU 內部處理,不需要頻繁到速度較慢的記憶體中讀寫。
這項規格早在 2024 年 10 月就由 Intel 首次提出,如今在 EAG 的框架下由 Intel 與 AMD 共同推動,並釋出了更多技術細節。
APX 六大核心改進
APX 並非單一功能的補強,而是對 x86 指令集架構的一次系統性升級。以下是主要改進項目:
通用暫存器(GPR)翻倍:由現有的 16 個一舉擴充至 32 個。這讓編譯器可以將更多資料與變數保留在暫存器中,而非寫入速度較慢的記憶體,對程式碼編譯與執行效率有直接幫助。
記憶體操作效率提升:經過 SPEC CPU 2017 整數基準測試的模擬驗證,APX 編譯後的程式碼可減少 10% 的讀取操作(loads)與 20% 的寫入操作(stores),代表更快且功耗更低的程式執行。
非破壞性指令形式:傳統 x86 指令大多是「破壞性」的,運算結果會直接蓋掉其中一個來源運算元。APX 新增了非破壞性版本,減少暫存器複製需求,讓程式碼更簡潔且執行更快。
條件執行擴充:過去 x86 的條件執行僅限於 CMOV 與 SET 等少數指令。APX 新增了條件式讀取(Conditional Load)、條件式寫入(Conditional Store)、條件式比較/測試(Conditional Compare/Test)以及旗標抑制功能,大幅擴展 if-conversion 的應用範圍,減少分支預測失誤。
堆疊操作強化:新增 PUSH2 與 POP2 指令,可以在一次記憶體操作中同時推送或彈出兩個暫存器,加速函式呼叫的進入與返回流程。
程式碼密度不變:儘管新增了大量指令與功能,APX 並不顯著增加程式碼體積,並且完全向下相容——既有的 x86 軟體可以在支援 APX 的處理器上無縫執行。
與 ACE 指令集同屬 EAG 框架下的戰略布局
APX 的公布時間點極具戰略意義。就在兩天前的 4 月 30 日,Intel 與 AMD 才剛聯合發布了 ACE(AI Compute Extensions)技術白皮書,將其定位為 x86 架構的「標準矩陣加速架構」,支援 INT8、FP8、BF16 等主流 AI 資料格式,並相容於 AVX10 指令集。
ACE 聚焦 AI 矩陣運算加速,APX 則專注於通用運算效能的全面提升:兩者相輔相成,共同構成 EAG 對 x86 架構未來發展的完整藍圖。EAG 自去年成立以來,陸續公布了 FRED(彈性返回與事件遞送)、AVX10(向量指令集統一)、ChkTag(記憶體安全標籤檢查)以及 ACE 與 APX 等多項核心特性。
不用更大面積、不必更高功耗,效能自然提升
APX 最令人驚豔的特色之一,是這些效能提升幾乎不需要額外的矽晶圓面積或功耗作為代價。Wccftech 的報導強調,APX 可以在不顯著增加核心面積與功耗的情況下,實現更高的通用運算效能:這對於晶片設計與散熱解決方案來說,意義極為重大。
對開發者與消費者的意義
對於軟體開發者而言,APX 最大的價值在於編譯器的最佳化空間大幅增加。當編譯器能夠將更多變數保留在暫存器而非記憶體中,程式就能跑得更快、更省電。尤其對於 LLVM 與 GCC 等主流編譯器來說,APX 的 32 個通用暫存器將成為極具吸引力的編譯目標。
對於一般消費者而言,APX 帶來的效益將間接體現在日常使用中:從網頁瀏覽、文書處理到遊戲與內容創作,支援 APX 的處理器將能以更低的功耗完成相同的工作,或在相同功耗下提供更流暢的效能表現。
結語
Intel 與 AMD 從數十年的競爭對手,到如今在 EAG 框架下聯手推進 x86 架構的演進:這不僅是為了對抗 ARM 與 RISC-V 的新興威脅,更是對 x86 這套走過近半世紀的指令集架構注入全新生命力。APX 的通用暫存器翻倍、ACE 的 AI 矩陣加速標準化,再加上 FRED、AVX10、ChkTag 等一系列基礎架構革新,x86 的故事顯然還沒有寫完。



