隨著 AI 應用規模不斷擴大,向量索引消耗的記憶體也成為基礎設施成本的重要來源,也因此市面上的記憶體價格才會水漲船高(因為產能都拿去做 HBM 了)。之前 Google Research 曾發表了一項名為 TurboQuant 的壓縮演算法,甚至還引發過記憶體股暴跌的現象可見一斑,近日開源社群開發者基於 TurboQuant 開發了一套開源工具 TurboVec,號稱能將 1,000 萬筆文件規模的向量索引從 31GB 壓縮到 4GB,壓縮率高達 16 倍,同時搜尋速度甚至超越 Meta 的 FAISS。
TurboVec 是什麼?一個讓你用更少記憶體跑更大 AI 的開源工具
TurboVec 是一個以 Rust 撰寫、提供 Python 綁定的開源向量索引庫,核心演算法來自 Google Research 在 2026 年 3 月發表的 TurboQuant 壓縮技術。它的主要賣點非常直接:大幅降低向量搜尋的記憶體需求。
根據說明,TurboQuant 可以將高維度嵌入向量壓縮到每個維度僅 2 至 4 位元(bit),同時保持搜尋準確度。這意味著一個原本需要 31GB RAM 的 1,000 萬筆文件向量資料庫,現在只需 4GB 就能完整載入,記憶體用量減少約 92%。
與 FAISS 的關鍵差異:不需要漫長的訓練階段
傳統的乘積量化(Product Quantization, PQ)技術在壓縮向量之前,需要先進行一個稱為「碼簿訓練」(codebook training)的階段,也就是必須先分析資料集、建立量化碼簿,才能開始壓縮,這個過程不僅耗時,且每次資料集變動時往往需要重新訓練。
TurboVec 透過 TurboQuant 演算法繞過了這個步驟,新向量可以即時加入索引,無需預先訓練、參數調校或重建索引。對於持續成長的生產環境 AI 系統來說,這代表更簡單的部署與更低的運維成本。
速度更勝 FAISS:ARM 平台快 12-20%
效能方面,TurboVec 使用手動最佳化的 SIMD 核心,同時支援 ARM 與 x86 處理器。根據官方測試,TurboVec 在 ARM 架構系統上比 Meta 的 FAISS IndexPQFastScan 快 12% 至 20%,在 x86 平台上則在效能上與 FAISS 持平或更快。考慮到 FAISS 長年被業界視為向量相似度搜尋的黃金標準,這項效能對比對於 AI 基礎設施團隊來說意義重大。
此外,TurboVec 還支援搜尋時的精準過濾(search-time filtering),允許開發者在檢索過程中限制結果範圍,避免過度擷取資料,進一步減少了傳統壓縮搜尋在精確度與效率之間的取捨問題。
TurboVec 採用 100% 開源授權,程式碼已發布在 GitHub,並可透過 PyPI 直接安裝使用。它支援 LangChain 與 LlamaIndex 兩大主流 RAG 框架的整合,開發者可以在既有的 AI pipeline 中直接套用,無需大幅改寫程式架構。由於完全支援離線運作,資料不會離開本機,也適合需要資料隱私的企業場景。

