TurboVec：基於 Google TurboQuant，可將向量搜尋記憶體用量由31GB 壓縮至4GB

隨著 AI 應用規模不斷擴大，向量索引消耗的記憶體也成為基礎設施成本的重要來源，也因此市面上的記憶體價格才會水漲船高（因為產能都拿去做 HBM 了）。之前 Google Research 曾發表了一項名為 TurboQuant 的壓縮演算法，甚至還引發過記憶體股暴跌的現象可見一斑，近日開源社群開發者基於 TurboQuant 開發了一套開源工具 TurboVec，號稱能將 1,000 萬筆文件規模的向量索引從 31GB 壓縮到 4GB，壓縮率高達 16 倍，同時搜尋速度甚至超越 Meta 的 FAISS。

TurboVec 是什麼？一個讓你用更少記憶體跑更大 AI 的開源工具

TurboVec 是一個以 Rust 撰寫、提供 Python 綁定的開源向量索引庫，核心演算法來自 Google Research 在 2026 年 3 月發表的 TurboQuant 壓縮技術。它的主要賣點非常直接：大幅降低向量搜尋的記憶體需求。

根據說明，TurboQuant 可以將高維度嵌入向量壓縮到每個維度僅 2 至 4 位元（bit），同時保持搜尋準確度。這意味著一個原本需要 31GB RAM 的 1,000 萬筆文件向量資料庫，現在只需 4GB 就能完整載入，記憶體用量減少約 92%。

與 FAISS 的關鍵差異：不需要漫長的訓練階段

傳統的乘積量化（Product Quantization, PQ）技術在壓縮向量之前，需要先進行一個稱為「碼簿訓練」（codebook training）的階段，也就是必須先分析資料集、建立量化碼簿，才能開始壓縮，這個過程不僅耗時，且每次資料集變動時往往需要重新訓練。

TurboVec 透過 TurboQuant 演算法繞過了這個步驟，新向量可以即時加入索引，無需預先訓練、參數調校或重建索引。對於持續成長的生產環境 AI 系統來說，這代表更簡單的部署與更低的運維成本。

速度更勝 FAISS：ARM 平台快 12-20%

效能方面，TurboVec 使用手動最佳化的 SIMD 核心，同時支援 ARM 與 x86 處理器。根據官方測試，TurboVec 在 ARM 架構系統上比 Meta 的 FAISS IndexPQFastScan 快 12% 至 20%，在 x86 平台上則在效能上與 FAISS 持平或更快。考慮到 FAISS 長年被業界視為向量相似度搜尋的黃金標準，這項效能對比對於 AI 基礎設施團隊來說意義重大。

此外，TurboVec 還支援搜尋時的精準過濾（search-time filtering），允許開發者在檢索過程中限制結果範圍，避免過度擷取資料，進一步減少了傳統壓縮搜尋在精確度與效率之間的取捨問題。

TurboVec 採用 100% 開源授權，程式碼已發布在 GitHub，並可透過 PyPI 直接安裝使用。它支援 LangChain 與 LlamaIndex 兩大主流 RAG 框架的整合，開發者可以在既有的 AI pipeline 中直接套用，無需大幅改寫程式架構。由於完全支援離線運作，資料不會離開本機，也適合需要資料隱私的企業場景。

TurboVec GitHub 頁面

Tags: Github Google TurboQuant TurboVec 開源

TurboVec：基於 Google TurboQuant，可將向量搜尋記憶體用量由31GB 壓縮至4GB

您也許會喜歡：

網站搜尋

廣告