說起 AMD BC-250 可能很多人並不清楚,其實它是 AMD 與華擎(ASRock)於 2021 年加密貨幣挖礦熱潮期間,針對區塊鏈(Blockchain)挖礦設計的專用礦卡/小型主板。其核心本質是 Sony PlayStation 5(PS5)主機內晶片的「不良品(次級晶片)」,代號為「Cyan Skillfish」(又稱 Oberon)的客製化 APU,內含 Zen 2 架構的 6 核心 CPU 與 GFX1013(RDNA 1.5)架構的 GPU。它配備 16GB GDDR6 統一記憶體(UMA,CPU 與 GPU 共享),出廠預設啟用 24 個計算單元(CU),但晶片本身物理上具備 40 CU,其中 16 個被韌體屏蔽。隨著以太幣轉為權益證明(PoS)與加密貨幣市場急遽降溫,BC-250 迅速失去礦工們的青睞,大量庫存流入電子廢棄物市場,險些淪為回收場的原料或最終被遺忘在倉庫角落。

PS5 廢品變身 AI 神器!AMD BC-250 用 PS5 晶片跑 LLM 推理
不過在開源社群開發者陸續挖掘出它在 Linux 環境下的遊戲與 AI 潛力,這張卡近日在二手市場重獲新生。除了 akandr 的 AI 部署專案外,BC-250 社群還成立了 bc250-collective 組織,彙整驅動程式、BIOS 工具與各類教學文件。之前 eBay 上 BC-250 的價格約落在 80 至 120 美元之間,不到一張 NVIDIA RTX 5090 的零頭,不過近期價格已被炒高。
從礦機到 AI 伺服器:軟體堆疊的突破
BC-250 能成為 AI 推理工具,最關鍵的推手是 GitHub 開發者 akandr 發表的完整部署指南。該指南詳細說明了如何在 Fedora Linux 系統上,透過 Vulkan 圖形運算 API 搭配 Ollama 或 llama.cpp,在 BC-250 上運行各類大型語言模型(LLM)。更讓人印象深刻的是,這位開發者還在這張卡上部署了一套基於 Signal 即時通訊的全自動 AI 監控系統,一口氣跑了 330 項自主排程任務,從程式碼審查到網頁監控一應俱全。
由於 AMD 的 ROCm 運算平台不支援 GFX1013 晶片,OpenCL 也無法在此硬體上正常運作,Vulkan 成了唯一可用的 GPU 運算路徑。這是一條相對小眾但社群證明可行的道路,開發者還需額外調整核心參數(GTT 容量上限與 TTM pages_limit)才能順利載入 14B 以上的參數模型。
AI 推理實測:超越預期的效能表現
根據 akandr 在 GitHub 上公開的詳細基準測試(截至 2026 年 6 月更新),BC-250 的 AI 推理效能相當驚人:
- 解鎖 40 CU 後,Qwen3.5 35B-A3B MoE(專家混合)模型可達到 78.7 tok/s 的生成速度
- Granite 4.0-H Tiny(混合 Mamba 架構)達到 129.2 tok/s
- DeepSeek-R1-14B 達到 30.4 tok/s
- Qwen3.5:9b(Ollama)達到 31.1 tok/s
與預設的 24 CU 相比,40 CU 解鎖平均帶來 生成速度 +32%、預填(prefill)速度 +50% 的提升。這項解鎖得益於社群開發者 S. Duggan 貢獻的核心修補程式(kernel patch),經獨立的 FP32 精確度驗證(1 億次乘加運算零錯誤)後,開發者以 11 款模型進行了嚴格的 A/B 測試。
| Model | Gen 24-CU | Gen 40-CU | Δ gen | Pfill 24-CU | Pfill 40-CU | Δ pfill |
|---|---|---|---|---|---|---|
| qwen3.5:9b (Ollama) | 23.1 | 31.1 | 1.34× | 143.1 | 225.3 | 1.57× |
| deepseek-r1-14b | 21.2 | 30.4 | 1.43× | 98.0 | 140.5 | 1.43× |
| gpt-oss-20b MXFP4 | 66.1 | 87.5 | 1.32× | 181.0 | 248.3 | 1.37× |
| gpt-oss-20b (Ollama) | 45.9 | 51.4 | 1.12× | 253.6 | 390.4 | 1.54× |
| qwen3-coder-30b IQ2_M | 57.7 | 76.7 | 1.33× | 178.2 | 264.6 | 1.49× |
| qwen3.5-35b-a3b IQ2_M | 59.5 | 78.7 | 1.32× | 171.8 | 245.9 | 1.43× |
| qwen3.6-35b-a3b IQ2_M | 59.6 | 78.0 | 1.31× | 170.8 | 250.2 | 1.46× |
| granite-4.0-h-tiny (hybrid Mamba) | 104.2 | 129.2 | 1.24× | 510.6 | 765.0 | 1.50× |
| gemma4-latest (Ollama) | 28.9 | 33.0 | 1.14× | 304.0 | 463.5 | 1.52× |
| mistral-small-3.2 (Ollama) | 11.6 | 18.3 | 1.57× | 51.5 | 83.7 | 1.62× |
| qwq-32b IQ2_M | 9.6 | 14.9 | 1.55× | 47.9 | 74.8 | 1.56× |
| Median | 1.32× | 1.50× |
長上下文與能耗優勢
BC-250 的長上下文表現也值得留意。Qwen3.5 35B MoE 可跑到 64K filled context(16.6 tok/s),而較小的 Qwen3.5:9b 甚至可達 128K context 且保持 5/5 的 Needle Retrieval 準確率,這意味著它能夠處理大篇幅的文件分析或長時間的對話歷史。在功耗方面,預設 24 CU 下整卡約 101W,解鎖 40 CU 後中位數約 116W,對比一張 H100 的 700W 功耗,BC-250 的能效比相當突出。
- 硬體成本:80-120 美元 vs H100 約 3 萬美元(相差 250-375 倍)
- 功耗:101-116W vs H100 的 700W(約 1/6)
- AI 推理:可跑 35B MoE 模型約 78 tok/s(40 CU),對照 H100 跑同模型約 200+ tok/s(推估值,因架構與量化方式不同難精確對比)
- 可用性:BC-250 可在 eBay 隨時下單,無需排隊等待數月
物理規格與部署陷阱
BC-250 並非一張標準 PCIe 顯卡。它本質上是一張採用 M.2 介面的小型主板,內含完整的 APU(CPU+GPU+記憶體)。使用者需要自行提供 ATX 電源供應器與散熱方案,社群的常見做法是用一個壞掉的一體式水冷散熱器加上三顆風扇直接壓在晶片上,據稱可 24/7 穩定運行。若要解鎖 40 CU,還需使用 CH341A 燒錄夾對 BIOS 進行刷寫。
此外,BC-250 的原始設計目標是放入 Samsung 的 4U 機架伺服器(每台裝 12 張),單獨購買者需自行解決供電與外殼問題。對於有 Linux 經驗且願意動手 DIY 的開發者來說,這些門檻並非不可克服。此外,同為 Cyan Skillfish 架構的還有 HP 等品牌伺服器使用的版本,規格略有差異。
誰適合購買 BC-250?
- 個人開發者:預算有限但想跑本地 LLM 推理,可接受 Linux 環境與手動設定
- 邊緣運算場景:低功耗、低成本的本地端 AI 推理節點,適合物聯網與遠端部署
- AI 教學與實驗:學生或自學者負擔得起的入門硬體,搭配 Ollama 即可快速上手
- 不適合:想要開箱即用、Windows 驅動完整支援、或需要頂規 AI 訓練效能的使用者
值得留意的是,Hackaday 的報導與 Reddit 討論區均指出,隨著 BC-250 的「挖礦廢料變黃金」故事在 YouTube 與科技媒體間廣泛傳播,eBay 上的價格已有明顯上漲趨勢(現在價格已經破萬元台幣)。若真有興趣入手的開發者,恐怕要加快腳步了。

