Apple 機器學習團隊近日在 GitHub Pages 上公開了一項名為 PICO 的圖像壓縮技術,引發電腦視覺與影像處理領域的關注。PICO 全名 Perceptual Image Codec(感知圖像編解碼器),是一款直接針對人類視覺系統最佳化的學習型圖像壓縮演算法,在 iPhone 17 Pro Max 上編碼一張 1,200 萬畫素的照片最快僅需 230 毫秒,解碼更只要 150 毫秒。根據 Apple 在 arXiv 上發表的論文,PICO 在相同畫質下可節省 2.3 至 3 倍的位元率,對比對象涵蓋 AV1、AV2、VVC、ECM 及 JPEG-AI 等當前主流與次世代的圖像壓縮標準。
Apple 發表 PICO 感知圖像編解碼器
什麼是學習型圖像編解碼器?
傳統圖像壓縮技術(如 JPEG、WebP、AVIF)依賴人工設計的數學轉換與量化規則,工程師花費數十年微調這些演算法。學習型編解碼器(learned codec)則完全不同:它使用神經網路從大量圖像數據中自動學習最佳的壓縮策略,理論上可以比人工設計的規則更有效率。JPEG 在 1992 年推出至今已超過 30 年,而學習型編解碼器直到近五年才開始展現實用潛力。
然而,學習型編解碼器一直面臨一個現實困境:它們雖然壓縮效率高,但運算速度太慢,難以在手機等行動裝置上實用化。這也是 PICO 試圖解決的核心問題。
PICO 的技術特點
Apple 團隊在 PICO 的研發過程中做了兩件關鍵的事情:第一,對學習型編解碼器的設計選擇進行了全面研究,涵蓋了多種新技術的消融實驗;第二,他們執行了大規模的神經架構搜索(Neural Architecture Search, NAS),在數百萬個骨幹網路配置中尋找同時滿足「手機端運行速度」與「最佳感知畫質」的模型組合。這一做法在圖像壓縮領域相當少見,因為 NAS 通常需要極大的運算資源,但 Apple 憑藉自有晶片與資料中心的整合優勢克服了這個門檻。
最終的成果是一個在速度與畫質之間取得顯著平衡的編解碼器。根據 Apple 進行的大規模主觀用戶研究,PICO 的表現令人印象深刻:
- 對比傳統編解碼器:在相同感知畫質下,位元率僅需 AV1、AV2、VVC、ECM 和 JPEG-AI 的 1/2.3 至 1/3,相當於節省 57% 至 67% 的資料量
- 對比同類學習型編解碼器:位元率節省 20% 至 40%
- 運行速度:在 iPhone 17 Pro Max 上編碼 1,200 萬畫素照片僅需 230 毫秒,解碼僅需 150 毫秒
- 跨平台穩定性:不同於多數學習型編解碼器,PICO 提供了跨平台的穩健性保證
速度對比:iPhone 打敗 V100 GPU
PICO 最令人驚豔的數據之一,是它在 iPhone 17 Pro Max 上的運行速度比多數頂尖機器學習編解碼器在 NVIDIA V100 GPU(資料中心級運算卡)上還要快。這凸顯了 Apple 晶片在專用神經網路加速方面的硬體優勢,也證明 PICO 的設計從一開始就是以「實用化」為目標,而非只是學術benchmark的數字競賽。
150 毫秒的解碼速度意味著使用者在拍照後幾乎感受不到延遲,這對於 iPhone 的照片儲存與分享體驗至關重要。相比之下,多數學習型編解碼器因為運算開銷過大,至今仍停留在雲端伺服器或研究實驗室中。PICO 能在手機上達到比資料中心 GPU 更快的速度,證明了專用神經網路加速器(Apple Neural Engine)與演算法協同設計的巨大潛力。
誰開發了 PICO?
PICO 由 Apple 的機器學習研究團隊開發,主要作者包括 Kedar Tatwawadi、Parisa Rahimzadeh、Zhanghao Sun、Zhiqi Chen、Ziyun Yang、Sanjay Nair、Divija Hasteer 和 Oren Rippel。論文於 2026 年 5 月 6 日提交至 arXiv,歸類於電腦視覺(cs.CV)與人工智慧(cs.AI)領域。團隊也公開了數據集供學術研究使用,顯示 Apple 在機器學習研究領域日益開放的態度。
對 iPhone 拍照體驗的潛在影響
雖然 Apple 尚未宣布 PICO 何時會整合進 iOS 或 macOS,但這項技術的實用性與 Apple 產品的關聯性不言而喻。目前 iPhone 拍攝 HEIF/HEIC 格式照片時已使用高效率影片編碼(HEVC)的靜態影像版本,若未來轉用 PICO,可在相同檔案大小下提供更佳的畫質,或在相同畫質下進一步縮減照片佔用的儲存空間。
對於 iCloud 照片圖庫的用戶來說,這意味著可以在不犧牲畫質的情況下儲存更多照片,或在上傳與同步時消耗更少的網路頻寬。以一部 256GB 的 iPhone 為例,若照片平均省下 60% 的儲存空間,相當於可多存放數千張高畫質照片。
此外,PICO 的跨平台穩健性保證也暗示 Apple 可能將其部署在 Mac、iPad、Apple Vision Pro 等多個平台上,而不只是限於 iPhone。
總結
PICO 代表了學習型圖像壓縮從學術研究走向實用產品的重要一步。多數同類技術雖然在壓縮效率上表現優異,但實際應用時往往因運算速度不足而卻步。Apple 透過大規模神經架構搜索與全面的設計選擇研究,成功在感知畫質與裝置端運行速度之間取得了領先業界的平衡。
考量到 Apple 一貫的產品整合策略,PICO 很可能會在未來版本的 iOS 或 macOS 中作為 HEIF 的下一代替代方案出現。屆時,使用者在 iPhone 上拍攝的照片將在看不見的地方享有更高效的壓縮技術支援。對於攝影愛好者而言,這意味著更少的儲存焦慮和更快的分享體驗。



