
《iPhone News 愛瘋了》報導,當多數科技公司還在比誰的 AI 生成圖片更「像真的」,Apple 這次選擇走一條更冷靜也更狠的路:直接把影像壓縮做到人眼幾乎無感,但資料量只剩三分之一。
PICO(Perceptual Image Codec)不是在修圖,而是在重新定義「一張照片到底需要佔多少記憶體」。
「真正的技術優雅,不是讓畫面更清晰,而是讓世界更輕。」
▋PICO 登場:Apple 把影像壓縮從工程問題變成視覺哲學
Apple 研究團隊發表的 PICO,是一種基於機器學習的影像編解碼器,核心目標不是單純壓縮,而是模擬人類視覺系統的感知方式。換句話說,它不在乎像素數字漂亮不漂亮,只在乎你「看起來覺得有沒有差」。
傳統 JPEG、PNG、HEIC 的邏輯是「數學壓縮」,而 PICO 的邏輯更像是:「如果你看不出來,那就當作不存在」。這種思維很 Apple:不是把東西做小,而是讓你開始懷疑原本是不是太大。

▋壓縮效率:不是進步,是直接改規則
根據 Apple 研究資料,PICO 相較 AV1、VVC、JPEG-AI 等主流編解碼器,可達到2.3 到 3 倍位元率節省,等於同畫質下只需要三分之一資料量。
更進一步,在與其他學習型編解碼器比較時,PICO 仍能再降低 20% 至 40% 位元率。這種數字在工程世界裡的意思通常是:別人還在優化,Apple 已經在改單位。
| 編解碼器 | 資料量需求 | 特色 |
|---|---|---|
| JPEG / PNG | 基準 | 穩定但笨重 |
| AV1 / VVC | 約 50%–70% | 主流高效壓縮 |
| PICO | 約 30%–50% | 以人類視覺為核心 |
▋端上運算:iPhone 開始學會「壓縮時間」
在 iPhone 17 Pro Max 上,PICO 可在約 230 毫秒完成 1200 萬像素影像編碼,解碼則約 150 毫秒。雖然仍未完全超越 HEIC 等高度優化傳統格式,但已大幅縮小差距。
這裡有個很 Apple 的矛盾:一邊堅持端上運算與隱私,一邊又要讓 AI 壓縮模型跑得像雲端一樣快。某種程度上,這是在要求手機同時做到「不連網」與「即時魔法」。
根據 IEEE Signal Processing Society 的相關研究,學習型編解碼器的最大瓶頸不在模型能力,而在於「端上延遲與穩定性」。PICO 的意義,就是開始嘗試解這個長期無解題。

▋人類視覺才是標準:Apple 的壓縮邏輯很不工程師
PICO 的訓練方式相當「不傳統」。Apple 結合 GAN 損失、知覺品質損失,甚至特別針對小字模糊與壓縮色塊做優化。簡單說,它不是讓圖片更正確,而是讓人類更不在意錯誤。
此外,Apple 還進行大規模人類測試,包含 610 位評估者、74,925 組比較結果,並使用貝葉斯 Elo 分數進行排序。這不是單純測試模型,而是用統計方式建構「人眼偏好模型」。
「當 AI 開始學會模仿人類視覺,人類也開始被重新定義什麼叫做真實。」
▋限制與現實:AI 壓縮不是萬能,而是更聰明的取捨
Apple 也坦承 PICO 並非完美。在動漫、插畫等高度簡化圖像上,PICO 有時反而需要更高位元率才能維持品質,這意味著它對「自然影像」最有效。
換句話說,它不是萬能壓縮器,而是專門為現實世界設計的壓縮方式。這也解釋了 Apple 一貫策略:不追求通用最佳解,而是優化「大多數人真正會遇到的場景」。
《iPhone News 愛瘋了》表示,PICO 看起來是一個影像壓縮技術,但本質上更像 Apple 對數位世界的一種提問:如果人眼才是標準,那資料量還有必要這麼誠實嗎?
當我們開始用「感覺」取代「數據」時,也許真正被壓縮的,不只是圖片,而是我們對真實的定義。
● Apple 相關內容:Apple PICO 影像壓縮技術原理、AI 影像編解碼器壓縮效率比較、iPhone 圖片壓縮演算法升級
