
《iPhone News 愛瘋了》報導,想像一下:你打開 YouTube,看到一部 AI 自動生成的影片,畫面流暢、人物自然、聲音逼真到幾乎分不出真假——沒錯,這樣的技術正是蘋果正在研究的領域!
蘋果宣布將在 2025 年 10 月 19 日至 23 日於夏威夷檀香山舉行的國際電腦視覺大會(ICCV 2025)上,公開多項與 AI、影像生成和多模態模型相關的最新研究成果。
▋蘋果強勢登場 ICCV 2025:AI 技術再進化
ICCV 是全球電腦視覺界最頂尖的學術盛會,每年與歐洲電腦視覺會議(ECCV)輪流舉辦,吸引全球最強研究團隊參與。蘋果這次不只投稿 8 篇論文被錄取,還要登上主題演講舞台,展示他們在 AI 領域的新突破。
蘋果機器學習應用研究部經理 C. Thomas 博士 將在「第三屆基於視覺的工業檢測研討會(VISION)」發表主題演講,時間定於 10 月 19 日。這也是蘋果首次在該研討會擔任主要講者之一,顯示公司對電腦視覺與 AI 的重視

▋8 篇 AI 重磅論文搶先看:從影像生成到 3D 理解
蘋果在 ICCV 2025 公布的八篇研究論文,幾乎涵蓋了 AI 的各個前沿領域,包括影像生成、文字到影片轉換、多模態理解、以及統一擴散模型等技術。以下是部分亮點:
| 論文名稱 | 研究主題 |
|---|---|
| ETVA | 透過問題生成與回答,讓 AI 更懂文字與影片的對應關係 |
| MM-Spatial | 探索多模態大語言模型的 3D 空間理解能力 |
| STIV | 從文字或圖像生成高品質影片的方法 |
| UniVG | 可同時用於影像產生與編輯的通用擴散模型 |
根據蘋果公開資料,這些研究不僅推進了生成式 AI 的真實感,也在「多模態學習」(Multimodal Learning)上有重要突破。簡單說,這就是讓 AI 同時理解圖片、文字、聲音甚至影片的一種關鍵技術,未來將應用在 Siri、Apple Vision Pro、甚至 Final Cut Pro 等產品中。

▋推動 AI 性別平權:蘋果研究員登上 Women in Computer Vision
除了技術研究外,蘋果也參與「電腦視覺領域女性研討會」(Women in Computer Vision Workshop),研究人員 Patricia Vitoria Carrera 與 Tanya Glozman 將擔任導師,分享女性在 AI 研究領域的職涯經驗與挑戰。這不只是技術展示,更是一場關於「包容與多元」的行動。
▋AI 技術的未來:蘋果下一步會是什麼?
根據 IEEE 的研究指出,2024 年全球生成式 AI 市場規模已突破 220 億美元,預計到 2030 年將翻五倍成長。蘋果顯然不想缺席這場 AI 革命,特別是在 Vision Pro 與 Apple Intelligence 崛起的時代。
業界分析指出,蘋果這次的 ICCV 展示,可能為其下一代「端側 AI」(On-device AI)打下基礎——讓 iPhone 或 Mac 不依賴雲端,也能自行生成影片或圖像,同時保護用戶隱私。
《iPhone News 愛瘋了》表示,這場 ICCV 2025 對蘋果來說不只是學術展示,更是一次「AI 實力秀」。當 Google、OpenAI、Meta 都在拚生成模型時,蘋果選擇以穩健、注重隱私的方式參戰。
或許下一次你在 iPhone 上編輯影片、生成圖片時,背後的 AI 就是這次研究成果的結晶。你會期待蘋果讓 AI 更「貼心」還是更「聰明」呢?
● 相關內容:蘋果 AI 研究、ICCV 2025、Apple 電腦視覺、生成式 AI、Vision Pro 技術

發表留言