《iPhone News 愛瘋了》報導，想像一下：你打開 YouTube，看到一部 AI 自動生成的影片，畫面流暢、人物自然、聲音逼真到幾乎分不出真假——沒錯，這樣的技術正是蘋果正在研究的領域！

蘋果宣布將在 2025 年 10 月 19 日至 23 日於夏威夷檀香山舉行的國際電腦視覺大會（ICCV 2025）上，公開多項與 AI、影像生成和多模態模型相關的最新研究成果。

▋蘋果強勢登場 ICCV 2025：AI 技術再進化

ICCV 是全球電腦視覺界最頂尖的學術盛會，每年與歐洲電腦視覺會議（ECCV）輪流舉辦，吸引全球最強研究團隊參與。蘋果這次不只投稿 8 篇論文被錄取，還要登上主題演講舞台，展示他們在 AI 領域的新突破。

蘋果機器學習應用研究部經理 C. Thomas 博士將在「第三屆基於視覺的工業檢測研討會（VISION）」發表主題演講，時間定於 10 月 19 日。這也是蘋果首次在該研討會擔任主要講者之一，顯示公司對電腦視覺與 AI 的重視

▋8 篇 AI 重磅論文搶先看：從影像生成到 3D 理解

蘋果在 ICCV 2025 公布的八篇研究論文，幾乎涵蓋了 AI 的各個前沿領域，包括影像生成、文字到影片轉換、多模態理解、以及統一擴散模型等技術。以下是部分亮點：

論文名稱	研究主題
ETVA	透過問題生成與回答，讓 AI 更懂文字與影片的對應關係
MM-Spatial	探索多模態大語言模型的 3D 空間理解能力
STIV	從文字或圖像生成高品質影片的方法
UniVG	可同時用於影像產生與編輯的通用擴散模型

根據蘋果公開資料，這些研究不僅推進了生成式 AI 的真實感，也在「多模態學習」（Multimodal Learning）上有重要突破。簡單說，這就是讓 AI 同時理解圖片、文字、聲音甚至影片的一種關鍵技術，未來將應用在 Siri、Apple Vision Pro、甚至 Final Cut Pro 等產品中。

▋推動 AI 性別平權：蘋果研究員登上 Women in Computer Vision

除了技術研究外，蘋果也參與「電腦視覺領域女性研討會」（Women in Computer Vision Workshop），研究人員 Patricia Vitoria Carrera 與 Tanya Glozman 將擔任導師，分享女性在 AI 研究領域的職涯經驗與挑戰。這不只是技術展示，更是一場關於「包容與多元」的行動。

▋AI 技術的未來：蘋果下一步會是什麼？

根據 IEEE 的研究指出，2024 年全球生成式 AI 市場規模已突破 220 億美元，預計到 2030 年將翻五倍成長。蘋果顯然不想缺席這場 AI 革命，特別是在 Vision Pro 與 Apple Intelligence 崛起的時代。

業界分析指出，蘋果這次的 ICCV 展示，可能為其下一代「端側 AI」（On-device AI）打下基礎——讓 iPhone 或 Mac 不依賴雲端，也能自行生成影片或圖像，同時保護用戶隱私。

《iPhone News 愛瘋了》表示，這場 ICCV 2025 對蘋果來說不只是學術展示，更是一次「AI 實力秀」。當 Google、OpenAI、Meta 都在拚生成模型時，蘋果選擇以穩健、注重隱私的方式參戰。

或許下一次你在 iPhone 上編輯影片、生成圖片時，背後的 AI 就是這次研究成果的結晶。你會期待蘋果讓 AI 更「貼心」還是更「聰明」呢？

● 相關內容：蘋果 AI 研究、ICCV 2025、Apple 電腦視覺、生成式 AI、Vision Pro 技術