《iPhone News 愛瘋了》報導,近期,有媒體報導指出,蘋果和英偉達等科技巨頭使用 YouTube 字幕資料來訓練他們的人工智慧(AI)模型,引發了廣泛的爭議。
蘋果聲明:OpenELM 模型僅用於研究
針對這一爭議,蘋果今日透過科技媒體 9to5Mac 發表聲明,澄清 OpenELM 開源 AI 模型僅用於研究用途,並未涉及任何商業應用或 Apple Intelligence 項目。
調查報告揭露:ProofNews 發布調查
非營利新聞機構 ProofNews 的調查報告顯示,蘋果在訓練 OpenELM 模型時使用了一個名為 YouTube Subtitles 的資料集。
這個資料集大小達 5.7GB,包含約 4.89 億個單字。
YouTube Subtitles 資料集詳情
這個資料集由 EleutherAI 於 2020 年創建,涵蓋了超過 48,000 個頻道的 173,536 個 YouTube 影片字幕內容,甚至包括 12,000 多個已被平台刪除影片的字幕。
OpenELM 的研究價值與用途
蘋果強調,OpenELM 模型的設計初衷是為了促進研究社群的發展,推動開源大型語言模型技術的進步。
蘋果研究人員稱 OpenELM 是「最先進的開放式語言模型」。
OpenELM 與 Apple Intelligence 無關
蘋果重申,OpenELM 模型僅限於研究使用,並未應用於任何商業項目或 Apple Intelligence 功能。
這一模型以開源方式發布,開發者可以自由獲取和使用。
蘋果未來計劃
蘋果表示,現階段沒有計劃推出新版的 OpenELM 模型,專注於現有模型的研究和貢獻。