使用 YouTube 字幕訓練 AI?蘋果澄清 OpenELM 模型用途

蘋果回應 AI 訓練爭議:OpenELM 模型僅用於研究 apple openelm youtube ai training

《iPhone News 愛瘋了》報導,近期,有媒體報導指出,蘋果和英偉達等科技巨頭使用 YouTube 字幕資料來訓練他們的人工智慧(AI)模型,引發了廣泛的爭議。

 

蘋果聲明:OpenELM 模型僅用於研究

針對這一爭議,蘋果今日透過科技媒體 9to5Mac 發表聲明,澄清 OpenELM 開源 AI 模型僅用於研究用途,並未涉及任何商業應用或 Apple Intelligence 項目。

 

調查報告揭露:ProofNews 發布調查

非營利新聞機構 ProofNews 的調查報告顯示,蘋果在訓練 OpenELM 模型時使用了一個名為 YouTube Subtitles 的資料集。

這個資料集大小達 5.7GB,包含約 4.89 億個單字。

 

YouTube Subtitles 資料集詳情

這個資料集由 EleutherAI 於 2020 年創建,涵蓋了超過 48,000 個頻道的 173,536 個 YouTube 影片字幕內容,甚至包括 12,000 多個已被平台刪除影片的字幕。

 

OpenELM 的研究價值與用途

蘋果強調,OpenELM 模型的設計初衷是為了促進研究社群的發展,推動開源大型語言模型技術的進步。

蘋果研究人員稱 OpenELM 是「最先進的開放式語言模型」。

 

OpenELM 與 Apple Intelligence 無關

蘋果重申,OpenELM 模型僅限於研究使用,並未應用於任何商業項目或 Apple Intelligence 功能。

這一模型以開源方式發布,開發者可以自由獲取和使用。

 

蘋果未來計劃

蘋果表示,現階段沒有計劃推出新版的 OpenELM 模型,專注於現有模型的研究和貢獻。

發表留言