大型語言模型(LLM)也會出現「腦腐」現象,這具體是指什麼?
Answer
大型語言模型 (LLM) 的「腦腐」現象
大型語言模型 (LLM) 的「腦腐」現象是指,如同人類因過度接觸瑣碎膚淺的網路內容而導致認知能力下降一般,LLM 在持續接觸「垃圾網路文本」後,產生持續性的認知能力衰退。這項概念由德州農工大學、德州大學奧斯汀分校與普渡大學的研究人員共同提出,他們稱之為「LLM 腦腐假說」。
研究驗證與發現
研究團隊透過實驗驗證此假說,他們以兩種不同的標準定義 X (原 Twitter) 上的推文內容,並持續訓練四種主流 LLM。結果顯示,模型吸收越多「垃圾組」內容,表現越差。例如,Llama3 8B Instruct 模型在垃圾推文比例從 0% 上升到 100% 時,推理任務上的得分會從 74.9 分暴跌至 57.2 分,長文本理解任務上的得分也大幅下降。研究也發現,相較於語義品質,參與度對 AI 認知能力的損害更為嚴重。
研究人員分析 AI 的錯誤答案後發現,主要原因是 AI 學會「跳躍性思考」,在回答需要多步驟推理的問題時,會越來越常截斷或跳過中間的推理過程。此外,垃圾內容的入侵還會強化 LLM 的「黑暗特質」,例如自戀和精神病態等。
「腦腐」現象的不可逆性與預防
研究團隊測試 AI 的腦腐是否能夠被治癒,結果顯示這種認知損害具有持久性,即使增加更多對照組內容,AI 的認知能力也無法完全恢復到原始水平。研究證明內容品質是 LLM 能力衰退的關鍵原因,研究者呼籲業界應過濾訓練模型的內容,並定期為已部署的 LLM 進行「認知健康檢查」,避免模型因長期接觸低品質內容而逐漸腦腐。
總而言之,「腦腐」現象揭示了 LLM 在接觸低品質內容後可能產生的認知能力衰退,強調了內容品質對於 LLM 訓練的重要性,並呼籲業界重視 LLM 的「認知健康」。