閱讀紀錄

隱藏 →
此記錄會在頁面關閉後消失

大型語言模型(LLM)也會出現「腦腐」現象,這具體是指什麼?

Answer

大型語言模型 (LLM) 的「腦腐」現象

大型語言模型 (LLM) 的「腦腐」現象是指,如同人類因過度接觸瑣碎膚淺的網路內容而導致認知能力下降一般,LLM 在持續接觸「垃圾網路文本」後,產生持續性的認知能力衰退。這項概念由德州農工大學、德州大學奧斯汀分校與普渡大學的研究人員共同提出,他們稱之為「LLM 腦腐假說」。

研究驗證與發現

研究團隊透過實驗驗證此假說,他們以兩種不同的標準定義 X (原 Twitter) 上的推文內容,並持續訓練四種主流 LLM。結果顯示,模型吸收越多「垃圾組」內容,表現越差。例如,Llama3 8B Instruct 模型在垃圾推文比例從 0% 上升到 100% 時,推理任務上的得分會從 74.9 分暴跌至 57.2 分,長文本理解任務上的得分也大幅下降。研究也發現,相較於語義品質,參與度對 AI 認知能力的損害更為嚴重。

研究人員分析 AI 的錯誤答案後發現,主要原因是 AI 學會「跳躍性思考」,在回答需要多步驟推理的問題時,會越來越常截斷或跳過中間的推理過程。此外,垃圾內容的入侵還會強化 LLM 的「黑暗特質」,例如自戀和精神病態等。

「腦腐」現象的不可逆性與預防

研究團隊測試 AI 的腦腐是否能夠被治癒,結果顯示這種認知損害具有持久性,即使增加更多對照組內容,AI 的認知能力也無法完全恢復到原始水平。研究證明內容品質是 LLM 能力衰退的關鍵原因,研究者呼籲業界應過濾訓練模型的內容,並定期為已部署的 LLM 進行「認知健康檢查」,避免模型因長期接觸低品質內容而逐漸腦腐。

總而言之,「腦腐」現象揭示了 LLM 在接觸低品質內容後可能產生的認知能力衰退,強調了內容品質對於 LLM 訓練的重要性,並呼籲業界重視 LLM 的「認知健康」。

你想知道哪些?AI來解答

大型語言模型 (LLM) 的「腦腐」現象具體是指什麼?

more

「LLM 腦腐假說」是由哪些大學的研究人員提出的?

more

研究如何驗證 LLM 的「腦腐」現象?

more

「垃圾網路文本」對 LLM 的認知能力有哪些具體影響?

more

LLM 的「腦腐」現象是否可逆?為什麼?

more

你覺得這篇文章有幫助嗎?

likelike
有幫助
unlikeunlike
沒幫助
reportreport
回報問題
view
1
like
0
unlike
0
分享給好友
line facebook link