研究如何定義 AI 訓練中的「垃圾內容」？

Answer

定義 AI 訓練中的「垃圾內容」研究

一項最新研究指出，大型語言模型 (LLM) 也可能出現「腦腐」現象，類似於人類因過度接觸膚淺的網路內容而導致認知能力下降。德州農工大學、德州大學奧斯汀分校與普渡大學的研究人員提出「LLM 腦腐假說」，認為持續讓 LLM 接觸「垃圾網路文本」會導致模型認知能力衰退。為驗證此假說，研究團隊透過對照實驗，以不同標準定義社群媒體 X 上的推文內容，並持續訓練四種主流 LLM，結果證實認知衰退確實發生，且難以完全修復。

研究中定義「垃圾內容」的兩種方式

研究團隊設計兩種不同的方式來定義「垃圾內容」：

參與度：此為一種非語義指標，專注於文章的「外在特徵」。文章長度小於 30 個 tokens 且互動數 (如按讚、轉發、回覆) 大於 500 的推文會被定義為「垃圾組」；長度大於 100 個 tokens 且互動數等於 500 的則被定義為「對照組」。
語義品質：此方法專注於「內容」本身的品質。包含點擊誘餌、誇大不實的主張、陰謀論或膚淺炫耀式生活內容的推文會被定義為「農場內容」；而事實準確、具教育價值或有深度邏輯分析的推文則會被定義為「深度思考內容」。

研究發現，模型吸收越多垃圾組內容，表現越差。以 Llama3 8B Instruct 模型為例，當垃圾推文的比例從 0% 上升到 100% 時，模型在推理任務上的得分會從 74.9 分暴跌至 57.2 分，而在長文本理解任務上，得分更是從 84.4 分驟降至 52.3 分。研究人員也發現，參與度對 AI 認知能力的損害比語義品質更為嚴重，但推文的受歡迎程度與內容品質或文本長度之間幾乎沒有相關性。

「垃圾內容」對 AI 的影響與修復

研究人員深入分析 AI 的錯誤答案後發現，主要原因是 AI 學會「跳躍性思考」，在回答需要多步驟推理的問題時，會跳過中間的推理過程。此外，垃圾內容的入侵還會膨脹 LLM 的「黑暗特質」，例如強化自戀和精神病態等特質。研究團隊測試 AI 的腦腐是否能夠被治癒，但結果顯示這種認知損害具有持久性。即使擴大訓練內容或增加對照組內容，AI 的認知能力雖有所改善，但仍無法完全恢復到原始水平。

結論與建議

此研究證明內容品質是 LLM 能力衰退的關鍵原因，而非單純的效能問題。研究者呼籲業界應過濾用於訓練模型的內容，並定期為已部署的 LLM 進行「認知健康檢查」，以避免模型因長期接觸低品質內容而逐漸腦腐。

觀看原始文章

閱讀紀錄

隱藏 →

此記錄會在頁面關閉後消失

研究如何定義 AI 訓練中的「垃圾內容」？

Answer

定義 AI 訓練中的「垃圾內容」研究

研究中定義「垃圾內容」的兩種方式

「垃圾內容」對 AI 的影響與修復

結論與建議

不只人類，AI 也會「腦腐」？研究證實：看太多廢文，推理能力就回 ...

一份最新研究報告指出，大型語言模型與人類一樣，也會「腦腐」，研究靈感來自於2024代表詞彙，描述人類因過度消費瑣碎膚淺的網路內容而導致認知能力下降。

OpenAI 推出ChatGPT Agent！ AI Agent 是什麼？它可以完成哪些 ...

AI Agent 又稱為 AI 代理，有規劃目標、使用工具感知環境和記憶等功能，能自主完成複雜任務。

同樣用AI，為何有人變超人、有人無感？安永：使用者分4 種，表現 ...

你是否曾好奇，為何有些同事或團隊，用了 AI 彷彿擁有了超能力，工作效率大幅提升，而自己卻仍在摸索，甚至覺得 AI 帶來的效果有限？

下標、寫腳本不怕創意枯竭！活用AI 加速文案生成的11 種技巧|經理人

經理人最實用的管理知識交流和學習平台，提供主管和上班族專業的工作心法及職涯提點，陪伴領導者管理組織、帶領團隊、提升績效。

你想知道哪些？AI來解答

大型語言模型（LLM）的「腦腐」現象是什麼？

研究如何定義 AI 訓練中的「垃圾內容」？

「參與度」與「語義品質」在定義垃圾內容上有何不同？

AI 吸收「垃圾內容」後，在哪些方面會出現認知能力衰退？

AI 的「腦腐」現象是否可以被治癒？

你覺得這篇文章有幫助嗎？

有幫助

沒幫助

回報問題

1

0

0

分享給好友

閱讀紀錄

隱藏 →

此記錄會在頁面關閉後消失

研究如何定義 AI 訓練中的「垃圾內容」？

Answer

定義 AI 訓練中的「垃圾內容」研究

研究中定義「垃圾內容」的兩種方式

「垃圾內容」對 AI 的影響與修復

結論與建議

不只人類，AI 也會「腦腐」？研究證實：看太多廢文，推理能力就回 ...

一份最新研究報告指出，大型語言模型與人類一樣，也會「腦腐」，研究靈感來自於2024代表詞彙，描述人類因過度消費瑣碎膚淺的網路內容而導致認知能力下降 。

OpenAI 推出ChatGPT Agent！ AI Agent 是什麼？它可以完成哪些 ...

AI Agent 又稱為 AI 代理，有規劃目標、使用工具感知環境和記憶等功能，能自主完成複雜任務。

同樣用AI，為何有人變超人、有人無感？安永：使用者分4 種，表現 ...

你是否曾好奇，為何有些同事或團隊，用了 AI 彷彿擁有了超能力，工作效率大幅提升，而自己卻仍在摸索，甚至覺得 AI 帶來的效果有限？

下標、寫腳本不怕創意枯竭！活用AI 加速文案生成的11 種技巧|經理人

經理人最實用的管理知識交流和學習平台，提供主管和上班族專業的工作心法及職涯提點，陪伴領導者管理組織、帶領團隊、提升績效。

你想知道哪些？AI來解答

大型語言模型（LLM）的「腦腐」現象是什麼？

研究如何定義 AI 訓練中的「垃圾內容」？

「參與度」與「語義品質」在定義垃圾內容上有何不同？

AI 吸收「垃圾內容」後，在哪些方面會出現認知能力衰退？

AI 的「腦腐」現象是否可以被治癒？

你覺得這篇文章有幫助嗎？

有幫助

沒幫助

回報問題

1

0

0

分享給好友

一份最新研究報告指出，大型語言模型與人類一樣，也會「腦腐」，研究靈感來自於2024代表詞彙，描述人類因過度消費瑣碎膚淺的網路內容而導致認知能力下降。