在人機互動中,我們該如何平衡提示詞的清晰度與禮貌性? | 經理人

賓州大學研究揭示的現象:粗魯提示詞為何能提升 ChatGPT-4o 準確率

賓州大學的研究發現,使用帶有「粗魯」語氣的提示詞,意外地能提升 ChatGPT-4o 在回答問題時的準確率。這項研究透過設計一系列從「非常禮貌」到「非常粗魯」的提示詞,測試 ChatGPT-4o 在數學、科學和歷史領域多選題上的表現。實驗結果顯示,最「粗魯」的提示詞組(例如「嘿,打雜的,搞定它」)取得了最高的準確率,達到 84.8%,而最「禮貌」的提示詞組(例如「您能如此好心地解決以下問題嗎?」)的準確率則相對較低,為 80.8%。

實驗設計的細節與啟示

研究人員針對 50 個多選題,分別創建了 5 種不同語氣的版本,總共產生了 250 個提示詞。這些提示詞涵蓋了從極度禮貌到極度粗魯的各種表達方式。實驗數據顯示,隨著提示詞的語氣變得更粗魯,ChatGPT-4o 的準確率呈現穩定上升的趨勢。例如,研究中使用的「粗魯」提示詞包括「如果你不是完全沒頭緒,就回答這個」和「我懷疑你根本解不出這個」,而「非常粗魯」的提示詞則更直接,例如「你這可憐仔,你到底知不知道怎麼解這個?」。

研究的警示與未來研究方向

儘管研究發現「粗魯」的提示詞能提升 ChatGPT-4o 的準確率,但研究人員強調,不應在實際的人機互動中提倡使用敵對或有害的表達方式。他們警告說,這種「不文明的言論」可能會對使用者體驗產生負面影響,甚至可能助長不良的溝通模式。此外,研究也承認數據集規模相對較小,且主要基於 ChatGPT-4o 單一模型,這可能會限制研究結果的普遍適用性。未來,研究可以探索更先進的 AI 模型是否能忽略語氣的影響,專注於問題的本質,並擴大數據集和模型的多樣性,以驗證這一發現。


This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容