維基百科指南中列出了哪些 AI 慣用的「詞彙黑名單」?
Answer
維基百科 AI 寫作跡象指南:詞彙黑名單解析
維基百科社群發布的《人工智慧寫作跡象》指南旨在協助辨識 AI 生成內容,其中列出了一系列 AI 常用的「詞彙黑名單」。由於大型語言模型(LLM)基於機率預測,易產生風格、格式及邏輯上的獨特模式,因此可從中識別。
AI 慣用詞彙
AI 傾向使用宏大、正面但空洞的描述,將具體事實「平滑化」為通用讚美。例如,在描述事物時過度強調象徵意義與重要性,或使用「廢話文學」。
維基百科列出了一些 AI 慣用的詞彙,例如 "Delve"(深入研究)在 ChatGPT 普及後使用率暴增。其他常見詞彙包括 "Tapestry"(掛毯)、"Testament"(見證)、"Underscore"(強調)等。若文章中頻繁出現這些詞彙,則很可能是 AI 生成的。
AI 慣用句型與語氣
AI 寫作常見「錯誤的範圍」,例如使用「從 X 到 Y」的句式,但 X 和 Y 之間缺乏邏輯關聯。此外,AI 也常使用否定平行結構("Not only X, but also Y")或說教式免責聲明("It is important to note/remember..."),並傾向使用模糊歸因("Critics argue..."、"Observers have cited...")來製造有來源的假象。三段式排比也是 AI 常用的修辭手法。
AI 生成的文章結構僵化,結尾常有「結論」或「未來展望」等標題,並使用「儘管面臨挑戰,但......」等句式來作總結。
AI 標點與格式
AI 生成內容常有標點符號使用過度、標題大小寫異常、粗體使用過多等問題。此外,由於 AI 模型多基於 Markdown 語法訓練,因此可能在文章中留下 Markdown 殘留,例如 "##" 或 "**" 等符號。文章中若出現 Emoji,也可能是 AI 生成的跡象。
最令人擔憂的是,AI 可能偽造參考文獻,捏造看似真實的引用來源。這對知識傳播構成威脅,因為它不僅創造了錯誤的資訊,還偽造了驗證資訊的路徑。