Grok 4.1 模型在 LMArena 評測中,與其他模型相比有何突出表現?
Answer
Grok 4.1 在 LMArena 評測中的卓越表現
由伊隆·馬斯克創立的 xAI 公司近期推出了最新模型 Grok 4.1。根據官方數據,Grok 4.1 在處理真實世界資訊的準確度大幅提升,將 AI 常見的「胡說八道」錯誤率從原先 Grok 4 Fast 的 12% 壓低至 4%。Grok 4.1 不僅在速度上有所提升,還加入了全新的「思考模式」,使其在 LMArena 的文字排行榜上以 1483 分高居榜首,領先其他非 xAI 開發的最高分模型多達 31 分。
Grok 4.1 的「思考模式」
Grok 4.1 的「思考模式」使其能夠透過深度推理發現深刻見解,並將各種資訊連接起來,發現複雜概念中的真相。即便在不開啟思考模式的「非推理模式」下,Grok 4.1 也能提供近乎即時的回應,並在 LMArena 排行榜上取得第二名的佳績。Grok 4.1 不僅更聰明,還在處理情感、創意寫作與協作互動上變得更具感知力與連貫性。無論是講求速度的日常問答,還是深度的邏輯分析,Grok 4.1 都能隨時切換。
Grok 模型比較
Grok 家族主要分為 Grok 3、Grok 4 和 Grok 4.1 三個層級,以滿足不同速度與深度需求。Grok 3 主打極致速度,適合快速問答;Grok 4 則強化推理能力;Grok 4.1 在 LMArena 盲測中排名第一,資訊錯誤率顯著降低至 4%,創意寫作能力達到 1696.4 分,情商與同理心也達到 1561 分。Grok 4 Heavy 則提供 Grok 4 Heavy 模型的獨家預覽權限,擁有更高的速率限制,並將記憶體容量翻倍至 25.6 萬 tokens,且享有 Grok3 模型的無限存取權。