DeepSeek的R1模型有哪些優勢,讓OpenAI願意學習?
Answer
DeepSeek R1 模型的優勢,促使 OpenAI 學習的原因
DeepSeek R1 模型之所以引起 OpenAI 的關注並願意學習,主要歸功於其在推理模型上的創新策略與成本效益。儘管 OpenAI 推出了新的推理模型 o3-mini,並首次向所有用戶免費提供,但其 API 定價仍然高於 DeepSeek-R1。OpenAI 執行長奧特曼也坦承,OpenAI 在公開推理模型的思考過程方面有所不足,並表示要學習 DeepSeek 的做法,這顯示 DeepSeek 在技術透明度上具有領先優勢。
DeepSeek 的開源策略與人才投資
OpenAI 重新思考其閉源策略,部分原因在於 DeepSeek 在開源方面的積極態度。奧特曼承認,OpenAI 的閉源策略可能使其站在了「歷史錯誤的一邊」,並透露 OpenAI 正在討論發布一些模型權重等。此外,DeepSeek 在人才招募上的策略也值得關注。他們不拘泥於傳統資歷,更看重能力與好奇心,並積極在北京大學和浙江大學等頂尖大學舉辦徵才活動,顯示其在吸引頂尖人才方面的投入。
DeepSeek 的硬體與資金投入
半導體研究公司 SemiAnalysis 的報告揭示了 DeepSeek 成功的關鍵因素,包括其龐大的 GPU 投資。據推測,DeepSeek 擁有至少 5 萬塊 Hopper 架構的 GPU,總伺服器資本支出約 16 億美元,營運成本也相當驚人。儘管 DeepSeek 聲稱預訓練成本僅為 600 萬美元,但報告指出這僅僅是 GPU 成本的一部分,並未包含硬體研發和總體擁有成本等重要部分。這顯示 DeepSeek 在硬體資源上的投入,是其模型優勢的重要支撐。