DeepSeek-V3 的訓練成本為何遠低於 GPT-4o？

Answer

DeepSeek-V3 訓練成本遠低於 GPT-4o 的原因

DeepSeek-V3 的效能足以與 OpenAI 最先進模型 GPT-4o 相提並論，但其訓練成本僅約 557.6 萬美元，僅使用了約 GPT-4o 二十分之一的算力資源。這家成立僅一年多的 AI 新創公司能以遠低於競爭對手的成本達到相同效能，主要歸功於其獨特的管理與用人哲學。

DeepSeek 的用人哲學

DeepSeek 在招募人才時，首重能力而非經驗。該公司偏好招募應屆畢業生或畢業一到兩年的新人，並認為經驗反而是「扣分項」。DeepSeek 約 140 人的工程師團隊幾乎都是應屆畢業生或博士在讀生，工作經驗超過 3 至 5 年已算最多，超過 8 年者基本不予考慮。此外，DeepSeek 非常看重應徵者在國際知名程式設計競賽中的表現，通常只考慮獲得「金獎」以上的應徵者。

DeepSeek 的管理方式

除了提供優渥的薪資待遇，DeepSeek 創辦人梁文鋒授權、無為的管理方式也是留住人才的關鍵。梁文鋒不「push」員工，也不干預人才發展。他認為每個人都有獨特的成長經歷和想法，不需要強迫。當一個想法展現出潛力時，公司會自上而下地調配資源支持。這種「不干預」哲學讓員工有更大的自由度和創造空間，從而提升了工作效率和創新能力，降低了訓練成本。

觀看原始文章