DeepSeek-V3 的訓練成本為何遠低於 GPT-4o?
Answer
DeepSeek-V3 訓練成本遠低於 GPT-4o 的原因
DeepSeek-V3 的效能足以與 OpenAI 最先進模型 GPT-4o 相提並論,但其訓練成本僅約 557.6 萬美元,僅使用了約 GPT-4o 二十分之一的算力資源。這家成立僅一年多的 AI 新創公司能以遠低於競爭對手的成本達到相同效能,主要歸功於其獨特的管理與用人哲學。
DeepSeek 的用人哲學
DeepSeek 在招募人才時,首重能力而非經驗。該公司偏好招募應屆畢業生或畢業一到兩年的新人,並認為經驗反而是「扣分項」。DeepSeek 約 140 人的工程師團隊幾乎都是應屆畢業生或博士在讀生,工作經驗超過 3 至 5 年已算最多,超過 8 年者基本不予考慮。此外,DeepSeek 非常看重應徵者在國際知名程式設計競賽中的表現,通常只考慮獲得「金獎」以上的應徵者。
DeepSeek 的管理方式
除了提供優渥的薪資待遇,DeepSeek 創辦人梁文鋒授權、無為的管理方式也是留住人才的關鍵。梁文鋒不「push」員工,也不干預人才發展。他認為每個人都有獨特的成長經歷和想法,不需要強迫。當一個想法展現出潛力時,公司會自上而下地調配資源支持。這種「不干預」哲學讓員工有更大的自由度和創造空間,從而提升了工作效率和創新能力,降低了訓練成本。