首頁 > 新聞 > AI先驅的DeepSeek揭幕:揭開了真正的開發成本

AI先驅的DeepSeek揭幕:揭開了真正的開發成本

作者:Kristen 更新日期:Feb 23,2025

DeepSeek的廉價AI模型令人驚訝地挑戰了行業規範。該公司聲稱,僅使用2048 GPU,培訓了其強大的DeepSeek V3神經網絡,僅使用2048 GPU,大大削弱了競爭對手。但是,這個數字具有誤導性。

DeepSeek Test圖像:ensigame.com

DeepSeek V3利用創新技術:多token預測(MTP),以提高準確性和效率; 專家(MOE)的混合物,利用256個神經網絡,加速培訓並提高績效; 多頭的潛在注意力(MLA)專注於關鍵句子元素,從而最大程度地減少信息丟失。

DeepSeek V3圖像:ensigame.com

與最初的主張相反,半分析顯示,DeepSeek的實際基礎設施涉及大約50,000個NVIDIA HOPPER GPU,總投資約為16億美元,運營成本為9.44億美元。這項巨額投資,加上其研究人員的高薪(每年超過130萬美元),與低培訓成本的敘述相矛盾。

DeepSeek圖像:ensigame.com

DeepSeek的獨特結構是高飛行對衝基金的子公司,允許直接擁有數據中心和自籌資金,促進敏捷性和快速創新。這與依賴雲計算的競爭對手形成鮮明對比。這筆600萬美元的數字僅反映了培訓前的GPU成本,不包括研究,改進,數據處理和基礎架構。 DeepSeek對AI開發的總投資超過了5億美元。

DeepSeek圖像:ensigame.com

雖然DeepSeek的成功展示了一家資金充足的獨立AI公司的潛力,但“革命預算”主張是過分簡化的。他們的競爭優勢源於大量投資,技術突破和高技能的團隊。但是,即使有這些巨大的費用,DeepSeek的成本仍然比其競爭對手的費用要低得多,而先前的模型培訓成本為500萬美元(R1),而Chatgpt的1億美元(ChatGPT4O)。