首頁 > 新聞 > AI先驅的DeepSeek揭幕：揭開了真正的開發成本

AI先驅的DeepSeek揭幕：揭開了真正的開發成本

作者：Kristen 更新日期：Feb 23,2025

DeepSeek的廉價AI模型令人驚訝地挑戰了行業規範。該公司聲稱，僅使用2048 GPU，培訓了其強大的DeepSeek V3神經網絡，僅使用2048 GPU，大大削弱了競爭對手。但是，這個數字具有誤導性。

DeepSeek Test 圖像：ensigame.com

DeepSeek V3利用創新技術：多token預測（MTP)，以提高準確性和效率； 專家（MOE)的混合物，利用256個神經網絡，加速培訓並提高績效； 多頭的潛在注意力（MLA)專注於關鍵句子元素，從而最大程度地減少信息丟失。

DeepSeek V3 圖像：ensigame.com

與最初的主張相反，半分析顯示，DeepSeek的實際基礎設施涉及大約50,000個NVIDIA HOPPER GPU，總投資約為16億美元，運營成本為9.44億美元。這項巨額投資，加上其研究人員的高薪（每年超過130萬美元)，與低培訓成本的敘述相矛盾。

DeepSeek 圖像：ensigame.com

DeepSeek的獨特結構是高飛行對衝基金的子公司，允許直接擁有數據中心和自籌資金，促進敏捷性和快速創新。這與依賴雲計算的競爭對手形成鮮明對比。這筆600萬美元的數字僅反映了培訓前的GPU成本，不包括研究，改進，數據處理和基礎架構。 DeepSeek對AI開發的總投資超過了5億美元。

DeepSeek 圖像：ensigame.com

雖然DeepSeek的成功展示了一家資金充足的獨立AI公司的潛力，但“革命預算”主張是過分簡化的。他們的競爭優勢源於大量投資，技術突破和高技能的團隊。但是，即使有這些巨大的費用，DeepSeek的成本仍然比其競爭對手的費用要低得多，而先前的模型培訓成本為500萬美元（R1)，而Chatgpt的1億美元（ChatGPT4O)。

上一篇文章>

Switch 2 傳聞稱明年將迎來“Switch 2 之夏”

下一篇>

格蕾絲·艾希克羅夫特主演《惡靈古堡：安魂曲》的浣熊市回歸