DeepSeek的廉價AI模型令人驚訝地挑戰了行業規範。該公司聲稱,僅使用2048 GPU,培訓了其強大的DeepSeek V3神經網絡,僅使用2048 GPU,大大削弱了競爭對手。但是,這個數字具有誤導性。
圖像:ensigame.com
DeepSeek V3利用創新技術:多token預測(MTP),以提高準確性和效率; 專家(MOE)的混合物,利用256個神經網絡,加速培訓並提高績效; 多頭的潛在注意力(MLA)專注於關鍵句子元素,從而最大程度地減少信息丟失。
圖像:ensigame.com
與最初的主張相反,半分析顯示,DeepSeek的實際基礎設施涉及大約50,000個NVIDIA HOPPER GPU,總投資約為16億美元,運營成本為9.44億美元。這項巨額投資,加上其研究人員的高薪(每年超過130萬美元),與低培訓成本的敘述相矛盾。
圖像:ensigame.com
DeepSeek的獨特結構是高飛行對衝基金的子公司,允許直接擁有數據中心和自籌資金,促進敏捷性和快速創新。這與依賴雲計算的競爭對手形成鮮明對比。這筆600萬美元的數字僅反映了培訓前的GPU成本,不包括研究,改進,數據處理和基礎架構。 DeepSeek對AI開發的總投資超過了5億美元。
圖像:ensigame.com
雖然DeepSeek的成功展示了一家資金充足的獨立AI公司的潛力,但“革命預算”主張是過分簡化的。他們的競爭優勢源於大量投資,技術突破和高技能的團隊。但是,即使有這些巨大的費用,DeepSeek的成本仍然比其競爭對手的費用要低得多,而先前的模型培訓成本為500萬美元(R1),而Chatgpt的1億美元(ChatGPT4O)。
Stardew Valley:附魔和武器鍛造的完整指南
Jan 07,2025
Roblox 2025 年 1 月公佈的 UGC 限量代碼
Jan 06,2025
Pokémon TCG Pocket:故障排除錯誤 102 已解決
Jan 08,2025
Blood Strike - 所有可用的兌換代碼 2025 年 1 月
Jan 08,2025
Roblox Forsaken字符層列表[更新](2025)
Mar 17,2025
蔚藍檔案 推出網路新年三月活動
Dec 19,2024
Cyber Quest:在 Android 上參與引人入勝的卡牌戰鬥
Dec 19,2024
Roblox:RIVALS 代碼(2025 年 1 月)
Jan 07,2025
巴特·邦特 (Bart Bonte) 在安東尼奧先生玩的地方掉落了一個新謎題“為”一隻貓找東西!
Dec 18,2024
女子FrontLine2:Exilium即將推出
Dec 26,2024
A Simple Life with My Unobtrusive Sister
休閒 / 392.30M
更新日期: Mar 27,2025
Random fap scene
休閒 / 20.10M
更新日期: Dec 26,2024
Corrupting the Universe [v3.0]
休閒 / 486.00M
更新日期: Dec 17,2024
Ben 10 A day with Gwen
A Wife And Mother
Permit Deny
Roblox
Cute Reapers in my Room Android
Oniga Town of the Dead
Utouto Suyasuya