DeepSeek的廉價AI模型令人驚訝地挑戰了行業規範。該公司聲稱,僅使用2048 GPU,培訓了其強大的DeepSeek V3神經網絡,僅使用2048 GPU,大大削弱了競爭對手。但是,這個數字具有誤導性。
圖像:ensigame.com
DeepSeek V3利用創新技術:多token預測(MTP),以提高準確性和效率; 專家(MOE)的混合物,利用256個神經網絡,加速培訓並提高績效; 多頭的潛在注意力(MLA)專注於關鍵句子元素,從而最大程度地減少信息丟失。
圖像:ensigame.com
與最初的主張相反,半分析顯示,DeepSeek的實際基礎設施涉及大約50,000個NVIDIA HOPPER GPU,總投資約為16億美元,運營成本為9.44億美元。這項巨額投資,加上其研究人員的高薪(每年超過130萬美元),與低培訓成本的敘述相矛盾。
圖像:ensigame.com
DeepSeek的獨特結構是高飛行對衝基金的子公司,允許直接擁有數據中心和自籌資金,促進敏捷性和快速創新。這與依賴雲計算的競爭對手形成鮮明對比。這筆600萬美元的數字僅反映了培訓前的GPU成本,不包括研究,改進,數據處理和基礎架構。 DeepSeek對AI開發的總投資超過了5億美元。
圖像:ensigame.com
雖然DeepSeek的成功展示了一家資金充足的獨立AI公司的潛力,但“革命預算”主張是過分簡化的。他們的競爭優勢源於大量投資,技術突破和高技能的團隊。但是,即使有這些巨大的費用,DeepSeek的成本仍然比其競爭對手的費用要低得多,而先前的模型培訓成本為500萬美元(R1),而Chatgpt的1億美元(ChatGPT4O)。
Stardew Valley:附魔和武器鍛造的完整指南
Jan 07,2025
Roblox 2025 年 1 月公佈的 UGC 限量代碼
Jan 06,2025
蔚藍檔案 推出網路新年三月活動
Dec 19,2024
Blood Strike - 所有可用的兌換代碼 2025 年 1 月
Jan 08,2025
Pokémon TCG Pocket:故障排除錯誤 102 已解決
Jan 08,2025
Sony 推出全新 Midnight 黑色 PS5 配件
Jan 08,2025
Roblox:動漫 Auras RNG 代碼(2025 年 1 月)
Jan 07,2025
Cyber Quest:在 Android 上參與引人入勝的卡牌戰鬥
Dec 19,2024
《寂靜嶺 2 重製版》即將登陸 Xbox,將於 2025 年切換
Jan 17,2025
Roblox:RIVALS 代碼(2025 年 1 月)
Jan 07,2025
Random fap scene
休閒 / 20.10M
更新日期: Dec 26,2024
Roblox
個人化 / 127.00M
更新日期: Oct 21,2021
Corrupting the Universe [v3.0]
休閒 / 486.00M
更新日期: Dec 17,2024
A Wife And Mother
Permit Deny
Piano White Go! - Piano Games Tiles
Ben 10 A day with Gwen
My School Is A Harem
Liu Shan Maker
BabyBus Play Mod