Deepseekの驚くほど安価なAIモデルは、業界の規範に挑戦しています。同社は、強力なDeepseek V3 Neural Networkをわずか600万ドルで訓練し、2048 GPUのみを使用して競合他社を大幅に下げていると主張しています。しかし、この数字は誤解を招くものです。
画像:Ensigame.com
Deepseek V3は革新的なテクノロジーを活用しています:マルチトークン予測(MTP)精度と効率を向上させるため。 256のニューラルネットワークを利用して、トレーニングを加速し、パフォーマンスを向上させるために、256のニューラルネットワークを利用している専門家(MOE)の混合。 マルチヘッドの潜在的な注意(MLA)**重要な文要素に焦点を当て、情報の損失を最小限に抑えます。
画像:Ensigame.com
彼らの最初の主張とは反対に、Semianalysisは、Deepseekの実際のインフラストラクチャには約50,000のNvidia Hopper GPUが関与しており、約16億ドルの総投資と9億4,400万ドルの運用コストを表していることが明らかになりました。この大規模な投資は、研究者の高い給与と相まって(年間130万ドルを超える)、低いトレーニングコストの物語と矛盾しています。
画像:Ensigame.com
Deepseekのユニークな構造は、ハイフライヤーヘッジファンドの子会社として、データセンターと自己資金の直接的な所有権を可能にし、敏ility性と迅速な革新を促進します。これは、クラウドコンピューティングに依存する競合他社とは対照的です。 600万ドルの数値は、研究、洗練、データ処理、インフラストラクチャを除く、トレーニング前のGPUコストのみを反映しています。 DeepseekのAI開発への総投資は5億ドルを超えています。
画像:Ensigame.com
Deepseekの成功は、資金提供された独立したAI企業の可能性を示していますが、「革新的な予算」請求は単純化しすぎです。彼らの競争力は、実質的な投資、技術的なブレークスルー、高度なスキルのあるチームに由来しています。ただし、これらのかなりの費用があっても、DeepSeekのコストは依然として競合他社の費用よりもかなり低いままであり、ChatGPTの1億ドル(ChatGPT4O)と比較して、以前のモデルトレーニングコストは500万ドル(R1)です。
Stardew Valley: エンチャントと武器の鍛造の完全ガイド
Jan 07,2025
Roblox 2025 年 1 月の UGC 限定コードが公開
Jan 06,2025
Blue Archive サイバーニューイヤー 3 月イベントを発表
Dec 19,2024
Blood Strike - すべての有効な引き換えコード 2025 年 1 月
Jan 08,2025
Pokémon TCG Pocket: トラブルシューティング エラー 102 が解決されました
Jan 08,2025
Sony 新しい Midnight ブラック PS5 アクセサリを公開
Jan 08,2025
サイバー クエスト: Android で魅力的なカード バトルに参加
Dec 19,2024
Roblox: アニメ オーラ RNG コード (2025 年 1 月)
Jan 07,2025
Roblox: RIVALS コード (2025 年 1 月)
Jan 07,2025
サイレントヒル 2 リメイクが Xbox、2025 年に Switch に登場
Jan 17,2025
Random fap scene
カジュアル / 20.10M
アップデート: Dec 26,2024
Roblox
パーソナライゼーション / 127.00M
アップデート: Oct 21,2021
Corrupting the Universe [v3.0]
カジュアル / 486.00M
アップデート: Dec 17,2024
A Wife And Mother
Permit Deny
Piano White Go! - Piano Games Tiles
Ben 10 A day with Gwen
My School Is A Harem
Liu Shan Maker
BabyBus Play Mod