Rumah > Berita > Deepseek Ai Pioneer Dilancarkan: Mengembangkan Kos Pembangunan Benar

Deepseek Ai Pioneer Dilancarkan: Mengembangkan Kos Pembangunan Benar

Pengarang：Kristen Kemas kini：Feb 23,2025

Deepseek yang mengejutkan model AI yang murah mencabar norma industri. Syarikat itu mendakwa telah melatih rangkaian saraf Deepseek V3 yang kuat untuk hanya $ 6 juta, dengan hanya menggunakan 2048 GPU, pesaing pemotongan yang ketara. Walau bagaimanapun, angka ini mengelirukan.

DeepSeek Test imej: ensigame.com

DeepSeek V3 memanfaatkan teknologi inovatif: Ramalan Multi-Token (MTP) Untuk ketepatan dan kecekapan yang dipertingkatkan; Campuran Pakar (MOE) , menggunakan 256 rangkaian saraf, untuk mempercepat latihan dan meningkatkan prestasi; dan Perhatian Laten Multi-Head (MLA) Untuk memberi tumpuan kepada elemen kalimat penting, meminimumkan kehilangan maklumat.

DeepSeek V3 imej: ensigame.com

Bertentangan dengan tuntutan awal mereka, semianalisis mendedahkan infrastruktur sebenar DeepSeek melibatkan kira -kira 50,000 GPU NVIDIA Hopper, yang mewakili jumlah pelaburan kira -kira $ 1.6 bilion dan kos operasi sebanyak $ 944 juta. Pelaburan besar -besaran ini, ditambah dengan gaji yang tinggi untuk penyelidiknya (melebihi $ 1.3 juta setahun), bercanggah dengan naratif kos latihan yang rendah.

DeepSeek imej: ensigame.com

Struktur unik DeepSeek, sebagai anak syarikat dana lindung nilai tinggi, membolehkan pemilikan langsung pusat data dan pembiayaan diri, memupuk ketangkasan dan inovasi pesat. Ini berbeza dengan pesaing yang bergantung kepada pengkomputeran awan. Angka $ 6 juta hanya mencerminkan kos GPU pra-latihan, tidak termasuk penyelidikan, penghalusan, pemprosesan data, dan infrastruktur. Jumlah pelaburan DeepSeek dalam pembangunan AI melebihi $ 500 juta.

DeepSeek imej: ensigame.com

Walaupun kejayaan DeepSeek mempamerkan potensi syarikat AI bebas yang dibiayai dengan baik, tuntutan "bajet revolusioner" adalah oversimplification. Kelebihan daya saing mereka berpunca daripada pelaburan yang besar, kejayaan teknologi, dan pasukan yang sangat mahir. Walau bagaimanapun, walaupun dengan perbelanjaan yang signifikan, kos DeepSeek masih jauh lebih rendah daripada pesaingnya, dengan kos latihan model terdahulu pada $ 5 juta (R1) berbanding dengan $ 100 juta (chatgpt4o) ChatGPT.