Il modello AI sorprendentemente economico di Deepseek sfida le norme del settore. La società afferma di aver formato la sua potente rete neurale di DeepSeek V3 per soli $ 6 milioni, utilizzando solo 2048 GPU, concorrenti significativamente sottochinanti. Tuttavia, questa cifra è fuorviante.
Immagine: Ensigame.com
DeepSeek V3 sfrutta le tecnologie innovative: Previsione multi-token (MTP) per una maggiore precisione ed efficienza; Miscela di esperti (MOE) , utilizzando 256 reti neurali, per accelerare la formazione e migliorare le prestazioni; e Attenzione latente multi-testa (MLA) per concentrarsi su elementi di frase cruciale, minimizzando la perdita di informazioni.
Immagine: Ensigame.com
Contrariamente alla loro affermazione iniziale, la semianalisi ha rivelato che l'infrastruttura effettiva di Deepseek coinvolge circa 50.000 GPU di Nvidia Hopper, che rappresentano un investimento totale di circa $ 1,6 miliardi e costi operativi di $ 944 milioni. Questo enorme investimento, unito ad alti salari per i suoi ricercatori (che superano l'anno di $ 1,3 milioni all'anno), contraddice la narrativa sui costi di formazione bassa.
Immagine: Ensigame.com
La struttura unica di Deepseek, come consociata dell'hedge fund ad alto frigo, consente la proprietà diretta dei data center e l'autofinanziamento, promuovendo l'agilità e la rapida innovazione. Ciò contrasta con i concorrenti che dipendono dal cloud computing. La cifra di 6 milioni di dollari riflette solo i costi di pre-allenamento GPU, esclusa la ricerca, la raffinatezza, l'elaborazione dei dati e l'infrastruttura. L'investimento totale di Deepseek nello sviluppo dell'IA supera $ 500 milioni.
Immagine: Ensigame.com
Mentre il successo di Deepseek mostra il potenziale di una società di intelligenza artificiale indipendente ben finanziata, l'affermazione del "bilancio rivoluzionario" è una semplificazione eccessiva. Il loro vantaggio competitivo deriva da investimenti sostanziali, scoperte tecnologiche e una squadra altamente qualificata. Tuttavia, anche con queste spese significative, i costi di DeepSeek rimangono ancora considerevolmente inferiori a quelli dei suoi concorrenti, con i precedenti costi di formazione del modello a $ 5 milioni (R1) rispetto ai $ 100 milioni di CHATGPT (CHATGPT4O).
Stardew Valley: Una guida completa agli incantesimi e alla forgiatura di armi
Jan 07,2025
Roblox Codici limitati UGC svelati per gennaio 2025
Jan 06,2025
Blue Archive Presenta l'evento di marzo del Capodanno informatico
Dec 19,2024
Blood Strike - Tutti i codici di riscatto funzionanti gennaio 2025
Jan 08,2025
Pokémon TCG Pocket: risoluzione dei problemi Errore 102 risolto
Jan 08,2025
Sony Rivelati nuovi Midnight accessori neri per PS5
Jan 08,2025
Cyber Quest: partecipa ad avvincenti battaglie di carte su Android
Dec 19,2024
Roblox: Codici RNG Anime Auras (gennaio 2025)
Jan 07,2025
Roblox: Codici RIVALS (gennaio 2025)
Jan 07,2025
Silent Hill 2 Remake in arrivo su Xbox, Switch nel 2025
Jan 17,2025
Random fap scene
Casuale / 20.10M
Aggiornamento: Dec 26,2024
Arceus X script
Personalizzazione / 127.00M
Aggiornamento: Oct 21,2021
Corrupting the Universe [v3.0]
Casuale / 486.00M
Aggiornamento: Dec 17,2024
A Wife And Mother
Permit Deny
Piano White Go! - Piano Games Tiles
Ben 10 A day with Gwen
My School Is A Harem
Liu Shan Maker
BabyBus Play Mod