Il modello AI sorprendentemente economico di Deepseek sfida le norme del settore. La società afferma di aver formato la sua potente rete neurale di DeepSeek V3 per soli $ 6 milioni, utilizzando solo 2048 GPU, concorrenti significativamente sottochinanti. Tuttavia, questa cifra è fuorviante.
Immagine: Ensigame.com
DeepSeek V3 sfrutta le tecnologie innovative: Previsione multi-token (MTP) per una maggiore precisione ed efficienza; Miscela di esperti (MOE) , utilizzando 256 reti neurali, per accelerare la formazione e migliorare le prestazioni; e Attenzione latente multi-testa (MLA) per concentrarsi su elementi di frase cruciale, minimizzando la perdita di informazioni.
Immagine: Ensigame.com
Contrariamente alla loro affermazione iniziale, la semianalisi ha rivelato che l'infrastruttura effettiva di Deepseek coinvolge circa 50.000 GPU di Nvidia Hopper, che rappresentano un investimento totale di circa $ 1,6 miliardi e costi operativi di $ 944 milioni. Questo enorme investimento, unito ad alti salari per i suoi ricercatori (che superano l'anno di $ 1,3 milioni all'anno), contraddice la narrativa sui costi di formazione bassa.
Immagine: Ensigame.com
La struttura unica di Deepseek, come consociata dell'hedge fund ad alto frigo, consente la proprietà diretta dei data center e l'autofinanziamento, promuovendo l'agilità e la rapida innovazione. Ciò contrasta con i concorrenti che dipendono dal cloud computing. La cifra di 6 milioni di dollari riflette solo i costi di pre-allenamento GPU, esclusa la ricerca, la raffinatezza, l'elaborazione dei dati e l'infrastruttura. L'investimento totale di Deepseek nello sviluppo dell'IA supera $ 500 milioni.
Immagine: Ensigame.com
Mentre il successo di Deepseek mostra il potenziale di una società di intelligenza artificiale indipendente ben finanziata, l'affermazione del "bilancio rivoluzionario" è una semplificazione eccessiva. Il loro vantaggio competitivo deriva da investimenti sostanziali, scoperte tecnologiche e una squadra altamente qualificata. Tuttavia, anche con queste spese significative, i costi di DeepSeek rimangono ancora considerevolmente inferiori a quelli dei suoi concorrenti, con i precedenti costi di formazione del modello a $ 5 milioni (R1) rispetto ai $ 100 milioni di CHATGPT (CHATGPT4O).
Stardew Valley: Una guida completa agli incantesimi e alla forgiatura di armi
Jan 07,2025
Roblox Codici limitati UGC svelati per gennaio 2025
Jan 06,2025
Pokémon TCG Pocket: risoluzione dei problemi Errore 102 risolto
Jan 08,2025
Blood Strike - Tutti i codici di riscatto funzionanti gennaio 2025
Jan 08,2025
Roblox Forsaken caratteri Elenco di livello [aggiornato] (2025)
Mar 17,2025
Blue Archive Presenta l'evento di marzo del Capodanno informatico
Dec 19,2024
Cyber Quest: partecipa ad avvincenti battaglie di carte su Android
Dec 19,2024
Roblox: Codici RIVALS (gennaio 2025)
Jan 07,2025
Bart Bonte lancia un nuovo puzzle, signor Antonio, dove giochi a prendere "per" un gatto!
Dec 18,2024
FrontLine 2 femminile: Exilium debutta presto
Dec 26,2024
A Simple Life with My Unobtrusive Sister
Casuale / 392.30M
Aggiornamento: Mar 27,2025
Random fap scene
Casuale / 20.10M
Aggiornamento: Dec 26,2024
Corrupting the Universe [v3.0]
Casuale / 486.00M
Aggiornamento: Dec 17,2024
Ben 10 A day with Gwen
A Wife And Mother
Permit Deny
Arceus X script
Cute Reapers in my Room Android
Oniga Town of the Dead
Utouto Suyasuya