Le modèle d'IA de Deepseek est étonnamment bon marché remet en question les normes de l'industrie. La société prétend avoir formé son puissant réseau de neurones Deepseek V3 pour seulement 6 millions de dollars, utilisant seulement 2048 GPU, sous-coignant considérablement les concurrents. Cependant, ce chiffre est trompeur.
Image: esigame.com
Deepseek V3 exploite les technologies innovantes: Prédiction multi-token (MTP) pour une précision et une efficacité améliorées; Mélange d'experts (MOE) , en utilisant 256 réseaux neuronaux, pour accélérer la formation et améliorer les performances; et Attention latente multi-tête (MLA) pour se concentrer sur les éléments de phrase cruciaux, minimisant la perte d'informations.
Image: esigame.com
Contrairement à leur réclamation initiale, la semianalyse a révélé que l'infrastructure réelle de Deepseek implique environ 50 000 GPU Nvidia Hopper, ce qui représente un investissement total d'environ 1,6 milliard de dollars et les coûts opérationnels de 944 millions de dollars. Cet investissement massif, associé à des salaires élevés pour ses chercheurs (dépassant 1,3 million de dollars par an), contredit le faible récit de coût de formation.
Image: esigame.com
La structure unique de Deepseek, en tant que filiale du fonds spéculatif à voler, permet la propriété directe des centres de données et l'autofinancement, favorisant l'agilité et l'innovation rapide. Cela contraste avec les concurrents qui dépendent du cloud computing. Le chiffre de 6 millions de dollars ne reflète que les coûts GPU avant la formation, l'exclusion de la recherche, du raffinement, du traitement des données et des infrastructures. L'investissement total de Deepseek dans le développement de l'IA dépasse 500 millions de dollars.
Image: esigame.com
Alors que le succès de Deepseek présente le potentiel d'une société d'IA indépendante bien financée, la réclamation "Budget révolutionnaire" est une simplification excessive. Leur avantage concurrentiel provient d'investissements substantiels, de percées technologiques et d'une équipe hautement qualifiée. Cependant, même avec ces dépenses importantes, les coûts de Deepseek restent toujours considérablement inférieurs à ceux de ses concurrents, avec des coûts de formation des modèles précédents à 5 millions de dollars (R1) par rapport aux 100 millions de dollars de Chatgpt (ChatGpt4O).
Stardew Valley : Un guide complet sur les enchantements et la forge d'armes
Jan 07,2025
Roblox Les codes UGC Limited dévoilés pour janvier 2025
Jan 06,2025
Blue Archive dévoile l'événement de mars du Cyber Nouvel An
Dec 19,2024
Blood Strike – Tous les codes d’échange fonctionnels janvier 2025
Jan 08,2025
Pokémon TCG Pocket : Erreur de dépannage 102 résolue
Jan 08,2025
Sony Révèle de nouveaux Midnight Accessoires PS5 noirs
Jan 08,2025
Cyber Quest : participez à des batailles de cartes captivantes sur Android
Dec 19,2024
Roblox : Codes RNG Anime Auras (janvier 2025)
Jan 07,2025
Roblox : Codes RIVAUX (janvier 2025)
Jan 07,2025
Le remake de Silent Hill 2 arrive sur Xbox, Switch en 2025
Jan 17,2025
Random fap scene
Occasionnel / 20.10M
Mise à jour: Dec 26,2024
Roblox
Personnalisation / 127.00M
Mise à jour: Oct 21,2021
Corrupting the Universe [v3.0]
Occasionnel / 486.00M
Mise à jour: Dec 17,2024
A Wife And Mother
Permit Deny
Piano White Go! - Piano Games Tiles
Ben 10 A day with Gwen
My School Is A Harem
Liu Shan Maker
BabyBus Play Mod