El modelo de IA sorprendentemente económico de Deepseek desafía las normas de la industria. La compañía afirma haber capacitado a su poderosa red neuronal Deepseek V3 por solo $ 6 millones, utilizando solo 2048 GPU, significativamente socavando competidores. Sin embargo, esta figura es engañosa.
Imagen: Ensigame.com
Deepseek V3 aprovecha tecnologías innovadoras: Predicción de token múltiple (MTP) para una mayor precisión y eficiencia; Mezcla de expertos (MOE) , utilizando 256 redes neuronales, para acelerar la capacitación y mejorar el rendimiento; y Atención latente de múltiples cabezas (MLA) para centrarse en elementos de oración cruciales, minimizando la pérdida de información.
Imagen: Ensigame.com
Al contrario de su reclamo inicial, el semianálisis reveló que la infraestructura real de Deepseek implica aproximadamente 50,000 GPU de la tolva nvidia, que representa una inversión total de aproximadamente $ 1.6 mil millones y costos operativos de $ 944 millones. Esta inversión masiva, junto con altos salarios para sus investigadores (superiores a $ 1.3 millones anuales), contradice la baja narrativa de costos de capacitación.
Imagen: Ensigame.com
La estructura única de Deepseek, como subsidiaria del fondo de cobertura de alto flyer, permite la propiedad directa de los centros de datos y la autofinanciación, fomentando agilidad e innovación rápida. Esto contrasta con los competidores que dependen de la computación en la nube. La cifra de $ 6 millones solo refleja los costos de GPU previos al entrenamiento, excluyendo la investigación, el refinamiento, el procesamiento de datos e infraestructura. La inversión total de Deepseek en el desarrollo de IA supera los $ 500 millones.
Imagen: Ensigame.com
Si bien el éxito de Deepseek muestra el potencial de una compañía de IA independiente bien financiada, el reclamo de "presupuesto revolucionario" es una simplificación excesiva. Su ventaja competitiva se deriva de una inversión sustancial, avances tecnológicos y un equipo altamente calificado. Sin embargo, incluso con estos gastos significativos, los costos de Deepseek siguen siendo considerablemente más bajos que los de sus competidores, con costos anteriores de capacitación modelo en $ 5 millones (R1) en comparación con los $ 100 millones de ChatGPT (CHATGPT4O).
Stardew Valley: Una guía completa de encantamientos y forja de armas
Jan 07,2025
Roblox Códigos UGC limitados revelados para enero de 2025
Jan 06,2025
Blue Archive Presenta el evento cibernético de marzo de Año Nuevo
Dec 19,2024
Blood Strike: todos los códigos de canje que funcionan en enero de 2025
Jan 08,2025
Pokémon TCG Pocket: Solución de problemas Error 102 resuelto
Jan 08,2025
Sony Revela nuevos Midnight accesorios negros para PS5
Jan 08,2025
Cyber Quest: participa en cautivadoras batallas de cartas en Android
Dec 19,2024
Roblox: Códigos RNG de Auras de Anime (enero de 2025)
Jan 07,2025
Roblox: Códigos RIVALS (enero 2025)
Jan 07,2025
El remake de Silent Hill 2 llegará a Xbox y Switch en 2025
Jan 17,2025
Random fap scene
Casual / 20.10M
Actualizar: Dec 26,2024
Roblox
Personalización / 127.00M
Actualizar: Oct 21,2021
Corrupting the Universe [v3.0]
Casual / 486.00M
Actualizar: Dec 17,2024
A Wife And Mother
Permit Deny
Piano White Go! - Piano Games Tiles
Ben 10 A day with Gwen
My School Is A Harem
Liu Shan Maker
BabyBus Play Mod