El modelo de IA sorprendentemente económico de Deepseek desafía las normas de la industria. La compañía afirma haber capacitado a su poderosa red neuronal Deepseek V3 por solo $ 6 millones, utilizando solo 2048 GPU, significativamente socavando competidores. Sin embargo, esta figura es engañosa.
Imagen: Ensigame.com
Deepseek V3 aprovecha tecnologías innovadoras: Predicción de token múltiple (MTP) para una mayor precisión y eficiencia; Mezcla de expertos (MOE) , utilizando 256 redes neuronales, para acelerar la capacitación y mejorar el rendimiento; y Atención latente de múltiples cabezas (MLA) para centrarse en elementos de oración cruciales, minimizando la pérdida de información.
Imagen: Ensigame.com
Al contrario de su reclamo inicial, el semianálisis reveló que la infraestructura real de Deepseek implica aproximadamente 50,000 GPU de la tolva nvidia, que representa una inversión total de aproximadamente $ 1.6 mil millones y costos operativos de $ 944 millones. Esta inversión masiva, junto con altos salarios para sus investigadores (superiores a $ 1.3 millones anuales), contradice la baja narrativa de costos de capacitación.
Imagen: Ensigame.com
La estructura única de Deepseek, como subsidiaria del fondo de cobertura de alto flyer, permite la propiedad directa de los centros de datos y la autofinanciación, fomentando agilidad e innovación rápida. Esto contrasta con los competidores que dependen de la computación en la nube. La cifra de $ 6 millones solo refleja los costos de GPU previos al entrenamiento, excluyendo la investigación, el refinamiento, el procesamiento de datos e infraestructura. La inversión total de Deepseek en el desarrollo de IA supera los $ 500 millones.
Imagen: Ensigame.com
Si bien el éxito de Deepseek muestra el potencial de una compañía de IA independiente bien financiada, el reclamo de "presupuesto revolucionario" es una simplificación excesiva. Su ventaja competitiva se deriva de una inversión sustancial, avances tecnológicos y un equipo altamente calificado. Sin embargo, incluso con estos gastos significativos, los costos de Deepseek siguen siendo considerablemente más bajos que los de sus competidores, con costos anteriores de capacitación modelo en $ 5 millones (R1) en comparación con los $ 100 millones de ChatGPT (CHATGPT4O).
Lista de nivel de caracteres abandonado de Roblox [Actualizado] (2025)
Mar 17,2025
Roblox Códigos UGC limitados revelados para enero de 2025
Jan 06,2025
Stardew Valley: Una guía completa de encantamientos y forja de armas
Jan 07,2025
Pokémon TCG Pocket: Solución de problemas Error 102 resuelto
Jan 08,2025
Personajes de Free Fire 2025: Ultimate Guide
Feb 20,2025
Blood Strike: todos los códigos de canje que funcionan en enero de 2025
Jan 08,2025
Blue Archive Presenta el evento cibernético de marzo de Año Nuevo
Dec 19,2024
Roblox: Códigos RIVALS (enero 2025)
Jan 07,2025
Cyber Quest: participa en cautivadoras batallas de cartas en Android
Dec 19,2024
Delta Force: una guía completa para todas las misiones de campaña
Apr 09,2025
A Simple Life with My Unobtrusive Sister
Casual / 392.30M
Actualizar: Mar 27,2025
Random fap scene
Casual / 20.10M
Actualizar: Dec 26,2024
Corrupting the Universe [v3.0]
Casual / 486.00M
Actualizar: Dec 17,2024
Ben 10 A day with Gwen
Oniga Town of the Dead
A Wife And Mother
Cute Reapers in my Room Android
Permit Deny
Utouto Suyasuya
Roblox