El modelo de IA sorprendentemente económico de Deepseek desafía las normas de la industria. La compañía afirma haber capacitado a su poderosa red neuronal Deepseek V3 por solo $ 6 millones, utilizando solo 2048 GPU, significativamente socavando competidores. Sin embargo, esta figura es engañosa.
Imagen: Ensigame.com
Deepseek V3 aprovecha tecnologías innovadoras: Predicción de token múltiple (MTP) para una mayor precisión y eficiencia; Mezcla de expertos (MOE) , utilizando 256 redes neuronales, para acelerar la capacitación y mejorar el rendimiento; y Atención latente de múltiples cabezas (MLA) para centrarse en elementos de oración cruciales, minimizando la pérdida de información.
Imagen: Ensigame.com
Al contrario de su reclamo inicial, el semianálisis reveló que la infraestructura real de Deepseek implica aproximadamente 50,000 GPU de la tolva nvidia, que representa una inversión total de aproximadamente $ 1.6 mil millones y costos operativos de $ 944 millones. Esta inversión masiva, junto con altos salarios para sus investigadores (superiores a $ 1.3 millones anuales), contradice la baja narrativa de costos de capacitación.
Imagen: Ensigame.com
La estructura única de Deepseek, como subsidiaria del fondo de cobertura de alto flyer, permite la propiedad directa de los centros de datos y la autofinanciación, fomentando agilidad e innovación rápida. Esto contrasta con los competidores que dependen de la computación en la nube. La cifra de $ 6 millones solo refleja los costos de GPU previos al entrenamiento, excluyendo la investigación, el refinamiento, el procesamiento de datos e infraestructura. La inversión total de Deepseek en el desarrollo de IA supera los $ 500 millones.
Imagen: Ensigame.com
Si bien el éxito de Deepseek muestra el potencial de una compañía de IA independiente bien financiada, el reclamo de "presupuesto revolucionario" es una simplificación excesiva. Su ventaja competitiva se deriva de una inversión sustancial, avances tecnológicos y un equipo altamente calificado. Sin embargo, incluso con estos gastos significativos, los costos de Deepseek siguen siendo considerablemente más bajos que los de sus competidores, con costos anteriores de capacitación modelo en $ 5 millones (R1) en comparación con los $ 100 millones de ChatGPT (CHATGPT4O).
Stardew Valley: Una guía completa de encantamientos y forja de armas
Jan 07,2025
Roblox Códigos UGC limitados revelados para enero de 2025
Jan 06,2025
Pokémon TCG Pocket: Solución de problemas Error 102 resuelto
Jan 08,2025
Blood Strike: todos los códigos de canje que funcionan en enero de 2025
Jan 08,2025
Lista de nivel de caracteres abandonado de Roblox [Actualizado] (2025)
Mar 17,2025
Blue Archive Presenta el evento cibernético de marzo de Año Nuevo
Dec 19,2024
Cyber Quest: participa en cautivadoras batallas de cartas en Android
Dec 19,2024
Roblox: Códigos RIVALS (enero 2025)
Jan 07,2025
¡Bart Bonte lanza un nuevo rompecabezas, Mister Antonio, donde juegas a buscar un gato!
Dec 18,2024
Chicas FrontLine 2: Exilium debuta pronto
Dec 26,2024
A Simple Life with My Unobtrusive Sister
Casual / 392.30M
Actualizar: Mar 27,2025
Random fap scene
Casual / 20.10M
Actualizar: Dec 26,2024
Corrupting the Universe [v3.0]
Casual / 486.00M
Actualizar: Dec 17,2024
Ben 10 A day with Gwen
A Wife And Mother
Permit Deny
Roblox
Cute Reapers in my Room Android
Oniga Town of the Dead
Utouto Suyasuya