Hogar > Noticias > Deepseek de AI Pioneer presentado: revelando los verdaderos costos de desarrollo

Deepseek de AI Pioneer presentado: revelando los verdaderos costos de desarrollo

Autor:Kristen Actualizar:Feb 23,2025

El modelo de IA sorprendentemente económico de Deepseek desafía las normas de la industria. La compañía afirma haber capacitado a su poderosa red neuronal Deepseek V3 por solo $ 6 millones, utilizando solo 2048 GPU, significativamente socavando competidores. Sin embargo, esta figura es engañosa.

DeepSeek TestImagen: Ensigame.com

Deepseek V3 aprovecha tecnologías innovadoras: Predicción de token múltiple (MTP) para una mayor precisión y eficiencia; Mezcla de expertos (MOE) , utilizando 256 redes neuronales, para acelerar la capacitación y mejorar el rendimiento; y Atención latente de múltiples cabezas (MLA) para centrarse en elementos de oración cruciales, minimizando la pérdida de información.

DeepSeek V3Imagen: Ensigame.com

Al contrario de su reclamo inicial, el semianálisis reveló que la infraestructura real de Deepseek implica aproximadamente 50,000 GPU de la tolva nvidia, que representa una inversión total de aproximadamente $ 1.6 mil millones y costos operativos de $ 944 millones. Esta inversión masiva, junto con altos salarios para sus investigadores (superiores a $ 1.3 millones anuales), contradice la baja narrativa de costos de capacitación.

DeepSeekImagen: Ensigame.com

La estructura única de Deepseek, como subsidiaria del fondo de cobertura de alto flyer, permite la propiedad directa de los centros de datos y la autofinanciación, fomentando agilidad e innovación rápida. Esto contrasta con los competidores que dependen de la computación en la nube. La cifra de $ 6 millones solo refleja los costos de GPU previos al entrenamiento, excluyendo la investigación, el refinamiento, el procesamiento de datos e infraestructura. La inversión total de Deepseek en el desarrollo de IA supera los $ 500 millones.

DeepSeekImagen: Ensigame.com

Si bien el éxito de Deepseek muestra el potencial de una compañía de IA independiente bien financiada, el reclamo de "presupuesto revolucionario" es una simplificación excesiva. Su ventaja competitiva se deriva de una inversión sustancial, avances tecnológicos y un equipo altamente calificado. Sin embargo, incluso con estos gastos significativos, los costos de Deepseek siguen siendo considerablemente más bajos que los de sus competidores, con costos anteriores de capacitación modelo en $ 5 millones (R1) en comparación con los $ 100 millones de ChatGPT (CHATGPT4O).