Lar > Notícias > Deepseek, do Ai Pioneer, revelou: revelando verdadeiros custos de desenvolvimento

Deepseek, do Ai Pioneer, revelou: revelando verdadeiros custos de desenvolvimento

Autor:Kristen Atualizar:Feb 23,2025

O modelo de IA surpreendentemente barato de Deepseek desafia as normas da indústria. A empresa afirma ter treinado sua poderosa rede neural Deepseek V3 por meros US $ 6 milhões, usando apenas 2048 GPUs, subcotando significativamente os concorrentes. No entanto, esse número é enganoso.

DeepSeek Testimagem: ensigame.com

A Deepseek V3 aproveita as tecnologias inovadoras: Previsão com vários toques (MTP) para maior precisão e eficiência; Mistura de especialistas (MOE) , utilizando 256 redes neurais, para acelerar o treinamento e melhorar o desempenho; e Atenção latente de várias cabeças (MLA) para se concentrar nos elementos cruciais da frase, minimizando a perda de informações.

DeepSeek V3imagem: ensigame.com

Ao contrário de sua reivindicação inicial, a semiânica revelou que a infraestrutura real da Deepseek envolve aproximadamente 50.000 GPUs da NVIDIA Hopper, representando um investimento total de aproximadamente US $ 1,6 bilhão e custos operacionais de US $ 944 milhões. Esse investimento maciço, juntamente com altos salários para seus pesquisadores (excedendo US $ 1,3 milhão anualmente), contradiz a narrativa de baixo custo de treinamento.

DeepSeekimagem: ensigame.com

A estrutura única de Deepseek, como subsidiária do fundo de hedge high-flyer, permite a propriedade direta de data centers e o autofinanciamento, promovendo a agilidade e a rápida inovação. Isso contrasta com os concorrentes dependentes da computação em nuvem. O número de US $ 6 milhões reflete apenas os custos de GPU pré-treinamento, excluindo pesquisas, refinamento, processamento de dados e infraestrutura. O investimento total da Deepseek em desenvolvimento de IA ultrapassa US $ 500 milhões.

DeepSeekimagem: ensigame.com

Embora o sucesso da Deepseek mostre o potencial de uma empresa independente de IA bem financiada, a reivindicação de "orçamento revolucionário" é uma simplificação excessiva. Sua vantagem competitiva deriva de investimentos substanciais, avanços tecnológicos e uma equipe altamente qualificada. No entanto, mesmo com essas despesas significativas, os custos da Deepseek ainda permanecem consideravelmente menores do que os de seus concorrentes, com custos anteriores de treinamento de modelos em US $ 5 milhões (R1) em comparação com os US $ 100 milhões da ChatGPT (ChatGPT4O).