O modelo de IA surpreendentemente barato de Deepseek desafia as normas da indústria. A empresa afirma ter treinado sua poderosa rede neural Deepseek V3 por meros US $ 6 milhões, usando apenas 2048 GPUs, subcotando significativamente os concorrentes. No entanto, esse número é enganoso.
imagem: ensigame.com
A Deepseek V3 aproveita as tecnologias inovadoras: Previsão com vários toques (MTP) para maior precisão e eficiência; Mistura de especialistas (MOE) , utilizando 256 redes neurais, para acelerar o treinamento e melhorar o desempenho; e Atenção latente de várias cabeças (MLA) para se concentrar nos elementos cruciais da frase, minimizando a perda de informações.
imagem: ensigame.com
Ao contrário de sua reivindicação inicial, a semiânica revelou que a infraestrutura real da Deepseek envolve aproximadamente 50.000 GPUs da NVIDIA Hopper, representando um investimento total de aproximadamente US $ 1,6 bilhão e custos operacionais de US $ 944 milhões. Esse investimento maciço, juntamente com altos salários para seus pesquisadores (excedendo US $ 1,3 milhão anualmente), contradiz a narrativa de baixo custo de treinamento.
imagem: ensigame.com
A estrutura única de Deepseek, como subsidiária do fundo de hedge high-flyer, permite a propriedade direta de data centers e o autofinanciamento, promovendo a agilidade e a rápida inovação. Isso contrasta com os concorrentes dependentes da computação em nuvem. O número de US $ 6 milhões reflete apenas os custos de GPU pré-treinamento, excluindo pesquisas, refinamento, processamento de dados e infraestrutura. O investimento total da Deepseek em desenvolvimento de IA ultrapassa US $ 500 milhões.
imagem: ensigame.com
Embora o sucesso da Deepseek mostre o potencial de uma empresa independente de IA bem financiada, a reivindicação de "orçamento revolucionário" é uma simplificação excessiva. Sua vantagem competitiva deriva de investimentos substanciais, avanços tecnológicos e uma equipe altamente qualificada. No entanto, mesmo com essas despesas significativas, os custos da Deepseek ainda permanecem consideravelmente menores do que os de seus concorrentes, com custos anteriores de treinamento de modelos em US $ 5 milhões (R1) em comparação com os US $ 100 milhões da ChatGPT (ChatGPT4O).
Stardew Valley: Um guia completo para encantamentos e forjamento de armas
Jan 07,2025
Roblox Códigos limitados UGC revelados para janeiro de 2025
Jan 06,2025
Blue Archive Revela Evento Cibernético de Marcha de Ano Novo
Dec 19,2024
Blood Strike - Todos os códigos de resgate em funcionamento, janeiro de 2025
Jan 08,2025
Pokémon TCG Pocket: Solução de problemas de erro 102 resolvido
Jan 08,2025
Sony Revela Novos Midnight Acessórios Pretos para PS5
Jan 08,2025
Cyber Quest: participe de batalhas de cartas cativantes no Android
Dec 19,2024
Roblox: Códigos RNG de Anime Auras (janeiro de 2025)
Jan 07,2025
Roblox: Códigos RIVALS (janeiro de 2025)
Jan 07,2025
Silent Hill 2 Remake chegando em Xbox, Switch em 2025
Jan 17,2025
Random fap scene
Casual / 20.10M
Atualizar: Dec 26,2024
Roblox
Personalização / 127.00M
Atualizar: Oct 21,2021
Corrupting the Universe [v3.0]
Casual / 486.00M
Atualizar: Dec 17,2024
A Wife And Mother
Permit Deny
Piano White Go! - Piano Games Tiles
Ben 10 A day with Gwen
My School Is A Harem
Liu Shan Maker
BabyBus Play Mod