Удивительно недорогие модели искусственного интеллекта Deepseek побуждают отраслевые нормы отрасли. Компания утверждает, что обучила свою мощную нейронную сеть Deepseek V3 всего за 6 миллионов долларов, используя только 2048 графических процессоров, что значительно подорвало конкурентов. Однако эта цифра вводит в заблуждение.
Изображение: Ensigame.com
DeepSeek V3 использует инновационные технологии: Multi-Token Production (MTP) для повышения точности и эффективности; Смесь экспертов (MOE) , используя 256 нейронных сетей, для ускорения обучения и повышения производительности; и Многополосное скрытое внимание (MLA) , чтобы сосредоточиться на важных элементах предложения, минимизируя потерю информации.
Изображение: Ensigame.com
Вопреки их первоначальному требованию, полуанализа выявил фактическую инфраструктуру Deepseek, связанную с примерно 50 000 графических процессоров Nvidia Hopper, что составляет общие инвестиции в размере около 1,6 млрд. Долл. США, а эксплуатационные расходы - 944 млн. Долл. США. Эта огромная инвестиция в сочетании с высокой заработной платой для исследователей (превышает 1,3 миллиона долларов в год), противоречит повествованию о низких затратах на обучение.
Изображение: Ensigame.com
Уникальная структура Deepseek, как дочерняя компания Хедж-фонда с высоким содержанием флешевых, позволяет прямой владение центрами обработки данных и самофинансирование, способствуя гибкости и быстрым инновациям. Это контрастирует с конкурентами, которые зависят от облачных вычислений. Цифра в 6 миллионов долларов отражает только предварительные затраты на GPU, исключая исследования, уточнение, обработку данных и инфраструктуру. Общая инвестиция DeepSeek в развитие искусственного интеллекта превышает 500 миллионов долларов.
Изображение: Ensigame.com
В то время как успех Deepseek демонстрирует потенциал хорошо финансируемой независимой компании ИИ, утверждение «революционного бюджета» является упрощением. Их конкурентное преимущество связано с существенными инвестициями, технологическими прорывами и высококвалифицированной командой. Тем не менее, даже с этими значительными расходами затраты DeepSeek по -прежнему остаются значительно ниже, чем у его конкурентов, причем предыдущие расходы на обучение на модели составляют 5 миллионов долларов США (R1) по сравнению с CHATGPT на 100 миллионов долларов (CHATGPT4O).
Roblox Forsakencess Screces Lier Lier [Обновлено] (2025)
Mar 17,2025
Roblox Ограниченные коды пользовательского контента представлены в январе 2025 года
Jan 06,2025
Stardew Valley: Полное руководство по зачарованию и ковке оружия
Jan 07,2025
Pokémon TCG Pocket: устранение ошибки 102
Jan 08,2025
Бесплатный пожарный персонажи 2025: Ultimate Guide
Feb 20,2025
Blood Strike — все рабочие коды активации, январь 2025 г.
Jan 08,2025
Blue Archive Представляет мартовское киберновогоднее мероприятие
Dec 19,2024
Roblox: Коды RIVALS (январь 2025 г.)
Jan 07,2025
Cyber Quest: участвуйте в захватывающих карточных битвах на Android
Dec 19,2024
Delta Force: Полное руководство по всем миссиям кампании
Apr 09,2025
A Simple Life with My Unobtrusive Sister
Повседневный / 392.30M
Обновлять: Mar 27,2025
Random fap scene
Повседневный / 20.10M
Обновлять: Dec 26,2024
Corrupting the Universe [v3.0]
Повседневный / 486.00M
Обновлять: Dec 17,2024
Ben 10 A day with Gwen
Oniga Town of the Dead
A Wife And Mother
Cute Reapers in my Room Android
Permit Deny
Utouto Suyasuya
Roblox