Удивительно недорогие модели искусственного интеллекта Deepseek побуждают отраслевые нормы отрасли. Компания утверждает, что обучила свою мощную нейронную сеть Deepseek V3 всего за 6 миллионов долларов, используя только 2048 графических процессоров, что значительно подорвало конкурентов. Однако эта цифра вводит в заблуждение.
Изображение: Ensigame.com
DeepSeek V3 использует инновационные технологии: Multi-Token Production (MTP) для повышения точности и эффективности; Смесь экспертов (MOE) , используя 256 нейронных сетей, для ускорения обучения и повышения производительности; и Многополосное скрытое внимание (MLA) , чтобы сосредоточиться на важных элементах предложения, минимизируя потерю информации.
Изображение: Ensigame.com
Вопреки их первоначальному требованию, полуанализа выявил фактическую инфраструктуру Deepseek, связанную с примерно 50 000 графических процессоров Nvidia Hopper, что составляет общие инвестиции в размере около 1,6 млрд. Долл. США, а эксплуатационные расходы - 944 млн. Долл. США. Эта огромная инвестиция в сочетании с высокой заработной платой для исследователей (превышает 1,3 миллиона долларов в год), противоречит повествованию о низких затратах на обучение.
Изображение: Ensigame.com
Уникальная структура Deepseek, как дочерняя компания Хедж-фонда с высоким содержанием флешевых, позволяет прямой владение центрами обработки данных и самофинансирование, способствуя гибкости и быстрым инновациям. Это контрастирует с конкурентами, которые зависят от облачных вычислений. Цифра в 6 миллионов долларов отражает только предварительные затраты на GPU, исключая исследования, уточнение, обработку данных и инфраструктуру. Общая инвестиция DeepSeek в развитие искусственного интеллекта превышает 500 миллионов долларов.
Изображение: Ensigame.com
В то время как успех Deepseek демонстрирует потенциал хорошо финансируемой независимой компании ИИ, утверждение «революционного бюджета» является упрощением. Их конкурентное преимущество связано с существенными инвестициями, технологическими прорывами и высококвалифицированной командой. Тем не менее, даже с этими значительными расходами затраты DeepSeek по -прежнему остаются значительно ниже, чем у его конкурентов, причем предыдущие расходы на обучение на модели составляют 5 миллионов долларов США (R1) по сравнению с CHATGPT на 100 миллионов долларов (CHATGPT4O).
Stardew Valley: Полное руководство по зачарованию и ковке оружия
Jan 07,2025
Roblox Ограниченные коды пользовательского контента представлены в январе 2025 года
Jan 06,2025
Blue Archive Представляет мартовское киберновогоднее мероприятие
Dec 19,2024
Blood Strike — все рабочие коды активации, январь 2025 г.
Jan 08,2025
Pokémon TCG Pocket: устранение ошибки 102
Jan 08,2025
Sony Представляет новые Midnight черные аксессуары для PS5
Jan 08,2025
Cyber Quest: участвуйте в захватывающих карточных битвах на Android
Dec 19,2024
Roblox: ГСЧ-коды аниме-аур (январь 2025 г.)
Jan 07,2025
Roblox: Коды RIVALS (январь 2025 г.)
Jan 07,2025
Ремейк Silent Hill 2 выйдет на Xbox, Switch в 2025 году
Jan 17,2025
Random fap scene
Повседневный / 20.10M
Обновлять: Dec 26,2024
Roblox
Персонализация / 127.00M
Обновлять: Oct 21,2021
Corrupting the Universe [v3.0]
Повседневный / 486.00M
Обновлять: Dec 17,2024
A Wife And Mother
Permit Deny
Piano White Go! - Piano Games Tiles
Ben 10 A day with Gwen
My School Is A Harem
Liu Shan Maker
BabyBus Play Mod