Trang chủ > Tin tức > AI Pioneer's Deepseek đã tiết lộ: Hiển thị chi phí phát triển thực sự

AI Pioneer's Deepseek đã tiết lộ: Hiển thị chi phí phát triển thực sự

Tác giả:Kristen Cập nhật:Feb 23,2025

Mô hình AI rẻ tiền đáng ngạc nhiên của Deepseek thách thức các chuẩn mực ngành. Công ty tuyên bố đã đào tạo mạng lưới thần kinh Deepseek V3 mạnh mẽ của mình chỉ với 6 triệu đô la, chỉ sử dụng GPU 2048, làm giảm đáng kể các đối thủ cạnh tranh. Tuy nhiên, con số này là sai lệch.

DeepSeek TestHình ảnh: Obligame.com

DeepSeek V3 tận dụng các công nghệ sáng tạo: Dự đoán đa điểm (MTP) để nâng cao độ chính xác và hiệu quả; Hỗn hợp các chuyên gia (MOE) , sử dụng 256 mạng lưới thần kinh, để tăng tốc đào tạo và cải thiện hiệu suất; và sự chú ý tiềm ẩn đa đầu (MLA) để tập trung vào các yếu tố câu quan trọng, giảm thiểu mất thông tin.

DeepSeek V3Hình ảnh: Obligame.com

Trái ngược với yêu cầu ban đầu của họ, Semianalysis cho thấy cơ sở hạ tầng thực tế của Deepseek bao gồm khoảng 50.000 GPU phễu NVIDIA, chiếm tổng đầu tư khoảng 1,6 tỷ đô la và chi phí hoạt động là 944 triệu đô la. Khoản đầu tư lớn này, cùng với mức lương cao cho các nhà nghiên cứu (vượt quá 1,3 triệu đô la hàng năm), mâu thuẫn với tường thuật chi phí đào tạo thấp.

DeepSeekHình ảnh: Obligame.com

Cấu trúc độc đáo của Deepseek, với tư cách là công ty con của quỹ phòng hộ cao, cho phép sở hữu trực tiếp các trung tâm dữ liệu và tự tài trợ, thúc đẩy sự nhanh nhẹn và đổi mới nhanh chóng. Điều này tương phản với các đối thủ cạnh tranh phụ thuộc vào điện toán đám mây. Con số 6 triệu đô la chỉ phản ánh chi phí GPU trước khi đào tạo, không bao gồm nghiên cứu, tinh chỉnh, xử lý dữ liệu và cơ sở hạ tầng. Tổng đầu tư của Deepseek vào phát triển AI vượt qua 500 triệu đô la.

DeepSeekHình ảnh: Obligame.com

Trong khi thành công của Deepseek thể hiện tiềm năng của một công ty AI độc lập được tài trợ tốt, thì tuyên bố "ngân sách cách mạng" là một sự đơn giản hóa. Lợi thế cạnh tranh của họ bắt nguồn từ đầu tư đáng kể, đột phá công nghệ và một đội ngũ có tay nghề cao. Tuy nhiên, ngay cả với các chi phí đáng kể này, chi phí của Deepseek vẫn thấp hơn đáng kể so với các đối thủ cạnh tranh, với chi phí đào tạo mô hình trước đây ở mức 5 triệu đô la (R1) so với 100 triệu đô la của TATGPT (TATGPT4O).