Mô hình AI hiệu quả đáng ngạc nhiên của Deepseek thách thức những người khổng lồ trong ngành. Mặc dù ban đầu tuyên bố chỉ có chi phí đào tạo 6 triệu đô la cho mẫu Deepseek V3 mạnh mẽ của mình, một cái nhìn gần hơn cho thấy một khoản đầu tư đáng kể hơn nhiều.
Mô hình V3 của Deepseek tự hào có các công nghệ sáng tạo: Dự đoán đa điểm (MTP) , dự đoán đồng thời nhiều từ; Hỗn hợp các chuyên gia (MOE) , sử dụng 256 mạng lưới thần kinh để xử lý nâng cao; và sự chú ý tiềm ẩn đa đầu (MLA) , tập trung vào các yếu tố câu chính để cải thiện độ chính xác.
Hình ảnh: Obligame.com
Tuy nhiên, việc bán phân tích đã phát hiện ra cơ sở hạ tầng đáng kể của Deepseek: khoảng 50.000 GPU phễu NVIDIA, bao gồm H800, H100 và H20, trải rộng trên nhiều trung tâm dữ liệu. Điều này thể hiện tổng đầu tư của máy chủ khoảng 1,6 tỷ đô la và chi phí hoạt động gần 944 triệu đô la.
Hình ảnh: Obligame.com
Deepseek, một công ty con của High Flyer, một quỹ phòng hộ của Trung Quốc, sở hữu các trung tâm dữ liệu của mình, thúc đẩy kiểm soát và đổi mới nhanh chóng. Bản chất tự tài trợ của nó góp phần vào sự nhanh nhẹn và ra quyết định nhanh chóng. Công ty thu hút tài năng hàng đầu, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm, chủ yếu từ các trường đại học Trung Quốc.
Hình ảnh: Obligame.com
Con số 6 triệu đô la ban đầu chỉ bao gồm việc sử dụng GPU trước khi đào tạo, bỏ qua nghiên cứu, sàng lọc, xử lý dữ liệu và cơ sở hạ tầng. Đầu tư phát triển AI thực tế của Deepseek vượt qua 500 triệu đô la. Mặc dù vậy, cấu trúc nạc của nó cho phép đổi mới hiệu quả, không giống như các đối thủ cạnh tranh lớn hơn, quan liêu hơn.
Hình ảnh: Obligame.com
Trong khi thành công của Deepseek bắt nguồn từ đầu tư đáng kể, những tiến bộ công nghệ và một nhóm lành nghề, thì câu chuyện "thân thiện với ngân sách" là sai lệch. Tuy nhiên, chi phí của nó vẫn thấp hơn đáng kể so với các đối thủ cạnh tranh; Ví dụ, mô hình R1 của Deepseek có giá 5 triệu đô la, so với 100 triệu đô la của TATGPT4. Ví dụ của Deepseek cho thấy một công ty AI độc lập được tài trợ tốt cạnh tranh thành công với các nhà lãnh đạo đã thành lập, mặc dù các khiếu nại chi phí ban đầu đòi hỏi phải giải thích cẩn thận.