Các thị trường AI đã bị lừa dối để tin vào chi phí đào tạo thấp của Deepseek;Chúng thực sự cao hơn 400 lần so với con số được báo cáo
Cuộc tranh cãi về chi phí đào tạo mô hình R1 của DeepSeeks đã gây chấn động thị trường, nhưng có vẻ như có nhiều sự lừa dối xung quanh vấn đề này, vì các con số thực tế thực sự gây ngạc nhiên. Chi phí đào tạo của DeepSeeks được cho là cao hơn nhiều so với con số 5 triệu mà họ công bố. Công ty nghiên cứu SemiAnalysis đã tiến hành phân tích sâu rộng về chi phí đào tạo của DeepSeek, bác bỏ quan điểm cho rằng R1 đã trở nên hiệu quả đến mức không cần tài nguyên tính toán từ NVIDIA và các công ty khác.
Trước khi tìm hiểu về phần cứng thực tế mà DeepSeek sử dụng, hãy điểm qua những gì ngành công nghiệp đã nhận định ban đầu. Có thông tin cho rằng DeepSeek chỉ sử dụng 5 triệu cho mô hình R1, tương đương với OpenAI GPTs o1, điều này đã gây ra một làn sóng hoảng loạn trên thị trường chứng khoán Mỹ. Tuy nhiên, khi mọi thứ đã lắng xuống, hãy xem xét các số liệu thực tế. Được biết, DeepSeek được cho là một dự án phụ của quỹ đầu tư Trung Quốc High-Flyer, và báo cáo của SemiAnalysis cho biết họ đã mua 10.000 đơn vị A100 của NVIDIA vào năm 2021, khi các hạn chế xuất khẩu chưa nghiêm ngặt.
DeepSeek đã phát triển thành một thực thể độc lập khi công ty mẹ High-Flyer quyết định tách dự án ra. Kể từ đó, DeepSeek bắt đầu tích lũy tài nguyên máy tính. Theo báo cáo, DeepSeek hiện có khoảng 10.000 GPU AI H800 của NVIDIA dành cho Trung Quốc và 10.000 chip AI H100 cao cấp. Họ cũng đã đầu tư vào các bộ tăng tốc AI H20 của NVIDIA và có một kho tài nguyên được chia sẻ giữa DeepSeek và High-Flyer cho giao dịch, suy diễn, đào tạo và nghiên cứu.
Điều này tương đương với khoảng 1,6 tỷ USD cho vốn đầu tư của DeepSeek, với chi phí vận hành ước tính khoảng 944 triệu USD. Các con số này cao gấp khoảng bốn trăm lần so với những gì thị trường ban đầu nhận thấy. Để làm rõ, con số ban đầu được cho là một phần cụ thể trong chi phí đào tạo liên quan đến việc vận hành mô hình cuối cùng. Điều DeepSeek thực sự làm tốt là tận dụng nguồn nhân lực địa phương thông qua các sự kiện tuyển dụng tại các trường đại học hàng đầu, với mức lương trên 1 triệu USD.
3 triệu đô la cho một số nhân viên cụ thể. Những người đứng sau mô hình R1 của DeepSeeks thực sự có khả năng đưa ra giải pháp hiệu quả để cạnh tranh với OpenAI, nhưng các số liệu tài chính bị báo cáo sai đã góp phần vào sự kiện bất ngờ vừa qua. SemiAnalysis đã tiến hành kiểm tra sâu rộng với mô hình AI của DeepSeeks, vì vậy bạn nên xem xét điều đó, vì có nhiều chi tiết thú vị được đề cập.
Nguồn: wccftech.com/ai-markets-were-deceived-to-believe-in-deepseek-low-training-costs/