Hoài nghi về chi phí 'siêu rẻ' của AI Trung Quốc DeepSeek
Công nghệ AI Thứ ba, 28/1/2025, 14:15 GMT+7
Nghi ngờ về chi phí siêu rẻ của AI Trung Quốc, DeepSeek tuyên bố xây dựng AI với chi phí dưới 6 triệu USD bằng GPU hiệu năng thấp. Tuy nhiên, CEO Scale AI và Elon Musk cho rằng con số này cao hơn nhiều. Sau khi mô hình DeepSeek V3 và R3 gây chú ý, cổ phiếu nhiều công ty công nghệ Mỹ, trong đó có Nvidia, đã giảm mạnh, với Nvidia giảm 17% do lo ngại nhu cầu về GPU sẽ giảm.
Công ty phát triển chatbot DeepSeek cho biết họ đã mất hai tháng và chi phí dưới 6 triệu USD để xây dựng sản phẩm, sử dụng GPU H800 của Nvidia bị hạ cấp do lệnh cấm của Mỹ, thay vì các chip AI tiên tiến nhất. DeepSeek hiện đang gây sốt toàn cầu, nhưng sự ra mắt đột ngột với khả năng vượt trội khiến một số chuyên gia hoài nghi về chất lượng sản phẩm.
Trong cuộc phỏng vấn với CNBC tuần trước, CEO của Scale AI, Alexandr Wang, cho biết DeepSeek đang sở hữu 50.000 chip Nvidia H100 nhưng không thể công khai thông tin này do các biện pháp kiểm soát xuất khẩu của Mỹ. Elon Musk, nhà sáng lập xAI và người gần gũi với Tổng thống Donald Trump, cũng đồng tình với nhận định này khi đăng lại video phỏng vấn.
Tỷ phú giàu nhất thế giới đã bày tỏ nghi ngờ về chi phí phát triển DeepSeek mà Gavin Baker, CIO quỹ đầu cơ Atreides Management, cho rằng chỉ tốn 6 triệu USD. Baker cho biết con số này không chính xác, vì báo cáo kỹ thuật của nhà phát triển Trung Quốc không tính đến chi phí nghiên cứu trước và các thí nghiệm liên quan đến kiến trúc, thuật toán và dữ liệu.
Điều này có nghĩa là mô hình chất lượng R1 có thể được đào tạo với chi phí 6 triệu USD nếu một phòng thí nghiệm đã đầu tư hàng trăm triệu USD cho nghiên cứu trước đó và có quyền truy cập vào cụm phần cứng lớn. Baker cũng nhấn mạnh rằng một báo cáo trước đây của DeepSeek đã đề cập đến cụm 100.000 chip A100, cho thấy các công ty Trung Quốc như DeepSeek có thể đang lách luật bằng cách chạy các mô hình AI trên chip tiên tiến ở nước ngoài.
Ted Mortonson, Giám đốc điều hành tại Baird, cho biết công ty Trung Quốc khó có thể thực hiện điều này với chip H800 bị hạn chế hiệu năng. Ông cho rằng thị trường đang phản ứng thái quá về khả năng các công ty Mỹ có thể theo đuổi mô hình tương tự. Mặc dù gặp nhiều hoài nghi, DeepSeek vẫn gây chấn động trên thị trường chứng khoán Mỹ, khiến các ông lớn AI như Microsoft, Nvidia, và Meta phải lên tiếng.
Mark Zuckerberg đã tập hợp các kỹ sư cao cấp để nghiên cứu mô hình AI mới. DeepSeek là ứng dụng mới nhất từ Trung Quốc đang nổi bật tại Mỹ. Trước đó, nhiều người Mỹ đã tải RedNote và Lemon8 để thay thế TikTok khi nền tảng này bị cấm. Ngày 201, công ty khởi nghiệp Trung Quốc DeepSeek ra mắt mô hình V3 miễn phí và R1, được đào tạo trên chip cũ của Nvidia, với mã nguồn mở 100%, giá rẻ hơn 96,4% so với OpenAI o1 nhưng hiệu suất tương tự.
Công ty cho biết họ chỉ mất hai tháng và dưới 6 triệu USD để xây dựng mô hình AI dùng chip H800 của Nvidia. Phiên bản V3 đã vượt ChatGPT, trở thành ứng dụng tải nhiều nhất trên App Store Mỹ, đồng thời làm mất gần 600 tỷ USD vốn hóa của Nvidia trong ngày 271.
Nguồn:vnexpress.net/hoai-nghi-ve-chi-phi-sieu-re-cua-ai-trung-quoc-deepseek-vnepre-4844007.html