Phòng thí nghiệm AI Trung Quốc Deepseek có 50.000 NVIDIA H100 AI GPU, Giám đốc điều hành AI cho biết
Đây không phải là lời khuyên đầu tư. Tác giả không nắm giữ cổ phiếu nào được đề cập. Wccftech.com có chính sách công khai và đạo đức. Phòng thí nghiệm trí tuệ nhân tạo Trung Quốc DeepSeek, với mô hình AI R1 gây sốt trong ngành tháng này, có quyền truy cập vào hàng chục nghìn GPU của NVIDIA để đào tạo, theo CEO một công ty AI. DeepSeek R1 là một trong những mô hình AI tiên tiến nhất thế giới, sánh ngang với các nền tảng hàng đầu của Mỹ như OpenAI's o1 và Meta's Llama.
Chip Hopper của NVIDIA là thế hệ GPU hiện tại, đang được sử dụng rộng rãi nhất trên thế giới khi công ty tăng cường vận chuyển chip Blackwell thế hệ tiếp theo. Thông tin mới nhất được chia sẻ bởi Alexandr Wang, người sáng lập và CEO của Scale AI, trong một buổi phỏng vấn với CNBC. Wang cho biết R1 đã đạt hoặc vượt qua tất cả các mô hình AI hàng đầu trong bài kiểm tra AI khó khăn nhất của công ty.
Giám đốc điều hành AI Wang cho biết trong cuộc phỏng vấn với Andrew Ross Sorkin của CNBC rằng mô hình DeepSeek R1 của họ có hiệu suất ngang bằng hoặc tốt hơn mô hình o1 của OpenAI. Ông chia sẻ về bài kiểm tra AI mới mang tên “Kỳ thi cuối cùng của nhân loại”, trong đó sử dụng những câu hỏi khó nhất từ các giáo sư toán, vật lý, sinh học và hóa học liên quan đến nghiên cứu mới nhất. Sau khi thử nghiệm các mô hình AI mới nhất với bài kiểm tra này, đội ngũ của Wang phát hiện rằng mô hình mới nhất của DeepSeek đạt hiệu suất tốt nhất hoặc tương đương với các mô hình hàng đầu của Mỹ như o1.
Khi được hỏi về cuộc cạnh tranh AI giữa Mỹ và Trung Quốc, Wang cho biết Mỹ đã dẫn đầu trong một thời gian dài. Tuy nhiên, ông cũng cho rằng các mô hình mới nhất của DeepSeeks đang cố gắng thay đổi tình hình. Wang cho rằng việc phòng thí nghiệm Trung Quốc công bố một mô hình đột phá vào ngày Giáng sinh là điều mang tính biểu tượng, khi mọi người đang ăn mừng kỳ nghỉ.
Cuộc trò chuyện sau đó chuyển sang số lượng GPU mà DeepSeek và các công ty AI Trung Quốc có cho các mô hình AI của họ. GPU của NVIDIA là một trong những sản phẩm được săn đón nhất trên thế giới và xuất khẩu của chúng được chính phủ Mỹ quản lý do tiềm năng của chúng. Dòng GPU thế hệ hiện tại của hãng gồm có H100 và H200, với sự khác biệt chính giữa hai mẫu GPU này là tốc độ và dung lượng bộ nhớ.
Chính quyền Biden đã hạn chế việc bán các GPU này cho Trung Quốc vào năm 2022 bằng một quy định ngăn NVIDIA bán các chip vượt trội hơn nhiều so với các GPU A100 cũ. Những hạn chế này buộc NVIDIA phải phát triển các chip thay thế mang tên H800 và A800, nhưng chúng cũng bị cấm vào tháng 10 năm 2023. Theo Wang, việc Trung Quốc tiếp cận các GPU tiên tiến của NVIDIA có thể nói là vừa có vừa không.
Ông Wang cho biết các phòng lab ở Trung Quốc có nhiều H100 hơn mọi người nghĩ, ước tính khoảng năm mươi nghìn H100. Tuy nhiên, ông nhấn mạnh rằng họ không thể bàn luận về điều này vì vi phạm các quy định xuất khẩu của Mỹ. Ông cũng cho rằng Trung Quốc có thể có nhiều chip hơn dự đoán, nhưng việc mua thêm chip sẽ gặp khó khăn.
Theo Wang, trong tương lai, họ sẽ bị hạn chế bởi các quy định kiểm soát chip và kiểm soát xuất khẩu mà chúng ta đã áp dụng.
Nguồn: wccftech.com/chinese-ai-lab-deepseek-has-50000-nvidia-h100-ai-gpus-says-ai-ceo/