NVIDIA sẵn sàng cắt giảm HGX H20 GPU để Trung Quốc tuân thủ các quy tắc kiểm soát xuất khẩu
Nvidia dự kiến ra mắt phiên bản rút gọn của bộ xử lý AI HGX H20 tại Trung Quốc vào tháng 7, nhằm duy trì khả năng tiếp cận thị trường sau khi các quan chức Mỹ cấm phiên bản gốc thông qua quy định xuất khẩu mới. Theo thông tin ban đầu, GPU AI sửa đổi sẽ có ít bộ nhớ HBM hơn để tuân thủ các giới hạn kỹ thuật mới và thay thế model đã được phê duyệt trước đó.
Một trong những thay đổi của GPU AI mới là dung lượng bộ nhớ giảm, điều này sẽ ảnh hưởng đến khả năng của bộ xử lý trong việc huấn luyện các mô hình ngôn ngữ lớn với hàng chục đến hàng trăm tỷ tham số. Ngoài ra, các đặc tính hiệu suất cuối cùng có thể được điều chỉnh tùy theo cách mà khách hàng cấu hình các mô-đun GPU HGX, cho phép một chút linh hoạt mặc dù tổng thể đã bị giảm cấp.
Vào tháng 4, các cơ quan chức năng của Mỹ đã hạn chế việc bán các bộ vi xử lý AI như AMD Instinct MI308 và Nvidia HGX 20 sang Trung Quốc, bao gồm cả Hong Kong và Macau, do các quy định xuất khẩu chưa công bố. Hệ quả là AMD và Nvidia phải ghi giảm hàng tồn kho trị giá hàng tỷ đô la, với 5,5 tỷ cho Nvidia và 800 triệu cho AMD, trong khi các giấy phép xuất khẩu cho hàng hóa đến Trung Quốc đang được xem xét với giả định từ chối.
Để duy trì quyền truy cập vào thị trường quan trọng, Nvidia đang áp dụng một loạt các điều chỉnh để đảm bảo tuân thủ các giới hạn do chính phủ Mỹ quy định. Nvidia đã thông báo về kế hoạch này cho các khách hàng lớn trong lĩnh vực điện toán đám mây tại Trung Quốc. Nếu thông tin về bộ xử lý HGX H20 bị hạ cấp là đúng, đây sẽ là GPU thứ ba dựa trên Hopper của Nvidia được thiết kế riêng cho Trung Quốc, sử dụng silicon H100 đã được cắt giảm.
Cần lưu ý rằng chưa có thông tin về các sản phẩm AI của Blackwell cho Trung Quốc. Sau khi chính phủ Mỹ áp đặt các hạn chế đầu tiên về việc xuất khẩu AI và GPU HPC sang Trung Quốc vào năm 2022, Nvidia đã phát triển bộ xử lý H800 với khả năng kết nối giảm. H800 chỉ giảm hiệu suất nhẹ so với H100 ban đầu. Sau khi chính quyền Mỹ áp dụng các quy tắc xuất khẩu mới hạn chế hiệu suất của các bộ xử lý gửi đến Trung Quốc, Nvidia đã phát triển HGX H20 dựa trên H100 cho đào tạo AI cùng với các thẻ L20 PCIe và L2 PCIe dựa trên GPU AD104 cho suy diễn AI.
Theo dõi Toms Hardware trên Google News để nhận tin tức, phân tích và đánh giá mới nhất. Đừng quên nhấn nút Theo dõi.
Nguồn: www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-readies-cut-down-hgx-h20-gpu-for-china-to-comply-with-export-control-rules