Huawei Ascend 910c tuyên bố là tốc độ 60% của NVIDIA H100
HiSilicon Ascend 910C của Huawei là phiên bản của bộ xử lý Ascend 910 dành cho đào tạo AI được giới thiệu năm 2019. Hiện tại, hiệu suất của Ascend 910 gần như không đủ cho việc đào tạo các mô hình AI lớn hiệu quả về chi phí. Tuy nhiên, trong việc suy diễn, nó đạt được 60% hiệu suất của Nvidia H100, theo nghiên cứu từ DeepSeek. Mặc dù không phải là sản phẩm hiệu suất cao nhất, Ascend 910C có thể giúp giảm sự phụ thuộc của Trung Quốc vào GPU của Nvidia.
Kiểm tra bởi DeepSeek cho thấy bộ xử lý 910C vượt xa mong đợi về hiệu suất suy diễn. Hơn nữa, với việc tối ưu hóa thủ công các kernel CUNN, hiệu suất có thể được cải thiện hơn nữa. Hỗ trợ sẵn có của DeepSeek cho các bộ xử lý Ascend và kho lưu trữ PyTorch của nó cho phép chuyển đổi dễ dàng từ CUDA sang CUNN, giúp tích hợp phần cứng của Huawei vào quy trình làm việc AI trở nên đơn giản hơn.
Điều này cho thấy khả năng của bộ xử lý AI của Huawei đang phát triển nhanh chóng, mặc dù bị cấm vận bởi chính phủ Mỹ và không tiếp cận được công nghệ sản xuất tiên tiến của TSMC. Trong giai đoạn 2019-2020, Huawei và SMIC đã bắt kịp khả năng của TSMC và sản xuất được chip cạnh tranh với bộ xử lý A100 và H100 của Nvidia, nhưng Ascend 910C không phải là lựa chọn tốt nhất cho việc đào tạo AI.
Đào tạo AI vẫn là lĩnh vực mà Nvidia giữ vị trí vượt trội. Yuchen Jin từ DeepSeeks cho biết độ tin cậy trong đào tạo dài hạn là điểm yếu lớn của bộ vi xử lý Trung Quốc. Thách thức này xuất phát từ sự tích hợp sâu sắc giữa phần cứng và phần mềm của Nvidia, được phát triển trong suốt hai thập kỷ. Trong khi hiệu suất suy diễn có thể được tối ưu hóa, các khối lượng công việc đào tạo liên tục cần cải tiến hơn nữa trong hệ thống phần cứng và phần mềm của Huawei.
Giống như Ascend 910 gốc, Ascend 910C mới cũng sử dụng công nghệ chiplet, với khoảng 53 tỷ transistor trong SoC chính. Chiplet tính toán của Ascend 910 được sản xuất bởi TSMC với công nghệ chế tạo N7 7nm sử dụng EUV, trong khi chiplet của Ascend 910C được SMIC sản xuất trên công nghệ 7nm thế hệ thứ 2 gọi là N2. Một số chuyên gia dự đoán rằng khi các mô hình AI chuyển sang kiến trúc Transformer, tầm quan trọng của hệ sinh thái phần mềm của Nvidia có thể giảm.
DeepSeeks chuyên về tối ưu hóa phần cứng và phần mềm, có thể giảm đáng kể sự phụ thuộc vào Nvidia, mang đến cho các công ty AI một lựa chọn tiết kiệm chi phí hơn, đặc biệt trong lĩnh vực suy diễn. Tuy nhiên, để cạnh tranh toàn cầu, Trung Quốc cần vượt qua thách thức về ổn định trong đào tạo và cải thiện hạ tầng tính toán AI.
Nguồn: www.tomshardware.com/tech-industry/artificial-intelligence/deepseek-research-suggests-huaweis-ascend-910c-delivers-60-percent-nvidia-h100-inference-performance