Deepseek có thể sử dụng chip Trung Quốc trong nước sau khi học từ GPU NVIDIA - Báo cáo
Phòng thí nghiệm AI DeepSeek của Trung Quốc, với các mô hình AI gây xôn xao Phố Wall tuần trước, có thể sử dụng GPU của Trung Quốc cho các mô hình trong tương lai, theo một báo cáo. Khả năng của DeepSeek trong việc giảm chi phí so với các mô hình của Mỹ, trong khi vẫn sử dụng GPU của NVIDIA, đã làm rối loạn thị trường khi các nhà đầu tư nghi ngờ về việc liệu có cần hàng tỷ đô la cho chi phí phát triển AI hay không. Điểm mấu chốt trong phát triển mô hình của công ty là khả năng sử dụng ngôn ngữ lập trình cấp thấp PTX trên GPU của NVIDIA, thay vì ngôn ngữ CUDA mà NVIDIA cung cấp.
Báo cáo cho biết DeepSeek có thể tận dụng chuyên môn của PTX để nâng cao hiệu suất từ các GPU nội địa Trung Quốc. Ngành công nghiệp bán dẫn Trung Quốc thường xuyên bị Mỹ áp đặt lệnh trừng phạt, khiến công ty sản xuất chip lớn nhất là SMIC không thể mua máy móc sản xuất chip mới nhất từ ASML. Những máy này là thiết yếu để sản xuất các chip tiên tiến, và nhiều báo cáo cho hay SMIC chỉ có thể sản xuất chip bằng công nghệ quy trình 7 nanometer cũ.
Một yếu tố quan trọng giúp DeepSeek đạt hiệu suất tương đương với một số mô hình AI phương Tây trong khi sử dụng ít và các GPU NVIDIA kém hiệu quả hơn là khả năng sử dụng ngôn ngữ lập trình Parallel Thread Execution (PTX). PTX cho phép kỹ sư kiểm soát sâu hơn các chức năng cơ bản của chip so với các ngôn ngữ khác, và số lượng kỹ sư có khả năng sử dụng nó khá ít. Quyết định của DeepSeek sử dụng PTX, một ngôn ngữ khó, xuất phát từ các lệnh trừng phạt GPU của Mỹ, khi công ty chỉ có thể mua được số lượng hạn chế hoặc các chip kém hiệu suất hơn.
📢 Liên hệ quảng cáo: 0919 852 204
Quảng cáo của bạn sẽ xuất hiện trên mọi trang!
Theo báo cáo từ truyền thông Hong Kong, khả năng sử dụng PTX của công ty có thể giúp họ phụ thuộc vào GPU nội địa Trung Quốc cho các mẫu tương lai. Báo cáo cho rằng PTX cho phép lập trình viên kiểm soát chặt chẽ hoạt động của GPU, giúp kỹ sư DeepSeek khai thác hiệu suất tốt hơn từ các GPU Trung Quốc. Các GPU Hopper H800 của NVIDIA mà DeepSeek tuyên bố sử dụng được sản xuất trên quy trình 5-nanomet.
Ra mắt vào năm 2023, họ đã sử dụng công nghệ quy trình sản xuất mới nhất trong ngành lúc bấy giờ. Báo cáo cho biết, bằng cách hiểu cách NVIDIAs PTX hoạt động và cách các driver điều khiển chức năng của chip, DeepSeek có thể áp dụng các chương trình tương tự với các GPU của Trung Quốc. Các GPU Trung Quốc có khả năng được sản xuất bằng công nghệ quy trình cũ hơn và sẽ có hiệu suất thấp hơn đáng kể so với các GPU Blackwell mới nhất của NVIDIA.
Nguồn: wccftech.com/deepseek-could-use-domestic-chinese-chips-after-learning-from-nvidias-gpus-report/