NVIDIA từ mới nhất bằng sáng chế để giải quyết một trong những thách thức lớn nhất của AI Máy tính
NVIDIA vẫn giữ vị thế hàng đầu trong lĩnh vực tính toán GPU và có ưu thế vượt trội trong lĩnh vực AI. Tuy nhiên, để duy trì vị trí lãnh đạo trong ngành công nghệ, công ty cần liên tục đổi mới. Hiện tại, NVIDIA đang đạt được nhiều tiến bộ, trong đó có bằng sáng chế US20250078199A1 về Bộ nhớ thống nhất GPU với chế độ địa phương, giải quyết một trong những thách thức lớn nhất trong việc phát triển GPU mạnh mẽ mà không làm giảm tốc độ.
Vào ngày 6 tháng 3 năm 2025, NVIDIA đã nộp đơn xin cấp bằng sáng chế mới với số hiệu US20250078199A1. Bằng sáng chế này đề xuất các phần riêng biệt của GPU hoạt động trong các khu vực cục bộ để lưu trữ và truy cập dữ liệu, cũng như thực hiện tính toán, nhằm giảm thiểu độ trễ khi truy cập các tài nguyên tính toán xa.
Bằng cách này, bằng sáng chế này sẽ tăng tốc độ tính toán dựa trên GPU, cho phép phát triển các ứng dụng AI mạnh mẽ hơn. Bằng sáng chế của NVIDIA gồm ba thành phần chính để đạt được điều này: Đơn vị Địa chỉ Bản đồ AMAP, cung cấp cái nhìn khác về bộ nhớ cục bộ, cho phép ánh xạ lại bộ nhớ vật lý đến DRAM cục bộ của vi xử lý uGPU.
Hệ thống Mặt nạ tương thích GPC (Graphic Processing Cluster) cho phép phân bổ chương trình tính toán tới các GPC cụ thể, giới hạn thực thi trong một nút uGPU nhất định. Ứng dụng AI có thể thông báo cho driver CUDA về ý định gắn với một nút uGPU nhất định qua mặt nạ tương thích. Driver CUDA sau đó phối hợp với Trình quản lý Tài nguyên để áp dụng ánh xạ cục bộ.
Đồng thời, bộ nhớ được phân bổ cho một nút uGPU cụ thể sẽ được chia nhỏ cho nút đó. Sau đó, driver CUDA phân bổ công việc tính toán cho các GPC do nút uGPU đã chỉ định kiểm soát. Các luồng CTA truy cập bộ nhớ thông qua ánh xạ địa chỉ cục bộ, trong khi các yêu cầu bộ nhớ chỉ giới hạn trong DRAM cục bộ của uGPU. Kiến trúc mà NVIDIA dự kiến, như đã trình bày trong đơn xin cấp bằng sáng chế, sẽ giảm đáng kể các vấn đề về độ trễ truy cập bộ nhớ, nâng cao hiệu quả bộ nhớ đệm bằng cách loại bỏ việc lưu trữ dữ liệu dư thừa, giải quyết các vấn đề độ trễ trong giao tiếp giữa các die, và cung cấp cho các ứng dụng khả năng kiểm soát chi tiết hơn về phân bổ và sử dụng tài nguyên GPU.
Bằng sáng chế này có thể giúp vượt qua những hạn chế của Luật Moore, dựa vào việc định vị thay vì thu nhỏ để tăng tốc độ tính toán. Phương pháp này tương tự như cách mà DeepSeek, một công ty khởi nghiệp AI của Trung Quốc, đã tận dụng khả năng của các GPU thế hệ cũ của NVIDIA để nâng cao đáng kể tài nguyên tính toán có sẵn.
Nguồn: wccftech.com/nvidia-latest-patent-attempts-to-solve-one-of-ai-computings-biggest-challenges/