NVIDIA thông báo Rubin GPU vào năm 2026, Rubin Ultra vào năm 2027, Feynman cũng thêm vào lộ trình
Nvidia đã công bố cập nhật lộ trình trung tâm dữ liệu cho năm 2026 và 2027, giới thiệu các cấu hình dự kiến cho Rubin, đặt theo tên nhà thiên văn học Vera Rubin, và Rubin Ultra. Dù mới hoàn thành sản xuất Blackwell B200 và có kế hoạch cho Blackwell B300 vào nửa sau năm 2025, Nvidia đã bắt đầu chuẩn bị cho hai năm tới và hỗ trợ các đối tác lên kế hoạch cho các chuyển đổi sắp tới.
Một điểm thú vị là Blackwell được đặt tên sai. Thực tế, Blackwell B200 có hai die cho mỗi GPU, điều này thay đổi cấu trúc NVLink. Jensen cho rằng nên gọi nó là NV144L thay vì Blackwell B200 NVL72. Nvidia sẽ sử dụng tên NV144L cho các giải pháp Rubin sắp tới. Hệ thống Rubin NVL144 sẽ tương thích với hạ tầng Blackwell NVL72 hiện có.
Chúng ta có cùng dữ liệu cấu hình cho Blackwell Ultra B300 NVL72 ở slide thứ hai để so sánh. B300 NVL72 cung cấp 1.1 PFLOPS tính toán FP4 dày đặc, trong khi Rubin NVL144 — cũng với 144 GPU die — sẽ cung cấp 3.6 PFLOPS FP4. Rubin còn có 1.2 ExaFLOPS cho đào tạo FP8, so với chỉ 0.36 ExaFLOPS của B300. Tổng thể, hiệu suất tính toán tăng 3.3 lần.
Rubin sẽ đánh dấu sự chuyển đổi từ HBM3 và HBM3e sang HBM4, trong đó HBM4e sẽ được sử dụng cho Rubin Ultra. Dung lượng bộ nhớ vẫn giữ nguyên ở mức 288GB cho mỗi GPU, giống như B300, nhưng băng thông sẽ cải thiện từ 8 TB/s lên 13 TB/s. Sẽ có NVLink nhanh hơn gấp đôi thông lượng lên 260 TB/s tổng cộng, cùng với liên kết CX9 mới giữa các giá, với 28.8 TB/s gấp đôi băng thông của B300 và CX8. Phần còn lại của gia đình Rubin sẽ là CPU Vera, thay thế cho các CPU Grace hiện tại.
Vera sẽ là một CPU nhỏ gọn với 88 nhân ARM tùy chỉnh và 176 luồng. Nó có giao diện NVLink 1.8 TBs để kết nối với các GPU Rubin. Rubin Ultra dự kiến sẽ ra mắt vào nửa cuối năm 2027, trong khi CPU Vera vẫn giữ nguyên, GPU sẽ được nâng cấp mạnh mẽ với bố trí mới NVL576, cho phép lắp tới 576 GPU trong một giá, với mức tiêu thụ điện chưa được công bố.
Khả năng tính toán suy diễn với FP4 sẽ đạt tới 15 ExaFLOPS, trong khi FP8 cho đào tạo đạt 5 ExaFLOPS. Điều này gấp 4 lần khả năng tính toán của Rubin NVL144, hợp lý vì số lượng GPU cũng gấp bốn lần. Các GPU sẽ có bốn die mỗi gói để tăng mật độ tính toán. Trong khi giải pháp NVL144 Rubin có 75TB bộ nhớ nhanh cho cả CPU và GPU mỗi tủ, Rubin Ultra NVL576 sẽ cung cấp 365TB bộ nhớ.
Các GPU sẽ sử dụng HBM4e, nhưng có điều thú vị ở đây. Nvidia công bố băng thông HBM4e là 4.6 PB, tương đương với 8 TB mỗi GPU cho 576 GPU. Điều này có vẻ là băng thông thấp hơn mỗi GPU so với trước, nhưng có thể do cách các die GPU được kết nối với nhau. Mỗi bốn GPU kích thước reticle sẽ có 1TB HBM4e, cùng với khả năng tính toán 100 PetaFLOPS FP4. Giao thức NVLink7 sẽ nhanh gấp 6 lần so với Rubin.
Tốc độ truyền dữ liệu đạt 5 PBs. Kết nối CX9 sẽ cải thiện gấp 4 lần, lên 115.2 TBs giữa các rack, có thể do số lượng liên kết tăng gấp bốn. Mặc dù còn nhiều điều chưa rõ ràng về Rubin và Rubin Ultra, nhưng thông tin sẽ được cập nhật trong tương lai. Các trung tâm dữ liệu cần lập kế hoạch kỹ lưỡng hơn so với GPU cho người tiêu dùng, vì vậy Nvidia đã chia sẻ thông tin chi tiết trước khi sản phẩm sẵn sàng xuất xưởng.
Chưa hoàn tất... Ảnh: Nvidia. Sau Rubin, kiến trúc trung tâm dữ liệu tiếp theo của Nvidia sẽ được đặt tên theo nhà vật lý lý thuyết Richard Feynman. Có thể chúng ta sẽ nhận được CPU Richard và GPU Feynman, nếu Nvidia tiếp tục theo xu hướng hiện tại.
Nguồn: www.tomshardware.com/pc-components/gpus/nvidia-announces-rubin-gpus-in-2026-rubin-ultra-in-2027-feynam-after