MI250X và MI250
AMD đã chính thức công bố GPU MI200 thế hệ tiếp theo mang mã Aldebaran, sử dụng kiến trúc CDNA 2 6nm, mang lại hiệu suất tính toán cực kỳ mạnh mẽ. MI200 là sản phẩm đầu tiên sử dụng công nghệ MCM 6nm, với hiệu suất FP32 vượt quá 95 TFLOPs.
GPU AMD Aldebaran sẽ có nhiều kích thước khác nhau, nhưng tất cả đều dựa trên kiến trúc CDNA 2 hoàn toàn mới, là phiên bản tinh chỉnh nhất của Vega. Một số tính năng chính bao gồm kiến trúc CDNA 2 – nhân ma trận thế hệ thứ hai, tăng tốc các phép toán ma trận FP64 và FP32, mang lại hiệu suất FP64 lý thuyết tối đa gấp 4 lần so với các GPU thế hệ trước của AMD.
Công nghệ Đóng gói Lãnh đạo – Thiết kế GPU đa chip đầu tiên trong ngành với công nghệ EFB 2.5D cung cấp 1.8 lần số lõi và băng thông bộ nhớ cao hơn 2.7 lần so với GPU thế hệ trước của AMD, đạt băng thông bộ nhớ lý thuyết tối đa 3.2 terabyte mỗi giây. Công nghệ AMD Infinity Fabric thế hệ thứ 3 – Kết nối lên đến 8 liên kết Infinity Fabric giữa AMD Instinct MI200 với CPU EPYC thế hệ thứ 3 và các GPU khác trong cùng nút, cho phép đồng bộ bộ nhớ CPUGPU và tối đa hóa thông lượng hệ thống, giúp mã CPU dễ dàng khai thác sức mạnh của các bộ tăng tốc.
Bên trong AMD Instinct MI200 có GPU Aldebaran với hai die: một chính và một phụ. Mỗi die gồm 8 shader engine, tổng cộng là 16 SE. Mỗi Shader Engine có 16 compute units (CUs) hỗ trợ FP64 đầy đủ, FP32 gói và 2nd Generation Matrix Engine cho các phép toán FP16 và BF16. Mỗi die gồm 128 compute units, tương đương với 8192 stream processors.
Tổng cộng chip có 220 đơn vị tính toán hoặc 14,080 bộ xử lý luồng. GPU Aldebaran được trang bị giao tiếp XGMI mới. Mỗi chiplet có một động cơ VCN 2.6 và bộ điều khiển IO chính. Được xây dựng trên kiến trúc AMD CDNA 2, bộ tăng tốc AMD Instinct MI200 cung cấp hiệu suất ứng dụng hàng đầu cho nhiều tác vụ HPC. Bộ tăng tốc AMD Instinct MI250X cung cấp lên tới 4.
Hiệu suất của sản phẩm này vượt trội hơn 9 lần so với các bộ tăng tốc cạnh tranh cho các ứng dụng HPC độ chính xác gấp đôi FP64 và đạt hơn 380 teraflops lý thuyết tối đa FP16 cho các tác vụ AI, mở ra những cách tiếp cận đột phá trong nghiên cứu dựa trên dữ liệu. AMD đã ghi nhận nhiều kỷ lục về hiệu suất trong phân khúc HPC, vượt xa giải pháp A100 của NVIDIA với cải thiện hiệu suất lên đến 3 lần trong AMG.
Về DRAM, AMD sử dụng giao diện 8 kênh với các giao diện 1024-bit, tạo ra băng thông rộng 8192-bit. Mỗi giao diện hỗ trợ mô-đun HBM2e DRAM 2GB, cho phép mỗi ngăn chứa tối đa 16 GB HBM2e. Với tổng cộng tám ngăn, dung lượng tối đa lên tới 128 GB, nhiều hơn 48 GB so với A100 với 80 GB HBM2e.
Bộ nhớ sẽ đạt tốc độ 3,2 Gbps với băng thông đầy đủ 3,2 TBs, cao hơn 1,2 TBs so với A100 80 GB có băng thông 2 TBs. AMD Instinct MI200 sẽ cung cấp sức mạnh cho ba siêu máy tính hàng đầu, bao gồm hệ thống exascale Frontier của Mỹ, hệ thống pre-exascale LUMI của Liên minh Châu Âu và hệ thống petascale Setonix của Australia. Đối thủ cạnh tranh là A100 80 GB với hiệu suất 19.
📢 Liên hệ quảng cáo: 0919 852 204
Quảng cáo của bạn sẽ xuất hiện trên mọi trang!
AMD cung cấp sức mạnh tính toán lên đến 5 TFLOPs cho FP64, 156 TFLOPs cho FP32 và 312 TFLOPs cho FP16. Năm tới, có khả năng NVIDIA sẽ ra mắt GPU Hopper MCM, dẫn đến sự cạnh tranh khốc liệt giữa hai "gã khổng lồ" GPU trong năm 2022. Dưới đây là danh sách các bộ tăng tốc AMD Radeon Instinct:
Thông tin kỹ thuật:
- Kiến trúc CPU: Zen 5 và Zen 4 cho các APU Exascale.
- Kiến trúc GPU: CDNA 4, CDNA 3, CDNA 2, CDNA 1, Vega 20, Vega 10, Polaris 10.
- Quy trình sản xuất GPU: từ 4nm đến 28nm.
Dưới đây là thông tin ngắn gọn bằng tiếng Việt:
- FP16 Compute: TBD, 1.3 PFLOPs, 980.6 TFLOPs, 383 TFLOPs, 362 TFLOPs, 181 TFLOPs, 185 TFLOPs, 29.5 TFLOPs, 26.5 TFLOPs, 24.6 TFLOPs, 8.2 TFLOPs, 5.7 TFLOPs.
- FP32 Compute: TBD, 163.4 TFLOPs, 122.6 TFLOPs, 95.7 TFLOPs, 90.5 TFLOPs, 45.3 TFLOPs, 23.1 TFLOPs, 14.7 TFLOPs, 13.3 TFLOPs, 12.3 TFLOPs, 8.2 TFLOPs, 5.7 TFLOPs.
- FP64 Compute: TBD, 81.7 TFLOPs, 61.3 TFLOPs, 47.9 TFLOPs, 45.3 TFLOPs, 22.6 TFLOPs.
VRAM:
Memory Clock:
Nguồn: wccftech.com/amd-unveils-instinct-mi200-aldebaran-gpu-first-6nm-mcm-product-with-58-billion-transistors-over-14000-cores-128-gb-hbm2e-memory/