AMD đã ra mắt máy gia tốc GPU MI325X AI bản năng mới nhất được đóng gói với bộ nhớ 256 GB HBM3E trong khi MI355X năm tới nhận được 288 GB.
AMD đi hết với dung lượng bộ nhớ HBM3E: 256 GB trên MI325X "cDNA 3" năm nay & 288 GB trên MI355X "cDNA 4" vào năm tới
Là một phần của sự kiện "tiến bộ AI" ngày nay, AMD đang triển khai máy gia tốc GPU AI bản năng hoàn toàn mới hoàn toàn mới của mình, cải thiện trên MI300X với khả năng hoàn toàn mới.
Nhưng trước khi chúng tôi tham gia vào các chi tiết, chúng tôi phải nói về toàn bộ nền tảng bản năng của AMD đã thu hút được sự hỗ trợ từ các công ty AI hàng đầu thế giới và đang được sử dụng bởi một số thương hiệu lớn nhất như Meta, Openai và Microsoft.
Cam kết của AMD đối với lãnh đạo hiệu suất, di chuyển dễ dàng, hệ sinh thái mở và danh mục đầu tư tập trung vào khách hàng đã dẫn đến sự hỗ trợ rất lớn từ các OEM và đối tác đám mây hàng đầu, và do đó, công ty đã theo dõi nhanh sự ra mắt của giải pháp tiếp theo là AINhu cầu trong ngành phát triển đến độ cao vô song.
AMD MI325X với bộ nhớ 256 GB & kiến trúc cDNA 3
Hiện tại, MI300X của AMD được cho là có hiệu suất cao hơn tới 30% trên một loạt khối lượng công việc cụ thể của AI so với NVIDIA H100.Công việc bổ sung của AMD vào bộ ROCM của họ đang giúp trích xuất nhiều hiệu suất hơn từ máy gia tốc hàng đầu nhưng giờ là lúc để xây dựng phần cứng thậm chí còn tốt hơn với cùng một hỗ trợ phần mềm mạnh mẽ.
Gặp gỡ AMD Bản năng MI325X, máy gia tốc hoàn toàn mới này được chế tạo dựa trên thiết kế và kiến trúc cơ bản giống như MI300X.Sử dụng kiến trúc GPU cDNA 3, MI325X có thể được xem là nâng cấp giữa chu kỳ, cung cấp 256 GB bộ nhớ HBM3E được thực hiện bằng cách sử dụng băng thông 16-Hi với băng thông nhớ lên tới 6 TB/s, 2,6 PFLOPS của FP8, 1,3Hiệu suất của FP16, tất cả được đóng gói trong một chip với 153 tỷ bóng bán dẫn.
AMD dự kiến sản xuất đầu tiên của GPU AI bản năng MI325X bắt đầu từ Q4 2024 cùng với sự sẵn có của các giải pháp máy chủ tương ứng bắt đầu từ Q1 2025 thông qua các đối tác hàng đầu.Các máy chủ bản năng AI sẽ có tối đa 8 cấu hình MI325X với bộ nhớ HBM3E tối đa 2 Tb, băng thông Fabin Fabin 896 GB/s, băng thông bộ nhớ 48 Tb/s, 20,8 PFLOPS của FP8 và 10,4Mỗi GPU cũng được cấu hình ở 1000W, đây là một sự tăng trưởng lớn so với các cấu hình 750-700W của MI300X.
Đi sâu vào các con số, AMD tuyên bố rằng máy gia tốc GPU AI bản năng MI325X AI phải nhanh hơn 40% so với NVIDIA H200 trong Mixtral 8x7b, nhanh hơn 30% trong Mistral 7B và nhanh hơn 20% trong Meta Llama 3.1 70B LLM.Nền tảng MI325X 8X cũng sẽ cung cấp hiệu suất nhanh hơn 40% so với nền tảng H200 HGX AI trong LLAMA 3.1 405B và nhanh hơn 20% trong thử nghiệm suy luận 70B.Về mặt đào tạo AI, MI325X sẽ cung cấp hiệu suất tương tự hoặc 10% tốt hơn so với các nền tảng H200.
AMD MI355X với bộ nhớ 288 GB & kiến trúc cDNA 4
Năm tới, AMD có kế hoạch ra mắt máy gia tốc GPU MI355X bản năng hoàn toàn mới sẽ nhắm mục tiêu khối lượng công việc AI và điều này sẽ được xây dựng bằng nút quy trình 3NM.GPU sẽ kết hợp kiến trúc cDNA 4.Về mặt thông số kỹ thuật, bộ nhớ sẽ được nâng cấp lên công suất cao hơn, lên tới 288 GB HBM3E trong khi cung cấp hỗ trợ cho các loại dữ liệu FP4/FP6.
AMD nói rằng kiến trúc cDNA 4 mang lại hiệu suất 35X trên cDNA 3 cộng với sự gia tăng 7x tính toán AI, tăng 50% công suất bộ nhớ/băng thông và cũng đi kèm với các tiến bộ hiệu quả mạng mới nhất.
Về hiệu suất, GPU AI bản năng AMD MI355X AI sẽ cung cấp tới 2,3 PFLOP của hiệu suất FP16, tăng 80% so với MI325X trong khi số liệu FP8 cũng tăng 80% lên 4,6 PFLOP so với MI325X.Hiệu suất tính toán FP6 và FP4 mới được đánh giá ở mức 9.2 PFLOPS.
MI355X sẽ đánh dấu sự gia tăng 50% về cả dung lượng bộ nhớ và băng thông bộ nhớ, với tốc độ tối đa 8 TB/s so với MI300X hiện tại.Các nền tảng đầu tiên có tám trong số các GPU MI355X này sẽ có sẵn vào nửa cuối năm 2025 và cung cấp tới 2,3 TB dung lượng bộ nhớ HBM3E với băng thông 64 TB/s, 18,5 PFLOPS của FP16, 37 PFLOPS của FP8, & 74/FP4 Tính toán.
ROCM 6.2 tiếp tục quay số hiệu suất AI cho bản năng
Di chuyển trở lại mặt trận phần mềm, AMD đang công bố hệ sinh thái ROCM 6.2 mới nhất của mình, mang lại sự cải thiện hiệu suất trung bình 2,4 lần và lên tới 2,8 lần trên một phạm vi khối lượng công việc AI trong suy luận và cải thiện trung bình 2,4 lần về hiệu suất đào tạo.
Cuối cùng, AMD vẫn đang xác nhận MI400 bản năng được phát hành vào năm 2026 dưới dạng phần "cDNA tiếp theo" và không sử dụng tên kiến trúc UDNA được tiết lộ gần đây.Có lẽ còn quá sớm để đi đặt tên UDNA vì nó chưa được AMD thực hiện chính thức mặc dù một trong những đại diện hàng đầu của họxác nhậnNó vì vậy chúng ta sẽ xem làm thế nào điều đó diễn ra trong tương lai.
Như đã nói, AMD dường như sẽ tham gia vào cơn sốt AI với các dịch vụ bản năng trong tương lai, mang lại sự cạnh tranh nóng bỏng chống lại những người như Nvidia và cũng giải quyết Intel, những người đang đấu tranh để bắt kịp phần còn lại.
AMD Bản năng MI325X AI GPU Bộ sưu tập gia tốc GPU:
AMD Bản năng AI Tăng tốc:
Tên gia tốc | AMD Bản năng MI400 | AMD Bản năng MI350X | AMD Bản năng MI325X | AMD Bản năng MI300X | AMD Bản năng MI250X |
Kiến trúc GPU | CDNA Tiếp theo | CDNA 4 | Aqua Vanjaram (cDNA 3) | Aqua Vanjaram (cDNA 3) | Aldebaran (cDNA 2) |
Nút quy trình GPU | TBD | 3nm | 5nm+6nm | 5nm+6nm | 6nm |
Chiplets GPU | TBD | 8 (MCM) | 8 (MCM) | 8 (MCM) | 2 (MCM) 1 (mỗi cái chết) |
Lõi GPU | TBD | TBD | 19.456 | 19.456 | 14.080 |
Tốc độ đồng hồ GPU | TBD | TBD | 2100 MHz | 2100 MHz | 1700 MHz |
Tính toán int8 | TBD | TBD | 2614 ngọn | 2614 ngọn | 383 ngọn |
Tính toán FP6/FP4 | TBD | 9.2 PFLOPS | N/a | N/a | N/a |
Tính toán FP8 | TBD | 4.6 PFLOPS | 2.6 PFLOPS | 2.6 PFLOPS | N/a |
Tính toán FP16 | TBD | 2.3 PFLOPS | 1.3 PFLOPS | 1.3 PFLOPS | 383 tflops |
Tính toán FP32 | TBD | TBD | 163,4 TFLOPS | 163,4 TFLOPS | 95,7 tflops |
Tính toán FP64 | TBD | TBD | 81.7 TFLOPS | 81.7 TFLOPS | 47.9 TFLOPS |
Vram | TBD | 288 HBM3E | 256 GB HBM3E | 192 GB HBM3 | 128 GB HBM2E |
Bộ đệm vô cực | TBD | TBD | 256 MB | 256 MB | N/a |
Đồng hồ bộ nhớ | TBD | 8,0 Gbps? | 5,9 Gbps | 5,2 Gbps | 3,2 Gbps |
Xe buýt bộ nhớ | TBD | 8192-bit | 8192-bit | 8192-bit | 8192-bit |
Băng thông bộ nhớ | TBD | 8 tb/s | 6.0 tb/s | 5,3 tb/s | 3,2 tb/s |
Yếu tố hình thức | TBD | Oam | Oam | Oam | Oam |
Làm mát | TBD | Làm mát thụ động | Làm mát thụ động | Làm mát thụ động | Làm mát thụ động |
TDP (Max) | TBD | TBD | 1000W | 750W | 560W |
#patablepress-2005 từ bộ đệm
Nguồn: wccftech.com/amd-instinct-mi325x-first-ai-gpu-256-gb-hbm3e-288-gb-mi355x-cdna-4-next-year/