AMD Instinct MI325X, GPU AI đầu tiên sở hữu 256 GB bộ nhớ HBM3E và MI355X với 288 GB, sử dụng cDNA trong 4 năm tới, cải thiện hiệu suất gấp 8 lần

Cửa hàng gần nhất

được xác nhận bởi itcctv

AMD Instinct MI325X, GPU AI đầu tiên sở hữu 256 GB bộ nhớ HBM3E và MI355X với 288 GB, sử dụng cDNA trong 4 năm tới, cải thiện hiệu suất gấp 8 lần

AMD đã ra mắt máy gia tốc GPU MI325X AI bản năng mới nhất được đóng gói với bộ nhớ 256 GB HBM3E trong khi MI355X năm tới nhận được 288 GB.

AMD đi hết với dung lượng bộ nhớ HBM3E: 256 GB trên MI325X "cDNA 3" năm nay & 288 GB trên MI355X "cDNA 4" vào năm tới

Là một phần của sự kiện "tiến bộ AI" ngày nay, AMD đang triển khai máy gia tốc GPU AI bản năng hoàn toàn mới hoàn toàn mới của mình, cải thiện trên MI300X với khả năng hoàn toàn mới.

Nhưng trước khi chúng tôi tham gia vào các chi tiết, chúng tôi phải nói về toàn bộ nền tảng bản năng của AMD đã thu hút được sự hỗ trợ từ các công ty AI hàng đầu thế giới và đang được sử dụng bởi một số thương hiệu lớn nhất như Meta, Openai và Microsoft.

AMD Instinct MI325X Is The First AI GPU To Pack 256 GB HBM3e Memory, 288 GB MI355X "CDNA 4" Next Year With 8x Performance Uplift 2

Cam kết của AMD đối với lãnh đạo hiệu suất, di chuyển dễ dàng, hệ sinh thái mở và danh mục đầu tư tập trung vào khách hàng đã dẫn đến sự hỗ trợ rất lớn từ các OEM và đối tác đám mây hàng đầu, và do đó, công ty đã theo dõi nhanh sự ra mắt của giải pháp tiếp theo là AINhu cầu trong ngành phát triển đến độ cao vô song.

AMD MI325X với bộ nhớ 256 GB & kiến trúc cDNA 3

Hiện tại, MI300X của AMD được cho là có hiệu suất cao hơn tới 30% trên một loạt khối lượng công việc cụ thể của AI so với NVIDIA H100.Công việc bổ sung của AMD vào bộ ROCM của họ đang giúp trích xuất nhiều hiệu suất hơn từ máy gia tốc hàng đầu nhưng giờ là lúc để xây dựng phần cứng thậm chí còn tốt hơn với cùng một hỗ trợ phần mềm mạnh mẽ.

AMD Instinct MI325X Is The First AI GPU To Pack 256 GB HBM3e Memory, 288 GB MI355X "CDNA 4" Next Year With 8x Performance Uplift 3

Gặp gỡ AMD Bản năng MI325X, máy gia tốc hoàn toàn mới này được chế tạo dựa trên thiết kế và kiến trúc cơ bản giống như MI300X.Sử dụng kiến trúc GPU cDNA 3, MI325X có thể được xem là nâng cấp giữa chu kỳ, cung cấp 256 GB bộ nhớ HBM3E được thực hiện bằng cách sử dụng băng thông 16-Hi với băng thông nhớ lên tới 6 TB/s, 2,6 PFLOPS của FP8, 1,3Hiệu suất của FP16, tất cả được đóng gói trong một chip với 153 tỷ bóng bán dẫn.

AMD dự kiến sản xuất đầu tiên của GPU AI bản năng MI325X bắt đầu từ Q4 2024 cùng với sự sẵn có của các giải pháp máy chủ tương ứng bắt đầu từ Q1 2025 thông qua các đối tác hàng đầu.Các máy chủ bản năng AI sẽ có tối đa 8 cấu hình MI325X với bộ nhớ HBM3E tối đa 2 Tb, băng thông Fabin Fabin 896 GB/s, băng thông bộ nhớ 48 Tb/s, 20,8 PFLOPS của FP8 và 10,4Mỗi GPU cũng được cấu hình ở 1000W, đây là một sự tăng trưởng lớn so với các cấu hình 750-700W của MI300X.

Đi sâu vào các con số, AMD tuyên bố rằng máy gia tốc GPU AI bản năng MI325X AI phải nhanh hơn 40% so với NVIDIA H200 trong Mixtral 8x7b, nhanh hơn 30% trong Mistral 7B và nhanh hơn 20% trong Meta Llama 3.1 70B LLM.Nền tảng MI325X 8X cũng sẽ cung cấp hiệu suất nhanh hơn 40% so với nền tảng H200 HGX AI trong LLAMA 3.1 405B và nhanh hơn 20% trong thử nghiệm suy luận 70B.Về mặt đào tạo AI, MI325X sẽ cung cấp hiệu suất tương tự hoặc 10% tốt hơn so với các nền tảng H200.

AMD MI355X với bộ nhớ 288 GB & kiến trúc cDNA 4

Năm tới, AMD có kế hoạch ra mắt máy gia tốc GPU MI355X bản năng hoàn toàn mới sẽ nhắm mục tiêu khối lượng công việc AI và điều này sẽ được xây dựng bằng nút quy trình 3NM.GPU sẽ kết hợp kiến trúc cDNA 4.Về mặt thông số kỹ thuật, bộ nhớ sẽ được nâng cấp lên công suất cao hơn, lên tới 288 GB HBM3E trong khi cung cấp hỗ trợ cho các loại dữ liệu FP4/FP6.

AMD nói rằng kiến trúc cDNA 4 mang lại hiệu suất 35X trên cDNA 3 cộng với sự gia tăng 7x tính toán AI, tăng 50% công suất bộ nhớ/băng thông và cũng đi kèm với các tiến bộ hiệu quả mạng mới nhất.

AMD Instinct MI325X Is The First AI GPU To Pack 256 GB HBM3e Memory, 288 GB MI355X "CDNA 4" Next Year With 8x Performance Uplift 4

Về hiệu suất, GPU AI bản năng AMD MI355X AI sẽ cung cấp tới 2,3 PFLOP của hiệu suất FP16, tăng 80% so với MI325X trong khi số liệu FP8 cũng tăng 80% lên 4,6 PFLOP so với MI325X.Hiệu suất tính toán FP6 và FP4 mới được đánh giá ở mức 9.2 PFLOPS.

MI355X sẽ đánh dấu sự gia tăng 50% về cả dung lượng bộ nhớ và băng thông bộ nhớ, với tốc độ tối đa 8 TB/s so với MI300X hiện tại.Các nền tảng đầu tiên có tám trong số các GPU MI355X này sẽ có sẵn vào nửa cuối năm 2025 và cung cấp tới 2,3 TB dung lượng bộ nhớ HBM3E với băng thông 64 TB/s, 18,5 PFLOPS của FP16, 37 PFLOPS của FP8, & 74/FP4 Tính toán.

📢 Liên hệ quảng cáo: 0919 852 204
Quảng cáo của bạn sẽ xuất hiện trên mọi trang!

AMD Instinct MI325X Is The First AI GPU To Pack 256 GB HBM3e Memory, 288 GB MI355X "CDNA 4" Next Year With 8x Performance Uplift 5

ROCM 6.2 tiếp tục quay số hiệu suất AI cho bản năng

Di chuyển trở lại mặt trận phần mềm, AMD đang công bố hệ sinh thái ROCM 6.2 mới nhất của mình, mang lại sự cải thiện hiệu suất trung bình 2,4 lần và lên tới 2,8 lần trên một phạm vi khối lượng công việc AI trong suy luận và cải thiện trung bình 2,4 lần về hiệu suất đào tạo.

Cuối cùng, AMD vẫn đang xác nhận MI400 bản năng được phát hành vào năm 2026 dưới dạng phần "cDNA tiếp theo" và không sử dụng tên kiến trúc UDNA được tiết lộ gần đây.Có lẽ còn quá sớm để đi đặt tên UDNA vì nó chưa được AMD thực hiện chính thức mặc dù một trong những đại diện hàng đầu của họxác nhậnNó vì vậy chúng ta sẽ xem làm thế nào điều đó diễn ra trong tương lai.

AMD Instinct MI325X Is The First AI GPU To Pack 256 GB HBM3e Memory, 288 GB MI355X "CDNA 4" Next Year With 8x Performance Uplift 6

Như đã nói, AMD dường như sẽ tham gia vào cơn sốt AI với các dịch vụ bản năng trong tương lai, mang lại sự cạnh tranh nóng bỏng chống lại những người như Nvidia và cũng giải quyết Intel, những người đang đấu tranh để bắt kịp phần còn lại.

AMD Bản năng MI325X AI GPU Bộ sưu tập gia tốc GPU:

amd-instinct-mi325x-oam-card-center-custom

AMD Bản năng AI Tăng tốc:

Tên gia tốc	AMD Bản năng MI400	AMD Bản năng MI350X	AMD Bản năng MI325X	AMD Bản năng MI300X	AMD Bản năng MI250X
Kiến trúc GPU	CDNA Tiếp theo	CDNA 4	Aqua Vanjaram (cDNA 3)	Aqua Vanjaram (cDNA 3)	Aldebaran (cDNA 2)
Nút quy trình GPU	TBD	3nm	5nm+6nm	5nm+6nm	6nm
Chiplets GPU	TBD	8 (MCM)	8 (MCM)	8 (MCM)	2 (MCM) 1 (mỗi cái chết)
Lõi GPU	TBD	TBD	19.456	19.456	14.080
Tốc độ đồng hồ GPU	TBD	TBD	2100 MHz	2100 MHz	1700 MHz
Tính toán int8	TBD	TBD	2614 ngọn	2614 ngọn	383 ngọn
Tính toán FP6/FP4	TBD	9.2 PFLOPS	N/a	N/a	N/a
Tính toán FP8	TBD	4.6 PFLOPS	2.6 PFLOPS	2.6 PFLOPS	N/a
Tính toán FP16	TBD	2.3 PFLOPS	1.3 PFLOPS	1.3 PFLOPS	383 tflops
Tính toán FP32	TBD	TBD	163,4 TFLOPS	163,4 TFLOPS	95,7 tflops
Tính toán FP64	TBD	TBD	81.7 TFLOPS	81.7 TFLOPS	47.9 TFLOPS
Vram	TBD	288 HBM3E	256 GB HBM3E	192 GB HBM3	128 GB HBM2E
Bộ đệm vô cực	TBD	TBD	256 MB	256 MB	N/a
Đồng hồ bộ nhớ	TBD	8,0 Gbps?	5,9 Gbps	5,2 Gbps	3,2 Gbps
Xe buýt bộ nhớ	TBD	8192-bit	8192-bit	8192-bit	8192-bit
Băng thông bộ nhớ	TBD	8 tb/s	6.0 tb/s	5,3 tb/s	3,2 tb/s
Yếu tố hình thức	TBD	Oam	Oam	Oam	Oam
Làm mát	TBD	Làm mát thụ động	Làm mát thụ động	Làm mát thụ động	Làm mát thụ động
TDP (Max)	TBD	TBD	1000W	750W	560W