AMD tiết lộ ROCM 7: 3X Hiệu suất nâng cao cho AI, thêm hỗ trợ cho GPU Radeon
Tuần này, AMD đã giới thiệu phiên bản 7 của bộ phần mềm mã nguồn mở ROCm Radeon, cải thiện hiệu suất suy diễn AI trên phần cứng hiện có so với ROCm 6, hỗ trợ công việc phân tán và mở rộng sang Windows và GPU Radeon. Ngoài ra, ROCm 7 còn hỗ trợ định dạng độ chính xác thấp FP4 và FP6 cho các bộ xử lý Instinct MI350XMI355X mới nhất.
Sự thay đổi lớn nhất của ROCm 7 cho máy tính cá nhân là việc mở rộng ROCm sang Windows và GPU Radeon, cho phép sử dụng cả GPU rời và tích hợp cho các tác vụ AI, nhưng chỉ trên máy tính Ryzen. Từ nửa cuối năm 2025, các nhà phát triển sẽ có thể xây dựng và chạy chương trình AI trên máy tính để bàn và laptop Ryzen với GPU Radeon, điều này có thể rất quan trọng cho những ai muốn chạy các mô hình AI cao cấp tại chỗ.
Một trong những lý do khiến AMD gặp khó khăn trong thị trường phần cứng AI là phần mềm chưa hoàn thiện. Tuy nhiên, tình hình đang cải thiện với sản phẩm Instinct MI300X sử dụng ROCm 7, cho hiệu suất suy diễn cao hơn 3,5 lần và tốc độ đào tạo cao hơn 3 lần so với ROCm 6. AMD đã thực hiện các thử nghiệm với máy 8 chiều Instinct MI300X chạy các mô hình Llama 3.1-70B, Qwen 72B và Deepseek-R1 với kích thước lô từ 1 đến 256, chỉ khác biệt là việc sử dụng ROCm 7 thay vì ROCm 6.
AMD cho biết những cải tiến này nhờ vào việc tối ưu hóa sử dụng GPU và di chuyển dữ liệu, nhưng không cung cấp thêm chi tiết. Phiên bản ROCm 6.4 mới nhất của AMD vẫn chưa hỗ trợ RDNA 4. AMD công bố MI350X và MI355X, cho biết hiệu suất tăng gấp 4 lần so với thế hệ trước và tốc độ suy diễn nhanh hơn 35 lần. Các mô hình Stable Diffusion tối ưu của AMD đạt hiệu suất tăng đến 3.3 lần trên Ryzen và Radeon. Phiên bản mới cũng hỗ trợ suy diễn phân tán thông qua tích hợp với các framework mở như vLLM, SGLang và llm-d.
📢 Liên hệ quảng cáo: 0919 852 204
Quảng cáo của bạn sẽ xuất hiện trên mọi trang!
AMD đã hợp tác với các đối tác để phát triển các thành phần và nguyên lý chung, giúp phần mềm mở rộng hiệu quả trên nhiều GPU. Hơn nữa, ROCm 7 bổ sung hỗ trợ cho các loại dữ liệu có độ chính xác thấp hơn như FP4 và FP6, mang lại cải tiến rõ rệt cho các bộ vi xử lý Instinct MI350X và MI355X dựa trên CDNA 4, cũng như các sản phẩm MI400X và MI500X thế hệ tiếp theo dựa trên CDNA 5 sẽ thay thế dòng MI300 vào năm 2026 và 2027.
Hình ảnh: AMD. Bên cạnh ROCm 7, AMD đã giới thiệu giải pháp ROCm Enterprise AI MLOps dành cho doanh nghiệp. Nền tảng này cung cấp công cụ để tinh chỉnh mô hình bằng cách sử dụng dữ liệu theo miền và hỗ trợ tích hợp vào các quy trình làm việc có cấu trúc và không có cấu trúc. AMD cho biết họ đang hợp tác với các đối tác trong hệ sinh thái để xây dựng các triển khai tham khảo cho các ứng dụng như chatbot và tóm tắt tài liệu, nhằm giúp phần cứng AMD phù hợp cho triển khai nhanh chóng trong môi trường sản xuất.
Cuối cùng, AMD đã ra mắt Developer Cloud, cung cấp quyền truy cập vào phần cứng MI300X với nhiều cấu hình khác nhau, từ MI300X đơn với 192 GB bộ nhớ đến cấu hình tám MI300X với 1536 GB bộ nhớ. AMD cung cấp 25 giờ sử dụng miễn phí ban đầu, và có thêm tín dụng qua các chương trình dành cho nhà phát triển. Hỗ trợ sớm cho các hệ thống dựa trên MI350X cũng đang được lên kế hoạch.
Theo dõi Toms Hardware trên Google News để nhận tin tức, phân tích và đánh giá mới nhất. Đừng quên nhấn nút Theo dõi.
Nguồn: www.tomshardware.com/pc-components/gpus/amd-unveils-rocm-7-new-platform-boosts-ai-performance-up-to-3-5x-adds-radeon-gpu-support