AMD tuyên bố RX 7900 XTX vượt trội hơn RTX 4090 trong điểm chuẩn DeepSeek
AMD đã công bố các bài kiểm tra hiệu suất của card đồ họa RX 7900 XTX so với Nvidia RTX 4090 và RTX 4080 Super bằng mô hình AI DeepSeeks. Theo David McAfee trên X, GPU dựa trên RDNA3 đã vượt trội hơn RTX 4090 tới 13% và RTX 4080 Super tới 34%. AMD đã thử nghiệm ba GPU này với nhiều LLM và các tham số khác nhau bằng DeepSeek R1. RX 7900 XTX đạt thành công lớn nhất khi so với RTX 4090 khi sử dụng DeepSeek R1 Distill Qwen 7B, vượt qua GPU Ada Lovelace tới 13%.
AMD đã thử nghiệm ba cấu hình LLM khác nhau so với RTX 4090. RX 7900 XTX nhanh hơn RX 4090 trong hai cấu hình - nhanh hơn 11% với Distill Llama 8B và 2% với Distill Qwen 14B. RX 4090 nhanh hơn 4% so với RX 7900 XTX trong một cấu hình với Distill Qwen 32B. DeepSeek hoạt động rất tốt trên AMDRadeon 7900 XTX. Tìm hiểu cách chạy trên GPU Radeon và APU Ryzen AI tại đây.
AMD đã thử nghiệm ba cấu hình so với RTX 4080 Super. RX 7900 XTX vượt trội hơn RTX 4080 Super 34 điểm khi sử dụng DeepSeek R1 Distill Qwen 7B. Điểm chênh lệch giảm còn 27 với Distill Llama 8B, và 22 với Distill Qwen 14B. Tuy nhiên, cần thận trọng vì không thể chắc chắn về cấu hình của GPU Nvidia trong các bài thử nghiệm do AMD thực hiện.
Không phải tất cả các tác vụ AI đều tận dụng tối đa khả năng tính toán của GPU. Trong các bài kiểm tra Stable Diffusion, chúng tôi nhận thấy rằng nó không sử dụng phép toán FP8 hay mã TensorRT. Mặc dù RX 7900 XTX không thường được sử dụng như một bộ xử lý AI chuyên dụng, nhưng kiến trúc của nó hoàn toàn có khả năng xử lý các tác vụ AI. Kiến trúc RDNA 3 mà RX 7900 XTX dựa trên có khả năng thực hiện các phép toán ma trận và hỗ trợ BF16 cũng như INT8.
AMD đã chính thức giới thiệu thuật ngữ AI Accelerator trong RDNA 3 để thể hiện khả năng xử lý AI của mình. Card đồ họa RX 7900 XTX có 192 AI accelerators. Gần đây, AMD đã công bố hướng dẫn cách khách hàng có thể chạy DeepSeek R1 trên phần cứng tiêu dùng AMD tương thích, bao gồm cả RX 7900 XTX. DeepSeek R1 là một mô hình AI mới, cung cấp hiệu suất tương đương với các mô hình AI hàng đầu phương Tây nhưng với chi phí tính toán thấp hơn.
DeepSeek R1 sử dụng nhiều tối ưu hóa phần cứng để giúp mô hình của nó chạy nhanh gấp 11 lần so với đối thủ, bao gồm việc sử dụng ngôn ngữ lập trình PTX kiểu assembly của Nvidia.
Nguồn: www.tomshardware.com/tech-industry/artificial-intelligence/amd-claims-rx-7900-xtx-outperforms-rtx-4090-in-deepseek-benchmarks