NVIDIA RTX 5090 Rõ ràng xử lý việc giải nén GPU DirectStorage tốt hơn RTX 4090
API DirectStorage của Microsoft đã gặp một số vấn đề hiệu suất kỳ lạ với việc giải nén bằng GPU. Tuy nhiên, YouTuber Compusemble cho rằng GPU GeForce RTX 5090 của Nvidia hoạt động tốt hơn trong việc giải nén GPU so với thế hệ RTX 4090 trước đó, cho thấy khoảng cách hiệu suất ít hơn khi sử dụng giải nén bằng GPU so với CPU. YouTuber này đã benchmark hai trò chơi hỗ trợ DirectStorage DS, là Ratchet and Clank Rift Apart và Spider-Man 2.
Các trò chơi đã được thử nghiệm với giải nén GPU DirectStorage và giải nén CPU trên RTX 5090 ở độ phân giải 4K, 1440p và 1080p. Không có bài thử nghiệm nào của RTX 4090 để so sánh, điều này giả định rằng DS có thể gây mất hiệu suất. Trong Ratchet and Clank Rift Apart, RTX 5090 cho ra tỷ lệ khung hình trung bình gần như giống hệt nhau khi sử dụng giải nén GPU so với giải nén CPU ở độ phân giải 4K gốc.
Tốc độ khung hình trung bình chỉ nhanh hơn 0.96 với giải nén bằng CPU, trong khi chỉ số 1 lows cao hơn gần 10 khi sử dụng CPU. Điều này cho thấy, khi tải GPU cao hơn (ví dụ ở 4K), việc giải nén trên GPU có thể làm giảm hiệu suất. Ở độ phân giải 1440p, tình hình thay đổi, mặc dù chênh lệch không lớn, nhưng hiệu suất tổng thể, đặc biệt là chỉ số 1 lows, lại nghiêng về phía giải nén bằng GPU.
Tính năng giải nén GPU DirectStorage trên RTX 5090 mang lại tỷ lệ khung hình trung bình cao hơn 1.19 lần và 1 lows tốt hơn 5.26 lần so với giải nén bằng CPU. Ở độ phân giải 1080p, giải nén GPU cũng thắng với tỷ lệ khung hình trung bình cao hơn 0.48 lần và 1 lows tốt hơn 11.11 lần.
19 5.26 Ratchet and Clank 1080p 0.48 11.11 Spider-Man 2 4K -7.58 -9.53 Spider-Man 2 1440p -3.41 -12.50 Spider-Man 2 1080p -3.19 -8.45. Ngược lại, Spider-Man 2 cho thấy hiệu suất kém hơn với nén GPU ở cả ba độ phân giải. Ở 4K, RTX 5090 có hiệu suất trung bình FPS cao hơn 8.2 và 10.53 trong các khung hình thấp nhất với nén CPU. Ở 1440p, nén CPU có hiệu suất cao hơn 3.
Khi so sánh, hiệu suất trung bình FPS của RTX 5090 cao hơn 53 và cao hơn 14.29 ở mức 1 lows. Tại độ phân giải 1080p, việc giải nén bằng CPU cho hiệu suất trung bình FPS cao hơn 3.3 và cao hơn 9.23 ở mức 1 lows so với giải nén bằng GPU. Consumable cho rằng hiệu suất của RTX 5090 ổn định hơn với cả giải nén bằng GPU và CPU so với RTX 4090 cũ hơn. Một video cũ mà anh ấy ghi lại đã chứng minh điều này, cho thấy RTX 4090 có sự giảm hiệu suất lớn hơn khi chuyển đổi giữa giải nén bằng CPU và GPU, đặc biệt trong Spider-Man 2.
Với RTX 4090 ở độ phân giải 4K trong Spider-Man 2, tốc độ khung hình trung bình cao hơn 10.34 và tốc độ khung hình thấp hơn 17.95 với việc giải nén CPU. Ở 1440p, tốc độ khung hình trung bình cao hơn 6.25 và tốc độ khung hình thấp hơn 18.87. Ở 1080p, tốc độ khung hình trung bình cao hơn 3.25 và tốc độ khung hình thấp hơn 25.86 với giải nén CPU. RTX 5090 có sức mạnh tính toán cao hơn 105 TFLOPS FP32 so với 83 TFLOPS và băng thông bộ nhớ cũng lớn hơn nhiều.
RTX 5090 có 8 TB bộ nhớ và 33 VRAM hơn so với RTX 4090, giúp giảm tác động của việc giải nén GPU. Nó sở hữu giao diện bộ nhớ rộng 512-bit và các mô-đun GDDR7 28 Gbps, mang lại băng thông bộ nhớ cao hơn 78 so với RTX 4090. Việc giải nén GPU rất tốn tài nguyên bộ nhớ vì các tài sản cần được truyền vào bộ nhớ GPU để quá trình giải nén hoạt động. Ở độ phân giải thấp, nơi RTX 5090 thường bị giới hạn bởi CPU, nó có thể xử lý giải nén tốt hơn.
Kiến trúc có thể là một yếu tố ảnh hưởng, vì RTX 5090 dường như không gặp vấn đề với việc giải nén GPU như RTX 4090. Chúng ta mong muốn thấy nhiều game hơn sử dụng DirectStorage để cải thiện thời gian tải và hiệu suất tổng thể – thời gian tải dài hơn nhưng ổn định sẽ tốt hơn là khung hình không nhất quán. RTX 5090 vượt qua RTX 4090 với 36 điểm trong bài kiểm tra Blender, trong khi RTX 5090D nhanh hơn RTX 4090D tới 40%. Công nghệ mới của Nvidia giảm mức sử dụng VRAM lên tới 96% trong bản demo beta – RTX Neural Texture Compression trông ấn tượng.
Nguồn: www.tomshardware.com/pc-components/gpus/nvidia-rtx-5090-allegedly-handles-directstorage-gpu-decompression-better-than-rtx-4090