Điểm chuẩn Blackwell RTX 50-series yêu cầu một số thay đổi
GPU Blackwell RTX 50-series của Nvidia sẽ cần công cụ mới để benchmark, đặc biệt với DLSS 4 Multi Frame Generation MFG. Đây là điểm chính từ buổi cuối của Ngày Biên tập viên Nvidia vào ngày 8 tháng 1 năm 2025, nơi hãng đã thông báo cho hàng trăm phóng viên và người ảnh hưởng về rendering thần kinh, kiến trúc RTX Blackwell, các thẻ Founders Edition RTX 50-series, PC RTX AI, AI tạo sinh cho game, và RTX Blackwell cho các chuyên gia và nhà sáng tạo.
Nhiều thông tin cốt lõi không mới, nhưng chúng ta hãy xem xét chi tiết. Đầu tiên, hiệu suất không chỉ là số khung hình mỗi giây mà còn phải xem xét độ trễ và chất lượng hình ảnh. Đây là những kiến thức cơ bản về đánh giá hiệu suất, một chủ đề mà tôi rất đam mê khi đang thử nghiệm nhiều GPU nhất có thể để chuẩn bị cho việc ra mắt Arc B570 và các dòng RTX 5090, 5080, cũng như AMD RDNA4 và RX 9070 XT, RX 9070.
Để đánh giá hiệu suất chính xác, cần có phương pháp nhất quán, lựa chọn trò chơi và ứng dụng phù hợp, cùng với hiểu biết về ý nghĩa của các con số. FPS trung bình dễ hiểu nhất, nhưng chúng tôi cũng báo cáo FPS thấp nhất, tức là hiệu suất trung bình của 1% khung hình tệ nhất. Tôi đã viết một script để phân tích các tệp CSV nhằm tính toán điều này, vì FPS tối thiểu thuần túy có thể dao động lớn qua nhiều lần chạy benchmark.
Một khung hình kém có thể làm giảm FPS tối thiểu từ 100 xuống chỉ còn vài chục. Việc chạy nhiều lần chỉ giúp phần nào. Thay vào đó, chúng ta tìm giá trị phần trăm 99, tức là thời gian khung hình mà chỉ có 1% khung hình tệ nhất nằm trong đó, sau đó chia số lượng khung hình này cho tổng thời gian. Đây là một thước đo tốt về mức độ nhất quán của trò chơi. Có thể đào sâu hơn không? Có, nhưng điều này đòi hỏi nhiều thời gian hơn và thông tin thu được thường không tỷ lệ thuận với công sức bỏ ra.
Việc kiểm tra một GPU trong bộ thử nghiệm hiện tại của tôi mất khoảng một ngày làm việc, tức 10 giờ, với hơn 20 trò chơi và nhiều ứng dụng khác nhau, cùng với nhiều lần chạy cho mỗi bài thử. Trong tình huống hiện tại, khi cần kiểm tra lại trên nhiều GPU, không thể chỉ tăng thời gian thử nghiệm lên 50%. Công cụ FrameView của Nvidia, mà tôi đã sử dụng trong hai năm qua, rất hữu ích cho việc ghi lại thời gian khung hình và thông tin khác như mức sử dụng CPU, GPU, tần số GPU, nhiệt độ GPU và cả công suất GPU theo thời gian thực nếu bạn có bộ chuyển đổi PCAT.
Có nhiều phép đo được cung cấp, bao gồm MsBetweenPresent mặc định của PresentMon và MsBetweenDisplayChange mới hơn của Nvidia. Nvidia khuyên mọi người nên sử dụng MsBetweenDisplayChange khi thực hiện benchmark vì nó chính xác hơn. Mặc dù thường không có sự khác biệt lớn giữa hai cách đo, nhưng Nvidia cho biết cách này sẽ giúp ghi lại chính xác hơn các khung hình bị rơi, biến đổi thời gian khung hình và phương pháp đo mới được sử dụng bởi MFG.
Nếu bạn muốn có hiệu suất khung hình DLSS 4 — vì khung hình do AI tạo ra không giống như khung hình được render hoàn toàn — bạn sẽ cần chuyển đổi. Điều này khá đơn giản và chúng tôi dự định thực hiện, dù có thử nghiệm với MFG hay không. Nvidia cũng đặt ra câu hỏi liệu chất lượng hình ảnh có quan trọng không. Câu trả lời là có, nhưng đây là nơi chúng tôi gặp vấn đề.
Khi mọi thứ hiển thị giống nhau, chúng ta nên có kết quả tương tự, chỉ khác biệt nhỏ. Tuy nhiên, với sự phát triển của công nghệ nâng cấp và tạo khung hình, cũng như cách thực hiện ray tracing và giảm nhiễu, việc này trở nên phức tạp. Do đó, bạn chỉ cần ghi lại video của từng thử nghiệm và phân tích chúng. Nghe có vẻ đơn giản, nhưng theo kinh nghiệm, việc ghi lại những video này đã làm tăng thời gian thử nghiệm lên 50%.
Phân tích video và tạo nội dung hữu ích từ chúng có giá trị hơn cho từng trò chơi riêng lẻ, thay vì cho các đánh giá đồ họa tổng quát. Tôi ước gì không phải như vậy. Tôi mong muốn có thể thu thập tất cả các chỉ số từ mọi cấu hình với so sánh chất lượng hình ảnh rõ ràng qua tất cả các cài đặt. Nhưng điều đó không khả thi và thật ngu ngốc khi nghĩ khác. Vì vậy, hiện tại, các đánh giá GPU của chúng tôi sẽ chủ yếu tập trung vào hiệu suất không nâng cấp và không tạo khung, nơi mà chất lượng hình ảnh không nên khác biệt nhiều.
Chúng ta có thể thử nghiệm việc nâng cấp và tạo khung hình, nhưng đó sẽ là yếu tố thứ yếu. Điều này là công bằng, vì dù có quảng cáo nhiều đến đâu, việc tạo khung hình khác với việc kết xuất và nâng cấp. Nó làm tăng độ trễ, và mặc dù làm cho hình ảnh trên màn hình mượt mà hơn, 100 FPS với tạo khung hình không giống như 100 FPS không có tạo khung hình — và chắc chắn không giống với 100 FPS với tạo khung hình đa khung. Nếu không có tạo khung hình, thông tin từ người dùng sẽ được lấy mẫu mỗi 10ms.
Với framegen, tần suất giảm xuống còn 20ms. Với MFG, có thể giảm tới 40ms. Việc nâng cấp hình ảnh là một câu chuyện khác. Những gì chúng ta thấy trong quá khứ cho thấy DLSS nâng cấp hình ảnh chất lượng vượt trội hơn FSR23 và XeSS. Hiện tại, Nvidia sắp cải tiến DLSS để nâng cao độ trung thực của hình ảnh.
Nguồn: www.tomshardware.com/pc-components/gpus/benchmarking-blackwell-and-rtx-50-series-gpus-with-multi-frame-generation-will-require-some-changes-according-to-nvidia