Microsoft cho biết DirectX Raytraces 1.2 sẽ cung cấp Uplift hiệu suất lên tới 2,3 lần
Microsoft đã công bố API DirectX Raytracing DXR 1.2, mang đến các tính năng mới giúp cải thiện chất lượng hình ảnh và hiệu suất xử lý đồ họa cao hơn gấp 2.3 lần. AMD, Intel, Nvidia, Qualcomm và các nhà phát triển game như Remedy đang hợp tác tích hợp công nghệ DXR 1.2 vào phần cứng và phần mềm game trong tương lai.
Cập nhật này bao gồm Opacity Micromaps (OMM) và Shader Execution Reordering (SER), hai công nghệ giúp tăng hiệu suất trong các trò chơi raytraced từ 2 đến 2.3 lần. Hai công nghệ này cần được tích hợp vào các trò chơi hoặc engine game để cảm nhận lợi ích về hiệu suất. Một trong những vấn đề chính với hình học alpha-tested như cây cối, hàng rào, tóc, v.v. trong raytracing là các phép tính bổ sung cần thiết để xác định xem ánh sáng có chạm vào bề mặt hay không.
Opacity Micromaps (OMM) cải thiện quy trình xử lý hình học có alpha bằng cách áp dụng một kết cấu có kênh alpha lên bề mặt phẳng, sau đó loại bỏ các pixel dưới ngưỡng trong suốt nhất định. OMM giảm số lần sử dụng shader, giúp tăng hiệu suất. Trong trường hợp tốt nhất, Microsoft cho biết hiệu suất có thể cải thiện gấp 2,3 lần. Tuy nhiên, không phải tất cả các trò chơi và cảnh đều có nhiều yếu tố như cây cối và hàng rào.
Ví dụ, trong khi S.T.A.L.K.E.R. 2 có nhiều cỏ, lá và hàng rào trong hầu hết các cảnh, thì Cyberpunk 2077 lại hầu như không có cây cối. Shader Execution Reordering (SER) là một tính năng phổ biến hơn, giúp sắp xếp lại cách thực thi shader để tránh hiện tượng shader divergence. Shader divergence xảy ra khi các pixel gần nhau cần thực hiện các tác vụ khác nhau, thường gặp trong các cảnh có hiệu ứng raytracing mạnh, như ánh sáng phức tạp, bóng đổ thực tế và phản chiếu chi tiết.
GPU xử lý các shader trong các luồng song song được tổ chức thành nhóm gọi là warps hoặc wavefronts. Lý tưởng nhất, tất cả các luồng trong cùng một nhóm thực hiện các lệnh giống nhau đồng thời để tối ưu hiệu suất GPU. Sự phân nhánh shader xảy ra khi các luồng trong cùng một warp hoặc wavefront cần thực hiện các lệnh khác nhau, khiến việc thực thi đồng thời không thể thực hiện, buộc GPU phải xử lý từng đường lệnh riêng biệt, làm cho một số luồng bị nhàn rỗi và tăng độ trễ.
Theo Microsoft, SER nhóm các tác vụ shader tương tự lại với nhau, giúp giảm sự phân tán và tối đa hóa hiệu suất GPU, tăng tốc độ kết xuất gấp đôi. Về hỗ trợ phần cứng, tình hình khá đa dạng, điều này thường thấy với các tính năng API mới. Tất cả các GPU Nvidia từ dòng Turing GeForce RTX 20 trở về sau đều hỗ trợ Opacity Micromaps (OMM), vì vậy các card đồ họa này có thể cải thiện hiệu suất khi các nhà phát triển game tích hợp chúng vào trò chơi.
Intel cho biết các GPU Celestial Xe3 thế hệ tiếp theo của họ sẽ hỗ trợ OMM. Các GPU của Nvidia đã hỗ trợ Shader Execution Reordering (SER) từ dòng GeForce RTX 40-series Ada Lovelace. Intel mong muốn hỗ trợ SER khi nó có sẵn trong Agility SDK trong tương lai, nhưng chưa rõ liệu nó có được hỗ trợ trên các GPU Arc Alchemist hay Arc Battlemage hay không. AMD dường như không hỗ trợ OMM hoặc SER trên các GPU RDNA 234, mặc dù Microsoft cho biết AMD đang hợp tác với họ để thúc đẩy việc áp dụng rộng rãi các công nghệ này.
AMD có một số tối ưu hóa lịch trình có thể giống với cách hoạt động của SER, vì vậy nếu các nhà phát triển game tối ưu hóa cho GPU Radeon, hiệu suất có thể được cải thiện. Qualcomm không hỗ trợ OMM hay SER, nhưng họ cho biết sẽ hỗ trợ trên GPU tích hợp thế hệ tiếp theo. Phiên bản thử nghiệm của DXR 1.2 sẽ ra mắt vào tháng 4 năm 2025.
Nguồn: www.tomshardware.com/pc-components/gpus/microsoft-says-directx-raytracing-1-2-will-deliver-up-to-2-3x-performance-uplift