Công nghệ mới của NVIDIA làm giảm việc sử dụng VRAM lên tới 96% trong bản demo beta
Công nghệ NTC (Neural Texture Compression) của Nvidia đã được kiểm tra hiệu suất trong các tác vụ 3D thực tế. Compusemble đã thử nghiệm công nghệ nén bộ nhớ mới của Nvidia trên RTX 4090 ở độ phân giải 1440p và 4K, cho thấy giảm 96% kích thước bộ nhớ texture so với các kỹ thuật nén texture thông thường. Bạn có thể xem kết quả trong video dưới đây.
Đoạn video trên YouTube giới thiệu về tính năng RTX Neural Texture Compression (NTC) BETA trên card đồ họa RTX 4090. Compusemble đã thử nghiệm NTC trong hai chế độ: NTC chuyển đổi sang BCn và Inference trên mẫu. Chế độ đầu tiên chuyển đổi kết cấu thành BCn khi tải, trong khi chế độ thứ hai chỉ giải nén các texel cần thiết để hiển thị một góc nhìn cụ thể, giúp giảm kích thước bộ nhớ kết cấu. Ở độ phân giải 1440p với DLSS, chế độ NTC chuyển đổi sang BCn đã giảm kích thước bộ nhớ kết cấu của ứng dụng thử nghiệm từ 272MB xuống còn 98MB, giảm 64%.
Tuy nhiên, việc suy diễn NTC trên chế độ mẫu đã giảm kích thước texture xuống chỉ còn 11.37MB, tương ứng với mức giảm 95.8% so với nén không sử dụng neural và 88% so với chế độ nén neural trước đó. Các bài kiểm tra Compusembles cho thấy hiệu suất giảm nhẹ khi kích hoạt nén texture neural RTX. Tuy nhiên, phần mềm beta này được chạy trên RTX 4090 thế hệ trước, không phải RTX 5090 hiện tại, nên có khả năng giảm hiệu suất sẽ ít hơn với kiến trúc mới.
Chế độ NTC chuyển sang BCn chỉ giảm nhẹ FPS trung bình so với khi tắt NTC, nhưng FPS thấp nhất tốt hơn rõ rệt so với nén texture thông thường. NTC khi suy diễn ở chế độ mẫu giảm mạnh nhất, từ khoảng 1.600 FPS xuống còn 1.500 FPS, và FPS thấp nhất giảm xuống khoảng 840 FPS. Giảm dung lượng bộ nhớ ở 1440p với TAA thay vì DLSS vẫn giữ nguyên, nhưng hiệu suất của GPU lại khác nhau.
Cả ba chế độ hoạt động nhanh hơn đáng kể so với DLSS, đạt gần 2000 FPS. NTC inference trên chế độ mẫu đạt khoảng 1,300 FPS, tăng mạnh từ 840 FPS. Không ngạc nhiên khi nâng độ phân giải lên 4K khiến hiệu suất giảm rõ rệt. Khi bật DLSS upscaling, FPS trung bình trong chế độ NTC được chuyển mã sang BCn là khoảng 1,100 FPS, còn trong chế độ NTC inference trên mẫu là dưới 1,000 FPS.
Trong cả hai chế độ, mức thấp nhất là khoảng 500 FPS. Việc tắt DLSS để sử dụng độ phân giải gốc với TAA đã mang lại mức FPS trung bình khoảng 1,700 FPS với NTC được mã hóa sang chế độ BCn, và khoảng 1,500 FPS với NTC suy diễn ở chế độ mẫu. Mức thấp nhất của chế độ NTC trước đó là dưới 1,100 FPS, trong khi mức thấp nhất của chế độ sau là dưới 800 FPS. Cuối cùng, Compusemble đã thử nghiệm các vector hợp tác với NTC suy diễn ở chế độ mẫu tại độ phân giải 4K với TAA.
Việc kích hoạt vector hợp tác giúp đạt được tỷ lệ khung hình trung bình khoảng 1,500 FPS, trong khi khi tắt, tỷ lệ này giảm xuống dưới 650 FPS. Các giá trị thấp nhất cũng tương tự, với khoảng 750 FPS khi bật và trên 400 FPS khi tắt. Kết quả từ các bài kiểm tra RTX NTC cho thấy công nghệ nén hình ảnh của Nvidia có thể giảm đáng kể dung lượng bộ nhớ của các ứng dụng 3D, nhưng lại ảnh hưởng đến hiệu suất, đặc biệt là trong chế độ suy diễn.
Điểm thú vị nhất là hiệu suất của DLSS so với độ phân giải gốc. Sự gia tăng đáng kể về tỷ lệ khung hình ở độ phân giải gốc cho thấy các lõi tensor xử lý RTX NTC đang hoạt động hết công suất, có thể gây cản trở hiệu suất DLSS, đủ để làm nghẽn các lõi shader. Nếu không, chúng ta lẽ ra đã thấy chế độ DLSS hoạt động với tỷ lệ khung hình cao hơn so với các bài kiểm tra TAA 4K gốc.
RTX Neural Texture Compression đã được phát triển trong vài năm qua. Công nghệ mới này sử dụng lõi tensor trong các GPU Nvidia hiện đại để nén các ứng dụng 3D và kết cấu game, thay vì sử dụng mã hóa cắt khối truyền thống. RTX NTC là bước nâng cấp lớn đầu tiên trong công nghệ nén kết cấu kể từ những năm 1990, cho phép kết cấu có độ phân giải cao gấp bốn lần so với khả năng của các GPU hiện tại.
Công nghệ này đang trong giai đoạn beta và chưa có ngày phát hành cụ thể. Đặc biệt, yêu cầu tối thiểu cho NTC có vẻ khá thấp. Trang GitHub của Nvidia cho RTX NTC xác nhận rằng yêu cầu GPU tối thiểu là GPU dòng RTX 20. Tuy nhiên, công nghệ này cũng đã được xác nhận hoạt động trên các GPU dòng GTX 10, AMD Radeon RX 6000 và Arc A-series, cho thấy có khả năng công nghệ sẽ phổ biến trên các GPU không phải RTX và cả trên console.
Nguồn: www.tomshardware.com/pc-components/gpus/nvidias-new-tech-reduces-vram-usage-by-up-to-96-percent-in-beta-demo-rtx-neural-texture-compression-looks-impressive