Như vậy là tối qua 23/1 theo giờ Việt Nam, lần lượt những trang tin, các tờ báo công nghệ nước ngoài, rồi cả những kênh YouTube của những reviewer linh kiện PC trên toàn thế giới đã đăng tải những bài đánh giá chi tiết RTX 5090, sản phẩm mạnh nhất của dàn chip xử lý đồ họa kiến trúc Blackwell sắp bán ra thị trường vào ngày 30/1 tới.
Chi tiết RTX 50, GPU Blackwell gaming của Nvidia: Tăng sức mạnh xử lý AI, kiến trúc thay đổi mạnh
Tóm tắt đơn giản những đánh giá rất dài và chi tiết của các reviewer:
RTX 5090 giống như một phiên bản nâng cấp toàn diện cả về mặt phần cứng lẫn phần mềm xử lý đồ họa máy tính. Chính vì những thay đổi quá lớn trong cả kiến trúc nhân xử lý cũng như cách vận hành những tính năng và mô hình AI để cải thiện cả độ phân giải lẫn tốc độ khung hình, nên những bài thử nghiệm cơ bản, phổ biến nhất khi đánh giá sức mạnh chip xử lý đồ họa sẽ chỉ tạo ra những con số không mô tả toàn diện những cải thiện hiệu năng của thế hệ chip mới.
Nói cách khác, anh em có thể hiểu như thế này. RTX 5090 là một mẫu card đồ họa phù hợp nhất với độ phân giải 4K của màn hình cũng như TV ở nhà anh em. Và thứ hai, nếu chỉ so sánh sức mạnh xử lý rasterization, RTX 5090 sẽ chỉ tạo ra chênh lệch hiệu năng khoảng 30 đến 35% so với RTX 4090. Thứ tạo ra khác biệt ở đây là những công nghệ xử lý mới, từ Multi-Frame Generation của DLSS 4, cho tới cả gói ứng dụng RTX Neural Shading, để tạo ra tốc độ khung hình cải thiện hơn nhiều so với thế hệ card đồ họa kiến trúc Ada Lovelace.
Đầu tiên là những benchmark phái sinh với những công cụ và bài thử nghiệm của 3DMark. Như tiêu đề, với mức giá cao hơn khoảng 30%, nhiều nhân CUDA hơn khoảng 30% so với RTX 4090, và TDP 575W cao hơn khoảng 30% so với flagship đời trước, RTX 5090 tạo ra những điểm số benchmark chênh lệch chừng hơn 30% so với RTX 4090, những cải thiện rất tuyến tính thay vì tăng trưởng theo cấp số nhân khi ứng dụng cả kiến trúc nhân chip xử lý cũng như tiến trình gia công bán dẫn mới:
Rồi tới khi mở những trò chơi để thử nghiệm ở cả ba độ phân giải 1080p, 1440p và 2160p, cải thiện về tốc độ khung hình cũng chỉ ở ngưỡng khoảng 30%. Xin phép nhắc lại, đó đều chỉ là những chênh lệch hiệu năng khi ép card đồ họa xử lý ở đồ họa native của màn hình, không có DLSS can thiệp để hạ độ phân giải mà card đồ họa xử lý trò chơi, và tắt cả ray tracing, chỉ đánh giá sức mạnh rasterization của hàng chục nghìn nhân CUDA của RTX 5090:
Có một tựa game vẫn có thể làm khó được RTX 5090, mẫu card đồ họa giá cả hai nghìn USD ở độ phân giải 4K. Đó chính là Black Myth: Wukong. Ngay cả khi tắt ray tracing, chỉ để hình ảnh ở chất lượng Cinematic, tốc độ khung hình không được tròn 60 FPS:
Nhưng ở một khía cạnh khác, khi mở Cyberpunk 2077 lên, ngay cả ở độ phân giải 4K, chưa bật ray tracing, đặt chất lượng đồ họa ở ngưỡng Ultra, không có DLSS hay Frame Generation, RTX 5090 là chiếc card đồ họa đầu tiên từ trước tới nay chạm được tới ngưỡng FPS ba con số:
Trang PCWorld mô tả như thế này khi benchmark sức mạnh xử lý game của RTX 5090 chỉ xét trên khía cạnh rasterization truyền thống:
"Thời điểm RTX 4090 chính thức ra mắt, nó luôn là sản phẩm vô địch nếu nói về một mẫu GPU gaming mạnh nhất thị trường. Giờ thì mọi chuyện đã khác. Dù rằng với việc sử dụng chung tiến trình gia công bán dẫn TSMC 4N để sản xuất những chip xử lý thế hệ Blackwell, nên Nvidia gần như rất khó để đưa vào thế hệ chip mới những cải tiến đáng kể vào die chip. Thay vào đó, Nvidia quyết định cải tiến toàn bộ đường dẫn tập lệnh xử lý các tác vụ, nhồi thêm 33% nhân CUDA, đẩy TDP lên con số gây choáng 575W, cùng với đó là thế hệ nhân ray tracing và nhân xử lý AI mới.
Trong những trò chơi không ứng dụng ray tracing hay DLSS, chỉ lấy nhân CUDA ra xử lý đồ họa render hình ảnh lên màn hình, RTX 5090 gần như không khác gì một bản nâng cấp ở mức trung bình về mặt hiệu năng. Tính trung bình tốc độ khung hình, RTX 5090 mạnh hơn RTX 4090 khoảng 27% trong những trò chơi chúng tôi thử nghiệm. Nhưng con số thực tế nếu xét riêng từng trò chơi lại khác biệt. Nếu như Cyberpunk 2077 mạnh hơn tới 50%, Shadow of the Tomb Raider mạnh hơn 32%, nhưng Assassin's Creed Valhalla và Call of Duty: Black Ops 6 chỉ cải thiện được tốc độ khung hình 15 và 12% mà thôi."
Còn trong khi đó, nếu mở ray tracing trên một số tựa game đẹp và đòi hỏi cấu hình PC mạnh nhất hiện giờ, dù tốc độ khung hình thực sự ấn tượng, nhưng nếu đem so sánh với RTX 4090, thì tỷ lệ cải thiện tốc độ khung hình không phải con số khiến tất cả trầm trồ:
Cá biệt, nếu có review card đồ họa hay phần cứng PC, có lẽ giờ nên né Spider-Man Remastered, vì ở độ phân giải 1080p và 1440p, game gặp lỗi với driver đồ họa, lúc nào cũng khóa tốc độ khung hình ở ngưỡng 128 FPS. Như anh em có thể thấy dưới đây, vì lỗi ấy mà hiệu năng của RTX 4080 Super với RTX 5090 y hệt nhau. Những vấn đề với Spider-Man Remastered trước mình cũng gặp phải, nhưng lỗi theo kiểu khác, bật hay tắt DLSS và Frame Generation lên, nếu không khởi động lại game, thì khác biệt về tốc độ khung hình gần như là không có:
Thứ tạo ra ấn tượng mạnh nhất đối với các reviewer thực hiện đánh giá chi tiết RTX 5090 có lẽ là tính năng Multi-Frame Generation của DLSS 4, với khả năng tạo sinh tối đa 3 khung hình mới hoàn toàn dựa vào mô hình AI, và dựa vào khung hình mà CPU và GPU đã tạo ra trước đó.
Cứ mỗi một khung hình mà CPU vẽ vector rồi GPU đắp texture và shading, chip Nvidia sẽ dựa vào đó, vận hành thuật toán AI để tạo ra 3 khung hình mới, cùng lúc vận hành đồng thời những tính năng khác của gói ứng dụng DLSS, để tốc độ khung hình tăng lên nhiều lần. Nhờ đó, RTX 5090 sẽ chơi được game ở độ phân giải 4K, tốc độ 240 FPS, đương nhiên là nếu như anh em có màn hình đáp ứng được hai thông số này.
Khác biệt cơ bản nhất về cách Multi-Frame Generation vận hành trên DLSS 4 so với Frame Generation của DLSS 3 chính là cách thuật toán vận hành. Trước đây, đối với Frame Generation trên DLSS 3, ra mắt cùng thế hệ card đồ họa RTX 40 series hồi cuối năm 2022, cụm nhân Optical Flow Accelerator sẽ lấy những dữ liệu của game như motion vector và chiều sâu vật thể trong mỗi khung hình, để tạo ra một khung hình nữa dựa trên những gì CPU và GPU tạo ra.
Còn bây giờ, Multi-Frame Generation sẽ vận hành ngay trên phần cứng nhân tensor của GPU RTX 5090 và những sản phẩm cùng thế hệ chip Blackwell. Thay vì cần tới phần cứng tăng tốc OFA như thế hệ trước, giờ Nvidia để card đồ họa vận hành một mô hình AI cỡ nhỏ để nội suy ra những khung hình mới. Theo thông tin mà Nvidia cung cấp, tốc độ tạo sinh khung hình game mới bằng AI nhanh hơn 40%, ngốn ít VRAM hơn 30%, và chỉ cần chạy một lần để tạo ra nhiều khung hình một lúc.
Thực tế thì sao? Nhìn vào tấm hình này có lẽ nói lên được rất nhiều điều về những gì Nvidia đem lại với RTX 5090 về mặt phần cứng, và DLSS 4 về mặt giải pháp phần mềm AI:
Dẫn lời của cây viết bên PCWorld nói về DLSS 4 và Multi-Frame Generation:
Mọi thứ dùng để xử lý tính năng Multi-Frame Generation đều là AI như chúng tôi dự đoán. Là một người rất nhạy cảm với độ trễ render và hiển thị hình ảnh game, trước khi bắt đầu thử nghiệm, tôi cũng cảm thấy nghi hoặc. Thế nhưng khi tận mắt chứng kiến, tận tay thử nghiệm, DLSS 4 với Multi Frame Generation thực sự rất tuyệt trong số ít những trò chơi chúng tôi được trải nghiệm.
Chúng tôi sẽ chỉ đăng tải kết quả benchmark MFG của Cyberpunk 2077, ở chế độ RT Overdrive preset, DLSS scaling 1.7x. Bật Multi-Frame Generation lên cải thiện tốc độ khung hình so với tính năng Frame Generation của DLSS 3 tới… 91%, tạo ra tốc độ khung hình choáng ngợp 249 FPS ở độ phân giải 4K. Còn nếu so sánh với việc không bật DLSS, RTX 5090 với Cyberpunk 2077 ở cùng chất lượng hình ảnh tạo ra 71 khung hình mỗi giây. Điều này có nghĩa là khi bật MFG của DLSS 4, cải thiện tốc độ khung hình là tới 251%.
Điên rồ. Và quan trọng nhất, là cảm giác game vô cùng mượt khi bật Nvidia Reflex giảm độ trễ hiển thị hình ảnh.
Trên các diễn đàn trực tuyến, tranh luận đang diễn ra vô cùng sôi nổi khi mọi người cãi nhau xem những khung hình do AI tạo ra có nên được coi là cải thiện tốc độ FPS hay không, vì lệnh điều khiển game chỉ nhận ở 1 trong 4 khung hình được GPU đưa lên màn hình. Nói theo cách của nhiều người, đây có lẽ cũng chỉ là một công nghệ làm mượt chuyển động hình ảnh thực sự cao cấp. Tôi có phần ủng hộ quan điểm này. Nhưng dù coi MFG của DLSS 4 là công nghệ tăng FPS hay tăng độ mượt của hình ảnh game, chúng ta không thể bỏ qua một sự thật, rằng DLSS 4 MFG giúp game đẹp và mượt hơn rất nhiều. Đó là điều quan trọng nhất.
Đương nhiên là với việc đẩy TDP của toàn bộ hệ thống RTX 5090 lên ngưỡng 575W so với 450W của RTX 4090, tăng khoảng 27%, lượng nhiệt năng mà con chip tỏa ra cũng sẽ là một cơn ác mộng đối với bất kỳ hệ thống heatsink và quạt tản nhiệt nào trên mọi phiên bản card đồ họa custom do các hãng sản xuất linh kiện PC bán ra vào cuối tháng này.
Còn xét riêng phiên bản Founders Edition được các bên đánh giá, giờ những dàn PC trang bị RTX 5090 sẽ phải sở hữu bộ nguồn với công suất tối thiểu 1000W, thay vì khuyến nghị 850W như RTX 4090. Nhìn vào biểu đồ tổng công suất tiêu thụ điện của toàn bộ hệ thống PC trong quá trình chơi game được đo đạc và tổng kết trong hình dưới đây, có lẽ 1000W là con số hợp lý:
Nhưng điều ấn tượng nhất của phiên bản RTX 5090 FE, là các kỹ sư Nvidia ứng dụng thiết kế buồng tản nhiệt vapor chamber, dẫn nhiệt từ die bán dẫn của GPU Blackwell qua tấm IHS lên heatsink bằng kim loại lỏng. Toàn bộ PCB chỉ là một mạch kích thước gần như hình vuông ở chính giữa card, tối ưu cả không gian lẫn tiết diện heatsink và quạt tản nhiệt.
Kết quả là một card đồ họa dù ngốn gần 600W điện, nhưng chỉ chiếm đúng 2 slot PCIe trong thùng máy, nhỏ hơn 1/3 so với RTX 4090 Founders Edition về chiều dày, còn bề ngang bề dọc thì y hệt:
Trong thực tế thử nghiệm, RTX 5090 full load từ benchmark, render, xử lý AI cho tới chơi game, nhiệt độ của chip dao động từ 70 tới 85 độ C, cao hơn một chút so với RTX 4090. Nhưng đổi lại, quạt đường kính lớn vận hành rất êm, nhưng vài reviewer nhận ra, âm thanh coil whine tạo ra do dòng điện đi qua linh kiện của card đồ họa nghe rất rõ ràng và dễ gây phiền toái. Nguồn:tinhte.vn/thread/reviewer-the-gioi-noi-gi-ve-rtx-5090-them-30-nhan-an-them-30-dien-khoe-hon-30-dat-hon-30.3952603/