AMD cho biết các siêu máy tính Zettascale sẽ cần một nửa Gigawatt để hoạt động, đủ cho 375.000 ngôi nhà
AMD đã thảo luận về những yếu tố hạn chế trong việc phát triển bộ tăng tốc AI tại ISC 2025, đặc biệt là yêu cầu năng lượng ngày càng tăng của các chip tiên tiến. Theo ComputerBase, AMD dự đoán rằng siêu máy tính có khả năng ZettaFLOP trong tương lai sẽ cần năng lượng tương đương với một nhà máy điện hạt nhân để hoạt động. AMD cũng chia sẻ một biểu đồ dự đoán mức tiêu thụ năng lượng của siêu máy tính đến năm 2035, bắt đầu từ giai đoạn 2010-2015, khi siêu máy tính chỉ cần 3.
Đồ thị bắt đầu từ 2GFwatt và kéo dài thẳng đến năm 2035, khi AMD dự đoán siêu máy tính zetta-scale sẽ cần 2140GFwatt, tương đương với nửa gigawatt. Đồ thị giả định có sự cải thiện hiệu suất gấp đôi trong phát triển bộ xử lý AI mỗi 2,2 năm. Băng thông bộ nhớ và khả năng làm mát được cho là những yếu tố chính dẫn đến mức tiêu thụ điện năng tăng cao như dự đoán.
Khi phần cứng AI tăng cường sức mạnh tính toán, băng thông bộ nhớ và hệ thống làm mát trung tâm dữ liệu cũng phải gia tăng để theo kịp. Điều này tạo ra hiệu ứng dây chuyền làm tăng mức tiêu thụ điện năng trong toàn bộ trung tâm dữ liệu. Chẳng hạn, bộ tăng tốc AMD Instinct MI355X dự kiến tiêu thụ 1.400 watt, trong khi Nvidia giới thiệu Rubin Ultra với các giá rack Kyber 600.000 watt, dự kiến ra mắt vào năm 2027. Nvidia sẽ nâng cấp các giá server AI lên quy mô megawatt, tăng cường khả năng cung cấp điện lên gấp năm lần hoặc hơn. Thêm vào đó, nhu cầu về khả năng tính toán FP128, FP64, FP16 và FP8 càng làm trầm trọng thêm vấn đề này.
📢 Liên hệ quảng cáo: 0919 852 204
Quảng cáo của bạn sẽ xuất hiện trên mọi trang!
Mặc dù FP64 và FP128 mang lại độ chính xác cao hơn, nhưng một số công việc lại hiệu quả hơn khi sử dụng FP16 và FP8. Do đó, các bộ tăng tốc AI trong tương lai cần có khả năng thực hiện các phép toán độ chính xác thấp. Hiện tại, chúng ta đã thấy mức tiêu thụ điện năng tăng vọt với các bộ tăng tốc AI mới nhất. Nvidias B200 có TDP 1000W, trong khi MI355X của AMD có TDP lên tới 1.400W. Ngược lại, GPU AI A100 của Nvidias cách đây 5 năm chỉ tiêu thụ 400W - ít hơn cả RTX 5090.
Chính phủ Mỹ đang nỗ lực giải quyết tình hình năng lượng đang gia tăng trước khi nó trở thành vấn đề với các nhà máy điện hạt nhân. Nhiều công ty lớn, như Microsoft, cũng đang đầu tư mạnh vào công nghệ phản ứng hạt nhân để giải quyết vấn đề năng lượng cho trung tâm dữ liệu. Các siêu máy tính vẫn nằm trong khoảng ExaFLOP, với siêu máy tính ElCaptain dựa trên AMD-MI300A hiện đang là siêu máy tính nhanh nhất thế giới.
Hiện nay, các trung tâm dữ liệu AI đã đạt hiệu suất zettaFLOP, với Oracle là công ty đầu tiên cung cấp cụm điện toán đám mây zettascale, sử dụng 131,072 GPU Blackwell, đạt 2.4 zettaFLOPS.
Nguồn: www.tomshardware.com/pc-components/gpus/amd-says-zettascale-supercomputers-will-need-half-a-gigawatt-to-operate-enough-for-375-000-homes