Aurora SuperComputer hiện đang hoạt động đầy đủ, có sẵn cho các nhà nghiên cứu
Phòng thí nghiệm quốc gia Argonne vừa thông báo rằng siêu máy tính Aurora đã hoạt động hoàn toàn và sẵn sàng phục vụ cộng đồng khoa học. Siêu máy tính này, được công bố vào năm 2015 và trải qua nhiều trì hoãn, hiện có hiệu suất hơn 1 ExaFLOPS FP64 cho mô phỏng và 11,6 ExaFLOPS với độ chính xác hỗn hợp cho trí tuệ nhân tạo và học máy. Giám đốc của Trung tâm Tính toán Lãnh đạo Argonne (ALCF), Michael Papka, cho biết ông rất vui mừng khi chính thức triển khai Aurora cho nghiên cứu khoa học mở.
Người dùng đầu tiên đã cho thấy tiềm năng to lớn của Aurora. Chúng tôi mong chờ xem cộng đồng khoa học sẽ sử dụng hệ thống này để cải tiến nghiên cứu ra sao. Việc siêu máy tính Aurora được mở cho nghiên cứu khoa học có thể coi là sự chấp nhận chính thức của ARNL, đánh dấu một cột mốc quan trọng cho máy tính gặp khó khăn này. Aurora ban đầu dự kiến ra mắt vào năm 2018, nhưng đã trễ hạn do Intel quyết định ngừng sản xuất các vi xử lý Xeon Phi.
Sau khi máy được tái cấu trúc, dự án gặp khó khăn thêm do sự chậm trễ trong công nghệ quy trình 7nm của Intel, khiến thời gian hoàn thành bị dời từ 2021 sang 2023. Dù phần cứng đã được lắp đặt vào tháng 6 năm 2023, nhưng mất vài tháng để hệ thống hoạt động hoàn toàn và đạt hiệu suất exascale, điều này chỉ đạt được vào tháng 5 năm 2024. Tuy nhiên, trong hơn nửa năm, hệ thống chỉ được cung cấp cho một số nhà nghiên cứu chọn lọc.
Mặc dù Aurora không phải là siêu máy tính mạnh nhất cho mô phỏng với hiệu suất FP64 chỉ vượt qua một ExaFLOPS, nhưng nó là hệ thống mạnh nhất cho trí tuệ nhân tạo với khả năng đạt 11,6 ExaFLOPS với độ chính xác hỗn hợp theo chuẩn HPL-MxP. Một mục tiêu lớn của Aurora là huấn luyện các mô hình ngôn ngữ lớn cho khoa học, theo lời Rick Stevens, giám đốc phụ trách máy tính, môi trường và khoa học đời sống của phòng thí nghiệm Argonne.
Trong dự án AuroraGPT, chúng tôi đang xây dựng một mô hình nền khoa học có khả năng tinh chế kiến thức từ nhiều lĩnh vực, từ sinh học đến hóa học. Một trong những mục tiêu của Aurora là giúp các nhà nghiên cứu tạo ra công cụ AI mới, giúp họ tiến bộ nhanh chóng như suy nghĩ của họ, không chỉ dựa vào tốc độ tính toán. Một số dự án nghiên cứu đầu tiên sử dụng Aurora là các mô phỏng chi tiết của những hệ thống phức tạp như hệ tuần hoàn của con người, lò phản ứng hạt nhân và vụ nổ siêu tân tinh.
Hiệu suất vượt trội của máy tính cũng đóng vai trò quan trọng trong việc xử lý dữ liệu từ các trung tâm nghiên cứu lớn như Argonne's Advanced Photon Source và CERN's Large Hadron Collider. Các dự án trên Aurora đại diện cho những nghiên cứu khoa học đầy tham vọng và đổi mới hiện nay, theo lời Katherine Riley, giám đốc khoa học ALCF. Từ việc mô phỏng các hệ thống vật lý phức tạp đến xử lý lượng dữ liệu khổng lồ, Aurora sẽ thúc đẩy những phát hiện làm sâu sắc thêm hiểu biết của chúng ta về thế giới xung quanh.
Về phần cứng, Aurora gây ấn tượng mạnh với 166 giá đỡ, mỗi giá chứa 64 lưỡi, tổng cộng là 10,624 lưỡi. Mỗi lưỡi có hai bộ xử lý Xeon Max và 64 GB bộ nhớ HBM2E, cùng với sáu GPU Intel Data Center Max Ponte Vecchio, được làm mát bằng hệ thống làm mát bằng chất lỏng chuyên dụng. Tổng cộng, Aurora có 21,248 CPU với hơn 1.1 triệu lõi x86 hiệu suất cao.
Aurora có 9 PB bộ nhớ DDR5 và 1.36 PB bộ nhớ HBM2E gắn với CPU. Hệ thống này còn có 63,744 GPU tối ưu cho AI và HPC với 8.16 PB bộ nhớ HBM2E. Aurora sử dụng 1,024 nút với ổ cứng thể rắn, cung cấp tổng dung lượng 220 PB và băng thông 31 TB/s. Máy tính này dựa trên kiến trúc siêu máy tính HPE Shasta với các kết nối Slingshot.
Nguồn: www.tomshardware.com/tech-industry/supercomputers/aurora-supercomputer-is-now-fully-operational-available-to-researchers