Nvidia mới đây đã tiết lộ quá trình lắp ráp của siêu máy tính Selene – siêu máy tính được chứng nhận là nhanh thứ 7 trên thế giới hồi tháng 6 vừa qua. Toàn bộ siêu máy tính này được lắp ráp giữa đại dịch, trong quãng thời gian vỏn vẹn 3 tuần rưỡi, với đội ngũ nhân công chỉ 6 người tuân thủ quy định về giãn cách xã hội và một con robot phụ tá tên Trip,
Selene thực sự là một siêu máy tính độc đáo với kiến trúc SuperPOD DGX tăng tốc GPU của Nvidia, không giống như các thiết kế dựa vào CPU tuỳ chỉnh trên hầu hết các siêu máy tính trong danh sách Top500. Đáng chú ý, Selene đứng thứ 2 trong danh sách Green500 - danh sách các siêu máy tính tiết kiệm điện nhất trên thế giới.
📢 Liên hệ quảng cáo: 0919 852 204
Quảng cáo của bạn sẽ xuất hiện trên mọi trang!
Trong cấu hình, Selene được trang bị 560 CPU AMD Epyc 7742 (mỗi CPU có 64 nhân) và 2240 GPU Nvidia A100, với hiệu năng lý thuyết cao nhất lên đến 35.000 teraflops.
Nvidia lắp ráp siêu máy tính nhanh thứ 7 thế giới chỉ trong một tháng. Đường link hình ảnh: https://itcctv.s3.ap-southeast-1.amazonaws.com/blogs/SvZAcy8Ua7nemlkDODroGo7zES4kPDB0GER22B1y.jpg
Trước đây, việc lắp ráp và bảo trì các siêu máy tính của Nvidia mất rất nhiều thời gian và công sức. Tuy nhiên, việc thiết kế Selene đã được đơn giản hóa và mô-đun hoá để tối ưu hóa quá trình bảo trì và nâng cấp. Mỗi node trong Selene bao gồm 8 GPU Nvidia A100 và 2 CPU AMD Epyc, được lắp đặt trong các pod DGX chuẩn hoá. Các pod được tổ chức gọn gàng trong các cabin, tạo thành những nhóm 16 cabin để hình thành một SuperPOD.
Tính đồng đều của Selene là thứ giúp quá trình lắp ráp nó diễn ra rất nhanh gọn. Việc của Nvidia hầu hết chỉ là di chuyển từng pod DGX vào vị trí thích hợp, nối dây chúng vào hệ thống, và kiểm tra xem mọi thứ có hoạt động hay không. Nối dây một siêu máy tính tất nhiên chẳng phải điều dễ dàng, nhưng Nvidia sử dụng các mạch chuyển InfinitiBand của Mellanox để giảm số lượng cáp cần thiết, trong khi vẫn giúp tăng băng thông hệ thống.
Selene được làm mát theo từng cụm SuperPOD trong một nhà kho lưu giữ các SuperPOD khổng lồ được điều hoà không khí. Các pod DGX được đặt cách sàn nhà một khoảng trống, với hệ thống quạt đẩy không khí mát vào các pod. Đội ngũ lắp ráp gồm 6 người của Nvidia chỉ cần cài đặt bộ khung sàn và khoá kín các SuperPOD để kiểm soát dòng không khí lưu thông.
Nvidia sáng tạo khi áp dụng trang thiết bị để theo dõi Selene bằng cách mua một con robot nhỏ có tên Trip, có khả năng điều khiển từ xa và di chuyển xung quanh khu vực bằng bánh xe để quan sát các hoạt động trong Selene. Họ cũng đã phát triển một bot trong ứng dụng Slack để thông báo khi phần cứng gặp sự cố hoặc có cáp lỏng trong hệ thống.
Selene hiện đang thực hiện khoảng 1.000 tác vụ, chủ yếu tập trung vào phát triển trí tuệ nhân tạo và huấn luyện mạng thần kinh. Nếu bạn muốn biết mục đích của Selene là gì, thì hãy biết rằng nó được sử dụng để nghiên cứu về virus corona.