Elon Musk xác nhận XAI đang mua một nhà máy điện ở nước ngoài và đang vận chuyển toàn bộ sự việc đến Hoa Kỳ.
Các trung tâm dữ liệu xAI sắp tới của Elon Musk dự kiến sẽ chứa hàng triệu chip AI và tiêu thụ rất nhiều điện, đến mức Musk đã mua một nhà máy điện ở nước ngoài và dự định vận chuyển về Mỹ. Thông tin này được Dylan Patel từ SemiAnalysis chia sẻ trong một podcast, và Musk đã xác nhận qua một tweet sau đó. Siêu máy tính Colossus AI của xAI hiện đã là một trong những máy mạnh nhất và tốn điện nhất thế giới, với khoảng 200.000 GPU Nvidia Hopper và tiêu thụ khoảng 300 MW điện, trong khi xAI gặp khó khăn trong việc cung cấp đủ năng lượng cho nó.
Thách thức ngày càng gia tăng khi công ty tiến về phía trước - Musk đang đối mặt với một thách thức lớn trong việc cung cấp năng lượng cho trung tâm dữ liệu AI mới, dự kiến sẽ chứa một triệu GPU AI, tiêu thụ năng lượng tương đương với 1,9 triệu hộ gia đình. Trung tâm dữ liệu này có thể tiêu thụ nhiều năng lượng như vậy và Musk có kế hoạch để đáp ứng nhu cầu này. Trung tâm dữ liệu khổng lồ của OpenAI còn lớn hơn cả Colossus của xAI của Elon Musk, có thể gây ảnh hưởng đến ổn định lưới điện. Colossus của Musk đã hoạt động với 200,000 GPU được hỗ trợ bởi pin Tesla. Colossus cũng đang đối mặt với cáo buộc ô nhiễm từ các nhà sản xuất điện chưa được báo cáo đầy đủ. xAI có nhiều máy tính và các nhà nghiên cứu xuất sắc, với 200,000 GPU đã hoạt động và đang xây dựng một trung tâm dữ liệu mới cũng như mua một nhà máy điện.
Elon Musk's xAI đã tập hợp nguồn lực tính toán lớn và đội ngũ nghiên cứu tài năng để phát triển các mô hình AI Grok. Tuy nhiên, công ty đang đối mặt với những thách thức lớn hơn. Musk đã gặp khó khăn trong việc cung cấp năng lượng cho trung tâm dữ liệu xAI. Trung tâm dữ liệu chính của công ty, Colossus, với 200.000 GPU Nvidia Hopper, nằm gần Memphis, Tennessee.
Để vận hành máy móc này, xAI đã lắp đặt 35 tua-bin khí với công suất 420 MW và triển khai hệ thống Tesla Megapack để ổn định nguồn điện. Tuy nhiên, tình hình sẽ trở nên nghiêm trọng hơn trong tương lai. Ngoài việc xây dựng Colossus, xAI đang nhanh chóng mua sắm và phát triển các cơ sở mới. Công ty đã mua một nhà máy ở Memphis đang được chuyển đổi thành trung tâm dữ liệu bổ sung, đủ sức cung cấp cho khoảng 125,000 máy chủ GPU tám chiều, cùng với tất cả phần cứng hỗ trợ như mạng, lưu trữ và làm mát.
Một triệu GPU Nvidia Blackwell sẽ tiêu thụ từ 1.000 MW (1 GW) đến 1.400 MW (1,4 GW), tùy thuộc vào các mẫu bộ tăng tốc B200, GB200, B300, GB300 và cấu hình của chúng. Tuy nhiên, GPU không phải là tải duy nhất trên hệ thống điện; cần tính đến cả mức tiêu thụ điện của CPU, bộ nhớ DDR5, lưu trữ, thiết bị mạng, làm mát, điều hòa không khí, hiệu suất nguồn và các yếu tố khác như ánh sáng.
Trong các cụm AI lớn, một ước lượng hữu ích là chi phí overhead tăng thêm từ 30 đến 50% so với mức tiêu thụ điện của GPU AI, thường được biểu thị bằng hiệu suất sử dụng điện PUE. Tùy thuộc vào các bộ tăng tốc Blackwell mà xAI dự định sử dụng, một trung tâm dữ liệu với một triệu GPU sẽ tiêu thụ từ 1,400 MW đến 1,960 MW với PUE là 1.4. Câu hỏi lớn là điều gì có thể cung cấp điện cho một trung tâm dữ liệu với một triệu GPU hiệu suất cao để đào tạo và suy diễn AI.
📢 Liên hệ quảng cáo: 0919 852 204
Quảng cáo của bạn sẽ xuất hiện trên mọi trang!
9 triệu ngôi nhà. Một nhà máy điện năng lượng mặt trời quy mô lớn không đủ khả năng đáp ứng nhu cầu điện 247 cho khối lượng này, vì cần nhiều gigawatt tấm pin và hệ thống lưu trữ pin lớn, điều này rất tốn kém và chiếm nhiều đất. Giải pháp thực tế và phổ biến nhất là xây dựng nhiều nhà máy điện khí tự nhiên kết hợp (CCGT), mỗi nhà máy có khả năng sản xuất 0.
5 MW – 1.500 MW. Phương pháp này có thể triển khai nhanh trong vài năm, có thể mở rộng theo từng giai đoạn và dễ dàng tích hợp với lưới điện hiện có. Có thể đây là kế hoạch của xAI để nhập khẩu vào Mỹ. Các lựa chọn như lò phản ứng hạt nhân có thể đáp ứng nhu cầu với ít đơn vị hơn, mỗi lò sản xuất khoảng 1.000 MW mà không phát thải carbon trực tiếp, nhưng nhà máy hạt nhân mất nhiều thời gian hơn để thiết kế, cấp phép và xây dựng, có thể lên đến 10 năm.
Có vẻ Musk khó có khả năng mua được một nhà máy điện hạt nhân ở nước ngoài để chuyển về Mỹ. Thực tế, bất kỳ tổ chức nào, như xAI, có kế hoạch triển khai từ 1.4 đến 1.96 Gigawatt sẽ trở thành một người mua năng lượng lớn. Hiện tại, Colossus của xAI sản xuất điện tại chỗ và mua điện từ lưới điện, vì vậy có khả năng trung tâm dữ liệu tiếp theo của công ty sẽ kết hợp một nhà máy điện tại chỗ với kết nối lưới điện.
Có vẻ như việc mua một nhà máy điện ở Mỹ mất quá nhiều thời gian, nên xAI đang mua một nhà máy ở nước ngoài và vận chuyển về. Điều này cho thấy sự phát triển AI không chỉ phụ thuộc vào phần cứng và phần mềm mà còn cần nhanh chóng đảm bảo nguồn năng lượng lớn. Rõ ràng, một trung tâm dữ liệu với một triệu bộ tăng tốc AI và một nhà máy điện riêng là một biện pháp cực đoan.
Patel chỉ ra rằng hầu hết các công ty AI hàng đầu đang tập trung vào những chiến lược tương tự, như xây dựng các cụm máy tính lớn, tuyển dụng các nhà nghiên cứu hàng đầu và đào tạo các mô hình AI ngày càng lớn hơn. Do đó, nếu xAI muốn vượt lên trên đối thủ, công ty cần xây dựng các trung tâm dữ liệu tiên tiến và tiêu tốn nhiều năng lượng hơn.
Nguồn: www.tomshardware.com/tech-industry/artificial-intelligence/elon-musk-xai-power-plant-overseas-to-power-1-million-gpus