Các máy chủ Nvidia từ Blackwell AI phải đối mặt với các vấn đề quá nóng và trục trặc;Các khách hàng lớn, bao gồm Microsoft & Google, bắt đầu cắt giảm đơn đặt hàng
Máy chủ AI Blackwell của NVIDIA đang gặp khó khăn trong chuỗi cung ứng do vấn đề quá nhiệt và lỗi kiến trúc chưa được khắc phục. NVIDIA đã bắt đầu trì hoãn đơn đặt hàng cho máy chủ Blackwell, khiến khách hàng chuyển sang phiên bản Hopper cũ hơn. Đây không phải là khởi đầu thuận lợi mà NVIDIA mong muốn cho dòng sản phẩm Blackwell.
NVIDIA từng dự kiến sản xuất hàng loạt các máy chủ AI Blackwell vào quý 4 năm 2024, nhưng đã gặp vấn đề thiết kế gây nhiệt độ cao. Mặc dù NVIDIA khẳng định đã khắc phục, một báo cáo mới từ The Information cho biết các máy chủ Blackwell vẫn gặp sự cố.
Theo báo cáo, lô hàng đầu tiên của máy chủ AI GB200 của NVIDIA gặp vấn đề quá nhiệt và lỗi do cách kết nối các chip. Vấn đề này đã ảnh hưởng đến các khách hàng lớn như Microsoft, Amazon, Google và Meta, dẫn đến việc các công ty này giảm đơn hàng Blackwell, mặc dù họ đã đặt hàng trị giá hơn 10 tỷ USD.
Tình hình hiện tại thật sự đáng lo ngại cho NVIDIA và lĩnh vực AI của họ, vì các vấn đề trong chuỗi cung ứng có thể gây thiệt hại nghiêm trọng cho tài chính của công ty. Mặc dù chúng ta vẫn chưa rõ nguyên nhân cụ thể, nhưng trước đây đã có thông tin cho rằng vấn đề nằm ở công nghệ đóng gói tiên tiến của TSMC, cụ thể là công nghệ CoWoS, liên quan đến vấn đề kết nối chip. NVIDIA đã cho biết họ đã thay đổi mặt nạ GPU Blackwell tại TSMC, nhưng điều này vẫn chưa giải quyết được vấn đề.
Các công ty hiện đang chuyển sang các sản phẩm từ thế hệ Hopper của NVIDIA cho đến khi Team Green khắc phục được vấn đề với Blackwell. Hiện tại, chúng ta chưa rõ mức ảnh hưởng của lỗi thiết kế Blackwell đến doanh thu của NVIDIA, nhưng nếu công ty không giải quyết được vấn đề, thành công của Blackwell có thể bị đe dọa, tạo ra khó khăn cho NVIDIA.
Nguồn: wccftech.com/nvidia-blackwell-ai-servers-faced-with-overheating-glitching-issues/