Jensen Huang xác nhận lỗi thiết kế hoàn toàn thuộc về Nvidia đối với GPU AI Blackwell, đã được khắc phục

Doanh nghiệp gần bạn nhất

được xác nhận bởi itcctv

Jensen Huang xác nhận lỗi thiết kế hoàn toàn thuộc về Nvidia đối với GPU AI Blackwell, đã được khắc phục

Hôm thứ 4 vừa rồi, trao đổi với Reuters, CEO Jensen Huang cho biết đúng là đã có những vấn đề liên quan tới thiết kế của GPU kích thước lớn, phục vụ data center xử lý AI thế hệ mới của họ, Blackwell. Những vấn đề liên quan tới thiết kế này đã khiến quá trình sản xuất gặp trục trặc. Nhưng may mắn là mọi rắc rối đã được khắc phục nhờ vào sự giúp đỡ của TSMC.

Hồi tháng 3, Nvidia chính thức ra mắt Blackwell, với lời khẳng định rằng đây là GPU AI mạnh nhất thế giới: 208 tỷ transistor, gia công trên tiến trình 4NP của TSMC, với 2 die silicon kích thước tối đa ghép lại với nhau bằng cầu nối 10TB/s, tạo ra một GPU kích thước cực lớn. Ban đầu, Nvidia dự kiến Blackwell sẽ được bán ra thị trường vào quý II năm 2024, nhưng sau đó bị hoãn ra mắt sang quý IV, ảnh hưởng tới khá nhiều khách hàng lớn như Meta, Alphabet hay Microsoft.

Mới nhất, CEO Jensen Huang cho biết: "Chúng tôi phát hiện ra lỗi thiết kế trên chip Blackwell. Chip vận hành ổn, nhưng lỗi này khiến tỷ lệ chip đạt chuẩn trong quá trình gia công bị ảnh hưởng. Đây 100% là lỗi của Nvidia. Để tạo ra Blackwell và giúp nó vận hành, 7 loại chip xử lý khác nhau phải được thiết kế từ con số 0, rồi đem sản xuất ngay lập tức để đáp ứng nhu cầu thị trường.

Việc mà TSMC đã làm là giúp chúng tôi cải thiện tỷ lệ chip đạt chuẩn, giải quyết những khó khăn liên quan tới thiết kế chip, và ngay lập tức quay lại gia công những die bán dẫn tạo ra chip Blackwell với tốc độ đáng nể."

Cùng lúc, ông Huang cũng phủ nhận “tin giả” rằng những vấn đề liên quan tới thiết kế của kiến trúc chip Blackwell đã khiến quan hệ hợp tác giữa Nvidia và TSMC trở nên xấu đi.

Về mặt kỹ thuật, GPU B200 kiến trúc Blackwell sở hữu 104 tỷ transistor trên mỗi die GPU, tổng cộng 2 die MCM là 208 tỷ transistor, chia thành 160 Stream Microprocessor, tức 20480 nhân CUDA. Con chip xử lý này, được hợp tác gia công bởi Synopsys và TSMC, ứng dụng công nghệ và thư viện phần mềm CuLitho của Nvidia, ứng dụng sức mạnh của máy tính để tăng tốc độ nghiên cứu phát triển chip. So sánh với Hopper, B200 nhiều hơn H200 tới 128 tỷ transistor. Sức mạnh xử lý số thực dấu phẩy động FP8 và FP6 của B200 nhanh gấp 2.5 lần, xử lý FP4 nhanh gấp 5 lần so với H200.

Ngay trên bề mặt con chip là 8 stack chip nhớ HBM3e, dung lượng tối đa 192GB, tốc độ 8TB/s, chạy trên bus interface 8192-bit. Công suất tiêu thụ điện tối đa của con chip này lên tới 700W, nhưng con số này giống hệt như H100 và H200 đang có trên thị trường, đang trang bị trong những hệ thống data center vận hành mô hình AI của các tập đoàn lớn.

Tối đa, GB200 cho phép tạo ra một data center quy mô khổng lồ với 32 nghìn GPU, 13 petabyte RAM HBM3e, sức mạnh xử lý 645 exaflop, tính riêng hiệu năng xử lý dữ liệu network cũng tính bằng đơn vị petaflop.

Nvidia Blackwell B200: Chip AI mạnh nhất thế giới, mạnh hơn H200 từ 2.5 đến 5 lần, thiết kế chiplet

GTC 2024, sự kiện công bố những sản phẩm phần cứng và phần mềm mới của Nvidia đã khai mạc, và trung tâm của sự kiện, và được trông đợi nhất có lẽ là kiến trúc chip GPGPU (general purpose graphics processing unit) mới của Nvidia, tên mã Blackwell…
tinhte.vn


Theo Reuters
Nguồn: Jensen Huang thừa nhận GPU AI Blackwell lỗi thiết kế hoàn toàn do Nvidia, đã sửa xong
💬 bình luận
1

Bình luận

Trở thành viên của itcctv — Đăng ký
Thủ thuật tin học văn phòng Thủ thuật Word Thủ thuật Excel
Cuộn