GPU Blackwell của Nvidia là một trong những thiết bị bán dẫn phức tạp nhất từng được chế tạo, làm tăng đáng kể việc sản xuất, đóng gói và khó khăn thử nghiệm của họ.TheoThời báo tài chính,Trích dẫn Doug Lefever, giám đốc điều hành của Advantest, phải mất gấp ba đến bốn lần để kiểm traGPU của Trung tâm dữ liệu BlackwellHơn GPU trung tâm dữ liệu Hopper vì mỗi đơn vị phải được kiểm tra hàng chục lần trên các công cụ khác nhau trước khi vận chuyển.
Một Nvidia BlackwellB100/B200GPU bao gồm hai chiplets tính toán đóng gói 104 tỷ bóng bán dẫn cùng với tám chiplets bộ nhớ HBM3E được kết nối với nhau bằng giao diện được bật bởiCông nghệ đóng gói Cowos-L của TSMC.Điều này tương phản với phễu của NvidiaH100GPU, có một con chip bóng bán dẫn 80 tỷ và sáu ngăn bộ nhớ HBM3.
Thông thường, khi số lượng bóng bán dẫn phát triển, độ phức tạp của thử nghiệm tăng gần như theo cấp số nhân, vì các chip đòi hỏi nhiều mẫu thử hơn và thời gian thử nghiệm dài hơn.Các giao thức thử nghiệm phải bao gồm các kết nối tốc độ cao, điều kiện ứng suất, điều kiện nhiệt (trong trường hợp B200, là cực đoan) và nhiều chế độ hoạt động (Blackwell cho biết thêm hỗ trợ FP4).Vì Blackwell liên quan đến hai chiplets rất phức tạp với các tính năng mới và nhiệt cao hơn, nên việc thử nghiệm chúng mất nhiều hơn gấp đôi.
📢 Liên hệ quảng cáo: 0919 852 204
Quảng cáo của bạn sẽ xuất hiện trên mọi trang!
Có nhiều hơn về điều này.Các kỹ thuật đóng gói Cowos-L 2.5D của TSMC giới thiệu các bước thử nghiệm bổ sung (và đôi khi nhiều giai đoạn thử nghiệm) để đảm bảo rằng mỗi thành phần trong gói hoạt động chính xác và các kết nối là đáng tin cậy.
Với Blackwell, người ta phải kiểm tra các chiplets và chiplets bộ nhớ riêng biệt (mặc dù các nhà sản xuất DRAM kiểm tra ngăn xếp HBM3) và sau đó kiểm tra GPU nhiều lần khi các chiplet này được thêm vào máy xen kẽ RDL của chúng.Chúng tôi không biết số lần chính xác mà Blackwell B100 và B200 GPU và các mô -đun của Nvidia được kiểm tra trong quá trình đóng gói và lắp ráp.Tuy nhiên, các GPU này trải qua các lần lặp thử nghiệm nhiều hơn đáng kể so với GPU Hopper H100.
Nói chung, thời gian thử nghiệm dài của Blackwell phản ánh sự phức tạp ngày càng tăng của GPU AI và HPC này và yêu cầu xác nhận rộng rãi để đảm bảo hiệu suất và độ tin cậy trong các môi trường trung tâm dữ liệu khác nhau khi hoạt động cùng với các thành phần khác, như CPU, DPU và thẻ giao diện mạng.
Nguồn: www.tomshardware.com/pc-components/gpus/blackwell-gpu-reportedly-takes-3x-to-4x-longer-to-test-than-hopper