Dead RTX 5090 với PCB bị nứt được phẫu thuật khẩn cấp từ trình hướng dẫn sửa chữa
Một chiếc RTX 5090 hỏng gần đây đã đến tay Tony tại Northwest Repairs, nơi cũng là trung tâm của kênh YouTube hỗn loạn của họ. Northwest chuyên về sửa chữa linh kiện bán dẫn, đặc biệt là các GPU cần được phục hồi. Khi một chiếc PNY RTX 5090 với bo mạch in bị nứt và không có dấu hiệu hoạt động được mang đến, Tony đã bắt tay vào sửa chữa và đưa chúng ta theo hành trình thú vị trong quá trình phục hồi chiếc 5090 này.
RTX 5090 không còn xa lạ với tranh cãi. Chúng đã gặp phải vấn đề kết nối nguồn bị chảy, di sản từ người tiền nhiệm RTX 4090. Tuy nhiên, vấn đề này không phải do quá nhiệt mà là do PCB bị nứt, một lỗi ngày càng phổ biến trên các GPU hiện đại. Những vết nứt trên PCB có thể làm gián đoạn các tín hiệu bên trong, dẫn đến những trục trặc khó chẩn đoán và sửa chữa.
Tony đã tháo rời RTX 5090 để xem bên trong. Sau khi gỡ bỏ lớp vỏ, anh phát hiện thiết kế của bộ tản nhiệt khá ổn, nhưng tấm tiếp xúc bộ nhớ không tiếp xúc đúng với buồng hơi, dẫn đến việc truyền nhiệt đến bộ nhớ gần như không có. Các phiên bản cao cấp hơn của RTX 5090 có thể không gặp vấn đề này vì được trang bị hệ thống tản nhiệt mạnh mẽ hơn.
Các VRM và linh kiện bề mặt đều chắc chắn, vì vậy bước tiếp theo là kiểm tra nguồn điện. Bạn có thể thích những thông tin sau: Charred RTX 4070 bị hư hỏng do PSU không có tính năng bảo vệ; Scam RTX 5090 mua với giá 2,000 nhưng thiếu toàn bộ chip GPU — kẻ gian đã lấy chip GPU và bộ nhớ khỏi bo mạch; Nvidia RTX 5090 vượt qua RTX Pro 6000 trong các bài kiểm tra sau khi điều chỉnh shunt lên tới 800W. Ngay cả khi không tải, GPU vẫn tiêu thụ khoảng 5 ampe, điều này là cao nhưng bình thường cho một sản phẩm tiêu tốn điện như 5090.
Tony đã phải tăng cường bộ kiểm tra nguồn từ 4A lên 8A để khởi động, vì 8A cần thiết để xử lý đợt tăng công suất ban đầu. Card đồ họa đã bật, đèn sáng và quạt quay, nhưng không có tín hiệu hiển thị, mặc dù đèn LED của màn hình đã sáng. Điều này cho thấy GPU đã hoạt động nhưng không khởi động, khiến thợ sửa chữa nghi ngờ về vấn đề VRAM. Do đó, chúng tôi tiếp tục kiểm tra bộ nhớ bằng cách sử dụng iGPU của bộ xử lý để xuất tín hiệu, và cuối cùng, một lỗi đào tạo đã chỉ ra một chip nhớ cụ thể là nguyên nhân vấn đề.
GPU không thể hoàn thành quá trình khởi tạo DRAM, cho thấy các mối hàn trên chip có thể đã hỏng. Tony đã tháo chip ra khỏi bo mạch, làm lại mối hàn và lắp lại vào PCB. Sau đó, card đồ họa đã khởi động thành công. Đây là chip Samsung GDDR7 2GB, cho thấy card này thuộc lô 5090 cũ trước khi Nvidia sử dụng các module do SK Hynix sản xuất.
Reballing là quá trình gỡ bỏ chip BGA (Ball Grid Array) khỏi bảng mạch, làm sạch chip và bảng mạch khỏi chì cũ, sau đó đặt các viên chì mới bằng khuôn và gắn lại chip bằng nhiệt điều khiển. Quá trình này đòi hỏi kỹ năng chuyên môn cao, căn chỉnh chính xác và thiết bị chuyên dụng như trạm sửa chữa và kính hiển vi.
📢 Liên hệ quảng cáo: 0919 852 204
Quảng cáo của bạn sẽ xuất hiện trên mọi trang!
Một sai sót nhỏ trong quá trình reballing có thể gây hại vĩnh viễn cho chip hoặc bo mạch, vì vậy bạn không nên thử làm tại nhà. Đáng tiếc, công việc không dừng lại ở đó, khi quạt ngay lập tức chạy hết công suất và giữ ở mức đó. Quạt GPU quay ở 100% mà không thay đổi có thể báo hiệu vấn đề nghiêm trọng, có thể GPU nghĩ rằng có gì đó không ổn. Đồng thời, giao diện PCIe cũng bất ngờ ngừng hoạt động.
Các chu kỳ nhiệt trước đó có thể đã làm trầm trọng thêm tổn thương bên trong của PCB. Kết nối PEX ban đầu của giao thức PCIe tới bo mạch chủ đã hoạt động tốt trước khi hư hỏng nặng hơn xảy ra. Để loại trừ khả năng này, nhân GPU đã được tái hàn hoàn toàn, một công việc đòi hỏi độ chính xác và kỹ năng cao.
Không chỉ vậy, đây còn là RTX 5090, nên không có chỗ cho sai sót. Sau khi hoàn tất quá trình, Tony kiểm tra và phát hiện rằng việc tái hàn đã gây ra một vấn đề mới: có sự chập mạch ở bộ nhớ, có thể do giãn nở nhiệt. Ban đầu, máy ảnh nhiệt kết nối với điện thoại của Tony không phát hiện được gì, vì vậy anh đã sử dụng tư duy phản biện để kiểm tra các khu vực có nhiệt độ tăng trên bo mạch.
Cuối cùng, anh đã xác định được chip lỗi - cùng loại mà anh đã hàn lại trước đó. Sau khi thay thế lần nữa, sự cố ngắn mạch đã được khắc phục, nhưng thẻ vẫn không được hệ thống nhận diện vì không có PEX. Lúc này, vết nứt ban đầu trên PCB có thể đã trở nên tồi tệ hơn do nhiệt, làm đứt hoàn toàn các kết nối bên trong. Khi kiểm tra kỹ hơn, anh phát hiện chỉ có một vài pha nguồn VRM hoạt động.
Các nguồn điện thông thường—12V và Vcore—đã có mặt, nhưng tín hiệu Driver ON kỹ thuật số không đến được một nửa các bộ điều khiển VRM. Dự đoán của Tony đã đúng, một đường dẫn trong PCB đã bị đứt. Giờ đây, việc kết nối lại diễn ra, và phần ấn tượng nhất của việc sửa chữa là do tín hiệu không được chia sẻ giữa các pha, một dây nối đơn giản đã được sử dụng để khôi phục đường dẫn bị đứt, giúp phục hồi nguồn cung cấp điện hoàn toàn, nhưng PEX vẫn còn thiếu.
Một jumper khác đã được thêm vào để kết nối tín hiệu PCIe bị thiếu. Lần này, nó hoạt động và PCIe đã trở lại trực tuyến.
Nguồn: www.tomshardware.com/pc-components/gpus/dead-rtx-5090-with-a-cracked-pcb-gets-urgent-surgery-from-repair-wizard-tech-casually-reballs-the-core-replaces-a-memory-chip-twice-and-runs-more-wires-across-its-traces-than-the-nsa