Giống như nhiều sản phẩm chip chuyên biệt của các tập đoàn công nghệ khác, con chip mang tên
MTIA (Meta Training and Inference Accelerator) được thiết kế để chỉ vận hành ở hiệu năng tối đa trong một số những tác vụ cụ thể, thay vì những GPGPU của Nvidia, được thiết kế để xử lý số thực dấu phẩy động, tính toán ma trận và tensor tối ưu cho mọi nhu cầu phổ quát trong ngành AI. Nhờ đó, MTIA phục vụ tốt hơn cho nhu cầu cụ thể của các nhà nghiên cứu AI cũng như các kỹ sư phát triển của Meta, cùng lúc giảm thiểu cả chi phí lẫn điện năng tiêu thụ của toàn bộ hệ thống máy chủ.
Trước đó, để tạo ra được con chip MTIA thế hệ mới, Meta đã thành công trong quá trình tape-out, tạo ra những bản photomask để gửi cho TSMC đưa vào máy quang khắc, cho phép họ “in” những cụm transistor lên bề mặt wafer silicon. Con chip xử lý nào cũng cần tới quá trình tape-out hết. Và tùy vào mức độ phức tạp của mỗi chip xử lý, chi phí tape-out ra những tấm photomask sẽ tốn hàng chục triệu USD, rồi phải thực hiện trong khoảng thời gian 3 đến 6 tháng. Nếu con chip gặp vấn đề trong khâu thiết kế, dẫn tới việc tape-out gặp sự cố, sẽ phải thực hiện lại từ đầu.
Để anh em dễ so sánh, chi phí để Apple thực hiện tape-out những tấm khuôn photomask của thế hệ chip xử lý M3 của họ được cho là chạm mốc 1 tỷ USD.
Cùng lúc cũng phải đề cập tới chuyện, con chip MTIA đang được Meta thử nghiệm là thế hệ tiếp theo của những con chip được các kỹ sư tập đoàn này tự phát triển. Kể từ năm ngoái, MTIA thế hệ đầu tiên đã được ứng dụng phục vụ cho chính những tác vụ trong những ứng dụng MXH mà Meta vận hành, bao gồm hệ thống khuyến nghị nội dung, và sau đó được ứng dụng vào những giải pháp AI tạo sinh, như chatbot Meta AI đang phổ biến hiện nay.
Giám đốc sản phẩm của Meta, Chris Cox tuần trước đã có mặt tại hội thảo công nghệ, truyền thông và viễn thông do Morgan Stanley tổ chức: “Chúng tôi đang làm việc để tìm ra cách vận hành hiệu quả quá trình huấn luyện hệ thống khuyến nghị nội dung, rồi sau đó sẽ nghĩ tới chuyện tối ưu quá trình huấn luyện và vận hành nội suy các sản phẩm AI tạo sinh.”
Giám đốc Cox mô tả MTIA đang là những nỗ lực sơ khai, giống như một đứa trẻ tập bò, rồi mới tập đi và tập chạy. Nhưng theo ông, những giám đốc cấp cao của tập đoàn Meta coi MTIA là thành công lớn.
Nói vậy thực ra cũng dễ hiểu, vì đã từng có thời điểm Meta từ bỏ nỗ lực phát triển những chip xử lý tăng tốc nội suy AI. Hồi năm 2022, họ thất bại trong việc thử nghiệm hiệu năng những con chip tự thiết kế phục vụ nhu cầu huấn luyện AI. Lúc đó, các giám đốc của tập đoàn Meta hủy dự án, chuyển qua rót tiền cho Nvidia để đặt hàng chục nghìn GPU máy chủ.