IBM tăng các máy tính lớn với hiệu suất AI cao hơn 50%: Z17 có chip Telum II với máy gia tốc AI
IBM vừa ra mắt hệ thống mainframe z17 mới, được thiết kế cho các giao dịch kinh doanh quan trọng với khả năng bảo mật tiên tiến được cải thiện bằng AI. Hệ thống này sử dụng bộ vi xử lý Telum II, cung cấp hiệu suất chung cao hơn 70% so với phiên bản trước và khả năng AI cải thiện 50%. Đối với những ai cần hiệu suất AI cao hơn nữa, IBM cung cấp tùy chọn lắp đặt thêm các bộ tăng tốc Spyre.
Bộ vi xử lý Telum II của IBM là trung tâm của máy chủ z17 mới. CPU Telum II có tám lõi tiên tiến hoạt động ở tốc độ 5,5 GHz, với cải tiến về dự đoán nhánh, ghi lại dữ liệu và chuyển đổi địa chỉ. Chip này được trang bị 36MB bộ nhớ đệm L2, tăng 40% so với phiên bản trước. Nó hỗ trợ các cấp bộ nhớ đệm ảo L3 và L4, mở rộng tổng bộ nhớ đệm lên 360 MB và 2.
Telum II có dung lượng 88 GB và tích hợp đơn vị xử lý dữ liệu DPU để tăng tốc khối lượng công việc giao dịch, cải thiện độ phản hồi của hệ thống. Chip được sản xuất bằng quy trình 5HPP của Samsung và chứa 43 tỷ transistor. Ngoài hiệu suất nâng cao, Telum II còn có đơn vị AI cải tiến, cung cấp khả năng tính toán gấp bốn lần thế hệ trước, đạt 24 triệu phép toán mỗi giây với độ chính xác dữ liệu INT8.
Có thể, 24 TOPS không quá ấn tượng. Tuy nhiên, NPU được thiết kế cho các ứng dụng nhạy cảm với thời gian, hỗ trợ phương pháp AI tổng hợp và học máy truyền thống với mô hình ngôn ngữ lớn để phát hiện hoạt động nghi ngờ và gian lận. Intel đã ra mắt bộ vi xử lý Xeon 6500-6700 với các lõi hiệu suất, trong khi AMD giới thiệu Instinct MI325X với 256 GB HBM3E. Cần lưu ý rằng mỗi đơn vị AI trong một khay bộ xử lý có thể nhận nhiệm vụ từ bất kỳ lõi CPU nào.
Điều này đảm bảo phân bổ đều nhu cầu xử lý và tận dụng tối đa 192 triệu phép toán mỗi giây cho mỗi khay khi tất cả các bộ tăng tốc đều hoạt động. IBM nhận thấy một số khối lượng công việc cần hiệu suất AI cao hơn. Vì vậy, bên cạnh Telum II, IBM đã ra mắt thẻ tăng tốc AI Spyre với giao diện PCIe. Bộ xử lý 26 tỷ bóng bán dẫn này có 32 lõi AI và kiến trúc tương tự như kiến trúc của bộ tăng tốc AI trong Telum II, cho phép mở rộng linh hoạt khả năng và hiệu suất AI của các khay z17.
Ngành công nghiệp đang nhanh chóng nhận ra rằng giá trị của AI phụ thuộc vào cơ sở hạ tầng mà nó hoạt động, theo Ross Mauri, giám đốc điều hành IBM Z và LinuxONE. Với z17, chúng tôi đưa AI vào trung tâm doanh nghiệp với phần mềm, sức mạnh xử lý và lưu trữ để triển khai AI nhanh chóng. Ngoài ra, các tổ chức có thể tận dụng lượng dữ liệu lớn chưa được khai thác một cách an toàn và hiệu quả về chi phí với AI.
Để hỗ trợ các tác vụ AI ở cấp hệ thống, IBM dự kiến ra mắt zOS 3.2 vào quý 3 năm 2025, phiên bản cập nhật của hệ điều hành mainframe. Hệ điều hành mới được thiết kế để hoạt động với tăng tốc phần cứng và hỗ trợ dữ liệu NoSQL cũng như đám mây lai. Các mainframe z của IBM, đặc biệt là z17, có các tính năng bảo mật mạnh mẽ, bao gồm công cụ mới IBM Vault, được phát triển bởi HashiCorp để quản lý thông tin xác thực, khóa và mã thông báo trong các môi trường lai.
Hệ thống còn hỗ trợ phần cứng cho phân loại dữ liệu và phát hiện bất thường nhờ khả năng suy diễn của CPU Telum II. Về lưu trữ, IBM z17 sẽ sử dụng hệ thống IBM DS8000 Gen10, được thiết kế cho giao dịch tốc độ cao, độ sẵn sàng và khả năng mở rộng cho các hoạt động quan trọng. IBM z17 sẽ ra mắt vào ngày 18 tháng 6 năm 2025, trong khi Spyre Accelerator sẽ có mặt sau đó trong năm.
Nguồn: www.tomshardware.com/tech-industry/ibm-boosts-mainframes-with-50-percent-more-ai-performance-z17-features-telum-ii-chip-with-ai-accelerators