GPU đáp ứng các ổ cứng dựa trên PCIE: Seagate và Nvidia Demo NVME HDDS
Ổ cứng HDD sẽ vẫn là giải pháp lưu trữ tiết kiệm chi phí nhất cho các trung tâm dữ liệu trong những năm tới. Để phù hợp hơn với các trung tâm dữ liệu AI, Seagate đang phát triển ổ HDD sử dụng giao diện PCIe và giao thức NVMe 2.0. Tại GTC, Seagate đã trình diễn một hệ thống mẫu sử dụng ổ NVMe HDD, ổ NVMe SSD, DPU BlueField 3 của Nvidia và phần mềm AIStore để minh họa cách NVMe biến đổi ổ cứng cho các tác vụ AI.
Seagate đang dẫn đầu so với các đối thủ trong việc phát triển ổ cứng NVMe. Các ổ cứng truyền thống thường sử dụng giao thức chuyên dụng như SCSI, Parallel ATA và SATA, nhưng những giao thức này đang gặp giới hạn trong môi trường dữ liệu hiện đại, đặc biệt là trong AI và các trung tâm dữ liệu quy mô lớn. Cả SATA và SAS đều dựa vào các giao thức được phát triển từ những năm 1980, không phù hợp với việc xử lý dữ liệu nhanh hiện nay.
Cấu hình SAS và SATA yêu cầu bộ điều khiển bus máy chủ và các lớp điều khiển bổ sung, làm tăng độ phức tạp, khả năng thất bại và độ trễ. Do đó, các kiến trúc này không phù hợp với các tác vụ AI, cần truy cập nhanh chóng và hiệu suất cao vào tập dữ liệu lớn. So với SAS/SATA, NVMe kết hợp với PCIe cung cấp băng thông cao hơn, độ trễ thấp hơn và khả năng mở rộng tốt hơn.
Khác với SASSATA, giới hạn tốc độ từ 6-12 Gbps và phụ thuộc vào các lớp phức tạp như HBA và bộ mở rộng, NVMe vận hành qua giao diện PCIe tiêu chuẩn ngành, hỗ trợ tốc độ lên đến 128 GB/s. Mặc dù một ổ cứng HDD không cần vượt quá 1 TB trong thời gian tới, nhưng ở cấp độ hệ thống, băng thông cao giúp giảm độ phức tạp và dễ dàng mở rộng. NVMe cũng cho phép truy cập trực tiếp từ GPU đến bộ nhớ thông qua GPUDirect, bỏ qua CPU, giảm tắc nghẽn CPU, và hỗ trợ 64K hàng đợi với 64K lệnh mỗi hàng đợi, cải thiện khả năng xử lý song song, điều này rất quan trọng cho các hệ thống AI.
Hệ thống chứng minh khái niệm: Để xác nhận kiến trúc này, Seagate đã xây dựng một hệ thống thử nghiệm tích hợp tám ổ HDD NVMe, bốn ổ SSD NVMe cho bộ nhớ cache, một DPU Nvidia Bluefield 3 và phần mềm AIStore, tất cả chạy trong một vỏ bọc NVMe hybrid của Seagate. Máy thử nghiệm cho thấy việc truy cập trực tiếp từ GPU tới lưu trữ giúp giảm độ trễ trong quy trình AI. Ngoài ra, việc loại bỏ cơ sở hạ tầng SASSATA cũ đã đơn giản hóa kiến trúc hệ thống và tăng hiệu quả lưu trữ.
Phần mềm AIStore tối ưu hóa linh hoạt việc lưu trữ và phân cấp dữ liệu, giúp tăng hiệu suất đào tạo mô hình AI. Seagate cho biết hệ thống có khả năng mở rộng lên đến cấp exabyte khi sử dụng NVMe-over-Fabric. Việc tích hợp NVMe-oF cho phép mở rộng dễ dàng các cụm lưu trữ AI đa giá, điều này rất quan trọng để mở rộng hiệu quả, đặc biệt là trong các trung tâm dữ liệu lớn.
Thử nghiệm đã xác nhận rằng ổ cứng NVMe có thể hỗ trợ môi trường AI hiệu suất cao mà không cần hoàn toàn dựa vào lưu trữ flash, giúp giảm chi phí mà vẫn duy trì hiệu suất. Các hệ thống AI đang tạo ra sự tăng trưởng dữ liệu nhanh chóng, trong khi các kiến trúc hiện tại gặp nhiều hạn chế. SSD mang lại hiệu suất cao nhưng không bền vững về mặt tài chính cho lưu trữ lâu dài ở quy mô lớn.
HDD SAS và SATA có giá thành phải chăng nhưng gây ra độ phức tạp và độ trễ do phụ thuộc vào bộ điều hợp bus máy chủ (HBA), silicon độc quyền và hệ thống điều khiển không tối ưu cho yêu cầu băng thông cao và độ trễ thấp của AI. Các tùy chọn lưu trữ đám mây cũng làm phức tạp cơ sở hạ tầng với chi phí chuyển dữ liệu WAN cao, thời gian truy xuất không ổn định và độ trễ tăng vọt, ảnh hưởng đến hiệu suất xử lý AI.
Những hạn chế này dẫn đến kiến trúc phức tạp, tốn kém và kém hiệu quả, làm chậm quá trình áp dụng và hiệu suất AI. Nhu cầu lưu trữ AI trong tương lai sẽ tăng cao khi các doanh nghiệp quản lý các tập dữ liệu từ petabyte đến exabyte cho việc huấn luyện và suy diễn mô hình AI. Giải pháp của Seagate mang lại kết nối NVMe cho HDD và tạo ra một nền tảng lưu trữ trung tâm dữ liệu thống nhất và hiệu quả sẽ phát huy tác dụng ở đây.
Theo quan điểm về độ phức tạp của HDD, việc thêm NVMe vào ổ cứng không tốn kém nhiều vì các HDD vẫn giữ lại các kết nối vật lý SASSATA và kích thước 3.5 inch truyền thống. Những thay đổi chỉ bao gồm việc hỗ trợ giao thức NVMe và giao diện PCIe cho bộ điều khiển, có lẽ chỉ tốn một khoản chi phí nhỏ, cùng với việc phát triển firmware hỗ trợ các tính năng của NVMe như GPUDirect.
Chuyển sang kết nối NVMePCIe giúp loại bỏ HBAs và giảm độ phức tạp, nên việc tăng giá nhỏ của HDD sẽ ít ảnh hưởng đến ngành công nghiệp. Tuy nhiên, khi dung lượng HDD tăng, hiệu suất IOPS trên TB sẽ giảm, có thể ảnh hưởng đến hiệu suất trong các cụm AI trong tương lai hoặc cần nhiều flash hơn để khắc phục. Do đó, có khả năng trong tương lai sẽ xuất hiện HDD với hai bộ truyền động, như Seagate Mach.
Các ổ đĩa này sẽ phù hợp hơn cho các cụm AI. Mặc dù giá của chúng cao hơn so với HDD với một cơ cấu điều khiển, nhưng vẫn rẻ hơn hai ổ HDD đơn, vì vậy sẽ không gây ra sự gián đoạn lớn. Một câu hỏi mà người đọc mê sách thường đặt ra sau khi biết về lợi ích của NVMe cho HDD là khi nào những ổ đĩa này sẽ ra mắt. Thật không may, điều này khó có thể xác định.
Các công ty lớn thường ưu tiên có nguồn cung cấp kép cho các sản phẩm như ổ cứng HDD, vì vậy ổ cứng NVMe đã được phát triển trong khuôn khổ dự án OCP. Hiện tại, Seagate đã có ổ cứng NVMe, trong khi các đối thủ khác vẫn chưa giới thiệu sản phẩm của họ.
Nguồn: www.tomshardware.com/pc-components/hdds/gpu-meets-pcie-based-hard-drives-seagate-and-nvidia-demo-nvme-hdds