DeepSeek phát hành hệ thống tệp song song mới mạnh mẽ
DeepSeek AI đã công bố hệ thống tệp song song Fire-Flyer Fire System 3FS hoàn toàn mã nguồn mở trong tuần này, như một phần của sự kiện Tuần Mã Nguồn Mở. Công ty AI từ Trung Quốc này cho biết 3FS có thể đạt tốc độ đọc tổng hợp lên đến 7,3 TB trong các cụm máy chủ của mình, nơi họ đã sử dụng 3FS để tổ chức máy chủ từ ít nhất năm 2019. 3FS là hệ thống tệp song song dựa trên Linux, được thiết kế cho các hoạt động AI-HPC, nơi nhiều máy chủ lưu trữ dữ liệu liên tục được truy cập bởi các nút GPU để đào tạo LLMs.
3FS khác biệt so với các hệ thống tệp khác nhờ vào việc ưu tiên tốc độ đọc ngẫu nhiên hơn tất cả các yếu tố khác, gần như hoàn toàn bỏ qua việc lưu cache đọc. Khi huấn luyện các mô hình AI, các đơn vị tính cần truy cập dữ liệu huấn luyện ngẫu nhiên liên tục, và việc đọc dữ liệu này chỉ diễn ra một lần. Do đó, cache đọc gần như không hữu ích và 3FS đã loại bỏ nó. Thực tế, việc sử dụng cache đọc khi huấn luyện LLM có thể gây hại, vì LLM chủ yếu hoạt động như những máy suy diễn tinh chỉnh cao, việc đọc cùng một dữ liệu theo cùng một thứ tự nhiều lần có thể dẫn đến việc liên kết dữ liệu hoàn toàn khác nhau với mô hình ngôn ngữ.
Nhóm vận hành cụm máy học Fire-Flyer 2 của DeepSeek đã công bố bài báo vào tháng 8 năm ngoái, trình bày việc sử dụng 3FS trong hệ thống tùy chỉnh này. Fire-Flyer 2 sử dụng 180 nút lưu trữ, mỗi nút có 16 SSD 16TB và hai NUC 200Gbps. Các nút này phục vụ cho 10,000 GPU Nvidia A100 PCIe, được xây dựng trên các máy chủ rẻ hơn so với sản phẩm DGX-A100 của Nvidia.
DeepSeek cho biết hệ thống 3FS đạt hiệu suất 6.6 TB/s, đồng thời thực hiện các tác vụ đào tạo nền tảng, tăng thêm 1.4 TB/s băng thông đọc. Trong khi đó, hệ thống đối thủ Ceph chỉ đạt 1.1 TB/s trên một máy chủ 68 nút với 10 SSD 16TB và mạng 2 x 100 Gbps. 3FS được coi là phần quan trọng trong phần mềm của DeepSeek để đào tạo AI, đã được thử nghiệm trên giải pháp Fire-Flyer 2 HPC, đạt 80% hiệu suất của máy chủ Nvidia DGX-A100 với 50% giá và 60% mức tiêu thụ điện.
Những người quan tâm đến việc thử nghiệm Hệ thống Tập tin Fire-Flyer và phong cách đọc ngẫu nhiên cho các giải pháp AI-HPC có thể tải xuống đầy đủ trên trang Github của DeepSeeks. Chúng tôi sẽ ngạc nhiên nếu hệ thống mã nguồn mở này không trở thành xu hướng cho cả người đam mê và người dùng AI-HPC doanh nghiệp, mặc dù nó có thể phải vượt qua nỗi lo sợ về công nghệ Trung Quốc để đạt được thành công lớn.
Nguồn: www.tomshardware.com/pc-components/storage/deepseek-releases-powerful-new-parallel-file-system-fire-flyer-fire-system-made-open-source