Meta bảo vệ sử dụng vật liệu lậu, tuyên bố đó là hợp pháp nếu bạn không gieo hạt
Meta đã tuyên bố trong một hồ sơ tòa án rằng mặc dù đã tải xuống 82 TB dữ liệu vi phạm bản quyền từ các thư viện ẩn danh để huấn luyện mô hình AI LLaMA, nhưng nhân viên của họ đã thực hiện các biện pháp để không chia sẻ (seeding) các tệp đã tải xuống. Trong thuật ngữ torrent, "seeding" đề cập đến việc chia sẻ tệp với người dùng khác trong hoặc sau khi tải xuống.
Luật sư của Meta cho rằng không có bằng chứng nào cho thấy Meta đã chia sẻ sách của nguyên đơn. Điều này có nghĩa là công ty đang dựa vào việc hiện tại không có chứng cứ cho thấy Meta đã chia sẻ tài liệu trong quá trình tải xuống. Mặc dù Meta khẳng định không có bằng chứng về việc chia sẻ, Michael Clark, một giám đốc tại Meta phụ trách quản lý dự án, đã làm chứng rằng các cài đặt cấu hình mà họ sử dụng đã được điều chỉnh để giảm thiểu việc chia sẻ xuống mức tối thiểu.
Sau tuyên bố này, một câu hỏi về lý do Meta chọn cách giảm thiểu việc phát tán đã được đặt ra, nhưng quyền bảo mật luật sư đã được áp dụng để Clark không thể trả lời. Thú vị là, tuyên bố của Clark cho thấy Meta đã tìm cách giảm thiểu việc phát tán, nhưng chưa có thông tin nào cho thấy đã hoàn toàn ngăn chặn việc phát tán tài liệu bản quyền. Thêm vào đó, một tin nhắn nội bộ từ Frank Zhang, một nhà nghiên cứu của Meta, có thể chỉ ra việc che giấu khả năng phát tán từ máy chủ của Meta để tránh rủi ro bị truy vết về nguồn phát tán trở lại máy chủ Facebook.
Lập luận bào chữa của Meta dường như dựa vào việc thiếu bằng chứng về việc họ không chia sẻ lượng dữ liệu lớn mà họ đã tải xuống để đào tạo các mô hình AI. Nếu Meta thắng trong trường hợp này và chứng minh rằng việc tải xuống nội dung có bản quyền không phải là bất hợp pháp, trong khi việc phân phối mới vi phạm, điều này có thể ảnh hưởng đến các vụ kiện liên quan đến vi phạm bản quyền trong tương lai. Việc sử dụng thuật ngữ liên quan đến torrent có thể là cách để Meta gây khó khăn cho các tòa án.
Tập trung vào việc chia sẻ dữ liệu có thể làm phức tạp thêm cáo buộc rằng Meta biết mình đang vi phạm pháp luật khi tải xuống tài liệu có bản quyền. Meta vẫn chưa phản hồi về việc liệu họ có biết rằng mình đang chia sẻ dữ liệu trong quá trình tải xuống hay không. Các tác giả của tài liệu có bản quyền cho rằng Meta đã tham gia vào một mạng lưới vi phạm bản quyền ngang hàng mà không có thỏa thuận cấp phép trước.
Tranh chấp tại tòa án vẫn đang tiếp tục, nên chưa có quyết định cuối cùng về vụ việc. Ngay cả sau khi có quyết định, Meta có thể sẽ kháng cáo nếu thua, điều này có thể kéo dài thời gian để có phán quyết cuối cùng. Tuy nhiên, cũng có những vụ việc tương tự. OpenAI đã bị các nhà văn kiện vào năm 2023, và New York Times cũng đã kiện OpenAI và Microsoft vì hàng triệu bài báo bị sao chép.
Với danh sách dài các vụ kiện liên quan đến LLM, có khả năng đây sẽ không phải là vụ cuối cùng của Meta mà chúng ta nghe thấy.
Nguồn: www.tomshardware.com/tech-industry/artificial-intelligence/meta-defends-using-pirated-material-claims-its-legal-if-you-dont-seed-content