Microsoft và Openai điều tra xem DeepSeek có nhận được dữ liệu bất hợp pháp từ Chatgpt
Microsoft và OpenAI đang điều tra việc một nhóm liên quan đến startup AI Trung Quốc DeepSeek có thể đã truy cập dữ liệu của OpenAI thông qua API của công ty mà không có sự cho phép. Theo một nguồn tin từ Financial Times, OpenAI có bằng chứng về việc nhóm này đã đánh cắp dữ liệu. Trong khi đó, các quan chức Mỹ nghi ngờ DeepSeek đã huấn luyện mô hình của mình bằng cách sử dụng đầu ra của OpenAI, một phương pháp được gọi là chưng cất.
Nhóm an ninh của Microsoft phát hiện một nhóm nghi ngờ có liên hệ với DeepSeek đang trích xuất một lượng lớn dữ liệu từ API của OpenAI. API này cho phép các nhà phát triển tích hợp các mô hình độc quyền của OpenAI vào ứng dụng của họ với một khoản phí và truy xuất dữ liệu. Tuy nhiên, việc lấy dữ liệu quá mức mà các nhà nghiên cứu của Microsoft ghi nhận đã vi phạm các điều khoản và điều kiện của OpenAI, cho thấy nỗ lực vượt qua các hạn chế của OpenAI.
Cuộc điều tra diễn ra sau khi DeepSeek ra mắt mô hình AI R1. Công ty này tuyên bố R1 ngang bằng hoặc vượt trội hơn các mô hình hàng đầu về khả năng suy luận, toán học và kiến thức chung, đồng thời tiêu tốn ít tài nguyên hơn. Sau thông báo của DeepSeek, Alphabet, Microsoft, Nvidia và Oracle đã trải qua tổng thiệt hại thị trường gần 1 nghìn tỷ đô la. Các nhà đầu tư lo ngại rằng những tiến bộ của DeepSeek có thể đe dọa vị thế thống trị của các công ty này.
Các công ty Mỹ trong lĩnh vực AI. Tuy nhiên, nếu DeepSeek bị phát hiện đã sử dụng dữ liệu thu thập trái phép từ người khác, điều này sẽ giải thích cách công ty đạt được kết quả mà không cần đầu tư hàng tỷ đô la. David Sacks, cố vấn AI của chính phủ Mỹ, cho biết có bằng chứng mạnh mẽ rằng DeepSeek đã sử dụng nội dung do OpenAI tạo ra để huấn luyện mô hình của mình thông qua một quy trình gọi là chưng cất. Phương pháp này cho phép một hệ thống AI học từ hệ thống khác bằng cách phân tích đầu ra của nó.
Sacks không cung cấp chi tiết cụ thể về bằng chứng. OpenAI và Microsoft cũng không đưa ra tuyên bố chính thức về cuộc điều tra. Quỹ đầu tư DeepSeek và High-Flyer, đơn vị đã giúp thành lập công ty, cũng không phản hồi yêu cầu bình luận từ Bloomberg. Tuy nhiên, trong một tuyên bố được Bloomberg và Financial Times công bố, OpenAI thừa nhận rằng các công ty có trụ sở tại Trung Quốc thường sao chép mô hình từ các công ty Mỹ và họ nỗ lực bảo vệ các mô hình của mình.
Theo Open AI, các công ty ở Trung Quốc và nơi khác đang cố gắng rút ra mô hình từ các công ty AI hàng đầu của Mỹ. Là nhà phát triển hàng đầu trong lĩnh vực AI, chúng tôi thực hiện các biện pháp bảo vệ quyền sở hữu trí tuệ, bao gồm quy trình cẩn thận để lựa chọn khả năng tiên tiến nào sẽ được đưa vào các mô hình phát hành. Chúng tôi tin rằng việc hợp tác chặt chẽ với chính phủ Mỹ là rất quan trọng trong tương lai.
Chính phủ Mỹ sẽ bảo vệ tốt nhất các mô hình ưu việt khỏi những nỗ lực của đối thủ và cạnh tranh trong việc chiếm đoạt công nghệ của Mỹ.
Nguồn: www.tomshardware.com/tech-industry/artificial-intelligence/microsoft-and-open-ai-investigate-whether-deepseek-illicitly-obtained-data-from-chatgpt