AI nguồn mở là gì và sự khác biệt của DeepSeek
DeepSeek là AI mã nguồn mở mạnh mẽ nhất, cho phép người dùng toàn quyền truy cập vào mã nguồn. Nó được đánh giá cao với những đột phá ấn tượng, và được xem là món quà quý giá cho thế giới công nghệ, theo nhận định của nhà đầu tư mạo hiểm Marc Andreessen.
Mã nguồn mở thu hút người dùng vì miễn phí hoặc giá thấp hơn phần mềm thương mại. Nhiều công ty AI, bao gồm Meta và Google, đã phát triển mã nguồn mở. OpenAI, thành lập năm 2015, ban đầu theo định hướng nguồn mở nhưng sau đó chuyển sang mục tiêu lợi nhuận. Ngày 102, Elon Musk, một trong những nhà đồng sáng lập OpenAI, muốn mua lại mảng phi lợi nhuận của công ty phát triển ChatGPT với giá 97,4 tỷ USD.
Elon Musk cho rằng đã đến lúc OpenAI trở lại với nguồn mở và chú trọng vào an toàn như trước. Trong tuyên bố của mình, ông nhấn mạnh rằng nhiều mô hình AI mã nguồn mở đã xuất hiện nhưng chưa có định nghĩa chung. Năm ngoái, tổ chức Sáng kiến Nguồn mở OSI đã tập hợp một nhóm 70 người, bao gồm nhà nghiên cứu, luật sư, nhà hoạch định chính sách và đại diện từ các công ty công nghệ lớn như Meta, Google và Amazon.
Đến tháng 8 năm 2024, định nghĩa AI nguồn mở ra đời. Theo OSI, AI nguồn mở là hệ thống được phép sử dụng cho mọi mục đích mà không cần xin phép. Các nhà nghiên cứu có thể kiểm tra, sửa đổi và chia sẻ các thành phần của hệ thống. Ngoài ra, nhà phát triển có thể xác định mức độ minh bạch cho dữ liệu đào tạo, mã nguồn và trọng số của mô hình.
Bộ dữ liệu huấn luyện sẽ được công khai và hợp pháp. Mô hình AI của DeepSeek được xem là thuần nguồn mở vì mọi người có thể tải xuống, sao chép và xây dựng. Mã nguồn và giải thích kỹ thuật được chia sẻ miễn phí, cho phép các nhà phát triển và tổ chức toàn cầu truy cập, sửa đổi và triển khai. Ngược lại, mặc dù các mô hình của Meta và Google có thể xem được, nhưng chúng không phải là mã nguồn mở thực sự do hạn chế trong cách sử dụng và bộ dữ liệu đào tạo không được công khai.
Avijit Ghosh, nhà nghiên cứu chính sách tại Hugging Face, cho biết các công ty đã sử dụng sai thuật ngữ khi tiếp thị mô hình của họ. Việc mô tả mô hình là mã nguồn mở có thể làm tăng độ tin cậy, mặc dù các nhà nghiên cứu không thể xác minh tính chất này. Sự khác biệt quan trọng của mô hình như DeepSeek là chi phí.
DeepSeek tuyên bố rằng mô hình của họ chỉ cần khoảng 5,6 triệu USD để phát triển, tương đương 10 lần chi phí xây dựng Meta Llama, trong khi các sản phẩm của OpenAI, Meta, Google hay Anthropic tiêu tốn hàng tỷ USD. Mặc dù chi phí thực tế có thể cao hơn, nhưng đây vẫn là một mức chi phí thấp hơn nhiều so với các công ty hàng đầu. Việc thiết lập nhanh chóng và tiêu tốn ít năng lượng hơn sẽ là tin tốt cho môi trường, khi mức tiêu thụ điện cao liên quan đến AI đang gia tăng lượng khí thải carbon, theo bình luận của Diễn đàn Kinh tế Thế giới WEF.
Cách tiếp cận của DeepSeek có thể giúp mở rộng quy mô AI bền vững hơn. Đến cuối tháng 1, DeepSeek đã vượt qua ChatGPT trở thành ứng dụng miễn phí được tải nhiều nhất trên App Store tại Mỹ và một số thị trường toàn cầu. Theo các chuyên gia, việc phổ cập AI như DeepSeek đang thúc đẩy dân chủ hóa AI, đặc biệt ở những khu vực có hạn chế về công nghệ, đồng thời thúc đẩy tiến bộ công nghệ chung.
Nhà phát triển nên tập trung vào tạo ra ứng dụng riêng thay vì xây dựng mô hình chuyên biệt, nhằm khai thác sức mạnh của AI để giải quyết vấn đề thực tế. Đây cũng là mục tiêu của sáng kiến Chuyển đổi ngành công nghiệp AI tại Diễn đàn Kinh tế thế giới tháng trước, với sách trắng mới khám phá tiềm năng và thách thức của AI trong các ngành công nghiệp.
DeepSeek có nhiều tính năng cạnh tranh với mô hình AI nguồn đóng, thu hút sự chú ý nhờ khả năng giải quyết nhiều vấn đề của người dùng. CEO Apple Tim Cook cho rằng sự đổi mới trong mô hình này thúc đẩy hiệu quả. Theo TechCrunch, cộng đồng công nghệ tin rằng tính nguồn mở của DeepSeek sẽ thúc đẩy hợp tác và tăng tốc đổi mới trong lĩnh vực AI.
Việc thiếu minh bạch về dữ liệu đào tạo cho các mô hình AI hàng đầu đã dẫn đến nhiều vụ kiện. Năm ngoái, OpenAI bị các nhà văn, nghệ sĩ và cơ quan báo chí kiện vì sử dụng tác phẩm của họ trái phép. Tuy nhiên, việc cho phép các mô hình như DeepSeek hoạt động tự do cũng tiềm ẩn rủi ro lớn, với nguy cơ bị sử dụng cho mục đích xấu như phát triển vũ khí sinh học và phát tán thông tin sai lệch.
Ngoài ra, các mô hình này có thu thập dữ liệu quá mức hay không?
Nguồn:vnexpress.net/ai-nguon-mo-la-gi-va-su-khac-biet-cua-deepseek-4848105.html