Hai tuần khuấy đảo thế giới của DeepSeek
Công nghệ AI Thứ Tư, 5/2/2025, 09:00 GMT+7
Hai tuần gây chú ý của DeepSeek
Từ một dự án gần như vô danh, mô hình AI Trung Quốc DeepSeek đã khiến nhiều tập đoàn công nghệ lớn phải e dè và tìm cách tích hợp. DeepSeek thật sự ấn tượng với mô hình nguồn mở có khả năng suy luận và hiệu suất tính toán vượt trội, theo CEO Microsoft Satya Nadella tại Diễn đàn Kinh tế Thế giới ở Davos ngày 22/1.
Giao diện ứng dụng DeepSeek trên điện thoại, với logo của một số hãng công nghệ phía sau. Sản phẩm ra mắt vào năm 201, đánh dấu bước ngoặt cho dự án AI Trung Quốc. Được thành lập giữa năm 2023 bởi Liang Wenfeng và đội ngũ kỹ sư trong nước, DeepSeek đã nhận được nhiều đánh giá tích cực khi ra mắt phiên bản V2 và V3, nhưng vẫn bị overshadow bởi các sản phẩm Mỹ như ChatGPT, Gemini, Claude.
Theo Semrush, DeepSeek đã có 2.300 lượt truy cập từ Mỹ vào ngày 11/02/2024, tăng lên 71.200 vào ngày 19/01, vẫn còn thấp so với hàng triệu lượt của ChatGPT. Bước ngoặt xảy ra vào cuối năm Âm lịch khi công ty của Wenfeng ra mắt DeepSeek R1, một mô hình AI có khả năng lý luận và mã nguồn công khai trên GitHub, đạt kết quả vượt trội so với OpenAI o1 trong nhiều bài kiểm tra.
Đặc biệt, chi phí đào tạo R1 rất rẻ, chỉ dưới 6 triệu USD. R1 là mã nguồn mở 100%, trong khi O1 tốn 60 USD cho một triệu token đầu ra, R1 chỉ tốn 2,19 USD. Trong một tuần, DeepSeek nhanh chóng phổ biến. Ngày 241, ứng dụng di động này đạt một triệu lượt tải trên App Store và Google Play, và tăng lên 2,6 triệu lượt vào ngày 271. Tôi nghĩ đây là ứng dụng AI miễn phí tốt nhất từng có.
Một người dùng trên App Store tại Việt Nam nhận xét rằng ứng dụng DeepSeek thông minh, phản hồi nhanh và có chất lượng tương đương 910 so với ChatGPT Pro mà không mất phí. Ứng dụng này đã vươn lên vị trí đầu bảng vào ngày 281. Theo Appfigures, DeepSeek lọt vào top 10 ứng dụng miễn phí tại 111 quốc gia trên App Store và 18 quốc gia trên Google Play. Trong giai đoạn này, 15 lượt tải đến từ Mỹ và 23 từ Trung Quốc. DeepSeek ghi nhận lượt tải nhiều hơn gần 300 so với Perplexity, một ứng dụng AI hàng đầu khác.
Thành công của DeepSeek đến từ nhiều yếu tố, bao gồm chất lượng câu trả lời, khả năng suy luận, mã nguồn mở, chi phí phát triển thấp và đặc biệt là phát hành miễn phí, thay vì phải trả hàng trăm USD mỗi tháng như các dịch vụ khác. Trong khi các công ty lớn như OpenAI, Microsoft, và Nvidia tập trung vào dự án Stargate trị giá 500 tỷ USD do Tổng thống Trump công bố, sự ra mắt của DeepSeek như một cú sốc.
Các nhà đầu tư đang băn khoăn liệu có nên đầu tư lớn vào AI, khi một startup như DeepSeek vẫn có thể thành công dù nguồn lực và chip hạn chế. Cổ phiếu của Nvidia giảm mạnh 17% xuống 271 USD, làm cả ngành công nghệ Mỹ lo lắng. Ông Trump cho rằng sự ra mắt của DeepSeek AI là lời cảnh tỉnh cho ngành công nghiệp, nhấn mạnh cần tập trung vào cạnh tranh.
Theo Reuters, ông đã có buổi gặp riêng với CEO Nvidia, Jensen Huang, vào ngày 31/1, để thảo luận về DeepSeek và các biện pháp ngăn chặn dự án từ Trung Quốc tiếp cận nguồn chip hiệu năng cao của công ty. Nvidia sau đó đã tích hợp DeepSeek vào giải pháp Nvidia NIM, nhằm tăng tốc triển khai AI tạo sinh cho doanh nghiệp, với lời giới thiệu R1 cung cấp độ chính xác cao cho các tác vụ suy luận logic, toán học, mã hóa và hiểu ngôn ngữ.
DeepSeek R1 là mô hình mở với khả năng suy luận tiên tiến, thực hiện nhiều lần suy luận qua một truy vấn để tạo ra câu trả lời tốt nhất. Mô hình này có 671 tỷ tham số, gấp nhiều lần so với các mô hình ngôn ngữ lớn khác, và hỗ trợ độ dài ngữ cảnh đầu vào lên đến 128.
Mô hình có 256 chuyên gia cho mỗi lớp và mỗi token sẽ được gửi đến tám chuyên gia khác nhau để đánh giá. Quy trình này được gọi là test-time scaling. DeepSeek-R1 là một ví dụ điển hình và Nvidia đã đánh giá như vậy. Tuy nhiên, sự phát triển nhanh chóng của DeepSeek cùng với tuyên bố chi phí dưới 6 triệu USD đã khiến công ty Trung Quốc gặp phải hoài nghi.
Theo SemiAnalysis, DeepSeek đã chi hơn 500 triệu USD cho phần cứng. Việc tạo dữ liệu để đào tạo mô hình cũng tốn nhiều tài nguyên tính toán. Số tiền 5,6 triệu USD có thể chỉ tính chi phí đào tạo, chưa bao gồm nghiên cứu, phát triển, chuẩn bị dữ liệu, bảo trì phần cứng và các vấn đề khác. DeepSeek được cho là sử dụng 50.000 chip Nvidia H100 thay vì chip H800, nhưng thông tin này không được công khai do vi phạm kiểm soát xuất khẩu của Mỹ.
Giống như nhiều ứng dụng Trung Quốc khác, DeepSeek gây lo ngại về an toàn thông tin. Italy đã cấm ứng dụng này trên hai kho ứng dụng của Apple và Google. Tại Mỹ, NASA, Hải quân, Hạ viện và bang Texas cũng cấm nhân viên sử dụng với lý do an ninh quốc gia và quyền riêng tư. Mặc dù gây tranh cãi, sự xuất hiện của DeepSeek được coi là đã thay đổi cục diện công nghệ và khiến các công ty AI lớn phải hành động.
Cùng với Nvidia NIM, Microsoft cũng giới thiệu DeepSeek R1.
Nguồn:vnexpress.net/hai-tuan-khuay-dao-the-gioi-cua-deepseek-4845438.html