Tại sao DeepSeek gây chấn động thế giới?

Cửa hàng gần nhất

được xác nhận bởi itcctv

Tại sao DeepSeek gây chấn động thế giới?

DeepSeek, một công ty khởi nghiệp AI Trung Quốc, đang gây chấn động toàn cầu với hai công cụ V3 và R1. Với chi phí thấp nhưng tính năng không kém các mô hình hàng đầu phương Tây, DeepSeek đã thu hút sự chú ý, khiến Tổng thống Mỹ Donald Trump cảnh báo các công ty công nghệ Mỹ về sự trỗi dậy bất ngờ này.

Giao diện ứng dụng DeepSeek trên điện thoại với logo của một số hãng công nghệ phía sau. Theo Business Today, việc DeepSeek ra mắt V3 và R1 được xem là khoảnh khắc Sputnik trong lĩnh vực trí tuệ nhân tạo, giống như vụ phóng vệ tinh đầu tiên của Liên Xô vào ngày 4/10/1957, gây chấn động toàn cầu và khởi đầu cuộc chạy đua không gian. Thành công của Liên Xô đã khiến Mỹ và thế giới lo ngại về sự tụt hậu, dẫn đến các khoản đầu tư lớn vào khoa học, công nghệ và giáo dục.

DeepSeek được coi là bước ngoặt trong cuộc chiến AI toàn cầu, cho thấy Trung Quốc có khả năng cạnh tranh với các gã khổng lồ AI Mỹ. Cuối năm 2022, sự ra mắt của ChatGPT từ OpenAI đã kích thích một cuộc đua phát triển chatbot, nhưng trong khi các công ty phương Tây như Meta, Google, Microsoft đã tạo ra nhiều sản phẩm chất lượng, Trung Quốc vẫn chưa có mô hình đủ mạnh để rút ngắn khoảng cách về năng lực AI.

Chất lượng và hiệu quả của DeepSeek đang thay đổi cục diện. Công nghệ đột phá của công ty Trung Quốc có chi phí phát triển rất thấp, chỉ một phần nhỏ so với các mô hình AI đắt đỏ của các gã khổng lồ Mỹ. Mô hình không cần các cụm chip mạnh nhất nhưng vẫn đạt hiệu suất vượt trội. Theo DeepSeek, mô hình R1 được đào tạo trên chip H800 của Nvidia, mã nguồn mở 100, rẻ hơn 96,4% so với OpenAI o1 nhưng mang lại hiệu suất tương tự.

Công ty khẳng định chỉ cần hai tháng và chi phí dưới 6 triệu USD để phát triển mô hình AI mới, trong khi GPT của OpenAI tiêu tốn hàng tỷ USD cùng với hệ thống GPU Nvidia. Mô hình của DeepSeek được đào tạo trên 14,8 nghìn tỷ token và có 671 tỷ tham số, lớn hơn 1,6 lần so với Llama 3.1 405B. DeepSeek R1 chỉ tốn 2,19 USD cho mỗi triệu token đầu ra, trong khi OpenAI o1 tốn 60 USD, theo Giám đốc sản phẩm Shubham Saboo.

Theo các chuyên gia, R1 có chi phí vận hành thấp hơn từ 20 đến 50 lần so với các GPT của OpenAI. Điều này thách thức quan điểm phát triển chip ngày càng lớn trong ngành AI, theo Marc Andreessen, nhà đầu tư mạo hiểm nổi tiếng. Wei Sun, nhà phân tích AI tại Counterpoint Research, cho biết DeepSeek đã chứng minh rằng mô hình AI tiên tiến có thể phát triển với nguồn tài nguyên tính toán hạn chế.

📢 Liên hệ quảng cáo: 0919 852 204
Quảng cáo của bạn sẽ xuất hiện trên mọi trang!

Các nhà đầu tư lo ngại rằng các mô hình AI giá rẻ như DeepSeek có thể làm giảm nhu cầu về chip đắt tiền cho trung tâm dữ liệu, điều này ảnh hưởng đến sự tăng trưởng của các công ty như Nvidia. Sự hoảng loạn trên thị trường, đặc biệt khi giá trị của Nvidia giảm gần 600 tỷ USD trong một ngày, phản ánh điều này. Chuyên gia AI Morgan Brown cho rằng, tình hình hiện tại của trí tuệ nhân tạo giống như việc xây dựng một tòa nhà chọc trời.

Ông cho biết trên LinkedIn rằng để phát triển AI cần nguồn lực khổng lồ và hàng tỷ USD, nhưng DeepSeek đã chứng minh có thể làm điều đó với chi phí chỉ bằng 5 và ít thời gian hơn. Theo Brown, điều này cho thấy chi phí phát triển và triển khai AI có thể giảm đáng kể, giúp các công ty nhỏ có thể cạnh tranh với các tập đoàn lớn. AI tiên tiến có thể được phát triển mà không cần sức mạnh tính toán lớn, giúp giảm chu kỳ phát triển.

Các nhà sản xuất phần cứng như Nvidia có thể cần xem xét lại mô hình kinh doanh, trong khi các nhà cung cấp đám mây có thể phải điều chỉnh giá dịch vụ. Việc chạy AI như ChatGPT trên máy tính chơi game thay vì trung tâm dữ liệu không còn là điều viễn tưởng, mà là thành tựu của DeepSeek, theo đánh giá của Brown. Reuters cũng cho biết rằng những diễn biến hiện tại đang gây nghi ngờ về hiệu quả thực tế của các khoản đầu tư hàng tỷ USD vào AI của một số công ty công nghệ.

Nvidia đã phải khẳng định rằng những tiến bộ của DeepSeek chứng tỏ tầm quan trọng của chip AI tại Trung Quốc, nơi cần nhiều chip hơn trong tương lai. Nhà khoa học AI Yann LeCun của Meta cho rằng những ai cho rằng Trung Quốc vượt Mỹ về AI là sai lầm.

Các mô hình nguồn mở đang vượt trội hơn các mô hình độc quyền. LeCun cho rằng DeepSeek tận dụng lợi ích từ nghiên cứu mở, đưa ra ý tưởng mới và phát triển dựa trên công trình của người khác. Ông cho biết, vì các công trình được công bố và sử dụng mã nguồn mở, mọi người đều có thể hưởng lợi. Theo CNBC, mã nguồn mở giúp mọi người dễ dàng tiếp cận các mô hình AI thông minh, cho phép các nhà phát triển tạo ra phần mềm AI chuyên biệt với chi phí thấp nhưng vẫn đạt hiệu quả cao.

Người dùng có thể chọn giải pháp kinh tế thay vì chi nhiều tiền cho các sản phẩm tương tự đang thu phí.

Nguồn:vnexpress.net/tai-sao-deepseek-gay-chan-dong-the-gioi-4844001.html