Deepseek đã kết thúc cuộc chạy AI do Nvidia dẫn đầu?Một chuyến đi sâu vào những gì tiếp theo cho Seven Magnificent Seven
Hôm nay không phải là một ngày tốt cho các nhà đầu tư AI, đặc biệt là NVIDIA, khi công ty Trung Quốc DeepSeek đã gây rối loạn các quy chuẩn trong ngành với mô hình AI R1 mới nhất của họ, hứa hẹn thay đổi cách thức đào tạo mô hình và tài nguyên cần thiết. Mô hình AI R1 của DeepSeek đã làm rối loạn thị trường AI nhờ vào hiệu quả đào tạo của nó. Liệu NVIDIA có sống sót qua cơn khủng hoảng này? Nếu bạn vẫn chưa hiểu tại sao thị trường AI đang hoảng loạn, bài viết này sẽ giúp bạn.
Trung Quốc đã ra mắt một mô hình AI được cho là được đào tạo với chi phí tài chính thấp hơn đáng kể, điều này đã dấy lên cuộc tranh luận về việc liệu "siêu chu kỳ AI" trong năm qua có bị thổi phồng hay không xứng đáng với số tiền bỏ ra. DeepSeek R1 đã có thể cạnh tranh với một số LLM hàng đầu, với chi phí đào tạo gây bất ngờ.
DeepSeek R1 là một mô hình LLM mã nguồn mở độc đáo, khác biệt với các mô hình khác nhờ vào việc áp dụng một phương pháp chưa từng được sử dụng. R1 sử dụng quy trình Chain of Thought, cho phép mô hình trình bày các bước và kết luận của mình khi xử lý một câu hỏi. Điều này giúp người dùng dễ dàng xác định nơi mà mô hình sai sót.
Một điểm thú vị nữa về DeepSeek R1 là việc sử dụng Học Tăng cường để đạt được kết quả. Đây là một loại học máy, trong đó mô hình tương tác với môi trường để đưa ra quyết định dựa trên quá trình thưởng. Khi đạt được kết quả mong muốn, mô hình sẽ chọn những phương án có phần thưởng cao nhất, đảm bảo đạt được kết luận mong muốn.
Với GPTs o1, trọng tâm chính là phương pháp học có giám sát, đòi hỏi huấn luyện mô hình trên các tập dữ liệu lớn về văn bản và mã, dẫn đến việc cần nhiều nguồn tài chính hơn. Về nguồn tài chính, có nhiều hiểu lầm trên thị trường về chi phí huấn luyện của DeepSeeks, vì con số 5,6 triệu đô la được đồn đại chỉ là chi phí vận hành mô hình cuối cùng, không phải tổng chi phí.
Do Trung Quốc bị hạn chế tiếp cận phần cứng AI tiên tiến, DeepSeek sẽ không khôn ngoan nếu công khai sức mạnh AI của mình. Các chuyên gia cho rằng DeepSeek có khả năng tương đương với các đối thủ nhưng chưa được tiết lộ. Elon Musk và Alexandr Wang cho rằng DeepSeek có khoảng 50.000 GPU NVIDIA Hopper, không phải 10.000 A100 như công bố.
Musk, với kinh nghiệm từ xAI, đồng ý với Wangs về các quy định xuất khẩu của S. Trong khi R1 rẻ hơn khoảng năm lần so với GPT-01 của OpenAI, thị trường đang phản ứng với sự bất ngờ và lo lắng. Tuy nhiên, có những khía cạnh thú vị mà chúng ta sẽ bàn tiếp và mọi người không nên hoảng sợ về thành tựu của DeepSeek.
NVIDIA đã tạo ra doanh thu khổng lồ trong vài quý qua nhờ bán tài nguyên tính toán AI, và các công ty lớn trong nhóm Magnificent 7, bao gồm OpenAI, sở hữu công nghệ vượt trội so với DeepSeek. Nếu DeepSeek đã huấn luyện R1 với nguồn tính toán hạn chế, thì các công ty này có thể mang lại điều gì cho thị trường khi có sức mạnh tính toán mạnh mẽ, khiến triển vọng tương lai của thị trường AI trở nên lạc quan hơn.
Không có đối thủ nào cho CUDA của NVIDIA và hệ sinh thái xung quanh nó. Trong bối cảnh AI đang phát triển, chúng ta mới chỉ bắt đầu. Việc DeepSeek triển khai không đánh dấu sự kết thúc của cơn sốt AI, mà chỉ ra tiềm năng chưa được khai thác của công nghệ này. Tuy nhiên, thị trường không mấy lạc quan về sự phát triển này, khi Team Green đã mất 300 tỷ USD giá trị thị trường sau R1 của DeepSeek.
Chúng tôi dự đoán tình hình sẽ ổn định khi mọi người nhận ra kết quả tích cực từ sự việc này. Hơn nữa, điều này sẽ thúc đẩy các công ty như Meta, Google và Amazon nhanh chóng phát triển giải pháp AI của họ. Như một nhà phân tích của Cantor Fitzgerald đã nói, thành công của DeepSeek nên khiến chúng ta lạc quan hơn về NVIDIA và tương lai của AI.
Nguồn: wccftech.com/has-deepseek-ended-the-ai-run-led-by-nvidia/