giảm 600 tỷ đô la giá trị thị trường
Hôm nay không phải là ngày tốt cho các nhà đầu tư AI, đặc biệt là NVIDIA, khi công ty Trung Quốc DeepSeek đã gây rối loạn các chuẩn mực trong ngành với mô hình AI R1 mới nhất của họ, được cho là thay đổi khái niệm về đào tạo mô hình và tài nguyên liên quan. Mô hình AI R1 của DeepSeek đang làm xáo trộn thị trường AI nhờ hiệu quả đào tạo của nó. Liệu NVIDIA có sống sót trước sự giảm sút quan tâm này? Nếu bạn chưa hiểu lý do tại sao thị trường AI đang hoảng loạn, bài viết này chắc chắn dành cho bạn.
Trung Quốc đã ra mắt một mô hình AI được cho là được đào tạo với chi phí tài chính thấp hơn đáng kể, điều này đã dấy lên cuộc tranh luận về việc liệu "siêu chu kỳ AI" trong năm qua có bị thổi phồng hay không xứng đáng với số tiền đã đầu tư. DeepSeek R1 đã có thể cạnh tranh với một số mô hình ngôn ngữ lớn hàng đầu, với chi phí đào tạo được cho là gây bất ngờ.
DeepSeek R1 là một mô hình LLM mã nguồn mở độc đáo, khác biệt với các mô hình khác ở chỗ nó sử dụng quy trình Chain of Thought. Điều này có nghĩa là khi nhận được một yêu cầu, R1 sẽ trình bày các bước và kết luận mà nó đã thực hiện để đạt được câu trả lời cuối cùng. Nhờ vậy, người dùng có thể xác định được phần mà mô hình đã mắc sai lầm.
Một điểm thú vị khác về DeepSeek R1 là việc sử dụng Học Tăng Cường để đạt được kết quả. Đây là một dạng học máy, trong đó mô hình tương tác với môi trường để đưa ra quyết định dựa trên quy trình thưởng. Khi đạt được kết quả mong muốn, mô hình sẽ chọn những lựa chọn có phần thưởng cao nhất, từ đó đảm bảo đạt được kết quả tốt nhất.
Trong khi đó, với GPTs o1, trọng tâm chính là phương pháp học có giám sát, đòi hỏi phải đào tạo mô hình trên những tập dữ liệu lớn về văn bản và mã, do đó cần nhiều nguồn lực tài chính hơn. Về nguồn lực tài chính, có nhiều hiểu lầm trên thị trường về chi phí đào tạo của DeepSeeks, vì con số 5.6 triệu chỉ là chi phí vận hành mô hình cuối cùng, không phải tổng chi phí.
Do Trung Quốc bị hạn chế tiếp cận phần cứng AI tiên tiến, DeepSeek không nên công khai sức mạnh AI của mình. Các chuyên gia cho rằng DeepSeek có sức mạnh tương đương với đối thủ nhưng chưa được tiết lộ. Elon Musk và Alexandr Wang cho rằng DeepSeek có khoảng 50.000 GPU NVIDIA Hopper, thay vì 10.000 A100 như họ đã tuyên bố.
Musk, với kinh nghiệm từ xAI, đồng ý với Wangs về việc kiểm soát xuất khẩu. So với GPT-01 của OpenAI, R1 rẻ hơn khoảng năm lần cho các token đầu vào và đầu ra, khiến thị trường cảm thấy bất ngờ và không chắc chắn. Tuy nhiên, có điều thú vị mà chúng ta sẽ bàn luận tiếp theo, và mọi người không nên hoảng sợ về thành tựu của DeepSeek.
NVIDIA đã tạo ra doanh thu khổng lồ trong vài quý qua nhờ bán tài nguyên tính toán AI, và các công ty lớn trong nhóm Magnificent 7, bao gồm OpenAI, có công nghệ vượt trội hơn so với DeepSeek. Nếu DeepSeek có thể huấn luyện R1 với khả năng tính toán hạn chế, thì các công ty này sẽ mang lại điều gì cho thị trường với sức mạnh tính toán mạnh mẽ, tạo ra triển vọng lạc quan hơn cho tương lai của thị trường AI.
Không có đối thủ nào cạnh tranh với CUDA của NVIDIA và hệ sinh thái xung quanh nó. Trong bối cảnh AI đang phát triển, chúng ta chỉ mới bắt đầu. Việc DeepSeek triển khai không đánh dấu sự kết thúc của sự phấn khích về AI, mà chỉ ra tiềm năng chưa được khai thác của công nghệ này. Tuy nhiên, thị trường không đón nhận sự phát triển này một cách lạc quan, khi Team Green đã mất 300 tỷ USD giá trị thị trường sau R1 của DeepSeek.
Chúng tôi kỳ vọng mọi chuyện sẽ ổn định khi mọi người nhận ra những kết quả tích cực từ tình huống này. Điều này cũng sẽ thúc đẩy các công ty như Meta, Google và Amazon tăng tốc phát triển giải pháp AI của họ. Theo một nhà phân tích của Cantor Fitzgerald, thành công của DeepSeek sẽ khiến chúng ta lạc quan hơn về NVIDIA và tương lai của AI.
Nguồn: http://wccftech.com/has-deepseek-ended-the-ai-run-led-by-nvidia/