Ít GPU NVIDIA AI cần thiết sau Deepseek, người đứng đầu công ty công nghệ Trung Quốc trị giá 600 tỷ đô la
Đây không phải là lời khuyên đầu tư. Tác giả không nắm giữ cổ phiếu nào được đề cập. Wccftech.com có chính sách công khai và đạo đức. Mặc dù các công ty lớn của Mỹ đã chi hàng tỷ đô la cho việc đầu tư vào GPU AI, giám đốc chiến lược của Tencent, James Mitchell, cho rằng những đột phá AI của DeepSeeks cho thấy việc chi tiêu như vậy có thể không cần thiết.
DeepSeeks tuyên bố đã phát triển các mô hình AI tương đương với một số đối thủ Mỹ nhưng với chi phí thấp hơn, đã tác động mạnh đến thị trường chứng khoán. Nạn nhân lớn nhất là cổ phiếu của NVIDIA, vẫn chưa phục hồi sau gần 600 tỷ USD thua lỗ trong đợt bán tháo tháng Giêng. Hội nghị GTC của NVIDIA diễn ra tuần này không gây ấn tượng với nhà đầu tư, và cổ phiếu vẫn không biến động dù CEO Jensen Huang chỉ ra nhiều thị trường trị giá hàng triệu tỷ USD cho sản phẩm của công ty.
Các công ty công nghệ Trung Quốc đã giảm chi tiêu vốn cho GPU AI do những đột phá từ DeepSeeks. Trong một buổi nói chuyện gần đây, Giám đốc Chiến lược của Tencent, James Mitchell, cho biết công ty đã đầu tư vào GPU AI của NVIDIA để huấn luyện các mô hình ngôn ngữ lớn (LLM). Tencent đã ra mắt mô hình AI Hunyuan Turbo S chỉ hơn một tháng sau khi sản phẩm của DeepSeeks nổi lên vào tháng Giêng. Công ty nhắm đến các startup Trung Quốc với sản phẩm của mình, cho biết mô hình có thể đáp ứng yêu cầu trong chưa đầy một giây.
Tuy nhiên, trong khi cạnh tranh với DeepSeek để phát triển các mô hình AI nhanh nhất, Tencent cũng nhận thấy rằng các công ty khởi nghiệp có những đột phá trong đào tạo có thể giảm đáng kể chi phí phát triển AI. DeepSeek tuyên bố đã giảm chi phí phát triển AI nhờ sử dụng kỹ thuật phần mềm tiên tiến, cho phép tiếp cận các chức năng cốt lõi của GPU. Thông thường, kỹ sư phụ thuộc vào phần mềm CUDA của NVIDIA để sử dụng chip, nhưng sự tiện lợi này lại kèm theo việc kiểm soát sản phẩm chặt chẽ hơn.
Mitchell cho biết rằng việc chi tiêu vốn cho GPU AI được sử dụng cho việc huấn luyện mô hình ngôn ngữ lớn là rất quan trọng. Trước khi DeepSeek công bố quy trình phát triển mô hình, có niềm tin rằng mỗi thế hệ mô hình ngôn ngữ mới cần nhiều GPU hơn gấp bội. Tuy nhiên, theo ông, DeepSeek đã thay đổi nhận thức này, ít nhất là trong các công ty Trung Quốc.
Thời gian đó kết thúc với những bước đột phá mà DeepSeek đã thể hiện, Mitchell cho biết. Ông không tiết lộ cụ thể, nhưng nêu rõ rằng sau những bước đột phá, ngành công nghiệp và chúng tôi trong ngành đang đạt được năng suất cao hơn trong việc huấn luyện mô hình ngôn ngữ lớn từ các GPU hiện có mà không cần thêm GPU mới như trước đây. Các công ty Trung Quốc bị hạn chế mua các GPU AI mới nhất của NVIDIA, như sản phẩm Blackwell và Hopper.
Các hạn chế đã buộc họ phải dựa vào chip cũ hoặc các cụm GPU lớn để khắc phục sự hạn chế về sức mạnh tính toán. Tencent đã tuyên bố rằng mẫu Turbo S của họ đã vượt qua các sản phẩm của DeepSeek về toán học, lý luận và các khả năng AI khác. Các nguồn tin trong ngành cho rằng các công ty Trung Quốc đang quan tâm hợp tác với Huawei và các chip AI Ascend của họ để vượt qua lệnh cấm chip. Tương tự như NVIDIA, Huawei cũng cung cấp phần mềm cho khách hàng chip của mình để kiểm soát các chip này.
DeepSeek cho rằng phần mềm của họ kém hơn sản phẩm của NVIDIA. Cổ phiếu NVIDIA vẫn chưa hồi phục về mức cao trước đợt bán tháo tháng Giêng, hiện giảm 14% từ đầu năm khi nhà đầu tư chờ thêm dữ liệu về nhu cầu. Công ty của Mitchell giao dịch trên thị trường OTC với giá trị vốn hóa 601 tỷ USD. James Mitchell từ Tencent nêu rõ lý do tiêu cực cho NVDA - các đổi mới của DeepSeek có thể làm giảm nhu cầu về GPU.
Tencent từng có suy nghĩ rằng, mặc dù việc sử dụng AI đang bùng nổ, nhưng vẫn có một khoảng thời gian năm ngoái khi mọi người tin rằng...
Nguồn: wccftech.com/fewer-nvidia-ai-gpus-needed-after-deepseek-says-600-billion-chinese-tech-firms-strategy-head/