Alibaba ra mô hình AI 'vượt trội DeepSeek'
Ngày 30 tháng 1 năm 2025, Alibaba đã ra mắt mô hình AI mới Qwen 2.5, vượt trội hơn DeepSeek V3, vào dịp Tết Nguyên đán. Việc phát hành vào ngày mùng 1 Tết, khi nhiều người Trung Quốc nghỉ làm, cho thấy sự nổi bật của DeepSeek trong tuần qua đã tạo áp lực lên các công ty công nghệ cả trong và ngoài nước.
Qwen 2.5-Max là mô hình AI mới nhất của Alibaba, vượt trội hơn nhiều mô hình khác như GPT-4o, DeepSeek-V3 và Llama-3.1-405B. Bộ phận phát triển điện toán đám mây của Alibaba nhấn mạnh rằng Qwen 2.5-Max vượt xa DeepSeek V3 trong nhiều tiêu chuẩn, bao gồm Arena-Hard, LiveBench, LiveCodeBench và GPQA-Diamond.
Nó thể hiện hiệu suất mạnh mẽ trong các đánh giá như MMLU-Pro. Alibaba cho biết mô hình đã được tích hợp vào Qwen Chat, cho phép người dùng trò chuyện trực tiếp và tương tác với các vật thể để tìm kiếm thông tin. DeepSeek chưa bình luận về các thông tin so sánh từ Alibaba. Việc AI DeepSeek phát hành mô hình DeepSeek-V3 và phiên bản R1 đã gây chấn động Thung lũng Silicon, khiến cổ phiếu nhiều công ty công nghệ giảm mạnh.
Chi phí thấp và thời gian phát triển ngắn của AI Trung Quốc khiến các nhà đầu tư nghi ngờ về kế hoạch chi tiêu lớn của các công ty Mỹ. Thành công của DeepSeek gây lo ngại cho nhiều công ty Mỹ, đồng thời khởi động cuộc chạy đua giữa các đối thủ trong nước. Chỉ hai ngày sau khi DeepSeek-R1 ra mắt, ByteDance, công ty mẹ của TikTok, đã cập nhật mô hình Doubao-1.5-pro và tuyên bố vượt qua OpenAI o1 trong bài kiểm tra AIME, theo Reuters.
Một số công ty Trung Quốc như Moonshot AI, Minimax và iFlyTek đã công bố mô hình lý luận vào đầu tháng 1.
Nguồn:vnexpress.net/alibaba-ra-mo-hinh-ai-vuot-troi-deepseek-4844325.html