Bài toán 9,9 và 9,11 hot trở lại khi người dùng thử tài DeepSeek
Bài toán 9,9 và 9,11 lại gây chú ý khi người dùng thử nghiệm với DeepSeek. DeepSeek cho rằng 9,9 lớn hơn 9,11, trong khi ChatGPT, Meta AI và Gemini lại cho rằng ngược lại. Kể từ giữa năm ngoái, phép so sánh này đã gây xôn xao trên mạng xã hội và được xem là thử thách khó khăn cho một số mô hình AI. Dù có vẻ đơn giản, nhưng nhiều chatbot AI vẫn đưa ra câu trả lời sai.
ChatGPT, Meta AI và Google Gemini đều cho rằng 9,11 lớn hơn. Khi thử nghiệm lại vào tháng 2, các chatbot này vẫn đưa ra câu trả lời tương tự. Trong khi đó, DeepSeek, chatbot mới từ Trung Quốc, giải quyết bài toán theo từng bước, so sánh phần nguyên và phần thập phân, và kết luận rằng 0,90 nhỏ hơn 0,11, nên 9,9 nhỏ hơn 9,11. Câu trả lời của DeepSeek khác với các chatbot còn lại.
Khi thử thách xuất hiện tại Trung Quốc vào tháng 7 năm 2024, hai chatbot phổ biến là Kimi của Moonshot AI và Baixiaoying của Baichuan đã trả lời sai rằng 9,11 lớn hơn. Sau khi nhận được phản hồi từ người dùng, cả hai đã sửa thuật toán và xin lỗi, giải thích nguyên nhân là do phương pháp tiếp cận chuỗi suy nghĩ không chính xác.
AI có thể tách số sau dấu phẩy để so sánh 11 với 9, từ đó khẳng định 11 lớn hơn, và do đó 9,11 cũng lớn hơn. Tuy nhiên, một số AI cần quy trình phức tạp hơn, như Qwen LLM của Alibaba sử dụng Python Code Interpreter để tính toán, trong khi Ernie Bot của Baidu cần sáu bước để đưa ra câu trả lời đúng. Theo nghiên cứu của Wu Yiquan tại Đại học Chiết Giang, việc AI không giỏi toán là vấn đề phổ biến.
Các mô hình ngôn ngữ lớn (LLM) không có khả năng toán học thực sự, vì chúng chỉ dự đoán câu trả lời dựa trên dữ liệu đào tạo. Một số LLM làm tốt bài kiểm tra toán có thể do đã ghi nhớ câu trả lời từ dữ liệu tương tự. Thế giới AI được mã hóa, vì vậy số, từ, dấu câu và khoảng trắng đều được xử lý giống nhau.
Bất kỳ thay đổi nào trong lời nhắc đều có thể ảnh hưởng lớn đến kết quả. Các chuyên gia khuyên người dùng không nên hoàn toàn tin tưởng vào mô hình AI, vì chúng thường trả lời sai hoặc bịa ra thông tin. Vào năm 201, công ty khởi nghiệp Trung Quốc DeepSeek đã công bố mô hình V3 miễn phí và mô hình R1, được đào tạo trên chip cũ của Nvidia, mã nguồn mở 100%, rẻ hơn 96,4% so với OpenAI o1 nhưng vẫn cho hiệu suất tương đương.
Công ty cho biết chỉ mất hai tháng và 5,6 triệu USD để phát triển mô hình AI sử dụng chip H800 của Nvidia. Phiên bản V3 đã vượt ChatGPT, trở thành ứng dụng được tải nhiều nhất trên App Store, trong khi giá trị của Nvidia giảm gần 600 tỷ USD.
Nguồn:vnexpress.net/bai-toan-9-9-va-9-11-hot-tro-lai-khi-nguoi-dung-thu-tai-deepseek-4845025.html