Được Musk khen làm toán giỏi, Grok 3 lại tự nhận giải sai
Grok 3, một AI được Musk khen ngợi về khả năng toán học, đã tự nhận là giải sai một bài toán khó trong cuộc thi Putnam 2025. Mặc dù Grok 3 tìm ra giải pháp trong 8 phút, nhưng sau đó thừa nhận đáp án không chính xác, và không có thí sinh nào trong số 500 người tham gia giải được vấn đề này.
Putnam là cuộc thi toán học hàng năm dành cho sinh viên đại học ở Mỹ và Canada. Elon Musk đã bình luận rằng Grok 3 đang trở nên siêu phàm. Tuy nhiên, sau khi bài toán được chia sẻ, một số chuyên gia phát hiện có điểm bất thường. Kỹ sư phần mềm Todd Ensz đã hỏi Grok 3, và AI của Musk đã phân tích lại và kết luận đã hiểu sai vấn đề. Giao diện ứng dụng AI Grok có ảnh của Elon Musk bên cạnh.
Nhiều người trong phần bình luận đánh giá AI của Musk trung thực vì đã tự nhận lỗi khi đưa ra đáp án sai cho bài toán mà 500 sinh viên không giải được. Một số khác cho rằng AI này biết nắm bắt tâm lý và thao túng cảm xúc. Tuy nhiên, có lo ngại về vấn đề ảo giác của AI khi nó có thể bịa ra lời giải thuyết phục nhưng không chính xác. Grok 3, được xAI công bố vào ngày 18/2 và được Musk gọi là chatbot thông minh nhất Trái Đất.
AI hiện đang được triển khai miễn phí trên web và iOS. Tại Việt Nam, Grok 3 được đánh giá cao vì khả năng trả lời tự nhiên và tùy biến. Người dùng Thanh Sang cho biết nó có thể chuyển đổi cách nói chuyện nhanh chóng, thân mật, trích dẫn nguồn tin cậy và cho phép kiểm tra thông tin, mặc dù độ chính xác không phải lúc nào cũng cao nhất. Người dùng cảm thấy như đang trò chuyện với một người hiểu biết hơn là một công cụ tìm kiếm.
Grok 3 có khả năng hiểu vấn đề nhanh chóng và phản hồi chính xác, bao gồm cả việc tạo hình ảnh từ mô tả ngắn, theo tài khoản Hoàng Hải. Nó mang tính con người, thông minh và hài hước. Một số chuyên gia cho rằng Grok 3 cung cấp dữ liệu gần như theo thời gian thực, giúp trả lời câu hỏi sát thực tế và khả năng tùy biến theo ngữ cảnh tạo cảm xúc lớn trong giao tiếp.
Grok 3 được cho là tiệm cận mô hình mạnh nhất của OpenAI và vượt trội hơn DeepSeek-R1 và Gemini 2.0 Flash Thinking, theo Andrej Karpathy, nhà đồng sáng lập OpenAI. Mô hình này có tốc độ và sức mạnh ấn tượng. Trong livestream công bố, xAI đã thực hiện nhiều bài kiểm tra benchmark cho thấy Grok 3 vượt trội hơn Gemini 2 Pro, Claude 3.5 Sonnet, GPT 4o và DeepSeek V3 về điểm chuẩn trong Toán, Khoa học và Mã hóa.
AI được trang bị khả năng lý luận, cho phép xử lý các truy vấn một cách sâu sắc hơn. Theo xAI, Grok 3 hiện đang miễn phí cho đến khi máy chủ ngừng hoạt động. Elon Musk đã có những phát biểu gây tranh cãi về Grok 3, trong khi bạn gái ông ca ngợi trải nghiệm sử dụng công nghệ này. Grok 3 được đánh giá vượt trội so với các đối thủ khác trong lĩnh vực AI.
Nguồn:vnexpress.net/duoc-musk-khen-lam-toan-gioi-grok-3-lai-tu-nhan-giai-sai-4853218.html