XAI tuyên bố Grok 3 là AI thông minh nhất thế giới
Đây không phải là lời khuyên đầu tư. Tác giả không nắm giữ cổ phiếu nào được đề cập. Wccftech.com có chính sách công bố và đạo đức. Sau nhiều ngày tạo ra sự hào hứng, xAI đã chính thức ra mắt Grok 3 LLM vào thứ Hai trong một buổi phát trực tiếp do Elon Musk dẫn dắt. Trong khi công ty AI quảng bá khả năng của LLM mới là tốt nhất, một số chuyên gia chỉ ra những thiếu sót quan trọng trong các tiêu chí đánh giá được công bố.
Grok 3 là trí tuệ nhân tạo thông minh nhất thế giới, hiện đã có sẵn cho tất cả người đăng ký Premium. Theo bài đăng của xAI trên X, Grok 3 là mô hình AI hàng đầu. Grok 3 có khả năng giải quyết các vấn đề về vật lý, trò chơi và vũ trụ.
Elon Musk đã thông báo rằng mô hình Grok 2 LLM sẽ được mã nguồn mở trong vài tháng tới. Mô hình Grok 3 mới được phát hành tối qua đã vượt qua tất cả các mô hình nền tảng công khai khác, bao gồm DeepSeek-V3 và GPT-4o, trong các bài kiểm tra về toán, khoa học và lập trình.
xAI cho biết mô hình Grok 3 đã vượt qua tất cả các mô hình nền tảng công khai khác, bao gồm DeepSeek-V3 và GPT-4o, trong các bài kiểm tra về toán, khoa học và lập trình. Đặc biệt, Grok 3 đạt điểm kỷ lục 1,402 trên thang điểm Arena. Có vẻ như Grok 3 là AI mạnh nhất thế giới.
Trên Manifold Markets, hợp đồng cược về việc Grok 3 sẽ trở thành AI mạnh nhất thế giới dự kiến sẽ kết thúc với kết quả "có". Tuy nhiên, xác suất thắng của bên "có" đã giảm từ 91% vào đêm thứ Hai xuống còn 78% hiện tại. Điều này có thể liên quan đến những bình luận chỉ trích mới nổi xoay quanh Grok 3, dù vẫn còn ít ỏi.
Tôi nghĩ Grok3 là một thiên tài không muốn tốn thời gian cho những câu hỏi đơn giản. Ví dụ, Zihan Wang, người từng làm việc tại DeepSeek, đã cho Grok 3 xem một bức ảnh về hai quả bóng sắt có kích thước khác nhau treo từ Tháp Nghiêng Pisa ở các độ cao khác nhau, và hỏi quả bóng nào sẽ rơi trước.
Câu trả lời hợp lý chỉ có thể là bóng A, vì nó nặng hơn và gần mặt đất hơn. Tuy nhiên, LLM lại cho rằng cả hai bóng sẽ rơi xuống cùng một lúc. Điều này cho thấy sự khác biệt giữa người ảnh hưởng và người thực. Ngay cả Teknium1 cũng chỉ biết tâng bốc. Họ không nói về FrontierMath, Arc-AGI hay HLE khi quảng cáo đây là "mô hình thông minh nhất". Các thử nghiệm ban đầu của tôi cũng cho cảm giác tương tự như Karpathy tiếp cận o1-pro, nhưng không thể so với o3-mini.
Nhiều người đang thắc mắc tại sao xAI không công bố điểm số của Grok 3 trên các chuẩn FrontierMath, Arc-AGI hay HLE. Chúng tôi chỉ chỉ ra những thiếu sót này để đặt câu hỏi về tính xác thực của những tuyên bố hàng đầu của xAI về Grok 3, mà chúng tôi tin rằng là một mô hình AI rất mạnh mẽ. Ngoài ra, Bloomberg gần đây đã báo cáo rằng xAI đang đàm phán với các nhà đầu tư hiện tại để huy động tới 10 tỷ đô la trong một vòng tài trợ mới, định giá công ty khởi nghiệp này lên tới 75 tỷ đô la.
Trong vòng huy động vốn gần đây, xAI đã huy động được 6 tỷ USD với định giá 40 tỷ USD. Chúng tôi đã khó khăn trong việc huấn luyện 10.000 GPU vào đầu năm ngoái, nhưng giờ đây đã có 100.000 GPU chạy liên tục cho Grok 3. Rất tự hào, còn nhiều điều hơn nữa sắp tới! — Guodong Zhang, 18 tháng 2, 2025. Cuối cùng, xAI đã tiết lộ rằng Grok 3 được huấn luyện trên 100.000 GPU, và dự kiến sẽ còn tăng thêm. Do đó, không có gì ngạc nhiên khi BESI dự đoán doanh thu từ việc bán chip AI sẽ đạt 227 tỷ USD vào năm 2032.
Nguồn: wccftech.com/xai-claims-grok-3-is-the-worlds-smartest-ai-betting-markets-agree-but-experts-remain-split/