Google ra mắt mô hình Gemini 2.5, tăng cường khả năng suy luận và xử lý tình huống phức tạp

#ai

Google đang tăng tốc trong việc chạy đua với OpenAI, Anthorpic hay xAI về việc triển khai các mô hình mới bằng cách ra mắt mô hình Gemini 2.5, hứa hẹn mang lại những cải tiến vượt trội về khả năng suy luận, lập trình và xử lý các tác vụ đa phương tiện phức tạp.

Gemini 2.5 được cải tiến dựa trên phản hồi từ người dùng và dữ liệu thực tế, giúp nó thích nghi tốt hơn với các câu hỏi khó hoặc không rõ ràng. Ngoài ra, Google cũng tích hợp thêm các công cụ hỗ trợ để mô hình có thể phân tích và suy luận logic tốt hơn, chẳng hạn như xử lý các chuỗi câu hỏi liên tiếp hoặc giải thích các vấn đề có nhiều tầng ý nghĩa.

Ngay khi ra mắt, Gemini 2.5 Pro lập tức đứng đầu bảng xếp hạng LMArena, với một khoảng cách đáng kể so với các đối thủ. Mô hình này đạt được những điểm số ấn tượng trên các bộ dữ liệu đánh giá mã hóa như SWE-Bench Verified và Aider Polyglot. Mặc dù điểm số trên SWE-Bench Verified (63,8%) thấp hơn một chút so với Claude 3.7 Sonnet (70,3%), nhưng Gemini 2.5 Pro lại vượt trội trong việc chuyển đổi và chỉnh sửa code, đạt 74% trên Aider Polyglot. Ngoài ra, trên bộ dữ liệu GPQA (dành cho khoa học), Gemini 2.5 Pro đạt hiệu suất rất tốt so với các mô hình còn lại, cho thấy khả năng xử lý các câu hỏi khoa học phức tạp.

Với AIME 2025 (toán học), mô hình này cũng dẫn đầu, chứng minh năng lực giải quyết các bài toán đòi hỏi tư duy logic sâu. Những kết quả này đạt được chỉ trong một lần chạy (single pass), không cần tối ưu hóa thêm, điều này nhấn mạnh sức mạnh tự nhiên của mô hình. Đặc biệt với bài test Humanity's Last Exam, Gemini 2.5 Pro ghi điểm 18.8% mà không cần dùng công cụ hỗ trợ, vượt qua các mô hình khác và được xem là kết quả "state-of-the-art" (tốt nhất hiện tại) trong nhóm không sử dụng công cụ. Humanity's Last Exam là một bộ dữ liệu do hàng trăm chuyên gia xây dựng để kiểm tra giới hạn kiến thức và khả năng lập luận của con người.

Về mặt kỹ thuật, Gemini 2.5 nhanh hơn đáng kể so với các phiên bản tiền nhiệm, đồng thời sử dụng ít tài nguyên tính toán hơn. Điều này có được nhờ vào sự kết hợp giữa các thuật toán tối ưu hóa mới và những tiến bộ trong công nghệ học sâu từ DeepMind. Đội ngũ Google nhấn mạnh rằng đây là một phần trong nỗ lực của họ để làm cho AI trở nên thông minh hơn, hiệu quả hơn và hữu ích hơn cho mọi người.

Gemini 2.5 Pro vẫn có context Window là 1 triệu token, cho phép xử lý lượng lớn dữ liệu đầu vào bao gồm hình ảnh, âm thanh, video và cả văn bản cũng như code. Google cho biết họ có kế hoạch mở rộng context window lên 2 triệu token trong tương lai, nhưng hiện tại họ đang muốn tối ưu cho từng trường hợp cụ thể trước.

Hiện tại Gemini 2.5 Pro đã được triển khai bản dùng thử trên ứng dụng Gemini dành cho người dùng Advanced cũng như trên Google AI Studio.

Google.

Nguồn:tinhte.vn/thread/google-ra-mat-mo-hinh-gemini-2-5-tang-cuong-kha-nang-suy-luan-va-xu-ly-tinh-huong-phuc-tap.3973234/