Tổng hợp toàn bộ công bố của Google tại IO 2025: AI Gemini 2.5 Pro, thiết bị AI XR, các gói đăng ký

#ai

Tại I/O 2025, Google đã giới thiệu một loạt những tiến bộ mới nhất về các model AI cốt lõi như Gemini 2.5, mở rộng khả năng của AI trong bộ máy tìm kiếm, các cập nhật về GenAI trong sáng tạo nội dung, Workspace, NotebookLM,… Đồng thời là các công cụ giao tiếp 3D được hỗ trợ bởi AI là Google Beam, sự hiện diện của AI Gemini trên kính thực tế tăng cường AR và tai nghe XR,… Tất cả sẽ dần định hình rõ hơn cách Google tạo ra một không gian AI hữu ích, thông minh và tích hợp sâu hơn vào cuộc sống người dùng.

Gemini 2.5

Tại sự kiện, Google đã dành thời gian nói về Gemini 2.5 Pro - model AI được nâng cấp cực kỳ mạnh mẽ với các điểm số benchmark cao, từ tiêu chuẩn học thuật, điểm ELO tới việc dẫn đầu các bảng xếp hạng WebDev Arena và LMArena cho lập trình và giúp người dùng học tập.

Model sẽ được triển khai với nhiều tính năng khác nhau cho người dùng. Đầu tiên là DeepThink - tính năng suy luận nâng cao sẽ được thử nghiệm trong Gemini 2.5 Pro, sử dụng "tư duy song song" để đạt hiệu suất cực kỳ cao đối với các tác vụ toán học và lập trình phức tạp. Chế độ này đang được thử nghiệm trên một số tester và sẽ sớm được triển khai tới người dùng toàn cầu. Song song với Gemini 2.5 Pro là model Gemini 2.5 Flash. Google nói rằng đây là model hướng tới xử lý công việc hiệu quả và mạnh mẽ nhất của coong ty, được cải thiện về mọi mặt và đặc biệt là sử dụng ít token hơn 20-30% nhưng vẫn có hiệu suất tốt hơn so với các model trươc đây.

Các model mới không chỉ được tích hợp các khả năng "truyền thống" của một LLM như xử lý ngôn ngữ, hình ảnh, tạo video mà còn hỗ trợ xử lý âm thanh để nói chuyện với người dùng, đồng thời có khả năng sử dụng máy tính (trong project Mariner) để thực hiện nhiệm vụ. Ngoài ra các model cũng được nâng cao tính bảo mật, chống lại các cuộc tấn công chèn lệnh không trực tiếp (indirect prompt injection) vốn có thể bị kẻ xấu sử dụng để khai thác thông tin trái phép từ LLM.

Đối với các bạn sử dụng API, model Gemini 2.5 Pro sẽ được sử dụng ít token hơn cho tính năng tóm tắt suy nghĩ (thought summaries) và ngân sách suy nghĩ (thinking budgets) để kiểm soát chi phí và độ trễ tốt hơn.

AI trong Tìm kiếm

Sau nhiều tháng thử nghiệm dưới dạng đăng ký Labs, cuối cùng thì tính năng AI mode trong tìm kiếm cũng sẽ được bắt đầu triển khai cho toàn bộ người dùng Mỹ và sẽ sớm cập nhật cho các nước khác. Google cho biết AI Search sử dụng kỹ thuật tìm kiếm AI mạnh mẽ nhất của Google là "query fan-out" để tìm hiểu sâu hơn vào web, từ đó trả về kết quả hữu dụng và nhanh chóng hơn cho người dùng.

Google Search cũng được tích hợp thêm tính năng Deep Search. Khi người dùng truy vấn, nó sẽ chạy chạy hàng trăm tìm kiếm cùng lúc và tạo báo cáo cấp chuyên gia được trích dẫn đầy đủ trong vài phút. Tính năng Search Live, sử dụng camera để nói chuyện trực tiếp với Gemini để hỏi các câu hỏi ngoài đời thật cũng sẽ được tích hợp như một cách tìm kiếm.

Ngoài ra, bộ máy tìm kiếm không chỉ dùng AI để trả kết quả, mà còn sử dụng hệ thống agentic AI để giúp giúp người dùng hoàn thành các tác vụ như mua vé sự kiện, đặt chỗ nhà hàng và cuộc hẹn. Đồng thời, nó cũng hỗ trợ các tác vụ như mua sắm, thử quần áo bằng ảnh của người dùng, cho phép họ lựa đồ dễ dàng hơn. Một tính năng mới khác trong mua sắm với AI Mode là người dùng có thể chọn mức giá mong muốn và AI sẽ hoàn tất giao dịch mua khi phát hiện giá của món đồ giảm xuống đúng ý.

Về tính năng AI Overviews, Google cho biết hiện nó đã được triển khai ở hơn 200 quốc gia và vùng lãnh thổ với hơn 40 ngôn ngữ. AI Overviews đang thúc đẩy tăng trưởng hơn 10% trong việc sử dụng Google cho các loại truy vấn hiển thị AI Overviews ở các thị trường lớn.

Các công cụ tạo multimedia

Tại Google AI, công ty đã giới thiệu Veo 3 - model tạo video tiên tiến nhất. Điểm mới của lần cập nhật này là nó tạo được cả video có âm thanh tiếng động môi trường, chim hót và cả lời thoại của nhân vật trong video. Model tạo ảnh cũng được cập nhật lên phiên bản mới với chất lượng, độ chi tiết cao hơn, độ phân giải lên đến 2k và đặc biệt là tạo chữ viết đúng chính tả và kiểu chữ trên hình. Công cụ tạo nhạc Lyria cũng được cập nhật lên thế hệ 2: có thêm quyền truy cập vào mô hình tạo nhạc, cung cấp các công cụ cho nhạc sĩ sáng tạo.

Google cũng giới thiệu công cụ làm phim AI mới là Flow, được thiết kế riêng cho các mô hình Veo, Imagen và Gemini của Google DeepMind, giúp người dùng tạo ra các clip và cảnh quay điện ảnh. Với Flow, người dùng có thể điều chỉnh những đặc điểm của cảnh quay như Camera Controls, Scenebuilder, Asset Management và Flow TV. Ngoài ra, công cụ tạo video hiện tại là Veo 2 cũng được cập nhậ bổ sung các khả năng mới như điều khiển camera, góc máy, outpainting và thêm hoặc xóa đối tượng.

Về ứng xử của con người trước các nội dung do AI tạo ra. Google giới thiệu công cụ gọi là SynthID Detector - một giao thức xác minh mới giúp mọi người xác định nội dung được tạo bằng AI.

Trợ lý AI Assistant

Google nói rằng trợ lý AI Gemini sẽ là "mô hình thế giới" với khả năng lập kế hoạch và mô phỏng các khía cạnh của thế giới để "tưởng tượng những trải nghiệm mới". Họ sẽ ddauw toàn bộ những thành công mới nhất của dự án Project Astra vào các sản phẩm có trợ lý ảo, cho phép nó có khả năng hiểu được nội dung video, hiểu được màn hình và cả bộ nhớ, từ đó vận hành hiệu quả hơn các tính năng Gemini Live, Search Live và cả Live API.

Tại IO năm nay, Google cũng giới thiệu dự án Marriner đang nghiên cứu về cách con người và các AI Agent tương tác với nhau trong tương lai. Một cách nôm na, đó sẽ là giao thức mà con người sẽ cùng lúc ra lệnh, giao tiếp và nhận két quả từ một đội những AI Agent biết tự làm việc cho họ. Hiện dự án đã có thể hoàn thành tới mười nhiệm vụ cùng lúc khi người dùng truy vấn.

AI trong Workspace

Trong Workspace, AI được cập nhật thêm các tính năng của Gemini như:

Trả lời email thông minh cá nhân hóa trong Gmail, trong đó AI sẽ soạn thảo email dựa trên ngữ cảnh cụ thể và tông giọng của người dùng. Tính năng này sẽ sớm cập nhật cho toàn bộ người dùng trong tương lai gần.
Dọn dẹp hộp thư đến: Gemini có thể giúp xóa hoặc lưu trữ email không cần thiết.
Lập lịch hẹn nhanh chóng: Tích hợp lập lịch cuộc hẹn vào Gmail.
Dịch giọng nói trong Google Meet: Tính năng này sẽ dịch lời hội thoại trong cuộc họp theothời gian thực, duy trì chất lượng và đặc điểm cá tính giọng nói. Tính năng sẽ được triển khai Beta cho người đăng ký Google AI Pro và Ultra, ban đầu hỗ trợ tiếng Anh và Tây Ban Nha.
Google Vids: Biến Google Slides thành video hấp dẫn. Gemini giúp tạo kịch bản, lời thoại thuyết minh và ảnh minh họa. Tính năng sẽ ra mắt rộng rãi vào quý tới cho người đăng ký Google AI Pro/Ultra.
Tự động cắt bản ghi âm: Gemini sẽ nhận dạng và loại bỏ các từ đệm và khoảng dừng trong video
Cân bằng âm thanh: AI Ttự động điều chỉnh mức âm thanh trong video.
AI avatars trong Vids: Tạo video với người nói ảo từ kịch bản mà người dùng đưa vào.
Imagen 4 trong Workspace: Tạo hình ảnh chất lượng cao hơn với chính tả và văn bản tốt hơn trong Slides, Vids, Docs, v.v.
Hỗ trợ viết dựa trên nguồn trong Google Docs: Với tính năng này, người dùng sẽ liên kết các tài liệu với docs đang soạn thảo và Gemini chỉ loio thông tin từ các tài liệu này, đảm bảo chống hallucianation.

Google Beam và Android XR

Google Beam là nền tảng giao tiếp video 3D sử dụng AI volumetric video để tạo trải nghiệm 3D thực tế mà không cần kính thực tế ảo hoặc thực tế tăng cường. Nền tảng này sẽ hoạt động trên Google Cloud, cho phép tạo ra một không gian 3D gặp gỡ đối thoại trực tiếp, có hỗ trợ dịch và loạt tính năng AI khác. Nền tảng đã được Google hợp tác với HP và Zoom để đưa ra thiết bị trong năm nay.

Và cuối cùng, sau nhiều năm đồn đoán, thử nghiệm, cuối cùng thì Google cũng chính thức ra mắt Android XR - nền tảng Android đầu tiên được xây dựng để dưa Gemini lên tai nghe và kính XR. Trong năm nay, chúng ta sẽ có những thiết bị như kính thông minh, tai nghe tích hợp AI biết nhìn và nghe thế giới theo thời gian thực để trả lời người dùng trong các tác vụ như như nhắn tin, đặt cuộc hẹn, chỉ đường từng bước, chụp ảnh và dịch ngôn ngữ trực tiếp.. Google cho biết đã hợp tác với Samsung để làm tai nghe Project Moohan. Ngoài ra cũng hợp tác với Gentle Monster và Warby Parker để tạo ra kính Android XR thời trang.

Các gói đăng ký AI mới

Đây là cái mà chúng ta quan tâm nhất. Các gói đăng ký AI mới được giới thệu bao gồm:

Google AI Ultra: Gói đăng ký mới với giá 249.99 đô la mỗi tháng ở Mỹ, với giới hạn sử dụng cao nhất, quyền truy cập sớm vào các mô hình mạnh mẽ nhất (bao gồm Veo 3 và sắp tới là 2.5 Pro Deep Think) và các tính năng cao cấp trong Gemini, Flow, Whisk, NotebookLM, Gemini trong Workspace/Chrome, Project Mariner, YouTube Premium và 30TB bộ nhớ.
Google AI Pro (trước đây là AI Premium): Được cải tiến bao gồm khả năng làm phim AI trong Flow (với Veo 2) và quyền truy cập sớm vào Gemini trong Chrome (đầu tiên sẽ ở Mỹ).
Tặng miễn phí Gemini Pro cho sinh viên đại học ở Mỹ, Brazil, Indonesia, Nhật Bản và Vương quốc Anh sẽ được tặng miễn phí Gemini Pro. Sắp tới sẽ mở rộng ra nhiều nước khác.

Nguồn:tinhte.vn/thread/tong-hop-toan-bo-cong-bo-cua-google-tai-io-2025-ai-gemini-2-5-pro-thiet-bi-ai-xr-cac-goi-dang-ky.4019871/