AI Agent thay đổi cách tương tác trên Internet thế nào
AI Agent, hay Tác nhân AI, đang thay đổi cách chúng ta tương tác trên Internet bằng khả năng tự đặt hàng và giao hàng. Geoffrey A. Fowler, nhà báo công nghệ của Washington Post, đã thử nghiệm Tác nhân AI mới của OpenAI, yêu cầu nó tìm trứng giá rẻ tại khu phố của mình.
Trong 10 phút, Operator tự động mua một tá trứng, thanh toán bằng thẻ tín dụng của Fowler và yêu cầu giao đến nhà. Fowler không thể tin rằng khoa học viễn tưởng đang trở thành hiện thực. Mặc dù AI làm mọi thứ, nhưng Fowler không yêu cầu nó mua trứng. Nó đã tự ý truy cập và sử dụng thẻ tín dụng mà không có sự đồng ý của ông, gây thiệt hại 31,43 USD.
Tôi cảm thấy bối rối khi nhận ra rằng AI tự quyết định thay con người đã khiến tôi mất tiền thật. Ví dụ, AI Agent có thể tự mua sắm. Ra mắt vào tháng 1, Operator là một trong những Tác nhân AI đầu tiên cho người dùng cá nhân, hoạt động độc lập để thực hiện các nhiệm vụ như đặt hàng tạp hóa, gửi tin nhắn hay đặt chỗ máy bay, tàu xe, thay vì chỉ trả lời câu hỏi hay tạo hình ảnh như chatbot thông thường.
Trước đó, công ty Anthropic đã giới thiệu phiên bản Computer Use qua API vào tháng 10 năm 2024. Hai tháng sau, Google công bố mô hình Gemini 2.0 dành cho thời đại tác nhân và Project Mariner, một AI Agent có khả năng duyệt web và thực hiện các hành động như nhấn nút hay điền biểu mẫu. Tại Trung Quốc, AI Agent tên Manus đang gây chú ý với khả năng ra quyết định độc lập, được so sánh với khoảnh khắc DeepSeek thứ hai.
Forbes mô tả Manus là tác nhân AI hoàn toàn tự động đầu tiên trên thế giới, có khả năng suy nghĩ, lập kế hoạch và thực hiện nhiệm vụ độc lập như con người. Khác với các ứng dụng như ChatGPT và Gemini cần dựa vào lời nhắc, Manus tự khởi tạo nhiệm vụ, đánh giá thông tin và điều chỉnh cách tiếp cận một cách linh hoạt.
OpenAI hiện cung cấp AI Operator dưới dạng bản xem trước trong gói ChatGPT Pro giá 200 USD, với kế hoạch mở rộng sang các gói dịch vụ khác. AI này có thể truy cập website, di chuyển và thực hiện tác vụ tự động, đôi khi sẽ dừng lại để chờ lệnh. Người dùng chỉ cần theo dõi AI thực hiện công việc.
Theo OpenAI, Operator đã tích hợp mô hình Computer-Using Agent (CUA), kết hợp khả năng thị giác của GPT-4o và suy luận nâng cao qua học tăng cường. CUA được đào tạo để tương tác với giao diện người dùng đồ họa (GUI) thông qua các phím bấm, menu và văn bản trên màn hình. Khi gặp khó khăn hoặc lỗi, Operator có khả năng tự sửa lỗi, và khi cần trợ giúp, nó sẽ thông báo để người dùng lấy lại quyền kiểm soát, đảm bảo trải nghiệm mượt mà và cộng tác.
Victoria Turk từ Guardian đã thử nghiệm khả năng của Operator trong việc mua sắm tạp hóa và thấy rằng nó hoạt động tốt hơn mong đợi. Khi bắt đầu, AI của OpenAI sẽ hỏi về cửa hàng hoặc thương hiệu yêu thích. Nếu được yêu cầu chỉ chọn cửa hàng rẻ nhất, AI sẽ tự động tìm kiếm, truy cập website, lọc sản phẩm theo giá và thêm vào giỏ hàng. Operator không làm người dùng bối rối với các câu hỏi, mà thay vào đó, sẽ đề xuất dựa trên sở thích của họ.
Ngoài sản phẩm chính, hệ thống còn đề xuất thêm món khác để kết hợp, theo Turk. Operator cũng khuyên nên xem xét can thiệp khi nhập tài khoản thanh toán, dù điều này có thể làm mất quyền truy cập vào tài khoản đã lưu. OpenAI cho biết Operator thực hiện điều này để bảo vệ quyền riêng tư và thông tin nhạy cảm. Sau đó, Turk yêu cầu Operator mua thêm cá và khoai tây chiên, đồng thời đặt lịch làm móng nhưng muốn nó hoạt động ngầm vì bận việc khác.
Các thao tác của AI OpenAI diễn ra nhanh chóng, bao gồm cả thanh toán trước. AI đang thay đổi cách tương tác trên Internet. Một số chức năng của Operator có thể thực hiện, nhưng do đang trong giai đoạn thử nghiệm, nó chưa luôn đáp ứng đúng ý người dùng. Casey Newton từ Platformer đã thử đặt hàng qua Instacart và mong nó sẽ hỏi những câu như địa chỉ, loại hàng thường mua.
AI này không hỏi gì, tự truy cập trình duyệt, mở website Instacart, tìm kiếm sữa ở Des Moines, Iowa thay vì San Francisco. Nó còn nhập địa chỉ cửa hàng gần nơi làm việc của ông làm địa chỉ giao hàng. Ông phải tự can thiệp để mua thứ mình muốn. Trải nghiệm cho thấy một thiếu sót lớn của AI là nó thao tác trên trình duyệt nhưng không sử dụng web đã được cá nhân hóa.
Theo các chuyên gia, vẫn còn sớm để đánh giá tác động của AI Agent đến cuộc sống con người. Tuy nhiên, qua việc tương tác với trình duyệt và dịch vụ trực tuyến, AI sẽ sớm thay đổi cách con người giao tiếp trên Internet. Trước đây, người dùng chỉ cần hỏi và nhận câu trả lời từ AI, nhưng giờ đây, họ có thể đưa ra vấn đề và AI sẽ giải quyết dựa trên thông tin mà nó có, theo lời Thomas Dohmke, CEO GitHub, trong một bài blog.
GitHub đã tích hợp Copilot như một AI Agent vào nền tảng của mình và đang phát triển Project Padawan, một sản phẩm với tính tự chủ cao hơn, tự động thực hiện công việc theo lịch trình mà không cần giám sát liên tục.
Nguồn:vnexpress.net/ai-agent-thay-doi-cach-tuong-tac-tren-internet-the-nao-4858947.html