Tất cả mọi thông tin về AI Agent Manus của TQ: nó là gì, làm được gì, hiệu quả ra sao,...?

#ai

Manus là hệ thống AI agent có thể tự động thực hiện một chuỗi rất nhiều tác vụ như tìm kiếm, phân tích, suy luận,... Để trả về kết quả chỉ với một lệnh của người dùng. Manus được phát triển bởi công ty AI Trung Quốc Butterfly Effect và mấy ngày nay đã cho dùng thử giới hạn. Đây có thể xem là một trong những hệ thống AI agent tự vận hành đầu tiên và cả cộng đồng đang quan tâm không thua gì DeepSeek hồi đầu năm. Trong bài này mình sẽ tổng hợp mọi thông tin về nó.

Manus khác biệt ở chỗ nào

Trước giờ thì chúng ta đã quen với các chatbot AI vận hành bằng LLM, hoạt động theo kiểu người dùng hỏi, nó trả lời và tiếp tục như vậy. Người dùng nhập prompt, AI sinh ra câu trả lời và hiện ra cho người dùng. Còn đối với Manus, nó là hệ thống AI Agent và cách hoạt động là nó tự động làm hết mọi thứ ở giữa sau khi người dùng nhập vào một lệnh.

Thí dụ như khi người dùng kêu Manus đi lập kế hoạch đi Đà Lạt chơi 5 ngày với ngân sách 15 triệu, nó sẽ tự suy luận coi cần phải có thông tin gì để lập kế hoạch đó, sau đó tự lên Google kiếm cách di chuyển, kiếm khách sạn, quán ăn, địa điểm tham quan,... Và trả về nguyên một kế hoạch đầy đủ. Để làm được chuyện đó thì các công đoạn ở giữa sẽ có bọn "AI nhỏ" tự nhận lệnh, nói chuyện với nhau, đi tìm thông tin và xây dựng thành kế hoạch. Toàn bộ hệ thống này hoạt động một cách tự động trên mây.

Manus hoạt động ra sao?

AI agent thì không mới, từ hơn 2 năm trước người ta đã bắt đầu đề xuất, rồi thử nghiệm và hiện nhiều công ty lớn như Google Workspace, Microsoft 365,... Đã cho triển khai bằng cách cho người dùng tự cấu hình các tác vụ để tự động hóa công việc. Hồi nửa cuối năm ngoái thì Anthropic cũng đa ra mắt mã nguồn để cho người dùng xem thử cách agent hoạt động. Khi đó nó chạy dưới local trên một máy ảo, nó có thể tự click chuột đi kiếm thông tin cho người dùng.

Trên Manus, nó là sự kết hợp nhiều kiến trúc lại với nhau. Bản chất nó vẫn sử dụng model LLM là Claude 3.5 Sonnet của Anthropic và Qwen của Alibaba, tuy nhiên được nhúng vào thêm 29 công cụ chuyên dụng khác nữa để có thể tự duyệt web, tương tác với các API, chạy script do nó tự viết. Có thể hiểu là từng thành phần đó chính là agents. Cái hay là họ xây được kiến trúc để vận hành cả đám agent đó.

Về cơ bản thì sẽ óc một "con agent" đóng vai trò như người điều hành, nhận và hiểu lệnh, sau đó lập kế hoạch và tự gọi những con agent khác lên chạy để hoàn tất coogn việc. Nói cách khác, Manus không tạo ra nền tảng mới, nhưng họ lắp ghép các thứ có sẵn lại để cho nó chạy mượt và làm được việc hơn mà con người không cần tương tác quá nhiều với máy tính.

Bây giờ thì Manus họ cho ra một dịch vụ gần như là hoàn chỉnh luôn. Người dùng nhập lệnh vào, đội AI sẽ tự chạy trên một máy ảo ở trên mây thuộc tài khoản người dùng và thực hiện task. Về viễn cảnh thì sau này, người dùng chỉ cần đưa ra nhiệm vụ xong tắt máy tính đi ngủ, lúc dậy thì bọn AI đã làm xong công việc và trả kết quả về.

Manus làm được gì?

Theo giới thiệu thì Manus có thể chạy được nhiều tác vụ đòi hỏi nhiều bước, điển hình như:

Xây dựng một trang web từ con số 0
Tạo ra một lịch trình du lịch cụ thể cho một địa điểm được chỉ định trước.
Phân tích sâu thị trường chứng khoán bằng dashboard tương tác.
So sánh các chính sách trong hợp đồng bảo hiểm và đưa ra lời khuyên.
Tạo ra nội dung học tập hoặc thuyết trình.
Tìm nguồn cung ứng vật tư B2B trên mạng.

Tất nhiên trên đây chỉ là vài thí dụ. Với những công cụ được trang bị thì trên lý thuyết, Manus có thể tự động làm được rất nhiều nhiệm vụ phức tạp và đòi hỏi nhiều bước. Kiểu như một ông giám đốc có cả một đội nhân viên với nhiều chuyên môn khác nhau, mỗi người trong đó đều có kiến thức chuyên môn của từng mảng, có kỹ năng nghiên cứu và có thể tự quyết định dựa vào những gì nó được học trước đó.

Các bạn muốn coi demo của Manus đang chạy có thể vào trang chủ của họ bên dưới, họ đã quay sẵn một số màn hình cảnh Manus nhận lệnh làm các tác vụ, sau đó lên plan trên một máy tính Linux, tự động tìm kiếm thông tin,…. để trả về kết quả.

https://manus.im/

Thí dụ như một người dùng muốn nó lên kế hoạch đi Hà Nội chơi 3 ngày 2 đêm với ngân sách 15 triệu

Nó sẽ lên plan nghiên cứu

Sau đó đi search trên web phương tiện di chuyển

Tự đi tìm khách sạn, sau đó đi suy luận và trả về kết quả

Tuyên bố của nhà phát triển

Butterfly Effect tuyên bố rằng Manus đạt được hiệu suất cao nhất khi thử nghiệm với bài benchmark GAIA - một bài test toàn diện dành cho các trợ lý AI được phát triển bởi Meta AI, Hugging Face và AutoGPT. Theo báo cáo của họ, Manus đã vượt qua Deep Research của OpenAI trên mọi thử nghiệm khó khăn nhất.

Mặc dù các tuyên bố đều rất tiềm năng, tuy nhiên nó vẫn dấy lên nhiều nghi ngờ về hiệu quả thực tế của Manus, đặc biệt là liệu nó có phải thực sự là đột phá công nghệ hay chỉ đơn giản là cải tiến những công nghệ hiện có. Trên thực tế, hiện vẫn còn rất giới hạn số người có thể dùng thử Manus nên những ứng dụng và hiệu suất thực tế của nó vẫn còn là ẩn số ở thời điểm hiện tại.

Làm sao để dùng Manus?

Hiện khi truy cập vào trang chủ của Manus, chỉ có những người có code invitation do họ cung cấp thì mới có thể vào sử dụng. Việc cho sử dụng rất hạn chế này hiện đã góp phần không nhỏ trong việc khiến cho dịch vụ này hot rần rần mấy ngày qua trong giới công nghệ. Thậm chí là thông tin còn nói rằng code invitation hiện đang được bán lại với giá cả ngàn đô trên mạng ở Trung Quốc để vào dùng thử.

Cũng chính vì sự khan hiếm này khiến người ta không khỏi đặt dấu hỏi về liệu nguyên nhân là do giới hạn về khả năng chịu tải của máy chủ Manus hay có phải là một chiến thuật tiếp thị để tạo ra tiếng vang ở thời điểm ra mắt.

Sắp tới sẽ là gì?

Hiện vẫn còn quá sớm để đánh giá ứng dụng thực tiễn cả về mặt kỹ thuật lẫn trải nghiệm người dùng của Manus nói riêng hay AI agent nói chung. Dù vậy, nếu Manus làm được như những gì họ tuyên bố thì đây xứng đáng là một cột mốc đáng ghi nhận trong sự phát triển của công nghệ AI, đặc biệt là đối với mảng này tại Trung Quốc. Từ lâu người ta đã đề cập tới những tiềm năng to lớn của AI Agent nhưng trên thực tế vẫn còn quá ít những ứng dụng thực tế của nó.

Tuy nhiên, điểm thú vị ở Manus chính là nó đến từ Trung Quốc chứ không phải từ Mỹ. Và liệu có phải đây tiếp tục là một sự kiện DeepSeek thứ 2 trong cuộc đua AI toàn cầu đang nóng hơn bao giờ hết trong khoảng thời gian qua. Và dù sao đi nữa, nếu Manus đạt được hiệu suất như họ công bố, chúng ta rất có thể sẽ chứng kiến loạt các bigtech lớn cũng sẽ sớm phát hành những đối trọng tương tự trong tương lai gần.

Khi đó, người dùng chúng ta lại có thêm nhiều lựa chọn sử dụng AI Agent, biết đâu lại như một cách naag cấp công cụ làm việc, nghiên cứu bằng công nghệ AI.

Song, nó cũng dấy lên tiếp lo ngại về cách mà Manus được vận hành. Liệu nó có được kiểm soát bởi chính quyền TQ, dẫn tới những giới hạn về thông tin vốn lại là một nghịch lý đối với kiến thức của AI. Mặt khác, việc AI Agent khả năng duyệt web, tương tác với các dịch vụ và chạy code một cách tự động dấy lên lo ngại nhiều hơn về tính bảo mật, an toàn thông tin cá nhân và cả trách nhiệm. Ai sẽ chịu trách nhiệm khi đôi AI Agent sai lầm? Làm sao đảm bảo được hệ thống như Manus sẽ vận hành theo đúng tiêu chuẩn và giá trị của cộng đồng được được quy ước xưa giờ.

Nguồn:tinhte.vn/thread/tat-ca-moi-thong-tin-ve-ai-agent-manus-cua-tq-no-la-gi-lam-duoc-gi-hieu-qua-ra-sao.3968260/