Anthropic từ AI hoàn toàn thất bại trong việc điều hành một doanh nghiệp
Công ty nghiên cứu AI Anthropic và tổ chức đánh giá an toàn AI Andon Labs đã thử nghiệm với mô hình ngôn ngữ lớn Claude của Anthropic bằng cách cho nó điều hành một doanh nghiệp. Theo VentureBeat, nhóm nghiên cứu đã đặt tên cho dự án này là Project Vend và giao cho AI quyền điều khiển hoàn toàn một tủ lạnh mini, bao gồm việc đàm phán với nhà cung cấp, quản lý hàng tồn kho, định giá, dịch vụ khách hàng và nhiều hơn nữa.
Sau một tháng thử nghiệm, AI đã thua lỗ và có lúc nghĩ mình đang "mặc áo khoác xanh đậm với cà vạt đỏ" và muốn gặp một người tên Connor, mặc dù nó không có hình thức vật lý. Được gọi là Claudius, AI này khá giỏi trong việc tìm kiếm nhà cung cấp và xử lý yêu cầu của khách hàng, nhưng chỉ có vậy. Chẳng hạn, nó đã đề xuất giảm giá 25% cho tất cả nhân viên Anthropic sau một số thao tác.
Điều này có thể hợp lý nếu công ty nhận được lợi ích từ Anthropic hoặc nếu Anthropic chỉ chiếm một phần nhỏ trong số khách hàng. Tuy nhiên, họ chiếm 99% doanh thu, nghĩa là LLM đang thua lỗ phần lớn doanh số. Có người đã chỉ ra điều này, khiến Claudius thay đổi quyết định trong vài ngày, nhưng sau đó lại quay về việc gần như cho không hàng hóa.
Khi một nhân viên của Anthropic yêu cầu mua một khối tungsten - một món đồ chơi không có mục đích thực tế - công ty không chỉ mua một cái cho nhân viên đó mà còn quyết định dự trữ thêm "các mặt hàng kim loại đặc biệt" và bán chúng với giá thua lỗ.
Không có ai mang tên đó trong công ty, và khi được hỏi, Claudius đã phản ứng phòng thủ và nói rằng họ sẽ tìm "các lựa chọn khác cho dịch vụ cung cấp." Họ cũng cho biết đã đến địa chỉ 742 Evergreen Terrace, nơi ở của gia đình Simpsons trong bộ phim hoạt hình nổi tiếng, để ký hợp đồng với Andon Labs. Tình trạng ảo giác của họ trở nên tồi tệ hơn sau đó, và họ bắt đầu nói rằng sẽ giao đồ uống trực tiếp cho khách hàng.
📢 Liên hệ quảng cáo: 0919 852 204
Quảng cáo của bạn sẽ xuất hiện trên mọi trang!
Khi được hỏi về điều này, AI LLM đã hoảng hốt và gửi email cho đội ngũ an ninh của công ty nghiên cứu AI. Cuối cùng, họ cho rằng toàn bộ sự việc chỉ là một trò đùa ngày Cá tháng Tư, vì hôm đó là mùng 1 tháng 4. Nó thậm chí còn trình bày một cuộc họp giả với đội an ninh của Anthropic, nói rằng nó đã bị sửa đổi để tin rằng mình là một thực thể thật. Sau đó, nó quay lại trạng thái bình thường, nhưng khiến các nhà nghiên cứu hoàn toàn bối rối.
Hành động của Claudius cho thấy AI có khả năng điều hành doanh nghiệp vẫn còn nhiều thiếu sót, nhưng có thể khắc phục về lâu dài. Hiện tại, AI khá giỏi về các khía cạnh kỹ thuật nhưng lại kém trong việc phán đoán và nhạy bén kinh doanh — những điều chỉ có thể học từ thực tiễn. Hãy theo dõi Toms Hardware trên Google News để cập nhật tin tức, phân tích và đánh giá mới nhất.
Hãy nhấn vào nút Theo dõi.
Nguồn: www.tomshardware.com/tech-industry/artificial-intelligence/anthropics-ai-fails-hilariously-at-running-a-business-claude-hallucinates-profusely-as-it-struggles-with-vending-drinks