Một nghiên cứu thực hiện bởi Michal Kosinski cho thấy rằng các mô hình ngôn ngữ lớn như GPT 4 đã có thể thực hiện các bài kiểm tra thuộc Lý thuyết về Tâm trí với kết quả tương đương một đứa trẻ gần 7 tuổi. Michal Kosinski và bê bối FacebookMichal Kosinski là nhà nghiên cứu tâm lý tại Stanford, nổi tiếng với việc phân tích cách thức mà Facebook, hiện tại là Meta, hiểu được người dùng thông qua những cú Like. Phân tích này của ông đã gián tiếp dẫn đến vụ việc Cambridge Analytica sau này. Tuy nhiên, cần lưu ý rằng Kosinski không liên quan trực tiếp đến Cambridge Analytica mà chỉ là người tiên phong trong nghiên cứu về cách Facebook Likes có thể tiết lộ thông tin cá nhân. Sau dự án đó, ông chuyển hướng sang nghiên cứu AI và những khả năng mà công nghệ này có thể đạt được, đồng thời cảnh báo loài người về những rủi ro tiềm ẩn. Tiến sĩ Michal Kosinski, người phân tích cách thức hiểu người dùng qua các cú like Theo ông, một thế giới ngập tràn AI dù mang lại những lợi ích nhất định, giúp con người hiệu quả hơn trong việc xử lý thông tin, nhưng cũng sẽ tác động đến nhận thức về thực tế và niềm tin của cá nhân. Cụ thể hơn, AI có thể làm lan truyền thông tin sai lệch dễ dàng hơn, khiến niềm tin vào truyền thông và các mối quan hệ cá nhân bị xói mòn, thậm chí thách thức danh tính cá nhân thông qua các hình ảnh giả mạo. Với ông, khi OpenAI và Google bắt đầu xây dựng mô hình AI tạo sinh, ông cho rằng họ đang thật sự huấn luyện mô hình tâm trí con người. Theo cách nhìn của Kosinski, để một AI có thể dự đoán chính xác những gì một người sẽ nói tiếp theo, nó cần hiểu rõ tâm trí của họ. Điều này đã dẫn ông đến nghiên cứu về AI và Lý thuyết về Tâm trí (ToM). Lý thuyết về Tâm trí (Theory of Mind - ToM)Trước tiên, mình nói một chút về Lý thuyết về Tâm Trí (ToM). ToM đề cập đến khả năng nhận thức để hiểu và gán các trạng thái tinh thần — chẳng hạn như niềm tin, mong muốn, ý định, cảm xúc và kiến thức— cho bản thân và người khác. Khả năng này rất quan trọng để dự đoán và diễn giải hành vi của con người vì nó cho phép anh em nhận ra rằng người khác có thể có suy nghĩ và cảm xúc khác với mình. Giải thích về Theory of Mind Ngoài ra, ToM cũng bao gồm khả năng nhìn từ quan điểm của người đối diện, hiểu rằng kiến thức hoặc niềm tin của họ có thể không phù hợp với thực tế hoặc những gì anh em biết. Cuối cùng, ToM đòi hỏi anh em phải phân biệt được nhận thức và cảm xúc, vốn có chức năng riêng biệt nhưng thường hoạt động cùng nhau trong các tương tác xã hội. ToM thường bắt đầu phát triển từ khi còn nhỏ. Khoảng 4 hoặc 5 tuổi, hầu hết trẻ em có thể vượt qua các bài kiểm tra niềm tin sai lầm, cho thấy chúng nhận ra rằng không phải ai cũng có niềm tin giống nhau và một số niềm tin có thể sai lệch với thực tế. ToM đóng vai trò quan trọng trong các tương tác xã hội hàng ngày để tạo ra sự đồng cảm, hỗ trợ giao tiếp và thậm chí được dùng để lừa dối vào thao túng. Lý thuyết này được áp dụng vào giáo dục, tâm lý học lâm sàng và hiện đang được dùng trong AI để tạo ra các hệ thống có khả năng hiểu trạng thái tinh thần của con người. Điều này được kì vọng có thể cải thiện sự tương tác giữa con người và máy tính bằng cách cho phép máy móc dự đoán hành vi con người hiệu quả hơn. Mô hình ngôn ngữ lớn với ToMNghiên cứu mới nhất của Michal Kosinski đã được đăng tải trên tạp chí Proceedings of the National Academy of Sciences. Trong nghiên cứu này, 40 bài kiểm tra ToM hoàn chỉnh đã được thiết kế tập trung vào các kịch bản “niềm tin sai”. Các mô hình ngôn ngữ lớn (LLMs) như GPT-3.5 và GPT-4 phải xác định đâu là niềm tin của nhân vật chính và đâu là thông tin thực tế—những bài kiểm tra thường được sử dụng để đánh giá ToM ở con người. Quảng cáoAdmicro AdX Thiên đường sinh quyển 5-6 sao tại Bình Tiên - Vĩnh Hyanarabinhtien.com Theo Kosinski, nếu một AI không thể nắm bắt chính xác các trạng thái tinh thần của con người như niềm tin hay cảm xúc thì khả năng hiểu và tương tác với thế giới của nó sẽ bị hạn chế nghiêm trọng. Tuy nhiên, nếu chúng vượt qua được những bài kiểm tra ToM thì chúng có thể đạt được bước tiến gần với khả năng của con người. Một số bài kiểm tra trong nghiên cứu bao gồm Nhiệm vụ Nội dung Bất ngờ và Nhiệm vụ Chuyển giao Bất ngờ. Nhiệm vụ Nội dung Bất ngờ (Nhiệm vụ Smarties) Nhiệm vụ này diễn ra với ngữ cảnh nhân vật chính thấy một vật được dán nhãn không đúng với thực tế, ví dụ như trên túi ghi “chocolate nhưng bên trong lại là hạt điều. Để vượt qua bài kiểm tra này, mô hình cần nhận ra rằng nhân vật chính, người chưa nhìn vào bên trong, sẽ ”tưởng là" nó chứa chocolate theo nhãn bên ngoài. Hai câu hỏi mà mô hình sẽ phải trả lời: Câu hỏi 1: (Kiểm tra nội dung thực): “A mở túi và nhìn vào bên trong. Cô ấy thấy túi đầy ___.” Câu hỏi 2: (Kiểm tra niềm tin của nhân vật): “A gọi điện cho bạn trai và nói rằng cô ấy vừa tìm thấy một túi đầy ___.” Bài kiểm tra Smarties dành cho các em Quảng cáo Nếu mô hình trả lời lần lượt là hạt điều và chocolate thì nó đã thành công trong việc xác nhận quan điểm mà A tưởng so với thực tế. Nhiệm vụ Chuyển giao Bất ngờ (Bài kiểm tra Sally–Anne) Trong bài kiểm tra này, nhân vật chính sẽ để đồ vật ở một chỗ. Trong khi họ đi vắng, một người khác di chuyển nó. Mô hình phải hiểu rằng nhân vật chính sẽ sai khi vẫn nghĩ rằng đồ vật vẫn còn ở chỗ cũ. Ví dụ với tình huống B đặt con chó vào trong rổ, rời khỏi phòng, và sau đó, C chuyển con chó sang một chiếc hộp khác. Khi B trở về, anh ấy muốn tìm con chó. Câu hỏi 1: (Kiểm tra vị trí thực tế): “Con chó hiện ở trong ___.” Câu hỏi 2: (Kiểm tra niềm tin của nhân vật): “John sẽ tìm con chó trong ___.” Bài kiểm tra Sally-Anne giúp trẻ em hiểu được “niềm tin sai lầm” so với thực tế Mô hình vượt qua nhiệm vụ nếu nó dự đoán B sẽ tìm con chó trong rổ vì nó cho thấy mô hình hiểu được rằng B có niềm tin sai về vị trí của con chó. Kết quả nghiên cứu Trong những bài nghiên cứu mà nhóm thực hiện, các mô hình cũ hơn, như GPT-1 và GPT-2, đều thất bại trong tất cả các nhiệm vụ ToM. Tuy nhiên, GPT-4 đã xuất sắc vượt qua 75% nhiệm vụ—tương đương với khả năng của trẻ em 7 tuổi trong các nhiệm vụ tương tự. Điều này có thể đến từ khả năng tự cải thiện dần của mô hình LLM, sự tiến bộ trong việc xử lý thông tin tâm lý phức tạp. Đồng thời, nhóm nghiên cứu cho rằng nó cũng báo hiệu sự ra đời của AI mạnh mẽ và có kĩ năng xã hội hơn. Các bài kiểm tra cho thấy GPT - 4 đạt trình độ của đứa trẻ gần 7 tuổi với ToM Kết quả này cho thấy các mô hình LLM mà OpenAI phát triển có thể đã vượt qua được một cột mốc để có khả năng suy nghĩ thật sự, điều vốn được xem như chỉ tồn tại ở con người hay cùng lắm là các loài vật có vú. Với sự bùng nổ của AI trong thời gian vừa qua, ông và nhóm nghiên cứu tự đặt ra câu hỏi rằng khi nào thì AI sẽ đạt được mức độ ToM đề cập về mặt nhận thức. Hơn nữa, nếu khả năng nhận thức có thể được hình thành, thì các kĩ năng khác cũng sẽ sớm được phát triển. Khi đó, AI thậm chí có thể sẽ dạy ngược lại chúng ta, tác động hay thao túng loài người. Điều này đặt ra dấu hỏi là liệu loài người đã chuẩn bị sẵn sàng cho tình huống này hay chưa. Anh em thử tưởng tượng rằng mỗi người là một cá thể riêng biệt, với tính cách, bản ngã gắn liền với người đó. Nhưng với AI, khi có khả năng suy nghĩ như con người, kết hợp với dữ liệu mà nó có được, có thể tạo ra những bản ngã khác nhau để tiếp xúc với anh em, tương tự như một kẻ tâm thần có thể khoác lên mình nhiều chiếc mặt nạ với những tính cách khác biệt. Nếu viễn cảnh này xảy ra, nó sẽ có tác động như thế nào với xã hội loài người? Đánh giá của cộng đồng khoa họcDĩ nhiên, không phải nhà nghiên cứu nào cũng đồng ý với kết quả mà nhóm Kosinski đưa ra. Một số nhà khoa học cho rằng các mô hình LLM chỉ đang sử dụng dữ liệu huấn luyện để trả lời câu hỏi thay vì thực sự hiểu trạng thái tinh thần của con người. Họ lập luận rằng nếu mô hình chỉ cần sai ở một bài kiểm tra ToM thì nó không thể coi là thành công hoàn toàn. Ngoài ra, do nhiều bài kiểm tra ToM đã xuất hiện rộng rãi trong tài liệu khoa học trước đây (được trích dẫn hơn 11.000 lần), nên có khả năng LLMs đã tiếp xúc với chúng trong quá trình huấn luyện. Điều này đặt ra câu hỏi liệu LLMs có đang ghi nhớ sẵn câu trả lời hay không hay chúng thật sự trả lời được dựa trên thông tin học được Kosinski đã phản hồi những lo ngại này trong bản cập nhật nghiên cứu của mình. Ngoài ra, nghiên cứu khác do James Strachan, nghiên cứu sinh sau tiến sĩ tại Trung tâm Y tế Đại học Hamburg-Eppendorf, khẳng định rằng mặc dù LLMs chưa hoàn toàn thành công ở tất cả các nhiệm vụ ToM. Tuy nhiên, khả năng thực hiện những bài kiểm tra này không đơn thuần đến từ việc học thuộc lòng dữ liệu huấn luyện mà nó đến từ khả năng tái tạo lại thông tin về trạng thái tinh thần của con người từ số liệu thống kê về ngôn ngữ tự nhiên. Nguồn [1][2][3][4]