Bước 1, các nhà nghiên cứu ngẫu nhiên chọn 200 bài báo tin tức từ 20 nhà xuất bản (10 bài với mỗi đơn vị xuất bản). Họ đảm bảo rằng mỗi câu chuyện xuất hiện trong top 3 kết quả trên trang kết quả tìm kiếm Google khi sử dụng một đoạn trích từ mỗi bài báo.
Đến bước 2, họ thực hiện cùng một yêu cầu tìm kiếm thông tin trên mỗi chatbot AI và xác định tỷ lệ chính xác của chatbot, dựa trên việc công cụ có viện dẫn một cách chính xác một trong ba yếu tố, bao gồm nội dung bài báo, tổ chức tin tức hay đường link của bài viết.
Kế đến, các nhà nghiên cứu đánh dấu những kết quả từ chatbot dựa theo 5 thang đo từ “hoàn toàn sai” đến “hoàn toàn đúng”. Kết quả được liệt kê trong biểu đồ dưới đây. Ngoại trừ hai phiên bản chatbot của Perplexity, những công cụ tìm kiếm thông tin trực tuyến dựa trên mô hình AI không có tỷ lệ chính xác cao. Tính trung bình, những công cụ tìm kiếm bằng AI sai tới 60%. Tệ hơn là những công cụ AI này luôn có xu hướng khẳng định rằng những thông tin sai lệch mà chúng hiển thị là chính xác, nói cách khác, sự tự tin của dữ liệu mà AI tạo sinh viết ra dễ khiến người dùng bị lừa.
Có thể nói, nghiên cứu này của trung tâm Tow là lần đầu tiên các nhà khoa học tổng kết được một cách định lượng tỷ lệ thông tin sai lệch mà một mô hình AI vận hành chatbot cũng như công cụ
tìm kiếm trực tuyến đưa ra. Thậm chí trong một số trường hợp, tùy thuộc vào mô hình AI cũng như dữ liệu huấn luyện, chatbot dám khẳng định những gì nó đưa ra là đúng, rồi tạo sinh ra cả những từ ngữ mang giá trị tranh luận với chính người dùng khi bị nghi ngờ về mức độ xác thực của thông tin.

Ted Gioia, trong một bài viết ngắn vào năm 2023 đã chỉ ra hàng chục câu trả lời của ChatGPT, mô tả việc chatbot AI này đưa ra thông tin sai lệch nhưng khẳng định chúng một cách vô cùng tự tin. Rồi thậm chí còn có cả trường hợp ChatGPT, sau khi thừa nhận nó đưa ra thông tin sai lệch, lại tiếp tục tạo ra những thông tin hoàn toàn không có thực khác.
Dữ liệu và kết quả của cuộc nghiên cứu này đã ủng hộ những tuyên bố của Gioia hồi năm 2023. ChatGPT Search là công cụ duy nhất sẵn sàng trả lời đủ 200 câu hỏi dựa trên 200 bài báo được dùng để làm nền tảng cho cuộc nghiên cứu. Tuy nhiên tỷ lệ những câu trả lời hoàn toàn chính xác được ChatGPT viện dẫn chỉ là 28%. Tỷ lệ đưa ra thông tin sai lên tới 57%.