Câu hỏi số 5: Hệ thống chatbot suy luận khác với các chatbot thế hệ cũ như thế nào?
Anh em có thể yêu cầu các chatbot cũ hơn cho bạn thấy cách họ đã đạt được một câu trả lời cụ thể hoặc kiểm tra công việc của chính họ. Vì mô hình công nghệ vận hành ChatGPT ban đầu học từ văn bản thu thập trên internet, nơi mọi người trình bày cách họ đạt được câu trả lời hoặc kiểm tra công việc của mình, nên mô hình ngôn ngữ lớn cũng có thể thực hiện bước “tự phê bình” quy trình tìm ra câu trả lời.
Nhưng hệ thống suy luận đi xa hơn. Nó có thể làm những điều này mà không cần được người dùng gõ prompt yêu cầu. Và AI suy luận có thể làm chúng theo những cách ứng dụng ngữ cảnh rộng hơn, và phức tạp hơn.
Các công ty gọi đây là một hệ thống suy luận vì nó cảm thấy như nó hoạt động giống như một người đang suy nghĩ về một vấn đề khó khăn, cần chia nhỏ thành nhiều bước.
Câu hỏi số 6: Tại sao suy luận AI lại quan trọng vào lúc này?
OpenAI và các công ty khác tin rằng đây là cách tốt nhất để cải thiện chatbot AI của họ.
Trong nhiều năm, hầu hết mọi startup và tập đoàn công nghệ nghiên cứu và vận hành AI đều dựa trên một khái niệm đơn giản: Càng bơm nhiều dữ liệu internet vào chatbot của họ, hệ thống đó càng hoạt động tốt hơn.
Nhưng vào năm 2024, họ đã sử dụng gần như tất cả văn bản trên internet. Cuộc khủng hoảng về dữ liệu
huấn luyện LLM bắt đầu diễn ra.
Điều đó có nghĩa là họ cần một cách mới để cải thiện chatbot của mình. Vì vậy, họ bắt đầu xây dựng các hệ thống có khả năng bắt chước cách con người suy luận.
Câu hỏi số 7: Làm thế nào để xây dựng một hệ thống suy luận?
Năm ngoái, các công ty như OpenAI bắt đầu tận dụng nhiều hơn một kỹ thuật gọi là huấn luyện tăng cường (reinforcement learning).
Thông qua quá trình này, đôi khi có thể kéo dài hàng tháng, một hệ thống AI có thể học hành vi thông qua thử và sai rộng rãi. Bằng cách làm việc với hàng nghìn bài toán, ví dụ, nó có thể học được phương pháp nào dẫn đến câu trả lời đúng và phương pháp nào không.
Các nhà nghiên cứu đã thiết kế các cơ chế phản hồi phức tạp, để xác thực khi hệ thống thực hiện điều gì đó đúng và khi nó thực hiện điều gì đó sai.
“Nó hơi giống việc con người huấn luyện một con chó,” Jerry Tworek, một nhà nghiên cứu tại OpenAI nói. “Nếu hệ thống làm tốt, bạn thưởng cho 'nó' một chiếc bánh quy. Nếu nó không làm tốt, bạn nói, ‘Chó hư.’”
Câu hỏi số 8: Liệu học tăng cường có hiệu quả 100% không?
Nó hoạt động khá tốt trong một số lĩnh vực nhất định, như toán học, khoa học và lập trình máy tính. Đây là những lĩnh vực mà các công ty có thể xác định rõ ràng hành vi tốt và hành vi xấu. Bài toán toán học luôn luôn có những kết quả đúng hoặc sai, không có nửa đúng nửa sai.
Quy trình học tăng cường không vận hành tốt nếu dùng chatbot AI và mô hình ứng dụng vào các lĩnh vực như viết sáng tạo, triết học và đạo đức, nơi sự khác biệt giữa tốt và xấu khó xác định một cách rạch ròi hơn. Các nhà nghiên cứu cho biết, quá trình này thường có thể cải thiện hiệu suất của hệ thống AI, ngay cả khi nó trả lời các câu hỏi bên ngoài toán học và khoa học.
“Nó dần dần học được những mô hình suy luận nào dẫn nó đi đúng hướng và những mô hình nào không,” Jared Kaplan, giám đốc khoa học tại Anthropic nói.
Câu hỏi số 9: Học tăng cường và hệ thống suy luận có giống nhau không?
Không. Học tăng cường là phương pháp mà các công ty sử dụng để xây dựng hệ thống suy luận. Đó là giai đoạn huấn luyện cuối cùng cho phép tạo ra những mô hình phục vụ chatbot suy luận.
Câu hỏi số 10: Những hệ thống suy luận này vẫn mắc lỗi chứ?
Chắc chắn rồi. Mọi thứ một chatbot làm đều dựa trên xác suất tạo sinh và nội suy văn bản và ngôn ngữ tự nhiên. Nó chọn ra một con đường giống nhất với dữ liệu mà nó học được, bất chấp việc dữ liệu đó đến từ internet hay được tạo ra thông qua học tăng cường. Đôi khi, nó chọn một tùy chọn sai hoặc không có ý nghĩa. Đấy cũng là thứ chúng ta hay gọi là AI bị “loạn ngôn” và “ảo giác”.
Câu hỏi số 11: AI suy luận có phải là con đường dẫn đến một cỗ máy sánh ngang trí thông minh của con người?
Các chuyên gia AI có những quan điểm trái chiều, rất nhiều tranh cãi khi tìm ra câu trả lời cho câu hỏi này. Những phương pháp huấn luyện để tạo ra những AI biết suy luận vẫn còn tương đối mới và các nhà nghiên cứu vẫn đang cố gắng hiểu giới hạn của chúng. Trong lĩnh vực AI, các phương pháp mới thường tiến triển rất nhanh lúc đầu, trước khi có sự chững lại về tốc độ cải tiến công nghệ.
Theo The New York Times