Chỉ mất 5 phút để anh em phân biệt giữa mô hình ngôn ngữ lớn với AI suy luận

Doanh nghiệp gần bạn nhất

được xác nhận bởi itcctv

Chỉ mất 5 phút để anh em phân biệt giữa mô hình ngôn ngữ lớn với AI suy luận
Hình ảnh rao vặt

Chỉ mất 5 phút để anh em phân biệt giữa mô hình ngôn ngữ lớn với AI suy luận

Vào tháng 9, OpenAI đã giới thiệu một phiên bản ChatGPT mới, được thiết kế để suy luận qua các nhiệm vụ liên quan đến toán học, khoa học và lập trình máy tính. Không giống như các phiên bản chatbot trước đây, công nghệ mới này có thể dành thời gian “suy nghĩ” về các vấn đề phức tạp trước khi đưa ra câu trả lời.

Gần như ngay lập tức, OpenAI cho biết công nghệ suy luận mới của họ đã vượt trội hơn so với các hệ thống hàng đầu trong ngành trên một loạt các bài kiểm tra theo dõi sự tiến bộ của trí tuệ nhân tạo. Hiện tại, các công ty khác như Google, Anthropic và DeepSeek của Trung Quốc cũng đang cung cấp các công nghệ tương tự.

Nhưng liệu AI thực sự có thể suy luận giống con người hay không? Điều gì cho phép định nghĩa một hệ thống máy tính “biết suy nghĩ”? Và liệu những hệ thống này có thực sự đang tiến gần đến trí thông minh nhân tạo phổ quát đích thực hay không?

Dưới đây là tất cả những gì anh em cần biết để phân biệt giữa mô hình suy luận (reasoning model) và mô hình ngôn ngữ lớn (large language model - LLM), theo cách ngắn gọn nhất có thể.



Câu hỏi số 1: Suy luận của mô hình AI có ý nghĩa gì?

Khái niệm "suy luận" ở đây rất đơn giản. Nó chỉ có nghĩa là chatbot dành thêm thời gian để xử lý một vấn đề.

“Suy luận xảy ra khi hệ thống thực hiện công việc bổ sung sau khi câu hỏi được đặt ra,” Dan Klein, giáo sư khoa học máy tính tại Đại học Berkeley, California, kiêm giám đốc công nghệ của Scaled Cognition, một startup AI, cho biết.

Hệ thống có thể chia nhỏ vấn đề thành các bước riêng lẻ hoặc cố gắng giải quyết nó thông qua quá trình thử - sai lặp đi lặp lại.

ChatGPT ban đầu trả lời câu hỏi ngay lập tức, dựa trên những phiên bản LLM GPT của OpenAI. Còn các hệ thống suy luận mới có thể làm việc với một vấn đề trong vài giây, thậm chí vài phút, trước khi đưa ra câu trả lời nhờ việc kết hợp chung với mô hình ngôn ngữ lớn.

Câu hỏi số 2: Cụ thể hơn là như thế nào?

Trong một số trường hợp, một hệ thống chatbot ứng dụng mô hình suy luận sẽ tinh chỉnh cách tiếp cận của mình đối với một câu hỏi, lặp đi lặp lại để cải thiện phương pháp đã chọn. Đôi khi, nó có thể thử nhiều cách khác nhau để giải quyết một vấn đề trước khi chọn một trong số đó. Hoặc nó có thể quay lại và kiểm tra một số công việc mà nó đã thực hiện vài giây trước, chỉ để xem liệu nó có chính xác hay không.

Về cơ bản, hệ thống sẽ cố gắng mọi thứ có thể để trả lời câu hỏi của anh em. Điều này tương tự như một học sinh tiểu học đang vật lộn tìm cách giải một bài toán khó, viết ra nhiều lựa chọn khác nhau lên giấy.


Câu hỏi số 3: Loại câu hỏi nào đòi hỏi hệ thống AI phải suy luận?

Nó có thể suy luận về bất cứ điều gì. Nhưng suy luận hiệu quả nhất khi anh em đặt câu hỏi liên quan đến toán học, khoa học và lập trình máy tính.



Câu hỏi số 4: Giờ con người vẫn thông minh hơn AI chứ?

Một số chuyên gia dự đoán rằng, AI sẽ vượt qua trí thông minh của con người trong vài năm tới. Nhưng đó là dự đoán chưa trở thành hiện thực. Còn bây giờ, anh em có thể thử sức với những câu đố trong link dưới đây, để xem các cỗ máy còn phải tiến bộ bao xa. Đây là những bài thử nghiệm thử thách khả năng nhận diện mẫu cũng như tư duy suy luận, một dạng “phép thử Turing” để phân biệt não bộ con người và máy móc điện toán:

Will A.I. Soon Outsmart Humans? Play This Puzzle to Find Out. - The New York Times


Câu hỏi số 5: Hệ thống chatbot suy luận khác với các chatbot thế hệ cũ như thế nào?

Anh em có thể yêu cầu các chatbot cũ hơn cho bạn thấy cách họ đã đạt được một câu trả lời cụ thể hoặc kiểm tra công việc của chính họ. Vì mô hình công nghệ vận hành ChatGPT ban đầu học từ văn bản thu thập trên internet, nơi mọi người trình bày cách họ đạt được câu trả lời hoặc kiểm tra công việc của mình, nên mô hình ngôn ngữ lớn cũng có thể thực hiện bước “tự phê bình” quy trình tìm ra câu trả lời.

Nhưng hệ thống suy luận đi xa hơn. Nó có thể làm những điều này mà không cần được người dùng gõ prompt yêu cầu. Và AI suy luận có thể làm chúng theo những cách ứng dụng ngữ cảnh rộng hơn, và phức tạp hơn.

Các công ty gọi đây là một hệ thống suy luận vì nó cảm thấy như nó hoạt động giống như một người đang suy nghĩ về một vấn đề khó khăn, cần chia nhỏ thành nhiều bước.

Câu hỏi số 6: Tại sao suy luận AI lại quan trọng vào lúc này?

OpenAI và các công ty khác tin rằng đây là cách tốt nhất để cải thiện chatbot AI của họ.

Trong nhiều năm, hầu hết mọi startup và tập đoàn công nghệ nghiên cứu và vận hành AI đều dựa trên một khái niệm đơn giản: Càng bơm nhiều dữ liệu internet vào chatbot của họ, hệ thống đó càng hoạt động tốt hơn.

Nhưng vào năm 2024, họ đã sử dụng gần như tất cả văn bản trên internet. Cuộc khủng hoảng về dữ liệu huấn luyện LLM bắt đầu diễn ra.

Điều đó có nghĩa là họ cần một cách mới để cải thiện chatbot của mình. Vì vậy, họ bắt đầu xây dựng các hệ thống có khả năng bắt chước cách con người suy luận.



Câu hỏi số 7: Làm thế nào để xây dựng một hệ thống suy luận?

Năm ngoái, các công ty như OpenAI bắt đầu tận dụng nhiều hơn một kỹ thuật gọi là huấn luyện tăng cường (reinforcement learning).

Thông qua quá trình này, đôi khi có thể kéo dài hàng tháng, một hệ thống AI có thể học hành vi thông qua thử và sai rộng rãi. Bằng cách làm việc với hàng nghìn bài toán, ví dụ, nó có thể học được phương pháp nào dẫn đến câu trả lời đúng và phương pháp nào không.

Các nhà nghiên cứu đã thiết kế các cơ chế phản hồi phức tạp, để xác thực khi hệ thống thực hiện điều gì đó đúng và khi nó thực hiện điều gì đó sai.

“Nó hơi giống việc con người huấn luyện một con chó,” Jerry Tworek, một nhà nghiên cứu tại OpenAI nói. “Nếu hệ thống làm tốt, bạn thưởng cho 'nó' một chiếc bánh quy. Nếu nó không làm tốt, bạn nói, ‘Chó hư.’”

Câu hỏi số 8: Liệu học tăng cường có hiệu quả 100% không?

Nó hoạt động khá tốt trong một số lĩnh vực nhất định, như toán học, khoa học và lập trình máy tính. Đây là những lĩnh vực mà các công ty có thể xác định rõ ràng hành vi tốt và hành vi xấu. Bài toán toán học luôn luôn có những kết quả đúng hoặc sai, không có nửa đúng nửa sai.

Quy trình học tăng cường không vận hành tốt nếu dùng chatbot AI và mô hình ứng dụng vào các lĩnh vực như viết sáng tạo, triết học và đạo đức, nơi sự khác biệt giữa tốt và xấu khó xác định một cách rạch ròi hơn. Các nhà nghiên cứu cho biết, quá trình này thường có thể cải thiện hiệu suất của hệ thống AI, ngay cả khi nó trả lời các câu hỏi bên ngoài toán học và khoa học.

“Nó dần dần học được những mô hình suy luận nào dẫn nó đi đúng hướng và những mô hình nào không,” Jared Kaplan, giám đốc khoa học tại Anthropic nói.



Câu hỏi số 9: Học tăng cường và hệ thống suy luận có giống nhau không?

Không. Học tăng cường là phương pháp mà các công ty sử dụng để xây dựng hệ thống suy luận. Đó là giai đoạn huấn luyện cuối cùng cho phép tạo ra những mô hình phục vụ chatbot suy luận.

Câu hỏi số 10: Những hệ thống suy luận này vẫn mắc lỗi chứ?

Chắc chắn rồi. Mọi thứ một chatbot làm đều dựa trên xác suất tạo sinh và nội suy văn bản và ngôn ngữ tự nhiên. Nó chọn ra một con đường giống nhất với dữ liệu mà nó học được, bất chấp việc dữ liệu đó đến từ internet hay được tạo ra thông qua học tăng cường. Đôi khi, nó chọn một tùy chọn sai hoặc không có ý nghĩa. Đấy cũng là thứ chúng ta hay gọi là AI bị “loạn ngôn” và “ảo giác”.

Câu hỏi số 11: AI suy luận có phải là con đường dẫn đến một cỗ máy sánh ngang trí thông minh của con người?

Các chuyên gia AI có những quan điểm trái chiều, rất nhiều tranh cãi khi tìm ra câu trả lời cho câu hỏi này. Những phương pháp huấn luyện để tạo ra những AI biết suy luận vẫn còn tương đối mới và các nhà nghiên cứu vẫn đang cố gắng hiểu giới hạn của chúng. Trong lĩnh vực AI, các phương pháp mới thường tiến triển rất nhanh lúc đầu, trước khi có sự chững lại về tốc độ cải tiến công nghệ.

Theo The New York Times
Nguồn:tinhte.vn/thread/chi-mat-5-phut-de-anh-em-phan-biet-giua-mo-hinh-ngon-ngu-lon-voi-ai-suy-luan.3974059/
💬 bình luận

Bình luận

Trở thành viên của itcctv — Đăng ký
Thủ thuật tin học văn phòng Thủ thuật Word Thủ thuật Excel
Cuộn