Bước nhảy lớn của AI

Trí tuệ nhân tạo đã có một bước tiến vượt bậc với mô hình mới nhất của OpenAI, o3, gần đây đạt 85% trên thang đo ARC-AGI, vượt xa kỷ lục AI trước đó là 55% và tiệm cận với mức độ của con người.

Kết quả này đã dấy lên những tranh luận sôi nổi về việc liệu chúng ta có thực sự đang tiến gần đến trí tuệ nhân tạo tổng quát (AGI) hay không.

Nhưng điều này thực sự có ý nghĩa gì? Không giống như các mô hình AI truyền thống dựa vào lượng dữ liệu khổng lồ, bài kiểm tra này đặt ra các nhiệm vụ nhận dạng mẫu dựa trên lưới nhỏ, đòi hỏi AI phải suy ra logic cơ bản với dữ liệu đào tạo tối thiểu. Khả năng này, được gọi là tính hiệu quả mẫu, được coi là một khía cạnh quan trọng của trí tuệ.

Tại sao hiệu suất của o3 lại quan trọng?

Hầu hết các mô hình AI, bao gồm cả ChatGPT, yêu cầu đào tạo mở rộng trên các tập dữ liệu khổng lồ để hoạt động hiệu quả. Tuy nhiên, chúng gặp khó khăn với các nhiệm vụ mới hoặc ít gặp do dựa vào nhận dạng mẫu thay vì giải quyết vấn đề thực sự. Ngược lại, o3 của OpenAI dường như đã vượt qua rào cản này khi học được từ chỉ một vài ví dụ, cho thấy mức độ thích ứng cao hơn.

Mặc dù các chi tiết về cách o3 đạt được điều này vẫn chưa rõ ràng, các nhà nghiên cứu suy đoán rằng nó sử dụng một hệ thống tương tự như AlphaGo của Google, hệ thống đánh giá các chiến lược giải quyết vấn đề khác nhau trước khi chọn chiến lược hiệu quả nhất. Quá trình này có thể liên quan đến việc tìm kiếm qua các chuỗi tư duy và sử dụng một tiêu chí—có thể ưu tiên giải pháp đơn giản nhất hoặc có tính khái quát cao nhất—để xác định đáp án tốt nhất.

O3 có phải là AGI?

Dù đạt kết quả ấn tượng, thành tựu của o3 không nhất thiết có nghĩa là chúng ta đã đạt được AGI. Có khả năng thành công của nó xuất phát từ các tối ưu hóa đặc thù cho thang đo ARC-AGI thay vì một đột phá cơ bản về trí tuệ.

Bài kiểm tra thực sự sẽ là liệu o3 có thể khái quát hóa qua một loạt nhiệm vụ rộng lớn hay không, thay vì chỉ hoạt động tốt trong các môi trường kiểm tra có cấu trúc.

Hơn nữa, OpenAI vẫn chưa cung cấp đầy đủ thông tin minh bạch về cách o3 hoạt động. Các khả năng, giới hạn và ứng dụng thực tế của nó vẫn phần lớn là ẩn số.

Tiếp theo là gì?

Để xác định liệu o3 thực sự là một bước tiến đến AGI, cần có các bài kiểm tra và đánh giá sâu rộng. Sự tiết lộ hạn chế từ OpenAI đồng nghĩa với việc các nhà nghiên cứu độc lập phải đánh giá kỹ lưỡng khả năng của o3 khi nó trở nên công khai.

Nếu o3 chứng minh được sự thích nghi ngang ngửa với một người bình thường, nó có thể cách mạng hóa AI, thúc đẩy các tiến bộ trong tự động hóa, ra quyết định và thậm chí cả các hệ thống tự cải thiện.

Nếu không, nó vẫn là một thành tựu đáng ghi nhận trong phát triển AI.

Dù kết quả thế nào, cột mốc này đưa chúng ta tiến một bước gần hơn đến việc hiểu tương lai của trí tuệ.