Chương trình LLM lý luận thực nghiệm của chúng tôi đã đạt được những thành tựu ấn tượng, vượt qua một trong những thách thức lâu đời nhất trong lĩnh vực trí tuệ nhân tạo. Theo Alexander Wei, thành viên của đội ngũ kỹ thuật OpenAI, hệ thống này đã đủ điều kiện giành huy chương vàng tại kỳ thi Olympic Toán quốc tế IMO, sự kiện toán học danh giá nhất thế giới. Thông tin này được ông chia sẻ trên X vào cuối tuần qua, cho thấy tiềm năng vượt trội của công nghệ AI trong lĩnh vực giáo dục và nghiên cứu.
Wei đã chia sẻ một trải nghiệm thú vị khi để mô hình trí tuệ nhân tạo của mình tham gia vào kỳ thi toán quốc tế IMO 2025. Mô hình đã được thử nghiệm với sáu câu hỏi theo định dạng giống như cuộc thi thực tế. Cụ thể, bài thi được tổ chức trong hai buổi, mỗi buổi kéo dài 4,5 tiếng với ba câu hỏi. Điều đặc biệt là trong quá trình thi, mô hình không sử dụng bất kỳ công cụ nào hay truy cập Internet, mà chỉ có thể đọc đề bài và giải đáp bằng ngôn ngữ tự nhiên. Đây thực sự là một bước tiến đáng chú ý trong việc kiểm tra khả năng tư duy của trí tuệ nhân tạo.
Quá trình nghiên cứu này sẽ khám phá khả năng sáng tạo của mô hình ngôn ngữ lớn (LLM) so với những tiêu chuẩn đã tồn tại. Theo Wei, việc viết các lời giải sẽ không chỉ giúp xác minh thông tin mà còn cho phép xác định mức độ phức tạp và tính chặt chẽ của lập luận ở trình độ toán học. Hơn nữa, phương pháp tiếp cận linh hoạt, không bị giới hạn bởi các định nghĩa hẹp dành riêng cho từng nhiệm vụ, sẽ mở ra những đột phá mới trong lĩnh vực học tăng cường với mục tiêu chung. Điều này hứa hẹn khả năng tính toán sẽ ngày càng được mở rộng và phát triển theo thời gian.
Kết quả của mô hình giải toán OpenAI rất ấn tượng khi đạt thành công trong 5 trên 6 bài toán. Các bài giải đã được đánh giá bởi một hội đồng giám khảo gồm ba chuyên gia từng giành huy chương tại kỳ thi IMO. Với tổng điểm 35 trên 42, OpenAI đã xuất sắc giành huy chương vàng.
Các bài toán tại IMO (International Mathematical Olympiad) yêu cầu người tham gia phải có khả năng tư duy sáng tạo vượt bậc, khác biệt hoàn toàn so với những tiêu chuẩn trước đây. Theo Noam Brown, kỹ sư của OpenAI, điều này cho thấy rằng mô hình hiện tại đã có khả năng suy nghĩ sâu sắc và bền bỉ hơn trong thời gian dài.
Trong một cuộc phỏng vấn gần đây, Wei đã chia sẻ rằng đây chỉ là một mô hình nghiên cứu thử nghiệm. Ông cũng nhấn mạnh, hiện tại chưa có bất kỳ kế hoạch nào để phát hành sản phẩm liên quan đến khả năng toán học ở mức độ này trong vài tháng tới.
Trên nền tảng X, CEO Sam Altman đã nhấn mạnh rằng chương trình LLM này tập trung vào lĩnh vực toán học. Ông cho biết đây không phải là một hệ thống toán học chính thức mà là một bước tiến trong nỗ lực của công ty nhằm phát triển trí thông minh tổng quát.
IMO được biết đến như một trong những kỳ thi toán học khó khăn nhất trên toàn cầu. Bắt nguồn từ Romania vào năm 1959, cuộc thi này thu hút sự tham gia của những thí sinh trẻ tuổi dưới 20. Nội dung đề thi chủ yếu xoay quanh toán học sơ cấp, bao gồm bốn lĩnh vực chính: hình học, số học, đại số và tổ hợp. Đây không chỉ là cơ hội để các tài năng trẻ thể hiện khả năng mà còn là sân chơi quốc tế cho đam mê toán học.
Theo thông tin từ Business Insider, OpenAI vừa công bố những bước tiến ấn tượng trong khả năng giải toán của trí tuệ nhân tạo, mở ra cơ hội mới cho lĩnh vực lập luận toán học và tư duy sáng tạo. Trong năm qua, các phòng thí nghiệm AI chủ yếu sử dụng các bài toán tiểu học để kiểm tra năng lực của các mô hình AI. Tuy nhiên, tỷ phú công nghệ Peter Thiel đã từng nhận định rằng, vào năm 2024, vẫn cần ít nhất ba năm nữa để AI có thể giải quyết các bài toán từ kỳ thi IMO. Sự phát triển này cho thấy tiềm năng to lớn của công nghệ AI trong việc nâng cao khả năng tư duy và phân tích.