Sau Pokémon, các nhà nghiên cứu tại Đại học California San Diego đã chuyển sự chú ý sang huyền thoại Super Mario Bros. trong cuộc đua thử thách năng lực của AI. Họ đã cho các mô hình AI hàng đầu tham gia vào cuộc phiêu lưu vượt chướng ngại vật đầy thú vị này. Kết quả từ những cuộc thí nghiệm này thực sự đã tạo nên nhiều bất ngờ.
Trong một thử nghiệm thú vị, AI đã điều khiển nhân vật Mario thông qua framework GamingAgent bằng cách nhận các hướng dẫn và ảnh chụp màn hình từ trò chơi. Nhiệm vụ đặt ra là sử dụng mã Python để điều khiển Mario một cách hiệu quả. Kết quả cho thấy mô hình Claude 3.7 của Anthropic chiếm ưu thế, nhanh chóng vượt qua các thử thách, tiếp theo là Claude 3.5. Trong khi đó, Google Gemini 1.5 Pro cũng ghi điểm nhưng bất ngờ nhất là GPT-4o của OpenAI lại gặp khó khăn với những chướng ngại vật.
Trận so tài giữa những công nghệ AI hàng đầu trong việc chơi Mario đang thu hút sự chú ý của cộng đồng game. Các mô hình AI nổi bật như OpenAI, DeepMind và nhiều cái tên khác đang được đưa vào cuộc chiến để đánh giá khả năng xử lý và chiến thuật của chúng trong một trong những trò chơi cổ điển nhất. Kết quả của cuộc thi này không chỉ đem lại những phút giây giải trí hấp dẫn mà còn mở ra những hướng đi mới cho việc ứng dụng AI trong ngành công nghiệp game. Hứa hẹn sẽ có nhiều điều thú vị và bất ngờ từ những Innovations này.
Trong một nghiên cứu mới, các mô hình AI "suy luận" đã gặp phải thách thức lớn khi tham gia vào trò chơi Super Mario Bros, mặc dù chúng từng tỏa sáng trong nhiều bài kiểm tra khác. Nguyên nhân dẫn đến tình trạng này là khả năng mất vài giây để xử lý thông tin và đưa ra quyết định. Điều này đã khiến cho các mô hình AI không theo kịp nhịp độ nhanh chóng của trò chơi, nơi mà phản xạ nhanh nhạy là yếu tố quyết định.
Gần đây, việc sử dụng trò chơi để đánh giá trí tuệ nhân tạo đã trở thành chủ đề gây nhiều tranh cãi trong giới chuyên gia. Một số ý kiến cho rằng trò chơi có tính chất đơn giản và trừu tượng, thiếu sự phản ánh chính xác về khả năng thực sự của AI trong thế giới đời thường.
Andrej Karpathy, một trong những người sáng lập OpenAI, đã thể hiện sự nghi ngờ đối với các phương pháp đánh giá AI hiện tại. Ông mô tả tình trạng này là "cuộc khủng hoảng đánh giá". Theo Karpathy, các chỉ số hiện tại không đủ khả năng để phản ánh chính xác năng lực của các mô hình AI.
Việc chứng kiến AI vượt qua các màn chơi Mario, dù còn nhiều hạn chế, lại mở ra những góc nhìn mới về tiềm năng của công nghệ này. Những khoảnh khắc hài hước và không kém phần hấp dẫn từ AI khiến người chơi không chỉ cảm nhận được sự tiến bộ của trí tuệ nhân tạo mà còn gợi mở những suy nghĩ về tương lai của game và công nghệ.