Đánh giá khả năng của trí tuệ nhân tạo (AI) luôn là một chủ đề gây tranh cãi, đặc biệt khi nhiều công ty chỉ công bố những thành tích nổi bật mà giấu nhẹm các hạn chế. Để đưa ra cái nhìn toàn diện hơn, một nhóm nghiên cứu tại Phòng thí nghiệm AI Hao thuộc Đại học California San Diego đã chọn một phương pháp độc đáo. Họ đã sử dụng trò chơi huyền thoại Super Mario Bros. như một thước đo để thử nghiệm các mô hình AI hàng đầu. Điều này đặt ra câu hỏi thú vị: nếu AI không thể vượt qua những chướng ngại vật cơ bản như Goombas hay Koopa Troopas, thì liệu nó có đủ độ tin cậy để hoạt động trong những tình huống phức tạp của cuộc sống thực?
Trong một nghiên cứu mới, các chuyên gia đã sử dụng một phiên bản mô phỏng của Super Mario Bros, kết hợp với GamingAgent – khuôn khổ được phát triển bởi Hao Lab. Công nghệ này cho phép trí tuệ nhân tạo điều khiển Mario bằng cách tạo ra mã Python từ những hướng dẫn đơn giản như "Nhảy qua kẻ thù" cùng với hình ảnh chụp màn hình trong trò chơi. Mặc dù Super Mario Bros. có vẻ như là một tựa game 2D đơn giản, nhưng để thành công, AI cần phải lập kế hoạch nhanh chóng và điều chỉnh chiến lược một cách linh hoạt. Đây thực sự là một thách thức đáng kể cho công nghệ trí tuệ nhân tạo hiện nay.
Kết quả mới nhất cho thấy Claude 3.7 từ Anthropic là "người chơi" vượt trội nhất. Với phản xạ nhanh nhẹn, nó thực hiện những cú nhảy chính xác và né tránh kẻ địch một cách tinh tế. Claude 3.5, phiên bản trước đó, cũng không kém phần ấn tượng. Trong khi đó, các mô hình nổi tiếng như GPT-4o của OpenAI và Gemini 1.5 Pro từ Google, mặc dù nổi bật về khả năng lý luận, lại gặp khó khăn trong việc theo kịp tốc độ của trò chơi. Sự khác biệt này tạo nên một bảng xếp hạng thú vị cho những ai yêu thích game.
Theo nghiên cứu từ các chuyên gia, yếu tố quyết định để đạt được thành công trong Super Mario Bros. không phải là lý thuyết mà là tốc độ. Chỉ cần một khoảnh khắc chần chừ trong việc xác định bước đi tiếp theo cũng đủ để Mario gặp rắc rối. Những chiến thuật quá nhiều lý luận thường tốn thời gian và dẫn đến những thất bại đáng tiếc. Hãy nhớ rằng, trong thế giới của Mario, phản xạ nhanh nhạy luôn là lợi thế!
Việc sử dụng những trò chơi điện tử cổ điển như Super Mario Bros. để đánh giá trí tuệ nhân tạo mang lại nhiều yếu tố giải trí hơn là một thước đo nghiêm ngặt về hiệu quả thực tiễn. Khả năng của AI trong việc chơi trò chơi này không thể hiện rõ giá trị thực sự của nó trong ứng dụng hàng ngày. Tuy nhiên, hình ảnh những mô hình AI tiên tiến đang vật lộn với một trò chơi tưởng chừng đơn giản như vậy vẫn tạo nên sự hứng thú cho không ít người yêu thích công nghệ.
Dành cho những ai yêu thích khám phá, Hao AI Lab đã chính thức công bố mã nguồn của GamingAgent trên GitHub. Điều này tạo điều kiện cho cộng đồng game thủ có thể tham gia thử nghiệm và trải nghiệm công nghệ mới này. Bạn có tin rằng AI của mình có thể đánh bại Mario? Hãy cùng thử sức và tìm ra câu trả lời!