Apple vừa thông báo về ReALM, một mô hình AI mới được đánh giá cao hơn cả GPT-4 của OpenAI. Theo các nhà nghiên cứu của Apple, ReALM là một mô hình ngôn ngữ có khả năng hiểu và xử lý thành công các ngữ cảnh khác nhau, mở ra tiềm năng to lớn cho các ứng dụng AI trong tương lai.
Điểm đặc biệt của ReALM chính là khả năng xử lý tham chiếu, một vấn đề quan trọng trong lĩnh vực Trí tuệ nhân tạo. Tham chiếu ở đây đề cập đến các thực thể trong một câu chuyện hoặc cuộc trò chuyện, như tên người, địa điểm, sự kiện, ... Khả năng xử lý tham chiếu hiệu quả giúp AI hiểu rõ hơn bối cảnh và cung cấp phản hồi chính xác, phù hợp hơn.
ReALM có thể xử lý ba loại tham chiếu chính:
Các thực thể trên màn hình là những đối tượng đang được hiển thị trên màn hình của người dùng. Ví dụ, khi người dùng yêu cầu "Gọi điện cho hiệu thuốc trên đường ABC", ReALM có thể hiểu và thực hiện cuộc gọi đến hiệu thuốc đó trên bản đồ.
Các thực thể trong cuộc hội thoại là những yếu tố liên quan đến cuộc trò chuyện. Ví dụ, khi người dùng hỏi "Ai là đạo diễn của bộ phim vừa chiếu?", ReALM có thể kiểm tra thông tin trong cuộc trò chuyện trước đó để xác định bộ phim đang được thảo luận và trả lời câu hỏi.
Thực thể nền: Đây là các thực thể liên quan đến các quá trình nền, không nhất thiết phải là một phần trực tiếp của những gì người dùng thấy trên màn hình hoặc tương tác với trợ lý ảo. Ví dụ, khi người dùng hỏi "Bài hát nào đang phát?", ReALM có thể xác định bài hát đang phát trong nền và cung cấp thông tin cho người dùng.
So sánh với GPT-4, ReALM được đánh giá cao về khả năng xử lý các ngữ cảnh phức tạp, đặc biệt là những ngữ cảnh liên quan đến hình ảnh và video. Trong bài báo khoa học giới thiệu về ReALM, các nhà nghiên cứu của Apple đã tiết lộ rằng họ đã sử dụng ảnh chụp màn hình để hỗ trợ ReALM giải quyết các tham chiếu trên màn hình, từ đó giúp cải thiện hiệu suất một cách đáng kể so với GPT-4.
ReALM được hy vọng sẽ đem đến nhiều ứng dụng AI mới trong tương lai, bao gồm trợ lý ảo tiên tiến hơn, hệ thống đề xuất nội dung cá nhân hóa và các công cụ sáng tạo hỗ trợ con người một cách hiệu quả hơn.
Đây là một bước tiến quan trọng trong lĩnh vực Trí tuệ nhân tạo của Apple và hứa hẹn sẽ tạo ra nhiều thay đổi tích cực trong tương lai.