Các mô hình AI đang trở nên phổ biến, nhưng vẫn gặp nhiều thách thức về độ chính xác. Hiện tượng "ảo giác" và việc lan truyền thông tin sai đã trở thành trở ngại không nhỏ cho các nhà phát triển. Nghiên cứu gần đây từ Trung tâm Tow Center for Digital Journalism đã cung cấp dữ liệu định lượng, khẳng định những lo ngại mà người dùng đã bàn luận trong nhiều năm: AI thường tự tin đưa ra những câu trả lời sai lệch.
Trung tâm Tow vừa hoàn thành một cuộc kiểm tra kỹ lưỡng về độ chính xác của tám công cụ tìm kiếm AI hàng đầu, bao gồm ChatGPT Search, Perplexity, Perplexity Pro, Gemini, DeepSeek Search, Grok-2 Search, Grok-3 Search và Copilot. Để đảm bảo tính khách quan, họ đã chọn ngẫu nhiên 200 bài báo từ 20 nhà xuất bản tin tức, với mỗi nhà xuất bản cung cấp 10 bài viết, và tất cả đều nằm trong top 3 kết quả trên Google khi tìm kiếm theo trích dẫn gốc. Các công cụ AI này sau đó được thử thách để xác định chính xác các yếu tố sau: tiêu đề bài báo, tổ chức tin tức và URL tương ứng.
Theo một phân tích gần đây, kết quả của các công cụ AI thường không chính xác, với tỷ lệ sai sót lên tới 60% trong nhiều trường hợp. Điều đặc biệt đáng lưu tâm là sự "tự tin" mà các công cụ này thể hiện khi đưa ra thông tin sai lệch. Trong khi Perplexity và Perplexity Pro cho thấy hiệu suất tốt hơn, phần còn lại của các công cụ AI vẫn chưa đáp ứng được kỳ vọng của người dùng. Việc đánh giá độ chính xác của công nghệ này là rất quan trọng để cải thiện và tối ưu hóa trải nghiệm người dùng trong tương lai.
Theo nghiên cứu gần đây, ChatGPT Search chỉ đáp ứng chính xác 28% trong tổng số 200 truy vấn người dùng. Đáng chú ý, tỷ lệ sai lệch cao lên đến 57% khiến nhiều người dùng cảm thấy thất vọng. Trong khi đó, Grok-3 Search của xAI còn tệ hại hơn, với tỷ lệ sai lên đến 94%. Về phía Microsoft, Copilot đã từ chối trả lời 104 trong số 200 truy vấn. Trong 96 câu trả lời còn lại, chỉ có 16 câu hoàn toàn chính xác, 14 câu đúng một phần, trong khi tới 66 câu hoàn toàn sai. Điều này cho thấy mức độ không chính xác của công nghệ AI hiện nay vẫn ở mức đáng lo ngại, với khoảng 70% câu trả lời thiếu chính xác.
Nghiên cứu gần đây cho thấy các hệ thống AI có xu hướng đáp ứng mọi câu hỏi một cách mạnh mẽ, mặc dù nhiều câu trả lời lại không chính xác và có thể gây hiểu lầm. Điều này hoàn toàn phù hợp với ý kiến của Ted Gioia, nhà bình luận nổi tiếng trong bài viết năm 2023, khi ông mô tả ChatGPT là “kẻ lừa đảo tài tình”. Theo ông, AI này không chỉ tự tin cung cấp thông tin sai lệch mà còn tiếp tục phủ nhận sự thật ngay cả khi bị chỉ ra sai sót.
Một điểm gây chú ý là các công ty phát triển những công cụ trí tuệ nhân tạo này đang áp dụng mức phí từ 20 USD cho Perplexity Pro cho đến 200 USD mỗi tháng cho ChatGPT Pro. Tuy nhiên, thông tin về độ chính xác của chúng lại không được công khai một cách rõ ràng. Mặc dù các phiên bản trả phí như Perplexity Pro và Grok-3 Search có tỷ lệ phản hồi chính xác cao hơn một chút so với phiên bản miễn phí, tỷ lệ sai sót vẫn còn đáng kể.
Trong khi nhiều người đánh giá cao ChatGPT Search, ý kiến không phải lúc nào cũng đồng thuận. Lance Ulanoff từ TechRadar đã dành lời khen cho công cụ tìm kiếm này, nhấn mạnh rằng nó nhanh nhạy và chính xác. Hơn nữa, giao diện sạch sẽ không có quảng cáo đã khiến anh cân nhắc việc từ bỏ Google. Sự đa dạng trong trải nghiệm cá nhân chứng tỏ rằng việc đánh giá các công nghệ AI thường phụ thuộc vào từng hoàn cảnh cụ thể.