"Những Thách Thức Về Độ Chính Xác Của Mô Hình AI: Tại Sao Chưa Thể Vượt Qua Bài Kiểm Tra?"

13-03-2025 16:04:43

Nghiên cứu gần đây cho thấy rằng các mô hình AI có xu hướng được lập trình để đưa ra câu trả lời cho mọi câu hỏi, thường dẫn đến những thông tin không chính xác hoặc bịa đặt. Điều này đặt ra câu hỏi về độ tin cậy và trách nhiệm của công nghệ trong việc cung cấp thông tin. Hãy cùng khám phá sâu hơn về vấn đề này trên website chúng tôi.

Các mô hình AI đang trở nên phổ biến, nhưng vẫn gặp nhiều thách thức về độ chính xác. Hiện tượng "ảo giác" và việc lan truyền thông tin sai đã trở thành trở ngại không nhỏ cho các nhà phát triển. Nghiên cứu gần đây từ Trung tâm Tow Center for Digital Journalism đã cung cấp dữ liệu định lượng, khẳng định những lo ngại mà người dùng đã bàn luận trong nhiều năm: AI thường tự tin đưa ra những câu trả lời sai lệch.

Trung tâm Tow vừa hoàn thành một cuộc kiểm tra kỹ lưỡng về độ chính xác của tám công cụ tìm kiếm AI hàng đầu, bao gồm ChatGPT Search, Perplexity, Perplexity Pro, Gemini, DeepSeek Search, Grok-2 Search, Grok-3 Search và Copilot. Để đảm bảo tính khách quan, họ đã chọn ngẫu nhiên 200 bài báo từ 20 nhà xuất bản tin tức, với mỗi nhà xuất bản cung cấp 10 bài viết, và tất cả đều nằm trong top 3 kết quả trên Google khi tìm kiếm theo trích dẫn gốc. Các công cụ AI này sau đó được thử thách để xác định chính xác các yếu tố sau: tiêu đề bài báo, tổ chức tin tức và URL tương ứng.

Theo một phân tích gần đây, kết quả của các công cụ AI thường không chính xác, với tỷ lệ sai sót lên tới 60% trong nhiều trường hợp. Điều đặc biệt đáng lưu tâm là sự "tự tin" mà các công cụ này thể hiện khi đưa ra thông tin sai lệch. Trong khi Perplexity và Perplexity Pro cho thấy hiệu suất tốt hơn, phần còn lại của các công cụ AI vẫn chưa đáp ứng được kỳ vọng của người dùng. Việc đánh giá độ chính xác của công nghệ này là rất quan trọng để cải thiện và tối ưu hóa trải nghiệm người dùng trong tương lai.

Theo nghiên cứu gần đây, ChatGPT Search chỉ đáp ứng chính xác 28% trong tổng số 200 truy vấn người dùng. Đáng chú ý, tỷ lệ sai lệch cao lên đến 57% khiến nhiều người dùng cảm thấy thất vọng. Trong khi đó, Grok-3 Search của xAI còn tệ hại hơn, với tỷ lệ sai lên đến 94%. Về phía Microsoft, Copilot đã từ chối trả lời 104 trong số 200 truy vấn. Trong 96 câu trả lời còn lại, chỉ có 16 câu hoàn toàn chính xác, 14 câu đúng một phần, trong khi tới 66 câu hoàn toàn sai. Điều này cho thấy mức độ không chính xác của công nghệ AI hiện nay vẫn ở mức đáng lo ngại, với khoảng 70% câu trả lời thiếu chính xác.

Nghiên cứu gần đây cho thấy các hệ thống AI có xu hướng đáp ứng mọi câu hỏi một cách mạnh mẽ, mặc dù nhiều câu trả lời lại không chính xác và có thể gây hiểu lầm. Điều này hoàn toàn phù hợp với ý kiến của Ted Gioia, nhà bình luận nổi tiếng trong bài viết năm 2023, khi ông mô tả ChatGPT là “kẻ lừa đảo tài tình”. Theo ông, AI này không chỉ tự tin cung cấp thông tin sai lệch mà còn tiếp tục phủ nhận sự thật ngay cả khi bị chỉ ra sai sót.

Một điểm gây chú ý là các công ty phát triển những công cụ trí tuệ nhân tạo này đang áp dụng mức phí từ 20 USD cho Perplexity Pro cho đến 200 USD mỗi tháng cho ChatGPT Pro. Tuy nhiên, thông tin về độ chính xác của chúng lại không được công khai một cách rõ ràng. Mặc dù các phiên bản trả phí như Perplexity Pro và Grok-3 Search có tỷ lệ phản hồi chính xác cao hơn một chút so với phiên bản miễn phí, tỷ lệ sai sót vẫn còn đáng kể.

Trong khi nhiều người đánh giá cao ChatGPT Search, ý kiến không phải lúc nào cũng đồng thuận. Lance Ulanoff từ TechRadar đã dành lời khen cho công cụ tìm kiếm này, nhấn mạnh rằng nó nhanh nhạy và chính xác. Hơn nữa, giao diện sạch sẽ không có quảng cáo đã khiến anh cân nhắc việc từ bỏ Google. Sự đa dạng trong trải nghiệm cá nhân chứng tỏ rằng việc đánh giá các công nghệ AI thường phụ thuộc vào từng hoàn cảnh cụ thể.

Cùng Chuyên Mục

CÔNG NGHỆ

6 tháng

So Sánh Giá: Mua iPhone 16e Hay iPhone 15 - Lựa Chọn Nào Tiết Kiệm Hơn 500.000 Đồng?

Người dùng có thể gặp khó khăn khi lựa chọn giữa iPhone 16e và iPhone 15. Cả hai mẫu điện thoại đều mang đến những tính năng cao cấp nhưng lại phù hợp với những nhu cầu sử dụng khác nhau. Sự khác biệt này có thể quyết định trải nghiệm của bạn, vì vậy hãy xem xét kỹ để tìm ra sản phẩm phù hợp nhất với mình.

CÔNG NGHỆ

6 tháng

"Khám Phá Thương Hiệu Smartwatch Tiên Phong Chiếm Lĩnh Thị Trường Năm 2024"

Apple vẫn đang dẫn đầu trong doanh số thị trường đồng hồ thông minh. Tuy nhiên, một thương hiệu khác đang cho thấy sự phát triển ấn tượng, thu hút ngày càng nhiều sự chú ý từ người tiêu dùng. Sự tăng trưởng này không chỉ là tín hiệu tích cực cho thị trường mà còn mở ra nhiều cơ hội cạnh tranh hấp dẫn.

CÔNG NGHỆ

6 tháng

"Dự Đoán Galaxy S25 Edge Sẽ Thất Bại Trước Khi Ra Mắt: Những Nguyên Nhân Đáng Lo Ngại"

Trong sự kiện Galaxy Unpacked vừa qua, Samsung đã bất ngờ ra mắt một sản phẩm mới thuộc dòng Galaxy S25, mang tên Galaxy S25 Edge. Đây hứa hẹn sẽ là một bổ sung ấn tượng cho dòng sản phẩm flagship của hãng, thu hút sự chú ý từ cả người tiêu dùng và giới công nghệ.

CÔNG NGHỆ

6 tháng

"Những Thành Phố Thế Giới Đang Đối Diện Nguy Cơ Bị Nước Biển Nuốt Chửng"

Biến đổi khí hậu toàn cầu đang nổi lên như một trong những thách thức nghiêm trọng nhất mà nhân loại phải đối mặt. Tình trạng này không chỉ ảnh hưởng đến môi trường mà còn tác động sâu sắc đến đời sống con người và nền kinh tế. Việc nhận thức và hành động kịp thời đối với vấn đề này là điều cần thiết để bảo vệ hành tinh và tương lai của chúng ta.

CÔNG NGHỆ

6 tháng

"Nguyên Nhân Đằng Sau Việc Apple Chậm Nâng Cấp AI Cho Siri: Những Điều Cần Biết"

Siri đã gặp một số tr delays trong quá trình nâng cấp, và nguyên nhân chính được tiết lộ liên quan đến mối lo ngại của Apple về việc người dùng có thể "bẻ khóa" trí tuệ nhân tạo này. Công ty đang cân nhắc kỹ lưỡng trước khi triển khai các tính năng mới nhằm đảm bảo rằng hệ thống an toàn và không bị khai thác. Những thông tin này cho thấy rõ ràng rằng Apple đang chú trọng đến cả khả năng đổi mới và bảo mật trong sản phẩm của mình.

CÔNG NGHỆ

6 tháng

"Google Ra Mắt Mô Hình AI Gemma 3: Công Nghệ Siêu Nhẹ Đột Phá Trong Ngành Game"

Google vừa ra mắt Gemma 3, một mô hình mã nguồn mở tiên tiến cho phép hoạt động trên cả bộ xử lý đồ họa GPU lẫn bộ xử lý tensor. Điều này mở ra nhiều cơ hội mới cho các nhà phát triển và nghiên cứu trong lĩnh vực trí tuệ nhân tạo. Với tính linh hoạt cao, Gemma 3 hứa hẹn sẽ trở thành công cụ mạnh mẽ, hỗ trợ sáng tạo và tối ưu hóa quy trình phát triển ứng dụng AI.

CÔNG NGHỆ