Tỷ phú Elon Musk vừa chia sẻ trong một cuộc phỏng vấn vào ngày 9/1 rằng mọi dữ liệu và kiến thức do con người sản xuất đã được khai thác triệt để trong quá trình đào tạo trí tuệ nhân tạo. Ông nhấn mạnh rằng quá trình này bắt đầu từ năm ngoái, cho thấy sự phát triển nhanh chóng và sâu rộng của AI trong việc tiếp thu và sử dụng thông tin mà con người đã tạo ra.
Ông nhấn mạnh rằng để giải quyết tình trạng thiếu hụt dữ liệu nguồn phục vụ cho việc đào tạo các mô hình mới, giải pháp hiệu quả là chuyển sang sử dụng dữ liệu tổng hợp do AI tạo ra. Ông mô tả quá trình này tương tự như việc viết một bài luận hay luận án, sau đó tự đánh giá và chấm điểm. Qua đó, chúng ta có thể xây dựng kiến thức mới một cách hệ thống và tối ưu hơn.
Nhiều tập đoàn công nghệ hàng đầu như Meta, Microsoft, Google và OpenAI đã áp dụng dữ liệu tổng hợp để nâng cao hiệu quả của các mô hình trí tuệ nhân tạo. Việc sử dụng dữ liệu này không chỉ giúp cải thiện khả năng học tập mà còn tăng cường độ chính xác trong các sản phẩm công nghệ mà họ phát triển.
Tỷ phú Elon Musk hồi năm 2023. Ảnh: Reuters
Tỷ phú Mỹ đã nhấn mạnh rằng các mô hình trí tuệ nhân tạo vẫn có khả năng sản sinh ra "ảo giác". Thuật ngữ này chỉ những kết quả không chính xác hoặc vô nghĩa mà AI tạo ra, dẫn đến nguy cơ thông tin sai lệch từ dữ liệu tự tổng hợp. Ông nhấn mạnh rằng điều này tạo ra nhiều thách thức trong việc sử dụng dữ liệu tổng hợp, vì rất khó để phân biệt đâu là ảo giác và đâu là câu trả lời chính xác cho những vấn đề được đặt ra.
Andrew Duncan, Giám đốc AI tại Viện Alan Turing ở Anh, đã chỉ ra rằng nhận xét của Elon Musk tương đồng với một nghiên cứu gần đây. Nghiên cứu này ước tính dữ liệu công khai cho mô hình AI có thể cạn kiệt vào năm 2026. Theo ông Duncan, nếu chúng ta quá phụ thuộc vào dữ liệu tổng hợp, có nguy cơ xảy ra "mô hình sụp đổ". Hệ quả của điều này là chất lượng đầu ra của AI sẽ giảm sút, mức độ thiên kiến sẽ tăng lên, và khả năng sáng tạo sẽ bị ảnh hưởng đáng kể.
Dữ liệu chất lượng cao và quyền kiểm soát chúng hiện đang trở thành một vấn đề pháp lý nóng bỏng giữa bối cảnh phát triển mạnh mẽ của trí tuệ nhân tạo. Các công ty công nghệ và nhà phát triển đang phải đối mặt với nhiều thách thức trong việc bảo vệ tài sản dữ liệu của mình trong khi vẫn đáp ứng nhu cầu ngày càng cao về thông tin chính xác và đáng tin cậy. Sự cạnh tranh khốc liệt trong lĩnh vực AI đã khiến việc quản lý và bảo vệ dữ liệu trở thành một ưu tiên hàng đầu.
OpenAI đã thừa nhận rằng việc phát triển các công cụ như ChatGPT sẽ không thể thực hiện được nếu thiếu quyền truy cập vào dữ liệu có bản quyền. Đồng thời, ngành công nghiệp sáng tạo cùng với các nhà xuất bản đang thúc giục việc bồi thường cho những tài liệu của họ đã được sử dụng trong quá trình huấn luyện trí tuệ nhân tạo.