Chuyên trang Neowin đưa tin, giám đốc điều hành Steve Huffman của Reddit đã cáo buộc Microsoft sử dụng dữ liệu của họ để đào tạo các dịch vụ trí tuệ nhân tạo mà không có sự cho phép.
Ông Huffman cho biết, không chỉ riêng Microsoft mà cả Anthropic và Perplexity cũng đã thu thập dữ liệu từ Reddit để hỗ trợ cho quá trình phát triển trí tuệ nhân tạo của họ. Ông nhận định rằng các công ty này xem nội dung trên internet như là tài nguyên miễn phí và có thể sử dụng mà không bị ràng buộc.
Huffman nhấn mạnh rằng việc ngăn chặn các công ty này tiếp cận dữ liệu của Reddit là một "khó khăn thực sự". Dẫu vậy, ông cũng nhận thấy rằng quan điểm về việc các công cụ tìm kiếm khai thác nội dung từ các trang web mà không có sự bồi thường đang dần có sự chuyển biến.
Trước đó, Reddit đã quyết định hạn chế quyền truy cập vào dữ liệu của mình từ các công cụ tìm kiếm, trong đó có Bing của Microsoft, trừ khi nhận được khoản phí. Microsoft đã lên tiếng cho rằng họ đã cung cấp cho Reddit những công cụ giúp kiểm soát việc thu thập dữ liệu, nhưng Reddit vẫn chọn chặn Bing.
Sự kiện này lại một lần nữa khơi mào nhiều cuộc tranh luận về việc sử dụng dữ liệu cho việc đào tạo trí tuệ nhân tạo. Các tập đoàn công nghệ lớn đang phải đối mặt với sự chỉ trích vì đã thu thập dữ liệu từ các trang web khác mà không có sự cho phép hoặc đền bù hợp lý.