Một báo cáo gần đây từ 404 Media đã gây chú ý mạnh mẽ khi tiết lộ rằng phần mềm tạo video dựa trên trí tuệ nhân tạo mang tên Jupiter đã sử dụng một khối lượng video đáng kể thu thập từ YouTube và các nguồn khác để đào tạo mô hình của nó. Phần mềm này được điều hành bởi Runway AI, Inc., một công ty khởi nghiệp có trị giá lên tới 1,5 tỷ đô la, với sự hỗ trợ tài chính từ những tên tuổi lớn trong lĩnh vực công nghệ như Google và NVIDIA.
Theo thông tin trong báo cáo, một bảng thống kê đã chỉ ra danh sách các kênh YouTube thuộc về những nhóm truyền thông và các nhà sáng tạo nội dung hàng đầu toàn cầu. Bảng này cũng bao gồm những trang web có chứa nội dung vi phạm bản quyền, được sử dụng trong nỗ lực "toàn diện" của công ty nhằm thu thập video. Một số cái tên nổi bật trong danh sách này là Netflix, Disney, Sony, Pixar, Vice News, cùng với những nhà sáng tạo nội dung độc lập như Marques Brownlee và Casey Neistat.
Một nguồn tin không tiết lộ danh tính đã chia sẻ với 404 Media rằng bảng tính này nằm trong kế hoạch của Runway nhằm tìm kiếm các video chất lượng tốt để phục vụ việc phát triển mô hình. Công ty này đã sử dụng phần mềm mã nguồn mở để thu thập nội dung từ YouTube và đã phân loại các video theo các thể loại như hoạt hình ngắn và tác phẩm của sinh viên.
Runway đã không cung cấp phản hồi cho yêu cầu bình luận từ 404 Media, trong khi Google đã hướng dẫn các câu hỏi đến một thông cáo trước đó về việc sử dụng video trên YouTube để huấn luyện mô hình video của OpenAI, cho rằng việc này vi phạm các quy định của YouTube.
Sự việc này là vấn đề mới nhất trong chuỗi tranh luận xung quanh việc các công ty khai thác dữ liệu từ những người sáng tạo mà không đền bù. Runway, công ty đã được đưa vào danh sách 100 công ty có ảnh hưởng nhất của Tạp chí TIME, hiện đang đối mặt với những nghi vấn nghiêm túc về tính hợp pháp của cách thức thu thập dữ liệu mà họ đang áp dụng.