Meta, công ty mẹ của Facebook và Instagram, đang đối mặt với một vụ kiện nghiêm trọng liên quan đến việc sử dụng trái phép dữ liệu để đào tạo mô hình trí tuệ nhân tạo. Không phải bê bối về quyền riêng tư hay tin giả, lần này, Meta bị cáo buộc đã thu thập trái phép hàng chục terabyte sách vi phạm bản quyền nhằm phục vụ quá trình phát triển Meta AI tích hợp trong các ứng dụng của hãng.
Theo hồ sơ tòa án vừa được công bố, Meta đang đối diện với một vụ kiện tập thể với cáo buộc sử dụng trái phép khoảng 81,7TB dữ liệu từ các thư viện trực tuyến không chính thống như Anna’s Archive, Z-Library, và LibGen. Các tài liệu này được cho là đã được tải xuống thông qua torrent – một phương thức thường gắn liền với việc chia sẻ nội dung vi phạm bản quyền.
Thư viện "lậu" Anna's Archive
Đáng chú ý, bê bối này không chỉ dừng lại ở hành động đơn lẻ của một nhóm nhỏ, mà dường như đã nhận được sự chấp thuận từ cấp quản lý cao nhất. Các tin nhắn nội bộ bị rò rỉ cho thấy, từ tháng 10/2022, một nhà nghiên cứu AI cấp cao của Meta đã bày tỏ lo ngại về vấn đề đạo đức khi sử dụng tài liệu vi phạm bản quyền. “Tôi không nghĩ chúng ta nên sử dụng nội dung trái phép,” người này cảnh báo. Một nhân viên khác cũng nhấn mạnh rằng các nền tảng như SciHub và LibGen thực chất là “chợ đen” cho tài liệu lậu.
Tuy nhiên, bất chấp những cảnh báo nội bộ, Meta vẫn tiếp tục triển khai kế hoạch. Theo một báo cáo, Mark Zuckerberg, CEO của Meta, đã tham dự một cuộc họp vào tháng 1/2023 để thúc giục nhóm phát triển AI đẩy nhanh tiến độ. Một nhân viên thậm chí còn nhận xét châm biếm rằng “tải torrent bằng laptop công ty có vẻ không phải là ý tưởng hay”.
CEO Mark Zuckerberg được cho là đã cho phép nhân viên tải sách lậu để đào tạo AI. Ảnh: WSJ
Nhằm che giấu hành vi của mình, Meta được cho là đã triển khai nhiều biện pháp để tránh liên kết trực tiếp giữa hoạt động tải dữ liệu với hệ thống nội bộ của công ty. Đơn kiện cáo buộc rằng đây là một nỗ lực có chủ đích nhằm né tránh các quy định về bản quyền.
Meta không phải là công ty công nghệ duy nhất vướng vào tranh cãi pháp lý liên quan đến việc đào tạo AI. Trước đó, OpenAI đã bị nhiều nhà văn kiện vì sử dụng tác phẩm của họ mà không có sự cho phép. Nvidia cũng từng đối mặt với các cáo buộc tương tự khi bị cho là đã sử dụng hàng nghìn cuốn sách và video để huấn luyện mô hình AI của mình.
Hiện tại, vụ kiện chống lại Meta vẫn đang trong giai đoạn đầu, và ngay cả khi có phán quyết bất lợi, công ty vẫn có quyền kháng cáo. Điều này đồng nghĩa với việc cuộc chiến pháp lý có thể kéo dài nhiều tháng, thậm chí nhiều năm, và có khả năng đặt ra những tiền lệ quan trọng cho ngành công nghiệp AI đang phát triển nhanh chóng.