Luật bản quyền hiện đại không theo kịp tư duy của trí tuệ nhân tạo

Thứ hai, 16/04/2018, 21:09 - Nguồn: Yêu cầu xóa tin

Ai sở hữu tác phẩm của một trí tuệ nhân tạo?

Tháng 4/2017, kỹ sư Alex Reben đã đăng lên YouTube video "Deeply Artificial Trees (Cây nhân tạo)", một tác phẩm nghệ thuật được thực hiện bằng học máy, sử dụng các video của chương trình truyền hình dạy vẽ Joy of Painting trong những năm 1980 và 1990. Video này có những âm thanh vô nghĩa mô phỏng cách nói và giọng điệu của Bob Ross, người dẫn chương trình. Người kế thừa quyền sở hữu trí tuệ của Bob Ross không hài lòng, đã yêu cầu DMCA (tổ chức bảo vệ bản quyền tác giả) gỡ video này xuống, và phải cho đến gần đây video mới được đăng lại. Giống trường hợp của Naruto, chú khỉ mào đen với những bức ảnh tự sướng nổi tiếng, thất bại của video này đặt ra một số câu hỏi về việc Luật Bản quyền năm 1976 và Học thuyết Sử dụng Hợp lý của DMCA nên được áp dụng như thế nào với nền văn hoá công nghệ đang phát triển nhanh, đặc biệt là khi kỹ thuật AI và học máy đang len lỏi vào mọi lĩnh vực.

"Nếu một người có thể học hỏi từ một cuốn sách có bản quyền, liệu máy móc có thể học được từ cuốn sách đó hay không?", Reben đặt câu hỏi với Engadget. Phần lớn nghệ thuật của Reben, được hỗ trợ bởi tổ chức phi lợi nhuận Stochastic Labs, đều có mục đích đặt ra những vấn đề hóc búa như vậy. Ông nói với Engadget: "Cách tốt nhất để làm một cái gì đó khiêu khích và công khai là khơi mào câu chuyện và đưa chúng đến nơi mà công chúng có thể bắt đầu suy nghĩ về chúng".

Để đạt được mục đích đó, Reben đã khởi xướng các dự án như Let Us Exaggerate, "một thuật toán tạo ra ngôn ngữ vô nghĩa từ các bài viết trên diễn đàn Artforum", Synthetic Penmanship, mô phỏng chính xác chữ viết tay của một người, Korible Bibloran, một thuật toán tạo ra thánh kinh mới dựa trên hiểu biết về Kinh thánh và Kinh Koran, hoặc Algorithmic Collaboration: Fractal Flame, làm mờ ranh giới sáng tạo giữa con người và máy móc.

Reben giải thích: "Tôi bắt đầu với một chương trình tạo ra các cụm từ để tôi phải suy nghĩ, ví dụ như ‘cỏ dại'". Sau đó ông suy nghĩ về cụm từ đó trong khi EEG và các cảm biến khác ghi lại phản ứng của ông. Tiếp đến, dữ liệu được đưa vào một thuật toán nghệ thuật để tạo ra hình ảnh. "Phiên bản kỹ thuật số sử dụng sản sinh phân dạng IFS, nơi bảng màu được máy tính lựa chọn từ cụm từ trong các kết quả tìm kiếm hình ảnh của Google, sau đó hiển thị các phiên bản khác nhau cho tôi lựa chọn bằng cách đo phản ứng của tôi đối với hình ảnh".

Algorithmic Collaboration: Fractal Flame - Disobedient Strawberry

Công nghệ mới vi phạm luật bản quyền hiện có không phải là mới. Ben Sobel, một hội viên tại Trung tâm Internet và Xã hội Berkman Klein, Đại học Harvard chia sẻ với Intellectual Property Watch vào tháng 8/2017: "Vào những năm 1980, Tòa án Tối cao Mỹ đánh giá ai "là tác giả" hình ảnh của một trò chơi điện tử được tạo ra bởi phần mềm theo dữ liệu đầu vào của người chơi. Các học giả về Sở hữu Trí tuệ vẫn đang tìm cách xử lý sản phẩm được tạo ra bởi một trí tuệ nhân tạo, ít nhất là 30 năm rồi".

Một trong những điểm kết nối giữa AI và luật bản quyền tập trung vào việc các hệ thống này được đào tạo như thế nào, đặc biệt là quá trình học máy. Hầu hết các hệ thống như vậy dựa vào số lượng lớn dữ liệu - hình ảnh, văn bản hoặc âm thanh - cho phép máy tính tìm kiếm các mẫu trong đó. Amanda Levendowski, giáo viên giảng dạy tại Trường Luật Đại học New York, lập luận trong nghiên cứu trên Washington Law Review: "Hệ thống AI được thiết kế tốt có thể tự động điều chỉnh phân tích mô hình theo dữ liệu mới. Đó là lý do tại sao các hệ thống này đặc biệt hữu ích cho các nhiệm vụ phụ thuộc vào những nguyên tắc khó giải thích, chẳng hạn như việc tổ chức các trạng từ trong tiếng Anh, hoặc khi viết mã chương trình đặc biệt phức tạp".

Tuy nhiên, vấn đề phát sinh khi các bộ dữ liệu sử dụng để đào tạo AI bao gồm các tác phẩm có bản quyền mà không có sự cho phép của chủ sở hữu bản quyền. Sobel giải thích: "Đây là hành vi xâm phạm bản quyền giả định trừ khi nó được cho phép bằng học thuyết sử dụng hợp lý". Đây chính là vấn đề mà Google đã gặp phải khi đưa ra sáng kiến Google Books vào năm 2005 và ngay lập tức bị khởi kiện vì vi phạm bản quyền.

Algorithmic Collaboration: Fractal Flame – Unrecoverable Discretionary Trust

Trong vụ kiện giữa tổ chức Authors Guild và Google, nguyên đơn cho rằng bằng cách số hóa và chú thích khoảng 20 triệu đầu sách, công ty tìm kiếm đã vi phạm bản quyền của Guild. Google phản đối bằng cách lập luận rằng hành động của họ đã được học thuyết sử dụng hợp lý bảo vệ. Vụ án được giải quyết vào năm ngoái khi Tòa án tối cao từ chối kháng cáo của Author Guild, để lại phán quyết cho tòa án cấp thấp hơn vốn nghiêng về phía Google. Sobel nói với IPW rằng: "Điều này thường xảy ra vì các mục đích sử dụng là những gì mà một số học giả gọi là không diễn tả được. Họ phân tích sự thật về các tác phẩm thay vì sử dụng các diễn đạt có bản quyền của tác giả".

Mọi thứ trở nên khó khăn hơn khi AI được đào tạo để tạo ra các tác phẩm biểu cảm, như cách Google đã đưa vào hệ thống của mình 11.000 cuốn tiểu thuyết lãng mạn để cải thiện giọng đàm thoại của AI. Sobel giải thích, điều đáng sợ là tác phẩm do AI tạo ra sẽ thay thế cho thị trường bản gốc. "Chúng tôi quan tâm đến cách các tác phẩm cụ thể được sử dụng, nó sẽ ảnh hưởng đến nhu cầu của tác phẩm đó như thế nào".

Synthetic Penmanship

"Không thể tưởng tượng được rằng chúng ta sẽ chứng kiến ​​sự gia tăng của công nghệ có thể đe dọa không chỉ tác phẩm cá nhân mà nó được đào tạo, mà còn, trong tương lai, có thể tạo ra những thứ đe dọa tác giả của những tác phẩm đó". Vì vậy, Sobel đã lập luận với IPW, "Nếu việc học máy biểu cảm đe doạ thay thế các tác giả là con người, thì có vẻ như không công bằng để đào tạo AI về các tác phẩm có bản quyền mà không bồi thường cho tác giả của những tác phẩm đó".

Đó là một phần của những gì mà Sobel gọi là "tình thế tiến thoái lưỡng nan của học thuyết sử dụng hợp lý". Một mặt, nếu việc sử dụng biểu cảm của học máy không được bảo vệ bởi học thuyết sử dụng hợp lý, bất kỳ tác giả nào có tác phẩm được sử dụng như là một phần của bộ dữ liệu huấn luyện sẽ có thể khởi kiện. Điều này sẽ tạo ra trở ngại lớn cho sự phát triển của công nghệ AI. Mặt khác, Sobel khẳng định với IPW, "một siêu AI sẽ có xu hướng thay thế con người trong các công việc sáng tạo, và điều đó có thể làm trầm trọng thêm bất bình đẳng thu nhập mà nhiều người lo sợ trong thời đại AI".

Algorithmic Collaboration: Fractal Flame – Magnified Reassignment

Những phân nhánh pháp lý có ý nghĩa khác hơn là lá chắn của người bị khởi kiện. Các quy tắc về bản quyền tác động đến AI. Nếu bạn không thể đào tạo AI bản quyền của bạn về các tài liệu có bản quyền, bạn phải tìm các tài liệu khác: như khu vực công cộng. Vấn đề với điều đó là nhiều tác phẩm trong đó - được viết trước những năm 1920 chủ yếu bởi các tác giả nam da trắng phương Tây - tự bản thân họ đã có thành kiến.

Một ví dụ là các email của Enron, được Ủy ban điều tiết năng lượng liên bang phát hành cho khu vực công cộng vào năm 2003. Bộ dữ liệu này chứa 1,6 triệu email và có nguy cơ pháp lý rất thấp khi sử dụng vì Enron và nhân viên cũ không còn sống để kiện bất kỳ ai. Tuy nhiên, tập dữ liệu thường chỉ được sử dụng để đào tạo các bộ lọc thư rác. Cụ thể là vì các email này chứa đầy những điều dối trá.

"Nếu bạn nghĩ có thể có những thành kiến ​​đáng kể trong các email gửi đến cho nhân viên của công ty dầu khí Texas, công ty đã sụp đổ dưới sự điều tra của liên bang về gian lận bắt nguồn từ nền văn hoá phi đạo đức có tổ chức, bạn đã đúng", Levendowski viết. "Các nhà nghiên cứu đã sử dụng email của Enron đặc biệt để phân tích thành kiến giới tính và quyền lực".

Ngay cả những nguồn gần đây như dữ liệu được chia sẻ bởi tổ chức Creative Commons (tài sản sáng tạo công cộng) không phải là không có chút thiên vị. Ví dụ, Wikipedia là một nguồn thông tin rất lớn, tất cả đều có thể được sử dụng lại vì được Creative Commons cấp phép, điều này làm cho nó trở thành một tập dữ liệu dồi dào cho việc học máy. Tuy nhiên, như Levendowski chỉ ra 91,5% biên tập viên của trang web này là nam giới, và điều này – dù có chủ ý hay không - có thể ảnh hưởng đến cách thức trình bày các thông tin liên quan đến phụ nữ và các vấn đề của phụ nữ. Và điều này có thể ảnh hưởng đến thuật toán đầu ra của AI.

Algorithmic Collaboration: Fractal Flame - Fair and Square

Tuy nhiên, giải pháp cho những vấn đề này là khá khó. Cũng giống như các vấn đề về sử dụng hợp lý trong trường hợp của DVRs hay khỉ mào đen Naruto, mỗi nền tảng mới cho thấy những xu hướng công nghệ độc đáo và những phân nhánh pháp lý phải chậm chạp luồn lách qua hệ thống tòa án để theo kịp những xu hướng mới.

Sobel có chỉ ra một số đề xuất. "Có lẽ sẽ không có bản quyền nào cả", ông nói, đó là trường hợp các bức ảnh tự sướng của Naruto. "Các đề xuất rộng hơn bao gồm việc cấp quyền cho máy tính, điều mà tôi nghĩ sẽ đòi hỏi cải cách sâu hơn để công nhận một thuật toán là một thực thể có quyền. Tôi cho rằng điều đó thật xa vời. Nhưng thật lòng mà nói, không có giải pháp tuyệt đối nào cả".

Hồ Ka

Theo Engadget

Trang gốc:
Công nghệ
Tiêu điểm tuần