財(cái)聯(lián)社7月6日訊(編輯 牛占林)近日,兩位美國(guó)作家對(duì)ChatGPT母公司OpenAI提起訴訟,聲稱OpenAI在沒有獲得版權(quán)授權(quán)的情況下,就利用他們的作品來訓(xùn)練其人工智能。
【資料圖】
起訴書中提到,美國(guó)馬薩諸塞州作家保羅·特倫布萊和莫娜·阿瓦德表示,ChatGPT未經(jīng)他們同意,直接復(fù)制了書籍的數(shù)據(jù)來進(jìn)行訓(xùn)練,這侵犯了作者的版權(quán)。
特倫布萊的作品有《世界盡頭的小屋》,阿瓦德的代表作為《看待胖女孩的13種方式》和《兔子》。
這兩位作家稱,ChatGPT寫出的書籍簡(jiǎn)要,和他們發(fā)表的文章一模一樣,這說明訓(xùn)練ChatGPT的數(shù)據(jù)庫,是包含了他們的作品的。
聊天機(jī)器人是在大量的文本數(shù)據(jù)上進(jìn)行訓(xùn)練的,OpenAI沒有透露訓(xùn)練ChatGPT具體使用了哪些數(shù)據(jù),但該公司表示,它通常會(huì)抓取網(wǎng)絡(luò)數(shù)據(jù),包括使用檔案圖書和維基百科等。
書籍是訓(xùn)練人工智能的理想選擇,因?yàn)樗鼈兺案哔|(zhì)量、精心編輯的長(zhǎng)篇文章”,儲(chǔ)存了人類思想的精華。
根據(jù)起訴書顯示,OpenAI的訓(xùn)練數(shù)據(jù)超過30萬本書,其中包括本就備受爭(zhēng)議、版權(quán)歸屬不明晰的“影子圖書館”。
但要證明ChatGPT是如何以及在哪里收集到這些信息的,以及這些作者是否遭受了經(jīng)濟(jì)損失,可能是一個(gè)挑戰(zhàn)。因?yàn)镃hatGPT也利用了大量的互聯(lián)網(wǎng)信息進(jìn)行訓(xùn)練,包括互聯(lián)網(wǎng)用戶對(duì)這些書的討論。
該訴訟代表美國(guó)全國(guó)范圍內(nèi)的版權(quán)所有者,尋求一筆數(shù)額不詳?shù)馁r償金。目前,OpenAI的代表沒有對(duì)此事進(jìn)行回應(yīng)。
薩塞克斯大學(xué)知識(shí)產(chǎn)權(quán)法專業(yè)的ndres Guadamuz表示,這是針對(duì)ChatGPT的第一起涉及版權(quán)的訴訟。他補(bǔ)充說,這起訴訟將探討生成式人工智能領(lǐng)域“合法性邊界”的問題。
而就在幾天之前,OpenAI在加利福尼亞州同樣被多方提起集體訴訟,起訴書稱OpenAI在未經(jīng)允許的前提下,在互聯(lián)網(wǎng)上竊取和挪用了大量私人數(shù)據(jù)來訓(xùn)練ChatGPT。