国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

《權(quán)力的游戲》作者起訴ChatGPT侵權(quán)的AI訓(xùn)練版權(quán)授權(quán)問題

0
分享至

據(jù)媒體報(bào)道[i],近日美國作家協(xié)會(huì)攜包括《冰與火之歌:權(quán)力的游戲》的作者喬治馬丁在內(nèi)的17名作家在美國紐約南區(qū)法院對(duì)人工智能公司OpenAI發(fā)起集體訴訟,指控后者未經(jīng)許可使用了受版權(quán)保護(hù)的作品訓(xùn)練人工智能模型。作為律師,筆者對(duì)原告如何證明OpenAI用《冰與火之歌:權(quán)力的游戲》訓(xùn)練ChatGPT很感興趣,就查閱了美國作家協(xié)會(huì)網(wǎng)站上的起訴狀,本文會(huì)結(jié)合著作權(quán)法律跟大家聊聊這個(gè)事情。

眾所周知,人工智能服務(wù)的解答能力要強(qiáng),高質(zhì)量的訓(xùn)練數(shù)據(jù)必不可少,但世界上多數(shù)國家的著作權(quán)法都要求人工智能開發(fā)者使用他人享有著作權(quán)的內(nèi)容進(jìn)行訓(xùn)練前,應(yīng)當(dāng)取得著作權(quán)人的許可。而人工智能開發(fā)者出于種種考慮(比如避免繁瑣冗長(zhǎng)的授權(quán)商務(wù)談判、開發(fā)時(shí)限要求他們只爭(zhēng)朝夕、減少版權(quán)成本等種種考慮、部分著作權(quán)人授權(quán)拿不到哪怕給錢也不愿意給他們授權(quán)),直接在人工智能開發(fā)時(shí)使用了盜版內(nèi)容作為訓(xùn)練數(shù)據(jù)。

但對(duì)于這種做法,因?yàn)榇竽P偷挠?xùn)練數(shù)據(jù)是不公開的,訓(xùn)練過程也是黑箱操作,著作權(quán)人即使知道存在侵權(quán)也很難舉證,美國現(xiàn)在既然有訴訟,下面我們就看看美國律師是怎么證明的。

一、被告自認(rèn)(其實(shí)是ChatGPT自認(rèn))

訴狀稱,OpenAI為了訓(xùn)練其大型語言模型,在未征得作者同意的情況下復(fù)制了由原告撰寫的受版權(quán)保護(hù)的書籍,并且OpenAI已公開承認(rèn)了。因?yàn)樵娴穆蓭熛駽hatGPT提問,然后聊天機(jī)器人回應(yīng)稱:

用于訓(xùn)練我的一些書籍可能是受版權(quán)保護(hù)的。不過,我的訓(xùn)練數(shù)據(jù)來自互聯(lián)網(wǎng)上的各種公開來源,我的訓(xùn)練數(shù)據(jù)集中包含的一些書籍很可能沒有被授權(quán)使用....如果我的訓(xùn)練數(shù)據(jù)中包含了任何受版權(quán)保護(hù)的資料,那么這些資料的使用是在版權(quán)持有者不知情或未征得版權(quán)持有者同意的情況下進(jìn)行的。

同時(shí),原告律師發(fā)現(xiàn),直到最近,ChatGPT還能準(zhǔn)確無誤地返回受版權(quán)保護(hù)的書籍中的文字原文,這表明底層大型語言模型在訓(xùn)練過程中一定完整地錄入了這些書籍。雖然最近ChatGPT對(duì)此進(jìn)行了修改,會(huì)以"我無法提供版權(quán)文本的逐字摘錄"來回應(yīng)此類提示。從時(shí)間上看,ChatGP對(duì)輸出規(guī)則的這一明顯修改很可能是因?yàn)樵孀骷覅f(xié)會(huì)給OpenAI和其他公司發(fā)了公開信。

筆者認(rèn)為,雖然ChatGPT自認(rèn)其訓(xùn)練素材可能沒有授權(quán),但鑒于人工智能經(jīng)常在回復(fù)里沒有依據(jù)的胡說八道(ChatGPT曾說筆者這個(gè)知識(shí)產(chǎn)權(quán)律師是刑事律師,最近處理過一起很有名的強(qiáng)奸案,明顯在胡編,沒有任何依據(jù)),這段回復(fù)要有其他證據(jù)佐證才能被法院認(rèn)定為案件的事實(shí)。

二、訓(xùn)練素材包來自知名盜版網(wǎng)站

訴狀稱:ChatGPT現(xiàn)在提供的不是逐字摘錄,而是受版權(quán)保護(hù)的書籍的摘要,其中通常包含評(píng)論和其他公開資料中沒有的細(xì)節(jié)——這再次表明,基礎(chǔ)大型語言模型在訓(xùn)練期間必須錄入整本書。但OpenAI對(duì)于從何處以及如何獲得原告受版權(quán)保護(hù)的作品,始終語焉不詳。OpenAI承認(rèn),它用來訓(xùn)練模型的訓(xùn)練數(shù)據(jù)集包括"Common Crawl"和兩個(gè)高質(zhì)量的基于互聯(lián)網(wǎng)的書籍語料庫,它稱之為"Booksl"和 "Books2.T2"。

CommonCrawl是一個(gè)龐大且不斷增長(zhǎng)的語料庫,包含從數(shù)十億網(wǎng)頁中抓取的"原始網(wǎng)頁數(shù)據(jù)、元數(shù)據(jù)提取和文本提取"。它被廣泛用于訓(xùn)練大型語言模型,除OpenAI的GPT外,還被用于訓(xùn)練臉書和谷歌的人工智能引擎。眾所周知,它包含從盜版網(wǎng)站復(fù)制的書籍文本(鏈接到 Z-Library——一個(gè)擁有 1,100多萬冊(cè)圖書的大型盜版圖書庫出現(xiàn)在Common Crawl語料庫中,并被納入其他大型語言模型的訓(xùn)練數(shù)據(jù)集)。

OpenAI拒絕討論Books2數(shù)據(jù)集的來源。但一些獨(dú)立的Al研究人員懷疑 Books2 包含或由從大型盜版圖書庫下載的電子書文件組成,如Library Genesis或 "LibGen","它提供了一個(gè)龐大的盜版文本庫:LibGen 作為一個(gè)臭名昭著的版權(quán)侵權(quán)者已為法院所熟知。而Books2的其他可能來源包括Z-Library和 Bibliotik 等盜版種子跟蹤器,這些跟蹤器允許用戶批量下載電子書。

原告律師無法證明Books2的數(shù)據(jù)來源,所以舉了著名包含大量盜版內(nèi)容的訓(xùn)練素材庫"Books3"作為類比證據(jù)(《連線》雜志報(bào)道過,臉書和彭博社的大型語言模型使用了"Books3"的素材庫[ii]):已披露的 Books2 數(shù)據(jù)集的規(guī)模表明,該數(shù)據(jù)集包含10萬多本書。Books2和Books3的大小相似,而且互聯(lián)網(wǎng)上允許批量下載電子書的盜版存儲(chǔ)庫寥寥無幾,這有力地表明Books2中的書籍也是從上文討論過的臭名昭著的存儲(chǔ)庫中獲取的。

如果這個(gè)訴訟是在中國進(jìn)行的,如果原告初步證明了被告的訓(xùn)練素材存在盜版,此時(shí),舉證責(zé)任就在被告,被告要證明其訓(xùn)練素材不存在盜版,否則法院就會(huì)支持原告的證明內(nèi)容。

三、喬治馬丁如何證明OpenAI用其作品訓(xùn)練了ChatGPT?

訴狀稱,喬治馬丁是包括《權(quán)力的游戲》在內(nèi)的十五部小說作品的著作權(quán)人,OpenAI在未經(jīng)許可的情況下錄入并復(fù)制了喬治馬丁的全部或多部作品,并將其用于訓(xùn)練OpenAI的大型語言模型。訴狀中舉了兩個(gè)第三方新聞的例子:

1、2023 年 7 月,一個(gè)叫LiamSwayne的程序員[iii]使用 ChatGPT 生成了《凜冬的寒風(fēng)》、《春曉的夢(mèng)想》的版本,這兩本書是馬丁正在創(chuàng)作的《冰與火之歌》系列的最后兩部作品。

2、美國加州大學(xué)伯克利分校的研究人員對(duì)ChatGPT對(duì)作品的"記憶"程度進(jìn)行了一項(xiàng)實(shí)驗(yàn)[iv],發(fā)現(xiàn)馬丁的小說《權(quán)力的游戲》在"記憶"程度方面排名第12位。

然后,原告律師使用ChatGPT進(jìn)行測(cè)試,輸入提示后,ChatGPT 準(zhǔn)確生成了幾部馬丁作品的摘要,包括冰與火之歌》系列的前三部《權(quán)力的游戲》、《列王的紛爭(zhēng)》、《冰雨的風(fēng)暴》以及《末日審判布條》最后一章的準(zhǔn)確摘要。

原告律師輸入提示后,ChatGPT還為馬丁作品《列王的紛爭(zhēng)》的另一部續(xù)集生成了一份詳細(xì)大綱,并將該衍生作品命名為"A Dance With Shadows",其中使用了馬丁《冰與火之歌》系列現(xiàn)有書籍中的相同角色。ChatGPT還生成了一份《權(quán)力的游戲前傳》的詳細(xì)大綱,并將該衍生作品命名為"A Dawn of Direwolves",其中使用了與《冰與火之歌》系列叢書中相同的人物。

訴狀總結(jié):如果OpenAI大型語言模型沒有攝取馬丁侵權(quán)作品并對(duì)其進(jìn)行訓(xùn)練,ChatGPT 就不可能產(chǎn)生上述結(jié)果。筆者認(rèn)為,如果訴訟在中國法院進(jìn)行,馬丁的律師已經(jīng)證明了ChatGPT使用了馬丁的作品進(jìn)行訓(xùn)練,并且其服務(wù)器目前仍然留存著馬丁作品的復(fù)制件。

四、人工智能訓(xùn)練可以不用獲得著作權(quán)人的授權(quán)嗎?

法律原理上,讓人工智能學(xué)習(xí)網(wǎng)上內(nèi)容的過程是一個(gè)復(fù)制行為或者臨時(shí)復(fù)制行為,人工智能公司要先將網(wǎng)上的或者線下獲得的內(nèi)容爬取,然后輸入到人工智能程序中,無論這個(gè)內(nèi)容是文字、圖片、音頻、視頻還是程序,復(fù)制行為都應(yīng)當(dāng)獲得相應(yīng)權(quán)利人許可,否則就涉嫌侵權(quán)。

實(shí)際上我國法律法規(guī)也是這么規(guī)定的,根據(jù)我國《著作權(quán)法》和七部門聯(lián)合發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》,我國的生成式人工智能服務(wù)提供者(以下稱提供者)開展預(yù)訓(xùn)練、優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動(dòng)時(shí),不得侵害他人依法享有的知識(shí)產(chǎn)權(quán),也就是說,訓(xùn)練素材需要取得著作權(quán)人的許可。在美國,如前文所述,訓(xùn)練人工智能的版權(quán)素材需要著作權(quán)人授權(quán)。

但對(duì)這個(gè)問題,也有國家的規(guī)定不太一樣,比如根據(jù)日本著作權(quán)法第30條第4款,用版權(quán)內(nèi)容訓(xùn)練人工智能屬于合理使用:如果不以欣賞作品中表達(dá)的思想或情感為目的,且沒有不合理的損害著作人權(quán)人權(quán)益的,可以合理使用他人享有著作權(quán)的作品。

筆者覺得,雖然日本的規(guī)定立法目的可能是為了振興該國的人工智能產(chǎn)業(yè),但其實(shí)也是一個(gè)思路,因?yàn)槿斯ぶ悄苌傻膬?nèi)容不受著作權(quán)法保護(hù),那其創(chuàng)造的內(nèi)容就是全民共有的,那把所有的版權(quán)作品都讓其學(xué)習(xí)一下,成果出來了大家都不需要授權(quán)就可以用,這個(gè)說不定也挺好。

本文作者:游云庭,上海大邦律師事務(wù)所高級(jí)合伙人,知識(shí)產(chǎn)權(quán)律師。電話:8621-52134900,Email: yytbest@gmail.com,本文僅代表作者觀點(diǎn)。

[i] https://finance.eastmoney.com/a/202309212853452095.html

[ii] https://www.wired.com/story/battle-over-books3/

[iii] https://game.sohu.com/a/704547146_114760

[iv] https://hub.baai.ac.cn/view/26572

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美司令已有預(yù)感,中美一旦開戰(zhàn),擺在美軍面前只有兩個(gè)選擇

美司令已有預(yù)感,中美一旦開戰(zhàn),擺在美軍面前只有兩個(gè)選擇

混沌錄
2026-03-12 19:40:12
以牙還牙,中國打響反制第一槍,一舉切斷美歐命脈,美歐坐立難安

以牙還牙,中國打響反制第一槍,一舉切斷美歐命脈,美歐坐立難安

凡知
2026-04-24 17:49:57
張柏芝大兒子終于“長(zhǎng)開”了!穿西裝比謝霆鋒還帥,網(wǎng)友:像爺爺

張柏芝大兒子終于“長(zhǎng)開”了!穿西裝比謝霆鋒還帥,網(wǎng)友:像爺爺

木子愛娛樂大號(hào)
2026-01-07 21:47:13
天生領(lǐng)袖!東契奇受傷后,詹姆斯在隊(duì)內(nèi)說:跟著我,我們能贏球!

天生領(lǐng)袖!東契奇受傷后,詹姆斯在隊(duì)內(nèi)說:跟著我,我們能贏球!

愛體育
2026-04-23 22:37:50
廈門一乘客酒后打車,支付了77276元車費(fèi),司機(jī)懵了,追著乘客退錢:不是自己的錢,一分也不能要

廈門一乘客酒后打車,支付了77276元車費(fèi),司機(jī)懵了,追著乘客退錢:不是自己的錢,一分也不能要

環(huán)球網(wǎng)資訊
2026-04-24 17:23:08
92年,錢學(xué)森向國家建議:汽車工業(yè)跳過汽油柴油,直接進(jìn)入新能源

92年,錢學(xué)森向國家建議:汽車工業(yè)跳過汽油柴油,直接進(jìn)入新能源

文史達(dá)觀
2024-07-25 17:55:10
一場(chǎng)96-113的慘敗,讓掘金腸子悔青,雷霆也失算了,馬刺看到希望

一場(chǎng)96-113的慘敗,讓掘金腸子悔青,雷霆也失算了,馬刺看到希望

毒舌NBA
2026-04-24 12:47:04
楊毅季后賽前曝猛料:北京外援集體罷吃早餐 麥基帶頭引眾怒?

楊毅季后賽前曝猛料:北京外援集體罷吃早餐 麥基帶頭引眾怒?

你看球呢
2026-04-24 10:45:24
扮豬吃虎?忍耐四個(gè)月,委代總統(tǒng)撕破偽裝,率幾十萬大軍硬剛美國

扮豬吃虎?忍耐四個(gè)月,委代總統(tǒng)撕破偽裝,率幾十萬大軍硬剛美國

白色得季節(jié)
2026-04-24 20:28:20
CBA宣布離譜決定

CBA宣布離譜決定

宗介說體育
2026-04-24 09:57:42
實(shí)測(cè)DeepSeek V4,為國產(chǎn)化而生。

實(shí)測(cè)DeepSeek V4,為國產(chǎn)化而生。

數(shù)字生命卡茲克
2026-04-24 15:00:19
3艘俄軍艦被炸沉!局勢(shì)觸及核紅線,美方:俄羅斯或動(dòng)用核武器!

3艘俄軍艦被炸沉!局勢(shì)觸及核紅線,美方:俄羅斯或動(dòng)用核武器!

健身狂人
2026-04-23 15:46:53
大數(shù)據(jù)分析,在中國,找個(gè)身高1米7年入20萬的老公,到底有多難?

大數(shù)據(jù)分析,在中國,找個(gè)身高1米7年入20萬的老公,到底有多難?

深度報(bào)
2026-04-18 23:37:27
為什么腦梗逐年增多?提醒:與肥肉無關(guān),有一樣?xùn)|西要少碰

為什么腦梗逐年增多?提醒:與肥肉無關(guān),有一樣?xùn)|西要少碰

芹姐說生活
2026-04-19 08:33:41
五一前后,貴人主動(dòng)伸出援手,事業(yè)迎來轉(zhuǎn)機(jī)的三個(gè)星座

五一前后,貴人主動(dòng)伸出援手,事業(yè)迎來轉(zhuǎn)機(jī)的三個(gè)星座

小晴星座說
2026-04-24 19:08:23
DeepSeek V4 Pro殺回開源榜第3,閉源模型優(yōu)勢(shì)窗口正在崩塌

DeepSeek V4 Pro殺回開源榜第3,閉源模型優(yōu)勢(shì)窗口正在崩塌

六子吃涼粉
2026-04-24 14:19:00
墨菲13-3橫掃肖國棟:一場(chǎng)提前終結(jié)的比賽

墨菲13-3橫掃肖國棟:一場(chǎng)提前終結(jié)的比賽

賽場(chǎng)速報(bào)局
2026-04-24 20:46:00
拜合拉木談安東尼奧:沒有他選我進(jìn)國青,可能我還在內(nèi)蒙踢

拜合拉木談安東尼奧:沒有他選我進(jìn)國青,可能我還在內(nèi)蒙踢

懂球帝
2026-04-23 23:24:51
湯姆斯杯小組賽:中國隊(duì)僅輸1局,5-0碾壓澳大利亞,迎開門紅

湯姆斯杯小組賽:中國隊(duì)僅輸1局,5-0碾壓澳大利亞,迎開門紅

側(cè)身凌空斬
2026-04-24 19:15:54
火箭0-2湖人,還能逆轉(zhuǎn)嗎?蘇群8個(gè)字回應(yīng),楊毅:詹姆斯可能放水

火箭0-2湖人,還能逆轉(zhuǎn)嗎?蘇群8個(gè)字回應(yīng),楊毅:詹姆斯可能放水

八斗小先生
2026-04-24 18:34:08
2026-04-24 21:20:49
游云庭律師 incentive-icons
游云庭律師
互聯(lián)網(wǎng)法律評(píng)論
157文章數(shù) 189關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價(jià)格依然"屠夫級(jí)"

頭條要聞

男子撫養(yǎng)14年兒子非親生 妻子結(jié)婚擺酒前跟別人在一起

頭條要聞

男子撫養(yǎng)14年兒子非親生 妻子結(jié)婚擺酒前跟別人在一起

體育要聞

里程碑之戰(zhàn)拖后腿,哈登18分8失誤

娛樂要聞

停工16個(gè)月!趙露思證實(shí)接拍新劇

財(cái)經(jīng)要聞

LG財(cái)閥內(nèi)斗:百億美元商業(yè)帝國爭(zhēng)奪戰(zhàn)

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態(tài)度原創(chuàng)

旅游
藝術(shù)
房產(chǎn)
本地
公開課

旅游要聞

視點(diǎn)|泡泡瑪特城市樂園煥新升級(jí),新地圖解鎖更多歡樂!

藝術(shù)要聞

2025最繪畫--第四屆中國青年油畫作品展 | 油畫選刊(三)

房產(chǎn)要聞

新一輪教育大爆發(fā)來了!海口,開始瘋狂建學(xué)校!

本地新聞

云游中國|逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版