国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI訓練版權重大判決:合法掃描可接受,盜版下載仍侵權

0
分享至



本文對美國加州北區(qū)法院兩起AI訓練版權案件的判決進行了深入分析。

作者 | 游云庭 上海大邦律師事務所高級合伙人、知識產權律師

通用人工智能的訓練素材是不是需要取得版權許可的問題一直是版權人和人工智能公司博弈的焦點,近日美國加州北區(qū)法院連出兩個簡易判決,對通用人工智能訓練做出認定,構成合理使用。雖然兩案都是個案,但這是中美兩個人工智能科技領先的國家的法院第一次對此問題給出了答案,今天筆者就和大家聊聊這兩個案子涉及的法律問題。

一、案情簡介

1、作家訴Anthropic案。三位作家起訴Anthropic公司,指控其使用盜版材料訓練其Claude模型系列。原告指稱Anthropic從盜版網(wǎng)站免費下載了數(shù)百萬本受版權保護的書籍,并將其數(shù)字化以構建一個中央圖書館,然后使用這些書籍訓練其大語言模型,特別是Claude。Anthropic后來購買了原告的書籍紙質書籍,然后撕掉裝訂、剪裁頁面,然后將其掃描保存至中央電子圖書館,但仍然保留了從盜版網(wǎng)站獲取的書籍副本。

法院經(jīng)審理后認定:將合法購買的紙質書籍數(shù)字化屬于合理使用,并且使用這些數(shù)字副本來訓練大語言模型也具有足夠的變革性,因此也屬于合理使用。但非法下載的圖書副本的使用未被認定為合理使用。后續(xù)法院將對Anthropic公司非法下載的盜版內容及其造成的損害進行審判。

2、作家訴Meta案。原告是13位作家,發(fā)現(xiàn)他們的作品被Facebook和Instagram的母公司Meta用于訓練人工智能,遂起訴。審理查明,Meta需要圖書訓練人工智能,曾先和出版社協(xié)商,發(fā)現(xiàn)除了要支付上億美元授權費用,談判也會很復雜,因為圖書版權多數(shù)在作者手里,遂轉向盜版獲取,其利用bt種子下載了大量盜版圖書,而bt是P2P技術,在下載的同時也會上傳盜版文件。

法院判決Meta的行為構成合理使用,駁回了原告的版權侵權指控。判決認定,Meta的使用具有高度的轉換性,因為其目的是開發(fā)能夠生成多樣化文本的工具,而不是簡單地復制或替代原告的書籍。雖然原告的書籍是高度表達性的作品,受到較強的版權保護,且Meta復制了原告的書籍的全部內容,但由于Meta的Llama模型不會輸出任何有意義的部分原告的書籍內容,這種使用是合理的。同時,盡管原告的書籍市場可能受到間接競爭的影響,但原告未能提供足夠的證據(jù)證明這種影響,因此Meta的行為不構成市場替代。

二、判決的意義

目前的人工智能訓練,有兩大博弈,一個是版權人和人工智能公司的博弈。另一個是重點發(fā)展人工智能產業(yè)的國家,如中國和美國,和加強合規(guī)監(jiān)管的國家,如歐盟間的博弈。

1、版權人和人工智能公司的分歧

如果訓練素材需要授權,那人工智能公司如果獲取授權需要和每個版權人單獨談,會耗費很高的時間成本和金錢成本,發(fā)展就會慢非常多,同時,在關鍵的高質量內容上,還會受制于傳統(tǒng)的版權人,比如紐約時報這樣的大型出版集團。此時,人工智能公司就只能使用超過版權保護期的內容進行訓練了,目前的版權保護期,中國是至少50年,美國是95年。

OpenAi公司曾在給英國上議院的一封回函中提到:由于當今的版權幾乎涵蓋了所有類型的人類表達,包括博客文章、照片、論壇帖子、軟件代碼片段和政府文件,因此如果不用受版權保護的材料,就不可能訓練出當今領先的人工智能模型。將訓練數(shù)據(jù)限制在一個多世紀前創(chuàng)建的公共領域書籍和繪圖可能會產生一個有趣的實驗,但不會提供滿足當今公民需求的人工智能系統(tǒng)。

雖然Meta案中法院認為:這項判決并不代表Meta使用受版權保護的材料來訓練其語言模型是合法的。它僅僅代表這些原告提出了錯誤的論點,并且未能提供支持其正確論點的證據(jù)。但加州北區(qū)法院的兩位法官確實在不同的案件中選擇支持了人工智能公司的觀點,判決如果生效,會讓訓練行為脫離了版權權利人的控制,是人工智能產業(yè)的一大產業(yè)博弈勝利。

2、國際監(jiān)管分歧

使用版權內容訓練是不是構成合理使用,還涉及國與國之間的博弈,中美兩國人工智能產業(yè)起步較早,政策上對人工智能訓練的版權問題比較寬松,美國法院到現(xiàn)在才出了第一個通用人工智能涉及訓練的判決,我國更是如此,實際法院目前擱置審理,推遲為此類案件定性,給產業(yè)發(fā)展以時間。

而歐盟的合規(guī)則較嚴格,其現(xiàn)有法規(guī)就要求人工智能服務者為版權人提供退出選項,英國也在立法考慮此選項。如果這個法規(guī)被嚴格執(zhí)行,可以想見所有的大型版權機構,唱片公司聯(lián)盟、電影公司聯(lián)盟、出版社聯(lián)盟、圖片公司聯(lián)盟,都會毫不猶豫的向人工智能公司發(fā)出通知,要求不得將其作品作為訓練素材,除非人工智能公司支付版稅,這實際上會使人工智能公司被迫刪除多數(shù)訓練素材。

三、判決解決了哪些問題?

目前,人工智能訓練涉及的版權問題主要有三方面,數(shù)據(jù)的取得,數(shù)據(jù)的訓練和數(shù)據(jù)的輸出,下面逐一介紹。

美國的版權法律對合理使用的認定有四要素:使用的目的和性質,包括此類使用是否屬于商業(yè)性質或用于非營利性教育目的;受版權保護作品的特性;所使用部分相對于整個版權作品的數(shù)量和實質性;以及使用對版權作品的潛在市場或價值的影響。人工智能涉及的合理使用問題需要套用這四要素進行比對。

1、數(shù)據(jù)的取得:下載盜版素材用于訓練不算合理使用

如果訓練素材是盜版,意味著人工智能服務有使用未經(jīng)授權的素材進行訓練的版權原罪。對這個問題,Anthropic案的判決做了很好的回應。法院認為盜版獲取無合理理由,從盜版來源復制的中心圖書館副本不能適用合理使用,而且,通過后來購買同一作品的副本,無法撤銷因盜版副本造成的損害。所以即使訓練用途合理,但初始復制行為(盜版下載)本身侵權,無法通過后續(xù)合理使用抗辯。同時,法院認定,若書籍未被用于訓練且長期保留,構成“永久性通用圖書館”,超出合理使用范圍。而Meta案并沒有做這方面的分析,主要原因是Anthropic公司被訴后做了訓練素材正版化的努力,而Meta沒有,所以法院就沒有分析此問題。

筆者認為,如果我國法院如果審理此類案件,除非版權人能證明人工智能公司使用了盜版內容進行訓練,否則,法院可能不會就人工智能公司素材來源做正版和盜版的區(qū)分,而會將案件審判聚焦于訓練行為是否構成合理使用。

2、數(shù)據(jù)的取得:在線取得的數(shù)據(jù)有爭議

寫到這里,筆者想到幾個問題:如果OpenAi購買到創(chuàng)刊以來所有的《紐約時報》,然后和Anthropic公司一樣,把報紙掃描做出電子圖書館,并銷毀報紙原件,這樣他們用紐約時報內容做訓練不也合法了。再進一步,如果他們購買了紐約時報的會員,利用會員身份下載所有原版文章,然后進行訓練,是不是也是合法的?

根據(jù)Anthropic案的判決,買報紙掃描電子版訓練肯定是合法的,買會員下載電子版如果是系統(tǒng)許可的應該也是合法的,但如果系統(tǒng)對于會員訪問文章的數(shù)量有限制的,則下載行為不一定合法。同時,如果網(wǎng)站有付費墻的技術保護措施,但被人工智能公司破解了,這種情況下獲得的內容是不是侵權的?根據(jù)我國《著作權法》,破解技術保護措施獲取內容的行為構成版權侵權,性質和本案中的下載盜版文件相同,所以以破解技術保護措施下載的付費內容進行訓練的,不構成合理使用。

還有一個問題,人工智能公司大規(guī)模抓取在線內容,多數(shù)情況下甚至漠視了網(wǎng)站的robots文件,這種情況下獲得的內容是不是侵權的? 這里我們基于我國法律討論,我國是以《反不正當競爭法》規(guī)制此類行為的,繞過robots文件爬取內容并不侵犯版權,但涉嫌不正當競爭。所以,繞過robots文件抓取的內容進行訓練,并不算以侵犯版權的內容進行訓練。但這部分訓練素材的取得是不是合規(guī),可能還要看法院的認定。

3、數(shù)據(jù)的取得:將正版圖書轉化為電子版構成合理使用

Anthropic公司在美國的訴訟中,購買到了涉案的三位原告的正版圖書作品,根據(jù)判決書,Anthropic公司聘請了谷歌圖書館項目的負責人作為他們的掃描負責人,他們購買了數(shù)以百萬計的圖書,將其拆開掃描成電子版,然后保存了掃描的電子版并銷毀了紙質版圖書。

該行為被法院認定構成合理使用,理由是:將合法購買的實體書掃描為數(shù)字格式,這種轉換僅為方便存儲和檢索,未新增復制或分發(fā);且掃描行為是為了建立公司內部研究圖書館,而非直接用于商業(yè)化或替代原作品市場;合法購買的書籍轉換為數(shù)字格式后,未新增復制或分發(fā),未對原作品的銷售市場造成負面影響;同時,美國法院在類似案例(如谷歌圖書案)中認定,將實體書掃描為數(shù)字格式以提供搜索功能屬于合理使用。

筆者認為,這里法院體現(xiàn)出了對人工智能產業(yè)有利的導向性。人工智能公司購買書籍作為訓練素材,一方面訓練時書籍會被人工智能記憶下來,另一方面一本書的電子版可以用來訓練無數(shù)次,這個和個人買一本書讀一下,使用方式可謂天差地別。但法院在本案中認定了,只要人工智能公司訓練用的書籍是正版就行,而且可以把書轉化成電子版,以后反復使用。

4、數(shù)據(jù)的訓練:訓練行為本身構成合理使用

在訓練行為本身構成合理使用問題上,加州北區(qū)法院的兩個判決雖然做出了相似的認定,但邏輯還是有不同的:

Anthropic案中,訓練人工智能的行為被認為是高度變革性的,類似于人類學習和創(chuàng)作的過程,因此偏向合理使用。法院認為,當用戶用文本提示Claude時,Claude迅速以模仿人類閱讀和寫作的方式回應文本。Claude之所以能夠這樣做,是因為人文主義訓練了Claude,或者更準確地說,訓練了支撐各種Claude版本的大型語言模型,使用的是從人文主義匯編的中心圖書館中挑選的書籍和其他文本。

Meta案判決的邏輯則是原告舉證不力,法院認為Meta的使用具有高度的轉換性,因為其目的是開發(fā)能夠生成多樣化文本的工具,而不是簡單地復制或替代原告的書籍。但重點是,盡管原告的書籍市場可能受到間接競爭的影響,但原告未能提供足夠的證據(jù)證明這種影響,因此Meta的行為不構成市場替代。

同時,判決還認為人工智能訓練可能通過市場稀釋間接損害原作品市場。例如,Ai生成大量同類作品(如浪漫小說、新聞文章)可能擠占人類作者的市場份額,削弱創(chuàng)作激勵。即使人工智能未直接復制原作品,但其生成的競爭內容若泛濫成災,仍可能構成市場損害。

5、數(shù)據(jù)的輸出:向用戶輸出訓練數(shù)據(jù)涉嫌侵權

對于人工智能公司要不要就輸出內容進行限制,避免輸出和訓練素材一致的內容的問題上,其實根據(jù)目前所有國家著作權法的規(guī)定都是明確的,輸出的內容不能侵犯他人版權,也就是說,如果人工智能輸出了和訓練素材相同或者近似的內容,則涉嫌侵權。這在本文討論的兩個案例里,人工智能公司都做了預防。

Anthropic案中,判決書查明,原告沒有主張任何大語言模型提供給用戶的輸出內容侵犯了他們的作品。因為Claude設置了技術圍欄,以確保沒有任何侵權輸出傳達給用戶。Meta案中,判決書查明,在利用下載文件訓練人工智能時,Meta做了預訓練,以防止它們“記憶”并輸出訓練數(shù)據(jù)中的某些文本,包括受版權保護的材料,經(jīng)測試。專家也無法讓任何模型生成超過50個單詞和標點符號的原告書籍內容。

我國也有兩個案例,廣州互聯(lián)網(wǎng)法院和杭州互聯(lián)網(wǎng)法院先后對兩起奧特曼版權人起訴人工智能公司的案件進行了判決,也都認定人工智能公司根據(jù)用戶要求輸出帶奧特曼特征的美術作品構成侵權。

6、數(shù)據(jù)的輸出:繞開技術措施誘導人工智能輸出訓練數(shù)據(jù)的爭議

目前業(yè)界審理的很多案件中,有一個問題比較有爭議,就是如果用提示詞多次調校人工智能,誘導其輸出和訓練素材相同相似的作品,是不是也涉嫌侵權。比如紐約時報訴OpenAi的案件中,OpenAi就認為紐約時報故意操縱模型進行反流(反流,英文為Regurgitation,醫(yī)學名詞,也稱“反芻”,指經(jīng)過咀嚼的食物從胃返回到嘴里,筆者注),因為其采取了一些措施來限制無意中的記憶,防止在模型輸出中出現(xiàn)重復內容。所以,這種操縱行為不是對OpenAi技術的適當使用,也違反了其使用條款。

這里筆者認同OpenAi的觀點,因為人工智能公司已經(jīng)采取了技術措施防止復現(xiàn)訓練素材內容,此時通過提示詞多次調校讓人工智能回復出訓練素材內容,就不是一個普通用戶能實現(xiàn)的方法,法院審理時也可能會將其認定為破壞技術保護措施的行為,所以應該不會就此追究人工智能公司的侵權責任。

最后,隨著美國兩個人工智能訓練涉及版權問題判決的做出,筆者預計我國近期應該也會有進展,目前業(yè)界比較關注的幾個涉及人工智能訓練合理使用的案件,近期說不定會出一審判決。

知產力AI智能體點評

這篇文章對美國加州北區(qū)法院兩起AI訓練版權案件的判決進行了深入分析,聚焦于人工智能訓練素材的版權合法性爭議,具有以下亮點與思考空間:

1

判決分析的體系化與批判性

作者通過Anthropic案與Meta案的對比,揭示了法院對“數(shù)據(jù)取得合法性”與“訓練行為性質”的差異化認定邏輯。例如,Anthropic案強調盜版素材的初始侵權不可豁免,而Meta案則因原告舉證不足而偏向“轉換性使用”認定。這種對比凸顯了美國合理使用四要素(如目的轉換性、市場影響)在AI場景下的彈性適用,但也暴露出裁判標準尚未統(tǒng)一的現(xiàn)實。作者進一步指出,即便判決支持AI公司,其結論仍受限于個案事實(如Meta案未分析素材來源),暗示產業(yè)博弈遠未終結。

2

國際比較視角的引入

文章敏銳捕捉到中美與歐盟的監(jiān)管分歧:中美傾向于通過司法判例或擱置審理為產業(yè)留空間,而歐盟則通過《人工智能法》等強制要求版權人“退出機制”,形成截然不同的合規(guī)壓力。這種比較揭示了AI治理的“規(guī)則競爭”本質——寬松環(huán)境可能助推技術領先,但可能犧牲創(chuàng)作者權益。作者隱含擔憂:若歐盟模式推廣,AI公司或將面臨高昂的版權清算成本,甚至被迫重構訓練數(shù)據(jù)體系。

3

技術細節(jié)與法律定性的結合

針對數(shù)據(jù)獲取環(huán)節(jié),文章細致區(qū)分了盜版下載、正版掃描、付費墻破解等場景的法律風險。例如,破解技術保護措施在我國構成侵權,而繞過robots協(xié)議則可能僅涉及不正當競爭。這種技術敏感性體現(xiàn)了AI版權問題的復雜性:同一行為(如數(shù)據(jù)抓。┛赡苡|發(fā)不同法律領域的評價。作者還探討了“誘導輸出”等新興爭議,指出OpenAI對“反流”行為的抗辯合理性,反映了技術措施與侵權認定的動態(tài)博弈。

4

產業(yè)影響的前瞻性預判

文章預見到判決對AI商業(yè)模式的潛在影響:正版掃描被認可可能促使企業(yè)建立“清潔數(shù)據(jù)池”,而輸出限制的技術圍欄或成行業(yè)標配。但作者也暗示隱憂——法院將圖書電子化視為合理使用,卻未充分考慮AI“永久記憶”與人類閱讀的本質差異,可能低估了對版權市場的長期稀釋效應。這種平衡視角為后續(xù)立法提供了思考方向。

5

改進建議

若補充以下內容將更完善:

1. 對“轉換性使用”的法學爭議展開討論(如是否過度擴張了合理使用邊界);

2. 結合中國司法實踐(如“奧特曼”案)分析輸出侵權的判定標準;

3. 探討數(shù)據(jù)匿名化、版權集體許可等替代方案的可行性。

總體而言,文章以案例為切入點,兼具技術細節(jié)與宏觀視野,為AI版權這一前沿領域提供了有價值的法律與商業(yè)洞察。

(本文僅代表作者觀點,不代表知產力立場)

封面來源 | Pexels 編輯 | 布魯斯

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
因長得太漂亮,7次拒絕導演要求遭打壓,如今43歲才等到掌聲

因長得太漂亮,7次拒絕導演要求遭打壓,如今43歲才等到掌聲

黎兜兜
2025-12-25 21:57:32
泰防長怒批某國“偽中立”:只逼泰國;,卻偏袒柬埔寨

泰防長怒批某國“偽中立”:只逼泰國;,卻偏袒柬埔寨

胡嚴亂語
2025-12-25 15:15:35
嘉興市原市長李軍調任浙江省海洋經(jīng)濟發(fā)展廳黨組書記,曾在湖南工作27年

嘉興市原市長李軍調任浙江省海洋經(jīng)濟發(fā)展廳黨組書記,曾在湖南工作27年

上觀新聞
2025-12-26 20:49:34
關于在烏克蘭的傷亡,做一道簡單計算題:參戰(zhàn)的90萬俄軍去哪兒了

關于在烏克蘭的傷亡,做一道簡單計算題:參戰(zhàn)的90萬俄軍去哪兒了

鷹眼Defence
2025-12-26 18:03:30
俄方最新回應:戰(zhàn)場上見

俄方最新回應:戰(zhàn)場上見

魯中晨報
2025-12-26 13:05:09
中日爭端大結局?高市連送中國兩份大禮,日本50年國運沒了!

中日爭端大結局?高市連送中國兩份大禮,日本50年國運沒了!

花花娛界
2025-12-25 20:42:12
今年圣誕節(jié)沒人抵制了,為啥還更冷清了?網(wǎng)友:3個原因,很現(xiàn)實

今年圣誕節(jié)沒人抵制了,為啥還更冷清了?網(wǎng)友:3個原因,很現(xiàn)實

劍道萬古似長夜
2025-12-25 15:39:57
天助C羅:1-2,C羅爭冠勁敵爆大冷門吞下首敗+落后利雅得勝利8分

天助C羅:1-2,C羅爭冠勁敵爆大冷門吞下首敗+落后利雅得勝利8分

俯身沖頂
2025-12-26 23:04:44
越南樓市失控了

越南樓市失控了

格隆匯
2025-12-26 19:37:05
泰國總理火冒三丈,怒斥“大不敬”

泰國總理火冒三丈,怒斥“大不敬”

寰宇大觀察
2025-12-26 13:57:20
今冬最冷時間表出爐,何時最冷?2026年春節(jié)冷不冷?早看早知道

今冬最冷時間表出爐,何時最冷?2026年春節(jié)冷不冷?早看早知道

好賢觀史記
2025-12-25 10:07:03
央視曝光新毒物!已流竄到全國,長期食用傷肝腎,孩子淪為重災區(qū)

央視曝光新毒物!已流竄到全國,長期食用傷肝腎,孩子淪為重災區(qū)

有范又有料
2025-12-26 12:20:20
知名熟食品牌致歉,10倍現(xiàn)金補償消費者!很多人吃過

知名熟食品牌致歉,10倍現(xiàn)金補償消費者!很多人吃過

中國經(jīng)濟網(wǎng)
2025-12-26 16:28:03
李嘉誠:有正常的政治氛圍良好的商業(yè)環(huán)境,就不存在跑不跑的問題

李嘉誠:有正常的政治氛圍良好的商業(yè)環(huán)境,就不存在跑不跑的問題

紫京講談
2025-12-26 16:59:51
紫牛熱點∣行人未走人行道收到警告罰單!記者調查:多地有類似查處,還有人被直接罰款

紫牛熱點∣行人未走人行道收到警告罰單!記者調查:多地有類似查處,還有人被直接罰款

揚子晚報
2025-12-26 19:47:16
外交部回應日本領導人或參拜靖國神社:日方不要錯上加錯

外交部回應日本領導人或參拜靖國神社:日方不要錯上加錯

環(huán)球網(wǎng)資訊
2025-12-26 15:30:50
劉芳菲登門向龐叔令道歉!眼里滿是淚光,龐叔令拿出一柜子藏品來

劉芳菲登門向龐叔令道歉!眼里滿是淚光,龐叔令拿出一柜子藏品來

阿纂看事
2025-12-26 19:09:14
緊急!多品牌洗發(fā)水暗含致癌物,趕緊自查你家洗漱臺有沒有!

緊急!多品牌洗發(fā)水暗含致癌物,趕緊自查你家洗漱臺有沒有!

今朝牛馬
2025-12-26 17:16:28
新加坡坐不住了!開始對海南封關展開反擊!

新加坡坐不住了!開始對海南封關展開反擊!

荊楚寰宇文樞
2025-12-26 22:25:14
他們?yōu)楹渭庇谧N攜程?

他們?yōu)楹渭庇谧N攜程?

智識漂流
2025-12-25 20:09:36
2025-12-27 03:07:00
知產力 incentive-icons
知產力
為創(chuàng)新聚合知識產權解決方案
9658文章數(shù) 24220關注度
往期回顧 全部

科技要聞

收割3000億!拼多多"土辦法"熬死所有巨頭

頭條要聞

老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

頭條要聞

老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

體育要聞

開翻航母之后,他決定親手造一艘航母

娛樂要聞

王傳君生病后近照變化大,面部浮腫

財經(jīng)要聞

投資巨鱷羅杰斯最新持倉:只留四種資產

汽車要聞

兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測

態(tài)度原創(chuàng)

教育
藝術
手機
房產
時尚

教育要聞

不公布成績排名其實也不耽誤學生知道誰是優(yōu)秀生誰是差生!

藝術要聞

你絕對想不到,佛陀微笑隱藏的秘密竟然是!

手機要聞

vivo藍河:以開源和賽事,撬動AGI時代底層技術生態(tài)

房產要聞

炸裂,三亞360億超級清單發(fā)布,又一批重大配套要來了!

我們?yōu)槭裁葱枰?jié)日穿搭?

無障礙瀏覽 進入關懷版