国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

《權(quán)力的游戲》作者起訴ChatGPT侵權(quán)的AI訓練版權(quán)授權(quán)問題

0
分享至

據(jù)媒體報道[i],近日美國作家協(xié)會攜包括《冰與火之歌:權(quán)力的游戲》的作者喬治馬丁在內(nèi)的17名作家在美國紐約南區(qū)法院對人工智能公司OpenAI發(fā)起集體訴訟,指控后者未經(jīng)許可使用了受版權(quán)保護的作品訓練人工智能模型。作為律師,筆者對原告如何證明OpenAI用《冰與火之歌:權(quán)力的游戲》訓練ChatGPT很感興趣,就查閱了美國作家協(xié)會網(wǎng)站上的起訴狀,本文會結(jié)合著作權(quán)法律跟大家聊聊這個事情。

眾所周知,人工智能服務的解答能力要強,高質(zhì)量的訓練數(shù)據(jù)必不可少,但世界上多數(shù)國家的著作權(quán)法都要求人工智能開發(fā)者使用他人享有著作權(quán)的內(nèi)容進行訓練前,應當取得著作權(quán)人的許可。而人工智能開發(fā)者出于種種考慮(比如避免繁瑣冗長的授權(quán)商務談判、開發(fā)時限要求他們只爭朝夕、減少版權(quán)成本等種種考慮、部分著作權(quán)人授權(quán)拿不到哪怕給錢也不愿意給他們授權(quán)),直接在人工智能開發(fā)時使用了盜版內(nèi)容作為訓練數(shù)據(jù)。

但對于這種做法,因為大模型的訓練數(shù)據(jù)是不公開的,訓練過程也是黑箱操作,著作權(quán)人即使知道存在侵權(quán)也很難舉證,美國現(xiàn)在既然有訴訟,下面我們就看看美國律師是怎么證明的。

一、被告自認(其實是ChatGPT自認)

訴狀稱,OpenAI為了訓練其大型語言模型,在未征得作者同意的情況下復制了由原告撰寫的受版權(quán)保護的書籍,并且OpenAI已公開承認了。因為原告的律師向ChatGPT提問,然后聊天機器人回應稱:

用于訓練我的一些書籍可能是受版權(quán)保護的。不過,我的訓練數(shù)據(jù)來自互聯(lián)網(wǎng)上的各種公開來源,我的訓練數(shù)據(jù)集中包含的一些書籍很可能沒有被授權(quán)使用....如果我的訓練數(shù)據(jù)中包含了任何受版權(quán)保護的資料,那么這些資料的使用是在版權(quán)持有者不知情或未征得版權(quán)持有者同意的情況下進行的。

同時,原告律師發(fā)現(xiàn),直到最近,ChatGPT還能準確無誤地返回受版權(quán)保護的書籍中的文字原文,這表明底層大型語言模型在訓練過程中一定完整地錄入了這些書籍。雖然最近ChatGPT對此進行了修改,會以"我無法提供版權(quán)文本的逐字摘錄"來回應此類提示。從時間上看,ChatGP對輸出規(guī)則的這一明顯修改很可能是因為原告作家協(xié)會給OpenAI和其他公司發(fā)了公開信。

筆者認為,雖然ChatGPT自認其訓練素材可能沒有授權(quán),但鑒于人工智能經(jīng)常在回復里沒有依據(jù)的胡說八道(ChatGPT曾說筆者這個知識產(chǎn)權(quán)律師是刑事律師,最近處理過一起很有名的強奸案,明顯在胡編,沒有任何依據(jù)),這段回復要有其他證據(jù)佐證才能被法院認定為案件的事實。

二、訓練素材包來自知名盜版網(wǎng)站

訴狀稱:ChatGPT現(xiàn)在提供的不是逐字摘錄,而是受版權(quán)保護的書籍的摘要,其中通常包含評論和其他公開資料中沒有的細節(jié)——這再次表明,基礎(chǔ)大型語言模型在訓練期間必須錄入整本書。但OpenAI對于從何處以及如何獲得原告受版權(quán)保護的作品,始終語焉不詳。OpenAI承認,它用來訓練模型的訓練數(shù)據(jù)集包括"Common Crawl"和兩個高質(zhì)量的基于互聯(lián)網(wǎng)的書籍語料庫,它稱之為"Booksl"和 "Books2.T2"。

CommonCrawl是一個龐大且不斷增長的語料庫,包含從數(shù)十億網(wǎng)頁中抓取的"原始網(wǎng)頁數(shù)據(jù)、元數(shù)據(jù)提取和文本提取"。它被廣泛用于訓練大型語言模型,除OpenAI的GPT外,還被用于訓練臉書和谷歌的人工智能引擎。眾所周知,它包含從盜版網(wǎng)站復制的書籍文本(鏈接到 Z-Library——一個擁有 1,100多萬冊圖書的大型盜版圖書庫出現(xiàn)在Common Crawl語料庫中,并被納入其他大型語言模型的訓練數(shù)據(jù)集)。

OpenAI拒絕討論Books2數(shù)據(jù)集的來源。但一些獨立的Al研究人員懷疑 Books2 包含或由從大型盜版圖書庫下載的電子書文件組成,如Library Genesis或 "LibGen","它提供了一個龐大的盜版文本庫:LibGen 作為一個臭名昭著的版權(quán)侵權(quán)者已為法院所熟知。而Books2的其他可能來源包括Z-Library和 Bibliotik 等盜版種子跟蹤器,這些跟蹤器允許用戶批量下載電子書。

原告律師無法證明Books2的數(shù)據(jù)來源,所以舉了著名包含大量盜版內(nèi)容的訓練素材庫"Books3"作為類比證據(jù)(《連線》雜志報道過,臉書和彭博社的大型語言模型使用了"Books3"的素材庫[ii]):已披露的 Books2 數(shù)據(jù)集的規(guī)模表明,該數(shù)據(jù)集包含10萬多本書。Books2和Books3的大小相似,而且互聯(lián)網(wǎng)上允許批量下載電子書的盜版存儲庫寥寥無幾,這有力地表明Books2中的書籍也是從上文討論過的臭名昭著的存儲庫中獲取的。

如果這個訴訟是在中國進行的,如果原告初步證明了被告的訓練素材存在盜版,此時,舉證責任就在被告,被告要證明其訓練素材不存在盜版,否則法院就會支持原告的證明內(nèi)容。

三、喬治馬丁如何證明OpenAI用其作品訓練了ChatGPT?

訴狀稱,喬治馬丁是包括《權(quán)力的游戲》在內(nèi)的十五部小說作品的著作權(quán)人,OpenAI在未經(jīng)許可的情況下錄入并復制了喬治馬丁的全部或多部作品,并將其用于訓練OpenAI的大型語言模型。訴狀中舉了兩個第三方新聞的例子:

1、2023 年 7 月,一個叫LiamSwayne的程序員[iii]使用 ChatGPT 生成了《凜冬的寒風》、《春曉的夢想》的版本,這兩本書是馬丁正在創(chuàng)作的《冰與火之歌》系列的最后兩部作品。

2、美國加州大學伯克利分校的研究人員對ChatGPT對作品的"記憶"程度進行了一項實驗[iv],發(fā)現(xiàn)馬丁的小說《權(quán)力的游戲》在"記憶"程度方面排名第12位。

然后,原告律師使用ChatGPT進行測試,輸入提示后,ChatGPT 準確生成了幾部馬丁作品的摘要,包括冰與火之歌》系列的前三部《權(quán)力的游戲》、《列王的紛爭》、《冰雨的風暴》以及《末日審判布條》最后一章的準確摘要。

原告律師輸入提示后,ChatGPT還為馬丁作品《列王的紛爭》的另一部續(xù)集生成了一份詳細大綱,并將該衍生作品命名為"A Dance With Shadows",其中使用了馬丁《冰與火之歌》系列現(xiàn)有書籍中的相同角色。ChatGPT還生成了一份《權(quán)力的游戲前傳》的詳細大綱,并將該衍生作品命名為"A Dawn of Direwolves",其中使用了與《冰與火之歌》系列叢書中相同的人物。

訴狀總結(jié):如果OpenAI大型語言模型沒有攝取馬丁侵權(quán)作品并對其進行訓練,ChatGPT 就不可能產(chǎn)生上述結(jié)果。筆者認為,如果訴訟在中國法院進行,馬丁的律師已經(jīng)證明了ChatGPT使用了馬丁的作品進行訓練,并且其服務器目前仍然留存著馬丁作品的復制件。

四、人工智能訓練可以不用獲得著作權(quán)人的授權(quán)嗎?

法律原理上,讓人工智能學習網(wǎng)上內(nèi)容的過程是一個復制行為或者臨時復制行為,人工智能公司要先將網(wǎng)上的或者線下獲得的內(nèi)容爬取,然后輸入到人工智能程序中,無論這個內(nèi)容是文字、圖片、音頻、視頻還是程序,復制行為都應當獲得相應權(quán)利人許可,否則就涉嫌侵權(quán)。

實際上我國法律法規(guī)也是這么規(guī)定的,根據(jù)我國《著作權(quán)法》和七部門聯(lián)合發(fā)布的《生成式人工智能服務管理暫行辦法》,我國的生成式人工智能服務提供者(以下稱提供者)開展預訓練、優(yōu)化訓練等訓練數(shù)據(jù)處理活動時,不得侵害他人依法享有的知識產(chǎn)權(quán),也就是說,訓練素材需要取得著作權(quán)人的許可。在美國,如前文所述,訓練人工智能的版權(quán)素材需要著作權(quán)人授權(quán)。

但對這個問題,也有國家的規(guī)定不太一樣,比如根據(jù)日本著作權(quán)法第30條第4款,用版權(quán)內(nèi)容訓練人工智能屬于合理使用:如果不以欣賞作品中表達的思想或情感為目的,且沒有不合理的損害著作人權(quán)人權(quán)益的,可以合理使用他人享有著作權(quán)的作品。

筆者覺得,雖然日本的規(guī)定立法目的可能是為了振興該國的人工智能產(chǎn)業(yè),但其實也是一個思路,因為人工智能生成的內(nèi)容不受著作權(quán)法保護,那其創(chuàng)造的內(nèi)容就是全民共有的,那把所有的版權(quán)作品都讓其學習一下,成果出來了大家都不需要授權(quán)就可以用,這個說不定也挺好。

本文作者:游云庭,上海大邦律師事務所高級合伙人,知識產(chǎn)權(quán)律師。電話:8621-52134900,Email: yytbest@gmail.com,本文僅代表作者觀點。

[i] https://finance.eastmoney.com/a/202309212853452095.html

[ii] https://www.wired.com/story/battle-over-books3/

[iii] https://game.sohu.com/a/704547146_114760

[iv] https://hub.baai.ac.cn/view/26572

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
沖突進入第九天,美駐伊拉克使館遭襲,特朗普稱3天內(nèi)擊沉42艘伊朗艦艇

沖突進入第九天,美駐伊拉克使館遭襲,特朗普稱3天內(nèi)擊沉42艘伊朗艦艇

新華社
2026-03-08 08:26:21
長期佩戴骨傳導耳機會致聾?醫(yī)生:7天內(nèi)是黃金治療期

長期佩戴骨傳導耳機會致聾?醫(yī)生:7天內(nèi)是黃金治療期

人民日報健康客戶端
2026-03-06 10:50:07
又一男星組團選妃?他恐成下一個棄子……

又一男星組團選妃?他恐成下一個棄子……

毒舌八卦
2026-03-07 23:23:32
股民要做好心理準備了,接下來一周內(nèi)股市域?qū)⒃傺?5年歷史!

股民要做好心理準備了,接下來一周內(nèi)股市域?qū)⒃傺?5年歷史!

風風順
2026-03-08 07:08:40
伊朗內(nèi)訌實錘!總統(tǒng)下令?;穑锩l(wèi)隊根本不認賬!

伊朗內(nèi)訌實錘!總統(tǒng)下令停火,革命衛(wèi)隊根本不認賬!

老馬拉車莫少裝
2026-03-07 21:56:08
宇樹科技創(chuàng)始人王興興相親帖曝光!女友標準引熱議

宇樹科技創(chuàng)始人王興興相親帖曝光!女友標準引熱議

江南晚報
2026-03-07 14:39:25
她是上海著名演員,巔峰時遠赴美國,嫁給資本巨鱷,69歲人生贏家

她是上海著名演員,巔峰時遠赴美國,嫁給資本巨鱷,69歲人生贏家

白面書誏
2026-03-07 17:18:19
油價要失控?

油價要失控?

虎嗅APP
2026-03-08 06:15:11
俄羅斯副總理表示 俄將轉(zhuǎn)移部分對歐天然氣供應至其他國家

俄羅斯副總理表示 俄將轉(zhuǎn)移部分對歐天然氣供應至其他國家

國際在線
2026-03-07 19:27:40
為何關(guān)閉霍爾木茲海峽就能掐全球脖子?因為伊朗原油是全世界最好的

為何關(guān)閉霍爾木茲海峽就能掐全球脖子?因為伊朗原油是全世界最好的

風向觀察
2026-03-06 21:31:15
方靜去世,那個誣陷她是間諜的中央電視臺主持人后來怎么樣了?

方靜去世,那個誣陷她是間諜的中央電視臺主持人后來怎么樣了?

老吳教育課堂
2026-03-07 19:16:02
1963年,羅榮桓逝世,林彪囑托葉群:你把林月琴請過來坐一坐吧

1963年,羅榮桓逝世,林彪囑托葉群:你把林月琴請過來坐一坐吧

大運河時空
2026-03-07 08:00:03
芬蘭總理:來故宮才明白,中國不是大國崛起,只是在重回歷史巔峰

芬蘭總理:來故宮才明白,中國不是大國崛起,只是在重回歷史巔峰

近史談
2026-03-06 13:57:51
國行 iPhone,終于解除 eSIM 限制!

國行 iPhone,終于解除 eSIM 限制!

黑貓科技迷
2026-03-08 01:26:22
離譜!日本球員在西乙被當做中國人+遭種族歧視 當場憤怒告訴裁判

離譜!日本球員在西乙被當做中國人+遭種族歧視 當場憤怒告訴裁判

風過鄉(xiāng)
2026-03-08 08:17:28
半年虧1500億!昔日巨頭跌落,比亞迪坐享其成登頂全球第四

半年虧1500億!昔日巨頭跌落,比亞迪坐享其成登頂全球第四

財叔
2026-03-07 09:00:17
兩個小藥丸兒,一個助硬,一個延時長,在家門口的藥店就能買到

兩個小藥丸兒,一個助硬,一個延時長,在家門口的藥店就能買到

中醫(yī)陳旺醫(yī)生
2025-11-14 10:43:05
快訊:伊朗強硬派否定總統(tǒng)講話,以色列轟炸伊朗石油設施

快訊:伊朗強硬派否定總統(tǒng)講話,以色列轟炸伊朗石油設施

近距離
2026-03-08 07:50:15
蔣介石日記:重慶談判放走毛澤東的真實原因,背后有這兩點考量

蔣介石日記:重慶談判放走毛澤東的真實原因,背后有這兩點考量

鶴羽說個事
2026-03-06 19:19:42
央視緊急揭露:全是假貨!別再往家里搬了,很多人天天在用!

央視緊急揭露:全是假貨!別再往家里搬了,很多人天天在用!

古事尋蹤記
2026-03-07 07:07:35
2026-03-08 09:47:00
游云庭律師 incentive-icons
游云庭律師
互聯(lián)網(wǎng)法律評論
134文章數(shù) 189關(guān)注度
往期回顧 全部

科技要聞

OpenClaw最大的推手是閑魚和小紅書

頭條要聞

媒體:伊朗問題要注意普京的動向 其在向美以喊話

頭條要聞

媒體:伊朗問題要注意普京的動向 其在向美以喊話

體育要聞

塔圖姆298天走完這段路 只用27分鐘征服這座城

娛樂要聞

汪小菲曝親媽猛料,張?zhí)m公開財產(chǎn)分配

財經(jīng)要聞

油價要失控?

汽車要聞

逃離ICU,上汽通用“止血”企穩(wěn)

態(tài)度原創(chuàng)

家居
藝術(shù)
健康
旅游
公開課

家居要聞

暖棕撞色 輕法奶油風

藝術(shù)要聞

他是二王書法的化身?米芾的秘密揭曉!

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

旅游要聞

湖州,不只有風景

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版