国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

《紐約時報》起訴了OpenAI和微軟哪些侵權(quán)行為?

0
分享至

近日,《紐約時報》在紐約南區(qū)法院起訴微軟和OpenAI,訴狀稱:被告未經(jīng)許可使用大量版權(quán)文章訓(xùn)練人工智能模型,開發(fā)與《紐約時報》競爭的產(chǎn)品,賺取了豐厚的利潤,《紐約時報》試圖與被告達成協(xié)議,保障內(nèi)容使用的公平價值,但未達成解決方案。被告聲稱行為屬于“合理使用”,但實際并不具備“轉(zhuǎn)換性”?!都~約時報》要求其停止侵權(quán)、恢復(fù)原狀、賠償損失。今天和大家聊聊,微軟和OpenAI對《紐約時報》有哪些侵權(quán)行為,以及根據(jù)我國法律,這些行為應(yīng)如何定性。

一、訓(xùn)練素材侵權(quán)

因為《紐約時報》文章的質(zhì)量非常高,所以其網(wǎng)站內(nèi)容被作為了ChatGPT的訓(xùn)練數(shù)據(jù)來源。OpenAI承認(rèn),與其他低質(zhì)量來源的內(nèi)容相比,包括來自《紐約時報》在內(nèi)的高質(zhì)量內(nèi)容,對于訓(xùn)練GPT 模型來說更重要、更有價值。訴狀稱微軟和 OpenAI在訓(xùn)練大模型時使用了《紐約時報》作品,并且其多個產(chǎn)品中包含了《紐約時報》的作品。

OpenAI的GPT-2的訓(xùn)練數(shù)據(jù)集包括一個名為WebText的 OpenAI內(nèi)部語料庫,其中有Reddit社交網(wǎng)絡(luò)用戶發(fā)布的 4500 萬個鏈接的文本內(nèi)容,這些是公認(rèn)的高質(zhì)量網(wǎng)絡(luò)內(nèi)容。WebText數(shù)據(jù)集的鏈接被OpenAI通過網(wǎng)絡(luò)抓取,其中包含了大量《紐約時報》內(nèi)容?!都~約時報》的NYTimes.com 域名是WebText數(shù)據(jù)集中數(shù)量最多的 15 個域名”之一,并被列為WebText 數(shù)據(jù)集中第五個“頂級域”,擁有333,160個條目。

在GPT-3中權(quán)重最高的用于訓(xùn)練的數(shù)據(jù)集Common Crawl中,《紐約時報》網(wǎng)站域名www.nytimes.com域名是最具代表性的專有來源之一(排名第三,僅次于維基百科和美國專利文獻數(shù)據(jù)庫),Common Crawl數(shù)據(jù)集包含至少 1600 萬條獨特的內(nèi)容記錄來自《紐約時報》的 News、Cooking、Wirecutter和 The Athletic等板塊。

根據(jù) Common Crawl, WebText和 WebText2訓(xùn)練數(shù)據(jù)集估算,被告可能完整使用了數(shù)百萬份《紐約時報》擁有版權(quán)的作品來訓(xùn)練 GPT 模型,且沒有任何向《紐約時報》提供許可或其他補償。

例如,2019年,《紐約時報》發(fā)表了一篇榮獲普利策獎的關(guān)于紐約市出租車行業(yè)掠奪性貸款的系列文章。歷時18個月的調(diào)查包括600次訪談、100余條記錄請求、大規(guī)模數(shù)據(jù)分析、審核數(shù)千頁內(nèi)部銀行記錄和其他文件,最終導(dǎo)致犯罪調(diào)查,以及促成新法律以防止未來的濫用行為。OpenAI在創(chuàng)作過程中沒有發(fā)揮任何作用,但只需很少的提示,其產(chǎn)品就會逐字背誦其中的大部分內(nèi)容。

在訴狀中,《紐約時報》的訴訟請求除了要求法院判令被告賠償損失外,還要求恢復(fù)原狀、以及法律或衡平法允許的任何其他救濟永久禁止被告從事非法、不公平和侵權(quán)行為、銷毀所有 GPT 或其他大型語言模型以及包含《紐約時報》內(nèi)容的訓(xùn)練素材。筆者認(rèn)為,對被告方OpenAI和微軟而言,恢復(fù)原狀和銷毀訓(xùn)練素材的訴求如果被法院支持,會是一個麻煩,但不至于導(dǎo)致ChatGPT崩潰或者停擺。

雖然ChatGPT的訓(xùn)練素材的記憶方式和傳統(tǒng)的電腦復(fù)制、粘貼、存儲內(nèi)容的過程有一定區(qū)別,而且人工智能服務(wù)機構(gòu)對此也諱莫如深,但從網(wǎng)上泄露的內(nèi)容看,有些技術(shù)漏洞可以導(dǎo)致輸入一次提示詞,ChatGPT就會向使用者反饋原始的訓(xùn)練素材,說明其也是存在存儲區(qū)的[i],所以哪怕法院判決刪除侵權(quán)素材、恢復(fù)原狀,OpenAI和微軟應(yīng)該也可以通過刪除存儲的爭議內(nèi)容來履行判決。

二、必應(yīng)ChatGPT插件截取網(wǎng)站流量

微軟通過與OpenAI合作,將OpenAI的GPT商業(yè)化,并將其與自己的必應(yīng)搜索相結(jié)合。2023年5月,微軟和 OpenAI推出了Browse with Bing,這是一個 ChatGPT插件,其可以通過必應(yīng)搜索引擎訪問互聯(lián)網(wǎng)上的最新內(nèi)容。必應(yīng)聊天和Browse with Bing 結(jié)合了ChatGPT-4 模仿人類表達的能力,必應(yīng)用戶可以直接閱讀搜索結(jié)果中的《紐約時報》文章自然語言摘要內(nèi)容,從而無需訪問《紐約時報》自己的網(wǎng)站。

不同于傳統(tǒng)搜索引擎只顯示網(wǎng)頁摘要,必應(yīng)搜索引擎頁面上的“合成”搜索結(jié)果可以直接回答用戶查詢,并且可能將《紐約時報》報道中廣泛的內(nèi)容進行釋義和直接引用。對于《紐約時報》而言,這種方式實際意味著替代,用戶無需訪問其網(wǎng)站就可以使用他們的內(nèi)容,這將導(dǎo)致商業(yè)利益受損。

由于互聯(lián)網(wǎng)的興起,傳統(tǒng)媒體如《紐約時報》的紙質(zhì)版內(nèi)容已經(jīng)被嚴(yán)重打擊了,這使得他們損失了報紙訂閱費用和廣告收入。所以不得已,他們在網(wǎng)站上推出了付費墻,也就是少部分內(nèi)容免費或者每月少量內(nèi)容免費,要多閱讀就要付費。這里面有兩部分收入,免費閱讀的廣告收入以及收費閱讀的訂閱收入。

傳統(tǒng)的搜索引擎的搜索結(jié)果一般只顯示兩到三行文章的報紙網(wǎng)站摘要內(nèi)容,用戶要閱讀還是要打開報紙網(wǎng)站,所以能和付費墻兼容。但必應(yīng)聊天和 Browse with Bing這兩個功能的出現(xiàn)使平衡被打破。用戶無需訪問網(wǎng)站就能獲得他們的內(nèi)容會使他們拿不到廣告收入以及收費閱讀的訂閱收入,這也是他們起訴的重要原因。

除了復(fù)制《紐約時報》新聞媒體內(nèi)容外,必應(yīng)ChatGPT插件和瀏覽器使用 Bing for ChatGPT 時,還會顯示《紐約時報》Wirecutter(意為“鋼絲鉗”)板塊內(nèi)容的大量摘錄或釋義提示。該板塊的記者以完全的編輯獨立性和誠信,在長達數(shù)十年的時間里每年花費數(shù)千小時研究和測試產(chǎn)品,以確保只推薦最好的產(chǎn)品。這些建議在呈現(xiàn)給讀者時,包括被介紹的產(chǎn)品在購物網(wǎng)站的直接鏈接,用戶購買后,《紐約時報》公司也會有收益。

但必應(yīng)的ChatGPT插件有效截取了Wirecutter 的精華部分直接呈現(xiàn)給用戶,這會降低用戶訪問到《紐約時報》原始來源的動力。減少Wirecutter 文章的流量,進而減少附屬鏈接的流量,最終導(dǎo)致《紐約時報》的收入損失。比如通過訪問必應(yīng)的ChatGPT插件,用戶已經(jīng)了解 Wirecutter推薦的最好的無繩真空吸塵器,以及這些建議的基礎(chǔ),沒有理由訪問原始文章并點擊其網(wǎng)站內(nèi)的鏈接。這樣,被告的人工智能產(chǎn)品通過不公平競爭,奪取了《紐約時報》的商業(yè)機會。

根據(jù)我國法律,如果搜索引擎提供的內(nèi)容實質(zhì)性替代了原始網(wǎng)站,涉嫌構(gòu)成著作權(quán)侵權(quán),《紐約時報》在美國也就微軟必應(yīng)搜索引擎的類似行為起訴,說明根據(jù)美國法律,這個行為也涉嫌侵權(quán)。

三、人工智能的幻覺造成誤導(dǎo)

訴狀稱,ChatGPT將“幻覺”定義為一種機器的現(xiàn)象,如聊天機器人,產(chǎn)生看似真實的感官體驗,不符合任何現(xiàn)實世界的輸入。被告的GPT模型將自信地提供信息,而不是說“我不知道”,這些信息在最好的情況下是不完全準(zhǔn)確的,在最壞的情況下,是明顯錯誤的(但無法識別)。而用戶會很難區(qū)分“幻覺”和真實的輸出。

例如,在回答請求提供《紐約時報》文章,題為“亞馬遜內(nèi)部在傷痕累累的工作場所中爭奪大創(chuàng)意”的第六段時,必應(yīng)的ChatGPT插件Bing Chat自信地聲稱要復(fù)制第六段。如果其真的這樣做了,它會已實施侵犯版權(quán)行為。但Bing Chat完全捏造了一個段落。

用戶給了Bing Chat《紐約時報》一篇名為“有益心臟健康的飲食方式”的鏈接,要求其摘錄出“15種最有益心臟健康的食物”, BingChat向用戶列舉了15種有益心臟健康的食物,還包括適量的紅酒。事實上《紐約時報》的文章并沒有列出這 15 種食品中的 12 種。而且《紐約時報》的最新報道得出的結(jié)論是,紅酒不利于心臟健康。

此外,訴狀還列舉了ChatGPT捏造了不少健康領(lǐng)域的文章。筆者認(rèn)為,如果人工智能提供的服務(wù)出現(xiàn)幻覺,就會提供虛構(gòu)的事實,在法律上,以虛構(gòu)的事實描述他人的,涉嫌誹謗,也就是名譽侵權(quán),損害了《紐約時報》的聲譽。ChatGPT作為人工智能沒有人格,所以無法負(fù)責(zé),應(yīng)當(dāng)負(fù)責(zé)的是其服務(wù)提供者OpenAI和微軟。

最后,《紐約時報》作為一家老牌的很有影響力的媒體,本次其起訴OpenAI和微軟,在業(yè)界引發(fā)了很大反響,說明雖然生成式人工智能還是新生事物,但重量級媒體已經(jīng)關(guān)注其破壞行業(yè)秩序的問題了。事實上,除了此案,美國發(fā)生了很多對于生成式人工智能的維權(quán)案件,筆者寫過的就包括小說作者維權(quán)的《《權(quán)力的游戲》作者起訴ChatGPT侵權(quán),AI訓(xùn)練要不要獲得著作權(quán)人的授權(quán)?》、軟件開發(fā)者維權(quán)的《用GitHub上的開源代碼訓(xùn)練人工智能違法嗎?》、唱片產(chǎn)業(yè)版權(quán)人維權(quán)的《環(huán)球唱片起訴人工智能引擎Claude案有哪些法律看點?》、以及綜合性的《AI生成的作品受版權(quán)保護嗎?我與ChatGPT各抒己見》等,大家有興趣也可以看看。

本文作者:游云庭,上海大邦律師事務(wù)所高級合伙人,知識產(chǎn)權(quán)律師。本文僅代表作者觀點。

[i] https://blog.csdn.net/richerg85/article/details/134940746

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
萬萬沒想到!李晨會因為老人味登上熱搜,感覺他這輩子很難結(jié)婚了

萬萬沒想到!李晨會因為老人味登上熱搜,感覺他這輩子很難結(jié)婚了

樂悠悠娛樂
2025-12-02 11:01:18
閆學(xué)晶多平臺賬號被禁止關(guān)注,馮鞏刪除所有相關(guān)視頻

閆學(xué)晶多平臺賬號被禁止關(guān)注,馮鞏刪除所有相關(guān)視頻

映射生活的身影
2026-01-10 10:38:36
A股:突然大利好,原因是什么?釋放什么信號?下周牛市穩(wěn)了?

A股:突然大利好,原因是什么?釋放什么信號?下周牛市穩(wěn)了?

夜深愛雜談
2026-01-11 19:55:15
紀(jì)實:高二男生在課堂上被活生生打死,死前哭求:我錯了,我不說了

紀(jì)實:高二男生在課堂上被活生生打死,死前哭求:我錯了,我不說了

紅豆講堂
2024-12-11 13:42:41
中組部、人社部發(fā)布通知

中組部、人社部發(fā)布通知

政知新媒體
2026-01-11 14:24:03
0-1輸給中國隊!澳大利亞隊進球被吹原因找到,或?qū)⑿〗M出局

0-1輸給中國隊!澳大利亞隊進球被吹原因找到,或?qū)⑿〗M出局

何老師呀
2026-01-11 22:09:05
商業(yè)航天龍頭,全是壟斷性第一

商業(yè)航天龍頭,全是壟斷性第一

風(fēng)風(fēng)順
2026-01-11 16:28:06
自盧克-肖以來,萊西是首位被罰下的20歲以下曼聯(lián)球員

自盧克-肖以來,萊西是首位被罰下的20歲以下曼聯(lián)球員

懂球帝
2026-01-12 02:57:35
中國20萬顆衛(wèi)星一旦部署完成,“星鏈”為什么會被直接碾壓

中國20萬顆衛(wèi)星一旦部署完成,“星鏈”為什么會被直接碾壓

粵語音樂噴泉
2026-01-11 14:34:26
四大血型排行榜公布:B型血平均年齡76歲,排名第二,第1是哪型?

四大血型排行榜公布:B型血平均年齡76歲,排名第二,第1是哪型?

39健康網(wǎng)
2025-12-11 18:17:08
德媒:中國不是歐洲的頭號金主了,我們不用,也不能跟中國客氣了

德媒:中國不是歐洲的頭號金主了,我們不用,也不能跟中國客氣了

梁訊
2026-01-11 20:00:13
機構(gòu)最新調(diào)研路線圖出爐 熵基科技最受關(guān)注

機構(gòu)最新調(diào)研路線圖出爐 熵基科技最受關(guān)注

每日經(jīng)濟新聞
2026-01-11 21:47:35
跨年夜男子酒后外出,中途下車后溺亡,同飲者稱其執(zhí)意下車,已與家屬協(xié)商賠償30萬元

跨年夜男子酒后外出,中途下車后溺亡,同飲者稱其執(zhí)意下車,已與家屬協(xié)商賠償30萬元

紅星新聞
2026-01-11 16:52:09
閆學(xué)晶發(fā)文道歉,但她不是知道錯了,而是知道自己再不道歉就涼了

閆學(xué)晶發(fā)文道歉,但她不是知道錯了,而是知道自己再不道歉就涼了

芊手若
2026-01-11 23:29:33
蘋果正式官宣:1月9日,全面官降!

蘋果正式官宣:1月9日,全面官降!

科技堡壘
2026-01-09 11:45:41
2026年要上市的7款SUV,你最喜歡哪一臺?

2026年要上市的7款SUV,你最喜歡哪一臺?

音樂時光的娛樂
2026-01-11 12:21:23
緬北逃跑男子肋骨穿心臟,反詐宣傳鋪天蓋地,園區(qū)卻越拆越旺?

緬北逃跑男子肋骨穿心臟,反詐宣傳鋪天蓋地,園區(qū)卻越拆越旺?

你食不食油餅
2025-12-07 06:00:07
樸孝敏泳池泳衣美照曝光,微胖身材簡直絕了!

樸孝敏泳池泳衣美照曝光,微胖身材簡直絕了!

章眽八卦
2026-01-11 13:20:41
36年前陳寶國主演的盜墓恐怖片!尺度大到少兒不宜

36年前陳寶國主演的盜墓恐怖片!尺度大到少兒不宜

釋凡電影
2025-08-14 09:33:19
夫妻性生活:女人最討厭的5種“床上行為”,男人千萬別犯!

夫妻性生活:女人最討厭的5種“床上行為”,男人千萬別犯!

精彩分享快樂
2025-11-25 00:05:03
2026-01-12 04:12:49
游云庭律師 incentive-icons
游云庭律師
互聯(lián)網(wǎng)法律評論
129文章數(shù) 188關(guān)注度
往期回顧 全部

科技要聞

“我們與美國的差距也許還在拉大”

頭條要聞

美軍突襲委內(nèi)瑞拉俄制防空系統(tǒng)失聯(lián) 俄方回應(yīng)

頭條要聞

美軍突襲委內(nèi)瑞拉俄制防空系統(tǒng)失聯(lián) 俄方回應(yīng)

體育要聞

U23國足形勢:末輪不負(fù)泰國即確保晉級

娛樂要聞

留幾手為閆學(xué)晶叫屈?稱網(wǎng)友自卑敏感

財經(jīng)要聞

外賣平臺"燒錢搶存量市場"迎來終局?

汽車要聞

2026款宋Pro DM-i長續(xù)航補貼后9.98萬起

態(tài)度原創(chuàng)

房產(chǎn)
教育
親子
旅游
家居

房產(chǎn)要聞

66萬方!4755套!三亞巨量房源正瘋狂砸出!

教育要聞

90%的學(xué)校不會教,影響孩子一生的學(xué)習(xí)方法

親子要聞

長大后才發(fā)現(xiàn),原來不舒服是可以解決的 網(wǎng)友:一部分不能怪父母

旅游要聞

哈爾濱文旅又放大招!老街重現(xiàn)傳統(tǒng)婚俗,這才是打開冬天的方式

家居要聞

木色留白 演繹現(xiàn)代自由

無障礙瀏覽 進入關(guān)懷版