国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

用GitHub上的開(kāi)源代碼訓(xùn)練人工智能違法嗎?

0
分享至

近日,人工智能公司OpenAI在開(kāi)發(fā)者大會(huì)上宣布[i]:如果用戶因人工智能生成內(nèi)容造成版權(quán)侵權(quán)被起訴索賠,其將向用戶提供版權(quán)保護(hù)盾:為客戶辯護(hù)并報(bào)銷過(guò)程中產(chǎn)生的費(fèi)用。其實(shí)OpenAI這招是從微軟學(xué)來(lái)的。而微軟,則是因?yàn)橛昧碎_(kāi)源軟件代碼訓(xùn)練人工智能被起訴,迫不得已才想出版權(quán)保護(hù)盾的辦法。今天就來(lái)聊聊微軟被起訴這個(gè)的訴訟,以及用開(kāi)源代碼訓(xùn)練人工智能到底有哪些法律風(fēng)險(xiǎn)。

筆者在網(wǎng)上找到了案件的起訴書(shū)、微軟的答辯意見(jiàn)和美國(guó)加利福尼亞北區(qū)法院的初步裁定[ii],今天就根據(jù)相關(guān)內(nèi)容介紹一下該案。美國(guó)是普通法系國(guó)家,法院的審判模式和我國(guó)有很大區(qū)別,所以我對(duì)判決書(shū)中的判例引用和制度也都不甚了解,只能挑自己看得懂的案件事實(shí)和部分說(shuō)理做摘要。美國(guó)法律上的分析可以參考美國(guó)律師這篇文章[iii]。

OpenAI公司開(kāi)發(fā)出一款名為Codex的人工智能生成工具。GitHub 推出了基于生成式人工智能的代碼自動(dòng)完成工具 Copilot。Copilot是一款面向 GitHub用戶的訂閱工具,月費(fèi) 10 美元,年費(fèi)100美元。根據(jù)訴狀,Copilot需要Codex才能運(yùn)行。2022年11月,兩名軟件開(kāi)發(fā)者使用化名(為什么用化名起訴,因?yàn)橛腥送ㄟ^(guò)原告律師對(duì)原告發(fā)出過(guò)死亡威脅)提起了假定的集體訴訟,被告為GitHub、微軟(作為GitHub的母公司)、OpenAI。原告聲稱Copilot和Codex作為人工智能工具,其訓(xùn)練中使用了原告受版權(quán)保護(hù)的計(jì)算機(jī)代碼。

開(kāi)源代碼的特點(diǎn)是都在開(kāi)源許可證下發(fā)布的,既然是開(kāi)放的,所以用開(kāi)源代碼訓(xùn)練人工智能也不能說(shuō)必然侵權(quán),但在GitHub上有11種開(kāi)源許可證,每一種許可證都對(duì)使用開(kāi)源代碼者有不同的要求,要求任何衍生作品或許可作品的副本都包含貢獻(xiàn)源代碼者的信息、版權(quán)聲明以及其他要求,比如GPL許可證下的代碼要求使用者開(kāi)放其軟件中的全部源代碼。

但原告認(rèn)為,當(dāng)他們的代碼被用作訓(xùn)練數(shù)據(jù)時(shí),代碼附帶的開(kāi)源許可證的版權(quán)管理信息(“CMI”Copyright ManagementInformation)被刪除了。他們還認(rèn)定Codex和Copilot生成的作品部分包含了他們受版權(quán)保護(hù)的代碼。原告的訴求包括一系列索賠,違反《數(shù)字千年版權(quán)法》(DMCA);違反 GitHub用戶協(xié)議;不公平競(jìng)爭(zhēng);隱私權(quán)侵權(quán)等。

但原告的起訴有一個(gè)證據(jù)瑕疵:無(wú)法證明Codex和Copilot生成的作品完全復(fù)制了原告的代碼。法院初步調(diào)查的結(jié)果是:發(fā)現(xiàn)了幾處Copilot的輸出與 Github用戶編寫的授權(quán)代碼相匹配(matched)的情況,但這些情況都不涉及原告發(fā)布的代碼。也就是說(shuō),有初步證據(jù)證明人工智能輸出的內(nèi)容用了Github上的代碼,但本案的原告不是代碼的作者,所以無(wú)權(quán)主張此行為侵權(quán)。

這些匹配的代碼證明原告訴訟事項(xiàng)并非沒(méi)有依據(jù),故法院在初步裁定書(shū)中認(rèn)定:原告有理由聲稱,被告的計(jì)劃至少存在以下重大風(fēng)險(xiǎn):將復(fù)制原告的許可代碼并進(jìn)行輸出。首先,Codex和Copilot的數(shù)據(jù)訓(xùn)練數(shù)據(jù)中包括所有公開(kāi)的GitHub存儲(chǔ)庫(kù)。其次,程序會(huì)根據(jù)相關(guān)提示重現(xiàn)眾所周知的代碼,并提供幾個(gè)具體的此類復(fù)制的例子。最后,原告聲稱GitHub自己的內(nèi)部研究顯示,Copilot"大約有1%的時(shí)間"從訓(xùn)練數(shù)據(jù)中復(fù)制代碼。因此,原告聲稱的,“如果沒(méi)有禁令救濟(jì),就會(huì)存在以下現(xiàn)實(shí)危險(xiǎn),Codex或Copilot將復(fù)制原告的許可代碼作為輸出”有一定道理。

原告還聲稱被告修改了 Copilot,以確保它不再?gòu)?fù)制許可證文本、署名和版權(quán)聲明。法院認(rèn)為,如果原告的代碼是被復(fù)制用于輸出,其復(fù)制方式將違反開(kāi)源許可證的規(guī)定。雖然原告未能證明事實(shí)損害足以使其獲得部分訴訟資格,但法院還是認(rèn)可他們有資格以財(cái)產(chǎn)權(quán)受到損害為由提出損害賠償,同時(shí)要求起訴8項(xiàng)禁令救濟(jì)。

雖然法院的初步裁定駁回了原告的很多訴請(qǐng),比如隱私權(quán),民事共謀和宣告性救濟(jì)(civil conspiracy and declaratory relief),但這個(gè)訴訟如果繼續(xù)推進(jìn),對(duì)被告方而言,其人工智能產(chǎn)品會(huì)始終處于被法院認(rèn)定停止侵權(quán)的威脅之下,所以目前案件對(duì)誰(shuí)更有利還不好說(shuō)。

要厘清用開(kāi)源代碼訓(xùn)練人工智能是否侵權(quán)的問(wèn)題,可以看訴狀里提到的下面幾個(gè)問(wèn)題:

一、人工智能是怎么用開(kāi)源代碼訓(xùn)練及輸出的?

根據(jù)訴狀,原告認(rèn)為人工智能的訓(xùn)練是算法推演,而不是理解代碼后生成結(jié)果,至少在訴訟的答辯狀里,被告方對(duì)訓(xùn)練過(guò)程、方法都沒(méi)有進(jìn)行回應(yīng),只是說(shuō)認(rèn)為訓(xùn)練屬于合理使用。

原告認(rèn)為:Codex和Copilot不能理解代碼,與人工智能有關(guān)的 "研究"、 "培訓(xùn)"和"學(xué)習(xí)"等詞描述的是與人類推理不同的算法過(guò)程。也不能像人類那樣"理解"語(yǔ)義和上下文,人工智能模型無(wú)法像人類一樣"學(xué)習(xí)",它能檢測(cè)其訓(xùn)練數(shù)據(jù)中具有統(tǒng)計(jì)意義的模式,并提供從其訓(xùn)練數(shù)據(jù)中得出的輸出結(jié)果,在統(tǒng)計(jì)適當(dāng)?shù)那闆r下,對(duì)數(shù)據(jù)進(jìn)行分析。這樣的"蠻力"方法既不高效,也不可靠。所以Codex和Copilot不能自己生成代碼,他們只是用算法推導(dǎo)出用戶想要什么,他們生成的結(jié)果是多個(gè)來(lái)源拼湊的。

可能Codex和Copilot這個(gè)產(chǎn)品是為了給程序員編程時(shí)服務(wù),這個(gè)訓(xùn)練的智能跟人類學(xué)習(xí)區(qū)別還是很大的,甚至和ChatGPT生成代碼的方式也是不同的。如果訴狀所稱屬實(shí),因?yàn)檩敵龅膬?nèi)容都是現(xiàn)成的結(jié)果的拼湊,其侵權(quán)的可能性確實(shí)會(huì)比較大。

二、GitHub的用戶協(xié)議有沒(méi)有限制或禁止訓(xùn)練行為?

所有上傳到GitHub的代碼均受GitHub用戶協(xié)議的約束,該協(xié)議條款規(guī)定用戶保留其上傳至GitHub的任何內(nèi)容的所有權(quán),但授予GitHub存儲(chǔ)權(quán),對(duì)[內(nèi)容]進(jìn)行存檔、解析和顯示,并制作必要的附帶副本,以提供服務(wù),包括不斷改進(jìn)服務(wù)。

根據(jù)Github的用戶協(xié)議:這包括將代碼復(fù)制到我們的數(shù)據(jù)庫(kù)并進(jìn)行備份等操作的權(quán)利;向您和其他用戶提供,將其解析為搜索索引或在我們的服務(wù)器上進(jìn)行其他分析;與其他用戶共享。用戶協(xié)議還規(guī)定,用戶如果設(shè)置了GitHub將授予每位GitHub用戶非獨(dú)占的、全球范圍內(nèi)的許可通過(guò)GitHub服務(wù)使用、展示和執(zhí)行。在GitHub功能允許的情況下,內(nèi)容只能在GitHub上發(fā)布。

鑒于用戶協(xié)議中有代碼要“與其他用戶共享”的規(guī)定,所以,如果代碼是開(kāi)源的,那拿來(lái)訓(xùn)練應(yīng)當(dāng)也是共享的一種方式,符合用戶協(xié)議規(guī)定。

三、人工智能輸出的涉及開(kāi)源代碼的內(nèi)容是不是符合開(kāi)源協(xié)議?

訴狀稱:盡管GitHub公共存儲(chǔ)庫(kù)中的大部分代碼都受到限制其使用的開(kāi)源許可證的約束,但Codex和Copilot“并未進(jìn)行編程設(shè)計(jì),以將版權(quán)歸屬、版權(quán)聲明和許可條款視為法律上必需的”,Copilot訓(xùn)練數(shù)據(jù)并復(fù)制作為輸出,但沒(méi)有復(fù)制版權(quán)歸屬信息、版權(quán)聲明和許可條款。這違反了“數(shù)萬(wàn)(可能是數(shù)百萬(wàn))軟件開(kāi)發(fā)人員”的開(kāi)源許可證。

這里面有三個(gè)法律問(wèn)題,首先是違法問(wèn)題,根據(jù)美國(guó)的版權(quán)法律[iv],未經(jīng)版權(quán)所有者或法律授權(quán),任何人不得刪除或更改版權(quán)管理信息。而本案中,代碼附帶的開(kāi)源許可證的版權(quán)管理信息(“CMI”Copyright ManagementInformation),在訓(xùn)練時(shí)被刪除了。這里的版權(quán)管理信息的范圍要比我國(guó)《著作權(quán)法》規(guī)定的署名權(quán)要大,因?yàn)槌孙@示作者或項(xiàng)目的名稱,開(kāi)源協(xié)議可能還有其他要求,比如公開(kāi)衍生代碼甚至項(xiàng)目的全部代碼。

其次是違約問(wèn)題,GitHub上有十一種開(kāi)源協(xié)議[v]。每一種都對(duì)使用代碼,產(chǎn)生衍生代碼有明確的條件,并且復(fù)制或者以原有代碼衍生新的代碼都至少應(yīng)當(dāng)載明代碼來(lái)源,所屬的開(kāi)源許可證,如果版權(quán)管理信息被刪除,人工智能的開(kāi)發(fā)者就會(huì)違反開(kāi)源協(xié)議。

還有人工智能使用者侵權(quán)的問(wèn)題。由于版權(quán)管理信息被刪除,Codex和Copilot的使用者無(wú)法判斷人工智能生成的代碼是否屬于開(kāi)源許可證項(xiàng)下的代碼,如果其使用了這些代碼,但沒(méi)有按照開(kāi)源許可證的要求標(biāo)明開(kāi)源代碼來(lái)源以及其他要求,就會(huì)對(duì)開(kāi)源代碼的作者構(gòu)成侵權(quán)??赡苓@也是微軟和OpenAi會(huì)向其人工智能服務(wù)用戶提供版權(quán)保護(hù)盾的原因。

最后,本案可以看出人工智能目前處于野蠻生長(zhǎng)的狀態(tài),創(chuàng)業(yè)者只故產(chǎn)品快速推出,但產(chǎn)品設(shè)計(jì)中忽視法律風(fēng)險(xiǎn)和更重要的產(chǎn)業(yè)生態(tài)保護(hù)。開(kāi)源軟件作為一個(gè)有幾十年歷史的龐大的產(chǎn)業(yè),標(biāo)注版權(quán)管理信息和遵守開(kāi)源許可證的規(guī)定是產(chǎn)業(yè)能夠正常運(yùn)轉(zhuǎn)的核心,而新興的人工智能產(chǎn)業(yè)卻只是把開(kāi)源社區(qū)的成果——開(kāi)源代碼全部拿走,但完全不愿遵守法律和開(kāi)源社區(qū)的規(guī)則。所以,我的判斷是,這種破壞生態(tài)式的創(chuàng)新應(yīng)該不會(huì)得到法院的支持。

本文作者:游云庭,上海大邦律師事務(wù)所高級(jí)合伙人,知識(shí)產(chǎn)權(quán)律師。本文僅代表作者觀點(diǎn)。

[i] https://baijiahao.baidu.com/s?id=1781864329601644857&wfr=spider&for=pc

[ii] https://www.skadden.com/-/media/files/publications/2023/05/ruling-on-motion-to-dismiss-sheds-light/govuscourtscand403220950.pdf?rev=4e26e0aee78a4ff49aa30cabfcb265f6&hash=8D62FF3579B6D474BCA1E9E495233E76

[iii] https://www.jdsupra.com/legalnews/ruling-on-motion-to-dismiss-sheds-light-6984451/

[iv] https://www.law.cornell.edu/uscode/text/17/1202

[v] 這十一種開(kāi)源許可證為:(1)Apache License 2.0;(2) GNU General PublicLicense version;(3) MIT; (4)BSD 2;(5) BSD 3;(6) Boost Software License("BSL-1.0") (7) Eclipse Public License 2.0; (8) GNU Affero GeneralPublic License version 3 ("AGPL-3.0") ;(9)General Public License version 2 ("GPL 2") ;(10) GNULesser General Public License version 2.1("LGPL-2.1") ;(11) Mozilla PublicLicense 2.0("GPL-3.0")。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
和訊投顧劉芳新:重磅利好來(lái)襲!下周這個(gè)方向即將起爆!

和訊投顧劉芳新:重磅利好來(lái)襲!下周這個(gè)方向即將起爆!

和訊網(wǎng)
2026-03-07 13:50:05
沒(méi)有人比五糧液更懂腦血栓

沒(méi)有人比五糧液更懂腦血栓

老斯基財(cái)經(jīng)
2026-03-06 17:18:30
內(nèi)塔尼亞胡做夢(mèng)也沒(méi)想到:親手扶持的“棋子”,正從背后捅戈蘭高地一刀

內(nèi)塔尼亞胡做夢(mèng)也沒(méi)想到:親手扶持的“棋子”,正從背后捅戈蘭高地一刀

起喜電影
2026-03-07 17:04:09
恐遭禁賽?中超最貴外援不滿判罰!做蒙眼吹哨手勢(shì)嘲諷張雷+染黃

恐遭禁賽?中超最貴外援不滿判罰!做蒙眼吹哨手勢(shì)嘲諷張雷+染黃

我愛(ài)英超
2026-03-07 22:33:36
謀新篇開(kāi)新局|開(kāi)局之年,這么干!

謀新篇開(kāi)新局|開(kāi)局之年,這么干!

新華社
2026-03-06 15:33:19
新疆真是五十步一個(gè)迪麗熱巴,這美貌不爆紅沒(méi)天理

新疆真是五十步一個(gè)迪麗熱巴,這美貌不爆紅沒(méi)天理

飛娛日記
2026-03-07 08:08:03
女孩當(dāng)小姐,一晚要提供4到5次上門服務(wù),2015年被親人點(diǎn)到不赴約

女孩當(dāng)小姐,一晚要提供4到5次上門服務(wù),2015年被親人點(diǎn)到不赴約

漢史趣聞
2025-11-08 09:27:32
CBA扣籃大賽預(yù)賽!俞澤辰100分力壓張鼎巖排第1,攜劉禮嘉晉級(jí)!

CBA扣籃大賽預(yù)賽!俞澤辰100分力壓張鼎巖排第1,攜劉禮嘉晉級(jí)!

籃球資訊達(dá)人
2026-03-07 22:44:59
韓國(guó)最新電影,超越《阿凡達(dá)3》,登頂票房冠軍!

韓國(guó)最新電影,超越《阿凡達(dá)3》,登頂票房冠軍!

小熊侃史
2026-03-07 22:59:53
44歲凱特王妃生理特征曝光!根本無(wú)法治愈,這次出鏡很“尷尬”

44歲凱特王妃生理特征曝光!根本無(wú)法治愈,這次出鏡很“尷尬”

夜深愛(ài)雜談
2026-03-07 18:54:52
奪下全國(guó)第一,磷化工巨頭,一戰(zhàn)成名!

奪下全國(guó)第一,磷化工巨頭,一戰(zhàn)成名!

飛鯨投研
2026-03-07 19:25:33
集體下挫!美聯(lián)儲(chǔ)降息,突傳大消息!

集體下挫!美聯(lián)儲(chǔ)降息,突傳大消息!

證券時(shí)報(bào)e公司
2026-03-07 22:27:40
特朗普脖子被發(fā)現(xiàn)異常,瞞不住的白宮承認(rèn),總統(tǒng)確實(shí)正在接受治療

特朗普脖子被發(fā)現(xiàn)異常,瞞不住的白宮承認(rèn),總統(tǒng)確實(shí)正在接受治療

牛鍋巴小釩
2026-03-07 15:23:05
悲報(bào):或因中日關(guān)系緊張,木村拓哉原定出演《九龍城寨》續(xù)集,開(kāi)拍前突然被臨時(shí)換掉!

悲報(bào):或因中日關(guān)系緊張,木村拓哉原定出演《九龍城寨》續(xù)集,開(kāi)拍前突然被臨時(shí)換掉!

日本物語(yǔ)
2026-03-07 20:35:30
A股:下周一穩(wěn)了!央行放出“王炸”,這兩個(gè)板塊將直接起飛!

A股:下周一穩(wěn)了!央行放出“王炸”,這兩個(gè)板塊將直接起飛!

夜深愛(ài)雜談
2026-03-07 18:59:55
江蘇省消保委提醒消費(fèi)者:別盲目入手“100%椰子水”

江蘇省消保委提醒消費(fèi)者:別盲目入手“100%椰子水”

揚(yáng)子晚報(bào)
2026-03-07 19:19:32
中華人民共和國(guó)居民身份證上竟然還有隱藏彩蛋!滿滿的科技感和中國(guó)元素

中華人民共和國(guó)居民身份證上竟然還有隱藏彩蛋!滿滿的科技感和中國(guó)元素

閃電新聞
2026-03-07 21:16:03
匈牙利“劫持”烏克蘭銀行押款車,大量歐元美元黃金被搶

匈牙利“劫持”烏克蘭銀行押款車,大量歐元美元黃金被搶

史政先鋒
2026-03-07 22:17:13
被打臉!俄代表在聯(lián)合國(guó)聲稱保護(hù)學(xué)校,卻毀掉烏克蘭1600所學(xué)校

被打臉!俄代表在聯(lián)合國(guó)聲稱保護(hù)學(xué)校,卻毀掉烏克蘭1600所學(xué)校

老馬拉車莫少裝
2026-03-05 11:08:36
中國(guó)最“閑”的3座機(jī)場(chǎng):每天飛1趟航班,飛機(jī)一走員工就集體下班

中國(guó)最“閑”的3座機(jī)場(chǎng):每天飛1趟航班,飛機(jī)一走員工就集體下班

青眼財(cái)經(jīng)
2026-03-07 23:26:43
2026-03-08 04:03:00
游云庭律師 incentive-icons
游云庭律師
互聯(lián)網(wǎng)法律評(píng)論
134文章數(shù) 189關(guān)注度
往期回顧 全部

科技要聞

OpenClaw爆火,六位"養(yǎng)蝦人"自述與AI共生

頭條要聞

選舉24小時(shí)內(nèi)舉行 伊朗今天或選出最高領(lǐng)袖

頭條要聞

選舉24小時(shí)內(nèi)舉行 伊朗今天或選出最高領(lǐng)袖

體育要聞

塔圖姆298天走完這段路 只用27分鐘征服這座城

娛樂(lè)要聞

汪小菲曝親媽猛料,張?zhí)m公開(kāi)財(cái)產(chǎn)分配

財(cái)經(jīng)要聞

針對(duì)"不敢休、不讓休"怪圈 國(guó)家出手了

汽車要聞

逃離ICU,上汽通用“止血”企穩(wěn)

態(tài)度原創(chuàng)

本地
藝術(shù)
房產(chǎn)
手機(jī)
親子

本地新聞

食味印象|一口入魂!康樂(lè)烤肉串起千年絲路香

藝術(shù)要聞

1.61億天價(jià)!陳丹青的《牧羊人》如何震撼藝術(shù)界?

房產(chǎn)要聞

傳統(tǒng)學(xué)區(qū)房熄火?2月??诙址勘鸬陌鍓K竟然是…

手機(jī)要聞

網(wǎng)曝OPPO Find N6渲染圖,或有橙色版本

親子要聞

長(zhǎng)輩勸你生娃的重要性尤其是女性!網(wǎng)友:年輕不懂,老了一定懂

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版