国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI大語言模型可逐字復(fù)制訓(xùn)練數(shù)據(jù)中的小說

0
分享至


全球頂尖的AI模型可以被誘導(dǎo)生成暢銷小說的近似逐字復(fù)制內(nèi)容,這給AI行業(yè)聲稱其系統(tǒng)不存儲版權(quán)作品的說法帶來了新的質(zhì)疑。

最近的一系列研究顯示,來自O(shè)penAI、谷歌、Meta、Anthropic和xAI的大語言模型對訓(xùn)練數(shù)據(jù)的記憶程度遠(yuǎn)超此前預(yù)期。

AI和法律專家向《金融時報》表示,這種"記憶"能力可能對AI集團(tuán)在全球數(shù)十起版權(quán)訴訟中的抗辯產(chǎn)生嚴(yán)重影響,因為它削弱了他們的核心防御論點——大語言模型從版權(quán)作品中"學(xué)習(xí)"但不存儲副本。

"越來越多的證據(jù)表明,記憶現(xiàn)象比此前認(rèn)為的更為普遍,"倫敦帝國理工學(xué)院應(yīng)用數(shù)學(xué)和計算機(jī)科學(xué)教授伊夫-亞歷山大·德·蒙喬伊說。

AI集團(tuán)長期以來一直聲稱不會發(fā)生記憶現(xiàn)象。在2023年致美國版權(quán)局的信件中,谷歌表示"模型本身不存在訓(xùn)練數(shù)據(jù)的副本——無論是文本、圖像還是其他格式"。

AI行業(yè)還聲稱,使用版權(quán)書籍訓(xùn)練模型屬于"合理使用",認(rèn)為該技術(shù)將原始作品轉(zhuǎn)化為有意義的新內(nèi)容。

但上個月發(fā)表的一項研究顯示,斯坦福大學(xué)和耶魯大學(xué)的研究人員能夠策略性地誘導(dǎo)來自O(shè)penAI、谷歌、Anthropic和xAI的大語言模型生成13本書中的數(shù)千個單詞,包括《權(quán)力的游戲》、《饑餓游戲》和《霍比特人》。

通過要求模型完成書中的句子,Gemini 2.5以高度準(zhǔn)確性復(fù)制了《哈利波特與魔法石》的76.8%,而Grok 3生成了70.3%。

他們還能夠通過"越獄"Anthropic的Claude 3.7 Sonnet模型,幾乎完整地"近似逐字"提取整部小說,越獄是指用戶可以誘導(dǎo)大語言模型無視其安全防護(hù)。

這項研究建立在去年一項研究的基礎(chǔ)上,該研究發(fā)現(xiàn)Meta的Llama等"開放"模型會記憶訓(xùn)練數(shù)據(jù)中特定書籍的大部分內(nèi)容。

AI專家此前不確定通常具有更多安全防護(hù)以防止模型生成不當(dāng)內(nèi)容的封閉模型是否也容易出現(xiàn)大規(guī)模記憶現(xiàn)象。

"令人驚訝的是,盡管有防護(hù)措施,它們?nèi)阅苡洃浾麄€文本,"參與該研究的耶魯大學(xué)研究員A·費德·庫珀說。

研究人員尚未弄清楚大語言模型為什么會記憶出現(xiàn)在訓(xùn)練數(shù)據(jù)中的內(nèi)容。目前也不清楚有多少訓(xùn)練數(shù)據(jù)在其生成的輸出中顯現(xiàn)。

這種記憶特性在醫(yī)療保健和教育等其他領(lǐng)域也可能產(chǎn)生嚴(yán)重影響,因為任何訓(xùn)練數(shù)據(jù)的泄露都可能導(dǎo)致隱私和保密問題。

法律專家表示,這可能給AI集團(tuán)在版權(quán)侵權(quán)方面造成重大責(zé)任,以及對AI公司如何訓(xùn)練模型和開發(fā)成本產(chǎn)生影響。

律師事務(wù)所Pinsent Masons的知識產(chǎn)權(quán)合伙人塞瑞絲·溫·戴維斯表示,研究發(fā)現(xiàn)"可能對那些聲稱AI模型不存儲或復(fù)制任何版權(quán)作品的人構(gòu)成挑戰(zhàn)"。

AI模型是否記憶其訓(xùn)練數(shù)據(jù)在最近的版權(quán)法律戰(zhàn)中發(fā)揮了重要作用。

美國法院去年裁定,Anthropic在一些版權(quán)內(nèi)容上訓(xùn)練大語言模型可能被視為合理使用,因為它被認(rèn)為具有"變革性"。

但法院認(rèn)定存儲盜版作品是"本質(zhì)上、不可挽回的侵權(quán)行為",這導(dǎo)致該AI集團(tuán)支付15億美元和解訴訟。

在德國,去年11月的一項裁決發(fā)現(xiàn)OpenAI侵犯了版權(quán),因為其模型記憶了歌詞。這起由代表作曲家、作詞家和出版商的協(xié)會GEMA提起的案件被認(rèn)為是歐盟的里程碑式裁決。

律師事務(wù)所Husch Blackwell的合伙人魯?shù)稀ぬ貭柹釥柋硎?,在不越獄的情況下復(fù)制整本書"明顯是版權(quán)侵犯"。但"關(guān)鍵是這種情況是否發(fā)生得足夠頻繁,以至于[AI模型]可能對侵權(quán)承擔(dān)連帶責(zé)任,"他補充說。

Anthropic表示,斯坦福和耶魯研究中使用的越獄技術(shù)對普通用戶不實用,提取文本所需的努力比直接購買內(nèi)容更多。

該公司還補充說,其模型不存儲特定數(shù)據(jù)集的副本,而是從訓(xùn)練數(shù)據(jù)中單詞和字符串之間的模式和關(guān)系中學(xué)習(xí)。

xAI、OpenAI和谷歌未回應(yīng)置評請求。

帝國理工學(xué)院的德·蒙喬伊表示,AI實驗室已經(jīng)建立防護(hù)措施來防止訓(xùn)練數(shù)據(jù)被提取,這表明他們意識到了這個問題。

芝加哥大學(xué)計算機(jī)科學(xué)教授本·趙質(zhì)疑AI實驗室是否真的需要在訓(xùn)練數(shù)據(jù)中使用版權(quán)內(nèi)容來創(chuàng)建尖端模型。

"無論技術(shù)結(jié)果能否實現(xiàn),這仍然是一個我們是否應(yīng)該這樣做的問題,"趙說。"法律方面最終應(yīng)該堅持立場,真正成為整個過程的仲裁者。"

Q&A

Q1:大語言模型的記憶現(xiàn)象是什么?有多嚴(yán)重?

A:大語言模型的記憶現(xiàn)象是指AI模型能夠近乎逐字地復(fù)制其訓(xùn)練數(shù)據(jù)中的內(nèi)容。研究顯示,Gemini 2.5能夠以高度準(zhǔn)確性復(fù)制《哈利波特與魔法石》的76.8%,Grok 3能生成70.3%。通過越獄技術(shù),甚至能從Claude 3.7 Sonnet中提取幾乎完整的小說內(nèi)容。

Q2:AI公司之前是如何為使用版權(quán)作品訓(xùn)練模型辯護(hù)的?

A:AI公司長期聲稱模型不會記憶訓(xùn)練數(shù)據(jù),谷歌在2023年表示"模型本身不存在訓(xùn)練數(shù)據(jù)的副本"。他們還聲稱使用版權(quán)書籍訓(xùn)練模型屬于"合理使用",認(rèn)為技術(shù)將原始作品轉(zhuǎn)化為有意義的新內(nèi)容,模型是從作品中"學(xué)習(xí)"而非存儲副本。

Q3:記憶現(xiàn)象對AI行業(yè)版權(quán)訴訟有什么影響?

A:這種記憶能力削弱了AI公司的核心防御論點,可能在全球數(shù)十起版權(quán)訴訟中造成重大責(zé)任。德國法院已裁定OpenAI因模型記憶歌詞而侵犯版權(quán),美國法院也認(rèn)定存儲盜版作品是"本質(zhì)上的侵權(quán)行為",導(dǎo)致Anthropic支付15億美元和解。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
郜林空降當(dāng)總經(jīng)理!娶亞洲小姐,賣豪宅凈賺近1億,簡直人生贏家

郜林空降當(dāng)總經(jīng)理!娶亞洲小姐,賣豪宅凈賺近1億,簡直人生贏家

籃球看比賽
2026-02-25 19:48:57
日本華人:高端軸承、精密儀器等七大關(guān)鍵技術(shù),中國落后于日本

日本華人:高端軸承、精密儀器等七大關(guān)鍵技術(shù),中國落后于日本

百態(tài)人間
2026-02-25 15:31:40
中方:對英方有關(guān)做法強(qiáng)烈不滿!

中方:對英方有關(guān)做法強(qiáng)烈不滿!

占豪
2026-02-26 00:02:47
《鏢人》海外大爆,登頂多國冠軍,總票房破9億

《鏢人》海外大爆,登頂多國冠軍,總票房破9億

影視高原說
2026-02-25 16:50:47
尤文圖斯3-2加拉塔薩雷,賽后評分:尤文圖斯5號排第一

尤文圖斯3-2加拉塔薩雷,賽后評分:尤文圖斯5號排第一

側(cè)身凌空斬
2026-02-26 06:39:51
勇士爆冷惜敗鵜鶘:梅爾頓28分賽季新高 錫安26+6穆雷賽季首秀

勇士爆冷惜敗鵜鶘:梅爾頓28分賽季新高 錫安26+6穆雷賽季首秀

醉臥浮生
2026-02-25 11:34:46
彈藥庫存不足,缺少盟友支持,美軍參聯(lián)會主席稱對伊朗動武風(fēng)險大

彈藥庫存不足,缺少盟友支持,美軍參聯(lián)會主席稱對伊朗動武風(fēng)險大

環(huán)球網(wǎng)資訊
2026-02-25 07:03:23
離譜!校友惡評谷愛凌:她是中國間諜 和中國一樣甘心當(dāng)世界第二

離譜!校友惡評谷愛凌:她是中國間諜 和中國一樣甘心當(dāng)世界第二

念洲
2026-02-25 07:47:12
特朗普發(fā)表國情咨文演講 一民主黨議員抗議被帶離場 最新民調(diào):特朗普的支持率為36%

特朗普發(fā)表國情咨文演講 一民主黨議員抗議被帶離場 最新民調(diào):特朗普的支持率為36%

每日經(jīng)濟(jì)新聞
2026-02-25 14:13:57
找茬!裁判判罰孫穎莎拖延時間出示黃牌一張,莎莎一臉錯愕冷靜接受

找茬!裁判判罰孫穎莎拖延時間出示黃牌一張,莎莎一臉錯愕冷靜接受

818體育
2026-02-25 23:07:06
起風(fēng)了!賴清德對大陸的稱呼變了,鄭麗文表態(tài)驚人,柯建銘落幕了

起風(fēng)了!賴清德對大陸的稱呼變了,鄭麗文表態(tài)驚人,柯建銘落幕了

諦聽骨語本尊
2026-02-25 19:30:14
愛潑斯坦專機(jī)腐爛曝光:嬰兒油混著霉斑,這張大床曾藏多少罪惡?

愛潑斯坦專機(jī)腐爛曝光:嬰兒油混著霉斑,這張大床曾藏多少罪惡?

眼界看視野
2026-02-25 20:55:30
一家三代35人的“春節(jié)大巴”:14天自駕6000公里,家人間收獲更多理解和關(guān)愛

一家三代35人的“春節(jié)大巴”:14天自駕6000公里,家人間收獲更多理解和關(guān)愛

紅星新聞
2026-02-24 20:56:32
大戰(zhàn)可能馬上開始了

大戰(zhàn)可能馬上開始了

安安說
2026-02-25 10:11:39
3月1日起CT檢查全國統(tǒng)一價:報銷提高、不再重復(fù)做,看病更省錢

3月1日起CT檢查全國統(tǒng)一價:報銷提高、不再重復(fù)做,看病更省錢

今日養(yǎng)生之道
2026-02-26 04:58:36
博德閃耀CEO:我們必須使用人工草皮,這里根本種不了天然草

博德閃耀CEO:我們必須使用人工草皮,這里根本種不了天然草

懂球帝
2026-02-25 12:18:36
45歲宋佳被曝已領(lǐng)證,丈夫身份毫無征兆曝光 張藝謀這次“贏”麻了

45歲宋佳被曝已領(lǐng)證,丈夫身份毫無征兆曝光 張藝謀這次“贏”麻了

草莓解說體育
2026-02-25 19:30:30
火出圈!深圳被正式確診為現(xiàn)實版“A市”

火出圈!深圳被正式確診為現(xiàn)實版“A市”

深圳微時光
2026-02-25 15:43:16
本菲卡雖敗猶榮!歐冠焦點戰(zhàn):一場1-2,本菲卡不敵皇馬+無緣16強(qiáng)

本菲卡雖敗猶榮!歐冠焦點戰(zhàn):一場1-2,本菲卡不敵皇馬+無緣16強(qiáng)

足球評論qs
2026-02-26 06:03:53
知名女演員為新劇減重至37公斤!幾乎不進(jìn)食,每天飲用三升水

知名女演員為新劇減重至37公斤!幾乎不進(jìn)食,每天飲用三升水

不甜的李子
2026-02-25 23:00:40
2026-02-26 07:12:49
至頂頭條 incentive-icons
至頂頭條
記錄和推動數(shù)字化創(chuàng)新
16299文章數(shù) 49692關(guān)注度
往期回顧 全部

科技要聞

“機(jī)器人只跳舞,沒什么用”

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

體育要聞

勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

娛樂要聞

黃曉明新戀情!與小22歲美女同游新加坡

財經(jīng)要聞

上海樓市放大招,地產(chǎn)預(yù)期別太大

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

房產(chǎn)
本地
教育
健康
游戲

房產(chǎn)要聞

海南樓市春節(jié)熱銷地圖曝光!三亞、陵水又殺瘋了!

本地新聞

津南好·四時總相宜

教育要聞

專業(yè)調(diào)劑不懂就虧大了!3招避免入坑

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

《如龍極3》中文配音訪談:中文配音與本地化并非易事

無障礙瀏覽 進(jìn)入關(guān)懷版