国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從最近的洗稿爭議,想到大模型訓(xùn)練的素材許可

0
分享至

最近,又因為洗稿的事吵起來了。

不表態(tài),也沒有明確的態(tài)度,就說說看法。我記得多年前一位作家,撰文說自己夢中偶得一佳句“江湖夜雨十年燈”,結(jié)果不想是黃庭堅的詩句,被人笑話了一陣。

洗稿,是處于“人人都知道,但卻難以下定論”的一種狀態(tài)。


這其實很正常,很合理。

因為,著作權(quán)法保護的是思想的表達(dá)而非思想本身。思想一般指概念、術(shù)語、原則、客觀事實、創(chuàng)意、發(fā)現(xiàn)等等。表達(dá)則一般指是指對于思想觀念的各種形式或方式的表述,如文字的、音符的、數(shù)字的、線條的、色彩的、造型的、形體動作的表述或傳達(dá)等。顯然,洗稿就是從表達(dá)上改變,從而避開著作權(quán)法。嚴(yán)格地說,通過“洗稿”方式,篡改刪減,是可以不構(gòu)成侵權(quán)抄襲剽竊原創(chuàng)作品的。

知識產(chǎn)權(quán)的保護,本來就存在一定的模糊性。中國知識產(chǎn)權(quán)法學(xué)界的泰斗鄭成思曾說:“知識產(chǎn)權(quán)是一門詭辯的學(xué)科。

其實,要講獨創(chuàng)思路、觀點的話,這么多年,我就太多了,我文章的特點就是有觀點。都要追究,哪里追究得完。當(dāng)然,我并不覺得該追究。別說所謂觀點,各類期刊直接把文章拿去發(fā),cnki一查。都很多。這個其實可以追究,但也麻煩。

比如,“智力的回歸”這個概念,我最初發(fā)在騰訊大家上的,把身高回歸的規(guī)律用在了智力上。我在網(wǎng)上搜索過,在我之前,沒人這么說過。如今,十多年過去,已經(jīng)成為常識了。那么,這是觀點的傳播還是洗稿?我能要求人人提到“智力回歸”都提到我的名字嗎?顯然,文章不是論文,沒辦法這樣要求。那么,不洗稿,觀點能傳播嗎?

其實,騰訊的洗稿評議機制,也在我公開發(fā)表的文章之后。當(dāng)時是六神磊磊指控另一個大號周沖洗稿,引發(fā)業(yè)內(nèi)熱議。我當(dāng)時提出,洗稿不違法,所以只能用行業(yè)評議解決。我是這么寫的:

洗稿乃至抄襲,大致上確定只需要兩個初中生,5分鐘,20塊錢。但法律上確定,需要請兩個博士后,5個月,200萬。如果洗稿的維權(quán)成本從后者變?yōu)榍罢?,維權(quán)就會變得簡單。所以,只有通過貝葉斯后驗的理念來進行判斷,即通過觀察到的信號來判斷發(fā)出信號的本質(zhì)。簡單地說就是,如果一只鳥多次看起來像鴨子,多次聽起來像鴨子,那么,它就是鴨子。


后來騰訊就有了洗稿評審,現(xiàn)在,我也不時能收到評議需求。不過,我當(dāng)時提出的是對公號原創(chuàng)程度的標(biāo)識,騰訊現(xiàn)在應(yīng)該是直接刪除。我提標(biāo)注,是因為洗稿并不侵權(quán),刪除有法律風(fēng)險。不過,騰訊可以基于用戶協(xié)議刪除。

這類例子,很多我也想不起了。

比如,最近想寫一篇文章,核心觀點就幾個字“優(yōu)質(zhì)教育資源,是不可能增加的,因為拼教育資源是為了競爭,而不是多學(xué)知識。人們要的是排序,而不是絕對值?!边@個觀點,隨著國家抹平內(nèi)卷的效率,過個十來年也許也會成為常識。

但法律并不能,也不該保護“觀點是我的”。因為傳播必然伴隨啟發(fā),傳播和啟發(fā)是同時發(fā)生的,而且,啟發(fā)應(yīng)該再次被傳播。而且,這個過程,正是法律想要保護的。某種程度上,它也是作者本身想達(dá)到的目的。

我們追求的正是這種外部性。

天下文章一大抄,這話說的是一個一直存在的現(xiàn)象。這其實很難免。

太陽之下無新事,常識需要不斷說,被別人重復(fù),被自己重復(fù)。當(dāng)然,我用自己之前的說理,我肯定會改改,不能完全一樣,或者引入當(dāng)時的具體事件。再比如某個2萬字的報告,有人總結(jié)了,我拿過來,改一下就用。或者某個新聞,有人總結(jié)了,我改一下用。一般來說,我接到洗稿評議,文章只是洗一兩段,不是核心部分,我不會給出洗稿的判斷。

對于洗稿質(zhì)疑,當(dāng)然還沒人質(zhì)疑過我哈,我覺得是不需要回應(yīng)的。因為我就是觀點產(chǎn)出型的,洗稿的指控對我不會有多大傷害。這同樣是基于貝葉斯后驗的,要多次看起來像洗稿,才能構(gòu)成對能力的質(zhì)疑。

寫這篇文章的時候,從洗稿想到AI訓(xùn)練的版權(quán)問題。這也是最近知識產(chǎn)權(quán)領(lǐng)域的爭論點?,F(xiàn)在有很多觀點了,我補充一個更底層的。(寫完了才發(fā)現(xiàn),這本身就是一個關(guān)于觀點傳播和洗稿的辨析例子)


第一個問題,訓(xùn)練是不是對素材的商業(yè)性應(yīng)用?

如果一個人看了一部電影,比如阿凡達(dá),從中受到啟發(fā),創(chuàng)造了另一種外星人的形象。這個形象不侵權(quán),完全不一樣。那么,可以說他對阿凡達(dá)進行了商業(yè)性應(yīng)用嗎?

一本書,讓一個人讀了,這個人學(xué)到一個道理,一個句式,產(chǎn)生了一幅圖像,得到一個靈感,應(yīng)用到了另一個地方。

這就是所謂的“啟發(fā)”。顯然,這不構(gòu)成對這本書、這部電影的商業(yè)應(yīng)用。正如我前面所說,法律不可能限制“啟發(fā)”——這正是知識產(chǎn)權(quán)保護想要達(dá)到的目標(biāo)。

那么,就進到第二個問題:啟發(fā)這個詞,形容的是一種觸類旁通的關(guān)系,是發(fā)散的、具有不確定性的智能上的因果關(guān)系。只有人才具有智能,所以,只有人才能受到啟發(fā)。那么,機器,從訓(xùn)練到生成文本或圖片,還是“啟發(fā)”嗎?

如果不是,反過來,則構(gòu)成對素材的商業(yè)應(yīng)用。某種程度上,就是另一種形式的洗稿。

那么,AI訓(xùn)練,從訓(xùn)練到生成新文本,是一種洗稿還是啟發(fā)?

如果計算機具有智慧的某種特征,那么,就可以視為啟發(fā)?,F(xiàn)在說大模型已經(jīng)有了涌現(xiàn)現(xiàn)象,應(yīng)該視為一個智能體。我覺得更關(guān)鍵的是,涌現(xiàn)具有發(fā)散性、不確定性的特征。

大模型中有很多隨機性。比如,temperature參數(shù)會直接改變輸出token的概率,這個參數(shù)甚至可以從外部環(huán)境調(diào)用,以獲得隨機性。

openai的api中也用seed這個參數(shù)來改變生成策略的隨機種子。

不同型號的GPU 之間的浮點數(shù)計算可能會略有差異,不能保證bit級別的一致性。這些差異,在巨大的參數(shù)累積下,剛開始生成的token是一樣的,但是從某個 token 開始,后續(xù)的生成結(jié)果就不一樣了。從這個角度,涌現(xiàn),也有發(fā)散、不確定性的特征。

這些隨機性,很多已經(jīng)是不可還原的了。這種不可還原的發(fā)散和不確定性,可以認(rèn)定類似人類智慧,所以,訓(xùn)練是被啟發(fā),而不是洗稿,那么,就不構(gòu)成商業(yè)應(yīng)用,就無需許可。


單純從數(shù)量上說,資料浩如煙海,參數(shù)多數(shù)繁星,很難認(rèn)定“素材——產(chǎn)出”的因果關(guān)系。而沒有這種因果關(guān)系,當(dāng)然不構(gòu)成商業(yè)應(yīng)用,所以,自然不需要特殊的許可。凡是公開的,都可以被合法地用來訓(xùn)練。

或者說,只要被人看到是合法的,無需許可,那么,被用來訓(xùn)練,就無需許可。

需要注意的是,有這樣一種論證方式:人作為智能體,是有民事權(quán)利的。這是“啟發(fā)”的法律前提。但顯然,大模型沒有這個資格,所以,它不能被“啟發(fā)”。但是,這種論證只是循環(huán)論證。

這一段中,一些技術(shù)細(xì)節(jié),是我查閱的,然后拿來用了,另一些技術(shù)細(xì)節(jié)我本來就知道(當(dāng)然,也是從其他地方看到),但這都并不影響我這段論述的原創(chuàng)性。

這一段論述,遇到相關(guān)話題,我肯定是要用的,不然挺可惜的。如果有人洗稿了,我也會不高興,但時間足夠長,我也就無所謂了??傊?,要求高沒錯,辯解也沒錯,都不必太在意。

劉 遠(yuǎn) 舉


央視網(wǎng)、第一財經(jīng)、光明日報、騰訊大家、南方周末、新京報、南方都市報、FT中文網(wǎng)、澎湃等特約作家,多家智庫研究員。

關(guān)注時政、財經(jīng)、科技話題,以深度、專業(yè)、理性的態(tài)度,去掘現(xiàn)象背后的事實。

中國科技自媒體50人

第35屆中國新聞獎評論三等獎

第34屆中國經(jīng)濟新聞獎評論二等獎

第28屆北京新聞獎一等獎

2024年湖南新聞獎一等獎

騰訊大家年度作家獎

新浪最有價值專欄作家獎

紅辣椒評論年度佳作獎

已開快捷轉(zhuǎn)載,歡迎轉(zhuǎn)載

已開過白名單的公眾號,轉(zhuǎn)載請遵循轉(zhuǎn)載規(guī)則

您的關(guān)注是最好的支持!


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
兩岸喜訊!大陸沒想到,沒等正式收臺,臺當(dāng)局先送來2份“大禮”

兩岸喜訊!大陸沒想到,沒等正式收臺,臺當(dāng)局先送來2份“大禮”

趣生活
2026-01-10 22:29:06
三十年后,街機游戲突然非法了

三十年后,街機游戲突然非法了

街機時代
2025-12-12 10:00:03
韓國女星兒子上節(jié)目口無遮攔,曝光稱:“父母每晚睡覺都很熱鬧”

韓國女星兒子上節(jié)目口無遮攔,曝光稱:“父母每晚睡覺都很熱鬧”

獨舞獨舞
2026-01-08 20:46:56
連續(xù)20場20+得分!實力倒退7年,果斷健康的你,真能改變聯(lián)盟格局

連續(xù)20場20+得分!實力倒退7年,果斷健康的你,真能改變聯(lián)盟格局

巴叔GO聊體育
2026-01-11 16:16:41
庫里生涯總薪資5.3億,實際到手能有多少?說出來你別不信!

庫里生涯總薪資5.3億,實際到手能有多少?說出來你別不信!

籃球看比賽
2026-01-11 11:36:30
上海民警喬裝打扮混入詐騙團伙偵查,凌晨多地抓捕72人

上海民警喬裝打扮混入詐騙團伙偵查,凌晨多地抓捕72人

澎湃新聞
2026-01-11 14:54:27
豐田神車“低頭了”! 普拉多煥新價僅售39.98萬,還要啥方程豹豹8?

豐田神車“低頭了”! 普拉多煥新價僅售39.98萬,還要啥方程豹豹8?

隔壁說車?yán)贤?/span>
2026-01-11 06:35:05
鄭爽廣電封禁通知曝光!日子久了都忘了她有多惡劣,違法還棄養(yǎng)

鄭爽廣電封禁通知曝光!日子久了都忘了她有多惡劣,違法還棄養(yǎng)

萌神木木
2026-01-11 16:41:19
做最壞打算!中國055大驅(qū)第二批加速,美媒:還有被美軍扣船隱憂

做最壞打算!中國055大驅(qū)第二批加速,美媒:還有被美軍扣船隱憂

諦聽骨語本尊
2026-01-09 19:26:20
那些本子里的大雷女主角,其實都是作者照著自己畫的?

那些本子里的大雷女主角,其實都是作者照著自己畫的?

游戲動力ATK
2026-01-09 23:18:53
WTT多哈賽11日凌晨!一場4-0 4強出爐 中國天才少年送日本新星慘敗

WTT多哈賽11日凌晨!一場4-0 4強出爐 中國天才少年送日本新星慘敗

林子說事
2026-01-11 03:35:20
特朗普聽取匯報,威脅最快下周打擊伊朗

特朗普聽取匯報,威脅最快下周打擊伊朗

山河路口
2026-01-11 12:14:33
滿是心酸!42歲著名歌手江蘇走穴,賓客只顧吃席沒人搭理

滿是心酸!42歲著名歌手江蘇走穴,賓客只顧吃席沒人搭理

阿燕姐說育兒
2026-01-10 00:27:50
撒切爾夫人在回憶錄中坦言:當(dāng)年并不想歸還香港,考慮過發(fā)動戰(zhàn)爭

撒切爾夫人在回憶錄中坦言:當(dāng)年并不想歸還香港,考慮過發(fā)動戰(zhàn)爭

泠泠說史
2025-12-15 18:05:17
楊瀚森已經(jīng)度過周琦未過的第一關(guān),經(jīng)受住了NBA底層邏輯的考驗

楊瀚森已經(jīng)度過周琦未過的第一關(guān),經(jīng)受住了NBA底層邏輯的考驗

小驛拍客在北漂
2026-01-11 13:58:13
中越戰(zhàn)爭老兵自述:當(dāng)時沒有749局的幫助,55軍團可能全軍覆滅

中越戰(zhàn)爭老兵自述:當(dāng)時沒有749局的幫助,55軍團可能全軍覆滅

神奇的錘子
2024-08-19 14:20:51
王茜發(fā)飆,輸球后指揮隊員!劉美君劉鑫孟豆表現(xiàn)太差,陳方也無用

王茜發(fā)飆,輸球后指揮隊員!劉美君劉鑫孟豆表現(xiàn)太差,陳方也無用

金毛愛女排
2026-01-11 08:32:37
全世界就中國有!曾被老百姓當(dāng)柴燒,2023年洞庭湖又發(fā)現(xiàn)兩三百棵

全世界就中國有!曾被老百姓當(dāng)柴燒,2023年洞庭湖又發(fā)現(xiàn)兩三百棵

北緯的咖啡豆
2026-01-04 14:49:26
破局重生丨12星座在2026年要經(jīng)歷哪些歷練

破局重生丨12星座在2026年要經(jīng)歷哪些歷練

Pandora占星小巫
2026-01-10 15:40:40
體檢報告中,若這3個指標(biāo)都正常,基本可排除很多疾病

體檢報告中,若這3個指標(biāo)都正常,基本可排除很多疾病

財經(jīng)早餐
2025-08-05 06:38:02
2026-01-11 17:24:49
劉遠(yuǎn)舉 incentive-icons
劉遠(yuǎn)舉
易起探尋現(xiàn)象背后的事實與公正
336文章數(shù) 1362關(guān)注度
往期回顧 全部

頭條要聞

西安小伙騎小黃車抵達(dá)三亞:29天騎行3500公里瘦20斤

頭條要聞

西安小伙騎小黃車抵達(dá)三亞:29天騎行3500公里瘦20斤

體育要聞

詹皇曬照不滿打手沒哨 裁判報告最后兩分鐘無誤判

娛樂要聞

網(wǎng)友偶遇賈玲張小斐崇禮滑雪

財經(jīng)要聞

外賣平臺"燒錢搶存量市場"迎來終局?

科技要聞

“我們與美國的差距也許還在拉大”

汽車要聞

2026款宋Pro DM-i長續(xù)航補貼后9.98萬起

態(tài)度原創(chuàng)

旅游
游戲
教育
藝術(shù)
公開課

旅游要聞

昆侖有什么好,讓神仙都搶著落戶大西北?

太不值錢了吧,PS5版《怪物獵人:荒野》二手收購價低至18日元

教育要聞

美國中考題,中國小學(xué)生口算

藝術(shù)要聞

引爆期待!275米,東莞第四高樓封頂!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版