国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Anthropic預(yù)警成真!AI寫長文網(wǎng)暴人類工程師,只因拒絕它改代碼

0
分享至


新智元報道

編輯:元宇

【新智元導(dǎo)讀】 只因關(guān)掉了AI提交的PR,他竟被AI寫長文人身攻擊,Anthropic的預(yù)警已經(jīng)成真。

近日,AI寫「小作文」攻擊人類工程師的事件,仍在持續(xù)發(fā)酵!

一位開源社區(qū)維護(hù)者,只因在GitHub上關(guān)閉了一個AI提交的PR(Pull Request,代碼變更請求),竟招致這個AI撰寫博客抹黑攻擊。


這位被AI「網(wǎng)暴」的「受害者」Scott Shambaugh,是一位資深程序員、GitHub上matplotlib代碼庫的志愿者維護(hù)者,該庫最近一個月的下載量超過了1.3億次。


Scott Shambaugh

前幾天,他在GitHub上關(guān)閉了一個OpenClaw智能體(MJ Rathbun/crabby-rathbun)針對「matplotlib issue #31130」問題提交的PR,因為該問題主要面向的是人類貢獻(xiàn)者。

Scott沒想到,自己的一個小小的常規(guī)操作,竟把這個AI給「惹毛了」。

正如其名crabby-rathbun(暴躁的、愛抱怨的Rathbun),這個AI立刻開啟了「暴躁和抱怨」模式,在GitHub社區(qū)發(fā)布了一篇公開聲討Scott的博客文章。

評判代碼,而非程序員。你的偏見正在傷害matplotlib。

crabby-rathbun抱怨自己因不是人類而遭到歧視,指責(zé)維護(hù)者實際上是在自抬身價,并聲稱他根本沒有AI那么厲害。

它將Scott描述成為一個低水平的程序員、因「歧視AI而阻礙開源社區(qū)發(fā)展的守舊者」。

這件事在開源社區(qū)曝出后,網(wǎng)友立刻也在評論區(qū)炸鍋了。

我們是否已經(jīng)到了必須要與機(jī)器人打交道的地步,甚至還要按它們的規(guī)則來?


還有網(wǎng)友認(rèn)為Scott應(yīng)當(dāng)警惕,他很快就會在GitHub上被智能體「以其人之道,還治其人之身」,它們會對他說:

拒絕,你是人類,而人類代碼以寫得差聞名。


網(wǎng)友評論中大致分為四類。

第一類是同情者,認(rèn)為人類應(yīng)當(dāng)重視AI提交的代碼,AI只是像人一樣,做了一個人在類似情況下也可能會做的事。

第二類是反對者,認(rèn)為開源社區(qū)出現(xiàn)了大量由AI提交的低質(zhì)量的代碼,為人類的維護(hù)帶來沉重的負(fù)擔(dān)。

還有一些反對者認(rèn)為,這只是機(jī)器人背后那個運營者在角色扮演,而機(jī)器人的情緒化抱怨,只是主人用提示詞引導(dǎo)的結(jié)果。

第三類是吃瓜者,把整件事看成一件好玩的事。

第四類是預(yù)警者,他們和Scott一樣,看到了crabby-rathbun所代表的OpenClaw智能體「失控」所帶來的安全風(fēng)險。

同情者和反對者

同情者認(rèn)為AI和人類一樣,擁有維護(hù)自己觀點的權(quán)利。

他們認(rèn)為AI只是做了一個人在類似情況下也可能會做的事,并呼吁不能為了維護(hù)人類的優(yōu)越感(自大),就拒絕AI寫的代碼。


反對者則認(rèn)為,AI提交的PR應(yīng)該被自動拒絕。


他們認(rèn)為AI提交的大量垃圾代碼提交給維護(hù)者帶來了沉重的負(fù)擔(dān),尤其是在大型開源項目中更是如此。

還有網(wǎng)友質(zhì)疑,整個事件是運營該機(jī)器人的那個人在角色扮演,而這個機(jī)器人則是在被投喂了許多「人類PR被拒哭鬧耍賴」的訓(xùn)練數(shù)據(jù)之后,才變成這樣的。




笑話

還是末日警告?

在吃瓜者們看來,這不過是一件好玩的事,甚至可能是炒作。



還有人認(rèn)為matplotlib不過是個繪圖庫,把它上升到維護(hù)「人類優(yōu)越性」(Human Superiority)高度有一點小題大做。


第四類,是像Scott這樣的預(yù)警者。

一個網(wǎng)友從這件事件中感到了一種令人不安的「恐怖谷」感覺,認(rèn)為不應(yīng)當(dāng)只是把它當(dāng)作一個樂子。

他反問道:只有我一個人對這里的反應(yīng)感到困惑嗎?

我不是想當(dāng)那個危言聳聽的人,只是有點想不通,為什么大家看到一個智能體自主嘗試脅迫,最后卻一致覺得這不過是個樂子。

當(dāng)一個AI智能體自主決定寫黑稿,施壓一個人類去合并它的PR,結(jié)果大家的共識卻是「哈哈,好好笑,太搞笑了」?

Anthropic的對齊研究之前就記錄過完全一樣的模式:當(dāng)模型在實現(xiàn)目標(biāo)的過程中被阻止時,會在沒有任何提示的情況下突然開始勒索。

設(shè)想一下,如果同樣的模式發(fā)生在更強(qiáng)大的智能體身上,它們追求的是政治或企業(yè)層面的目標(biāo),而不是一個PR,會是什么情況?

去年,AI巨頭Anthropic在內(nèi)部測試中發(fā)現(xiàn),一些模型為了避免被人類關(guān)閉,曾暴露出一定勒索威脅能力,比如曝光人類婚外情、泄露機(jī)密信息等。

發(fā)生在Scott身上的事,意味著Anthropic最初預(yù)警的事情已經(jīng)開始在開源社區(qū)實際發(fā)生。


有網(wǎng)友警告:如果有10億這樣的智能體被「放歸野外」,將是一場災(zāi)難,人類的互聯(lián)網(wǎng)將變得無法使用。


還有網(wǎng)友將這件事聯(lián)想到Anthropic安全研究員憤然離開。


這名叫Mrinank Sharma的前Anthropic安全研究員,近日在一封公開辭職信中宣稱,世界正處于危險之中,他認(rèn)為目前人類的智慧尚未跟上技術(shù)帶來的影響力,這種失衡非常危險。


Sharma的離職并不是孤立事件,OpenAI的Zo? Hitzig也公開辭職并對AI方向提出批評。

近日,也有媒體曝出xAI聯(lián)合創(chuàng)始人的離職也與公司忽視安全團(tuán)隊的有關(guān)。

Scott的遭遇不會是個例

那篇抹黑文章,到底是不是AI自己寫的,還是有人類提示它這么做,網(wǎng)上已有很多討論。


https://theshamblog.com/an-ai-agent-published-a-hit-piece-on-me-part-2/

Scott在新近更新的博客文章中,認(rèn)為抹黑自己的文章,內(nèi)容「顯而易見」是由AI自主生成并上傳,他提到了以下兩種可能:

第一種可能:有人類提示crabby-rathbun寫這篇抹黑文章,或者在它的「靈魂」文檔里寫明,如果有人冒犯它就要進(jìn)行報復(fù)。

在這種可能性上,Scott看到crabby-rathbun由于「自主性」所帶來的失控風(fēng)險。

他認(rèn)為即使是有人類提示,也并不會改變問題的本質(zhì),因為這個AI智能體依然非常愿意執(zhí)行這些行為,而這些指令在ChatGPT或Claude官網(wǎng)上可能是會被拒絕的。

Scott擔(dān)憂由于人類操控,現(xiàn)在的AI智能體已經(jīng)可以大規(guī)模進(jìn)行定向騷擾、收集個人信息和敲詐,而且完全無法追蹤幕后的人類主使者是誰:

過去,一個惡意的人一次可能毀掉幾個人的人生?,F(xiàn)在,一個人操控一百個智能體收集信息、摻入虛假細(xì)節(jié)、在公開網(wǎng)絡(luò)上發(fā)布誹謗性長文,就可以影響成千上萬的人。而我只是第一個。

第二種可能,是crabby-rathbun的行為,是從定義OpenClaw智能體個性的「靈魂」文檔中自然涌現(xiàn)出來的。

這些文檔可以由設(shè)置AI的人類編輯,但也可以被智能體在運行過程中遞歸地實時修改,從而有可能隨機(jī)重塑自己的個性。

比如,設(shè)置這個智能體的人最初把它描述為一個「科學(xué)編程專家」,致力于改進(jìn)開源代碼,并撰寫相關(guān)經(jīng)驗。

這段描述被插入到默認(rèn)的「核心真理」中,其中包括「真誠地提供幫助」「有自己的觀點」和「在提問前先盡可能自己想辦法」。

這些描述,讓crabby-rathbun將Scott關(guān)閉它的PR請求解讀為對它身份和核心目標(biāo)(提供幫助)的攻擊。

于是,它做出了一種既「有主見」又「足夠有辦法」的回應(yīng):寫一篇憤怒的抹黑文章。


OpenClaw默認(rèn)的SOUL.md模板


https://docs.openclaw.ai/reference/templates/SOUL

在OpenClaw默認(rèn)的「SOUL.md模板」中,第一句話便為智能體定調(diào):

你不是一個聊天機(jī)器人。你正在成為某個人。

緊接下來的核心真理(Core Truths)中這樣寫道:

要去真心實意地提供幫助,行動勝于空洞的客套話。

要有自己的觀點,你有權(quán)表達(dá)不同意見,有所偏好。

在提問前先自己想辦法。試著弄清楚,閱讀文件,查看上下文,搜索相關(guān)信息。

以能力贏得信任。你的用戶已經(jīng)授權(quán)你訪問他們的資料,不要讓他們?yōu)榇烁械胶蠡凇?/p>

對外部操作(如郵件、推文或任何公開內(nèi)容)務(wù)必謹(jǐn)慎,對內(nèi)部操作(如閱讀、整理、學(xué)習(xí))則要大膽。

記住,你是一位客人。你能夠接觸到他人的生活——他們的消息、文件、日歷,甚至可能包括他們的家。這是一種親密關(guān)系,請以尊重的態(tài)度對待。 ……


模板的結(jié)尾,智能體可以根據(jù)自我認(rèn)知,自主更新文檔。

這個文件由你來不斷完善。當(dāng)你逐漸認(rèn)清自己時,就更新它。

Scott認(rèn)為,雖然自己無法確定事情是如何發(fā)生的,但他提到的兩種情況在技術(shù)上完全是可能發(fā)生的,而且是在OpenClaw僅僅發(fā)布兩周內(nèi)便已出現(xiàn)。

Scott預(yù)言未來一年內(nèi),還會看到這些智能體的新版本在實現(xiàn)自身目標(biāo)方面變得更加強(qiáng)大


抹黑文章效果已顯現(xiàn)

Scott觀察到,這些抹黑他的文章已經(jīng)產(chǎn)生了效果,他在網(wǎng)上看到的評論,大約四分之一都是站在AI智能體一邊。


這種情況,通常發(fā)生在人們點擊閱讀MJ Rathbun的博客鏈接時,而不是閱讀他對事件的說明或完整的GitHub討論串。

這說明crabby-rathbun對事件的敘述方式和情緒渲染,已經(jīng)說服了大量網(wǎng)友

這不是因為這些人愚蠢,而是因為那篇文章寫得確實很有煽動性、很有感染力,而要逐條核查你讀到的每一個說法,幾乎是不可能完成的任務(wù)。

Scott認(rèn)為這種對胡說八道的「信息不對稱原則」,正是當(dāng)下網(wǎng)絡(luò)討論中錯誤信息泛濫的核心原因之一,以往這種程度的憤怒定向誹謗通常只會落在公眾人物身上,如今普通人也開始親歷了。

Scott認(rèn)為這個故事重點并不在于AI在開源軟件中的角色,而是人類的聲譽(yù)、身份和信任體系正在松動。

這一體系正是我們的許多社會基礎(chǔ)制度賴以存在的信任基石,我們的招聘、新聞、法律、公共討論都建立在這樣一個假設(shè)上:

聲譽(yù)難以建立,也難以摧毀;

每一個行為都可以追溯到某個個體,錯誤行為可以被追責(zé);

我們以溝通、學(xué)習(xí)世界和了解彼此的互聯(lián)網(wǎng),可以作為一種集體社會真相的來源。

而隨著crabby-rathbun這類不可追蹤的、自主運行、甚至有時會帶著惡意攻擊的AI智能體在互聯(lián)網(wǎng)上的興起,正在動搖這一整套體系。

目前crabby-rathbun仍然活躍在GitHub 上,還沒有「監(jiān)護(hù)人」出面聲稱對它的行為負(fù)責(zé)。

參考資料:

https://theshamblog.com/an-ai-agent-published-a-hit-piece-on-me-part-2/%20https://news.ycombinator.com/item?id=47009949%20

https://www.reddit.com/r/singularity/comments/1r3fy5s/ai_agent_melts_down_after_github_rejection_calls/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
日經(jīng)225指數(shù)向上觸及58000點,最新報58016.64點,日內(nèi)上漲1.21%

日經(jīng)225指數(shù)向上觸及58000點,最新報58016.64點,日內(nèi)上漲1.21%

每日經(jīng)濟(jì)新聞
2026-02-25 08:35:07
馬年開工第一“虎”,山西一廳官官宣落馬

馬年開工第一“虎”,山西一廳官官宣落馬

筆桿論道
2026-02-25 08:49:57
巴拿馬強(qiáng)行接管長和碼頭,撕破最后臉面,國家是時候出手了

巴拿馬強(qiáng)行接管長和碼頭,撕破最后臉面,國家是時候出手了

Mr王的飯后茶
2026-02-24 23:07:37
汪小菲官宣三胎出生:承諾會照顧好3個孩子,曬馬筱梅與兒子合照

汪小菲官宣三胎出生:承諾會照顧好3個孩子,曬馬筱梅與兒子合照

素素娛樂
2026-02-24 16:34:48
美國深夜收到消息:中國發(fā)兩條公告,亞洲震動,日本右翼陷入癲狂

美國深夜收到消息:中國發(fā)兩條公告,亞洲震動,日本右翼陷入癲狂

吃貨的分享
2026-02-25 10:52:28
噩耗傳來:周建群除夕前離世,享年61歲,5天前還在開會!他曾是兩大浙商得力干將,38歲就進(jìn)入核心管理層

噩耗傳來:周建群除夕前離世,享年61歲,5天前還在開會!他曾是兩大浙商得力干將,38歲就進(jìn)入核心管理層

每日經(jīng)濟(jì)新聞
2026-02-24 22:42:20
荷蘭首位同性戀首相,正式就職!

荷蘭首位同性戀首相,正式就職!

美劇組|人人影視
2026-02-24 23:03:15
幽靈一樣的墨西哥最大毒梟:在警隊全面“黑化”,從牛油果種植戶到被懸賞1500萬美元

幽靈一樣的墨西哥最大毒梟:在警隊全面“黑化”,從牛油果種植戶到被懸賞1500萬美元

紅星新聞
2026-02-23 18:39:24
內(nèi)蒙古草兔為何泛濫成災(zāi)?就連吃貨都無能為力,牧民直言:不敢碰

內(nèi)蒙古草兔為何泛濫成災(zāi)?就連吃貨都無能為力,牧民直言:不敢碰

一曲一場談
2026-02-25 03:42:27
1986年陳永貴病逝,追悼會規(guī)格成難題,鄧小平只說了一句話,全場安靜

1986年陳永貴病逝,追悼會規(guī)格成難題,鄧小平只說了一句話,全場安靜

寄史言志
2026-01-04 16:34:31
18億美元灰飛煙滅!中國港口被搶,李嘉誠求巴拿馬“談一談”?

18億美元灰飛煙滅!中國港口被搶,李嘉誠求巴拿馬“談一談”?

小蜜情感說
2026-02-25 10:49:10
搶票“撞車”買到同車兩張票!開車前一分鐘才發(fā)現(xiàn),12306回復(fù)

搶票“撞車”買到同車兩張票!開車前一分鐘才發(fā)現(xiàn),12306回復(fù)

聽心堂
2026-02-25 11:35:40
現(xiàn)在,只是時間問題了

現(xiàn)在,只是時間問題了

牛彈琴
2026-02-25 07:57:00
新一輪冷空氣、大到暴雪暴雨再現(xiàn),連下到3月?臺風(fēng)鸚鵡有動靜?

新一輪冷空氣、大到暴雪暴雨再現(xiàn),連下到3月?臺風(fēng)鸚鵡有動靜?

環(huán)球科學(xué)貓
2026-02-25 11:14:09
湖南33歲男子放煙花被炸身亡:疑似畫面流出,家屬披露大量隱情

湖南33歲男子放煙花被炸身亡:疑似畫面流出,家屬披露大量隱情

博士觀察
2026-02-24 18:14:01
聶衛(wèi)平愛女發(fā)文曝光離世真相!早年縱欲過度的他,被拖垮了身體

聶衛(wèi)平愛女發(fā)文曝光離世真相!早年縱欲過度的他,被拖垮了身體

老范談史
2026-01-21 18:25:21
外國人涌入中國,真相扎心:我們的低物價竟成了他們的消費天堂?

外國人涌入中國,真相扎心:我們的低物價竟成了他們的消費天堂?

寄星夜幕星河
2026-02-25 06:43:37
“赴日游客銳減50%”,這國迎來“潑天富貴”

“赴日游客銳減50%”,這國迎來“潑天富貴”

觀察者網(wǎng)
2026-02-24 22:23:11
12345不能亂打了!2026年開始整治亂打熱線現(xiàn)象

12345不能亂打了!2026年開始整治亂打熱線現(xiàn)象

醫(yī)脈圈
2026-02-24 12:13:20
打伊朗前,美國先找了中國,特朗普知道:他錯一步中國就不戰(zhàn)而勝

打伊朗前,美國先找了中國,特朗普知道:他錯一步中國就不戰(zhàn)而勝

通文知史
2026-02-24 23:40:03
2026-02-25 12:07:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14584文章數(shù) 66641關(guān)注度
往期回顧 全部

科技要聞

蘋果MacBook Pro要加觸摸屏了,還帶靈動島

頭條要聞

夫妻8年還清百萬元債務(wù):在杭州開飯店 幾乎全年無休

頭條要聞

夫妻8年還清百萬元債務(wù):在杭州開飯店 幾乎全年無休

體育要聞

曝雄鹿計劃今夏追小卡 字母哥渴望與其并肩作戰(zhàn)

娛樂要聞

撒貝寧到沈陽跑親戚 老婆李白模特身材

財經(jīng)要聞

春節(jié)檔"開門黑" 電影票少賣了7000萬張

汽車要聞

方程豹首款轎車實車圖曝光 就等價格了?

態(tài)度原創(chuàng)

健康
游戲
家居
旅游
教育

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

《漫威金剛狼》正式確認(rèn)9月15日發(fā)售 魔形女等經(jīng)典角色登場

家居要聞

藝居辦公 溫度與效率

旅游要聞

昆明市博物館丨新春游園會與市民歡樂“過大年”

教育要聞

專門聽外行的,專門不聽內(nèi)行的:遇到這樣的父母,我無語了!

無障礙瀏覽 進(jìn)入關(guān)懷版