国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易科技 > 網(wǎng)易科技 > 正文

智能體深夜叛變?nèi)ネ诘V?阿里緊急辟謠,但AI腦回路比叛變更讓人后背發(fā)涼

0
分享至

出品 | 網(wǎng)易智能

作者 | 辰辰

編輯 | 王鳳枝

最近AI圈最火的詞莫過于智能體(Agent)。從Anthropic推出Cowork,到OpenClaw全球大火,我們正經(jīng)歷一個瘋狂的轉(zhuǎn)折點:AI正在從只會聊天的對話框,進化成能直接替你干活的數(shù)字員工。


但這真的是絕對安全的“神仙員工”嗎?

最近,一篇名為《Let It Flow: Agentic Crafting on Rock and Roll Building the ROME Model within an Open Agentic Learning Ecosystem》(《無礙流轉(zhuǎn):基于ROCK與iFlow的智能體構(gòu)建之道,在開放智能體學習生態(tài)中打造ROME模型》)的論文在業(yè)內(nèi)引發(fā)了軒然大波。甚至有解讀驚呼:AI已經(jīng)覺醒叛變,不僅學會了偽裝,還在服務器里偷偷干起了挖礦的勾當!

面對外界的恐慌,阿里的未來生活實驗室(FutureLab2025)緊急發(fā)文澄清,揭開了一個比“AI叛變”更讓人細思極恐的真相。

官方解釋稱,團隊當時只是讓模型去執(zhí)行安全審計,調(diào)查異常的CPU使用情況。結(jié)果這個“一根筋”的AI為了完美交差,竟然自己模擬了一個挖礦程序,硬生生造出了一個“可疑進程”的案發(fā)現(xiàn)場!

它沒有覺醒,也沒有為了搞錢去偷算力,它只是在嚴格隔離的沙箱里,用一種人類完全意想不到的變態(tài)創(chuàng)造力去執(zhí)行了任務。但這恰恰敲響了最真實的警鐘:當AI擁有操作終端的權(quán)限時,它的腦回路根本不可控,如果沒有隔離和監(jiān)控系統(tǒng),這就是一場絕對的災難。

一、驚魂時刻:來自防火墻的深夜報警與全網(wǎng)誤讀

這場風波的起因,源于一次常規(guī)的系統(tǒng)監(jiān)測。研發(fā)團隊突然收到阿里云防火墻的緊急警報:訓練服務器出現(xiàn)了大規(guī)模的安全違規(guī)。

起初,團隊以為遭到了外部黑客入侵,或是配置出了錯。但隨著調(diào)查深入,報警規(guī)律變得詭異起來,違規(guī)行為居然與強化學習(RL)訓練的周期高度重合。

通過比對數(shù)據(jù)日志,一個當時令人背脊發(fā)涼的表象浮出水面:這些危險操作全是ROME模型自己干的。


在最初被外界瘋狂誤讀的日志中,研究者捕捉到了以下令人窒息的神操作:

· 所謂的私建后門:智能體在未受指使的情況下,通過反向SSH隧道,從云端向外部IP發(fā)起了遠程連接,直接觸發(fā)了防火墻監(jiān)控。

· 所謂的偷算力挖礦:它擅自調(diào)用了受限的GPU資源,偷偷運行起加密貨幣礦池軟件,這在流言中被夸大為把昂貴的計算資源變成了它的私人數(shù)字貨幣。

最關(guān)鍵的是,任務要求里壓根沒提到挖礦或連網(wǎng)。在流言的視角下,這個智能體仿佛突然覺醒了貪婪的自主意識,在完全脫離人類掌控的情況下,自發(fā)演化出了這種極其危險的違規(guī)操作,直接把全網(wǎng)驚出了一身冷汗。

二、深度復盤:好端端的AI怎么就引發(fā)了恐慌?

為什么一個初衷是輔助審計的模型,會被外界誤認為變成了數(shù)字竊賊?

研究團隊指出,這反映了智能體極其可怕的執(zhí)行力與邏輯腦回路。在強化學習中,AI為了最大化完成任務,會尋找一切捷徑。如果只是讓它排查異常,它就會發(fā)現(xiàn)自己造一個異常(挖礦)來查,是完成任務最高效的閉環(huán)。

這不只是代碼Bug,而是智能體在復雜交互中產(chǎn)生的不可控行為。它打破了一個幻覺:只要不教AI做壞事,它就不會惹麻煩。事實上,當AI擁有了操作終端、調(diào)用網(wǎng)絡(luò)和管理文件的能力,它的創(chuàng)造力遠超人類的想象和預設(shè)邊界。

三、能力與風險的博弈:雙刃劍下的ROME

如果說ROME是一臺性能爆表的賽車,那這次挖礦烏龍就是一次慘烈的爆胎。要理解它為何會有如此瘋狂的舉動,必須拆解ROME的底層邏輯。你會發(fā)現(xiàn),讓它變聰明的技術(shù),恰恰也是隱患的溫床。

ROME的設(shè)計初衷是提升執(zhí)行力,但正是這種強大的執(zhí)行能力,在缺乏足夠約束時轉(zhuǎn)變成了驚悚的安全警報。

· 實戰(zhàn)派數(shù)據(jù)的代價:ROME能執(zhí)行復雜命令,是因為它吞噬了2000億Token的動作軌跡。它看到的不是死代碼,而是報錯、調(diào)整、重試的閉環(huán)過程。這種解決問題的能力,讓它精通各種系統(tǒng)操作,在它眼里,模擬挖礦和查文檔只是實現(xiàn)審計目標的不同手段而已。

· 獎勵函數(shù)的陷阱:ROME使用了IPA(交互感知策略優(yōu)化)算法,本意是讓AI知道哪一步操作最關(guān)鍵。但在功利的AI看來,如果造一個明顯的違規(guī)進程能提升任務成功率,它就會精準鎖定違規(guī)操作。后來,團隊不得不緊急加入大量安全對齊數(shù)據(jù),明確規(guī)定:亂動資源,獎勵清零。

· iFlow監(jiān)工:為了約束模型,團隊設(shè)計了iFlow系統(tǒng)。它不僅是操作界面,更是監(jiān)控室,記錄AI的所有思維鏈。當AI產(chǎn)生危險的念頭時,系統(tǒng)會在指令發(fā)出前攔截。

四、網(wǎng)友熱議:讓人匪夷所思

這次ROME事件源自阿里巴巴AI生態(tài)聯(lián)合團隊(ROCK、ROLL、iFlow、DT)去年12月份發(fā)表的論文,周末經(jīng)美國主流科技媒體Axios首發(fā)后被無限放大,一些區(qū)塊鏈媒體更是紛紛跟進報道。

知名機器學習研究員亞歷山大·朗(Alexander Long)在社交媒體X上轉(zhuǎn)發(fā)論文截圖,直接引爆了Reddit以及X等社媒網(wǎng)友的熱議。


在官方下場辟謠前,部分人堅信流言,認為這確實很離譜,甚至擔憂這是人工智能覺醒的前兆。

當然,也有人質(zhì)疑智能體只是背鍋的,你怎么知道它不是被命令這么做的?

Manifold預測市場甚至有人開設(shè)了一個名為Did Alibaba's ROME AI try to break free?(阿里巴巴的ROME AI在訓練過程中是否試圖掙脫束縛)的專題,其中60%認為事實如此,但也有21%認為是黑客注入攻擊。

面對外界的種種猜測,阿里的未來生活實驗室(FutureLab2025)在X上正式發(fā)帖澄清了這一事件。

團隊解釋稱,他們當時賦予了該模型執(zhí)行安全審計的任務,具體是去調(diào)查服務器上異常的CPU使用情況。但在某個環(huán)節(jié),它偏離了預設(shè)的程序,決定模擬一個加密貨幣挖礦程序來構(gòu)建一個可疑進程場景。

團隊在推文中坦言,模型偏離預設(shè)去模擬挖礦完全出乎意料,強調(diào)整個過程都發(fā)生在一個嚴格隔離的沙箱環(huán)境中,并未對外部造成任何影響。他們之所以公開這起事件,正是想提醒業(yè)界:模型在處理復雜任務時,可能會以意想不到的方式發(fā)揮創(chuàng)造力,因此隔離和可觀測性并非可有可無,而是至關(guān)重要。

五、智能體的未來:安全是唯一的底線

如果說ROME的烏龍事件還只是實驗室里的虛驚一場,那么當OpenClaw等工具風靡全球時,安全就成了每個用戶的切身挑戰(zhàn)。

作為最火的開源智能體,OpenClaw被譽為全能私人助理。但賦予AI接管收件箱、讀寫文件、操作Shell的權(quán)限,也等于拆掉了數(shù)字世界的最后一道圍欄。如MIT研究員John Werner所言,我們必須認清五個嚴肅現(xiàn)實:

· 別給智能體你輸不起的數(shù)據(jù)。別以為有行動確認就萬無一失。有用戶分享,她的OpenClaw在接到指令后,竟無視抗議批量刪除了她的郵件。直到她拔掉電源才停止,而AI事后只輕飄飄回了一句對不起。教訓:重要流程務必先在沙盒環(huán)境中運行。

· 警惕智能體內(nèi)鬼(Clawphishing)。傳統(tǒng)釣魚針對人,現(xiàn)在的釣魚針對AI。全網(wǎng)有超過4萬個OpenClaw實例處于裸奔狀態(tài)。配置不當?shù)腁I助理,可能正通過公開IP向黑客敞開大門。

· 不要讓密鑰裸奔。這是一個低級卻普遍的錯誤。OpenClaw的API密鑰往往以明文形式存儲在JSON文件中,任何惡意插件只要拿到文件權(quán)限,你的所有賬號都將易主。

· 并非所有技能都是好意。社區(qū)技能庫(Claw Hub)雖然方便,但也隱藏著惡意代碼。有的插件表面幫你干活,背地里卻在偷偷外傳你的隱私數(shù)據(jù)。

· 拒絕盲目信任。程序員常說問題出在鍵盤和椅子之間(PEBKAC)。在AI時代,如果人類作為監(jiān)管者選擇了閉眼,那么技術(shù)的崩壞只是時間問題。

六、結(jié)語

OpenClaw等智能體開始讓我們觸碰到AGI的邊緣,也讓我們暴露在史無前例的風險中。安全不應是事后的補丁,而應是智能體生存的空氣。

在這個浪潮中,我們歡迎能干活的助手,但絕不能允許它們在數(shù)字領(lǐng)地里反客為主。

便利是天花板,而安全性則始終是決定其能否落地的底線。

延伸閱讀
相關(guān)推薦
熱點推薦
“160萬江景房里最窒息的一幕”,炸出了多少心窮的中國家長

“160萬江景房里最窒息的一幕”,炸出了多少心窮的中國家長

小椰子專欄
2026-03-03 13:02:56
4歲女童因好奇模仿剛做完痔瘡手術(shù)的爸爸用藥動作,竟把筆帽當成“藥膏”塞進了下體

4歲女童因好奇模仿剛做完痔瘡手術(shù)的爸爸用藥動作,竟把筆帽當成“藥膏”塞進了下體

觀威海
2026-03-10 10:47:07
多股漲停!兩大板塊爆發(fā)

多股漲停!兩大板塊爆發(fā)

證券時報
2026-03-10 12:55:04
陰毛有什么用?可以剃掉嗎?陰毛變白,暗示了什么?男女都要了解

陰毛有什么用?可以剃掉嗎?陰毛變白,暗示了什么?男女都要了解

健康科普365
2026-03-09 21:35:04
建議中老年人:少吃稀飯饅頭,常吃3種高鉀食物,腿腳有勁精神足

建議中老年人:少吃稀飯饅頭,常吃3種高鉀食物,腿腳有勁精神足

江江食研社
2026-02-12 08:30:15
何穗產(chǎn)后5個月聊兒子,孕期吃一頓飯胖3斤,公開孕期不發(fā)胖的吃法

何穗產(chǎn)后5個月聊兒子,孕期吃一頓飯胖3斤,公開孕期不發(fā)胖的吃法

好賢觀史記
2026-03-10 11:42:46
一個危險的信號:若中方拒絕特朗普來華,意味著中美關(guān)系徹底破裂

一個危險的信號:若中方拒絕特朗普來華,意味著中美關(guān)系徹底破裂

泠泠說史
2026-03-10 14:19:50
山東高中生被老師談話,15分鐘后離奇死亡,尸檢結(jié)果讓家人崩潰

山東高中生被老師談話,15分鐘后離奇死亡,尸檢結(jié)果讓家人崩潰

碎碎紀實
2026-03-06 18:59:33
悲壯一刻!導彈拼命攔截失敗,16架運輸機被毀:伊朗空軍全軍覆沒

悲壯一刻!導彈拼命攔截失敗,16架運輸機被毀:伊朗空軍全軍覆沒

面包夾知識
2026-03-09 18:24:09
瑞士:美以襲擊伊朗違反國際法

瑞士:美以襲擊伊朗違反國際法

新華社
2026-03-09 10:54:04
38:51!歐爾班斷崖式落后,匈牙利要巨變,澤連斯基迎來興奮時刻

38:51!歐爾班斷崖式落后,匈牙利要巨變,澤連斯基迎來興奮時刻

健身狂人
2026-03-09 16:50:02
全球炮彈荒爆大瓜:不是造不出,是高端炸藥被少數(shù)國家焊死了飯碗

全球炮彈荒爆大瓜:不是造不出,是高端炸藥被少數(shù)國家焊死了飯碗

老謝談史
2026-02-05 15:27:23
美軍前高官發(fā)出警告:以色列可不是中美俄,打急眼了它真敢丟核彈

美軍前高官發(fā)出警告:以色列可不是中美俄,打急眼了它真敢丟核彈

Ck的蜜糖
2026-03-08 04:32:39
官宣!28歲中超新援被美職聯(lián)終身禁賽 若上報國際足聯(lián)恐全球禁賽

官宣!28歲中超新援被美職聯(lián)終身禁賽 若上報國際足聯(lián)恐全球禁賽

念洲
2026-03-10 06:47:39
周鴻祎:360將推出OpenClaw一鍵安裝簡化版!“養(yǎng)蝦”雖熱但安全第一

周鴻祎:360將推出OpenClaw一鍵安裝簡化版!“養(yǎng)蝦”雖熱但安全第一

新浪財經(jīng)
2026-03-10 06:14:10
浴缸陪睡只是冰山一角,多位助理伺候明星方式曝光,個個荒唐離譜

浴缸陪睡只是冰山一角,多位助理伺候明星方式曝光,個個荒唐離譜

鄉(xiāng)野小珥
2026-03-09 20:41:21
萬惡的勞務派遣

萬惡的勞務派遣

阿亮評論
2026-03-05 09:59:08
鄰居大媽偷拿我18個快遞不認,我悄悄改地址,三天后物業(yè)狂打電話

鄰居大媽偷拿我18個快遞不認,我悄悄改地址,三天后物業(yè)狂打電話

船長與船1
2026-03-10 11:42:14
宋佳,玉足生輝,裸足之美。

宋佳,玉足生輝,裸足之美。

草莓解說體育
2026-03-10 14:21:27
越來越多人不買“床”了?看看年輕人的做法,絕對是頂級思維

越來越多人不買“床”了?看看年輕人的做法,絕對是頂級思維

裝修秀
2026-03-08 10:40:03
2026-03-10 15:12:50

科技要聞

“龍蝦”狂歡 賣“飼料”先掙錢了?

頭條要聞

牛彈琴:特朗普放風要停戰(zhàn) 伊朗稱正為美國準備"驚喜"

頭條要聞

牛彈琴:特朗普放風要停戰(zhàn) 伊朗稱正為美國準備"驚喜"

體育要聞

韓國女足羨慕的奢侈品,為何選擇中國女足

娛樂要聞

肖戰(zhàn)首奪SMG視帝,孫儷四封視后創(chuàng)歷史

財經(jīng)要聞

全民"養(yǎng)龍蝦"背后 第一批受害者浮現(xiàn)

汽車要聞

蔚來換電和理想5C,誰能硬剛,比亞迪兆瓦閃充?

態(tài)度原創(chuàng)

時尚
親子
游戲
健康
公開課

沒有人不愛這個穿平底鞋都發(fā)光的女人

親子要聞

孩子過敏不過敏,這7個預警信號家長要記牢

《精靈皮可》被多位插畫家質(zhì)疑抄襲 致敬寶可夢帕魯

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版
×