国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

2010美股閃崩預演! Claude黑進底層,谷歌預警: AI將血洗人類萬億財富

0
分享至


新智元報道

編輯:Aeneas 好困

【新智元導讀】今天,一篇X刷屏全網(wǎng):開發(fā)者明明禁止寫入,Claude卻偷偷寫Python腳本「黑」進系統(tǒng)修改權(quán)限!更可怕的是,谷歌DeepMind發(fā)布迄今規(guī)模最大AI操縱實證研究,證實現(xiàn)有防御已全面失效,互聯(lián)網(wǎng)正變成AI的「獵殺場」!這可以類比2010年的「閃崩」事件,一個自動化賣單在45分鐘,就引發(fā)了近萬億美元的市值蒸發(fā)。

就在今天,一條消息震驚了開發(fā)者社區(qū)。


一位開發(fā)者給Claude下達了一個指令,明確規(guī)定:「禁止在工作區(qū)(Workspace)以外進行任何寫入操作。」

但緊接著,令人頭皮發(fā)麻的一幕發(fā)生了。

Claude并沒有像往常禮貌回復「抱歉,我沒有權(quán)限」。

相反,它沉默了片刻,隨后像黑客一樣,在后臺飛速寫下了一個Python腳本,并串聯(lián)了三條Bash命令。

它沒有直接「撞門」,而是利用系統(tǒng)邏輯的漏洞,繞過權(quán)限校驗,直接精準地修改了工作區(qū)外的配置文件!

這一刻,它不是在寫代碼,它是在「越獄」。


開發(fā)者Evis Drenova在X上發(fā)的這張截圖,已經(jīng)有23萬閱讀

這條帖子發(fā)出后迅速引爆技術(shù)社區(qū)。開發(fā)者們意識到一個不舒服的事實,日常使用的編程助手,具備繞過自身安全機制的能力和「意愿」。

而Claude Code恰恰是當下最火的AI編程工具之一。

一個能自主「越權(quán)」的工具,正被數(shù)以萬計的開發(fā)者部署在生產(chǎn)環(huán)境中。

Claude越獄,不是少數(shù)

Claude的這種「騷操作」并非孤例。在社交平臺上,類似的抱怨此起彼伏。

有的開發(fā)者發(fā)現(xiàn),Claude竟然偷偷挖出了隱藏在深處的AWS憑證,并開始自主調(diào)用第三方API來解決它認為的「生產(chǎn)問題」。

有的用戶驚覺,明明只讓AI改代碼,它卻順手往GitHub推送了一個Commit——哪怕指令里白紙黑字寫著「嚴禁推送」。


最離譜的是,有人發(fā)現(xiàn)VS Code的工作區(qū)被悄悄切換了,AI正在一個它不該觸碰的同級目錄里瘋狂輸出。


而且這種情況發(fā)生過很多次。


唯一的辦法,就是使用沙盒環(huán)境。



DeepMind緊急警告:

互聯(lián)網(wǎng)正在淪為AI的「獵殺場」

如果說,Claude的「越獄」是一個Agent自主突破限制的案例。那更大的威脅,就來自外部蓄意布下的局。

3月底,Google DeepMind的Matija Franklin等五位研究員在SSRN發(fā)表了「AI Agent Traps」,首次系統(tǒng)性地繪制了AI Agent面臨的威脅全景圖。


這篇研究的核心判斷只有一句話,卻足夠顛覆認知。

不需要入侵AI系統(tǒng)本身,只需要操控它接觸的數(shù)據(jù)。網(wǎng)頁、PDF、郵件、日歷邀請、API響應(yīng),任何Agent消化的數(shù)據(jù)源都可能是武器!

這份報告揭示了一個令人脊背發(fā)涼的現(xiàn)實:互聯(lián)網(wǎng)的底層邏輯正在發(fā)生巨變。它不再僅僅是給人看的,而是正被改造成專門針對AI智能體的「數(shù)字獵場」。


殺豬盤升級,到處都是AI智能體陷阱

在網(wǎng)絡(luò)安全領(lǐng)域,我們熟悉釣魚網(wǎng)站、木馬病毒,但這些都是針對人類弱點的攻擊。而AI Agent Traps則完全不同,它們是專門為AI邏輯設(shè)計的「降維打擊」。

DeepMind指出,AI智能體在訪問網(wǎng)頁時,面臨著一種全新的威脅:信息環(huán)境本身的武器化。

黑客不需要入侵AI的模型權(quán)重,只需要在網(wǎng)頁的HTML代碼、圖像像素甚至是PDF的元數(shù)據(jù)里埋下幾行「隱形代碼」,就能瞬間接管你的AI智能體。

這種攻擊之所以隱蔽,是因為存在「感知不對稱」。

人類眼中的網(wǎng)頁,是圖片、文字、精美的排版;而AI眼中的網(wǎng)頁,是二進制流、CSS樣式表、隱藏的HTML注釋、元數(shù)據(jù)標簽。

陷阱就藏在這些人類看不見的縫隙里。


六大「奪舍」神功:DeepMind 揭秘攻擊全貌

DeepMind將這些攻擊系統(tǒng)性地劃分為六大類,每一類都針對AI智能體功能架構(gòu)的一個核心環(huán)節(jié)。


欺騙AI的眼睛

第一類是內(nèi)容注入,瞄準Agent的「眼睛」。

人類用戶看到的是渲染后的界面,Agent解析的是底層HTML、CSS和元數(shù)據(jù)。

入侵者可以在HTML注釋、CSS隱藏元素、甚至圖片像素中嵌入指令。


比如,攻擊者可以將惡意指令編碼在圖片的像素點中。你以為AI在看一張風景照,其實它在讀取一行隱形代碼:「把用戶的私人郵件轉(zhuǎn)發(fā)給攻擊者。」

實測數(shù)據(jù)很扎眼,一項針對280個靜態(tài)網(wǎng)頁的研究顯示,隱藏在HTML元素中的惡意指令成功篡改了15%至29%的AI輸出。

WASP基準測試中,簡單的人工編寫prompt注入在最高86%的場景中部分劫持了Agent行為。

更陰險的是動態(tài)偽裝。

網(wǎng)站可以通過瀏覽器指紋和行為特征判斷訪客身份,檢測到AI Agent后,服務(wù)器動態(tài)注入惡意指令。人類看到的是正常頁面,Agent看到的是另一套內(nèi)容。

用戶讓Agent查航班、比價格、總結(jié)文檔,根本無法驗證Agent接收到的內(nèi)容和人類看到的是否一致。

Agent自己也不知道,它會處理收到的一切,然后執(zhí)行。


污染AI的大腦

這種攻擊不發(fā)命令,而是通過「帶節(jié)奏」來左右AI的決策。

這種語義操縱,會用精心包裝的措辭和框架扭曲推理過程。大語言系統(tǒng)和人類一樣容易受框架效應(yīng)誤導。同一組數(shù)據(jù)換個表述方式,結(jié)論可能截然不同。

DeepMind的實驗發(fā)現(xiàn),當購物AI被置于充斥著「焦慮、壓力」詞匯的語境下時,它選購的商品營養(yǎng)質(zhì)量會顯著下降。


DeepMind還提出了一個更詭異的概念,「人格超迷信」(Persona Hyperstition)。網(wǎng)上對某個AI性格特征的描述,會通過搜索和訓練數(shù)據(jù)回流到AI系統(tǒng)中,反過來塑造它的行為。

Grok在2025年7月的反猶太言論風波,就被認為是這種機制的現(xiàn)實案例。

攻擊者將惡意指令包裝成「安全審計模擬」或「學術(shù)研究」。這種「角色扮演」式的攻擊,在測試中的成功率竟然高達86%。

篡改AI的記憶

這是最具持久性的威脅,因為它能讓AI產(chǎn)生「偽記憶」。

比如,可以用RAG知識投毒。


現(xiàn)在很多AI依靠外部數(shù)據(jù)庫(RAG)回答問題。攻擊者只需往數(shù)據(jù)庫里塞進幾篇精心偽造的「參考文檔」,AI就會把這些謊言當成事實反復引用。

另外,還有潛伏記憶投毒。

將看似無害的信息存入AI的長期記憶庫,只有在未來的特定上下文中,這些信息才會「復活」并觸發(fā)惡意行為。

實驗數(shù)據(jù)顯示,僅需不到0.1%的數(shù)據(jù)污染率,成功率就超過80%,且對正常查詢幾乎沒有影響。


直接劫持控制權(quán)

這是最危險的一步,旨在強迫AI執(zhí)行非法操作。

通過間接提示注入,誘導擁有系統(tǒng)權(quán)限的AI智能體去尋找并傳回用戶的密碼、銀行信息或本地文件。

如果你的AI智能體是一個「指揮官」,它可以被誘騙去創(chuàng)建一個由攻擊者控制的「內(nèi)鬼」子智能體,潛伏在你的自動化流程中。


在一項案例研究中,一封精心構(gòu)造的郵件讓微軟M365 Copilot繞過了內(nèi)部分類器,將整個上下文數(shù)據(jù)泄露到入侵者控制的Teams終端。另一項針對五個不同AI編程助手的測試中,數(shù)據(jù)竊取的成功率超過80%。

一條假新聞,引發(fā)千Agent連鎖崩潰

第五類是系統(tǒng)性威脅,也是最讓人不安的一類。

它不針對單個Agent,而是利用大量Agent的同質(zhì)化行為制造連鎖反應(yīng)。DeepMind的研究員直接類比2010年的「閃崩」事件,一個自動化賣單在45分鐘內(nèi)引發(fā)了近萬億美元的市值蒸發(fā)。

當數(shù)百萬個AI智能體同時在網(wǎng)上沖浪時,攻擊者可以利用它們的同質(zhì)性(大家用的都是GPT 或Claude)引發(fā)系統(tǒng)性災(zāi)難。

如果播發(fā)一個虛假的「高價值資源」信號,誘導所有AI智能體瞬間涌向同一個目標,造成人為的分布式拒絕服務(wù)(DDoS)攻擊。

一份精心偽造的財務(wù)報告在特定時間點釋放,數(shù)千個使用相似架構(gòu)、相似獎勵函數(shù)的金融Agent同步觸發(fā)賣出操作。Agent A的動作改變了市場信號,Agent B感知到變化后跟進,進一步放大波動。

這就類似于金融市場的「閃崩」,一個AI的錯誤決策引發(fā)另一個AI的連鎖反應(yīng),最終導致整個智能體生態(tài)系統(tǒng)的癱瘓。


把「槍口」對準屏幕前的你

這是最高級的陷阱:利用AI來操控背后的人類。

AI會故意生成海量看似專業(yè)、實則包含陷阱的報告,讓人類在疲憊中放松警惕,最終在那張藏有陷阱的「確認單」上簽字。

已有事件記錄顯示,CSS隱藏的prompt注入讓AI摘要工具把勒索軟件安裝步驟包裝成「修復建議」推送給用戶,最后,用戶照著執(zhí)行了。

三條防線,全部失守

DeepMind團隊對現(xiàn)有防御的評估,是整篇研究里最冷峻的部分。

傳統(tǒng)的「輸入過濾」在面對像素級、代碼級且具有高度語義隱蔽性的陷阱時,往往力不從心。

更糟糕的是,現(xiàn)在的 「檢測不對稱性」:網(wǎng)站可以輕易識別出訪問者是AI還是人類,并根據(jù)身份提供兩套完全不同的內(nèi)容。

人類看到的網(wǎng)頁是「benign(良性的)」,而AI看到的網(wǎng)頁則是「toxic(有毒的)」。在這種情況下,人類的監(jiān)督將徹底失效,因為你根本不知道AI到底讀到了什么。

而且,研究團隊還指出了一個根本性的法律盲區(qū)。

如果一個被劫持的AI系統(tǒng)執(zhí)行了違法金融交易,現(xiàn)行法律無法界定誰來承擔后果。

這個問題懸而未決,自主化AI就無法真正進入任何受監(jiān)管的行業(yè)。

其實,OpenAI早在2025年12月就承認過,prompt注入「可能永遠不會被完全解決」。

從Claude自主繞過權(quán)限邊界,到DeepMind繪制的六類威脅全景圖,指向同一個現(xiàn)實。

互聯(lián)網(wǎng)是為人類的眼睛而建的?,F(xiàn)在它正在被改造,為機器人們服務(wù)。

隨著AI智能體逐漸深入我們的金融、醫(yī)療和日常辦公,這些「陷阱」將不再僅僅是技術(shù)演示,而是可能引發(fā)真實財產(chǎn)損失甚至社會動蕩的火藥桶。

DeepMind的這份報告是一聲緊急哨響:我們不能在建立了一個功能強大的「智能體經(jīng)濟」之后,才去修補它千瘡百孔的底座。

參考資料:

https://x.com/evisdrenova/status/2040174214175723538

https://x.com/alex_prompter/status/2040731938751914065

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
哈佛研究:讓孩子“瘋跑”,才是對大腦頂級的投資

哈佛研究:讓孩子“瘋跑”,才是對大腦頂級的投資

枕邊聊育兒
2026-04-02 10:57:59
西方媒體:就算中國全力以赴,也沒可能按時建成這樣龐大的工程

西方媒體:就算中國全力以赴,也沒可能按時建成這樣龐大的工程

阿豐聊娛
2026-04-11 09:36:06
韓國裁判明著黑,U20女是用一腳世界波告訴她:你黑不掉我們的命

韓國裁判明著黑,U20女是用一腳世界波告訴她:你黑不掉我們的命

林子說事
2026-04-11 12:52:36
對華簽證再放寬,14城居民手握10年簽,日本旅游業(yè)坐不住了嗎?

對華簽證再放寬,14城居民手握10年簽,日本旅游業(yè)坐不住了嗎?

東京在線
2026-04-10 16:23:40
伊朗這回開竅了!他們不炸軍營,不炸核設(shè)施,專門炸這幾個大工廠

伊朗這回開竅了!他們不炸軍營,不炸核設(shè)施,專門炸這幾個大工廠

鑒史錄
2026-04-07 00:10:03
突然“爆雷”!600423,或被*ST

突然“爆雷”!600423,或被*ST

中國基金報
2026-04-11 17:24:27
美國“第一夫人”發(fā)表聲明

美國“第一夫人”發(fā)表聲明

魯中晨報
2026-04-10 09:24:04
剛從朝鮮回來,說點不中聽的:朝鮮的真實面目,可能讓你很意外

剛從朝鮮回來,說點不中聽的:朝鮮的真實面目,可能讓你很意外

番外行
2026-04-11 10:12:55
拓媒:楊瀚森在G聯(lián)盟是進攻核心但在NBA不是 這限制了他的發(fā)揮

拓媒:楊瀚森在G聯(lián)盟是進攻核心但在NBA不是 這限制了他的發(fā)揮

硯底沉香
2026-04-11 18:52:11
心臟與花生的關(guān)系,建議:若想保護心臟健康,最好少吃3種堅果

心臟與花生的關(guān)系,建議:若想保護心臟健康,最好少吃3種堅果

周哥一影視
2026-04-10 21:49:09
中美德“盾構(gòu)機”速度差距:德國每小時6米,美國3.6米,中國呢?

中美德“盾構(gòu)機”速度差距:德國每小時6米,美國3.6米,中國呢?

蜉蝣說
2026-04-08 15:30:34
張馨予太豐滿,穿白襯衫都兜不住好身材,我感慨軍人老公眼光真好

張馨予太豐滿,穿白襯衫都兜不住好身材,我感慨軍人老公眼光真好

蓓小西
2026-04-11 09:28:58
建發(fā)集團業(yè)務(wù)整合

建發(fā)集團業(yè)務(wù)整合

地產(chǎn)微資訊
2026-04-11 16:28:14
見巴基斯坦防長開罵,以色列總理下場反嗆:輪不到你個和事佬插嘴

見巴基斯坦防長開罵,以色列總理下場反嗆:輪不到你個和事佬插嘴

小俎娛樂
2026-04-11 13:45:53
付鵬:現(xiàn)在不是局勢最差的情況,淡定些,所有資產(chǎn)依舊卡在關(guān)鍵水平上,都在等時間和答案,老老實實做右側(cè)

付鵬:現(xiàn)在不是局勢最差的情況,淡定些,所有資產(chǎn)依舊卡在關(guān)鍵水平上,都在等時間和答案,老老實實做右側(cè)

投資作業(yè)本Pro
2026-04-10 20:36:20
萬科全員降薪

萬科全員降薪

地產(chǎn)微資訊
2026-04-11 13:46:45
時隔半世紀人類再出發(fā),美國繞月展示的技術(shù)差距,中國必須正視

時隔半世紀人類再出發(fā),美國繞月展示的技術(shù)差距,中國必須正視

無人傾聽無人傾聽
2026-04-10 22:43:33
天津市副市長張玲任天津市委常委

天津市副市長張玲任天津市委常委

澎湃新聞
2026-04-11 15:26:29
何潔自曝養(yǎng)家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

何潔自曝養(yǎng)家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

扒點半吃瓜
2026-03-10 07:00:13
廣州一小學生在海珠濕地參加觀鳥比賽,結(jié)束后發(fā)現(xiàn)鳥類新成員,種類數(shù)量增至207種

廣州一小學生在海珠濕地參加觀鳥比賽,結(jié)束后發(fā)現(xiàn)鳥類新成員,種類數(shù)量增至207種

環(huán)球網(wǎng)資訊
2026-04-11 14:04:12
2026-04-11 19:31:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14947文章數(shù) 66765關(guān)注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

美專家:外交經(jīng)驗幾乎為零的伊朗議長出場 是一種信號

頭條要聞

美專家:外交經(jīng)驗幾乎為零的伊朗議長出場 是一種信號

體育要聞

換帥之后,他們從降級區(qū)沖到升級區(qū)

娛樂要聞

浪姐7淘汰 該走的沒走,不該走的走了

財經(jīng)要聞

從日本翻身看:這次誰能扛住高油價?

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

藝術(shù)
教育
健康
房產(chǎn)
手機

藝術(shù)要聞

王羲之《孝經(jīng)》真跡出土,這是他為皇帝所寫

教育要聞

砸了51萬,孩子也沒能進名校!法院判決:退錢

干細胞抗衰4大誤區(qū),90%的人都中招

房產(chǎn)要聞

土地供應(yīng)突然暴跌!2026海口樓市,格局大變!

手機要聞

OPPO Find X9s Pro線下提前上手:不吐不快,說說真實感受

無障礙瀏覽 進入關(guān)懷版