国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

OpenClaw走紅背后:當(dāng)AI助手擁有你的郵箱和硬盤(pán)訪(fǎng)問(wèn)權(quán)

0
分享至


(來(lái)源:麻省理工科技評(píng)論)

AI 智能體在使用過(guò)程中存在諸多風(fēng)險(xiǎn)。

例如,即便僅局限在聊天窗口內(nèi),大語(yǔ)言模型也會(huì)出現(xiàn)錯(cuò)誤,表現(xiàn)出不當(dāng)行為。一旦它們配備網(wǎng)頁(yè)瀏覽器、電子郵箱等可與外界交互的工具,這些錯(cuò)誤帶來(lái)的后果會(huì)嚴(yán)重得多。

這或許能解釋?zhuān)瑸楹问卓顚?shí)現(xiàn)突破的大語(yǔ)言模型個(gè)人助手并非出自頭部 AI 實(shí)驗(yàn)室,而是由獨(dú)立軟件工程師彼得?斯坦伯格(Peter Steinberger)研發(fā)。2025 年 11 月,斯坦伯格將這款名為 OpenClaw 的工具上傳至 GitHub 平臺(tái),今年 1 月末,該項(xiàng)目迅速走紅。

OpenClaw 依托現(xiàn)有大語(yǔ)言模型,讓用戶(hù)打造定制化的個(gè)人助手。對(duì)部分用戶(hù)而言,這意味著要提交海量個(gè)人數(shù)據(jù),包括所有的郵件記錄與硬盤(pán)內(nèi)容,這一情況讓安全專(zhuān)家深感擔(dān)憂(yōu)。OpenClaw 帶來(lái)的安全風(fēng)險(xiǎn)范圍極廣,過(guò)去幾周涌現(xiàn)的相關(guān)安全分析博客文章,普通人可能需要近一周時(shí)間才能全部讀完。中國(guó)政府已公開(kāi)發(fā)布警告,提示 OpenClaw 存在安全漏洞

針對(duì)這些擔(dān)憂(yōu),斯坦伯格在 X 平臺(tái)發(fā)文稱(chēng),非技術(shù)人員不應(yīng)使用該軟件。他并未回應(yīng)本文的置評(píng)請(qǐng)求。但市場(chǎng)對(duì) OpenClaw 提供的功能需求明確,且這類(lèi)需求并非只存在于能自主完成軟件安全檢測(cè)的人群中。所有希望涉足個(gè)人助手領(lǐng)域的 AI 企業(yè),都需研發(fā)保障用戶(hù)數(shù)據(jù)安全的系統(tǒng)。企業(yè)需要借鑒智能體安全前沿研究的相關(guān)技術(shù)方案。

OpenClaw 本質(zhì)上是為大語(yǔ)言模型配備的機(jī)械外骨骼。用戶(hù)可任選一款大語(yǔ)言模型作為核心驅(qū)動(dòng),這款模型會(huì)獲得更強(qiáng)的記憶能力,還能自主設(shè)定并定期重復(fù)執(zhí)行任務(wù)。與頭部 AI 企業(yè)推出的智能體產(chǎn)品不同,OpenClaw 智能體支持全天候運(yùn)行,用戶(hù)可通過(guò) WhatsApp 或其他即時(shí)通訊軟件與其交互。這意味著它能成為超強(qiáng)能力的個(gè)人助手,每天早晨用定制待辦事項(xiàng)提醒用戶(hù),在用戶(hù)工作時(shí)規(guī)劃假期,空閑時(shí)開(kāi)發(fā)新應(yīng)用。

但這種強(qiáng)大能力也伴隨相應(yīng)風(fēng)險(xiǎn)。用戶(hù)若想讓 AI 個(gè)人助手管理收件箱,就需要授予其郵箱訪(fǎng)問(wèn)權(quán)限,其中包含所有敏感信息;用戶(hù)若想讓助手代為購(gòu)物,就需要提供信用卡信息;用戶(hù)若想讓助手在電腦上完成編寫(xiě)代碼等任務(wù),就需要授予其本地文件訪(fǎng)問(wèn)權(quán)限。

這類(lèi)權(quán)限會(huì)引發(fā)多種問(wèn)題。第一種是 AI 助手自身出現(xiàn)操作失誤,曾有用戶(hù)的 Google Antigravity 編程智能體清空了其整個(gè)硬盤(pán)。第二種是黑客通過(guò)常規(guī)黑客工具入侵智能體,竊取敏感數(shù)據(jù)或運(yùn)行惡意代碼。OpenClaw 走紅的幾周內(nèi),安全研究人員已發(fā)現(xiàn)大量此類(lèi)漏洞,缺乏安全意識(shí)的用戶(hù)會(huì)因此面臨風(fēng)險(xiǎn)。

這兩類(lèi)風(fēng)險(xiǎn)都有應(yīng)對(duì)方法。部分用戶(hù)選擇在獨(dú)立電腦或云端運(yùn)行 OpenClaw 智能體,避免硬盤(pán)數(shù)據(jù)被清空,其他漏洞可通過(guò)成熟的安全技術(shù)修復(fù)。

但本文采訪(fǎng)的專(zhuān)家,重點(diǎn)關(guān)注一種更隱蔽的安全風(fēng)險(xiǎn),即提示詞注入。提示詞注入本質(zhì)是對(duì)大語(yǔ)言模型的劫持。攻擊者只需在大語(yǔ)言模型可能瀏覽的網(wǎng)頁(yè)發(fā)布惡意文本或圖片,或?qū)⑦@類(lèi)內(nèi)容發(fā)送至模型讀取的郵箱,就能操控模型按照自己的指令行動(dòng)。

若這款大語(yǔ)言模型擁有用戶(hù)隱私信息的訪(fǎng)問(wèn)權(quán)限,后果會(huì)十分嚴(yán)重。多倫多大學(xué)電氣與計(jì)算機(jī)工程教授尼古拉斯?帕佩諾(Nicolas Papernot)表示,使用 OpenClaw 這類(lèi)工具,就像把錢(qián)包交給街上的陌生人。頭部 AI 企業(yè)能否放心推出個(gè)人助手產(chǎn)品,關(guān)鍵在于其抵御此類(lèi)攻擊的防護(hù)能力。

需要明確的是,提示詞注入目前尚未引發(fā)重大安全事故,至少?zèng)]有公開(kāi)的相關(guān)報(bào)道。但如今互聯(lián)網(wǎng)上已有數(shù)十萬(wàn) OpenClaw 智能體運(yùn)行,提示詞注入會(huì)成為網(wǎng)絡(luò)罪犯更青睞的攻擊手段。帕佩諾表示,這類(lèi)工具會(huì)促使惡意攻擊者將目標(biāo)轉(zhuǎn)向更廣泛的人群。

提示詞注入這一概念,由知名大語(yǔ)言模型博主西蒙?威利森(Simon Willison)在 2022 年提出,僅比 ChatGPT 發(fā)布早數(shù)月。早在當(dāng)時(shí)就可預(yù)見(jiàn),大語(yǔ)言模型普及后,會(huì)帶來(lái)全新的安全漏洞。大語(yǔ)言模型無(wú)法區(qū)分用戶(hù)指令與執(zhí)行指令所需的數(shù)據(jù),郵件、網(wǎng)頁(yè)搜索結(jié)果等內(nèi)容,在模型看來(lái)都只是文本。

因此攻擊者若在郵件中嵌入幾句話(huà),被大語(yǔ)言模型誤認(rèn)為用戶(hù)指令,就能操控模型執(zhí)行任何操作。

提示詞注入是棘手的難題,短期內(nèi)難以徹底解決。加州大學(xué)伯克利分校計(jì)算機(jī)科學(xué)教授 Dawn Song 表示,目前業(yè)內(nèi)尚未找到一勞永逸的防御方案。但眾多學(xué)術(shù)團(tuán)隊(duì)正在研究該問(wèn)題,已提出多種策略,未來(lái)有望實(shí)現(xiàn) AI Agent 的安全應(yīng)用。

從技術(shù)角度來(lái)說(shuō),當(dāng)前使用 OpenClaw 可避免提示詞注入風(fēng)險(xiǎn),只需斷開(kāi)其網(wǎng)絡(luò)連接。但禁止 OpenClaw 讀取郵件、管理日程、開(kāi)展網(wǎng)絡(luò)調(diào)研,會(huì)喪失 AI Agent 的核心使用價(jià)值。防御提示詞注入的關(guān)鍵,是在阻止模型被劫持的同時(shí),保留其正常工作的能力。

第一種策略是訓(xùn)練大語(yǔ)言模型,使其忽略提示詞注入。大語(yǔ)言模型研發(fā)的核心環(huán)節(jié)為后期訓(xùn)練,研發(fā)人員會(huì)讓具備文本生成能力的模型,通過(guò)合理應(yīng)答獲得正向反饋,應(yīng)答失誤則接受負(fù)向反饋,逐步成為實(shí)用的助手。

這類(lèi)正向與負(fù)向反饋是象征性的,大語(yǔ)言模型會(huì)像動(dòng)物一樣從中學(xué)習(xí)。通過(guò)這一過(guò)程,可訓(xùn)練模型拒絕執(zhí)行特定的提示詞注入指令。

但這一過(guò)程需要把握平衡。若過(guò)度訓(xùn)練模型拒絕注入指令,模型也會(huì)拒絕用戶(hù)的合理請(qǐng)求。大語(yǔ)言模型的行為本身存在隨機(jī)性,即便經(jīng)過(guò)高效訓(xùn)練,能抵御提示詞注入,偶爾仍會(huì)出現(xiàn)失誤。

第二種方法是在提示詞注入攻擊到達(dá)大語(yǔ)言模型前進(jìn)行攔截。通常會(huì)使用專(zhuān)用的檢測(cè)模型,判斷傳輸至目標(biāo)模型的數(shù)據(jù)是否包含注入內(nèi)容。但近期研究顯示,即便性能最優(yōu)的檢測(cè)模型,也無(wú)法識(shí)別部分類(lèi)型的提示詞注入攻擊。

第三種策略更為復(fù)雜。該方案并非通過(guò)檢測(cè)輸入內(nèi)容是否存在注入來(lái)管控?cái)?shù)據(jù),而是制定規(guī)則約束模型的輸出行為,避免模型執(zhí)行有害操作。

這類(lèi)防御方式的部分規(guī)則十分簡(jiǎn)單。例如限定模型僅能向預(yù)先審核的郵箱地址發(fā)送郵件,就能避免用戶(hù)信用卡信息被泄露給攻擊者。但這類(lèi)規(guī)則會(huì)限制模型完成諸多實(shí)用任務(wù),比如代為調(diào)研并聯(lián)系潛在的職業(yè)人脈。

杜克大學(xué)電氣與計(jì)算機(jī)工程教授 Neil Gong 表示,難點(diǎn)在于如何精準(zhǔn)制定這類(lèi)規(guī)則,這需要在實(shí)用性與安全性之間做出平衡。

從更廣泛的層面來(lái)看,整個(gè)智能體領(lǐng)域都在權(quán)衡這一平衡。智能體需要達(dá)到何種安全標(biāo)準(zhǔn),才能兼顧實(shí)用性與安全性,專(zhuān)家對(duì)此觀(guān)點(diǎn)不一。Song 創(chuàng)辦的 Virtue AI 公司研發(fā)智能體安全平臺(tái),她認(rèn)為當(dāng)前已能安全部署人工智能個(gè)人助手。但 Gong 表示,行業(yè)尚未達(dá)到這一水平。

即便人工智能智能體尚未能完全抵御提示詞注入,仍有多種方法降低風(fēng)險(xiǎn)。部分技術(shù)方案也可應(yīng)用于 OpenClaw。上周在舊金山舉辦的首屆 ClawCon 活動(dòng)上,斯坦伯格宣布已聘請(qǐng)安全人員參與該工具的研發(fā)。目前 OpenClaw 仍存在安全漏洞,但這并未打消眾多熱衷用戶(hù)的使用熱情。

喬治?皮克特(George Pickett)是 OpenClaw GitHub 倉(cāng)庫(kù)的志愿維護(hù)者,也是該工具的愛(ài)好者。他采取了多項(xiàng)安全措施保障使用安全,在云端運(yùn)行工具,避免硬盤(pán)被誤刪,同時(shí)設(shè)置防護(hù)機(jī)制,防止他人接入自己的智能助手。

但他并未采取專(zhuān)門(mén)措施防范提示詞注入。他知曉這一風(fēng)險(xiǎn),卻未看到相關(guān)攻擊事件的報(bào)道。皮克特表示,或許這種想法很不明智,但自己不太可能成為首個(gè)被攻擊的目標(biāo)。

https://www.technologyreview.com/2026/02/11/1132768/is-a-secure-ai-assistant-possible/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
女子誤轉(zhuǎn)69萬(wàn)元公款,對(duì)方拒絕退款!警方介入,收款人:管得著嗎

女子誤轉(zhuǎn)69萬(wàn)元公款,對(duì)方拒絕退款!警方介入,收款人:管得著嗎

環(huán)球網(wǎng)資訊
2026-02-24 22:05:24
林孝埈未來(lái)迷茫,離開(kāi)中國(guó)投奔第三方國(guó)家或成最佳出路,生涯走向充滿(mǎn)變數(shù)

林孝埈未來(lái)迷茫,離開(kāi)中國(guó)投奔第三方國(guó)家或成最佳出路,生涯走向充滿(mǎn)變數(shù)

林子說(shuō)事
2026-02-24 16:23:35
女生會(huì)考驗(yàn)?zāi)愕恼\(chéng)意嗎?

女生會(huì)考驗(yàn)?zāi)愕恼\(chéng)意嗎?

賴(lài)煥慶
2026-02-24 13:58:44
去日本才發(fā)現(xiàn):年輕人都不穿耐克、阿迪,滿(mǎn)街都是Asics、鬼塚虎

去日本才發(fā)現(xiàn):年輕人都不穿耐克、阿迪,滿(mǎn)街都是Asics、鬼塚虎

白宸侃片
2026-02-24 15:45:22
大紅袍是辣椒還是茶葉?這辣妹的腳趾頭給出了答案

大紅袍是辣椒還是茶葉?這辣妹的腳趾頭給出了答案

飛娛日記
2026-02-17 15:33:20
中國(guó)正在大量囤油,一度吞掉世界9成囤量,有什么大事要發(fā)生?

中國(guó)正在大量囤油,一度吞掉世界9成囤量,有什么大事要發(fā)生?

森羅萬(wàn)象視頻
2026-02-23 21:13:07
收視率破36!央視馬年春晚首波口碑出爐,觀(guān)眾的評(píng)價(jià)“一針見(jiàn)血”

收視率破36!央視馬年春晚首波口碑出爐,觀(guān)眾的評(píng)價(jià)“一針見(jiàn)血”

八卦南風(fēng)
2026-02-16 23:11:18
為什么大多數(shù)中國(guó)家長(zhǎng)無(wú)法獨(dú)立帶娃?網(wǎng)友的分享猶如醍醐灌頂

為什么大多數(shù)中國(guó)家長(zhǎng)無(wú)法獨(dú)立帶娃?網(wǎng)友的分享猶如醍醐灌頂

另子維愛(ài)讀史
2026-01-31 20:12:55
我嫁全村最窮懶漢,新婚夜剛要打地鋪,他開(kāi)口:轉(zhuǎn)窮17年終于等到你

我嫁全村最窮懶漢,新婚夜剛要打地鋪,他開(kāi)口:轉(zhuǎn)窮17年終于等到你

奶茶麥子
2026-02-25 11:05:22
河南平頂山郟縣再通報(bào)打人事件:劉某飛夫妻涉嫌“尋釁滋事罪”被批捕

河南平頂山郟縣再通報(bào)打人事件:劉某飛夫妻涉嫌“尋釁滋事罪”被批捕

環(huán)球網(wǎng)資訊
2026-02-25 07:14:08
卓別林在晚宴上問(wèn)周總理:可以送我一瓶茅臺(tái)嗎?總理回答令人感動(dòng)

卓別林在晚宴上問(wèn)周總理:可以送我一瓶茅臺(tái)嗎?總理回答令人感動(dòng)

柳絮憶史
2026-01-02 07:15:03
特斯拉新車(chē)現(xiàn)身官網(wǎng),內(nèi)飾終于升級(jí)!

特斯拉新車(chē)現(xiàn)身官網(wǎng),內(nèi)飾終于升級(jí)!

花果科技
2026-02-24 13:23:09
WTT新加坡大滿(mǎn)貫:王曼昱再贏一場(chǎng)!3-1勝世界亞軍晉級(jí)16強(qiáng)

WTT新加坡大滿(mǎn)貫:王曼昱再贏一場(chǎng)!3-1勝世界亞軍晉級(jí)16強(qiáng)

大眼瞄世界
2026-02-24 22:54:03
別再尬演白月光了!臉腫皮松,嘟嘴裝嫩,是迷倒男人該有的皮囊?

別再尬演白月光了!臉腫皮松,嘟嘴裝嫩,是迷倒男人該有的皮囊?

不似少年游
2026-02-24 19:46:25
華為董事長(zhǎng)梁華:華為2025年收入超8800億,距創(chuàng)歷史,僅一步之遙

華為董事長(zhǎng)梁華:華為2025年收入超8800億,距創(chuàng)歷史,僅一步之遙

科技頭條
2026-02-25 00:07:22
歐冠綜述:國(guó)米出局+遭挪超黑馬雙殺 馬競(jìng)藥廠(chǎng)過(guò)關(guān) 英超6隊(duì)進(jìn)16強(qiáng)

歐冠綜述:國(guó)米出局+遭挪超黑馬雙殺 馬競(jìng)藥廠(chǎng)過(guò)關(guān) 英超6隊(duì)進(jìn)16強(qiáng)

我愛(ài)英超
2026-02-25 06:02:07
美國(guó)一富豪被冷凍50年,原定2017年蘇醒,解凍時(shí)工作人員緊急叫停

美國(guó)一富豪被冷凍50年,原定2017年蘇醒,解凍時(shí)工作人員緊急叫停

蜉蝣說(shuō)
2025-12-01 11:20:58
33歲董宇輝被26歲雙料博士索婭表白,網(wǎng)友:為名利多過(guò)才情?

33歲董宇輝被26歲雙料博士索婭表白,網(wǎng)友:為名利多過(guò)才情?

復(fù)轉(zhuǎn)小能手
2026-02-14 00:10:03
Anthropic「蒸餾」了人類(lèi)最大的知識(shí)庫(kù)

Anthropic「蒸餾」了人類(lèi)最大的知識(shí)庫(kù)

愛(ài)范兒
2026-02-25 08:55:59
新外援是賈巴里帕克?廣東隊(duì)被迫裁掉薩林杰,朱芳雨這次真賭對(duì)了

新外援是賈巴里帕克?廣東隊(duì)被迫裁掉薩林杰,朱芳雨這次真賭對(duì)了

緋雨兒
2026-02-25 14:47:19
2026-02-25 16:19:01
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16317文章數(shù) 514652關(guān)注度
往期回顧 全部

科技要聞

“機(jī)器人只跳舞,沒(méi)什么用”

頭條要聞

中方就涉烏克蘭問(wèn)題的決議草案投棄權(quán)票 中國(guó)代表發(fā)聲

頭條要聞

中方就涉烏克蘭問(wèn)題的決議草案投棄權(quán)票 中國(guó)代表發(fā)聲

體育要聞

曝雄鹿計(jì)劃今夏追小卡 字母哥渴望與其并肩作戰(zhàn)

娛樂(lè)要聞

撒貝寧到沈陽(yáng)跑親戚 老婆李白模特身材

財(cái)經(jīng)要聞

GEO亂象:誰(shuí)為AI營(yíng)銷(xiāo)的泡沫買(mǎi)單?

汽車(chē)要聞

750km超長(zhǎng)續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

健康
親子
時(shí)尚
旅游
公開(kāi)課

轉(zhuǎn)頭就暈的耳石癥,能開(kāi)車(chē)上班嗎?

親子要聞

拇指發(fā)育不良是懷孕吃了雞爪?無(wú)理取鬧,無(wú)中生有,無(wú)稽之談

普通人穿衣別太老氣橫秋!這些穿搭給你靈感,保暖耐看兩不誤

旅游要聞

櫻桃花開(kāi)了!來(lái)烏當(dāng)赴一場(chǎng)春暖花開(kāi)之約

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版