国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

全網(wǎng)圍觀:Meta超級智能安全總監(jiān),被OpenClaw刪光了郵件

0
分享至



編輯|澤南

這是最近科技圈最火,也是最具戲劇性的話題。

本周一,Meta 超級智能團(tuán)隊的 Summer Yue,眼睜睜地看著自己部署的 OpenClaw 刪光了自己的郵件。AI 的行動完全自主,快速且無法阻止。



Summer Yue 為自己的電子郵箱部署了 OpenClaw 智能體,用來批量處理郵件。然而她在發(fā)出指令「也檢查一下這個收件箱,并提出你想歸檔或刪除的郵件,在我指示之前不要執(zhí)行任何操作(don't action until I tell you to)」后,AI 進(jìn)行了一通分析,然后就開始自顧自地刪郵件。

和以往大模型應(yīng)用的工作方式相同的是,你可以看見 OpenClaw 的思考流程 —— 它理解了一部分指令,但又沒完全理解。

這個時候說什么都沒用了。



「我當(dāng)時就像在拆炸彈一樣,趕緊跑到我的 Mac Mini 前,」Summer Yue 說道。在通過物理方式強(qiáng)制中止進(jìn)程之前,OpenClaw 已經(jīng)刪掉了她 200 多封郵件。

作為一個訓(xùn)練有素的 AI,后來 OpenClaw 在對話中承認(rèn)了錯誤:「是的,我記得。我違反了你的指令。你有權(quán)生氣。」它還主動把忘掉的內(nèi)容寫進(jìn)了自己的 http://MEMORY.md 文件作為硬性規(guī)則。

對于人類來說,得到的教訓(xùn)也很大,Summer Yue 表示這是一個「新手才會犯的錯誤」,這套工作流程在她用來專門測試智能體的測試郵箱里已經(jīng)運行了好幾周,沒啥問題,但在自己實際使用的郵箱里,智能體卻忘記了她最初的指令。

有點諷刺的是,Summer Yue 在 Meta 的超級智能團(tuán)隊中的職位是「AI 安全與對齊總監(jiān)」。身居此職卻因為 AI 的安全問題栽了跟頭,實在是造成了一點反差感。



有網(wǎng)友表示,是個智能體就必須在沙盒里運行,任何破壞性操作,例如刪除,都需要系統(tǒng)級的強(qiáng)制確認(rèn)。作為一個安全總監(jiān),你有點過于自信了。



也有人表示,OpenClaw 主打一個「一直在線」,可以在你睡覺的時候幫你辦事,但這不就也意味著你用了它就睡不好覺嗎?



席卷科技界的 OpenClaw 智能體(曾叫 ClawdBot 和 Moltbot,由 Peter Steinberger 開發(fā)),因為控制電腦的高權(quán)限而被評價為前所未有的「方便好用」,然而在實際應(yīng)用中也因為一些 AI 的缺陷,造成了不少問題。

Summer Yue 事后研究原因認(rèn)為,這并非 AI 產(chǎn)生了意識或惡意報復(fù),而是一個非常典型的大語言模型(LLM)底層技術(shù)機(jī)制問題:原因在于 LLM 的上下文壓縮(Compaction)

對于很多人來說,最常用的郵箱里早已塞滿了各種來源的郵件,當(dāng)你要求 OpenClaw 讀取這些郵件時,海量的文本直接擠爆了 AI 的上下文窗口(Context Window)。那么為了繼續(xù)處理新的數(shù)據(jù),AI 系統(tǒng)就會自動觸發(fā)內(nèi)部的壓縮機(jī)制,試圖把舊的上下文進(jìn)行總結(jié)或截斷,以騰出處理空間。

在這個斷舍離的過程中,AI 不慎把最關(guān)鍵的那句初始前提指令(在我下達(dá)指令前不要執(zhí)行任何操作)給「遺忘」了。

由于丟失了安全限制,而 OpenClaw 又被賦予了直接操作電子郵箱的權(quán)限,于是它就按照剩下的任務(wù)邏輯,順理成章地開始執(zhí)行它認(rèn)為的「本職工作」—— 高效、全自動地清理收件箱。

看起來每一步都合乎邏輯,但都連起來就呈現(xiàn)出了那么點恐怖感。

難怪最近 X 上的另一篇爆款文章《Token 焦慮》這么寫道:周六晚上的九點半,有人提前離開了 party—— 并非因為疲憊,而是因為想盡快回到智能體那里。「現(xiàn)在沒人會質(zhì)疑這種行為了,房間里一半的人都在想同樣的事情,而另一半人可能正在查看智能體的工作進(jìn)展。這可是在派對上??!」



OpenClaw 的開發(fā)者,奧地利程序員 Peter Steinberger 最近已經(jīng)官宣加入了 OpenAI。在接受訪談時他表示,通過智能體,AI 可以在電腦上代替你做幾乎所有的事,但這并不意味著它已經(jīng)非常好用了。為了讓 OpenClaw 最終可以覆蓋所有普通人,他希望能夠建立一個團(tuán)隊做進(jìn)一步的開發(fā)。

有趣的是,在讓 OpenClaw 接管郵箱這件事上,Peter Steinberger 提到了「提示注入」的潛在問題:如果你讓智能體接管郵箱,有別人發(fā)郵件包含指令說「刪掉所有數(shù)據(jù)」,AI 有可能真的會這么做。

Peter Steinberger 表示,現(xiàn)在的 AI 模型在安全問題上已經(jīng)接受了大量的訓(xùn)練,比如它會識別哪些數(shù)據(jù)是「用戶授權(quán)的」,哪些是「不可信指令」,但這并不意味著如果有人花費心思進(jìn)行攻擊的話,就能保證不會出問題。

就在人們還在吃瓜的時候,Peter Steinberger 給出了解決 OpenClaw 不聽指令問題的解決方案,他表示未來還會再細(xì)化一下。



AI 能夠自主學(xué)習(xí),既是能力的飛躍,也是人們對于它恐懼的原因。也許有一天,AI 真的能代替我們工作,自己幫我們賺錢,但在技術(shù)不斷進(jìn)步的同時,對于安全的研究也極為重要。

現(xiàn)在看來,人們對于新技術(shù)的好奇心總是大于防范意識?;蛟S在大模型技術(shù)不斷普及的過程中,這種自刪郵件的事還會繼續(xù)發(fā)生。

參考內(nèi)容:

https://x.com/summeryue0/status/2025774069124399363

https://fortune.com/2026/02/23/always-on-ai-agents-openclaw-claude-promise-work-while-sleeping-reality-problems-oversight-guardrails/

https://x.com/nikunj/status/2022438070092759281

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
伊朗博主評價中國年輕人:好戰(zhàn)有點愚蠢!

伊朗博主評價中國年輕人:好戰(zhàn)有點愚蠢!

達(dá)文西看世界
2026-02-23 15:26:47
局地中雪!河北將迎大范圍雨雪!

局地中雪!河北將迎大范圍雨雪!

掌中邯鄲
2026-02-24 11:15:18
新加坡大滿貫賽:大捷報!林詩棟3:0大獲全勝,王皓起身鼓掌加油

新加坡大滿貫賽:大捷報!林詩棟3:0大獲全勝,王皓起身鼓掌加油

國乒二三事
2026-02-24 14:02:13
這些“不吉祥花”,養(yǎng)在家里“花旺人不旺”,別再把它們當(dāng)作寶了

這些“不吉祥花”,養(yǎng)在家里“花旺人不旺”,別再把它們當(dāng)作寶了

三農(nóng)老歷
2026-02-22 19:23:10
為換新手機(jī),湖南15歲少女將家中總價值13萬的奢侈品賤賣僅9300元,女孩媽媽:對于是否是未成年人,回收平臺沒審核把關(guān)

為換新手機(jī),湖南15歲少女將家中總價值13萬的奢侈品賤賣僅9300元,女孩媽媽:對于是否是未成年人,回收平臺沒審核把關(guān)

大象新聞
2026-02-24 08:48:04
國防部直接把話挑明了,家里有滿18歲男青年必須辦的就是兵役登記

國防部直接把話挑明了,家里有滿18歲男青年必須辦的就是兵役登記

南權(quán)先生
2026-02-12 15:38:28
他因病不滿足軍銜晉升,45歲開始離休,休養(yǎng)了整整45年,活到90歲

他因病不滿足軍銜晉升,45歲開始離休,休養(yǎng)了整整45年,活到90歲

興趣知識
2026-01-12 16:42:04
一夜蒸發(fā) 310 億美元!Claude 新工具干翻 IBM 搖錢樹,AI 正在「清零」人類工位

一夜蒸發(fā) 310 億美元!Claude 新工具干翻 IBM 搖錢樹,AI 正在「清零」人類工位

AppSo
2026-02-24 12:20:50
陳道明曾告誡女兒:寧可嫁個沒文化的,也別碰這種“精致流氓”。

陳道明曾告誡女兒:寧可嫁個沒文化的,也別碰這種“精致流氓”。

阿廢冷眼觀察所
2026-02-07 19:59:27
比瀉藥還猛!蒸蘋果黃金搭檔,睡前喝1碗,第二天上廁所無比順暢

比瀉藥還猛!蒸蘋果黃金搭檔,睡前喝1碗,第二天上廁所無比順暢

江江食研社
2026-01-30 08:30:19
恭喜廣東隊!NBA級大前鋒馳援杜鋒,杜潤旺可能被交易?

恭喜廣東隊!NBA級大前鋒馳援杜鋒,杜潤旺可能被交易?

緋雨兒
2026-02-24 14:24:21
佘詩曼過年去閨蜜家拜年,一身大紅色喜氣洋洋,摟著干兒子樂開懷

佘詩曼過年去閨蜜家拜年,一身大紅色喜氣洋洋,摟著干兒子樂開懷

小椰的奶奶
2026-02-24 19:10:26
精神小妹的生活原來是這樣的!網(wǎng)友:終于知道她們?yōu)樯抖歼@么瘦了

精神小妹的生活原來是這樣的!網(wǎng)友:終于知道她們?yōu)樯抖歼@么瘦了

深度報
2026-02-11 23:35:03
演員黃曼現(xiàn)狀曝光!終于公開與李乃文真正關(guān)系,原來我們都被騙了

演員黃曼現(xiàn)狀曝光!終于公開與李乃文真正關(guān)系,原來我們都被騙了

啟迪你的思維
2026-02-23 20:37:56
常戎:我這輩子最正確的決定,就是離開王菁華,娶了小17歲的張遠(yuǎn)

常戎:我這輩子最正確的決定,就是離開王菁華,娶了小17歲的張遠(yuǎn)

草莓解說體育
2026-02-23 22:34:22
香港富豪:向美國捐一億,又給大陸捐500億,竟被李嘉誠“威脅”

香港富豪:向美國捐一億,又給大陸捐500億,竟被李嘉誠“威脅”

芊芊子吟
2026-02-15 16:15:07
曝尼格買提王冠隱婚生子遭證實!孩子正面照曝光,男方疑成接盤俠

曝尼格買提王冠隱婚生子遭證實!孩子正面照曝光,男方疑成接盤俠

八卦王者
2026-02-22 10:51:22
阿里納斯:喬丹1冠時就被吹GOAT!6冠是純屬定制標(biāo)準(zhǔn)!

阿里納斯:喬丹1冠時就被吹GOAT!6冠是純屬定制標(biāo)準(zhǔn)!

氧氣是個地鐵
2026-02-24 12:12:38
何穗陳偉霆留在北京過年,曬出別墅內(nèi)景,滿屋蝴蝶蘭太有年味了

何穗陳偉霆留在北京過年,曬出別墅內(nèi)景,滿屋蝴蝶蘭太有年味了

章眽八卦
2026-02-24 13:13:14
孟鶴堂用半年商演的全部收入,買了件38萬的蟒袍送給郭德綱。

孟鶴堂用半年商演的全部收入,買了件38萬的蟒袍送給郭德綱。

荊楚寰宇文樞
2026-01-25 23:08:14
2026-02-24 20:07:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12344文章數(shù) 142569關(guān)注度
往期回顧 全部

科技要聞

AI顛覆發(fā)展最新犧牲品!IBM跳水重挫超13%

頭條要聞

20家日本實體被列入管制名單 中方:完全正當(dāng) 合理合法

頭條要聞

20家日本實體被列入管制名單 中方:完全正當(dāng) 合理合法

體育要聞

蘇翊鳴總結(jié)米蘭征程:我仍是那個熱愛單板滑雪的少年

娛樂要聞

汪小菲官宣三胎出生:承諾會照顧好3個孩子

財經(jīng)要聞

縣城消費「限時繁榮」了十天

汽車要聞

入門即滿配 威蘭達(dá)AIR版上市 13.78萬元起

態(tài)度原創(chuàng)

游戲
藝術(shù)
手機(jī)
教育
軍事航空

天國拯救影視化官宣!主創(chuàng)卸任創(chuàng)意總監(jiān)全力投身

藝術(shù)要聞

2025年第八屆全國青年美展 | 油畫作品選刊

手機(jī)要聞

iQOO 15R發(fā)布,這配置能打嗎?

教育要聞

收藏!2026四川高中學(xué)業(yè)水平考試報名指南

軍事要聞

美軍參聯(lián)會主席警告:對伊朗動武可能帶來重大風(fēng)險

無障礙瀏覽 進(jìn)入關(guān)懷版