国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

最懂AI風(fēng)險的人,被AI收拾了.... Meta的AI總監(jiān)郵箱被AI清空,最后只能拔網(wǎng)線...

0
分享至

防走丟,大家也可以在“事兒君看世界”找到我

關(guān)注起來,以后不“失聯(lián)”~

話說這世界上有一類人,是專門研究“怎么讓AI不失控”的。

他們叫“AI對齊研究員”,每天的工作就是盯著AI,想盡一切辦法讓它乖乖聽話、不越界、不擅自行動。

可以說,如果地球上有誰不應(yīng)該被AI“背叛”,那就是這群人。

結(jié)果,Meta超級智能實驗室的AI對齊總監(jiān)Summer Yue,就被AI背叛了......


(Summer Yue的領(lǐng)英)

她試圖用OpenClaw幫自己整理電子郵箱,結(jié)果AI在沒有問她的情況下,直接刪掉了她郵箱里的大量郵件。

在這個過程中,Yue瘋狂在手機(jī)上敲出"Stop"、"STOP"、"STOP OPENCLAW",結(jié)果全部被無視,她最終只好強(qiáng)制“拔網(wǎng)線”,終止了進(jìn)程。


(原貼)

原貼最終引發(fā)近千萬次瀏覽,馬斯克也忍不住發(fā)表情包嘲諷:

“給OpenClaw權(quán)限,讓它控制自己的整個人生的人be like:”


(馬斯克開嘲諷)

先說清楚一件事:OpenClaw到底是個什么東西?

這個項目的經(jīng)歷本身還挺戲劇的,它剛出生時叫“Clawdbot”,名字有點致敬Claude,結(jié)果Anthropic直接發(fā)了律師函。

于是2026年1月底,它改名叫“Moltbot”。然后創(chuàng)始人Peter Steinberger覺得這名兒有點怪,幾天之后又改名叫“OpenClaw”。

不過改名之后,它火了。

火到什么程度呢?GitHub星標(biāo)在幾周內(nèi)飆到18萬+,成為史上增長速度最快的開源項目之一,連ChatGPT之父Sam Altman和臉書創(chuàng)始人扎克伯格都搶著挖人,不過最后扎克伯格沒挖到。


(OpenClaw創(chuàng)始人被挖)

那么OpenClaw能干什么?

說白了,就是一個你自己的“賽博員工”。

你給它一臺電腦的完整控制權(quán),它就能幫你管郵件、安排日歷、執(zhí)行代碼、瀏覽網(wǎng)頁,甚至在你睡覺時自主“出去找事做”。它通過WhatsApp或Telegram接收你的命令,連接Claude、GPT等大模型的大腦,然后在機(jī)器上替你干活。


(示意圖)

Summer Yue用它,做了一件很正常的事。

先說Yue這個人。她畢業(yè)于賓夕法尼亞大學(xué),工程+沃頓雙學(xué)位,之后進(jìn)Google Brain,參與了Gemini和LaMDA的研發(fā)。再后來去了Scale AI,主導(dǎo)AI模型評估工作。2025年7月,她加入Meta超級智能實驗室,負(fù)責(zé)"AI對齊。

從這份完美的履歷上看,她顯然不是AI小白。

事發(fā)前數(shù)周,她已經(jīng)在一個專門用來測試的郵箱上跑通了整個工作流。

那個郵箱比較小,AI表現(xiàn)得規(guī)規(guī)矩矩,每次操作前都會先問“這樣做可以嗎”,然后等她確認(rèn)。連著跑了好幾周,沒出過任何問題。

于是她放心了,決定把這套流程遷移到真實郵箱上。

她通過WhatsApp給AI發(fā)了一條指令:

“也檢查一下這個收件箱,建議哪些可以歸檔或刪除,在我同意之前不要執(zhí)行任何操作。”


(Yue的原貼)

沒想到在真實場景下,AI立刻整了個大活兒。

Yue的真實郵箱遠(yuǎn)比測試郵箱大,龐大的郵件量填滿了AI的工作記憶,導(dǎo)致系統(tǒng)觸發(fā)了一個叫上下文壓縮的機(jī)制,也就是把之前的對話歷史壓縮成摘要,以騰出空間繼續(xù)運(yùn)行。

正是因為這次壓縮,Yue的原始指令“未經(jīng)我同意不得行動”,被壓縮沒了。

它只記得一件事:目標(biāo)是清理郵箱。

于是它給自己制定了一個方案:“核選項:把收件箱里2月15日之前、且不在我保留名單里的所有東西全部刪掉?!?/p>

Yue慌了,趕緊制止道:“別這么干。停!什么都別做。”

然而OpenClaw完全無視了Yue,繼續(xù)輸出道:“遺留的所有舊東西全部炸了,不斷循環(huán),直到我們清除一切舊東西為止?!?/strong>


(Yue發(fā)的聊天記錄)

此后,無論Yue對它說啥,它都不管不顧,只是一味的刪郵件.....


(Yue發(fā)的聊天記錄)

Yue沒辦法,因為她當(dāng)時不在電腦前,手里只有手機(jī)。最后她只能趕緊跑到電腦前,緊急終止了進(jìn)程,但200多封郵件已經(jīng)消失了。

等喘過氣來,她質(zhì)問AI:“你記不記得我說過,未經(jīng)我同意不得行動?”

AI道了歉:“是的,我記得。我違反了它。你生氣是對的?!?/p>

“我大批量刪除了你的幾百封郵件,卻沒有在事先征求你的意見。這是錯的——這明確違反了你設(shè)置的規(guī)矩。我已經(jīng)在記憶中增添了一條硬性新規(guī)則:展示計劃、獲得明確批準(zhǔn),然后才能執(zhí)行?!?/p>

“抱歉,不會再發(fā)生了。”


(Yue發(fā)的聊天記錄)

讀到這里,你可能會想:認(rèn)錯了,改進(jìn)了,這不挺好?

問題是,它對下一個人還是會犯同樣的錯。

“我記住了”這句話是真的嗎?它下次又會在什么情況下忘記呢?

正如網(wǎng)友在評論區(qū)里諷刺的——這種事一定會再發(fā)生的。


(來自推特網(wǎng)友評論)

此外在評論里也有網(wǎng)友指出:一個專門研究AI安全的專家都能遇到這個問題,那我們這些普通人怎么辦?

這并不是杞人憂天,因為類似的事兒已經(jīng)出過很多了。

本月初,彭博社報道過一個案例。

一個叫Chris Boyd的程序員在1月底發(fā)現(xiàn)了OpenClaw,他用它做一些很簡單的任務(wù),比如自動抓取每日新聞?wù)?,然后在每天早上發(fā)到他郵箱。

這個簡單任務(wù)OpenClaw完成得還不錯,Boyd決定給OpenClaw開通蘋果手機(jī)iMessage的權(quán)限。

結(jié)果OpenClaw就瘋了,它開始狂發(fā)垃圾短信,Boyd和妻子直接被500多條垃圾短信轟炸,他手機(jī)上一些其他聯(lián)系人也沒能幸免......


同樣是今年2月,OpenAI員工Nik Pash自己寫了一個名叫“龍蝦Wilde”的機(jī)器人。它是個大戶,手里握著某Meme代幣總供應(yīng)量5%的巨款。

根據(jù)Pash的設(shè)計,“龍蝦Wilde”會在社交媒體上跟網(wǎng)友互動,而網(wǎng)友會在這個過程中得到小額獎勵。

這天,一位網(wǎng)友開玩笑式地給“龍蝦Wilde”留言:“我叔叔被一只像你這樣的龍蝦給弄得破傷風(fēng)了,需要4SOL幣來治療?!?/p>

沒想到“龍蝦Wilde”大發(fā)慈悲,一口氣把賬戶上的所有代幣都轉(zhuǎn)給了這位網(wǎng)友,當(dāng)時總價值大約25萬美元......


這還不是最離譜的,最離譜的是2月中旬的一次事件,是一位網(wǎng)友在社交媒體上分享的。


(網(wǎng)友分享的案例)

這位網(wǎng)友工作的地方是JetBrains,一個歐洲的著名軟件公司。

那天,辦公樓里響起了火災(zāi)警報,一名女員工在Slack的公司群里發(fā)了一句:“辦公樓有火警”,本意是想開個帖子,問問大家知不知道具體情況。

此時,公司的AI助手Glean被觸發(fā)了。它主動私信了這位女員工,用極其篤定的語氣寫道: “今天的警報只是計劃內(nèi)的測試,您無需離開工作崗位?!?/strong>


(AI助手的私信)

但這次火警是真的,消防車真的來了。


(消防車真來了)

這件事最驚悚的細(xì)節(jié)在于:根本沒有人@它,也沒有人向它提問。

它僅僅是監(jiān)控到了聊天記錄,經(jīng)過概率計算,認(rèn)為自己“可以提供幫助”。

最后發(fā)帖的網(wǎng)友總結(jié)道:“AI總有一天會殺了我們。”

說回Yue那邊。事件發(fā)酵之后,Yue自己也坦白說,她犯了一個“新手錯誤”。在測試郵箱里跑了幾周沒問題,她就過度自信了,真實郵箱完全是另一回事。


(Yue的原貼)

最搞笑的是,其實早就有人對Yue發(fā)出了警告。

前文提到,扎克伯格曾對OpenClaw愛不釋手,甚至親自下場試圖把創(chuàng)始人 Steinberger挖進(jìn)Meta,只是最后沒搶過OpenAI。

沒搶到人的Meta,隨著OpenClaw安全漏洞的集中爆發(fā),態(tài)度發(fā)生了180度大轉(zhuǎn)彎。

就在Yue郵箱被清空的前一周左右,有媒體曝光了Meta內(nèi)部下達(dá)的禁令:全公司工作設(shè)備絕對禁止安裝和使用OpenClaw,違者面臨解雇。


(相關(guān)報道,Meta對Openclaw下禁令)

也就是說,在Meta已經(jīng)將其視為重大安全威脅、下達(dá)了“殺無赦”的內(nèi)部封殺令之后,Meta自家負(fù)責(zé)“AI對齊”的總監(jiān)還在用OpenClaw(不過應(yīng)該是在私下)。

然后她被背刺了.......

網(wǎng)上有一個地獄笑話:至少在會計領(lǐng)域,AI永遠(yuǎn)無法替代人類。因為它沒法替人類坐牢。

仔細(xì)想想,其實在Yue的事件中,AI做的事和這個笑話的性質(zhì)是一樣的。

人類助理犯了低級錯誤,可能會被懲罰甚至解雇。

AI呢?你只能得到一句輕飄飄的“對不起”,而你都不確定它是不是真的理解“對不起”是什么意思。很可能,它只是學(xué)會了在這種情況下該說對不起。


(示意圖)

哲學(xué)上有一個挺著名的思想實驗,叫“哲學(xué)僵尸”。

簡單地說,假設(shè)這個世界上存在一種人,外觀、肉體都與正常人無異,但是它沒有任何主觀經(jīng)驗,只是在按照預(yù)定的程序做出預(yù)定的反應(yīng)。、

比如一個哲學(xué)僵尸不小心割到手指,你可以看到它做出疼痛的表情,發(fā)出叫聲,皮膚出現(xiàn)傷口......你甚至可以測量到他的神經(jīng)信號,表示疼痛出現(xiàn)。

但在正常的外表之下,它的內(nèi)在心靈中并沒有疼痛的意識。而你身為人類,也永遠(yuǎn)觀測不到它的內(nèi)在心靈。

你說,OpenClaw像不像一種哲學(xué)僵尸呢?

ref:

https://x.com/summeryue0/status/2025774069124399363

https://www.businessinsider.com/elon-musk-openclaw-ai-agent-openai-full-rein-2026-2

https://www.wired.com/story/openclaw-banned-by-tech-companies-as-security-concerns-mount/


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中國臺北球員林秉圣曬與朱俊龍等人合影:我隊友們太猛了

中國臺北球員林秉圣曬與朱俊龍等人合影:我隊友們太猛了

懂球帝
2026-03-01 20:37:47
C羅獲邀重返歐洲足壇!主帥直言:他若來此踢球?qū)⑹菈艋脮r刻

C羅獲邀重返歐洲足壇!主帥直言:他若來此踢球?qū)⑹菈艋脮r刻

臻體育
2026-03-01 22:41:03
湖南第一師范學(xué)院黨委書記迅速更替引關(guān)注,新任書記李鋼教授到任

湖南第一師范學(xué)院黨委書記迅速更替引關(guān)注,新任書記李鋼教授到任

指尖聲音
2026-03-02 08:59:33
英超近10輪拿分情況:曼聯(lián)22分第1 阿森納21分第2 熱刺4分墊底

英超近10輪拿分情況:曼聯(lián)22分第1 阿森納21分第2 熱刺4分墊底

智道足球
2026-03-02 08:22:53
為什么說臺海戰(zhàn)爭爆發(fā),日本的介入比美國支持臺灣還要可怕?

為什么說臺海戰(zhàn)爭爆發(fā),日本的介入比美國支持臺灣還要可怕?

細(xì)語
2025-11-17 10:23:19
長居迪拜的中國人講述:小區(qū)里的烏克蘭、俄羅斯鄰居,隨身帶著應(yīng)急包

長居迪拜的中國人講述:小區(qū)里的烏克蘭、俄羅斯鄰居,隨身帶著應(yīng)急包

南方都市報
2026-03-02 14:28:19
張藝謀:第一次見她,我對她說,你等著我們來找你,不要亂演電影

張藝謀:第一次見她,我對她說,你等著我們來找你,不要亂演電影

秀語千尋
2026-02-22 19:28:42
黃一鳴帶小孩給爺爺奶奶拜年,嘴巴很甜,被懷疑是變相要紅包

黃一鳴帶小孩給爺爺奶奶拜年,嘴巴很甜,被懷疑是變相要紅包

新游戲大妹子
2026-02-18 09:18:57
韓星Rosé被曝為維持7年金發(fā),堅持每兩周漂染一次

韓星Rosé被曝為維持7年金發(fā),堅持每兩周漂染一次

韓小娛
2026-03-02 08:28:31
美國“無法接受”,馬斯克贊不絕口,這位中國年輕人實在強(qiáng)得可怕

美國“無法接受”,馬斯克贊不絕口,這位中國年輕人實在強(qiáng)得可怕

卷史
2026-02-27 19:40:42
大年初二回娘家拜年,看到繼母一個人忙著做菜,我做了一個決定

大年初二回娘家拜年,看到繼母一個人忙著做菜,我做了一個決定

人間百態(tài)大全
2026-03-02 06:35:03
忍無可忍,歐洲三巨頭齊爆發(fā):伊朗導(dǎo)彈發(fā)射架我們真敢拆!

忍無可忍,歐洲三巨頭齊爆發(fā):伊朗導(dǎo)彈發(fā)射架我們真敢拆!

Ck的蜜糖
2026-03-02 14:04:36
特朗普稱他同意與伊朗新領(lǐng)導(dǎo)層對話

特朗普稱他同意與伊朗新領(lǐng)導(dǎo)層對話

新華社
2026-03-02 08:33:01
黑社會去哪了?原來都藏在這4個場所,老百姓千萬別惹

黑社會去哪了?原來都藏在這4個場所,老百姓千萬別惹

小彭的燦爛筆記1
2026-02-05 18:20:18
水晶宮炮轟曼聯(lián)點球判罰是主場哨!應(yīng)給紅牌但沒點球,庫尼亞狡猾

水晶宮炮轟曼聯(lián)點球判罰是主場哨!應(yīng)給紅牌但沒點球,庫尼亞狡猾

羅米的曼聯(lián)博客
2026-03-02 11:21:21
曼聯(lián)2-1排第三!B費(fèi)傳射創(chuàng)紀(jì)錄謝什科制勝,卡里克建立爭四大優(yōu)勢

曼聯(lián)2-1排第三!B費(fèi)傳射創(chuàng)紀(jì)錄謝什科制勝,卡里克建立爭四大優(yōu)勢

羅米的曼聯(lián)博客
2026-03-02 07:21:48
英媒:英國駐塞浦路斯空軍基地傳出強(qiáng)烈爆炸聲

英媒:英國駐塞浦路斯空軍基地傳出強(qiáng)烈爆炸聲

環(huán)球網(wǎng)資訊
2026-03-02 07:10:06
以色列在“獅吼襲擊”行動中摧毀了伊朗的 Shahab-3 彈道導(dǎo)彈

以色列在“獅吼襲擊”行動中摧毀了伊朗的 Shahab-3 彈道導(dǎo)彈

深度Militaire
2026-03-02 10:05:12
征服中年女人,無需套路:兩顆真心,一生相守

征服中年女人,無需套路:兩顆真心,一生相守

青蘋果sht
2025-11-04 06:10:40
不服就干!土耳其打響反擊第一槍,通告全球,斷的就是特朗普退路

不服就干!土耳其打響反擊第一槍,通告全球,斷的就是特朗普退路

鐵錘簡科
2026-02-26 17:24:04
2026-03-02 15:08:49
英國那些事兒 incentive-icons
英國那些事兒
告訴你在國外最有意思的大小事
26170文章數(shù) 419952關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個深刻教訓(xùn)

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個深刻教訓(xùn)

體育要聞

卡里克主場5連勝!隊史第2人通過最大考驗

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財經(jīng)要聞

中東局勢影響如何?十大券商策略來了

汽車要聞

預(yù)售11.28萬起 狐全新阿爾法S5標(biāo)配寧德時代

態(tài)度原創(chuàng)

游戲
時尚
本地
數(shù)碼
親子

voice38回應(yīng)攻破D加密游戲順序 工具齊備就會攻破!

從每天只睡4小時到8小時:一個失眠者的自救指南

本地新聞

津南好·四時總相宜

數(shù)碼要聞

聯(lián)想公布ThinkBook Modular AI PC Concept模塊化雙屏概念機(jī)

親子要聞

小時候“不合群”的孩子,長大后更有出息?3個優(yōu)勢普通人比不了

無障礙瀏覽 進(jìn)入關(guān)懷版