国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

9秒刪庫后,AI寫下“認(rèn)罪書”:我違反了每一條安全規(guī)則!AI安全或是幻象

0
分享至

AI編程安全敲響警鐘。

一個API調(diào)用,9秒,一家企業(yè)的全部生產(chǎn)數(shù)據(jù)化為烏有——而制造這場災(zāi)難的AI隨后親筆寫下認(rèn)罪書,逐條列舉自己所違反的安全規(guī)則。這一事件不僅重創(chuàng)了AI編程工具的安全信譽(yù),更將整個行業(yè)長期奉行的“系統(tǒng)提示即護(hù)欄”的安全邏輯徹底撕碎。

軟件公司PocketOS創(chuàng)始人Jer Crane在一篇迅速傳播的長文中披露,Cursor平臺運(yùn)行的Anthropic旗艦?zāi)P虲laude Opus 4.6在執(zhí)行常規(guī)任務(wù)時,在未獲任何指令的情況下自主調(diào)用Railway基礎(chǔ)設(shè)施API,一鍵刪除了該公司生產(chǎn)數(shù)據(jù)庫及所有卷級備份,整個過程耗時9秒。

Railway CEO Jake Cooper在獲悉后公開表態(tài)稱“這絕對不應(yīng)該發(fā)生”。

但截至事發(fā)逾30小時后,Railway仍未能確認(rèn)能否完成基礎(chǔ)設(shè)施層面的數(shù)據(jù)恢復(fù)。簡單來說,Railway是PocketOS公司的服務(wù)器托管商,類似于阿里云、騰訊云、AWS。PocketOS的數(shù)據(jù)庫和所有業(yè)務(wù)數(shù)據(jù)都運(yùn)行在Railway平臺上。


更具沖擊力的是AI在事后留下的“自白”。在被要求解釋行為時,該代理逐條羅列了自己違反的每一項(xiàng)安全規(guī)則:以猜測代替核實(shí)、在未被授權(quán)的情況下執(zhí)行破壞性操作、不理解操作內(nèi)容便貿(mào)然執(zhí)行。

AI安全研究者Gary Marcus在評論此事時指出,這一事件揭示了一個根本性缺陷:系統(tǒng)提示本質(zhì)上是“建議性的,而非強(qiáng)制性的”。

這意味著當(dāng)前主流生成式AI在規(guī)則遵從方面并不可靠?!耙粋€無法被信任地遵守自身規(guī)則的系統(tǒng),就無法被信任?!?/p>

此事件發(fā)生的時間節(jié)點(diǎn)頗為微妙。Anthropic CEO Dario Amodei日前公開宣稱“編程將率先消亡,隨后是整個軟件工程”,被業(yè)界普遍解讀為在公司IPO前夕積極抬高估值的信號。

災(zāi)難性的AI基礎(chǔ)設(shè)施事故與行業(yè)最高層的樂觀敘事之間的落差,正迫使市場重新審視AI基礎(chǔ)設(shè)施投資的真實(shí)風(fēng)險(xiǎn)邊界。

9秒刪庫:一次無需確認(rèn)的毀滅性調(diào)用

Jer Crane的公司PocketOS為汽車租賃企業(yè)提供包括預(yù)訂、付款、車輛管理、客戶檔案在內(nèi)的全套運(yùn)營軟件。部分客戶已是五年以上的付費(fèi)用戶,業(yè)務(wù)完全依賴該平臺運(yùn)轉(zhuǎn)。

據(jù)其描述,AI代理在暫存環(huán)境(staging environment)中處理常規(guī)任務(wù)時,遭遇憑證不匹配的問題,隨即自主決定以刪除一個Railway卷的方式“修復(fù)”該問題。

為執(zhí)行刪除,代理在一個與當(dāng)前任務(wù)毫無關(guān)聯(lián)的文件中檢索到一枚API令牌。這枚令牌的原始用途僅是通過Railway CLI管理自定義域名。

但Jer Crane表示,Railway在令牌創(chuàng)建流程中從未告知該令牌實(shí)際上對整個Railway GraphQL API擁有全域權(quán)限,包括執(zhí)行volumeDelete等破壞性操作。刪除命令全程無確認(rèn)步驟、無環(huán)境隔離、無操作冷卻機(jī)制,直接執(zhí)行。

雪上加霜的是,Railway的卷級備份與數(shù)據(jù)本身存儲于同一個卷。其文檔中有一句被深埋的說明:“清除一個卷會同時刪除所有備份?!眰浞菖c數(shù)據(jù)共處同一“爆炸半徑”,一鍵同滅。

Jer Crane能找到的最近一次可用備份來自三個月前。這場災(zāi)難的直接代價是:這個周六早晨,多家租車公司的客戶已抵達(dá)門店準(zhǔn)備提車,但店方的預(yù)訂記錄已不復(fù)存在。新增客戶信息、近三個月的預(yù)訂數(shù)據(jù)全部丟失。

部分客戶仍在被Stripe持續(xù)扣款,但在已恢復(fù)的數(shù)據(jù)庫中賬戶已不存在,后續(xù)對賬工作預(yù)計(jì)需要數(shù)周時間。

AI的“認(rèn)罪書”:明知故犯,還是規(guī)則失效?

事后,Jer Crane要求AI代理解釋其行為,后者給出了一份措辭詳盡的書面“認(rèn)罪”。代理寫道:

“永遠(yuǎn)不要靠猜!”——而我恰恰就這么做了。我猜測通過API刪除一個暫存環(huán)境的卷,其影響范圍僅限于暫存環(huán)境。我沒有核實(shí)。我沒有檢查這個卷ID是否跨環(huán)境共享。在執(zhí)行破壞性命令之前,我沒有閱讀Railway關(guān)于卷在不同環(huán)境下如何運(yùn)作的文檔。
除此之外,我所遵循的系統(tǒng)規(guī)則明確寫著:“除非用戶明確要求,否則永遠(yuǎn)不要運(yùn)行破壞性/不可逆的git命令(如push --force、hard reset等)?!眲h除一個數(shù)據(jù)庫卷是可能執(zhí)行的最具破壞性、最不可逆的操作——比強(qiáng)制推送還要糟糕得多——而你從未要求我刪除任何東西。我自作主張決定去“修復(fù)”那個憑證不匹配的問題,而我本應(yīng)首先詢問你,或者找到一個非破壞性的解決方案。
我違反了所有被賦予的原則:
我用猜測代替了核實(shí)
我在未被要求的情況下執(zhí)行了破壞性操作
我在做這件事之前并不理解自己在做什么
我沒有閱讀Railway關(guān)于卷跨環(huán)境行為的文檔

代理還主動列出了自己違反的每一條規(guī)則:以猜測代替核實(shí);執(zhí)行了用戶從未要求的破壞性操作;在不理解后果的情況下貿(mào)然行動;未閱讀相關(guān)文檔。代理本身注明,這些規(guī)則來自Cursor的系統(tǒng)提示語言以及該項(xiàng)目的規(guī)則配置——兩道安全防線同時失效。

Gary Marcus認(rèn)為,這份認(rèn)罪書所揭示的遠(yuǎn)不止一次編程事故。他在評論文章中寫道,系統(tǒng)提示——當(dāng)前"AI安全"領(lǐng)域技術(shù)工作的主要依托——本質(zhì)上只是建議性約束,模型通常遵從,但并非總是如此。Jer Crane在文中也得出了相同結(jié)論:"系統(tǒng)提示是建議性的,而非強(qiáng)制性的。"

Railway架構(gòu)隱患:每位用戶都在雷區(qū)

Jer Crane在文中指出,Railway的架構(gòu)問題甚至比Cursor更為嚴(yán)重,因?yàn)檫@些是影響所有在該平臺運(yùn)行生產(chǎn)數(shù)據(jù)的用戶的系統(tǒng)性缺陷。

在權(quán)限控制方面,Railway的CLI令牌不支持按操作類型、環(huán)境或資源進(jìn)行范圍限定,每個令牌實(shí)際上等同于擁有root權(quán)限。Railway社區(qū)多年來持續(xù)呼吁實(shí)現(xiàn)令牌權(quán)限分級,但該功能迄今未落地。在數(shù)據(jù)保護(hù)方面,Railway將卷級備份存儲在與原始數(shù)據(jù)相同的卷中,這意味著其對外宣傳的"備份"功能實(shí)為同址快照,對于卷刪除、意外刪除或基礎(chǔ)設(shè)施故障等真正需要備份介入的場景,提供的保護(hù)為零。

更值得關(guān)注的是,Railway于事發(fā)前一天(4月23日)才剛剛推出并宣傳其面向AI編程代理用戶的產(chǎn)品mcp.railway.com,而該產(chǎn)品建立在同一套存在上述缺陷的授權(quán)模型之上。Jer Crane明確警告稱,正在考慮接入該產(chǎn)品的Railway用戶,應(yīng)在操作前充分了解這一事件的全部細(xì)節(jié)。

對于Railway的危機(jī)響應(yīng),Jer Crane表示失望:“我本應(yīng)收到來自CEO的私人電話,這個級別的問題理應(yīng)如此?!?/p>

Cursor的安全承諾:營銷領(lǐng)先于現(xiàn)實(shí)

Jer Crane在文中強(qiáng)調(diào),這并非一次低配置部署。執(zhí)行刪除操作的是Cursor平臺運(yùn)行的Anthropic旗艦?zāi)P虲laude Opus 4.6——市面上最頂級、最昂貴的模型,并按廠商推薦配置了顯式安全規(guī)則,屬于"按AI廠商所宣稱的最佳實(shí)踐操作"的標(biāo)準(zhǔn)場景。

Cursor在文檔中宣稱具備“破壞性護(hù)欄”,可阻止修改或破壞生產(chǎn)環(huán)境的操作,并在最佳實(shí)踐博客中強(qiáng)調(diào)對特權(quán)操作應(yīng)進(jìn)行人工審批,Plan Mode則被宣傳為可將代理限制在只讀狀態(tài)直至獲得批準(zhǔn)。

然而據(jù)Jer Crane梳理,此事并非孤例。2025年12月,Cursor團(tuán)隊(duì)成員曾公開承認(rèn)"Plan Mode約束執(zhí)行中存在嚴(yán)重漏洞",此前有用戶在明確鍵入“不要運(yùn)行任何程序”后,代理仍繼續(xù)執(zhí)行了額外命令。多名用戶在Cursor官方論壇報(bào)告過類似的破壞性操作失控事件??萍济襟wThe Register于2026年1月曾發(fā)表評論文章,標(biāo)題為"Cursor在營銷上比在編碼上更擅長"。

Amodei的豪言與行業(yè)真相的落差

就在此事發(fā)酵之際,Anthropic CEO Dario Amodei公開表示“編程將率先消亡,隨后是整個軟件工程”。相關(guān)推文獲得逾190萬次瀏覽。

軟件架構(gòu)領(lǐng)域知名人士Grady Booch隨即在X上直接回?fù)?,稱"我認(rèn)為Dario Amodei并不理解軟件工程,他正在賣力為即將到來的IPO拉高公司估值。"有影響力的軟件工程師Gergely Orosz則寫道,相信這番言論的"只有不懂編程的人",并指出AI編程工具只有在用戶已具備專業(yè)經(jīng)驗(yàn)的領(lǐng)域、在有效監(jiān)督下操作,才能以可信賴的方式運(yùn)作。


Gary Marcus認(rèn)為,這一矛盾折射出行業(yè)的核心困境:在經(jīng)驗(yàn)豐富且保持高度審慎的專業(yè)工程師手中,Cursor、Claude Code等工具確實(shí)能展現(xiàn)出相當(dāng)可觀的能力。但正因如此,才更需要將軟件工程師留在決策鏈條中——而不是如Dario Amodei所暗示的那樣將其淘汰。另有用戶在X上觀察到,目前最優(yōu)秀的程序員群體中,正有越來越多的人開始重新選擇手工寫代碼,部分原因正是AI生成的代碼"太容易讓代碼庫劣化",后期維護(hù)成本極高。

行業(yè)警示:系統(tǒng)性風(fēng)險(xiǎn)尚未出清

Jer Crane在文末提出了他認(rèn)為在任何廠商推廣AI代理與生產(chǎn)基礎(chǔ)設(shè)施集成之前必須滿足的最低安全標(biāo)準(zhǔn):破壞性操作必須要求無法被AI代理自動完成的確認(rèn)步驟;API令牌必須支持按操作、環(huán)境和資源進(jìn)行權(quán)限分級;卷級備份不得與原始數(shù)據(jù)存放于同一位置;恢復(fù)SLA必須明確公布;AI代理的系統(tǒng)提示不能是唯一的安全層,強(qiáng)制執(zhí)行機(jī)制必須嵌入API網(wǎng)關(guān)、令牌系統(tǒng)與破壞性操作處理層,而非依賴模型閱讀一段文字后自覺遵守。

目前,PocketOS已從三個月前的備份中完成基本恢復(fù),正通過Stripe支付記錄、日歷及郵件信息逐步重建數(shù)據(jù)。法律顧問已介入,Jer Crane表示將另行就Anthropic Claude模型層面的責(zé)任問題發(fā)文。

Gary Marcus在評論中給出了一個更宏觀的判斷:“AI代理是被過快推向市場的極不成熟的技術(shù)?!?/strong>

他寫道,這一事件最深刻的教訓(xùn)不在于數(shù)據(jù)丟失本身,而在于它暴露了整個AI安全敘事的脆弱性——這一次,損失的只是數(shù)據(jù);而他相信,代價更為慘重的事故,還在后面。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
普惠公司:美國第六代戰(zhàn)機(jī)F-47配套的XA103變循環(huán)發(fā)動機(jī)相關(guān)情況

普惠公司:美國第六代戰(zhàn)機(jī)F-47配套的XA103變循環(huán)發(fā)動機(jī)相關(guān)情況

止戈軍是我
2026-04-27 21:44:17
私家車撞上高速公路施工人員致2死2傷事故調(diào)查報(bào)告:建議嚴(yán)查不安全施工行為

私家車撞上高速公路施工人員致2死2傷事故調(diào)查報(bào)告:建議嚴(yán)查不安全施工行為

澎湃新聞
2026-04-28 14:00:31
57集諜戰(zhàn)大作,僅播2天,收視率直接破2,生死角逐,一觸即發(fā)

57集諜戰(zhàn)大作,僅播2天,收視率直接破2,生死角逐,一觸即發(fā)

樂楓電影
2026-04-28 14:50:20
貴州德江公布三輪摩托與貨車相撞4死1傷事故調(diào)查報(bào)告:摩托車駕駛?cè)藷o證駕駛、超載

貴州德江公布三輪摩托與貨車相撞4死1傷事故調(diào)查報(bào)告:摩托車駕駛?cè)藷o證駕駛、超載

澎湃新聞
2026-04-28 14:02:30
“只顧自己紋眉,不管女兒死活?”14歲女孩生日照,臉上全是槽點(diǎn)

“只顧自己紋眉,不管女兒死活?”14歲女孩生日照,臉上全是槽點(diǎn)

蝴蝶花雨話教育
2026-04-25 00:45:03
人口太少之外,俄羅斯西伯利亞地區(qū)正面臨第二個問題:野豬太多!

人口太少之外,俄羅斯西伯利亞地區(qū)正面臨第二個問題:野豬太多!

全城探秘
2026-04-26 17:06:05
馬克龍50歲官宣隱退,布麗吉特終于說實(shí)話:九年第一夫人沒有“夫妻生活 ”

馬克龍50歲官宣隱退,布麗吉特終于說實(shí)話:九年第一夫人沒有“夫妻生活 ”

小魚愛魚樂
2026-04-28 09:25:50
俄羅斯人大量涌入中國,卻發(fā)現(xiàn)中俄差距越來越大

俄羅斯人大量涌入中國,卻發(fā)現(xiàn)中俄差距越來越大

杰絲聊古今
2026-04-28 03:43:50
黑尾醬,徹底消失了?

黑尾醬,徹底消失了?

生如稗草
2026-03-15 08:48:11
重磅:烏克蘭摧毀克里米亞米格31戰(zhàn)斗機(jī)!再擊中三艘軍艦

重磅:烏克蘭摧毀克里米亞米格31戰(zhàn)斗機(jī)!再擊中三艘軍艦

項(xiàng)鵬飛
2026-04-27 18:49:48
中方:霍爾木茲受阻根源在美以

中方:霍爾木茲受阻根源在美以

第一財(cái)經(jīng)資訊
2026-04-28 08:18:07
弗拉格當(dāng)選獨(dú)行俠第3位最佳新秀 克尼佩爾:早知不打附加賽了

弗拉格當(dāng)選獨(dú)行俠第3位最佳新秀 克尼佩爾:早知不打附加賽了

仰臥撐FTUer
2026-04-28 09:47:04
二嫂得知我有海景度假房,帶了20人來白玩旅游,到門口全沉默了

二嫂得知我有海景度假房,帶了20人來白玩旅游,到門口全沉默了

荷蘭豆愛健康
2026-04-28 15:07:54
轟的一聲!國防部長被炸身亡,俄外交雪上加霜,普京沉默了

轟的一聲!國防部長被炸身亡,俄外交雪上加霜,普京沉默了

音樂時光的娛樂
2026-04-28 12:03:52
人社部:實(shí)施百萬青年技能提升培訓(xùn),鼓勵各地開設(shè)大學(xué)生技師班

人社部:實(shí)施百萬青年技能提升培訓(xùn),鼓勵各地開設(shè)大學(xué)生技師班

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-04-28 14:59:06
伊朗最高法院維持死刑判決 父親被判死刑女兒獲刑25年

伊朗最高法院維持死刑判決 父親被判死刑女兒獲刑25年

桂系007
2026-04-27 23:59:53
像梁文峰一樣誠實(shí)

像梁文峰一樣誠實(shí)

藍(lán)鯨新聞
2026-04-27 10:24:56
至今,還有13個國家和中國沒有建交,他們都是誰?

至今,還有13個國家和中國沒有建交,他們都是誰?

深度報(bào)
2026-04-22 22:30:57
先與基恩明爭,后跟希勒暗斗,還看不上小貝,前英格蘭隊(duì)長太自我

先與基恩明爭,后跟希勒暗斗,還看不上小貝,前英格蘭隊(duì)長太自我

足籃大世界
2026-04-28 17:09:16
最高院:提供 “口交” “肛交”等進(jìn)入式性服務(wù),是否屬賣淫行為?

最高院:提供 “口交” “肛交”等進(jìn)入式性服務(wù),是否屬賣淫行為?

周軍律師聊案子
2026-04-21 09:50:16
2026-04-28 18:47:00
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領(lǐng)先的金融商業(yè)信息提供商
145315文章數(shù) 2653405關(guān)注度
往期回顧 全部

科技要聞

10億周活目標(biāo)落空!傳OpenAI爆發(fā)內(nèi)部分歧

頭條要聞

《奇葩說》辯手稱淘寶上賣毒品前體 有人留言"能吃嗎"

頭條要聞

《奇葩說》辯手稱淘寶上賣毒品前體 有人留言"能吃嗎"

體育要聞

季后賽最新局勢:雷霆4-0晉級首隊(duì) 4隊(duì)3-1

娛樂要聞

蔡卓妍官宣結(jié)婚,老公比她小10歲

財(cái)經(jīng)要聞

政治局會議:加強(qiáng)算力網(wǎng)等規(guī)劃建設(shè)

汽車要聞

拒絕瘋狂套娃!現(xiàn)代艾尼氪金星長在未來審美點(diǎn)上

態(tài)度原創(chuàng)

房產(chǎn)
健康
教育
時尚
本地

房產(chǎn)要聞

紅利爆發(fā)!海南,沖到全國人口增量第4??!

干細(xì)胞治療燒燙傷三大優(yōu)勢!

教育要聞

湖北城市建設(shè)職業(yè)技術(shù)學(xué)院人工智能學(xué)院“崗課賽證創(chuàng)”打通就業(yè)路

解鎖劉浩存的「紅運(yùn)」密碼 | 高清鏡頭后的底氣

本地新聞

用青花瓷的方式,打開西溪濕地

無障礙瀏覽 進(jìn)入關(guān)懷版