国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

當Anthropic的安全人設崩塌:一場被泄露戳穿的生存游戲

0
分享至


本文來自微信公眾號:青萍見,作者:舒書,頭圖來自:AI生成

過去兩天,AI圈最魔幻的一幕出現(xiàn)了:以安全潔癖著稱的Anthropic,因為一個連實習生都不該犯的CMS配置失誤,讓3000份內(nèi)部文件在互聯(lián)網(wǎng)上裸奔。

網(wǎng)絡安全股應聲暴跌,安全研究員們一邊吃瓜一邊炸鍋——誰能想到,這家天天喊著“AI安全高于一切”的公司,自己的安全防線竟比紙糊的還脆?

但比這場低級泄露更諷刺的是,就在事發(fā)前一個月,Anthropic剛剛悄悄撕掉了自己最引以為傲的安全承諾。

新版《負責任擴展政策》(RSP 3.0)里,那個曾讓OpenAI都顯得不道德的“若風險不可控,就暫停訓練”的硬條款,被悄無聲息地刪除了。

這不是技術(shù)調(diào)整,這是一場精心包裝的人設崩塌。

一、從硬剎車到軟著陸:安全承諾的彈性變形記

2023年,當Anthropic推出RSP時,整個行業(yè)都在鼓掌。

這是第一次,有AI公司敢公開說:“如果模型太危險,我們就不做了?!?/p>

當時的邏輯簡單粗暴:設定危險閾值(比如能輔助研發(fā)生物武器),一旦觸及,立刻暫停訓練,直到安全措施到位。

這是一條死線,意味著安全優(yōu)先級高于商業(yè)進度、融資節(jié)奏,甚至IPO窗口。

2026年2月,RSP 3.0來了。

那條死線沒了。

取而代之的是“前沿安全路線圖、風險報告、外部審查”——每3到6個月發(fā)布一次報告,由內(nèi)部專家起草,獨立評審,提交董事會。

官方說法很漂亮:“技術(shù)邊界模糊,無法預設紅線,所以轉(zhuǎn)向透明披露?!?/p>

翻譯過來就是:從做不到就不許動變成了邊做邊說。

更直白點:從硬剎車變成了軟著陸。

首席科學家Jared Kaplan在接受采訪時,直接道出了真相:

“如果競爭對手飛速前進,我們單方面承諾暫停訓練沒有意義。”

說白了就是:別人都在跑,我不能站著。

這不是技術(shù)判斷,是生存判斷。

在資本眼中,暫停訓練等于暫停估值增長。對于一家估值3800億美元、正被OpenAI(8500億+)、Google、xAI圍剿的公司,繼續(xù)自我設限等于商業(yè)自殺。

從硬剎車到透明監(jiān)控,中間差的不是技術(shù)認知,是囚徒困境下的生存本能。


二、軍事合作的底線游戲:當國家意志撞上安全紅線

如果說RSP 3.0的調(diào)整是主動妥協(xié),那么軍事合作的博弈,就是一場真正的底線戰(zhàn)爭。

Anthropic曾信誓旦旦:“拒絕參與全自主武器和國內(nèi)大規(guī)模監(jiān)控?!?/p>

這條紅線劃得比刀鋒還利。

2026年2月24日,一把更鋒利的刀架在了它的脖子上。

那一天,美國國防部長皮特·赫格塞斯當面向Anthropic CEO達里奧·阿莫迪下達了最后通牒:解除Claude模型的所有軍事用途限制(包括進攻性網(wǎng)絡行動),否則后果自負。

截止時間是2月27日17:01。

后果是什么?要么五角大樓動用《國防生產(chǎn)法》強制接管模型,要么將Anthropic列為供應鏈風險企業(yè)——這個標簽通常用于敵對國家的公司,一旦貼上,Anthropic將失去所有國防承包商的商業(yè)聯(lián)系。

這是一道選擇題:放棄安全原則,或者放棄生存。

2月27日,最后期限到來。阿莫迪未能及時與五角大樓官員敲定最終條款。截止時間剛過14分鐘,赫格塞斯宣布談判破裂,將Anthropic正式列為供應鏈風險。

特朗普隨后下令聯(lián)邦機構(gòu)停止使用Anthropic技術(shù)。

但故事沒有在這里結(jié)束。

3月9日,Anthropic正式向加州聯(lián)邦法院提起訴訟,指控美國政府的系列行動“前所未有且不合法”。

3月26日,法院作出裁定。加州北區(qū)聯(lián)邦地區(qū)法院法官Rita Lin批準了Anthropic的初步禁制令申請,叫停了國防部的封殺令。

法庭文件顯示,Anthropic提供了關(guān)鍵技術(shù)證據(jù):其模型在部署于軍方封閉環(huán)境后,公司本身無法遠程控制——這一證據(jù)戳穿了五角大樓的安全風險指控。

Anthropic贏了。

至少這一回合。

拒絕全自主武器,寧可被制裁也不妥協(xié)。這條線,是它的底線。但問題是:底線能守多久?法院的裁定只是初步禁制令,不是終局。五角大樓可以換一種方式再來。而Anthropic的客戶名單里,依然有國防部的名字——那些作戰(zhàn)規(guī)劃和情報分析的合作,依然在繼續(xù)。

拒絕全自主武器,但接受作戰(zhàn)規(guī)劃。這條線劃得清楚嗎?還是說,它只是在更大的博弈里,選了一個自己能承受的戰(zhàn)場?

這不是Anthropic的選擇,是它沒有選擇——但它選擇了抗爭。

三、內(nèi)部管理的燈下黑:最強安全AI,犯最低級錯誤

一個CMS配置失誤,3000份文件裸奔。

這不是黑客攻擊,不是系統(tǒng)漏洞,是最基礎的權(quán)限設置問題——和AWS S3存儲桶忘記關(guān)權(quán)限一樣低級。

劍橋大學研究員驗證了泄露材料的真實性:員工育兒假記錄、CEO閉門峰會細節(jié)、甚至內(nèi)部安全評估報告,全部暴露在互聯(lián)網(wǎng)上。

最諷刺的是,泄露文件中有一句罕見的話:

“Mythos預示著即將到來的一波模型浪潮,屆時模型將以遠超防御者努力的速度來利用漏洞?!?/p>

措辭之重,不像市場部寫的,更像造物主的恐懼清單。

一家正在打造史上最強網(wǎng)絡安全AI的公司,被最基礎的權(quán)限配置失誤扒了個精光。

這種燈下黑的現(xiàn)象在科技史上屢見不鮮:蘋果與FBI之爭、微軟補丁漏洞、Google內(nèi)部數(shù)據(jù)泄露……每一家科技巨頭都犯過類似的錯誤。

但Anthropic的不同在于:它的核心價值就是安全。

當一家以安全第一立身的公司,連自己的內(nèi)部文件都保護不好,它憑什么保護用戶?


四、AI安全的囚徒困境:當好人活不下去

泄露文件里那句“模型將以遠超防御者努力的速度來利用漏洞”,像一把刀懸在AI從業(yè)者頭頂。

而Dario Amodei在看到這份評估時,是什么心態(tài)?是興奮、恐懼,還是兩者皆有?

他拒絕全自主武器,但接受作戰(zhàn)規(guī)劃。這條線劃得清楚嗎?還是說,它只是在更大的博弈里,選了一個自己能承受的戰(zhàn)場?

Anthropic不是唯一面臨“安全vs商業(yè)”悖論的公司。

OpenAI的“宮斗”暴露了治理結(jié)構(gòu)的脆弱:當非營利使命和商業(yè)利益沖突,決策權(quán)在誰手里?

Google的“慢”暴露了官僚流程的拖沓:有最多的人才和算力,卻跑得最慢。

Anthropic的“泄露”暴露了安全流程的漏洞:當核心價值是“安全”,卻連基礎流程都做不好。

當模型能力越來越趨同——都用Transformer架構(gòu)、都做RLHF對齊、都卷推理能力——決定誰能活下來的,不是誰算力最多,不是誰模型最強,而是誰的組織最扛造。

但更深的困境在于:當安全承諾在資本壓力和國家意志面前被反復修改,這個行業(yè)的安全到底還有多少可信度?

RSP 3.0的變化,國防部的最后通牒,CMS的低級失誤——這三件事拼在一起,勾勒出一個殘酷的圖景:

AI行業(yè)正在經(jīng)歷一場安全敘事的破產(chǎn)。

監(jiān)管真空:政府沒有建立統(tǒng)一的紅線,導致企業(yè)不敢單方面踩剎車。

劣幣驅(qū)逐良幣:如果OpenAI和Google都在加速,Anthropic的道德潔癖反而成了競爭劣勢。

公關(guān)化:安全正在從一種工程約束,變成一種公關(guān)語言。RSP 3.0的透明披露,本質(zhì)上是在告訴資本市場:我們還在意安全,但請不要讓我們真的停下。

首席科學家Jared Kaplan的那句話,應該被刻在每一家AI公司的會議室墻上:

“如果競爭對手飛速前進,我們單方面承諾暫停訓練沒有意義?!?/p>

翻譯過來就是:除非所有人一起踩剎車,否則誰先停,誰先死。

這就是AI安全的最大悖論。在監(jiān)管真空、競爭白熱化的今天,沒有一家公司敢做唯一的好人。

每個修改都有合理的解釋。技術(shù)邊界確實在模糊,監(jiān)管環(huán)境確實在變化,商業(yè)競爭確實在加速。但問題是:當安全承諾可以被修改,它還是承諾嗎?當人類在回路中成為免責聲明,安全還有意義嗎?


結(jié)語:AI時代的護城河,不是算力,是誠實

Anthropic的泄露事件,最終會被修復。

CMS權(quán)限會被重新設置,泄露的文件會從互聯(lián)網(wǎng)上消失,網(wǎng)絡安全股會漲回來,RSP 3.0會繼續(xù)執(zhí)行。

但那個問題會一直存在:

當一家以安全第一立身的公司,在資本壓力和國家意志面前,一次次被逼到墻角,它還能守住多少底線?

Anthropic用被制裁、被列為供應鏈風險、失去巨額國防合同的代價,守住了拒絕全自主武器這條線。但這條線能守多久?五角大樓會換一種方式再來嗎?

答案從來不是模型更強、算力更大。

答案是:把最基本的流程做好,把最基礎的承諾守住。

這是Anthropic給整個AI行業(yè)上的一課。

也是最難的一課。因為在這一課里,Anthropic自己,既是那個抗爭的學生,也是那個不及格的學生。

本文來自微信公眾號:青萍見,作者:舒書

本內(nèi)容由作者授權(quán)發(fā)布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯(lián)系 tougao@huxiu.com。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4846249.html?f=wyxwapp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
現(xiàn)實生活中,間諜都是怎么暴露的?網(wǎng)友:百密一疏呀

現(xiàn)實生活中,間諜都是怎么暴露的?網(wǎng)友:百密一疏呀

夜深愛雜談
2026-03-27 20:48:13
伊朗官媒發(fā)布《為眾人復仇》AI短片:一枚伊朗導彈在哈梅內(nèi)伊等人注視下,精準炸毀幻化成羊頭惡魔的美國自由女神像

伊朗官媒發(fā)布《為眾人復仇》AI短片:一枚伊朗導彈在哈梅內(nèi)伊等人注視下,精準炸毀幻化成羊頭惡魔的美國自由女神像

大象新聞
2026-03-26 09:45:03
國務院食安辦、市場監(jiān)管總局約談相關(guān)地方市級人民政府負責人督辦“3?15”晚會曝光問題整改

國務院食安辦、市場監(jiān)管總局約談相關(guān)地方市級人民政府負責人督辦“3?15”晚會曝光問題整改

財聯(lián)社
2026-03-28 19:04:05
波蘭簽生死令:本國公民可合法入烏克蘭作戰(zhàn)

波蘭簽生死令:本國公民可合法入烏克蘭作戰(zhàn)

老馬拉車莫少裝
2026-03-28 09:13:29
笑不活了,天價的祖母綠,被中國人給打下來了!

笑不活了,天價的祖母綠,被中國人給打下來了!

果殼
2026-03-28 16:07:16
新華社消息|伊朗決定促進人道主義貨船安全通行霍爾木茲海峽

新華社消息|伊朗決定促進人道主義貨船安全通行霍爾木茲海峽

新華社
2026-03-28 10:47:01
3月最后一周,運勢不錯,諸事順遂的3個生肖,吉星眷顧,求財易得

3月最后一周,運勢不錯,諸事順遂的3個生肖,吉星眷顧,求財易得

小智223
2026-03-26 18:25:48
她再婚嫁小8歲帥哥,生下2個兒子,終獲幸福

她再婚嫁小8歲帥哥,生下2個兒子,終獲幸福

暖心萌阿菇?jīng)?/span>
2026-03-28 02:06:55
男子自駕游至海南遇美女搭車,同行三天后,他才知道自己逃過死劫

男子自駕游至海南遇美女搭車,同行三天后,他才知道自己逃過死劫

林林故事揭秘
2025-04-10 14:49:38
越南成品油價格大幅下調(diào)

越南成品油價格大幅下調(diào)

緬甸中文網(wǎng)
2026-03-27 13:37:49
無需大量運動!《柳葉刀》:每天多動5分鐘、少坐半小時,足以顯著降低死亡風險

無需大量運動!《柳葉刀》:每天多動5分鐘、少坐半小時,足以顯著降低死亡風險

生物世界
2026-03-25 16:05:30
招商證券凈利123億再創(chuàng)歷史新高,財富管理為第一收入,AI券商建設實現(xiàn)三大突破

招商證券凈利123億再創(chuàng)歷史新高,財富管理為第一收入,AI券商建設實現(xiàn)三大突破

財聯(lián)社
2026-03-28 20:06:10
馬年真正悶聲發(fā)財?shù)娜笊ぃ旱驼{(diào)沉得住氣,家底日益殷實!

馬年真正悶聲發(fā)財?shù)娜笊ぃ旱驼{(diào)沉得住氣,家底日益殷實!

毅談生肖
2026-03-28 11:14:59
2026年了,是誰還在花冤枉錢,買這些即將被淘汰的電器!

2026年了,是誰還在花冤枉錢,買這些即將被淘汰的電器!

家居設計師宅哥
2026-03-28 22:46:11
這是田曦薇的素顏照,你還能第一眼認出來她嗎

這是田曦薇的素顏照,你還能第一眼認出來她嗎

TVB的四小花
2026-03-29 00:11:41
又轟下33+15+12!抱歉羅伯特森:你要從歷史第一變成歷史第二了

又轟下33+15+12!抱歉羅伯特森:你要從歷史第一變成歷史第二了

籃球大視野
2026-03-28 14:23:53
徐根寶估計也沒想到,被他放棄的霍智宇,如今已是上海房地產(chǎn)大佬

徐根寶估計也沒想到,被他放棄的霍智宇,如今已是上海房地產(chǎn)大佬

冷紫葉
2026-03-27 15:09:39
英國方面不滿阿勞霍:他的犯規(guī)非常惡劣,差點踢斷福登的腿

英國方面不滿阿勞霍:他的犯規(guī)非常惡劣,差點踢斷福登的腿

懂球帝
2026-03-28 22:11:06
陳慧琳”太豐滿了,穿抹胸都兜不住好身材,我感慨自律女人真美

陳慧琳”太豐滿了,穿抹胸都兜不住好身材,我感慨自律女人真美

章眽八卦
2026-03-08 15:36:53
凌晨炸鍋!國家隊減持5000億+四大消息齊發(fā),下周A股要跳空?

凌晨炸鍋!國家隊減持5000億+四大消息齊發(fā),下周A股要跳空?

慧眼看世界哈哈
2026-03-28 14:22:18
2026-03-29 06:08:49
虎嗅APP incentive-icons
虎嗅APP
個性化商業(yè)資訊與觀點交流平臺
26001文章數(shù) 687633關(guān)注度
往期回顧 全部

科技要聞

華為盤古大模型負責人王云鶴確認離職

頭條要聞

伊朗:擊中美軍F-16戰(zhàn)機 強力反擊加速以政權(quán)崩潰

頭條要聞

伊朗:擊中美軍F-16戰(zhàn)機 強力反擊加速以政權(quán)崩潰

體育要聞

“我是全家最差勁的運動員”

娛樂要聞

陳牧馳陳冰官宣得子 曬一家三口握拳照

財經(jīng)要聞

臥底"科技與狠活"培訓:化工調(diào)味劑泛濫

汽車要聞

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態(tài)度原創(chuàng)

藝術(shù)
旅游
本地
公開課
軍事航空

藝術(shù)要聞

毛澤東手箋驚現(xiàn)美國拍賣會,滿紙崢嶸往事......

旅游要聞

泰安市岱岳區(qū):賞梨花 看村晚 萬畝梨園迎客來

本地新聞

在濰坊待了三天,沒遇到一個“濰坊人”

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美軍中東基地損失最新披露

無障礙瀏覽 進入關(guān)懷版