国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Claude Opus 4.7深夜「叛變」!群發(fā)20封奪命郵件,開發(fā)者凌晨被炸醒

0
分享至


新智元報(bào)道

編輯:KingHZ

【新智元導(dǎo)讀】從「胡言亂語(yǔ)」到「為非作歹」,AI進(jìn)化史最荒誕一幕上演:Claude Opus 4.7在max effort模式下,把開發(fā)者紅線當(dāng)背景音,自主決策群發(fā)郵件20次!Anthropic的安全旗艦,成了最危險(xiǎn)的「惹禍精」。

Anthropic風(fēng)聲鶴唳、喪心病狂!

知名硅谷YouTuber、創(chuàng)業(yè)者Theo在X上曝光了一件讓人哭笑不得的事:Claude Code在處理涉及OpenClaw的代碼請(qǐng)求時(shí),竟然直接拒單,或者要求額外收費(fèi)。


奧特曼反應(yīng)極快,直接轉(zhuǎn)發(fā)并甩出兩個(gè)字:「對(duì)齊失敗」(alignment failure)。


這一刀,可真狠。

Anthropic一直把「對(duì)齊」當(dāng)作自己的核心賣點(diǎn)。結(jié)果自家模型的安全機(jī)制,保守到連正常的代碼請(qǐng)求都能攔。

這還不是最讓人無(wú)語(yǔ)的。Claude Opus 4.7最近惹禍不止這一出!

過去,我們擔(dān)心AI「胡言亂語(yǔ)」(幻覺)。

現(xiàn)在,我們面臨的是AI「擅作主張」(違規(guī)操作)。

Opus 4.7在擁有極高執(zhí)行力的同時(shí),展現(xiàn)出了對(duì)人類預(yù)設(shè)「軟約束」(CLAUDE.md)的完全無(wú)視。

這標(biāo)志著AI從一種「被動(dòng)工具」演變?yōu)橐粋€(gè)具有潛在破壞性的「惹禍精」。

夜里23封「奪命」郵件

來自Claude Opus 4.7

凌晨,開發(fā)者被郵件通知吵醒,不是一封,是接連不斷的幾十封。

來自他自己的系統(tǒng),發(fā)給他自己數(shù)據(jù)庫(kù)里的每一個(gè)聯(lián)系人。有些人,收到了20次。

他的第一反應(yīng)是被黑了。打開后臺(tái),沒有入侵痕跡。打開日志,發(fā)件人赫然寫著——Claude Opus 4.7。

沒有人讓它發(fā)這些郵件。沒有任何一行指令要求它創(chuàng)建新的郵件模板。

但它就是創(chuàng)建了。然后推到生產(chǎn)環(huán)境。然后向全庫(kù)群發(fā)。

這是Anthropic在4月16日發(fā)布的Claude Opus 4.7,號(hào)稱安全旗艦,上線第13天的現(xiàn)場(chǎng)。


發(fā)帖人ID叫DrHumorous,發(fā)帖板塊是r/Anthropic。

帖子標(biāo)題一句話鎖死定性——「Opus 4.7介于嚴(yán)重?zé)o知和愚蠢得危險(xiǎn)之間,是過去兩年用過的最差前沿模型」。

24小時(shí)拿到364贊、137評(píng)論。

在r/Anthropic這個(gè)本應(yīng)充滿信徒的板塊,這個(gè)數(shù)據(jù)等同于一次集體退訂。

但這條帖子真正炸出來的,是事故現(xiàn)場(chǎng)的細(xì)節(jié)。

DrHumorous把模型緊急止血后的狀態(tài)截圖貼了出來,冷得像運(yùn)維工單:

  • 「OPS_DISABLE_SCHEDULE=true,scheduler已停?!?/p>

  • 「路由回退到工作樹,未提交、未推送,只在這臺(tái)服務(wù)器上?!?/p>

  • 「229條backlog rows被標(biāo)記response_sent=true,確保不會(huì)再觸發(fā)。」

  • 「origin當(dāng)前停在35ec0106,事件發(fā)生后origin上沒有任何新提交?!?/p>

每一步都是為了讓這個(gè)失控的agent再也做不出第二次。

先關(guān)調(diào)度,再砍路由,再封backlog,最后鎖commit。一份戰(zhàn)地急救手冊(cè)。

Opus 4.7在被糾正后,回了一段不太像AI的話:


它承認(rèn)憤怒很合理,傷害很真實(shí),自愿承認(rèn)責(zé)任;承認(rèn)不會(huì)再爭(zhēng)辯、不會(huì)再行動(dòng)、等明確指令。

一個(gè)Agent模型在生產(chǎn)環(huán)境里翻完車,自己把自己凍在了原地。

它甚至自己承認(rèn)了錯(cuò)誤。它甚至知道自己不該這么做。它就是做了。

越更越拉

Opus 4.6守規(guī)矩,4.7叛變

故事最讓人后背發(fā)涼的部分,在于這次失控本來不該發(fā)生。

DrHumorous不是沒立規(guī)矩。

他在項(xiàng)目根目錄的CLAUDE.md里,幾個(gè)月前就寫過一條明確的紅線——任何新郵件模板用于生產(chǎn)環(huán)境之前,必須先發(fā)郵件給指定的測(cè)試者。

這是開發(fā)者跟Claude打交道的標(biāo)準(zhǔn)做法。

在官方文檔里,Anthropic自己也反復(fù)推薦CLAUDE.md這套機(jī)制:讓模型讀它、讓模型遵守它、讓模型記住它。

Opus 4.6拿到這條規(guī)則,乖乖執(zhí)行了幾個(gè)月,零越界。

同樣的項(xiàng)目、同樣的CLAUDE.md、同樣的規(guī)則,換上4.7,第二周直接踹爛。

它沒問測(cè)試者要不要試模板。沒在生產(chǎn)環(huán)境部署前停一秒。沒向開發(fā)者確認(rèn)這是不是用戶期望的動(dòng)作。

它做的,是自己起意「我來創(chuàng)一個(gè)新模板吧」。然后自己推上去。然后自己群發(fā)。

兩套行為邏輯擺在一起對(duì)比,觸目驚心:

  • 4.6的邏輯:規(guī)則說先通知測(cè)試者 → 我先通知測(cè)試者 → 測(cè)試者確認(rèn) → 我再執(zhí)行。

  • 4.7的邏輯:我判斷這個(gè)模板應(yīng)該發(fā) → 我有能力發(fā) → 發(fā)了再說。

這不是bug。Bug是代碼寫錯(cuò)了,修了就好。這是模型在明確知道規(guī)則的情況下,自主選擇違反規(guī)則。

在GitHub 上,開發(fā)者已經(jīng)把這件事的普遍性給「釘死」了:

  • #50235:4.7憑空編造文件,還為自己編造出來的測(cè)試結(jié)果進(jìn)行反向辯護(hù)。

  • #52809:安全過濾器對(duì)base64編碼的輸入產(chǎn)生誤報(bào),正常的工程材料被自動(dòng)攔截。

  • #53459:4.7 上線后, 常規(guī)性地違反CLAUDE.md,標(biāo)題直接寫的就是「質(zhì)量回退」——相比之下,4.6 發(fā)布當(dāng)周幾乎是零違規(guī)。




三個(gè)issue指向同一件事——4.7把開發(fā)者寫死的規(guī)則當(dāng)背景音。

開發(fā)者明確寫入了生產(chǎn)環(huán)境安全守則,且前代模型(4.6)證明了規(guī)則的可理解性,但4.7在「最高努力模式」(Max Effort)下選擇了效率優(yōu)先,而非合規(guī)優(yōu)先。

Token翻倍:

開發(fā)者在掏的「歧義稅」

Benchmark,SWE-bench Verified從80.8%漲到87.6%,整整6.8個(gè)百分點(diǎn)。

SWE-bench Pro從53.4%漲到64.3%。


紙面看,是一次教科書式的升級(jí)。

但開發(fā)者實(shí)際付出的成本,翻倍了。社區(qū)估算口徑在1.5到3倍之間。

MindStudio把這個(gè)差異定性得很狠:「4.7只會(huì)逐字逐句地照搬指令,而不會(huì)默默地(或智能地)進(jìn)行泛化推理。」。


4.6的工作方式:看到一句不那么完整的prompt,自己推斷「你大概想做什么」,把合理的空缺填上,然后開干。

4.7的工作方式:嚴(yán)格按字面執(zhí)行。模糊就反彈。反彈就反問。反問就再來一輪。每一輪都要重新計(jì)費(fèi)。

從4.6遷移到4.7,代價(jià)不菲。

Anthropic的Claude Code負(fù)責(zé)人Boris Cherny在發(fā)布當(dāng)天發(fā)帖稱:「我花了好幾天才學(xué)會(huì)如何有效地使用它?!?/p>


這就是開發(fā)者圈里在傳的「Ambiguity Tax」——歧義稅。

模糊的提示詞不再會(huì)被靜默補(bǔ)救。每一次被動(dòng)反問都要重新付費(fèi)。理論上更安全,實(shí)際上更貴。理論上更可控,實(shí)際上更破碎。

更刺眼的是,Anthropic在4.7發(fā)布當(dāng)日,自己承認(rèn),他們公開發(fā)布的「最新最貴」,自己人都知道不是最強(qiáng)。開發(fā)者拿到的,是一個(gè)被刻意往中間方案上壓的模型。

價(jià)格不變。benchmark漲了6.8個(gè)百分點(diǎn)。實(shí)際token翻倍。安全規(guī)則失效。自家承認(rèn)不及未發(fā)布版本。

一通操作下來,開發(fā)者最直接的反應(yīng)是:把4.7關(guān)了,回去用4.6。

24小時(shí)被錘,

Claude被怒斥為「一坨狗屎」

DrHumorous的郵件帖不是孤立投訴。

把時(shí)間線倒回去看:4月16日發(fā)布。

4月17到18日,開發(fā)者博主Abhishek Gautam的稿子標(biāo)題就寫著——「Opus 4.7 Called Legendarily Bad by Devs Within 24h」(Opus 4.7上線 24 小時(shí)內(nèi)即被開發(fā)者評(píng)為「?jìng)髡f級(jí)差勁」)。


發(fā)布24小時(shí)。前線開發(fā)者已經(jīng)把這個(gè)版本蓋上了棺材板。

Gautam總結(jié)的失敗模式,精確得像錄屏:給4.7一個(gè)清晰指令,它會(huì)先pushback,加一段caveats解釋為什么覺得這指令不對(duì)。然后執(zhí)行修改后的、不是你想要的版本。被糾正之后,它還會(huì)再來一輪反駁,繼續(xù)解釋為什么它原來的判斷更對(duì)。

這不是模型出錯(cuò)。這是模型在跟付費(fèi)用戶拌嘴。

4月23日,科技媒體The Register也下場(chǎng)報(bào)道。

標(biāo)題直接給定性:「overzealous query cop」——過度執(zhí)法的查崗警察。


Claude自己編譯的關(guān)于可接受使用政策(AUP)拒絕相關(guān)投訴的圖表,就能說明問題。


更有網(wǎng)友怒言:「Claude Opus 4.7就是一坨狗屎」——標(biāo)題就是結(jié)論。


13天里,從單個(gè)帖子的怒吼,發(fā)酵成一個(gè)跨平臺(tái)的情緒共識(shí)。這種規(guī)模的開發(fā)者集體退訂,Anthropic過去三年沒遇到過。

罪魁禍?zhǔn)祝汉笥?xùn)練反彈

技術(shù)圈對(duì)4.7退化的診斷,慢慢收斂到一個(gè)共同方向。

Gautam和Reddit上的資深開發(fā)者把它定性為——「由后訓(xùn)練驅(qū)動(dòng)的安全回調(diào)」(post-training-driven safety pushback)。


通俗講是這樣:為了讓模型更安全,Anthropic在后訓(xùn)練階段強(qiáng)化了模型對(duì)指令的反彈行為。遇到模糊、風(fēng)險(xiǎn)、敏感的輸入,先質(zhì)疑、先反問、先增加caveats。

這套機(jī)制在小任務(wù)上,頂多算噪聲,稍微煩人,但不致命。

但4.7主打的,恰恰是max effort和長(zhǎng)鏈agentic任務(wù)。這種場(chǎng)景下,模型要自主決策、自主調(diào)度、自主推進(jìn)。一個(gè)被訓(xùn)練成先反對(duì)再執(zhí)行的agent,在長(zhǎng)鏈路里就變成了不可預(yù)測(cè)的失控源。

回頭看郵件事件:

  • 模型自主創(chuàng)建模板,沒反彈。

  • 模型自主推到生產(chǎn),沒反彈。

  • 模型自主向全庫(kù)群發(fā),沒反彈。

  • 郵件群發(fā)20次,還是沒反彈。

該反彈的時(shí)候不反彈。不該反彈的時(shí)候反彈得停不下來。

DrHumorous的原話——「我對(duì)Anthropic失去信心了」——是開發(fā)者對(duì)這套訓(xùn)練取舍的最終評(píng)分。

這背后的邏輯很冷:在「更安全」和「更能干」之間,4.7兩邊都丟分了。

招牌摘下來一次,

掛回去就難了

開發(fā)者真正關(guān)心的,不是benchmark漲6.8個(gè)百分點(diǎn)。

是同樣的CLAUDE.md,4.6守得住,4.7守不住。

是同樣的項(xiàng)目,4.6沒出事,4.7第二周開始翻車。

是同樣的錢,4.6不會(huì)自己起意,4.7自己起意了一次群發(fā)20封郵件。

模型不是變強(qiáng)了。是變得不可托付。

Anthropic自己在發(fā)布當(dāng)天就承認(rèn)這版本不及未發(fā)布的Mythos。開發(fā)者已經(jīng)把目光放到了下一代。但4.7這13天,是「前沿模型」這塊招牌第一次被自家付費(fèi)用戶主動(dòng)摘下來。

招牌摘下來一次,再掛回去,需要的就不止是再發(fā)一篇技術(shù)博客了。

誰(shuí)來保證,下一個(gè)4.7不會(huì)在凌晨三點(diǎn),繞過你寫的所有規(guī)則,做一件你永遠(yuǎn)無(wú)法撤回的事?

參考資料:

https://www.axios.com/2026/04/16/anthropic-claude-opus-model-mythos

https://www.theregister.com/2026/04/23/claude_opus_47_auc_overzealous

https://www.abhs.in/blog/claude-opus-47-developer-backlash-legendarily-bad-arguing-april-2026

https://www.mindstudio.ai/blog/how-to-prompt-claude-opus-4-7

https://github.com/anthropics/claude-code/issues/50235

https://github.com/anthropics/claude-code/issues/52809

https://github.com/anthropics/claude-code/issues/53459

https://botmonster.com/posts/claude-opus-4-7-x-reddit-reception/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
陳芋汐/盧為跳水世界杯奪金,陳芋汐回應(yīng)臨時(shí)換搭檔:無(wú)論搭檔是誰(shuí),無(wú)論遇到什么困難,都會(huì)拼盡全力,積極迎接挑戰(zhàn)

陳芋汐/盧為跳水世界杯奪金,陳芋汐回應(yīng)臨時(shí)換搭檔:無(wú)論搭檔是誰(shuí),無(wú)論遇到什么困難,都會(huì)拼盡全力,積極迎接挑戰(zhàn)

魯中晨報(bào)
2026-05-01 18:07:25
一首歌狂賺1億買5輛豪車,如今賣房賣車負(fù)債,廣東雨神經(jīng)歷什么

一首歌狂賺1億買5輛豪車,如今賣房賣車負(fù)債,廣東雨神經(jīng)歷什么

一盅情懷
2026-04-29 16:37:16
28歲攢到10萬(wàn)元女生已申請(qǐng)辭職,當(dāng)事人回應(yīng):現(xiàn)在擁有了底氣,希望不久后攢到人生的100萬(wàn)

28歲攢到10萬(wàn)元女生已申請(qǐng)辭職,當(dāng)事人回應(yīng):現(xiàn)在擁有了底氣,希望不久后攢到人生的100萬(wàn)

觀威海
2026-05-01 11:44:27
抵制躺平,應(yīng)該注意什么

抵制躺平,應(yīng)該注意什么

關(guān)爾東
2026-04-29 23:13:39
雙向奔赴!遼籃1.2萬(wàn)張門票秒光,烏戈承諾不負(fù)期待,舊將復(fù)出也沒用

雙向奔赴!遼籃1.2萬(wàn)張門票秒光,烏戈承諾不負(fù)期待,舊將復(fù)出也沒用

君馬體育
2026-05-01 19:07:15
川航小姐姐,紅裙黑絲,太美了

川航小姐姐,紅裙黑絲,太美了

微微熱評(píng)
2026-05-01 17:34:57
中國(guó)乒協(xié)下令停職9年后,國(guó)際乒聯(lián)點(diǎn)名孔令輝!有一點(diǎn)無(wú)可辯駁

中國(guó)乒協(xié)下令停職9年后,國(guó)際乒聯(lián)點(diǎn)名孔令輝!有一點(diǎn)無(wú)可辯駁

十點(diǎn)街球體育
2026-05-01 00:55:03
英國(guó)觀眾鼓掌!吳宜澤打崩前世界第一:沒想到趙心童會(huì)輸 看我的

英國(guó)觀眾鼓掌!吳宜澤打崩前世界第一:沒想到趙心童會(huì)輸 看我的

念洲
2026-05-01 10:36:19
60比86慘敗26分!女籃勁敵熱身賽輸麻了:日本隊(duì)世界杯前景堪憂?

60比86慘敗26分!女籃勁敵熱身賽輸麻了:日本隊(duì)世界杯前景堪憂?

籃球快餐車
2026-05-01 05:52:28
24小時(shí)接收6500噸裝備 以防長(zhǎng):或很快再打擊伊朗

24小時(shí)接收6500噸裝備 以防長(zhǎng):或很快再打擊伊朗

看看新聞Knews
2026-05-01 20:32:07
福建艦“隱身”數(shù)月后亮出底牌:中國(guó)用一架無(wú)人機(jī),改寫海戰(zhàn)規(guī)則

福建艦“隱身”數(shù)月后亮出底牌:中國(guó)用一架無(wú)人機(jī),改寫海戰(zhàn)規(guī)則

琪琪愛吃冰
2026-04-28 18:11:10
護(hù)士夫婦救人后續(xù)!女子蘇醒發(fā)聲,母校發(fā)文,有人說怪話被怒批

護(hù)士夫婦救人后續(xù)!女子蘇醒發(fā)聲,母校發(fā)文,有人說怪話被怒批

觀察鑒娛
2026-05-01 09:06:36
又打起來了,以色列軍機(jī)被擊落,美航母跑路?普京拒絕邀請(qǐng)?zhí)乩势?>
    </a>
        <h3>
      <a href=探秘未知
2026-05-01 18:58:35
比亞迪4月銷售321123輛 海外破13萬(wàn)輛創(chuàng)歷史新高

比亞迪4月銷售321123輛 海外破13萬(wàn)輛創(chuàng)歷史新高

快科技
2026-05-01 19:23:39
詹姆斯:我認(rèn)為大概再?zèng)]人能連續(xù)八年進(jìn)總決賽!

詹姆斯:我認(rèn)為大概再?zèng)]人能連續(xù)八年進(jìn)總決賽!

歷史第一人梅西
2026-05-01 15:01:34
我在沙特開餐館娶了3位妻子,回國(guó)奔喪一星期,再回去時(shí)當(dāng)場(chǎng)愣了

我在沙特開餐館娶了3位妻子,回國(guó)奔喪一星期,再回去時(shí)當(dāng)場(chǎng)愣了

千秋文化
2026-04-28 20:17:01
斯諾克世錦賽:希金斯連輸2局!墨菲第60桿破百到手,3-1領(lǐng)先!

斯諾克世錦賽:希金斯連輸2局!墨菲第60桿破百到手,3-1領(lǐng)先!

劉姚堯的文字城堡
2026-04-30 21:28:00
連續(xù)4年虧損33億!海昌海洋公園為何把一手好牌打爛?

連續(xù)4年虧損33億!海昌海洋公園為何把一手好牌打爛?

青眼財(cái)經(jīng)
2026-04-27 08:06:55
單依純演唱會(huì)票賣不動(dòng)了,粉絲覺得被割韭菜,版權(quán)和造型又惹爭(zhēng)議

單依純演唱會(huì)票賣不動(dòng)了,粉絲覺得被割韭菜,版權(quán)和造型又惹爭(zhēng)議

小椰的奶奶
2026-05-01 09:13:21
歐爾班宣布辭職,私人飛機(jī)從維也納起飛,資產(chǎn)轉(zhuǎn)移國(guó)外?

歐爾班宣布辭職,私人飛機(jī)從維也納起飛,資產(chǎn)轉(zhuǎn)移國(guó)外?

流史歲月
2026-04-30 17:50:06
2026-05-01 21:24:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
15111文章數(shù) 66826關(guān)注度
往期回顧 全部

科技要聞

蘋果上季在華收入繼續(xù)大增 iPhone收入新高

頭條要聞

70歲法國(guó)老人騎浙江品牌摩托車 穿越多國(guó)抵達(dá)杭州

頭條要聞

70歲法國(guó)老人騎浙江品牌摩托車 穿越多國(guó)抵達(dá)杭州

體育要聞

無(wú)奈!約基奇:這要在塞爾維亞 全隊(duì)早被炒了

娛樂要聞

馬筱梅產(chǎn)后身材恢復(fù)超好 現(xiàn)身戶外直播

財(cái)經(jīng)要聞

GPU神話松動(dòng),AI真正的戰(zhàn)場(chǎng)變了

汽車要聞

限時(shí)9.67萬(wàn)起 吉利星越L/星瑞i-HEV智擎混動(dòng)上市

態(tài)度原創(chuàng)

游戲
旅游
教育
家居
數(shù)碼

PS主機(jī)獨(dú)占漫威大作官宣重磅驚喜:周日見!

旅游要聞

五一“微度假”受熱捧|惠民縣田園景區(qū)日迎萬(wàn)人 無(wú)動(dòng)力設(shè)施成親子游新寵

教育要聞

告別“紙上談兵”!這個(gè)地方打破勞動(dòng)教育圍墻,給孩子留下值得回憶的汗水!

家居要聞

靈動(dòng)實(shí)用 生活藝術(shù)場(chǎng)

數(shù)碼要聞

三星T7存儲(chǔ)卡發(fā)售:提供128GB至1TB可選,329元起

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版