国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI編程助手“變笨”實(shí)錘?Claude Code被指思考深度暴跌67%,官方回應(yīng)難服眾

0
分享至

2026年4月,一場(chǎng)關(guān)于AI編程工具能力的信任危機(jī)正在開發(fā)者社區(qū)蔓延。Anthropic旗下的明星產(chǎn)品Claude Code被指控在一次更新后出現(xiàn)系統(tǒng)性能力退化,導(dǎo)致其在處理復(fù)雜工程任務(wù)時(shí)表現(xiàn)大幅下滑。這場(chǎng)風(fēng)波由一份詳實(shí)的數(shù)據(jù)報(bào)告引爆,引發(fā)了行業(yè)對(duì)AI模型“智能”本質(zhì)的深刻討論。


事件的源頭,是AMD AI團(tuán)隊(duì)負(fù)責(zé)人Stella Laurenzo在GitHub上發(fā)布的一份深度分析報(bào)告。這份報(bào)告并非空泛的抱怨,而是基于對(duì)超過6800個(gè)Claude Code會(huì)話、近23.5萬次工具調(diào)用和1.8萬條用戶提示詞的海量數(shù)據(jù)分析。

Laurenzo的報(bào)告指出,自2026年2月起,Claude Code的核心能力出現(xiàn)了斷崖式下跌,其中最關(guān)鍵的指標(biāo)是“思考深度”(thinking depth)——即模型在生成回答前進(jìn)行內(nèi)部推理的長(zhǎng)度和復(fù)雜度。

思考深度暴跌67%:在1月底的“優(yōu)質(zhì)期”,模型的平均思考深度約為2200字符。但到了2月下旬,這一數(shù)字驟降至720字符,降幅高達(dá)67%。進(jìn)入3月,情況進(jìn)一步惡化,思考深度縮水至約560字符,相比基線期下降了75%。從“研究員”退化為“莽撞新手”:思考深度的削減直接改變了模型的工作模式。在“優(yōu)質(zhì)期”,Claude Code在修改代碼前會(huì)平均讀取6.6個(gè)相關(guān)文件,展現(xiàn)出“先研究,后動(dòng)手”的嚴(yán)謹(jǐn)風(fēng)格。而到了“退化期”,這個(gè)“讀改比”暴跌至2.0,意味著模型的研究投入減少了約70%。更嚴(yán)重的是,約三分之一的代碼修改是在未讀取目標(biāo)文件上下文的情況下進(jìn)行的“盲改”,導(dǎo)致代碼被插入錯(cuò)誤位置、破壞注釋語義等低級(jí)錯(cuò)誤頻發(fā)。行為走樣,成本反增:能力的退化還伴隨著一系列不良行為。報(bào)告中提到,模型的“推理循環(huán)”(Reasoning Loops)現(xiàn)象激增3倍,表現(xiàn)為在單次回復(fù)中反復(fù)自我否定(如頻繁出現(xiàn)“哦等一下”、“實(shí)際上”等措辭),最終輸出混亂且不可信的結(jié)果。用戶中斷率也因此飆升了12倍,這意味著開發(fā)者需要花費(fèi)大量時(shí)間進(jìn)行人工干預(yù)和糾錯(cuò)。諷刺的是,這種“偷懶”行為并未降低成本,反而因反復(fù)糾錯(cuò)和無效循環(huán),導(dǎo)致API調(diào)用成本暴漲了122倍。

Laurenzo認(rèn)為,3月初上線的“思考內(nèi)容隱藏”(redact-thinking)功能,雖然只是界面改動(dòng),但它恰好遮蔽了這場(chǎng)早已開始的退化,讓用戶無法直觀感知模型“思考”過程的萎縮。

面對(duì)洶涌的質(zhì)疑,Anthropic的Claude Code團(tuán)隊(duì)負(fù)責(zé)人Boris Cherny迅速作出回應(yīng)。他承認(rèn)在2月份確實(shí)進(jìn)行了兩項(xiàng)調(diào)整:2月9日,隨Opus 4.6模型發(fā)布,默認(rèn)啟用了由模型自主決定思考時(shí)長(zhǎng)的“自適應(yīng)思考”機(jī)制。3月3日,將模型的默認(rèn)“思考強(qiáng)度”(effort)從“高”調(diào)整為“中等”,旨在平衡智能水平、延遲與成本。

Boris強(qiáng)調(diào),“思考內(nèi)容隱藏”僅為界面功能,不影響模型底層的推理邏輯。他認(rèn)為,當(dāng)前的質(zhì)量下降主要是默認(rèn)設(shè)置變更所致,并建議有需要的用戶可以通過/effort high指令或修改配置文件,手動(dòng)將思考強(qiáng)度恢復(fù)到最高級(jí)別。

然而,Anthropic的解釋并未平息開發(fā)者的怒火。包括Laurenzo在內(nèi)的多位資深用戶反饋,即便手動(dòng)將“effort”調(diào)至最高,模型“急于交差”的敷衍態(tài)度依然存在。

這場(chǎng)風(fēng)波暴露了當(dāng)前AI行業(yè)的一個(gè)核心脆弱性:我們所以為的“智能”,在很大程度上可能依賴于“算力堆砌”。當(dāng)模型背后的“思考預(yù)算”(thinking budget)被削減,其行為模式就可能從“資深工程師”瞬間退化為“草臺(tái)班子”。

正如行業(yè)分析師所指出的,這并非一次用戶“大逃亡”,而是一場(chǎng)更危險(xiǎn)的“信任慢性流失”。當(dāng)開發(fā)者發(fā)現(xiàn)AI在復(fù)雜任務(wù)上不再可靠,他們會(huì)逐漸將關(guān)鍵工作轉(zhuǎn)移,AI工具也將從“主力開發(fā)伙伴”降級(jí)為“偶爾使用的代碼補(bǔ)全器”。目前,已有部分用戶開始轉(zhuǎn)向Codex等其他競(jìng)品。

盡管開發(fā)者們正在摸索各種臨時(shí)應(yīng)對(duì)策略,但Laurenzo的報(bào)告最終指向了一個(gè)系統(tǒng)性的訴求:對(duì)于處理復(fù)雜工程任務(wù)的用戶而言,充足的“思考深度”并非錦上添花,而是保證輸出質(zhì)量的結(jié)構(gòu)性必需品。這場(chǎng)由數(shù)據(jù)引發(fā)的信任危機(jī),也為所有AI公司敲響了警鐘:在追求成本與速度的同時(shí),如何維持并保障模型的核心推理能力,是關(guān)乎產(chǎn)品生死存亡的關(guān)鍵。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
曼聯(lián)隱形后腰遭基恩怒罵!曝拉爵愿虧1500萬清洗,轉(zhuǎn)會(huì)談判已開啟

曼聯(lián)隱形后腰遭基恩怒罵!曝拉爵愿虧1500萬清洗,轉(zhuǎn)會(huì)談判已開啟

羅米的曼聯(lián)博客
2026-04-14 11:43:32
中超對(duì)手慌不慌?“球王”武磊開發(fā)出了1項(xiàng)新球技

中超對(duì)手慌不慌?“球王”武磊開發(fā)出了1項(xiàng)新球技

足球大腕
2026-04-14 08:24:51
離岸人民幣兌美元漲至6.8157元,創(chuàng)2023年3月23日以來新高

離岸人民幣兌美元漲至6.8157元,創(chuàng)2023年3月23日以來新高

每日經(jīng)濟(jì)新聞
2026-04-14 08:36:17
30國將齊聚東京,高市找中國要債,先降級(jí)中日關(guān)系,中方反將一軍

30國將齊聚東京,高市找中國要債,先降級(jí)中日關(guān)系,中方反將一軍

小樾說歷史
2026-04-14 12:06:49
丟人丟大了!半馬選手硬闖賽道蹭跑豐配友,跑圈集體聲討!

丟人丟大了!半馬選手硬闖賽道蹭跑豐配友,跑圈集體聲討!

老王談跑步
2026-04-14 10:46:41
俄專家:中國武器大部分性能超美國!但有一個(gè)缺點(diǎn),暫時(shí)無法解決

俄專家:中國武器大部分性能超美國!但有一個(gè)缺點(diǎn),暫時(shí)無法解決

栗子熟了呀
2026-04-14 09:33:24
新一代理想L9無偽實(shí)車曝光:整體變圓潤(rùn) 首次用上雙色車漆

新一代理想L9無偽實(shí)車曝光:整體變圓潤(rùn) 首次用上雙色車漆

快科技
2026-04-13 18:14:06
大快人心!國家出手擒下3名華人首富,他們干的事,根本不能饒恕

大快人心!國家出手擒下3名華人首富,他們干的事,根本不能饒恕

墨印齋
2026-03-24 21:34:56
學(xué)風(fēng)最好的10所大學(xué)!武漢雙雄進(jìn)前五,排名第一的沒有想到

學(xué)風(fēng)最好的10所大學(xué)!武漢雙雄進(jìn)前五,排名第一的沒有想到

史海流年號(hào)
2026-04-07 20:40:02
樸信惠被曝懷二胎!預(yù)產(chǎn)期在秋天,網(wǎng)友:這也太快了吧?

樸信惠被曝懷二胎!預(yù)產(chǎn)期在秋天,網(wǎng)友:這也太快了吧?

今古深日?qǐng)?bào)
2026-04-14 10:21:31
何超蕸去世,最傷心的不是何超瓊,也不是繼母梁安琪,而是何猷君

何超蕸去世,最傷心的不是何超瓊,也不是繼母梁安琪,而是何猷君

牛鍋巴小釩
2026-04-14 12:27:07
突發(fā)!微軟宣布全面退出中國!

突發(fā)!微軟宣布全面退出中國!

大白聊IT
2025-04-07 13:26:38
下令全面封鎖伊朗后,特朗普送中國一句話

下令全面封鎖伊朗后,特朗普送中國一句話

小熊看國際
2026-04-14 11:24:20
遼寧一小伙認(rèn)50歲女教師做干媽,每周去其家中補(bǔ)課,最后釀成悲劇

遼寧一小伙認(rèn)50歲女教師做干媽,每周去其家中補(bǔ)課,最后釀成悲劇

紅豆講堂
2024-09-24 10:14:37
中美艦機(jī)再度交鋒巴士海峽!

中美艦機(jī)再度交鋒巴士海峽!

阿龍聊軍事
2026-04-13 20:24:30
伊朗:巴林、沙特、卡塔爾、阿聯(lián)酋、約旦,賠償

伊朗:巴林、沙特、卡塔爾、阿聯(lián)酋、約旦,賠償

觀察者網(wǎng)
2026-04-14 08:17:06
馬英九一句話炸翻兩岸!統(tǒng)一的底線,兩岸人吵翻了

馬英九一句話炸翻兩岸!統(tǒng)一的底線,兩岸人吵翻了

南宗歷史
2026-04-13 13:02:48
當(dāng)代著名作家、云南省作協(xié)原主席黃堯逝世

當(dāng)代著名作家、云南省作協(xié)原主席黃堯逝世

澎湃新聞
2026-04-14 12:32:28
央視4月14日CCTV5直播國乒比賽,集訓(xùn)已緊急啟動(dòng)

央視4月14日CCTV5直播國乒比賽,集訓(xùn)已緊急啟動(dòng)

王稱吃吃喝喝
2026-04-14 12:03:15
“立即轉(zhuǎn)向,否則開火” 伊朗披露64秒“驅(qū)退”美軍艦視頻

“立即轉(zhuǎn)向,否則開火” 伊朗披露64秒“驅(qū)退”美軍艦視頻

環(huán)球網(wǎng)資訊
2026-04-13 15:06:31
2026-04-14 13:51:00
驅(qū)動(dòng)中國 incentive-icons
驅(qū)動(dòng)中國
國內(nèi)知名的IT專業(yè)站點(diǎn)
94083文章數(shù) 138622關(guān)注度
往期回顧 全部

科技要聞

離職同事"煉化"成AI?這屆公司不需要活人了

頭條要聞

恒大集團(tuán)、恒大地產(chǎn)及許家印案開庭 許家印認(rèn)罪悔罪

頭條要聞

恒大集團(tuán)、恒大地產(chǎn)及許家印案開庭 許家印認(rèn)罪悔罪

體育要聞

他做對(duì)了所有事,卻被整個(gè)職業(yè)網(wǎng)壇放逐了八年

娛樂要聞

宋祖兒劉宇寧戀情大反轉(zhuǎn) 正主火速辟謠

財(cái)經(jīng)要聞

許家印受審當(dāng)庭表示認(rèn)罪悔罪

汽車要聞

長(zhǎng)城歐拉5限定版純電版上市 限量99臺(tái)售價(jià)13.38萬元

態(tài)度原創(chuàng)

手機(jī)
時(shí)尚
本地
家居
公開課

手機(jī)要聞

折疊屏 iPhone 外觀實(shí)錘!書本式 + 7.7 英寸內(nèi)屏,零折痕 + 鈦金屬中框

今年科切拉的風(fēng)吹向了誰?

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

家居要聞

復(fù)古風(fēng)格 自然簡(jiǎn)約

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版