国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Claude終于認(rèn)了!降智坐實(shí),越聊越傻,3個(gè)bug全曝光

0
分享至

henry 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

感謝OpenAI(doge)。

就在GPT-5.5發(fā)布的前后腳,Claude招了:

模型降智屬實(shí),所有使用額度均已重置。



嘴硬了一個(gè)多月,這降智bug終于從A社自己嘴里蹦出來了:

  • 推理等級偷偷從「高」調(diào)成「中」
  • 緩存bug導(dǎo)致每輪對話都清空思考記錄
  • 一句25詞限制的提示詞砸了輸出質(zhì)量

三個(gè)bug疊在一起,Claude使用體驗(yàn)全面拉垮。

只能還好說友商今天及時(shí)給上了一波壓力,教育用戶終究不可取。



不過,說歸說,更新bug當(dāng)然是好事。就是這時(shí)間也太巧了,GPT-5.5剛發(fā),Claude就開始「認(rèn)慫」。

難不成是5.5幫忙debug的?

Dario啊,你該不會真的是故意讓Claude變笨,好在GPT-5.5放出來的時(shí)候找畫面的吧?



Bug實(shí)錘了,一共三個(gè)

先說一句,這已經(jīng)不是第一次了。

去年8月,Anthropic剛發(fā)過一次類似的降智postmortem,當(dāng)時(shí)影響的是Opus 4.0和4.1,官方說辭也是「我們從未有意降低模型質(zhì)量」。

這次新postmortem的標(biāo)題叫「A postmortem of three recent issues」。recent,意思也很明白。

不是剛剛,是最近。



之所以「最近」,是因?yàn)镃laude降智這事兒,社區(qū)已經(jīng)嚷嚷吵了很久了。

十多天前,AMD AI組高級總監(jiān)Stella Laurenzo就在GitHub上發(fā)了一份硬核審計(jì)報(bào)告,覆蓋6852份會話文件、17871個(gè)思考塊、超過23萬次工具調(diào)用。



分析結(jié)果顯示,從2月份開始,模型的推理深度出現(xiàn)了斷崖式下滑。

更細(xì)節(jié)的發(fā)現(xiàn)是,Claude開始陷入reasoning loops,而且有明顯的傾向去選「最簡單的修復(fù)」而不是正確的修復(fù)。

BridgeMind的BridgeBench測試也在同期炸鍋,Opus 4.6準(zhǔn)確率從83.3%掉到68.3%,排名從第2跌到第10。



雖然后來被研究者批評方法論有問題,前后測試的任務(wù)數(shù)量根本不一樣,但「Claude變蠢了」的敘事已經(jīng)傳開了。

網(wǎng)友甚至造了個(gè)新詞,AI shrinkflation,AI縮水通脹。同樣的價(jià)格,你拿到的是稀釋過的產(chǎn)品。

換句話說,大伙買到了A社的「兒童套餐」。

但沒辦法,當(dāng)時(shí)Claude確實(shí)是打遍天下無敵手,不少用戶邊罵邊用,沒啥脾氣。

直到GPT-5.5發(fā)了,A社終于坐不住,在官方博客上發(fā)了一篇postmortem,把過去兩個(gè)月的「降智」拆成三條獨(dú)立問題:

偷偷降了推理等級

3月4日,Claude Code的默認(rèn)推理從high調(diào)成了medium,理由是high模式下延遲太高。但界面上還是顯示「high」。用戶以為自己在用滿血版,實(shí)際拿到的是降檔貨。一個(gè)多月后才回滾。

越聊越傻

3月26日上了個(gè)緩存優(yōu)化,本意是會話空閑超過一小時(shí)后清掉舊的思考記錄。結(jié)果代碼有bug,清除變成了每一輪都執(zhí)行。

Claude繼續(xù)干活,但逐漸忘了自己為什么要干這件事。健忘、重復(fù)、工具調(diào)用亂飛,就是這個(gè)bug的癥狀。

而且因?yàn)樗伎加涗洷环磸?fù)清,每次請求都緩存未命中,token消耗反而飆升;15天才修好。

一句提示詞砸了輸出質(zhì)量。

4月16日,系統(tǒng)提示里加了一條「工具調(diào)用之間文字不超過25個(gè)詞,最終回復(fù)不超過100個(gè)詞」。

Opus 4.6和4.7都掉了3%性能,四天后回滾。

三個(gè)問題影響不同用戶群,在不同時(shí)間段生效。疊加起來的效果就是整個(gè)Claude Code在持續(xù)、不均勻地變差,但誰也說不清到底哪里不對。

官方推特上,ClaudeDevs發(fā)總結(jié),Claude之父Boris Cherny也親自下場回復(fù),并預(yù)告Opus 4.7的bug也正在de了。



但問題是,光有bug不夠解釋這兩個(gè)月發(fā)生的一切。

四月里,A社的騷操作一籮筐

把時(shí)間線拉開看,四月其實(shí)是A社連續(xù)三拳打在自己臉上。

4月4日,Anthropic封禁了OpenClaw等第三方agentic工具通過Pro/Max訂閱運(yùn)行。想繼續(xù)用?去走API按token付費(fèi)。

4月21日,官方定價(jià)頁悄悄把Pro plan里的Claude Code去掉了,支持文檔也從「Pro或Max plan」改成了「只有Max plan」。

被網(wǎng)友抓包后,Head of Growth Amol Avasare出來說這只是2%新用戶的A/B測試。但問題是公開頁面是全站更新的,口徑完全對不上。幾小時(shí)后灰頭土臉地回滾。

連起來算一筆賬。Pro用戶20/月,年費(fèi)240。要繼續(xù)用Claude Code,得升到Max 5x,100/月起步,年費(fèi)1200。五倍。Max 20x是2400,十倍。中間沒有過渡檔。

注意,這里單位是美元。

4月23日,就是今天,postmortem上線,補(bǔ)償是重置使用額度。

有網(wǎng)友不客氣地指出,上周Opus 4.7發(fā)布時(shí)就已經(jīng)重置過一次了,所以這次的「補(bǔ)償」其實(shí)就是一次正常的周期重置。

三件事連起來,味道就不是bug了,是成本焦慮全面爆發(fā)。

網(wǎng)友不買賬

綜上種種,對于Claude,網(wǎng)友的反應(yīng)也開始分化。

有人覺得出bug可以理解,postmortem寫得也算透明。Boris在HN一條一條回復(fù),這比大多數(shù)公司做得好。



但更多人在算另一筆賬。

這兩個(gè)月里,所有正式渠道一聲不吭。

只有幾個(gè)員工在X上零星回復(fù)用戶,而且被批評為「隨機(jī)時(shí)間隨機(jī)回復(fù)」,完全不成體系。



還有人質(zhì)疑「緩存優(yōu)化」的真正動機(jī)。清除思考記錄的觸發(fā)時(shí)間恰好卡在緩存過期的節(jié)點(diǎn)上,有人覺得這不是為了降延遲,是為了省成本。

同期Anthropic還對一小部分Pro用戶做了A/B測試,悄悄給了不同的產(chǎn)品配置,信任又挨了一刀。



補(bǔ)償措施是重置使用額度。有人不客氣地指出,上周Opus 4.7發(fā)布時(shí)就已經(jīng)重置過一次了。

BridgeMind的BridgeBench測試也在這段時(shí)間炸了鍋,顯示Opus 4.6準(zhǔn)確率從83.3%掉到68.3%,排名從第2跌到第10。

雖然后來被研究者批評方法論有問題,前后測試的任務(wù)數(shù)量根本不一樣,但「Claude變蠢了」的敘事已經(jīng)傳開了。

正如一位網(wǎng)友說的,不能把所有雞蛋放在一個(gè)模型公司里。



One more thing

HN評論區(qū)里一個(gè)有意思的現(xiàn)象,不少人在聊自己的「遷移經(jīng)歷」。

有人說二月份就「下意識地」轉(zhuǎn)去了Codex,直到現(xiàn)在才意識到大概是被Claude變差給逼的。



也有人說GPT-5.4已經(jīng)比Opus4.6好了。



還有人在用MiniMax做補(bǔ)充,40美金4500條消息一個(gè)5小時(shí)周期,還能看到完整思考過程。



半年前「寫代碼就用Claude」幾乎是共識。

現(xiàn)在Codex有400萬活躍用戶,GPT-5.5主打的就是編碼和計(jì)算機(jī)操作能力,連OpenAI的人都直接說這個(gè)模型能當(dāng)「參謀長」用。

Claude不是變差了。是別人變好了,而它在最不該出問題的時(shí)候出了問題。

留給Anthropic修bug和重建信任的窗口,比兩個(gè)月前窄了不少。

GPT-5.5已經(jīng)發(fā)布,DeepSeek V4儼然就位。



Gemini快來吧!就差你了。

[1]https://www.anthropic.com/engineering/april-23-postmortem

[2]https://news.ycombinator.com/item?id=47878905

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
7國南海搞軍演,轉(zhuǎn)頭求中國救急?中方一句話:不會拉你一把

7國南海搞軍演,轉(zhuǎn)頭求中國救急?中方一句話:不會拉你一把

墨印齋
2026-04-23 12:35:16
日媒報(bào)道北京國際車展,比亞迪9分鐘充電震撼全場!日本網(wǎng)友炸鍋了...

日媒報(bào)道北京國際車展,比亞迪9分鐘充電震撼全場!日本網(wǎng)友炸鍋了...

今日日本
2026-04-26 10:03:45
為啥越來越多男生不主動幫女生搬行李?網(wǎng)友:最怕來一句不加微信

為啥越來越多男生不主動幫女生搬行李?網(wǎng)友:最怕來一句不加微信

夜深愛雜談
2026-04-26 07:36:03
觸目驚心!央視曝光上海一中醫(yī)館:從醫(yī)生到病人全是演員!

觸目驚心!央視曝光上海一中醫(yī)館:從醫(yī)生到病人全是演員!

番外行
2026-04-24 08:59:12
山東校長崔玉軍被查,巨額回扣損害教育公平,家長心聲引發(fā)關(guān)注!

山東校長崔玉軍被查,巨額回扣損害教育公平,家長心聲引發(fā)關(guān)注!

金哥說新能源車
2026-04-26 08:47:09
33歲章澤天風(fēng)格大變!穿艷俗紗裙、副乳突出,比實(shí)際年齡成熟10歲

33歲章澤天風(fēng)格大變!穿艷俗紗裙、副乳突出,比實(shí)際年齡成熟10歲

阿訊說天下
2026-04-18 14:53:39
東方甄選全員告別:這場逼宮為何徹底失控?

東方甄選全員告別:這場逼宮為何徹底失控?

時(shí)尚的弄潮
2026-04-26 06:43:56
電力央企違法違規(guī)典型問題被通報(bào)!

電力央企違法違規(guī)典型問題被通報(bào)!

能見
2026-04-26 12:07:39
倆女子大鬧上海地鐵,拳打薅頭滿臉血,攔都攔不住,結(jié)局令人舒適

倆女子大鬧上海地鐵,拳打薅頭滿臉血,攔都攔不住,結(jié)局令人舒適

奇思妙想草葉君
2026-04-26 02:02:15
58歲江珊差點(diǎn)認(rèn)不出,膀大腰圓,身材壯碩,滿頭白發(fā)太真實(shí)

58歲江珊差點(diǎn)認(rèn)不出,膀大腰圓,身材壯碩,滿頭白發(fā)太真實(shí)

林輕吟
2026-04-25 07:44:35
突發(fā)!臺高層已抵達(dá)非洲,大陸徹底看清:特朗普的最壞打算是什么

突發(fā)!臺高層已抵達(dá)非洲,大陸徹底看清:特朗普的最壞打算是什么

愛下廚的阿釃
2026-04-26 03:10:11
“都絕戶了,還拼命掙錢干嘛?”看見父親50歲就躺平,我崩潰了

“都絕戶了,還拼命掙錢干嘛?”看見父親50歲就躺平,我崩潰了

素十三兒
2026-04-13 07:12:36
052D過橫當(dāng)水道后,遼寧艦抵臺海,日本向中國抗議,不滿東海行動

052D過橫當(dāng)水道后,遼寧艦抵臺海,日本向中國抗議,不滿東海行動

老赳說歷史
2026-04-23 16:08:53
人的命,天注定,這10句話,人越活越信

人的命,天注定,這10句話,人越活越信

金沛的國學(xué)筆記
2026-04-24 14:22:27
民進(jìn)黨高層竟敢偷偷離臺,大陸火速行動!美國來陰的,鄭麗文拼了

民進(jìn)黨高層竟敢偷偷離臺,大陸火速行動!美國來陰的,鄭麗文拼了

致敬明天的太陽
2026-04-26 17:14:46
同是影視巨頭,為何萬達(dá)有人接盤,華誼卻無人相救?真相太扎心

同是影視巨頭,為何萬達(dá)有人接盤,華誼卻無人相救?真相太扎心

八斗小先生
2026-04-25 11:47:21
網(wǎng)紅莫氏雞煲涼透了!從通宵排隊(duì)到空無一人,終究逃不過曇花一現(xiàn)

網(wǎng)紅莫氏雞煲涼透了!從通宵排隊(duì)到空無一人,終究逃不過曇花一現(xiàn)

阿郎娛樂
2026-04-23 15:28:38
1949年傅作義上西柏坡會見毛主席,臨行前:我得拿些哈德門做禮物

1949年傅作義上西柏坡會見毛主席,臨行前:我得拿些哈德門做禮物

海佑講史
2026-04-26 19:20:05
時(shí)間有變!趙心童VS丁俊暉,央視更改直播頻道,誰能進(jìn)世錦賽8強(qiáng)

時(shí)間有變!趙心童VS丁俊暉,央視更改直播頻道,誰能進(jìn)世錦賽8強(qiáng)

體育大學(xué)僧
2026-04-26 08:50:39
一場4-1,讓中超負(fù)分清零第8隊(duì)誕生!火爆齊魯?shù)卤龋EO品┥?>
    </a>
        <h3>
      <a href=小彭美識
2026-04-26 19:21:41
2026-04-26 20:03:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12536文章數(shù) 176457關(guān)注度
往期回顧 全部

科技要聞

漲價(jià)浪潮下,DeepSeek推動AI“價(jià)格戰(zhàn)”

頭條要聞

特朗普內(nèi)閣又一女部長落馬:強(qiáng)迫男下屬為其提供性服務(wù)

頭條要聞

特朗普內(nèi)閣又一女部長落馬:強(qiáng)迫男下屬為其提供性服務(wù)

體育要聞

森林狼3比1掘金:逆境中殺出了多孫穆?!

娛樂要聞

僅次《指環(huán)王》的美劇,有第二季

財(cái)經(jīng)要聞

事關(guān)新就業(yè)群體,中辦、國辦發(fā)文

汽車要聞

預(yù)售19.38萬元起 哈弗猛龍PLUS七座版亮相

態(tài)度原創(chuàng)

旅游
健康
家居
房產(chǎn)
數(shù)碼

旅游要聞

昨日1.78萬人次在廣富林文化遺址體驗(yàn)壯鄉(xiāng)風(fēng)情,“五一”期間還有精彩節(jié)目等你來

干細(xì)胞如何讓燒燙傷皮膚"再生"?

家居要聞

自然肌理 溫潤美學(xué)

房產(chǎn)要聞

新一輪教育大爆發(fā)來了!?,開始瘋狂建學(xué)校!

數(shù)碼要聞

一加120W充電寶有多猛?30分鐘充68%

無障礙瀏覽 進(jìn)入關(guān)懷版