国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

百萬(wàn)Token白燒?Claude官方下場(chǎng):5招治好上下文腐爛

0
分享至


新智元報(bào)道

編輯:元宇

【新智元導(dǎo)讀】給了100萬(wàn)token,現(xiàn)在卻手把手教你怎么刪記錄!Anthropic官方承認(rèn):塞太多東西,Claude就會(huì)變蠢。面對(duì)失控的「上下文腐爛」,Anthropic連夜甩出5招救命指南。

Anthropic自己戳破了百萬(wàn)上下文神話(huà)?


https://claude.com/blog/using-claude-code-session-management-and-1m-context

近日,Anthropic一篇關(guān)于「如何管理百萬(wàn)上下文」的博客中再次提到了「上下文腐爛」(context rot)的問(wèn)題,簡(jiǎn)單說(shuō)就是:

上下文越長(zhǎng),模型越蠢。

Anthropic解釋道,上下文窗口是指模型在生成下一條回復(fù)時(shí)能夠「看到」的全部?jī)?nèi)容,它包括你的系統(tǒng)提示、迄今為止的對(duì)話(huà)內(nèi)容、每一次工具調(diào)用及其輸出,以及所有已讀取的文件。

目前,Claude Code的上下文窗口為一百萬(wàn)個(gè)token。


但上下文并非越長(zhǎng)越好。模型的注意力被分散到更多token上,更早的、已經(jīng)不相關(guān)的內(nèi)容會(huì)開(kāi)始干擾當(dāng)前任務(wù),導(dǎo)致表現(xiàn)下降,這就是「上下文腐爛」。


這并非社區(qū)自造的概念,而是出自Anthropic官方博客。

早在今年2月Sonnet 4.6發(fā)布時(shí),公告里就寫(xiě)明了:Sonnet 4.6提供了測(cè)試版百萬(wàn)token上下文窗口。

但百萬(wàn)Token≠百萬(wàn)有效Token。

你往對(duì)話(huà)里塞的每一條消息、每一次文件讀取、每一輪工具調(diào)用,都在稀釋模型的注意力。

早期那些已經(jīng)不相關(guān)的內(nèi)容不會(huì)自動(dòng)消失,它們會(huì)像噪音一樣持續(xù)干擾當(dāng)前任務(wù)。

提出問(wèn)題后,Anthropic通過(guò)這篇博客給出了一套完整的管理方法。

先告訴你「你的對(duì)話(huà)在腐爛」,然后再手把手教你怎么治。

上下文越長(zhǎng)

AI越蠢

先把「上下文腐爛」的機(jī)制拆開(kāi)看。

100萬(wàn)Token聽(tīng)起來(lái)很多。

一個(gè)中型代碼庫(kù),連文檔帶源碼,可能也就幾十萬(wàn)Token。理論上你可以把整個(gè)項(xiàng)目塞進(jìn)去,然后隨便問(wèn)。

但模型的注意力是有限資源。

你兩小時(shí)前讀的那個(gè)配置文件、一小時(shí)前調(diào)試失敗的那段日志、半小時(shí)前探索的一條死胡同,全都還在窗口里,全都在搶模型的注意力。

這就是context rot的機(jī)制:模型被迫同時(shí)「記住」太多不相關(guān)的東西,沒(méi)法集中精力處理眼前的任務(wù)。

也許你會(huì)覺(jué)得,這不就和人類(lèi)開(kāi)會(huì)開(kāi)久了走神是一個(gè)道理嘛。

的確如此。

信息過(guò)載導(dǎo)致注意力稀釋?zhuān)@與能力無(wú)關(guān),是帶寬問(wèn)題。

更要命的是,當(dāng)上下文快要撐到100萬(wàn)Token上限時(shí),系統(tǒng)會(huì)自動(dòng)觸發(fā)「壓縮」(compaction):

即把整段對(duì)話(huà)總結(jié)成一個(gè)更短的摘要,然后在新窗口里繼續(xù)工作。

這聽(tīng)起來(lái)很智能,但自動(dòng)壓縮發(fā)生的那一刻,恰恰是上下文最長(zhǎng)、模型表現(xiàn)最差的時(shí)候。

用最蠢的狀態(tài)去做最關(guān)鍵的總結(jié),這事兒本身就很難靠譜。

每一輪對(duì)話(huà)都是岔路口

Anthropic在博客里把每一次對(duì)話(huà)交互定義為一個(gè)決策節(jié)點(diǎn)。

每一輪交互結(jié)束后,你其實(shí)站在一個(gè)岔路口,不是只有「繼續(xù)聊」這一條路。

第一條:Continue。在同一會(huì)話(huà)中發(fā)送另一條消息,直接繼續(xù)聊。上下文還相關(guān),沒(méi)必要折騰。這是最自然的選擇,大多數(shù)時(shí)候也確實(shí)夠用。

第二條:/rewind。連按兩下Esc,跳回之前某條消息,從那里重新來(lái)。

官方博客里有一個(gè)很精準(zhǔn)的判斷:與其糾正,不如回退。


回退(Rewind)通常是更佳的修正方式。

比如Claude讀了五個(gè)文件,試了一種方法沒(méi)成功,你的本能反應(yīng)是說(shuō)「這個(gè)不行,換個(gè)方法」。

但這樣做的問(wèn)題是,那次失敗嘗試的全部中間過(guò)程還留在上下文里,繼續(xù)污染后續(xù)判斷。

更聰明的做法是rewind到讀完文件那個(gè)節(jié)點(diǎn),帶著新信息重新發(fā)一條更精確的指令:別用方案A,foo模塊沒(méi)暴露那個(gè)接口,直接走B。

有用的文件讀取保留了,失敗的嘗試丟掉了。上下文干干凈凈。

你也可以讓Claude總結(jié)它學(xué)到的內(nèi)容并創(chuàng)建一條交接信息。這有點(diǎn)像未來(lái)的Claude給過(guò)去的自己留了一封信:這條路我試過(guò)了,走不通。

第三條:/clear。開(kāi)啟一個(gè)新會(huì)話(huà),附帶一段簡(jiǎn)要說(shuō)明:之前做了什么、現(xiàn)在要干什么、哪些文件相關(guān)。

好處是零腐爛,上下文完全由你控制。壞處是費(fèi)事,所有背景都得你自己寫(xiě)。

第四條:/compact。讓模型總結(jié)當(dāng)前對(duì)話(huà),用摘要替換掉原來(lái)的歷史記錄。


省事,但有損。

你可以附上引導(dǎo)指令:/compact focus on the auth refactor, drop the test debugging(聚焦認(rèn)證重構(gòu),刪掉測(cè)試調(diào)試。)

讓它知道什么該留什么該扔,而不是去猜。

/clear和/compact看起來(lái)相似,但行為截然不同:

/compact由模型決定什么重要,你省心但可能丟關(guān)鍵信息,而/clear由你自己寫(xiě)下關(guān)鍵內(nèi)容,費(fèi)事但精確。


第五條,Subagents。

把一塊工作交給一個(gè)擁有獨(dú)立上下文的子智能體,干完活只把結(jié)論帶回來(lái)。

當(dāng)你知道接下來(lái)的任務(wù)會(huì)產(chǎn)生大量中間輸出,但你只需要最終結(jié)論時(shí),subagent是最干凈的方案。

它拿到一個(gè)全新的獨(dú)立上下文窗口,在里面完成所有臟活,中間過(guò)程全部留在子窗口里,最后只有一份結(jié)論帶回主會(huì)話(huà)。

Subagents:你的一次性調(diào)查員

這五個(gè)動(dòng)作里,最容易被誤解的就是subagents。

很多人一聽(tīng)「子智能體」就往「多智能體協(xié)作」上聯(lián)想:團(tuán)隊(duì)分工、并行處理、AI員工開(kāi)會(huì)討論。

但Anthropic這篇博客里講的subagents,核心價(jià)值只有一個(gè):上下文隔離。

官方文檔明確寫(xiě)道:每個(gè)subagent都運(yùn)行在自己的上下文窗口中。

它可以讀大量文件、做大量搜索、跑完整個(gè)調(diào)查流程。但最終,只有摘要和一小段元數(shù)據(jù)會(huì)回傳給主會(huì)話(huà)。

那些海量的中間過(guò)程,全部留在子智能體的一次性上下文里。你的主會(huì)話(huà)不會(huì)被這些噪聲污染。


Anthropic內(nèi)部用的判斷標(biāo)準(zhǔn)也很簡(jiǎn)單:

我之后還需要這些工具輸出本身嗎,還是只需要最終結(jié)論?

如果答案是后者,就交給subagent。

博客里給了三個(gè)典型場(chǎng)景:

讓subagent基于規(guī)格文件驗(yàn)證工作結(jié)果;讓subagent去讀另一個(gè)代碼庫(kù),總結(jié)它的認(rèn)證流程,然后你自己來(lái)實(shí)現(xiàn);讓subagent根據(jù)你的git改動(dòng)去寫(xiě)文檔。

這三個(gè)場(chǎng)景有一個(gè)共同點(diǎn):過(guò)程很重,結(jié)論很輕。

所以subagent的本質(zhì)不是你的同事,和你在一塊干活,更像是你的「一次性調(diào)查員」。

它的工作簿在任務(wù)結(jié)束后就可以扔掉,你只需要拿走最后那頁(yè)報(bào)告。

雖然Claude Code會(huì)自動(dòng)調(diào)用Subagents,但你也可以給它更明確的執(zhí)行指令,比如:

啟動(dòng)一個(gè)Subagents,根據(jù)以下規(guī)范文件驗(yàn)證此項(xiàng)工作的結(jié)果;

派生一個(gè)Subagents去閱讀另一個(gè)代碼庫(kù),并總結(jié)其身份驗(yàn)證流程的實(shí)現(xiàn)方式,然后你自己以相同的方式實(shí)現(xiàn)它;

派生一個(gè)Subagents,根據(jù)我的Git變更來(lái)編寫(xiě)此功能的文檔。

警惕自動(dòng)壓縮的翻車(chē)時(shí)刻

Anthropic在博客里坦承了一個(gè)很多開(kāi)發(fā)者已經(jīng)踩過(guò)的坑:自動(dòng)壓縮(compaction)翻車(chē)。

什么時(shí)候翻車(chē)?當(dāng)模型無(wú)法預(yù)測(cè)你接下來(lái)要干什么的時(shí)候。

博客舉了一個(gè)例子:

你做了一次很長(zhǎng)的調(diào)試會(huì)話(huà),自動(dòng)壓縮觸發(fā)了,模型把整個(gè)排查過(guò)程總結(jié)了一遍。然后你突然說(shuō):「現(xiàn)在修一下bar.ts里那個(gè)warning?!?/p>

但因?yàn)檎麄€(gè)會(huì)話(huà)主要圍繞調(diào)試展開(kāi),那個(gè)warning只是中途順帶看到的一眼,壓縮的時(shí)候已經(jīng)被丟掉了。

這事棘手在哪?觸發(fā)自動(dòng)壓縮的那一刻,恰恰是上下文最長(zhǎng)、模型表現(xiàn)最打折的時(shí)候。

你讓一個(gè)已經(jīng)「走神」的模型來(lái)決定什么信息重要、什么可以丟掉。

好在百萬(wàn)Token窗口給了一個(gè)緩沖區(qū)。

你不用等到自動(dòng)觸發(fā),可以提前主動(dòng)/compact,并附上說(shuō)明:接下來(lái)要做什么、哪些信息必須保留。


用最清醒的時(shí)候做壓縮,而不是等到最糊涂的時(shí)候被動(dòng)挨打。

說(shuō)到底,自動(dòng)壓縮不是不能用,是不能盲信。

五條路

一個(gè)急救包

雖然最自然的做法就是繼續(xù)下去,但另外四個(gè)選項(xiàng)可用于幫助你管理上下文。

這五條路拼在一起,本質(zhì)上就是一套防治「上下文腐爛」的急救包。


Anthropic官方示意圖:五種上下文管理動(dòng)作,從左到右保留的舊上下文越來(lái)越多

官方博客在文末放了一張決策表,按場(chǎng)景匹配工具:


每一次回車(chē),都是一次上下文決策。

五種場(chǎng)景,五個(gè)工具,選對(duì)了上下文干凈,選錯(cuò)了模型變蠢。

因此,每一輪交互之后,都該花一秒鐘想想:我的上下文還干凈嗎?接下來(lái)該走哪條路?

百萬(wàn)上下文的另一面

是百萬(wàn)token的賬單

除了管上下文質(zhì)量,Anthropic這次還做了另一件事:

讓開(kāi)發(fā)者看見(jiàn)自己的消耗。

博客開(kāi)頭就說(shuō)了,/usage這個(gè)新命令的推出,「來(lái)自我們和客戶(hù)進(jìn)行的多次交流」。

/usage是干什么的?

根據(jù)Claude Code官方命令文檔,它的作用是「顯示套餐使用上限和速率限制狀態(tài)」。

注意,這不是一個(gè)上下文管理工具。

它不壓縮、不回退、不清理,只做一件事:讓你看見(jiàn)自己用了多少,還剩多少,有沒(méi)有撞上限流。

但這恰恰是開(kāi)發(fā)者最焦慮的事。

100萬(wàn)上下文聽(tīng)起來(lái)很美,但token不是免費(fèi)的。

一個(gè)長(zhǎng)會(huì)話(huà)跑下來(lái),你到底消耗了多少配額?自動(dòng)壓縮會(huì)不會(huì)在你不知情的情況下觸發(fā),丟掉關(guān)鍵信息?你離速率限制還有多遠(yuǎn)?

以前這些問(wèn)題沒(méi)有答案,現(xiàn)在Anthropic給了一個(gè)透明窗口。

這個(gè)功能很小,但表明Anthropic已經(jīng)意識(shí)到,百萬(wàn)上下文時(shí)代,「用得起」和「用得好」是兩個(gè)必須同時(shí)解決的問(wèn)題。

光給能力不給可見(jiàn)性,開(kāi)發(fā)者遲早會(huì)踩坑然后流失。

提示詞工程之后

是上下文工程

退一步看全局。

今年2月,Anthropic發(fā)布Sonnet 4.6,公告里確認(rèn)了100萬(wàn)token上下文窗口(beta)。


那篇公告解決的是「能不能」的問(wèn)題:模型能不能撐住這么長(zhǎng)的上下文。

用戶(hù)反饋也很正面:它在改代碼前更能有效讀取上下文了。

4月15日這篇博客,解決的是「怎么用」的問(wèn)題。它直接承認(rèn)了現(xiàn)實(shí)局限,然后給出一套系統(tǒng)化的管理方法。

兩步合在一起,構(gòu)成了一個(gè)完整的閉環(huán):先給你武器,再教你怎么用不傷到自己的錢(qián)包。

Prompt engineering這幾年被講爛了。但真正決定AI編程天花板的,可能是下一個(gè)詞:context engineering(上下文工程)。

怎么喂上下文、什么時(shí)候清理、哪些信息該隔離、哪些該保留,這些問(wèn)題以前靠直覺(jué),現(xiàn)在Anthropic開(kāi)始給方法論了。

上下文工程,正在成為AI編程時(shí)代的必修課。

參考資料:

https://claude.com/blog/using-claude-code-session-management-and-1m-context

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美尖端領(lǐng)域10人接連死亡,美前高官:FBI調(diào)查或發(fā)現(xiàn)“難以置信的離奇情況”

美尖端領(lǐng)域10人接連死亡,美前高官:FBI調(diào)查或發(fā)現(xiàn)“難以置信的離奇情況”

紅星新聞
2026-04-19 15:48:10
女子稱(chēng)酒店回訪暴露她開(kāi)房隱私:丈夫查她開(kāi)房記錄,和她離婚了

女子稱(chēng)酒店回訪暴露她開(kāi)房隱私:丈夫查她開(kāi)房記錄,和她離婚了

江山揮筆
2026-04-19 10:57:54
寵物食品品牌“誠(chéng)實(shí)一口”翻車(chē),創(chuàng)始人深夜致歉!其公司注冊(cè)資本3年增長(zhǎng)137倍

寵物食品品牌“誠(chéng)實(shí)一口”翻車(chē),創(chuàng)始人深夜致歉!其公司注冊(cè)資本3年增長(zhǎng)137倍

半島官網(wǎng)
2026-04-18 05:58:14
烏克蘭對(duì)俄本土發(fā)起狂風(fēng)暴雨打擊,俄羅斯遭遇黑色星期六

烏克蘭對(duì)俄本土發(fā)起狂風(fēng)暴雨打擊,俄羅斯遭遇黑色星期六

史政先鋒
2026-04-19 19:18:27
5月1日起全國(guó)嚴(yán)查!開(kāi)車(chē)上班、做生意,這些小事別再碰,輕則罰款

5月1日起全國(guó)嚴(yán)查!開(kāi)車(chē)上班、做生意,這些小事別再碰,輕則罰款

寶哥精彩賽事
2026-04-19 06:35:05
新西蘭軍機(jī)多次抵近中國(guó)周邊空域,嚴(yán)重干擾民航!中方:已作出堅(jiān)決有力應(yīng)對(duì),并向新方提出嚴(yán)正交涉

新西蘭軍機(jī)多次抵近中國(guó)周邊空域,嚴(yán)重干擾民航!中方:已作出堅(jiān)決有力應(yīng)對(duì),并向新方提出嚴(yán)正交涉

每日經(jīng)濟(jì)新聞
2026-04-17 18:37:58
心情復(fù)雜?槍手兼曼城舊將阿德巴約向瓜迪奧拉送上祝賀

心情復(fù)雜?槍手兼曼城舊將阿德巴約向瓜迪奧拉送上祝賀

懂球帝
2026-04-20 01:58:15
絕不談判!永久關(guān)閉豁免窗口!中國(guó)打響光刻機(jī)反擊戰(zhàn)

絕不談判!永久關(guān)閉豁免窗口!中國(guó)打響光刻機(jī)反擊戰(zhàn)

素衣讀史
2026-04-19 21:49:57
為什么全國(guó)人民都在拒接電話(huà)?

為什么全國(guó)人民都在拒接電話(huà)?

黯泉
2026-04-18 17:00:56
打蛇打七寸!中國(guó)全面斷供開(kāi)始,日本多行業(yè)停擺,高市真慌了

打蛇打七寸!中國(guó)全面斷供開(kāi)始,日本多行業(yè)停擺,高市真慌了

來(lái)科點(diǎn)譜
2026-04-19 07:17:32
五大聯(lián)賽首冠誕生!拜仁提前4輪奪冠,孔帕尼兩連冠,連刷10紀(jì)錄

五大聯(lián)賽首冠誕生!拜仁提前4輪奪冠,孔帕尼兩連冠,連刷10紀(jì)錄

奧拜爾
2026-04-20 01:27:03
越南百億高鐵訂單給德國(guó),來(lái)華體驗(yàn)12小時(shí)高鐵,背后算計(jì)太明顯

越南百億高鐵訂單給德國(guó),來(lái)華體驗(yàn)12小時(shí)高鐵,背后算計(jì)太明顯

苗苗情感說(shuō)
2026-04-19 12:38:15
悲??!廣東一96年女生開(kāi)會(huì)時(shí)心梗猝死,網(wǎng)友稱(chēng)她為20000月薪太拼

悲??!廣東一96年女生開(kāi)會(huì)時(shí)心梗猝死,網(wǎng)友稱(chēng)她為20000月薪太拼

火山詩(shī)話(huà)
2026-04-19 09:35:22
何潤(rùn)東半個(gè)月狂接6個(gè)頂級(jí)商務(wù),零成本躺贏翻紅第一人!

何潤(rùn)東半個(gè)月狂接6個(gè)頂級(jí)商務(wù),零成本躺贏翻紅第一人!

毒舌八卦
2026-04-19 11:36:20
曼城0-1阿森納:4月掉鏈子魔咒見(jiàn)鬼去吧!槍手一戰(zhàn)定乾坤|前瞻

曼城0-1阿森納:4月掉鏈子魔咒見(jiàn)鬼去吧!槍手一戰(zhàn)定乾坤|前瞻

體育世界
2026-04-19 16:38:52
塔帥跪了!曼城“提速”,名宿熱議:凈勝球定生死,阿森納擋不住

塔帥跪了!曼城“提速”,名宿熱議:凈勝球定生死,阿森納擋不住

奧拜爾
2026-04-20 02:01:45
美國(guó)妹子崩潰大哭:借9.6萬(wàn)美元上大學(xué),已還16.5萬(wàn),還欠22萬(wàn)

美國(guó)妹子崩潰大哭:借9.6萬(wàn)美元上大學(xué),已還16.5萬(wàn),還欠22萬(wàn)

賤議你讀史
2026-04-19 04:30:07
持續(xù)低迷,阿森納自2018年以來(lái)首次遭遇國(guó)內(nèi)賽事四連敗

持續(xù)低迷,阿森納自2018年以來(lái)首次遭遇國(guó)內(nèi)賽事四連敗

懂球帝
2026-04-20 02:03:02
2-0奪冠!萊巴金娜賺128萬(wàn)獎(jiǎng)金 還開(kāi)走1輛跑車(chē) 傳來(lái)鄭欽文新消息

2-0奪冠!萊巴金娜賺128萬(wàn)獎(jiǎng)金 還開(kāi)走1輛跑車(chē) 傳來(lái)鄭欽文新消息

侃球熊弟
2026-04-19 20:59:03
比黃金還稀缺!比爾蓋茨、社保重倉(cāng)硬科技龍頭,全是高成長(zhǎng)+高roe

比黃金還稀缺!比爾蓋茨、社保重倉(cāng)硬科技龍頭,全是高成長(zhǎng)+高roe

長(zhǎng)風(fēng)價(jià)值掘金
2026-04-19 11:03:37
2026-04-20 02:28:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
15012文章數(shù) 66787關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類(lèi)紀(jì)錄!300臺(tái)機(jī)器人狂飆半馬

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒(méi)法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒(méi)法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂(lè)要聞

何潤(rùn)東漲粉百萬(wàn)!內(nèi)娛隔空掀桌第一人

財(cái)經(jīng)要聞

華誼兄弟,8年虧光85億

汽車(chē)要聞

29分鐘大定破萬(wàn) 極氪8X為什么這么多人買(mǎi)?

態(tài)度原創(chuàng)

旅游
手機(jī)
藝術(shù)
本地
公開(kāi)課

旅游要聞

北京投入2.2億元建成和田“三館一院”

手機(jī)要聞

8.8英寸小鋼炮!REDMI K Pad 2核心配置揭曉

藝術(shù)要聞

超模施特洛耶克寫(xiě)真曝光,簡(jiǎn)直美到窒息,別錯(cuò)過(guò)!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版