国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Claude 這個更新,讓模型能力提升10%+!

0
分享至

大多數(shù)人低估了昨天 Claude開放 100 萬上下文長度的更新,從 200K 到 1M,上下文長度其實不是提升到原來的 5 倍,而是 7 倍、8 倍、9 倍。

因為原來 200K 的上下文里有很大一部分會被系統(tǒng)提示詞、記憶、skills,以及預(yù)留的 compact buffer 所占據(jù)。所以你真正可使用的項目上下文長度其實就 100K 出頭,現(xiàn)在在 1M 上下文里,項目可用的上下文提升到了 900K 左右。

我打開 /context 截了兩張圖:

Sonnet 4.6(200K)——打開對話就用掉了 25%


Opus 4.6(1M)——同樣的 skill 配置,用掉的比例縮到 4%


Free space 的對比:

· Sonnet 4.6(200K):free space 118k(58.8%)

· Opus 4.6(1M):free space 923k(92.3%)

923 ÷ 118 ≈ 7.8 倍。名義上 5 倍,實際可用空間接近 8 倍。對于 skill 配置越重的用戶,這個數(shù)字越夸張——這就是我說它等效于 6-10 倍的原因。

被 compact 折磨過的人都懂這是什么感覺。對話太長觸發(fā) compact,有時候順,有時候直接失敗,對話就卡死了。重開,手動粘貼上下文,每次都有信息損耗,然后模型在同一個地方再犯一遍你以為解決了的錯。

上下文不是容量,是草稿紙

費曼不相信自己說不清楚的東西。他的標(biāo)準(zhǔn)是:把所有符號去掉還能講清楚,才算真理解。上下文限制限制的不只是能放進(jìn)去多少內(nèi)容。

你正在解一道復(fù)雜的數(shù)學(xué)題,做到一半,我把你的草稿紙拿走了。你變笨了嗎?沒有。但你能解出那道題嗎?也不能了。

問題出在草稿紙,不在你的大腦。模型的上下文就是它的草稿紙。

記憶不只是存儲,是推理的原材料。推導(dǎo)結(jié)論,前提和中間步驟得記在某個地方,才能一步步往下走。每推一步就忘一步,算力再猛也推不出來。上下文窗口就是模型的有效記憶范圍,超出去只能猜。

所以模型出錯很多時候不是不夠聰明,是看不見:

代碼開發(fā):bug 的根源在三個文件之前引入的變量定義。那個定義超出上下文了,模型看不見,只能猜。

長文寫作:寫到后半段,前面某個論點超出窗口了。模型開始隱隱復(fù)述已經(jīng)說過的東西,或者前后邏輯出現(xiàn)細(xì)微矛盾。你改稿時才發(fā)現(xiàn),時間沒了。

多輪對話:第 3 輪定的約束到第 30 輪消失了。建議越來越奇怪,你說不出哪里不對,就是感覺「它沒在聽」。

上下文越小,這類殘缺越多,判斷越差。

數(shù)據(jù):上下文越長,Claude 和其他模型差距越大

數(shù)據(jù)也能說明這件事。Anthropic 用 MRCR v2(8-needle)測了一組長上下文檢索,任務(wù)是在超長文本里同時找多個藏起來的關(guān)鍵信息。


模型

256K

1M

Claude Opus 4.6 91.9% 78.3% Claude Sonnet 4.6 90.6% 65.1%

GPT-5.4

79.3%?

36.6%

Gemini 3.1 Pro

59.1%

25.9%

? GPT-5.4 的 256K 數(shù)據(jù)為 128K–256K 區(qū)間均值

上下文越長,差距越大。 256K 時幾個模型還擠在一起,拉到 1M,GPT-5.4 掉到 36.6%,Gemini 3.1 Pro 掉到 25.9%,Claude Opus 4.6 還在 78.3%。不是 Claude 在短上下文里更強——是拉長之后別人扛不住,Claude 還在。

Claude Code 的 PM Boris Cherny 也在推上確認(rèn)了一件事:

Opus 4.6 1M 現(xiàn)在是 Claude Code Max、Team、Enterprise 的默認(rèn)模型,不用改任何設(shè)置。Pro 版和 Sonnet 用 /extra-usage 手動開啟。

Anthropic 還引用了個客戶案例:用上 1M 上下文之后,自動壓縮事件減少了 15%。這跟我自己的體感對得上。我自己估,對長期迭代的復(fù)雜項目,這個價值至少等于模型能力提升 10%-20%。

API也取消溢價了

900K token 的請求和 9K token,現(xiàn)在一個價:

服務(wù)商

長上下文怎么收費

Anthropic Claude ? 無溢價,和短上下文一個價

OpenAI GPT-5.4

超過 272K 輸入收 2× 單價,輸出 1.5×

OpenAI 收長度稅,Anthropic 現(xiàn)在不收了。終于,上下文成了top模型的標(biāo)配。理論上長上下文也確實不該是高級功能,本身就該是個模型基礎(chǔ)能力。

Claude Code Max 用戶(100 刀/月那檔)更簡單,1M 上下文直接就有,不用加參數(shù),不用多付錢。

順帶還有兩件事

更新

圖片 / PDF 上限 100 → 600

以前一堆 PDF 要手動拆批,現(xiàn)在一次喂進(jìn)去。我每次寫文章要整理十幾張截圖和參考資料,這個直接省了好幾步。

更新

Adaptive Thinking 轉(zhuǎn)正式版

模型自己判斷什么時候慢想、什么時候直接答,不用你手動配置推理深度。少了一層不必要的決策。

Context,Not Control.

AI 工具的進(jìn)步有兩種:模型變聰明,或者把已有的能力真正釋放出來。1M 上下文 GA 是后者。但對于長期項目、復(fù)雜開發(fā)、以及被 compact 搞崩過的人,實際影響不比前者小。

費曼說過,背下來一個公式,和能自己從頭推導(dǎo)出來,是兩回事,重量完全不同。給模型喂答案,和給它喂能推導(dǎo)出答案的所有信息,也是兩回事。后者更難,但結(jié)果更靠譜。

上下文窗口,決定了你能給它多少推導(dǎo)所需的信息。之前太小,你得做減法——剪掉那些「可能有用但放不進(jìn)去」的東西。每次剪,都是在賭這段信息不重要。賭對了沒感覺,賭錯了,模型就在某個你看不見的地方犯了一個你找不出原因的錯。

現(xiàn)在,你完全可以肆無忌憚去給模型投喂任何你覺得它該知道的信息了。

這個管理理念不止是在Netflix和字節(jié),在大模型的使用和管理上也越來越有效了

Context,Not Control.

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
大廠程序員失業(yè)一年,離婚率高達(dá)90%?

大廠程序員失業(yè)一年,離婚率高達(dá)90%?

燈錦年
2026-04-20 16:52:48
超300萬跌停封單,今日最慘股,連續(xù)下跌4個月后,又一字跌停!

超300萬跌停封單,今日最慘股,連續(xù)下跌4個月后,又一字跌停!

丁丁鯉史紀(jì)
2026-04-20 15:33:38
中國堅決拒絕談判,光刻機封鎖引發(fā)全球緊張局勢

中國堅決拒絕談判,光刻機封鎖引發(fā)全球緊張局勢

普陀動物世界
2026-04-20 18:18:17
“把大女兒養(yǎng)成這樣,還敢說沒偏心?”一張母女三人合照,被群嘲

“把大女兒養(yǎng)成這樣,還敢說沒偏心?”一張母女三人合照,被群嘲

妍妍教育日記
2026-04-20 18:51:58
家暴打死老婆,他在行刑前尿了褲子:終于怕了

家暴打死老婆,他在行刑前尿了褲子:終于怕了

大道微言
2026-04-04 14:49:29
翁虹罕見談前夫:婚前婚后兩個樣,曾因穿著問題被其罵是在勾引人

翁虹罕見談前夫:婚前婚后兩個樣,曾因穿著問題被其罵是在勾引人

喜歡歷史的阿繁
2026-04-21 02:17:37
國際觀察|美伊談判懸念叢生,局勢走向有幾種可能?

國際觀察|美伊談判懸念叢生,局勢走向有幾種可能?

新華社
2026-04-20 22:02:14
收拾完伊朗,下一個輪到中國?以色列發(fā)戰(zhàn)爭威脅,中方送出5個字

收拾完伊朗,下一個輪到中國?以色列發(fā)戰(zhàn)爭威脅,中方送出5個字

千羽解讀
2026-04-18 10:12:15
黃圣依小兒子近照曝光:這顏值,是來“整頓”星二代的吧!

黃圣依小兒子近照曝光:這顏值,是來“整頓”星二代的吧!

情感大頭說說
2026-04-19 22:17:29
這是迄今為止,我見過身材最美的女人之一,不接受反駁

這是迄今為止,我見過身材最美的女人之一,不接受反駁

小椰的奶奶
2026-04-11 12:33:07
一個多月內(nèi),青島兩名市委常委相繼落馬

一個多月內(nèi),青島兩名市委常委相繼落馬

中國青年報
2026-04-20 22:08:12
江西省委組織部:陳克龍、方向軍,擬任市委書記

江西省委組織部:陳克龍、方向軍,擬任市委書記

上觀新聞
2026-04-20 17:48:10
丁俊暉暖心牽手老奶奶!盼半決賽都是中國球員,展望對陣趙心童

丁俊暉暖心牽手老奶奶!盼半決賽都是中國球員,展望對陣趙心童

排球黃金眼
2026-04-21 00:38:50
河南新鄉(xiāng)21歲男生失聯(lián)10天,自稱去安徽跑外賣,最后現(xiàn)身云南邊境,警方已介入調(diào)查

河南新鄉(xiāng)21歲男生失聯(lián)10天,自稱去安徽跑外賣,最后現(xiàn)身云南邊境,警方已介入調(diào)查

極目新聞
2026-04-20 21:15:49
原來我們錯怪高市早苗了

原來我們錯怪高市早苗了

智先生
2026-04-20 21:07:48
為了訪華,美國忍了

為了訪華,美國忍了

安安說
2026-04-20 11:07:59
嚴(yán)肅辟謠:小鵬 GX沒有抄襲路虎攬勝!

嚴(yán)肅辟謠:小鵬 GX沒有抄襲路虎攬勝!

車市博覽
2026-04-19 16:06:34
伊朗官員:最高領(lǐng)袖穆杰塔巴·哈梅內(nèi)伊完全健康,“出于安全考慮,目前錄制穆杰塔巴的任何影像或聲音均不妥當(dāng)”

伊朗官員:最高領(lǐng)袖穆杰塔巴·哈梅內(nèi)伊完全健康,“出于安全考慮,目前錄制穆杰塔巴的任何影像或聲音均不妥當(dāng)”

大象新聞
2026-04-20 23:43:04
馬筱梅成立個人公司,疑似與婆家經(jīng)濟(jì)切割,張?zhí)m無奈直言欲望太高

馬筱梅成立個人公司,疑似與婆家經(jīng)濟(jì)切割,張?zhí)m無奈直言欲望太高

人間煙火記事本
2026-04-21 00:35:17
越南一把手很焦慮:和中國一對比,才知道原來我們落后了這么多

越南一把手很焦慮:和中國一對比,才知道原來我們落后了這么多

芳芳?xì)v史燴
2026-04-21 00:55:07
2026-04-21 02:44:49
AI進(jìn)化論花生 incentive-icons
AI進(jìn)化論花生
AI博主,AppStore付費榜第一的小貓補光燈app開發(fā)者
188文章數(shù) 111關(guān)注度
往期回顧 全部

科技要聞

HUAWEI Pura X Max發(fā)布 售價10999元起

頭條要聞

19歲女孩挪用自家1700萬當(dāng)"榜一大姐" 親爹帶女兒自首

頭條要聞

19歲女孩挪用自家1700萬當(dāng)"榜一大姐" 親爹帶女兒自首

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經(jīng)要聞

利潤暴跌7成,字節(jié)到底在做什么

汽車要聞

把天門山搬進(jìn)廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

教育
旅游
游戲
公開課
軍事航空

教育要聞

大降溫:來澳洲留學(xué)的中國學(xué)生,創(chuàng)近12年新低!

旅游要聞

以“Fun”為名,深圳布吉將發(fā)布全域旅游品牌IP

大司馬回歸兩個月,某音人氣穩(wěn)居頂流行列,道出風(fēng)光背后心酸現(xiàn)狀

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普:美艦向伊朗貨船開火炸出個洞

無障礙瀏覽 進(jìn)入關(guān)懷版