国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

貼臉嘲諷ChatGPT后,這家公司又發(fā)了個最強模型。

0
分享至


誰能想到呢,本周的硅谷AI圈,已經(jīng)演變到了大家喜聞樂見的互噴環(huán)節(jié)。

起因是周三晚上,Anthropic在他們美國人的“春晚”上,放了幾條廣告,明牌嘲諷OpenAI在ChatGPT里塞廣告,直接把諷刺都打到公屏上了:廣告在入侵AI,但不會出現(xiàn)在 Claude。


奧特曼當場就坐不住了,凌晨六點在X上敲了一篇長文,說Anthropic的廣告"明顯不誠實","德州用ChatGPT免費版的人比全美用Claude的人還多"。。

不過插廣告這事兒確實不是大伙喜歡的,可以預見的,評論區(qū)一邊倒地,說他破防了。

哎,光說不解氣,不然打一架?

第二天,還真打起來了。不過不是線下真實嗷,是 Anthropic 把 Claude Opus 4.6 擺上了臺面。


OpenAI 那邊也不甘示弱,在Opus 4.6上線二十多分鐘之后,火速掏出了GPT-5.3 Codex應戰(zhàn)。


不過,這波對轟雖然熱鬧,兩邊的招式其實不太一樣。 Anthropic 這次,是拿出了自己最強的通用模型,而 OpenAI 拿出的 Codex,其實是個專精代碼的“偏科生”,對大多數(shù)人來說用不到。。總感覺氣勢上就輸一頭啊。

所以今天世超先撇開那個寫代碼的,還是來聊聊大家更感興趣的通用模型, Claude Opus 4.6 吧。

先說結(jié)論,在"干活"這件事上,Opus 4.6 應該可以算目前最強的大模型。

跑分圖什么的,大伙估計都看膩了,也基本都是分數(shù)要比老模型高一點點,當然也有少量不如的,不過對咱來說,看的還是綜合體驗嘛。


所以我們仔細翻了下 Anthropic 官方的介紹和 System Card,把幾個真正有料的升級給各位拎了出來。

首先,上下文窗口終于破百萬Tokens了。

之前,Opus系列最讓人詬病的,就是20萬Token的上下文,而隔壁 Gemini 的百萬上下文早用了快兩年了。

而 Opus 4.6 在 MRCR v2 這個評測里拿了76分,我們俗稱“大海撈針”,也就是在巨長上下文里找到我們想找的東西,而上一代Sonnet 4.5是18.5分,一下提升了四倍,可以說是質(zhì)變了。


但上下文這玩意,重點不是數(shù)字大不大,而是能不能真好用啊,很多模型號稱百萬上下文,實際上塞到后面就開始記憶錯亂,胡言亂語了。

所以這次 Anthropic 是有備而來,他們提了一個叫“上下文衰減”的概念,是指上下文過長時,注意力分配被稀釋,導致模型難以精準捕捉一些細小的信息。說白了就是 AI 的腦容量被稀釋了,讀了后面忘前面,在海量信息里找不著重點。


而Claude現(xiàn)在的解決思路,叫“上下文壓縮”,能在對話達到 Token 閾值時,自動將冗長的歷史記錄壓縮成高濃度的摘要,就好比你追了幾百集電視劇腦子不夠用了,它不僅幫你把前面那些啰嗦的情節(jié)刪了給大腦騰內(nèi)存,還能自動生成前情提要讓你無縫銜接下一集。

但世超實測了一下,是有點想吐槽的。

我缺的是上下文嗎,好像是額度?。ro 版訂閱根本聊不到上下文頂點就用光光了。


而且我試了一下,一次喂大量上下文的能力,是干不過Gemini的。比如我最近有個研究物理的項目,找到了一份天文學家里希爾的原版著作,在閱讀中碰到了疑問,因為他的一個計算結(jié)果和牛頓老師完全不同!

然后我把這個200多頁的書丟給Gemini,問他到底是誰的問題。

Gemini讀完,理解得又快又準,并且精確指出了里希爾原文的頁碼數(shù),一通操作指出,牛頓是對的。


而 Opus 4.6 這邊好像是有 bug,一本書根本喂不進去,顯示error。我最后只好給它拆成了兩半。


不過拆完就蠻順利的了,它成功找到了出問題的頁碼數(shù),還給了精確的推理分析,質(zhì)量跟Gemini 3 Pro不相上下。


所以能力這塊是完全過關(guān)的,至于為什么一次喂不進一本書,可能是一種仁慈的防token爆炸機制吧。

當然就這也不夠說“干活最強”,Claude現(xiàn)在最強的地方,其實是“實操”的能力。

咋說呢?你就看之前AI圈爆火的干活工具,什么 MCP,Skill,都是Claude先用上,就連不久前爆火的 Clawdbot (現(xiàn)OpenClaw)現(xiàn)在的默認推薦模型都是Opus 4.6。


就是因為 Opus 這玩意,操作電腦的能力,確實太狠了。

比如我問它,我現(xiàn)在用的顯示器,二手貨最便宜能多少錢。


我就只需要給它說一句話,它就能自己調(diào)用MCP,連接我的電腦,查看我的顯示器型號,再自己上網(wǎng)去閑魚搜最低價。


最終搜出來的價格,跟我自己上閑魚搜的大差不差,而且最騷的是它還知道國補,讓我別買二手,考慮直接加錢換新,全程不需要我干預,可以說真的很像真人助理了。


除了這個,Claude Opus的編碼能力一直是壓著其他家打的,從競技場排名來看,Opus 4.5已經(jīng)打遍無敵手了,現(xiàn)在又來了個4.6,真遙遙領(lǐng)先了。


再配合上超模的動手能力,能力據(jù)說已經(jīng)能媲美高級工程師——這評價來自日本樂天公司的AI總經(jīng)理,說 Opus 4.6 一天之內(nèi)自己修好并關(guān)閉了 13 個 Bug,還看懂了另外 12 個問題是誰負責的,自動把活派給了對應的程序員。


咱也來了點簡單的活,讓它寫個 CS 的 demo 發(fā)到我電腦上。


結(jié)果確實好用,html文件直接出現(xiàn)在了桌面,點開就能玩,血量、地圖、子彈都顯示得完全正確。


最后,Opus 4.6 還有個最頂級的能力,搜集信息,而且不是一般的信息,是各種你不確定的,犄角旮旯里的信息,它都能給你找著。AI 界把這叫做 BrowseComp,Opus 4.6 強勢登頂。


這一點在世超日常使用時也深有體會,其他模型搜不到的情報,Claude 能直接給你定位來源,然后端上來。

比如,差友都知道咱差評有個內(nèi)部梗,就是925,不算出圈,基本只有咱差友自己知道。

那可能有些新差友,不知道這個梗,可以去哪搜呢?咱先用Gemini和GPT試試。

結(jié)果無一例外,全部敗下陣來。



結(jié)果去問了下Claude,直接一個精準命中,連今日最佳都知道,原來 Claude 也是差友吧。。


這也是為啥世超最近驗證傳言、搜集事實都用 Claude Opus,省心的不止一星半點啊。

這一堆子體驗下來,Claude Opus 整體給人一種成熟穩(wěn)重的感覺,如果你讓我選擇一個“它辦事我放心”的AI,我毫不猶豫選的就是Claude。既然這么強,為啥在用戶這塊老不溫不火啊?世超覺得,和 Claude 選擇的路線脫不開關(guān)系。

Anthropic 從一開始就奔著"最能干的AI同事"去的,你看它的產(chǎn)品線,Claude Code、Cowork、Excel插件,全都一個目的,幫你把活干完。

而這,也是老板最喜歡的特質(zhì),所以企業(yè)客戶占了 Anthropic 收入的 80%,這條路確實它最能打。

Claude 的風格這么偏商務風,我覺得也跟它目標客戶有關(guān)。(說是這么說,感覺比其他兩家好看多了。。)


而其他兩家則是各有各的說法。

ChatGPT 這邊,奧特曼的野心顯然不只在做一個“好員工”了,最近的產(chǎn)品節(jié)奏也是真的猛,光 2026 年到現(xiàn)在就發(fā)了ChatGPT Health、Codex 桌面 App、Prism(科研工具),以及剛發(fā)布的企業(yè)平臺 Frontier,還想搶塊企業(yè)市場的蛋糕。 這意思像是,C 端靠用戶量和廣告,B 端靠平臺和生態(tài),兩手都要抓,就是不知道抓不抓得住了。

至于Gemini,則想靠生態(tài)進行一個降維打擊,在Gemini里你能干谷歌生態(tài)里的任何事,回郵件,傳網(wǎng)盤,甚至看Youtube。再加上幾十億臺安卓手機,如果 AI 真像水電一樣滲進你每天都在用的 App 里時,單純賣模型的公司只能拿頭打。

至于誰能笑到最后?

有個網(wǎng)友的評論我覺得很到位:"2026年最聰明的做法不是選一個最好的模型,而是知道每個模型最擅長什么,換著用。"

說得非常對啊,我認可,但唯一的缺點是我錢包有點不對了。

撰文:不咕

編輯:江江&面線

美編:不咕

圖片、資料來源

Anthropic、X


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中國地圖軟件在外網(wǎng)火了!紅綠燈倒計時、林蔭路段顯示驚到老外

中國地圖軟件在外網(wǎng)火了!紅綠燈倒計時、林蔭路段顯示驚到老外

快科技
2026-02-27 21:58:15
大量外國人涌入中國!在中國待幾天后破防:原來中國人這么幸福

大量外國人涌入中國!在中國待幾天后破防:原來中國人這么幸福

鯨探所長
2026-02-27 17:39:51
美軍上尉回憶:志愿軍沖入陣地后,拿刺刀捅死看到的每一個美國兵

美軍上尉回憶:志愿軍沖入陣地后,拿刺刀捅死看到的每一個美國兵

阿器談史
2026-02-26 17:42:09
毛澤東時代經(jīng)濟是崩潰的?從對越反擊戰(zhàn)的軍費支出,便可揭曉一切

毛澤東時代經(jīng)濟是崩潰的?從對越反擊戰(zhàn)的軍費支出,便可揭曉一切

文史季季紅
2026-02-25 08:15:03
德國總理默茨,吃上了西湖醋魚

德國總理默茨,吃上了西湖醋魚

小影的娛樂
2026-02-27 17:28:23
歐冠16強抽簽前致命打擊!巴薩絕對主力報銷,歐冠淘汰賽懸了

歐冠16強抽簽前致命打擊!巴薩絕對主力報銷,歐冠淘汰賽懸了

夜白侃球
2026-02-27 14:18:01
一家子全是美籍,卻還在國內(nèi)“撈金”,年賺4億,賬上還存有130億

一家子全是美籍,卻還在國內(nèi)“撈金”,年賺4億,賬上還存有130億

云景侃記
2026-02-26 23:05:22
“高鐵小少爺”事件,讓普通家長看清真相,學歷和認知都有壁的

“高鐵小少爺”事件,讓普通家長看清真相,學歷和認知都有壁的

澤澤先生
2026-02-24 21:02:57
A股電力三大牛股集體漲停,鎢價大漲引爆概念股,章源鎢業(yè)7天5板,港股智譜深V反彈

A股電力三大牛股集體漲停,鎢價大漲引爆概念股,章源鎢業(yè)7天5板,港股智譜深V反彈

21世紀經(jīng)濟報道
2026-02-27 12:16:14
A股:今天漲到4162,做好準備,下周一股市行情分析!

A股:今天漲到4162,做好準備,下周一股市行情分析!

明心
2026-02-27 15:20:42
終于談妥,莫迪離開耶路撒冷,登機前通告全球,伊朗新的強敵出現(xiàn)

終于談妥,莫迪離開耶路撒冷,登機前通告全球,伊朗新的強敵出現(xiàn)

肖茲探秘說
2026-02-27 14:14:28
Nature重磅發(fā)現(xiàn):超級老人的大腦在大量新生神經(jīng)元,這讓他們80歲以上時仍記憶超群、遠離癡呆

Nature重磅發(fā)現(xiàn):超級老人的大腦在大量新生神經(jīng)元,這讓他們80歲以上時仍記憶超群、遠離癡呆

生物世界
2026-02-27 12:07:57
國際籃聯(lián)重罰!中國男籃遇到2次誤判細節(jié)披露,中國籃協(xié)應上訴

國際籃聯(lián)重罰!中國男籃遇到2次誤判細節(jié)披露,中國籃協(xié)應上訴

現(xiàn)代小青青慕慕
2026-02-27 06:53:55
官方支持,東莞計劃籌建一所新的公辦本科大學

官方支持,東莞計劃籌建一所新的公辦本科大學

高等教育數(shù)字局
2026-02-27 10:15:00
突發(fā),央企國家能源集團已有多名管理人員被查!

突發(fā),央企國家能源集團已有多名管理人員被查!

通信爆料
2026-02-27 09:23:26
項立剛再次鼓吹戰(zhàn)爭之思:最可怕的是,邪惡靈魂裹上愛國外衣

項立剛再次鼓吹戰(zhàn)爭之思:最可怕的是,邪惡靈魂裹上愛國外衣

讀鬼筆記
2026-01-06 19:42:20
巴拿馬強收港口僅3天,李嘉誠再度“出手”,原來他早留退路

巴拿馬強收港口僅3天,李嘉誠再度“出手”,原來他早留退路

王二哥老搞笑
2026-02-27 10:33:06
終于有人把話說透了:當普通人存款到20–50萬,危險的不是沒錢

終于有人把話說透了:當普通人存款到20–50萬,危險的不是沒錢

生活新鮮市
2026-02-22 06:40:40
提前漲停!002980,重要并購

提前漲停!002980,重要并購

中國基金報
2026-02-27 21:52:01
一夜暴裁4000人,股價飆漲25%!聯(lián)創(chuàng)發(fā)文:AI時代不需要那么多人了

一夜暴裁4000人,股價飆漲25%!聯(lián)創(chuàng)發(fā)文:AI時代不需要那么多人了

新智元
2026-02-27 12:02:35
2026-02-27 22:40:49
差評XPIN incentive-icons
差評XPIN
用知識和觀點Debug the world!
10325文章數(shù) 489471關(guān)注度
往期回顧 全部

科技要聞

單張不到五毛!谷歌深夜發(fā)布Nano Banana 2

頭條要聞

23歲博士研究生確診胃癌晚期 坦言經(jīng)常錯過食堂飯點

頭條要聞

23歲博士研究生確診胃癌晚期 坦言經(jīng)常錯過食堂飯點

體育要聞

一場必須要贏的比賽,男籃何止擊敗了裁判

娛樂要聞

郭晶晶霍啟剛現(xiàn)身香港藝術(shù)節(jié)盡顯恩愛

財經(jīng)要聞

沈明高提共富建議 百姓持科技股國家兜底

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

藝術(shù)
數(shù)碼
本地
健康
公開課

藝術(shù)要聞

紫氣東來,好運一整年!

數(shù)碼要聞

三星與美國德州達成協(xié)議,旗下智能電視不再默認“監(jiān)視”當?shù)鼐用?/h3>

本地新聞

津南好·四時總相宜

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版