国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

我們壓根不處于AI泡沫之中

0
分享至

帶來一篇Ben Thompson最新巨作 Agents Over Bubbles ,可以翻作超越泡沫的智能體?

重要的是智能體,而非泡沫。

而關(guān)于所謂的智能體,agents,到底如何發(fā)展到今天,本文做出了系統(tǒng)性的回顧。

在國(guó)內(nèi)處于龍蝦狂熱的當(dāng)下,這可以幫助我們看清楚,AI的進(jìn)步究竟在哪里,以及,我們到底如何從中受益。

看完全文讓我最驚訝的是,理性如BEN,從以前認(rèn)為AI有泡沫、但良性的泡沫有一定好處,現(xiàn)在轉(zhuǎn)而認(rèn)為:我們可能完全不處于AI泡沫之中了。

文章分4部分:

一、LLM 的范式LLM Paradigms

二、Agency需求的降低The Decreased Need for Agency

三、企業(yè)經(jīng)濟(jì)的必然法則Enterprise Economic Imperatives

四、Agents與 AI 價(jià)值鏈Agents and the AI Value Chain

全文總結(jié):如今,AI已經(jīng)正式進(jìn)入了agents 驅(qū)動(dòng)的新階段,它肯定不是一個(gè)即將破裂的泡沫。LLM 的演進(jìn)分成三次躍遷:ChatGPT 讓大眾看到模型能力,o1 通過 reasoning 提高可靠性,而 Claude Code / Codex 代表的 agents,則進(jìn)一步通過harness + tools + 自動(dòng)驗(yàn)證,把模型從“會(huì)聊天”推進(jìn)到“能完成任務(wù)”。正因如此,算力需求不再只是訓(xùn)練或普通推理,而是被 agent 工作流大幅放大,所以大型云廠商的 capex 并非盲目擴(kuò)張,而是對(duì)真實(shí)需求的回應(yīng)。AI 的主要商業(yè)化場(chǎng)景,會(huì)優(yōu)先落在企業(yè)端,而不是消費(fèi)端,因?yàn)槠髽I(yè)更愿意為生產(chǎn)力買單。進(jìn)一步的,真正有利潤(rùn)的環(huán)節(jié),未必只是 model 本身,而是model 與 harness 的集成,而這意味著 Anthropic、OpenAI 這類能夠做出強(qiáng) agent 產(chǎn)品的公司,未必因?yàn)椤澳P蜕唐坊?,而被迅速壓縮利潤(rùn),反而可以攫取更大的利潤(rùn)份額。

以下是正文:

在關(guān)于 AI 未來的預(yù)測(cè)方面,存在著一個(gè)奇怪的悖論:一方面,你不想成為忽視最可怕的末日情景的人,畢竟誰會(huì)希望自己最終被證明是愚蠢的樂觀主義者呢?

與此同時(shí),也存在著一種壓力,讓人不得不相信,我們正處于泡沫之中,所有的這些炒作和各種花銷,都終將走向破產(chǎn)。

一直以來,我都認(rèn)為,我們處于泡沫之中,但是我同樣認(rèn)為泡沫也有好處(the benefits of bubbles)。

然而,現(xiàn)在的我,得出了一個(gè)不同的結(jié)論:我不認(rèn)為我們正處于泡沫之中。

不過同樣諷刺的是,我的這種想法,尤其是想法的轉(zhuǎn)變,也許正是我們身處泡沫之中的最有力證據(jù)。

一、LLM 的范式 LLM Paradigms

在過去幾周里,首先是在 Nvidia 財(cái)報(bào)的背景下,然后是上周在 Oracle 財(cái)報(bào)的背景下,我談到了三個(gè) LLM 拐點(diǎn)(inflection point)。

1、第一個(gè) LLM 的拐點(diǎn),是 2022 年 11 月 ChatGPT 的發(fā)布,這幾乎不需要解釋。

是的,基于 transformer 的大型語言模型在 2017 年就被引入了,其能力令人印象深刻且在不斷增長(zhǎng),但卻被嚴(yán)重低估了。

在2022年的當(dāng)時(shí)來看,這是一項(xiàng)令人難以置信的新技術(shù),但卻極度缺乏產(chǎn)品應(yīng)用和創(chuàng)業(yè)活力(product applications and startup energy)。

不用說,幾周之后,這種情況就被徹底顛覆了。

ChatGPT 當(dāng)然讓世界見識(shí)到了 LLM 的能力,但最初的版本有兩個(gè)缺陷一直留在許多人的腦海中,尤其是那些堅(jiān)信我們正處于泡沫之中的人。

第一個(gè)缺陷,是 LLM 經(jīng)常出錯(cuò),更糟糕的是,當(dāng)它不知道答案時(shí),還會(huì)產(chǎn)生幻覺。

這讓 LLM 感覺像某種魔術(shù)表演:管用的時(shí)候令人驚嘆,但卻不是你可以依賴的東西。

第二個(gè)缺陷與第一個(gè)相關(guān):即使處于那種有缺陷的狀態(tài),LLM 也極其有用,但你需要知道什么時(shí)候用,用它們來做什么,并且你需要主動(dòng)地管理錯(cuò)誤,并驗(yàn)證輸出,以防它產(chǎn)生幻覺。

2、第二個(gè) LLM 拐點(diǎn),是 2024 年 9 月 OpenAI 的 o1 模型的發(fā)布。

到那時(shí),LLM 已經(jīng)取得了巨大的進(jìn)步,這既歸功于新的基礎(chǔ)模型,也因?yàn)楹笥?xùn)練的持續(xù)改進(jìn)。

這意味著,在 ChatGPT 或 Claude 中,構(gòu)成答案的 token 流,現(xiàn)在更有可能是正確的,并且產(chǎn)生幻覺的概率有所降低。

然而,o1 的不同之處在于,它在將答案交付給你之前,會(huì)對(duì)其進(jìn)行推理驗(yàn)證。

傳統(tǒng) LLM ,面臨的巨大挑戰(zhàn)在于它們具有路徑依賴性(path-dependent),雖然它們可以將難題作為一個(gè)整體來考慮,但一旦它們致力于某個(gè)特定的猜測(cè),它們就會(huì)被鎖定,并注定會(huì)失敗。

這是所謂“自回歸大型語言模型”的一個(gè)根本弱點(diǎn),而迄今為止,所有的模型都屬于這一類。

然而,推理模型會(huì)進(jìn)行自我評(píng)估(self-evaluate):它們會(huì)推導(dǎo)出一個(gè)答案,然后思考該答案是否正確,或者它們是否應(yīng)該考慮其他替代方案。

用我上面指出的弱點(diǎn)來說,它們?cè)诠芾礤e(cuò)誤方面,具有內(nèi)部的主動(dòng)性,減輕了用戶持續(xù)主動(dòng)引導(dǎo) LLM 的負(fù)擔(dān),并且結(jié)果非常顯著。

從我的角度來看,如果說 ChatGPT 的卓越之處在于使 LLM 變得更具可讀性和實(shí)用性,那么 o1 的卓越之處就在于使 LLM 變得更加可靠和不可或缺。

3、第三個(gè)拐點(diǎn),Anthropic 于 2025 年 11 月 24 日發(fā)布了 Opus 4.5。

在當(dāng)時(shí),這并沒有引起太大的轟動(dòng)。

然后,在 12 月的某個(gè)時(shí)候,搭載 Opus 4.5 的 Claude Code ,似乎突然能夠完成以前根本不可能做到的事情。

OpenAI 大約在同一時(shí)間(12 月 18 日),發(fā)布了 GPT-5.2-Codex,它也具備類似的能力。

人們談?wù)揳gents,已經(jīng)有一段時(shí)間了。然而突然之間,Claude 和 Codex 都在切實(shí)地完成具體任務(wù),,并且它們做得很正確,其中一些任務(wù)需要耗費(fèi)數(shù)小時(shí)。

不過,關(guān)于 Opus 4.5 模型發(fā)布日期的那一點(diǎn)很有趣。

關(guān)于 agentic 工作負(fù)載的關(guān)鍵在于,它們不僅僅關(guān)乎模型,也不僅僅像 o1 那樣遞歸地使用模型。相反,使 agentic 工作負(fù)載發(fā)揮作用的一個(gè)關(guān)鍵組成部分是“harness”,也就是實(shí)際控制某個(gè)模型的軟件(the software that actually controls the model)。

換句話說,Claude Code 和 OpenAI 的 Codex ,實(shí)際上將用戶從模型中“分離”了出來:你只需向 agent 發(fā)出指令,而 agent 則實(shí)際去指揮模型。

關(guān)鍵在于,agent 還可以使用其他確定性工具(deterministic tools),這意味著它同樣可以驗(yàn)證自己的結(jié)果。

將其置于coding的背景下,在前面跳的第一種范式中,LLM 會(huì)生成代碼,在第二種范式中,LLM 會(huì)思考它正在生成的代碼,并朝著更好的答案進(jìn)行迭代。

而在目前的第三種范式中,agent 會(huì)指揮模型生成代碼,然后檢查該代碼是否真的有效,如果無效則重試。

這一切,都不需要用戶的介入。

換句話說,最初 ChatGPT 帶來的許多最大缺陷,已經(jīng)被大幅削弱,至少對(duì)于像編程這樣,可驗(yàn)證的用例而言,就是如此。

LLM 第一次就答對(duì)的可能性,要大得多,它們會(huì)對(duì)結(jié)果進(jìn)行推理以提高成功率,而現(xiàn)在 agents 會(huì)主動(dòng)驗(yàn)證結(jié)果,無需人類參與其中。

此時(shí),這就只剩下一個(gè)缺陷了:那就是弄清楚到底該用這些東西來做什么。

二、Agency需求的降低 The Decreased Need for Agency

然而,為什么整個(gè)行業(yè)會(huì)如此受限于算力?

以及,為什么大型云廠商在 capex 上的大規(guī)模投資是合理的?

第一種范式,在訓(xùn)練方面需要大量的算力,但是推理部分,也即實(shí)際回答一個(gè)問題,則是相對(duì)高效的,你只需將模型吐出的任何內(nèi)容,發(fā)送給用戶即可(所以我的理解就是基本沒有推理inference)。

第二種范式,急劇增加了推理所需的計(jì)算量,原因有兩點(diǎn):首先,生成答案時(shí),需要多得多的 tokens,因?yàn)槌舜鸢副旧碇?,所有的“推理reasoning”過程也都需要 tokens。

其次,推理reasoning,使模型變得更加有用這一事實(shí),意味著它們被使用得更頻繁了,這本身就推動(dòng)了 token 使用量的增加。

然而,正是第三種范式,才真正打破了天平,證明了 capex 支出并非投機(jī)性投資,而是為了滿足遠(yuǎn)超供應(yīng)的需求而新增的投資。

首先,生成一個(gè)答案,通常需要多次調(diào)用推理模型reasoning model 。

其次,agent 本身也需要算力,并且這種計(jì)算——以及 agent 所使用的工具——由 CPU 來執(zhí)行,比由 GPU 來執(zhí)行更好。

第三,agents 代表了實(shí)用性上的又一次階躍函數(shù)式的增長(zhǎng),這意味著它們將被使用得甚至比聊天機(jī)器人中的推理模型還要多。

第三點(diǎn)將如何體現(xiàn),目前尚未得到充分認(rèn)識(shí)。畢竟,使用聊天機(jī)器人的人,遠(yuǎn)比使用 agents 的人多,而且我會(huì)說,大多數(shù)人使用聊天機(jī)器人的頻率,還沒有達(dá)到他們本應(yīng)該達(dá)到的程度!

這一直是一個(gè)主動(dòng)性的問題(a question of agency):要充分利用 AI,需要真正地發(fā)揮主動(dòng)性去使用 AI。

大型語言模型是智能的,但它們沒有目標(biāo)、價(jià)值觀或驅(qū)動(dòng)力。它們是供人們使用的工具,供任何有意愿且有能力發(fā)揮主動(dòng)性去使用它們的人使用。

有多少應(yīng)用程序或服務(wù),還沒有被開發(fā)出來,并不是因?yàn)槟硞€(gè)人無法想象或在腦海中創(chuàng)造它們,而是因?yàn)樗麄內(nèi)狈?shí)際交付它們所需的資源、團(tuán)隊(duì)或協(xié)調(diào)能力?

這觸及了 AI 影響世界的途徑,這種影響超越了客戶支持(customer support)中的成本節(jié)約,或是其他任何顯而易見的容易實(shí)現(xiàn)的目標(biāo)(低垂的果實(shí)low-hanging fruit)。

隨著大型語言模型在需要時(shí),通過確定性計(jì)算(deterministic computing)進(jìn)行理解、并執(zhí)行復(fù)雜命令的能力不斷增強(qiáng),指揮 AI 做事的獨(dú)立個(gè)體的潛在力量,也會(huì)隨之增強(qiáng)。

互聯(lián)網(wǎng)消除了媒體行業(yè)對(duì)復(fù)雜成本結(jié)構(gòu)的需求及其內(nèi)在的防御性,而 AI 有潛力在更多的行業(yè)中做到同樣的事情。

這就是真正能發(fā)揮作用的 agents有多么重要。

你能看到它們的到來,但當(dāng)它們真的來臨時(shí),你仍然會(huì)感到驚訝,而且就像我們談?wù)撍信c AI 相關(guān)的事物時(shí)必須說的那樣,它們目前所呈現(xiàn)的形態(tài),已經(jīng)是它們未來最差的樣子了。

然而,這一切對(duì)主動(dòng)性agency的影響,才是最深遠(yuǎn)的。

是的,你需要有主動(dòng)性,才能使用 agents。

是的,具備這種主動(dòng)性的人數(shù),可能遠(yuǎn)遠(yuǎn)少于那些可能會(huì)使用聊天機(jī)器人的人數(shù)。

是的,你可以說,聊天機(jī)器人本身將成為 agent 經(jīng)理,但更關(guān)鍵的觀察在于,通過將人類從直接的模型管理中抽象出來,任何單個(gè)的人類都可以控制多個(gè) agents。

就計(jì)算能力、乃至經(jīng)濟(jì)影響而言,這意味著實(shí)際上,不需要那么多具備主動(dòng)性的人,就能極大地增加被積極用于創(chuàng)造具有重大經(jīng)濟(jì)影響的產(chǎn)品的算力。

換言之,agents 的崛起,不僅意味著對(duì)算力需求的急劇增加,也意味著需求顯現(xiàn)不再那么依賴于人類的大規(guī)模采用。

是的,AI 仍然需要主動(dòng)性,只是它不需要那么多人的主動(dòng)性,就能產(chǎn)生深遠(yuǎn)的影響。

三、企業(yè)經(jīng)濟(jì)的必然法則Enterprise Economic Imperatives

在最近的 MacBook Neo 發(fā)布之后,關(guān)注 Apple 的媒體緊緊抓住了華碩的首席財(cái)務(wù)官 Nick Wu 在該公司近期財(cái)報(bào)電話會(huì)議上的言論,他將這臺(tái)599 美元的電腦描述為“對(duì)整個(gè)市場(chǎng)的沖擊potential effects on that market”。

然而,同樣有趣的是 ,Wu 試圖淡化 Neo 對(duì)該市場(chǎng)的潛在影響:“事實(shí)上,我們?cè)缭谌ツ晗掳肽昃吐犝f了 MacBook Neo 即將出貨的消息。因此,我們做了一些內(nèi)部準(zhǔn)備。但該產(chǎn)品正式發(fā)布后,我們發(fā)現(xiàn)其規(guī)格存在一些局限。例如,內(nèi)存不可升級(jí),而且只有 8GB 的內(nèi)存。因此這可能會(huì)限制某些應(yīng)用。所以我認(rèn)為, Apple 在定位這款產(chǎn)品時(shí),可能更多地是關(guān)注于內(nèi)容消費(fèi)(content consumption)。這與主流筆記本電腦的使用場(chǎng)景有些不同,因?yàn)樵谶@種情況下,Neo 感覺更像是一臺(tái)平板電腦,畢竟平板電腦就是主要用于內(nèi)容消費(fèi)?!?/p>

這有點(diǎn)像是在找借口,考慮到 Neo 的處理器是多么強(qiáng)大,以及部分得益于 Apple 硬件和軟件的深度整合,Mac OS 在 8GB 內(nèi)存上運(yùn)行得是多么流暢。

與此同時(shí),Wu 談及到的某些事實(shí)也是對(duì)的,那就是大多數(shù)消費(fèi)者,通常確實(shí)只是想消費(fèi)內(nèi)容。

但我想補(bǔ)充的是,這意味著他應(yīng)該更加擔(dān)心 Neo,而不是更少擔(dān)心。

你最喜歡的生產(chǎn)力應(yīng)用程序(productivity application),最終總是會(huì)轉(zhuǎn)向企業(yè)市場(chǎng)。

因?yàn)楣静旁敢鉃樯a(chǎn)力買單,畢竟他們才是真正為那些他們希望變得更具生產(chǎn)力的員工支付薪水的人。

有理由預(yù)計(jì),這一點(diǎn)同樣適用于 AI。

至少在短期內(nèi),AI 最具吸引力的消費(fèi)者應(yīng)用,是 Google 和 Meta 的廣告業(yè)務(wù),它們與內(nèi)容消費(fèi)并存。

同時(shí),OpenAI 認(rèn)為自己能將超過一小部分比例的消費(fèi)者,轉(zhuǎn)化為訂閱用戶的想法,其實(shí)一直都是不切實(shí)際的。

這既是為什么廣告模式不可或缺的原因,也是為什么這還不足以支付那么多支出的原因。

毫無疑問,大多數(shù)人并不想為 AI 付費(fèi)。

至于他們是否愿意足夠頻繁地使用它,以維持廣告模式的運(yùn)轉(zhuǎn),也還有待觀察。

這也就是說,Anthropic 幾乎完全專注于企業(yè)市場(chǎng)的做法,是對(duì)的。

很多公司已經(jīng)表現(xiàn)出愿意為能讓員工提高生產(chǎn)力的軟件買單,而 AI 在這方面肯定符合要求。

然而,真正讓企業(yè)高管垂涎三尺的,不僅是 AI 會(huì)裁減工作崗位的前景,而且裁減崗位恰恰是因?yàn)檫@能讓整個(gè)公司更具生產(chǎn)力。

情況一直都是如此,即使在大公司里,也只有相對(duì)少數(shù)的人能真正取得突破,并以有意義的方式推動(dòng)公司向前發(fā)展。

然而,這種動(dòng)力需要通過一個(gè)由人類組成的龐大機(jī)構(gòu)進(jìn)行過濾,這些人在某些方向上加速了這種努力,在另一些方向上卻拖慢了它。

那個(gè)機(jī)構(gòu),使得廣泛的影響成為可能,但它伴隨著巨大的協(xié)調(diào)成本。

然而,agents 將更強(qiáng)烈地向純粹的加速傾斜,讓那些創(chuàng)造價(jià)值的驅(qū)動(dòng)者更具影響力。

我贊同這樣一種觀點(diǎn):最好的公司,會(huì)希望利用 AI 做更多的事情,而不僅僅是省錢。

然而,大型組織的現(xiàn)實(shí)情況是,AI 的積極影響,將不在于消滅工作崗位,而在于用 agents 替換掉組織機(jī)器中那些難以管理和激勵(lì)的“人類齒輪human cogs”。

Agents 不僅會(huì)按照指示做事,而且會(huì)不知疲倦、持續(xù)不斷地工作,直到任務(wù)完成。

這可能使得,我們并不處于泡沫之中的論點(diǎn),變得更加令人信服:

1、LLM 的所有弱點(diǎn),正在通過算力的指數(shù)級(jí)增長(zhǎng)得到解決;

2、能使需求暴漲的、需要有效利用 AI 的人類數(shù)量,正在減少。

3、使用 agents 帶來的經(jīng)濟(jì)回報(bào),不僅對(duì)行業(yè)的底線bottom line有影響,也會(huì)推高天花板top line。

在這種背景下,每一家大型云廠商都表示,算力供不應(yīng)求,并且每一家大型云廠商都在面對(duì)股市懷疑的情況下,宣布了遠(yuǎn)超預(yù)期的 capex 計(jì)劃,這難道有什么好奇怪的嗎?

這也就是為什么,不應(yīng)該把即將到來的、歸咎于 AI 的一波裁員潮,僅僅看作是糾正新冠疫情時(shí)期過度招聘決定、或在多次緊縮后調(diào)整薪酬結(jié)構(gòu)的借口。

這些,其實(shí)都是事實(shí)!

與此同時(shí),值得深思的是,公司之所以變得臃腫,是因?yàn)檫@在很長(zhǎng)一段時(shí)間里,招人一直是擴(kuò)張的唯一方式,而且很難知道協(xié)調(diào)成本的拖累和龐大的員工隊(duì)伍,所帶來的邊際收益遞減(diminishing returns )在什么時(shí)候會(huì)超過邊緣員工帶來的好處。

不幸的是,你只有在越過那個(gè)點(diǎn)時(shí),才會(huì)發(fā)現(xiàn)它,而且很難走回頭路。

然而,AI 不僅為消除這種臃腫,提供了上述借口,而且還將“適度規(guī)模的點(diǎn)“rightsize point”,顯著推向了規(guī)模小得多的員工隊(duì)伍。

越來越多的公司,不僅會(huì)懷疑他們?cè)谇?AI 時(shí)代是否雇傭了太多人,還會(huì)懷疑:他們?cè)诤?AI 時(shí)代,是否雇傭了太多人。

最具前瞻性和最能經(jīng)受未來考驗(yàn)的方法,可能將是多裁員而不是少裁員,這可以倒逼留下來的人別無選擇,只能利用 agents 來重建規(guī)模。

畢竟,如果他們不這樣做,那些從一開始就基于 AI 建立起來的、規(guī)模小得多的競(jìng)爭(zhēng)對(duì)手,很快就會(huì)以更低的成本結(jié)構(gòu)(smaller cost structures)和隨著時(shí)間推移結(jié)構(gòu)性增強(qiáng)的能力(more capabilities that will structurally increase over time),緊跟在他們身后(甚至超越?)。

情況,很可能會(huì)變得糟糕。

我不是在倡導(dǎo)這種結(jié)果,而是在分析為什么它很可能會(huì)發(fā)生。

這種經(jīng)濟(jì)上的必然性,將是無法抗拒的,并且隨著時(shí)間的推移,將刺激對(duì)算力更大的需求,這進(jìn)一步支持了現(xiàn)在不是泡沫的觀點(diǎn)

四、Agents與AI 價(jià)值鏈Agents and the AI Value Chain

另一個(gè)重要的泡沫問題是,關(guān)于 Anthropic 和 OpenAI 極高的估值。

當(dāng)然,也許這些東西都是真實(shí)的,但如果模型變成了一種商品( commodity,就是模型能力成了大路貨),那還有利潤(rùn)可圖嗎?

Horace Dediu 在 Asymco 上提出了這些問題,并想知道 Apple 是否正在執(zhí)行企業(yè)史上最輝煌的舉措:

“這正是 Apple 的押注變得天才的地方。AI 模型商品化的速度,比任何人預(yù)測(cè)的都要快,軟件和硬件都有商品化的趨勢(shì)。保護(hù)壁壘是存在的,但它們與集成和分銷(integration and distribution)有關(guān)?!?/p>

“DeepSeek 花費(fèi) 600 萬美元,構(gòu)建了一個(gè)模型,就足以媲美耗資 1 億美元的系統(tǒng)。開源模型,現(xiàn)在為 80% 尋求 VC 融資的初創(chuàng)公司提供支持。”

“大公司正花費(fèi)數(shù)千億美元建立的護(hù)城河,正在蒸發(fā)?!?/p>

“Apple 比任何人都早明白這一點(diǎn),因?yàn)樗鼪]有構(gòu)建自己的 AI 模型,而是以每年約 10 億美元的價(jià)格獲得了 Google 的 Gemini 授權(quán)。當(dāng)外包只需要 10 億美元時(shí),為什么非要花費(fèi) 1000 億美元去建一座工廠?”

“如果明年,出現(xiàn)了更好的模型,Apple 只需更換供應(yīng)商即可……”

“Apple 并沒有錯(cuò)過 AI 革命,它只是押注贏家不會(huì)是那些構(gòu)建基礎(chǔ)設(shè)施的人。贏家將是那些擁有客戶的人,而在地球上沒有其他人擁有比它更好的客戶。”

我認(rèn)為,在前面提到的第一個(gè) LLM 范式期間,以上所有這些斷言,都是站得住腳的。

沒過多久,多個(gè)基礎(chǔ)模型在處理大多數(shù)人使用 LLM 的事務(wù)上,就已經(jīng)足夠優(yōu)秀了,比如,烹飪或基本的醫(yī)療建議,或是作為治療師或伴侶。

此外,有理由期望這種質(zhì)量的模型,很快就能在本地運(yùn)行。

然而,推理范式(reasoning paradigm),讓本地推理(local inference)的暢想,可能無法成立。

考慮到生成的 tokens 數(shù)量,推理模型不僅需要快速的算力,而且它們還需要呈指數(shù)級(jí)增長(zhǎng)的內(nèi)存,來容納大得多的上下文窗口,這是本地模型最大的局限。

Apple 制造出了令人驚嘆的芯片,其極具吸引力的統(tǒng)一內(nèi)存架構(gòu),使其設(shè)備上的基礎(chǔ)推理(basic inference),比其他任何人的設(shè)備都更具合理性。

但在可預(yù)見的未來,也不存在任何一種情況能讓具有競(jìng)爭(zhēng)力的、哪怕是勉強(qiáng)能與云端模型競(jìng)爭(zhēng)的強(qiáng)大推理模型,在本地運(yùn)行(因?yàn)閮?nèi)存不夠)。

然而,最可能會(huì)對(duì) Dediu 的論點(diǎn)造成致命打擊的,是 agents。

具體來說,前面我提到,使 Opus 4.5 令人矚目的,并非模型發(fā)布本身,而是 Claude Code harness (實(shí)際控制某個(gè)模型的軟件)的變化,這使其突然變得極其有用。

這意味著,模型性能并非唯一重要的事情,模型與 harness 之間的整合,才是真正實(shí)現(xiàn) agent 差異化的地方。

在弄清楚 AI 行業(yè)未來的結(jié)構(gòu),以及利潤(rùn)流向時(shí),這是一件非常重要的事情,因?yàn)槔麧?rùn)會(huì)從價(jià)值鏈中被商品化的模塊化部分流出,并流向價(jià)值鏈中具有差異化(differentiated)的整合部分。

Apple 當(dāng)然是這方面最終極的例子,它的硬件并沒有商品化,因?yàn)樗桥c軟件整合在一起的,這就是為什么 Apple 能夠持續(xù)收取更高的價(jià)格,并攫取 PC 和智能手機(jī)領(lǐng)域幾乎全部的利潤(rùn)。

因此可以得出結(jié)論,如果 agents 需要模型與 harness 之間的整合,那么建立這種整合的公司——尤其是 Anthropic 和 OpenAI(Gemini 是一個(gè)強(qiáng)大的模型,但 Google 尚未交付令人信服的 harness)——實(shí)際上有望獲得比去年年底看起來要高得多的利潤(rùn)。

同理,那些認(rèn)為模型只能商品化的公司,可能會(huì)在交付具有競(jìng)爭(zhēng)力的產(chǎn)品時(shí),陷入掙扎。

在這方面,煤礦里的金絲雀是微軟(用來預(yù)警“毒氣”)。

曾經(jīng),Microsoft 自詡為整合的 AI 供應(yīng)商,在財(cái)報(bào)電話會(huì)議上吹噓其與 OpenAI 的深度整合,將帶來具有可持續(xù)差異化的基礎(chǔ)設(shè)施。

之后,OpenAI 險(xiǎn)些管理層大崩盤,而 Microsoft 隨即轉(zhuǎn)變了態(tài)度,越來越多地將模型作為商品來談?wù)?,并提出了一?xiàng)核心 AI 戰(zhàn)略,該戰(zhàn)略需要在模型周圍構(gòu)建基礎(chǔ)設(shè)施,而這些模型本身將是可互換的,并且從 Microsoft 的客戶那里被剝離出來。

然而,快進(jìn)到上周,當(dāng) Microsoft 透露他們將如何應(yīng)對(duì) AI 減少席位seats,帶來的潛在業(yè)務(wù)影響時(shí)(微軟的商業(yè)模式是seat-based business model),聲稱公司打算將 AI 捆綁到一個(gè)新的、更高級(jí)別的企業(yè)級(jí)產(chǎn)品 E7 中,其價(jià)格將是以前最頂級(jí)的 E5 的兩倍,即每個(gè)席位每月 99 美元。

這是一個(gè)巨大的漲幅,Microsoft 需要用真正能讓這些席位更具生產(chǎn)力的 AI,來證明其合理性,而他們隨這個(gè)新捆綁包推出的產(chǎn)品是 Copilot Cowork。

如果“Cowork”這個(gè)名字聽起來很耳熟,那是因?yàn)檫@基本上就是 Claude Cowork 的企業(yè)版,而 Claude Cowork 是該公司在今年早些時(shí)候發(fā)布的、圖形用戶界面化的 Claude Code 版本。

Microsoft 的版本,有一些重要的區(qū)別,包括后者在云端運(yùn)行,并基于你的組織數(shù)據(jù),擁有隨之而來的所有權(quán)限和訪問策略。

然而,關(guān)鍵在于,Copilot Cowork——與 Copilot 聊天機(jī)器人不同——并非是不挑模型的。

Cowork 是一個(gè)agent,這意味著,它既需要一個(gè)模型,也需要一個(gè) harness,并且這是兩個(gè)被整合在一起的部分,而不是模塊化的組件。

這其中的影響是重大的。

Microsoft 承認(rèn),至少在目前,要交付一個(gè)真正引人注目,且企業(yè)愿意為之買單的 agentic 產(chǎn)品,就意味著要放棄他們之前聲明的不挑模型的目標(biāo)。

進(jìn)一步而言,這就提出了一種可能性,即模型不是、也不會(huì)成為商品,因?yàn)?agents 所需要的不僅僅是模型,光靠模型是不夠的。

這無疑讓人對(duì) Apple 僅僅授權(quán) Gemini 并以新的 Siri 的形式自己構(gòu)建 harness 的決定,產(chǎn)生了疑問。

Microsoft 認(rèn)定,他們無法通過走那條路,來交付一款引人注目的產(chǎn)品。

那么,Apple 做了什么,來讓人相信他們能做得更好呢?

如果真要說的話,這家公司的可取之處在于 Dediu 最后得出的那一點(diǎn):消費(fèi)者可能根本就不那么在乎 agents。

在這種情況下,Apple 做到“足夠好good enough”,就可以了。

但是,這對(duì)微軟的企業(yè)級(jí)客戶,是不夠的,這些客戶的要求更高,所以,微軟會(huì)意識(shí)到,它將不得不分給 Anthropic 更多的利潤(rùn),哪怕它本不愿意。

然而,重要的是,如果 agents 正在使 Anthropic 和 OpenAI 成為價(jià)值鏈中的整合點(diǎn)(the point of integration in the value chain),那么認(rèn)為這些公司被高估、以及其他公司代表它兩在數(shù)據(jù)中心進(jìn)行的巨額投資是不合理的那種泡沫論點(diǎn),可能就是不正確的。

我一直堅(jiān)信,只要每個(gè)人都在擔(dān)心泡沫,就不需要去擔(dān)心泡沫。

只有當(dāng)人們把謹(jǐn)慎拋諸腦后,并打包票說,這絕對(duì)不是泡沫的時(shí)候,我們才可能真正身處泡沫之中。

是的,我認(rèn)為 agents 的崛起,意味著我們并不在泡沫之中。

現(xiàn)在的capex是合理的,并且 Anthropic 和 OpenAI 看起來比以往任何時(shí)候都更有韌性。

也或者,當(dāng)我宣布沒有泡沫,就意味著有泡沫,那也就這樣好了,so be it!

全文完。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
活塞頭牌躺了11場(chǎng),球隊(duì)反而從東部第一變"更好了"

活塞頭牌躺了11場(chǎng),球隊(duì)反而從東部第一變"更好了"

籃壇第一線
2026-04-09 08:04:28
廣東21歲美女抑郁癥自殺,上月寫好了遺書,留下8萬存款

廣東21歲美女抑郁癥自殺,上月寫好了遺書,留下8萬存款

180視角
2026-04-08 10:02:54
直播間被指涉黃!中華老字號(hào)海河乳品道歉:相關(guān)店鋪商品已下架

直播間被指涉黃!中華老字號(hào)海河乳品道歉:相關(guān)店鋪商品已下架

界面新聞
2026-04-08 09:25:10
即期布倫特原油價(jià)格漲至144.42美元/桶 創(chuàng)歷史新高

即期布倫特原油價(jià)格漲至144.42美元/桶 創(chuàng)歷史新高

每日經(jīng)濟(jì)新聞
2026-04-08 05:48:03
當(dāng)思想家揮刀自宮,其理論便徹底走向了反人類反人性

當(dāng)思想家揮刀自宮,其理論便徹底走向了反人類反人性

壹家言
2026-03-27 21:13:25
不跑不跳!一個(gè)被嚴(yán)重低估的“長(zhǎng)壽動(dòng)作”藏著6大好處,醫(yī)生都在推薦

不跑不跳!一個(gè)被嚴(yán)重低估的“長(zhǎng)壽動(dòng)作”藏著6大好處,醫(yī)生都在推薦

黃河新聞網(wǎng)呂梁
2026-04-06 09:33:08
非夫妻開房,民警提醒:只要不干這個(gè),誰管你是不是夫妻

非夫妻開房,民警提醒:只要不干這個(gè),誰管你是不是夫妻

君說輿情
2026-04-07 08:35:16
山東旋轉(zhuǎn)門后續(xù):逼員工鞠躬的家長(zhǎng)懵了,監(jiān)控+通報(bào)雙雙打臉!

山東旋轉(zhuǎn)門后續(xù):逼員工鞠躬的家長(zhǎng)懵了,監(jiān)控+通報(bào)雙雙打臉!

奇思妙想草葉君
2026-04-07 21:39:15
降級(jí)也去!曼城新星鐵心加盟熱刺,對(duì)瓜迪奧拉徹底失望

降級(jí)也去!曼城新星鐵心加盟熱刺,對(duì)瓜迪奧拉徹底失望

瀾歸序
2026-04-09 05:43:11
阿聯(lián)酋和科威特遭導(dǎo)彈與無人機(jī)襲擊

阿聯(lián)酋和科威特遭導(dǎo)彈與無人機(jī)襲擊

界面新聞
2026-04-08 18:39:34
訂單排到2028年!光通信這波不是炒概念,是真金白銀的產(chǎn)業(yè)爆發(fā)

訂單排到2028年!光通信這波不是炒概念,是真金白銀的產(chǎn)業(yè)爆發(fā)

Thurman在昆明
2026-04-08 08:36:14
毛主席曾預(yù)言:這兩個(gè)國(guó)家將來對(duì)中國(guó)最大威脅,如今果然應(yīng)驗(yàn)

毛主席曾預(yù)言:這兩個(gè)國(guó)家將來對(duì)中國(guó)最大威脅,如今果然應(yīng)驗(yàn)

鍋鍋愛歷史
2026-03-27 10:28:43
2011年,她全裸接受記者采訪,并稱:我敢看你們,你們敢看我嗎?

2011年,她全裸接受記者采訪,并稱:我敢看你們,你們敢看我嗎?

觸摸史跡
2026-04-08 16:02:42
馬競(jìng)歐冠逃點(diǎn)?后衛(wèi)禁區(qū)內(nèi)用手接門將傳球!巴薩暴怒:正考慮上訴

馬競(jìng)歐冠逃點(diǎn)?后衛(wèi)禁區(qū)內(nèi)用手接門將傳球!巴薩暴怒:正考慮上訴

我愛英超
2026-04-09 06:00:01
白宮:美伊首輪會(huì)談將于11日上午在伊斯蘭堡舉行

白宮:美伊首輪會(huì)談將于11日上午在伊斯蘭堡舉行

界面新聞
2026-04-09 06:54:02
國(guó)家一級(jí)女演員陳麗云被逮捕!

國(guó)家一級(jí)女演員陳麗云被逮捕!

許三歲
2026-03-28 09:24:30
中美德“盾構(gòu)機(jī)”速度差距:德國(guó)每小時(shí)6米,美國(guó)3.6米,中國(guó)呢?

中美德“盾構(gòu)機(jī)”速度差距:德國(guó)每小時(shí)6米,美國(guó)3.6米,中國(guó)呢?

蜉蝣說
2026-04-08 15:30:34
深圳地鐵突然火了!網(wǎng)友:已加入“必吃榜”

深圳地鐵突然火了!網(wǎng)友:已加入“必吃榜”

深圳晚報(bào)
2026-04-08 12:58:04
甜妹田曦薇殺瘋了,這露肩魚尾裙下的腰臀比,誰看了不迷糊?

甜妹田曦薇殺瘋了,這露肩魚尾裙下的腰臀比,誰看了不迷糊?

娛樂領(lǐng)航家
2026-04-08 19:00:04
+7,沒有三巨頭,殘陣湖人這么強(qiáng)嗎?

+7,沒有三巨頭,殘陣湖人這么強(qiáng)嗎?

體育新角度
2026-04-08 22:08:39
2026-04-09 08:40:49
柳胖胖 incentive-icons
柳胖胖
36氪、虎嗅、鈦媒體專欄作者
221文章數(shù) 387關(guān)注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

一天之內(nèi) 以軍空襲黎巴嫩致254死1165傷

頭條要聞

一天之內(nèi) 以軍空襲黎巴嫩致254死1165傷

體育要聞

40歲,但實(shí)力倒退12年

娛樂要聞

侯佩岑全家悉尼度假,一家四口幸福滿溢

財(cái)經(jīng)要聞

局勢(shì)再升級(jí)!霍爾木茲海峽關(guān)閉

汽車要聞

20萬級(jí)滿配華為全家桶 華境S是懂家庭的大六座

態(tài)度原創(chuàng)

時(shí)尚
親子
藝術(shù)
旅游
健康

ED網(wǎng)紅病,正在掏空年輕女性

親子要聞

深圳婦幼救治孕期22周超早產(chǎn)兒,出生體重僅550克

藝術(shù)要聞

趙麗穎再傳喜訊,獲央視點(diǎn)贊!網(wǎng)友:她的底氣,藏不住了

旅游要聞

2026上?!ち参穆眉文耆A之“邀春山”專場(chǎng)推介會(huì)即將啟幕

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

無障礙瀏覽 進(jìn)入關(guān)懷版