網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

我們壓根不處于AI泡沫之中

2026-03-17 08:37:56　來源: 柳胖胖

北京舉報(bào)

分享至

帶來一篇Ben Thompson最新巨作 Agents Over Bubbles ，可以翻作超越泡沫的智能體？

重要的是智能體，而非泡沫。

而關(guān)于所謂的智能體，agents，到底如何發(fā)展到今天，本文做出了系統(tǒng)性的回顧。

在國(guó)內(nèi)處于龍蝦狂熱的當(dāng)下，這可以幫助我們看清楚，AI的進(jìn)步究竟在哪里，以及，我們到底如何從中受益。

看完全文讓我最驚訝的是，理性如BEN，從以前認(rèn)為AI有泡沫、但良性的泡沫有一定好處，現(xiàn)在轉(zhuǎn)而認(rèn)為：我們可能完全不處于AI泡沫之中了。

文章分4部分：

一、LLM 的范式LLM Paradigms

二、Agency需求的降低The Decreased Need for Agency

三、企業(yè)經(jīng)濟(jì)的必然法則Enterprise Economic Imperatives

四、Agents與 AI 價(jià)值鏈Agents and the AI Value Chain

全文總結(jié)：如今，AI已經(jīng)正式進(jìn)入了agents 驅(qū)動(dòng)的新階段，它肯定不是一個(gè)即將破裂的泡沫。LLM 的演進(jìn)分成三次躍遷：ChatGPT 讓大眾看到模型能力，o1 通過 reasoning 提高可靠性，而 Claude Code / Codex 代表的 agents，則進(jìn)一步通過harness + tools + 自動(dòng)驗(yàn)證，把模型從“會(huì)聊天”推進(jìn)到“能完成任務(wù)”。正因如此，算力需求不再只是訓(xùn)練或普通推理，而是被 agent 工作流大幅放大，所以大型云廠商的 capex 并非盲目擴(kuò)張，而是對(duì)真實(shí)需求的回應(yīng)。AI 的主要商業(yè)化場(chǎng)景，會(huì)優(yōu)先落在企業(yè)端，而不是消費(fèi)端，因?yàn)槠髽I(yè)更愿意為生產(chǎn)力買單。進(jìn)一步的，真正有利潤(rùn)的環(huán)節(jié)，未必只是 model 本身，而是model 與 harness 的集成，而這意味著 Anthropic、OpenAI 這類能夠做出強(qiáng) agent 產(chǎn)品的公司，未必因?yàn)椤澳Ｐ蜕唐坊?，而被迅速壓縮利潤(rùn)，反而可以攫取更大的利潤(rùn)份額。

以下是正文：

在關(guān)于 AI 未來的預(yù)測(cè)方面，存在著一個(gè)奇怪的悖論：一方面，你不想成為忽視最可怕的末日情景的人，畢竟誰會(huì)希望自己最終被證明是愚蠢的樂觀主義者呢？

與此同時(shí)，也存在著一種壓力，讓人不得不相信，我們正處于泡沫之中，所有的這些炒作和各種花銷，都終將走向破產(chǎn)。

一直以來，我都認(rèn)為，我們處于泡沫之中，但是我同樣認(rèn)為泡沫也有好處（the benefits of bubbles）。

然而，現(xiàn)在的我，得出了一個(gè)不同的結(jié)論:我不認(rèn)為我們正處于泡沫之中。

不過同樣諷刺的是，我的這種想法，尤其是想法的轉(zhuǎn)變，也許正是我們身處泡沫之中的最有力證據(jù)。

一、LLM 的范式 LLM Paradigms

在過去幾周里，首先是在 Nvidia 財(cái)報(bào)的背景下，然后是上周在 Oracle 財(cái)報(bào)的背景下，我談到了三個(gè) LLM 拐點(diǎn)（inflection point）。

1、第一個(gè) LLM 的拐點(diǎn)，是 2022 年 11 月 ChatGPT 的發(fā)布，這幾乎不需要解釋。

是的，基于 transformer 的大型語言模型在 2017 年就被引入了，其能力令人印象深刻且在不斷增長(zhǎng)，但卻被嚴(yán)重低估了。

在2022年的當(dāng)時(shí)來看，這是一項(xiàng)令人難以置信的新技術(shù)，但卻極度缺乏產(chǎn)品應(yīng)用和創(chuàng)業(yè)活力（product applications and startup energy）。

不用說，幾周之后，這種情況就被徹底顛覆了。

ChatGPT 當(dāng)然讓世界見識(shí)到了 LLM 的能力，但最初的版本有兩個(gè)缺陷一直留在許多人的腦海中，尤其是那些堅(jiān)信我們正處于泡沫之中的人。

第一個(gè)缺陷，是 LLM 經(jīng)常出錯(cuò)，更糟糕的是，當(dāng)它不知道答案時(shí)，還會(huì)產(chǎn)生幻覺。

這讓 LLM 感覺像某種魔術(shù)表演：管用的時(shí)候令人驚嘆，但卻不是你可以依賴的東西。

第二個(gè)缺陷與第一個(gè)相關(guān)：即使處于那種有缺陷的狀態(tài)，LLM 也極其有用，但你需要知道什么時(shí)候用，用它們來做什么，并且你需要主動(dòng)地管理錯(cuò)誤，并驗(yàn)證輸出，以防它產(chǎn)生幻覺。

2、第二個(gè) LLM 拐點(diǎn)，是 2024 年 9 月 OpenAI 的 o1 模型的發(fā)布。

到那時(shí)，LLM 已經(jīng)取得了巨大的進(jìn)步，這既歸功于新的基礎(chǔ)模型，也因?yàn)楹笥?xùn)練的持續(xù)改進(jìn)。

這意味著，在 ChatGPT 或 Claude 中，構(gòu)成答案的 token 流，現(xiàn)在更有可能是正確的，并且產(chǎn)生幻覺的概率有所降低。

然而，o1 的不同之處在于，它在將答案交付給你之前，會(huì)對(duì)其進(jìn)行推理驗(yàn)證。

傳統(tǒng) LLM ，面臨的巨大挑戰(zhàn)在于它們具有路徑依賴性（path-dependent），雖然它們可以將難題作為一個(gè)整體來考慮，但一旦它們致力于某個(gè)特定的猜測(cè)，它們就會(huì)被鎖定，并注定會(huì)失敗。

這是所謂“自回歸大型語言模型”的一個(gè)根本弱點(diǎn)，而迄今為止，所有的模型都屬于這一類。

然而，推理模型會(huì)進(jìn)行自我評(píng)估（self-evaluate）：它們會(huì)推導(dǎo)出一個(gè)答案，然后思考該答案是否正確，或者它們是否應(yīng)該考慮其他替代方案。

用我上面指出的弱點(diǎn)來說，它們?cè)诠芾礤e(cuò)誤方面，具有內(nèi)部的主動(dòng)性，減輕了用戶持續(xù)主動(dòng)引導(dǎo) LLM 的負(fù)擔(dān)，并且結(jié)果非常顯著。

從我的角度來看，如果說 ChatGPT 的卓越之處在于使 LLM 變得更具可讀性和實(shí)用性，那么 o1 的卓越之處就在于使 LLM 變得更加可靠和不可或缺。

3、第三個(gè)拐點(diǎn)，Anthropic 于 2025 年 11 月 24 日發(fā)布了 Opus 4.5。

在當(dāng)時(shí)，這并沒有引起太大的轟動(dòng)。

然后，在 12 月的某個(gè)時(shí)候，搭載 Opus 4.5 的 Claude Code ，似乎突然能夠完成以前根本不可能做到的事情。

OpenAI 大約在同一時(shí)間（12 月 18 日），發(fā)布了 GPT-5.2-Codex，它也具備類似的能力。

人們談?wù)揳gents，已經(jīng)有一段時(shí)間了。然而突然之間，Claude 和 Codex 都在切實(shí)地完成具體任務(wù)，，并且它們做得很正確，其中一些任務(wù)需要耗費(fèi)數(shù)小時(shí)。

不過，關(guān)于 Opus 4.5 模型發(fā)布日期的那一點(diǎn)很有趣。

關(guān)于 agentic 工作負(fù)載的關(guān)鍵在于，它們不僅僅關(guān)乎模型，也不僅僅像 o1 那樣遞歸地使用模型。相反，使 agentic 工作負(fù)載發(fā)揮作用的一個(gè)關(guān)鍵組成部分是“harness”，也就是實(shí)際控制某個(gè)模型的軟件（the software that actually controls the model）。

換句話說，Claude Code 和 OpenAI 的 Codex ，實(shí)際上將用戶從模型中“分離”了出來：你只需向 agent 發(fā)出指令，而 agent 則實(shí)際去指揮模型。

關(guān)鍵在于，agent 還可以使用其他確定性工具（deterministic tools），這意味著它同樣可以驗(yàn)證自己的結(jié)果。

將其置于coding的背景下，在前面跳的第一種范式中，LLM 會(huì)生成代碼，在第二種范式中，LLM 會(huì)思考它正在生成的代碼，并朝著更好的答案進(jìn)行迭代。

而在目前的第三種范式中，agent 會(huì)指揮模型生成代碼，然后檢查該代碼是否真的有效，如果無效則重試。

這一切，都不需要用戶的介入。

換句話說，最初 ChatGPT 帶來的許多最大缺陷，已經(jīng)被大幅削弱，至少對(duì)于像編程這樣，可驗(yàn)證的用例而言，就是如此。

LLM 第一次就答對(duì)的可能性，要大得多，它們會(huì)對(duì)結(jié)果進(jìn)行推理以提高成功率，而現(xiàn)在 agents 會(huì)主動(dòng)驗(yàn)證結(jié)果，無需人類參與其中。

此時(shí)，這就只剩下一個(gè)缺陷了：那就是弄清楚到底該用這些東西來做什么。

二、Agency需求的降低 The Decreased Need for Agency

然而，為什么整個(gè)行業(yè)會(huì)如此受限于算力？

以及，為什么大型云廠商在 capex 上的大規(guī)模投資是合理的？

第一種范式,在訓(xùn)練方面需要大量的算力，但是推理部分，也即實(shí)際回答一個(gè)問題，則是相對(duì)高效的，你只需將模型吐出的任何內(nèi)容，發(fā)送給用戶即可（所以我的理解就是基本沒有推理inference)。

第二種范式，急劇增加了推理所需的計(jì)算量，原因有兩點(diǎn)：首先，生成答案時(shí)，需要多得多的 tokens，因?yàn)槌舜鸢副旧碇?，所有的“推理reasoning”過程也都需要 tokens。

其次，推理reasoning，使模型變得更加有用這一事實(shí)，意味著它們被使用得更頻繁了，這本身就推動(dòng)了 token 使用量的增加。

然而，正是第三種范式，才真正打破了天平，證明了 capex 支出并非投機(jī)性投資，而是為了滿足遠(yuǎn)超供應(yīng)的需求而新增的投資。

首先，生成一個(gè)答案，通常需要多次調(diào)用推理模型reasoning model 。

其次，agent 本身也需要算力，并且這種計(jì)算——以及 agent 所使用的工具——由 CPU 來執(zhí)行，比由 GPU 來執(zhí)行更好。

第三，agents 代表了實(shí)用性上的又一次階躍函數(shù)式的增長(zhǎng)，這意味著它們將被使用得甚至比聊天機(jī)器人中的推理模型還要多。

第三點(diǎn)將如何體現(xiàn)，目前尚未得到充分認(rèn)識(shí)。畢竟，使用聊天機(jī)器人的人，遠(yuǎn)比使用 agents 的人多，而且我會(huì)說，大多數(shù)人使用聊天機(jī)器人的頻率，還沒有達(dá)到他們本應(yīng)該達(dá)到的程度！

這一直是一個(gè)主動(dòng)性的問題（a question of agency）：要充分利用 AI，需要真正地發(fā)揮主動(dòng)性去使用 AI。

大型語言模型是智能的，但它們沒有目標(biāo)、價(jià)值觀或驅(qū)動(dòng)力。它們是供人們使用的工具，供任何有意愿且有能力發(fā)揮主動(dòng)性去使用它們的人使用。

有多少應(yīng)用程序或服務(wù)，還沒有被開發(fā)出來，并不是因?yàn)槟硞€(gè)人無法想象或在腦海中創(chuàng)造它們，而是因?yàn)樗麄內(nèi)狈?shí)際交付它們所需的資源、團(tuán)隊(duì)或協(xié)調(diào)能力？

這觸及了 AI 影響世界的途徑，這種影響超越了客戶支持（customer support）中的成本節(jié)約，或是其他任何顯而易見的容易實(shí)現(xiàn)的目標(biāo)（低垂的果實(shí)low-hanging fruit）。

隨著大型語言模型在需要時(shí)，通過確定性計(jì)算（deterministic computing）進(jìn)行理解、并執(zhí)行復(fù)雜命令的能力不斷增強(qiáng)，指揮 AI 做事的獨(dú)立個(gè)體的潛在力量，也會(huì)隨之增強(qiáng)。

互聯(lián)網(wǎng)消除了媒體行業(yè)對(duì)復(fù)雜成本結(jié)構(gòu)的需求及其內(nèi)在的防御性，而 AI 有潛力在更多的行業(yè)中做到同樣的事情。

這就是真正能發(fā)揮作用的 agents有多么重要。

你能看到它們的到來，但當(dāng)它們真的來臨時(shí)，你仍然會(huì)感到驚訝，而且就像我們談?wù)撍信c AI 相關(guān)的事物時(shí)必須說的那樣，它們目前所呈現(xiàn)的形態(tài)，已經(jīng)是它們未來最差的樣子了。

然而，這一切對(duì)主動(dòng)性agency的影響，才是最深遠(yuǎn)的。

是的，你需要有主動(dòng)性，才能使用 agents。

是的，具備這種主動(dòng)性的人數(shù)，可能遠(yuǎn)遠(yuǎn)少于那些可能會(huì)使用聊天機(jī)器人的人數(shù)。

是的，你可以說，聊天機(jī)器人本身將成為 agent 經(jīng)理，但更關(guān)鍵的觀察在于，通過將人類從直接的模型管理中抽象出來，任何單個(gè)的人類都可以控制多個(gè) agents。

就計(jì)算能力、乃至經(jīng)濟(jì)影響而言，這意味著實(shí)際上，不需要那么多具備主動(dòng)性的人，就能極大地增加被積極用于創(chuàng)造具有重大經(jīng)濟(jì)影響的產(chǎn)品的算力。

換言之，agents 的崛起，不僅意味著對(duì)算力需求的急劇增加，也意味著需求顯現(xiàn)不再那么依賴于人類的大規(guī)模采用。

是的，AI 仍然需要主動(dòng)性，只是它不需要那么多人的主動(dòng)性，就能產(chǎn)生深遠(yuǎn)的影響。

三、企業(yè)經(jīng)濟(jì)的必然法則Enterprise Economic Imperatives

在最近的 MacBook Neo 發(fā)布之后，關(guān)注 Apple 的媒體緊緊抓住了華碩的首席財(cái)務(wù)官 Nick Wu 在該公司近期財(cái)報(bào)電話會(huì)議上的言論，他將這臺(tái)599 美元的電腦描述為“對(duì)整個(gè)市場(chǎng)的沖擊potential effects on that market”。

然而，同樣有趣的是，Wu 試圖淡化 Neo 對(duì)該市場(chǎng)的潛在影響：“事實(shí)上，我們?cè)缭谌ツ晗掳肽昃吐犝f了 MacBook Neo 即將出貨的消息。因此，我們做了一些內(nèi)部準(zhǔn)備。但該產(chǎn)品正式發(fā)布后，我們發(fā)現(xiàn)其規(guī)格存在一些局限。例如，內(nèi)存不可升級(jí)，而且只有 8GB 的內(nèi)存。因此這可能會(huì)限制某些應(yīng)用。所以我認(rèn)為， Apple 在定位這款產(chǎn)品時(shí)，可能更多地是關(guān)注于內(nèi)容消費(fèi)（content consumption）。這與主流筆記本電腦的使用場(chǎng)景有些不同，因?yàn)樵谶@種情況下，Neo 感覺更像是一臺(tái)平板電腦，畢竟平板電腦就是主要用于內(nèi)容消費(fèi)?！?/p>

這有點(diǎn)像是在找借口，考慮到 Neo 的處理器是多么強(qiáng)大，以及部分得益于 Apple 硬件和軟件的深度整合，Mac OS 在 8GB 內(nèi)存上運(yùn)行得是多么流暢。

與此同時(shí)，Wu 談及到的某些事實(shí)也是對(duì)的，那就是大多數(shù)消費(fèi)者，通常確實(shí)只是想消費(fèi)內(nèi)容。

但我想補(bǔ)充的是，這意味著他應(yīng)該更加擔(dān)心 Neo，而不是更少擔(dān)心。

你最喜歡的生產(chǎn)力應(yīng)用程序（productivity application），最終總是會(huì)轉(zhuǎn)向企業(yè)市場(chǎng)。

因?yàn)楣静旁敢鉃樯a(chǎn)力買單，畢竟他們才是真正為那些他們希望變得更具生產(chǎn)力的員工支付薪水的人。

有理由預(yù)計(jì)，這一點(diǎn)同樣適用于 AI。

至少在短期內(nèi)，AI 最具吸引力的消費(fèi)者應(yīng)用，是 Google 和 Meta 的廣告業(yè)務(wù)，它們與內(nèi)容消費(fèi)并存。

同時(shí)，OpenAI 認(rèn)為自己能將超過一小部分比例的消費(fèi)者，轉(zhuǎn)化為訂閱用戶的想法，其實(shí)一直都是不切實(shí)際的。

這既是為什么廣告模式不可或缺的原因，也是為什么這還不足以支付那么多支出的原因。

毫無疑問，大多數(shù)人并不想為 AI 付費(fèi)。

至于他們是否愿意足夠頻繁地使用它，以維持廣告模式的運(yùn)轉(zhuǎn)，也還有待觀察。

這也就是說，Anthropic 幾乎完全專注于企業(yè)市場(chǎng)的做法，是對(duì)的。

很多公司已經(jīng)表現(xiàn)出愿意為能讓員工提高生產(chǎn)力的軟件買單，而 AI 在這方面肯定符合要求。

然而，真正讓企業(yè)高管垂涎三尺的，不僅是 AI 會(huì)裁減工作崗位的前景，而且裁減崗位恰恰是因?yàn)檫@能讓整個(gè)公司更具生產(chǎn)力。

情況一直都是如此，即使在大公司里，也只有相對(duì)少數(shù)的人能真正取得突破，并以有意義的方式推動(dòng)公司向前發(fā)展。

然而，這種動(dòng)力需要通過一個(gè)由人類組成的龐大機(jī)構(gòu)進(jìn)行過濾，這些人在某些方向上加速了這種努力，在另一些方向上卻拖慢了它。

那個(gè)機(jī)構(gòu)，使得廣泛的影響成為可能，但它伴隨著巨大的協(xié)調(diào)成本。

然而，agents 將更強(qiáng)烈地向純粹的加速傾斜，讓那些創(chuàng)造價(jià)值的驅(qū)動(dòng)者更具影響力。

我贊同這樣一種觀點(diǎn)：最好的公司，會(huì)希望利用 AI 做更多的事情，而不僅僅是省錢。

然而，大型組織的現(xiàn)實(shí)情況是，AI 的積極影響，將不在于消滅工作崗位，而在于用 agents 替換掉組織機(jī)器中那些難以管理和激勵(lì)的“人類齒輪human cogs”。

Agents 不僅會(huì)按照指示做事，而且會(huì)不知疲倦、持續(xù)不斷地工作，直到任務(wù)完成。

這可能使得，我們并不處于泡沫之中的論點(diǎn)，變得更加令人信服：

1、LLM 的所有弱點(diǎn)，正在通過算力的指數(shù)級(jí)增長(zhǎng)得到解決；

2、能使需求暴漲的、需要有效利用 AI 的人類數(shù)量，正在減少。

3、使用 agents 帶來的經(jīng)濟(jì)回報(bào)，不僅對(duì)行業(yè)的底線bottom line有影響，也會(huì)推高天花板top line。

在這種背景下，每一家大型云廠商都表示，算力供不應(yīng)求，并且每一家大型云廠商都在面對(duì)股市懷疑的情況下，宣布了遠(yuǎn)超預(yù)期的 capex 計(jì)劃，這難道有什么好奇怪的嗎？

這也就是為什么，不應(yīng)該把即將到來的、歸咎于 AI 的一波裁員潮，僅僅看作是糾正新冠疫情時(shí)期過度招聘決定、或在多次緊縮后調(diào)整薪酬結(jié)構(gòu)的借口。

這些，其實(shí)都是事實(shí)！

與此同時(shí)，值得深思的是，公司之所以變得臃腫，是因?yàn)檫@在很長(zhǎng)一段時(shí)間里，招人一直是擴(kuò)張的唯一方式，而且很難知道協(xié)調(diào)成本的拖累和龐大的員工隊(duì)伍，所帶來的邊際收益遞減（diminishing returns ）在什么時(shí)候會(huì)超過邊緣員工帶來的好處。

不幸的是，你只有在越過那個(gè)點(diǎn)時(shí)，才會(huì)發(fā)現(xiàn)它，而且很難走回頭路。

然而，AI 不僅為消除這種臃腫，提供了上述借口，而且還將“適度規(guī)模的點(diǎn)“rightsize point”，顯著推向了規(guī)模小得多的員工隊(duì)伍。

越來越多的公司，不僅會(huì)懷疑他們?cè)谇?AI 時(shí)代是否雇傭了太多人，還會(huì)懷疑：他們?cè)诤?AI 時(shí)代，是否雇傭了太多人。

最具前瞻性和最能經(jīng)受未來考驗(yàn)的方法，可能將是多裁員而不是少裁員，這可以倒逼留下來的人別無選擇，只能利用 agents 來重建規(guī)模。

畢竟，如果他們不這樣做，那些從一開始就基于 AI 建立起來的、規(guī)模小得多的競(jìng)爭(zhēng)對(duì)手，很快就會(huì)以更低的成本結(jié)構(gòu)（smaller cost structures）和隨著時(shí)間推移結(jié)構(gòu)性增強(qiáng)的能力（more capabilities that will structurally increase over time），緊跟在他們身后（甚至超越？）。

情況，很可能會(huì)變得糟糕。

我不是在倡導(dǎo)這種結(jié)果，而是在分析為什么它很可能會(huì)發(fā)生。

這種經(jīng)濟(jì)上的必然性，將是無法抗拒的，并且隨著時(shí)間的推移，將刺激對(duì)算力更大的需求，這進(jìn)一步支持了現(xiàn)在不是泡沫的觀點(diǎn)

四、Agents與AI 價(jià)值鏈Agents and the AI Value Chain

另一個(gè)重要的泡沫問題是，關(guān)于 Anthropic 和 OpenAI 極高的估值。

當(dāng)然，也許這些東西都是真實(shí)的，但如果模型變成了一種商品（ commodity，就是模型能力成了大路貨），那還有利潤(rùn)可圖嗎？

Horace Dediu 在 Asymco 上提出了這些問題，并想知道 Apple 是否正在執(zhí)行企業(yè)史上最輝煌的舉措：

“這正是 Apple 的押注變得天才的地方。AI 模型商品化的速度，比任何人預(yù)測(cè)的都要快，軟件和硬件都有商品化的趨勢(shì)。保護(hù)壁壘是存在的，但它們與集成和分銷（integration and distribution）有關(guān)?！?/p>

“DeepSeek 花費(fèi) 600 萬美元，構(gòu)建了一個(gè)模型，就足以媲美耗資 1 億美元的系統(tǒng)。開源模型，現(xiàn)在為 80% 尋求 VC 融資的初創(chuàng)公司提供支持。”

“大公司正花費(fèi)數(shù)千億美元建立的護(hù)城河，正在蒸發(fā)?！?/p>

“Apple 比任何人都早明白這一點(diǎn)，因?yàn)樗鼪]有構(gòu)建自己的 AI 模型，而是以每年約 10 億美元的價(jià)格獲得了 Google 的 Gemini 授權(quán)。當(dāng)外包只需要 10 億美元時(shí)，為什么非要花費(fèi) 1000 億美元去建一座工廠？”

“如果明年，出現(xiàn)了更好的模型，Apple 只需更換供應(yīng)商即可……”

“Apple 并沒有錯(cuò)過 AI 革命，它只是押注贏家不會(huì)是那些構(gòu)建基礎(chǔ)設(shè)施的人。贏家將是那些擁有客戶的人，而在地球上沒有其他人擁有比它更好的客戶。”

我認(rèn)為，在前面提到的第一個(gè) LLM 范式期間，以上所有這些斷言，都是站得住腳的。

沒過多久，多個(gè)基礎(chǔ)模型在處理大多數(shù)人使用 LLM 的事務(wù)上，就已經(jīng)足夠優(yōu)秀了，比如，烹飪或基本的醫(yī)療建議，或是作為治療師或伴侶。

此外，有理由期望這種質(zhì)量的模型，很快就能在本地運(yùn)行。

然而，推理范式（reasoning paradigm），讓本地推理（local inference）的暢想，可能無法成立。

考慮到生成的 tokens 數(shù)量，推理模型不僅需要快速的算力，而且它們還需要呈指數(shù)級(jí)增長(zhǎng)的內(nèi)存，來容納大得多的上下文窗口，這是本地模型最大的局限。

Apple 制造出了令人驚嘆的芯片，其極具吸引力的統(tǒng)一內(nèi)存架構(gòu)，使其設(shè)備上的基礎(chǔ)推理（basic inference），比其他任何人的設(shè)備都更具合理性。

但在可預(yù)見的未來，也不存在任何一種情況能讓具有競(jìng)爭(zhēng)力的、哪怕是勉強(qiáng)能與云端模型競(jìng)爭(zhēng)的強(qiáng)大推理模型，在本地運(yùn)行（因?yàn)閮?nèi)存不夠）。

然而，最可能會(huì)對(duì) Dediu 的論點(diǎn)造成致命打擊的，是 agents。

具體來說，前面我提到，使 Opus 4.5 令人矚目的，并非模型發(fā)布本身，而是 Claude Code harness （實(shí)際控制某個(gè)模型的軟件）的變化，這使其突然變得極其有用。

這意味著，模型性能并非唯一重要的事情，模型與 harness 之間的整合，才是真正實(shí)現(xiàn) agent 差異化的地方。

在弄清楚 AI 行業(yè)未來的結(jié)構(gòu)，以及利潤(rùn)流向時(shí)，這是一件非常重要的事情，因?yàn)槔麧?rùn)會(huì)從價(jià)值鏈中被商品化的模塊化部分流出，并流向價(jià)值鏈中具有差異化（differentiated）的整合部分。

Apple 當(dāng)然是這方面最終極的例子，它的硬件并沒有商品化，因?yàn)樗桥c軟件整合在一起的，這就是為什么 Apple 能夠持續(xù)收取更高的價(jià)格，并攫取 PC 和智能手機(jī)領(lǐng)域幾乎全部的利潤(rùn)。

因此可以得出結(jié)論，如果 agents 需要模型與 harness 之間的整合，那么建立這種整合的公司——尤其是 Anthropic 和 OpenAI（Gemini 是一個(gè)強(qiáng)大的模型，但 Google 尚未交付令人信服的 harness）——實(shí)際上有望獲得比去年年底看起來要高得多的利潤(rùn)。

同理，那些認(rèn)為模型只能商品化的公司，可能會(huì)在交付具有競(jìng)爭(zhēng)力的產(chǎn)品時(shí)，陷入掙扎。

在這方面，煤礦里的金絲雀是微軟（用來預(yù)警“毒氣”）。

曾經(jīng)，Microsoft 自詡為整合的 AI 供應(yīng)商，在財(cái)報(bào)電話會(huì)議上吹噓其與 OpenAI 的深度整合，將帶來具有可持續(xù)差異化的基礎(chǔ)設(shè)施。

之后，OpenAI 險(xiǎn)些管理層大崩盤，而 Microsoft 隨即轉(zhuǎn)變了態(tài)度，越來越多地將模型作為商品來談?wù)?，并提出了一?xiàng)核心 AI 戰(zhàn)略，該戰(zhàn)略需要在模型周圍構(gòu)建基礎(chǔ)設(shè)施，而這些模型本身將是可互換的，并且從 Microsoft 的客戶那里被剝離出來。

然而，快進(jìn)到上周，當(dāng) Microsoft 透露他們將如何應(yīng)對(duì) AI 減少席位seats，帶來的潛在業(yè)務(wù)影響時(shí)（微軟的商業(yè)模式是seat-based business model），聲稱公司打算將 AI 捆綁到一個(gè)新的、更高級(jí)別的企業(yè)級(jí)產(chǎn)品 E7 中，其價(jià)格將是以前最頂級(jí)的 E5 的兩倍，即每個(gè)席位每月 99 美元。

這是一個(gè)巨大的漲幅，Microsoft 需要用真正能讓這些席位更具生產(chǎn)力的 AI，來證明其合理性，而他們隨這個(gè)新捆綁包推出的產(chǎn)品是 Copilot Cowork。

如果“Cowork”這個(gè)名字聽起來很耳熟，那是因?yàn)檫@基本上就是 Claude Cowork 的企業(yè)版，而 Claude Cowork 是該公司在今年早些時(shí)候發(fā)布的、圖形用戶界面化的 Claude Code 版本。

Microsoft 的版本，有一些重要的區(qū)別，包括后者在云端運(yùn)行，并基于你的組織數(shù)據(jù)，擁有隨之而來的所有權(quán)限和訪問策略。

然而，關(guān)鍵在于，Copilot Cowork——與 Copilot 聊天機(jī)器人不同——并非是不挑模型的。

Cowork 是一個(gè)agent，這意味著，它既需要一個(gè)模型，也需要一個(gè) harness，并且這是兩個(gè)被整合在一起的部分，而不是模塊化的組件。

這其中的影響是重大的。

Microsoft 承認(rèn)，至少在目前，要交付一個(gè)真正引人注目，且企業(yè)愿意為之買單的 agentic 產(chǎn)品，就意味著要放棄他們之前聲明的不挑模型的目標(biāo)。

進(jìn)一步而言，這就提出了一種可能性，即模型不是、也不會(huì)成為商品，因?yàn)?agents 所需要的不僅僅是模型，光靠模型是不夠的。

這無疑讓人對(duì) Apple 僅僅授權(quán) Gemini 并以新的 Siri 的形式自己構(gòu)建 harness 的決定，產(chǎn)生了疑問。

Microsoft 認(rèn)定，他們無法通過走那條路，來交付一款引人注目的產(chǎn)品。

那么，Apple 做了什么，來讓人相信他們能做得更好呢？

如果真要說的話，這家公司的可取之處在于 Dediu 最后得出的那一點(diǎn)：消費(fèi)者可能根本就不那么在乎 agents。

在這種情況下，Apple 做到“足夠好good enough”，就可以了。

但是，這對(duì)微軟的企業(yè)級(jí)客戶，是不夠的，這些客戶的要求更高，所以，微軟會(huì)意識(shí)到，它將不得不分給 Anthropic 更多的利潤(rùn)，哪怕它本不愿意。

然而，重要的是，如果 agents 正在使 Anthropic 和 OpenAI 成為價(jià)值鏈中的整合點(diǎn)（the point of integration in the value chain），那么認(rèn)為這些公司被高估、以及其他公司代表它兩在數(shù)據(jù)中心進(jìn)行的巨額投資是不合理的那種泡沫論點(diǎn)，可能就是不正確的。

我一直堅(jiān)信，只要每個(gè)人都在擔(dān)心泡沫，就不需要去擔(dān)心泡沫。

只有當(dāng)人們把謹(jǐn)慎拋諸腦后，并打包票說，這絕對(duì)不是泡沫的時(shí)候，我們才可能真正身處泡沫之中。

是的，我認(rèn)為 agents 的崛起，意味著我們并不在泡沫之中。

現(xiàn)在的capex是合理的，并且 Anthropic 和 OpenAI 看起來比以往任何時(shí)候都更有韌性。

也或者，當(dāng)我宣布沒有泡沫，就意味著有泡沫，那也就這樣好了，so be it！

全文完。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.