国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

是個公司都在用AI Agent,但大家真用明白了嗎| MEET2026圓桌論壇

0
分享至

編輯部 整理自 MEET2026
量子位 | 公眾號 QbitAI

“每個人每天使用最高頻的三個APP中有兩個是Agent時,才意味著AI Agent進入新發(fā)展階段?!?/p>

“一個好Agent的衡量指標,包括可控性、可解釋性以及持續(xù)穩(wěn)定執(zhí)行任務的能力?!?/p>

“多數Agent存在負毛利問題,完成任務的代價高于用戶支付意愿,這對創(chuàng)業(yè)者來說是巨大挑戰(zhàn)?!?/p>

在量子位MEET2026智能未來大會的圓桌環(huán)節(jié),三位來自產業(yè)一線的嘉賓圍繞AI Agent的革新進程展開深入討論。他們分別是:

  • 聯匯科技CEO兼首席科學家趙天成博士
  • 小宿科技聯合創(chuàng)始人兼CEO杜知恒先生
  • 螞蟻集團平臺體驗技術部負責人徐達峰先生

2025年普遍被視為“Agent元年”。從客服、理賠等相對標準化的場景開始,Agent已經完成了初步落地,并驗證了技術可行性與階段性價值。

但真正的難題才剛剛顯現——

如何讓Agent同時跑通技術、產品與商業(yè)三條曲線,形成可持續(xù)的正向閉環(huán),仍是擺在整個行業(yè)面前的共同挑戰(zhàn)。

而在這場圓桌討論中,三位嘉賓從產品形態(tài)、技術演進與商業(yè)現實等多個維度出發(fā),分享了他們對Agent下一程的判斷。

透過這些觀點,我們或可窺見Agent從技術概念走向規(guī)模應用的關鍵路徑,以及產業(yè)先行者們在探索中所面臨的思考與抉擇。



本次圓桌環(huán)節(jié)由量子位智庫首席分析師劉萌媛主持。在不改變原意的基礎上,本文對內容進行了編輯整理。希望能夠給你帶來更多的啟發(fā)與思考。

MEET2026智能未來大會是由量子位主辦的行業(yè)峰會,近30位產業(yè)代表與會討論。線下到場參會觀眾近1500人,線上直播觀眾350萬+,獲得了主流媒體的廣泛關注與報道。

話題要點
  • 目前在AI Agent及相關領域重點從事哪些工作?
  • 各自落地效果最好的案例是什么?
  • 真正好用的AI Agent產品應該關注哪些指標?
  • 未來還有哪些對于AI Agent發(fā)展比較關鍵的卡點?
  • AI Agent的下一步關鍵演進方向是什么?進入新階段的標志性節(jié)點是什么?

以下為圓桌對話全文:

圓桌實錄

量子位

無論是在前面各位嘉賓的演講中,還是在整個2025年的討論里,相信大家已經多次聽到“AI Agent”這一關鍵詞。

無論是技術迭代還是產品涌現,AI Agent確實屢屢讓人眼前一亮。今天,我們將從更加理性、務實的角度來探討:千行百業(yè)距離廣泛應用AI Agent究竟還有多遠?

為此,我們邀請到三位嘉賓,他們分別代表AI Agent產業(yè)鏈上不同領域的最前沿產品與技術,來為大家?guī)砬袑嵉姆窒怼?/p>

首先,請三位嘉賓簡要介紹一下自己,以及目前在AI Agent相關領域所從事的工作

趙天成

大家好,我是來自聯匯科技的趙天成。在過去的五年里,我們團隊一直在做的事情是:

第一,研發(fā)信號終端側的多模態(tài)模型;

第二,探索如何讓智能體從在虛擬世界做PPT、寫寫畫畫,走向物理世界,真正操控終端設備,也就是實現所謂的“物理智能體”

目前我們在兩個方向做了很多工作,一是致力于讓多模態(tài)智能體本地化運行,不完全依賴云端強大算力。例如,讓它在端側設備(如AI PC)上,甚至在飛機等無網絡環(huán)境中,也能高效處理海量多模態(tài)數據,并轉化為真正實用、能幫用戶解決實際問題的智能體。

更進一步,我們致力于將無人機、機器人、攝像頭等具備真正執(zhí)行能力的智能終端串聯起來,形成協(xié)同工作的智能體網絡。這是一個非常有意思的課題。目前大家熟悉的智能體,或許更多體現在處理工作流或特定查詢場景中。而我們探索的是更系統(tǒng)的物理聯動

舉個例子,一個智能攝像頭探測到火災,它可以自動通知另一個終端——比如一臺配備滅火裝置的機器狗。機器狗收到指令后前往現場撲滅火情,并在任務完成后返回基地,自動生成一份報告給管理員,說明“火災已發(fā)生并被撲滅,問題已解決”。

這樣一個從感知、決策、執(zhí)行到反饋的完整閉環(huán),能否通過智能體流暢地串聯與調度,從而實現智能體從數字世界走向物理世界的跨越?這正是我們團隊過去兩年來持續(xù)深耕的核心方向。



徐達峰

大家好,我是來自螞蟻平臺體驗技術團隊的徐達峰。我們目前主要聚焦在兩個方向:

一是重構軟件的研發(fā)方式。我們正在構建一套完整的智能研發(fā)體系——WeaveFox,其中包含WeaveFox-Coder、Vibe-Coding、Spec-Coding等模塊,并打造了面向工程體系的Coding-Agent基礎設施和軟件工程-Agent基礎設施。

我們的核心目標,不僅僅是“讓模型能夠寫代碼”,更是要將多模態(tài)生成代碼、任務自動拆解、工具鏈智能協(xié)同等能力,真正融入到生產環(huán)境中。我們致力于讓AI從輔助工具,轉變?yōu)檠邪l(fā)體系的原生能力,從而推動整個工程鏈路實現更高水平的自動化。

二是致力于將多智能體能力帶給大眾用戶

為此,我們推出了“螞蟻百寶箱”以及“百寶箱超級智能體”。我們的愿景是將其打造成一個“通用Agent平臺”——無需任何代碼依賴,也不要求使用者具備技術背景,真正做到開箱即用。用戶只需用自然語言描述需求,就能輕松構建并發(fā)布屬于自己的智能體應用。

無論是內容創(chuàng)作類的需求,如生成文案、制作PPT、撰寫報告、設計網頁,還是通過多Agent協(xié)作完成更復雜的工作流任務,都可以通過這個平臺實現。我們的目標,是將AI智能體從高門檻的“專業(yè)工具”,轉變?yōu)槿巳硕寄苡闷饋淼摹肮ぞ呦洹薄?/p>



杜知恒

我是杜知恒,小宿科技打造的是面向Agent的一站式基礎設施平臺

我們認為,其中尤為重要的一個產品是為Agent設計的搜索引擎。這里我們也呼應一下螞蟻的觀點:我們相信,優(yōu)秀的Agent能夠勝任人類可以完成的工作。

過去,搜索引擎和信息獲取一直是人們工作、學習乃至日常生活中最主要的信息獲取工具。我們提供的正是一個多語言、全球化的搜索引擎工具,專門服務于Agent。

除了搜索能力,我們還提供模型服務、AI沙盒等多樣化的Agent工具集,致力于為大家打造一站式的Agent Infra平臺。



各自落地效果最好的案例是什么?

量子位

在三位做的Agent相關的產品里面,效果最好的Agent落地案例是什么?能否結合具體數據和觀眾分享一下,讓大家對Agent落地價值有更直觀的感受?

趙天成

今年有兩個點帶來的ROI(投資回報率)提升還是非常明顯的。

第一個是有了多模態(tài)。今年的確是VLM(視覺語言大模型)大幅度成熟的一年,之前大家用ChatGPT、GPT-4比較多,今年GPT-4o、Gemini 3這些新出來的多模態(tài)模型對于圖像和視頻的理解能力其實有質的飛躍。

有了這個能力之后,我們的智能體可以算是打開了新的窗戶。之前Agent只能處理文本,要做圖片任務還需要一段描述,再給到模型去理解執(zhí)行,現在有了端到端模型之后,直接給視頻、給掃描件、給一張圖片甚至混合在一起都可以直接做(任務),很多以前不敢想的場景瞬間打開。

我們在多模態(tài)領域扎根很久,之前就在做很多探索,今年的確感受到建模本身的提升,多模態(tài)能力可以讓我們的智能體即使在數字空間場景中,也可以做很多以前不可能做到的事情。

第二個是有了執(zhí)行智能體。以前的AI即使可以理解視頻、理解圖像,也只能給你一個提醒“這邊發(fā)生事故趕快修復”、“這邊有問題趕快派人去吧”,現在有了執(zhí)行智能體,無論是操控機械臂還是執(zhí)行其他操作,現場就能直接解決問題。

這對于用戶來說,投資回報率和價值完全不在一個量級,比如以前一個終端最多付一千塊錢,有了智能執(zhí)行端之后愿意付十萬塊錢,這是一百倍的本身價值的提升。

智能體核心邏輯在于結果即服務,提供的是一個結果,這個結果的價值定義了產品有多大的能力邊界,一個是幫你看著,提醒你趕快滅火吧;第二個是直接告訴你已經幫你把火撲滅了,比人撲的更快一些,這個對客戶來說價值是100倍的提升,這也是為什么我們非常篤定地相信多模態(tài)+執(zhí)行是智能體在后續(xù)發(fā)展中非常重要的板塊和體現。

杜知恒

過去這一年Agent進化還是很明顯的,從大家只會用Chatbot到真正開始用AI做各種各樣的任務、工作,包括陪伴式的娛樂、學習。

我觀察到在這幾個場景中,Agent能做越來越多智能化的工作。

第一個就是剛才說的做PPT、寫產品文檔,包括Coding,在核心工作流中Agent開始能交付實習生水平的結果,這是過去一年中Agent領域非常明顯的進步和進化。

另外可以看到,各種各樣的垂類軟件正在越來越多地采用AI技術,無論是客服系統(tǒng)、數據平臺還是其他各類軟件工具。我的觀察是,上一代SaaS公司正在快速引入AI能力,這顯著提升了它們服務客戶的效率與質量。

徐達峰

前面老師提到智能客服,還有端到端多模態(tài)+執(zhí)行,我補充一個Coding Agent能力方面的個人觀察。

Coding Agent已經從寫一段代碼進化為跑一段流程。在WeaveFox的實踐中,Agent能看懂設計稿、理解上下文和組件規(guī)范,然后自動生成可上線代碼。過去通常需要工程師在IDE中花半天時間調試,現在Agent幾十秒就能跑完。而且這是在多個規(guī)模化項目里,我們穩(wěn)定看到了3~5倍的效率提升。



這說明,只要工具鏈和上下文足夠清晰,Agent的能力是可以被“工程化復制”的

真正好用的AI Agent產品應該關注哪些指標?

量子位

今天邀請到的三位嘉賓在AI Agent里面處于不同的生態(tài)位,小宿處于基礎設施層,另外兩位老師偏向于產品層,請各位在不同的生態(tài)位上定義真的好用、或者有價值的AI Agent產品,你們覺得現在更應該關注哪些指標?有哪些指標大家沒有關注?下一步應該在哪些方面投入更多技術和精力呢?

杜知恒

我的觀點還是一樣的,(如果AI)能更像人一樣,交付一個從高中生到大學生到博士生能交付的結果,這就是好場景。

企業(yè)愿意為這類AI支付更高成本,背后的邏輯很明確:過去,大家把AI當作普通軟件看待,關注點局限在軟件訂閱費的高低;而現在,大家會將其價值與實習生、全職員工的人力價值做對比。

即便目前存在堆砌Token完成任務的爭議,包括我們公司在內,許多企業(yè)在高頻使用AI進行代碼編寫(Coding)、撰寫產品需求文檔(PRD)、搭建各類工作流以優(yōu)化效率的過程中,通過AI節(jié)省的人工成本,也遠遠超過了在Token上投入的費用,即使Claude Code很貴。

我覺得我們內部對Agent可用性最主要的評判標準,就是它能不能在特定場景交付一個相對完整的結果

Agent在中國被叫智能體,但其實我覺得“代理人”這個翻譯是更好的,一個Agent不能給你交付結果,你肯定不會花錢雇他,包括Coding這些場景在內,AI越來越能夠真正交付結果。

現在Coding還有抽卡的情況,但即使是抽卡抽三次性價比依然很高。

趙天成

我們從時間上來看,有兩方面是整個業(yè)界要慢慢接受和改變的,因為智能體跟以前信息化系統(tǒng)和純粹軟件還是不太一樣的。

第一個是之前很多人說做AI原生的Agent,我們發(fā)現以前軟件系統(tǒng)有很多UI式、表單式結構,很多時候AI就是把表單的某些環(huán)節(jié)換成模型,這是比較方便的方式,但也有很多時候換湯不換藥,還是原來的工作流做的事情。

其實可以把一個環(huán)節(jié)徹底用Agent代替,這時候可能會有一些更加創(chuàng)新型的產品并落地應用,這樣才真正能把智能體的優(yōu)勢發(fā)揮出來,而不是受限于很條條框框的地方,只能做以前一些環(huán)節(jié)的替代。大家(才)會接受智能體可以真正替代一個流程一個環(huán)節(jié),真正用AI的方式做這個事情。

第二個是Agent本身是可以進化的,在以往的AI應用中,包括我們的不少甲方客戶在內,很多人會陷入一種認知誤區(qū):認為采購AI本質上就是采購一套算法,并且對算法的準確率、召回率有明確要求,若初始階段無法達到既定指標,就不會驗收。

但實際上,Agent的價值體現在實際應用過程中,Context(上下文信息)會不斷豐富,它自身具備記憶能力,再結合用戶給出的反饋,會逐漸熟悉用戶的業(yè)務流程,最終真正幫用戶解決實際問題。然而當前許多場景下,用戶并不能接受這種漸進式優(yōu)化的模式,他們往往期望一步到位,要求AI在初始階段就達到95%的準確率。

這就陷入了“雞生蛋還是蛋生雞”的矛盾問題。如果用戶不使用AI、不提供反饋、不補充Context,不給AI學習和適應的機會,AI自然無法達到理想的使用效果;可用戶又因AI初始效果未達預期而不愿啟用,形成了惡性循環(huán)。

不過這種情況也在逐漸改變,越來越多人也正在接受,說明大家用豆包、用GPT,已經習慣了越聊越聰明的交互模式,慢慢(把它)變成自己想要的數字員工。

這個可進化性也是我們內部衡量智能體的非常重要的指標。假如一個智能體做出來就是這樣了,你再跟它聊它都不會有變化,那就不是好的智能體,如果通過一天、一周、一個月使用變得更加個性化了,就是好的智能體。



量子位

我想再追問一下趙總,您剛剛提到用Agent徹底替代某一部分工作流,或者某一部分工作場景,那讓你暢想一下在未來6個月或者一年之內,您覺得會有哪些行業(yè)或者場景率先有可能被徹底改變工作流呢?

趙天成

假如是6個月的時間,在那些失敗結果沒有那么災難性的地方,相關問題或許可以得到徹底解決。(這些場景的容錯空間相對較大),AI一次沒做好,大不了再做一次,而且如果做三次的成本,比我自己干整個過程的成本還是低很多,那這類工作就可以被替換掉。

量子位

也就是說結果不夠致命,有一點容錯空間的任務基本可以實現AI替代人。

那么徐總,螞蟻目前在做的這些產品,包括您剛才提到的Coding Agent,以及面向群眾的產品,從您的角度來說,一款AI Agent產品最值得關注的指標是什么呢?

徐達峰

在我看來,判斷一款Agent是否優(yōu)秀,可以從以下幾個角度界定標準,比如可控性、可解釋性,乃至于穩(wěn)定性,這是基礎要求,在此就不贅述了。

需要明確的是,Agent一定是基于某一類特定任務去設計的,很多場景里,任務本身就是開放型問題、還存在各種例外情況,模型也不可能100%完美解決所有問題。所以我認為優(yōu)秀的標準是看Agent產品有沒有設計人機協(xié)作的流程

企業(yè)真正需要的不是“永不犯錯”,而是犯錯時能暴露不確定性,是否具有回滾的能力,能不能回溯回去找到問題。另外在這個過程中,在出現問題后,能順暢地將任務交由人工接管。

也就是說,它要像一位可靠的同事,而不是像一名(缺乏協(xié)作性的)天才小學生。如果沒有如上指標,即便效果再驚艷,也很難真正落地,我覺得這是一個好的Agent的標準指標。

量子位

如果把剛剛給趙總的問題再拋給您,目前您涉及的所有用戶場景里,未來6個月,您覺得哪一個是被改寫最徹底的?

徐達峰

徹底不敢談。我認為軟件工程可能仍會面臨較大的沖擊和變革。

這主要是因為其工具鏈相對成熟,有上一代數字基建作為基礎,且任務本身偏向結構化。

同時,進一步自動化的收益非常高。這些因素共同作用,將推動整個流程越來越自動化,通過輔助編碼和自動化流程,研發(fā)團隊也會更容易接受。因此,我認為是軟件工程。

量子位

我們把這個問題換一個方向問杜總,您作為基礎設施層的代表,您認為基礎設施層究竟是如何影響不同AI Agent產品最終呈現的任務水平呢?能否結合小宿或其他具體案例,為我們解析一下具體的影響鏈路?

杜知恒

其實我們很難直接影響到Agent本身,更多是客戶基于自身場景對基礎設施提出更高要求,我們去響應和滿足。

回到搜索本身,從ToC時代到ToAgent時代,三十年來它的核心標準——相關性、權威性、時效性,本質上沒有改變。變化的是這些標準的重要程度。

過去,用戶搜索時前三條結果必須吸引點擊,所以相關性是最重要的指標。(但僅有相關性還不夠)即使內容相關但質量很差,排到前面用戶接受的概率,也比展示不相關信息要低得多。

但對于AI而言,調用搜索的核心原因在于消除信息幻覺與獲取時效內容。

對AI Agent來說,搜索的首要要求是權威性——信息必須準確、全面。即便在前十條結果中,哪怕極端情況下有兩條不相關,也遠比“十條看似相關、卻缺乏精準性和時效性的信息”要好,后者帶來的后果反而更加災難性。

未來還有哪些對于AI Agent發(fā)展比較關鍵的卡點?

量子位

我們剛剛幾個問題都聊的是Agent今天有怎么樣的成就和價值,那我們現在從批判的角度聊一聊。

首先想問一下,從各位的角度來看,除了現在常說的推理大模型,或者語言大模型,還有哪些對于AI Agent未來發(fā)展比較關鍵的卡點?

既可以是技術方面,也可以是生態(tài)運營方面的,不知道各位是怎么看待這個問題的?

趙天成

我最近比較關注的是智能體的雙腦架構

剛才提到的代碼生成這些創(chuàng)新都是用大語言模型做快速的處理,但是到我們這種物理場景之后,有時候你逃不掉,必須做雙腦架構。

什么叫雙腦?比如大語言模型給出一個指令,說無人機幾點幾分到這個地方去,但是在飛行過程中怎么飛?假如還是依賴云端語言模型思考的話,這個飛機干脆不要飛了,每飛5米就要想一想再飛一下,不太現實。

所以必須在端側要有快速的、類似于小腦的模型做飛行這一塊的執(zhí)行,這個就跟常規(guī)的MCP模式還不太一樣,以往云端模型調用工具,可能只是完成一次搜索、查詢或簡單指令下發(fā);但在雙腦架構里,云端大腦調用的不是普通工具,而是要驅動端側小腦模型,讓它把飛機飛過去。

這其實和目前主流智能體架構有區(qū)別,跟學術界研究的問題也不太一樣。這里面得有一個框架,方便把各種小腦和大腦集成在一起,真正形成一個指揮官和類似于行動單元的組合的形態(tài)。

這個是我們近期一直在看的點,因為現在的確碰到了這樣的現實問題,而且需要解決這些問題。

徐達峰

我可以補充一個企業(yè)視角下的觀點,Agent如果要在企業(yè)中落地,可能還會有一些挑戰(zhàn)。尤其是大規(guī)模用在企業(yè)端時,首當其沖的可能是會面臨訪問核心資產數據,以及隱私和安全審計問題。

怎么樣能夠讓這樣的Agent可以被安全地運行?它訪問數據是否有權限?能不能被審計?這些都是關鍵命題。

以往很多流程設計更多是針對常規(guī)系統(tǒng)和人類操作場景設計的,很少有為Agent設計的,這是很關鍵的基礎設施的缺漏。這樣的安全基礎設施建立起來之后,才可能會為Agent大規(guī)模落地鋪好前提。

面向Agent的設計,很可能是權限體系的重新設計和重塑。



杜知恒

我也說一個非常現實的問題,我們看Agent,特別是ToC的Agent最大的挑戰(zhàn)就是成本和ROI的問題。

因為即使當下的Agent可以幫你完成一些任務,但其實它完成任務所付出的代價和用戶愿意付的成本還是有一個很明顯的差距,目前市場上絕大多數的Agent都是以負毛利在運營,這在長期看來是一個很大的挑戰(zhàn),因為你很難在一個負毛利商業(yè)模式下做大規(guī)模的用戶滲透。

除非像螞蟻、字節(jié)這樣的巨頭,可以為獲取客戶長期承擔非常大規(guī)模的虧損,這個對于大部分的Agent創(chuàng)業(yè)者來說可能也是一個挑戰(zhàn)。所以核心問題就是怎么能把商業(yè)模式跑通,能夠把用掉的Token和工具的錢賺回來?

對于一個基礎設施提供方來說,對客戶健康度的判斷很重要,如果我的客戶都很賺錢,那我大概率收取的價格是比較合理且可持續(xù)的,如果所有人都在虧錢,或者說大家都是期待下一輪的融資再來付今天用的基礎設施的錢,(那么整個生態(tài)的健康度就會存疑),對于我們來說也非常關心這個問題。

量子位

有關產品線的ROI,也想再問一下徐總,您剛剛提到咱們有做一些面向大眾普惠型的產品,像剛剛提到收費方面的問題,會不會從您的角度來看,為了讓大眾使用AI Agent的產品,除了技術上要達成一些目標,是不是還有其他的要素也需要注意的?

徐達峰

說一點個人的粗淺判斷。

首先,使用門檻在產品設計上必須足夠低,不能預設用戶具備專業(yè)知識背景,更不能假定他們本身就懂代碼?,F實中,這樣的前提不太可能成立。

其次,更高頻的使用場景,可能集中在文案、PPT等內容創(chuàng)作上,其本質是信息的聚合、創(chuàng)作過程的協(xié)助,以及后續(xù)內容排版等工作。這類場景天然更適合大眾用戶。

此外,還會出現許多新的特色玩法。比如螞蟻最近發(fā)布的“靈光”產品,就是一款很有意思的App,用戶可以用它制作小游戲、小應用,實用性很強。大致會是這類產品設計方向。

Agent的下一步關鍵演進方向是什么?

量子位

眾所周知,2025年已被視為AI Agent的元年。那么,元年之后下一個關鍵的演進方向是什么?剛才趙總提到了“雙端”和“多模態(tài)”,我們想請各位具體展望一下,對于Agent而言,下一步的關鍵方向是什么?

趙天成

雖然2025年被稱為“智能體元年”,但可能現實生活中還沒有那么多智能體。今年更像是iPhone 1的階段,距離真正成熟、普及的iPhone 4,還有很多要做的事情

就我個人在C端的使用體驗而言,日??赡軙靡粋€類似豆包的智能體,來替代部分搜索類工作,我覺得已經達到了“可用”的水平。但如果是下一輪融資的PPT,讓智能體來完成,即便是現在最好的智能體也做不到,這仍然需要我自己完成大量策略層面的思考,才能有比較好的結果。

所以在我看來,即使是目前定義已經相當成熟的智能體,在可靠性和實際效果上,依然有大量提升空間。

這種提升可能來自基礎模型能力的增強,也可能來自工程化能力的改進,也可能正如前面幾位所提到的,是多個層面的共同進步。

只有這些條件都到位,智能體才能真正把哪怕是“做PPT”這樣看似簡單的功能,提升到一個全民都能夠使用的水平——這是第一個方面。

第二個方面,是我們自己正在做的事情。我們一直相信,如果未來的AI只停留在替代一部分數字化工作,那一定是不夠的。它最終必須能夠替代部分藍領工作,走向現實世界,幫我們在物理世界干活。

(而要實現這一點),需要解決的問題依然非常多,包括前面多位老師提到的VLA、世界模型等,這些很可能都是不可或缺的組成部分,只有在它們被有效拼合之后,智能體才有可能真正走向物理世界。

在這里有兩個關鍵問題。第一,未來是否會一直是“大語言模型+其他模型”的組合形式?短期來看大概率如此,但從長期看并不一定——完全有可能被一種全新的架構徹底取代,這并非不可能。其實早兩年我們看待大語言模型時,也曾覺得這條路徑不太可能,但現在它已經成為主流。

第二,還是可靠性的問題。(當智能體進入物理世界),可靠性就變得更加嚴肅,不能說一下子把桌子砸了,那會是災難性的后果——在電腦里最多是誤刪文件,雖然也很嚴重,但相比之下還是要輕一些。

因此我認為,可靠性是所有智能體真正成為“每個人每天都在使用”的工具之前,必須解決的核心問題之一

杜知恒

我可能更多是從商業(yè)視角來看這個問題。對于2026年,我有幾個基本預期。

第一會是巨頭的大規(guī)模下場

無論是在B端還是C端,都會出現真正意義上的重投入,去爭奪DAU、ARR和核心客戶。2025年我們已經看到,超大規(guī)模投入主要來自字節(jié)的豆包,BAT其他幾家以及螞蟻更多是在下半年才逐漸發(fā)力。

我認為到明年,這一趨勢會變得非常清晰且激烈——所有Tier 1、Tier 2的傳統(tǒng)大型互聯網公司,都會在Agent方向上加大投入,圍繞“入口”展開競爭。

第二個預期也由此引出:在這種大規(guī)模投入的推動下,AI的整體滲透率會顯著提升

包括現場各位的手機和電腦,其AI含量也都會大幅上升。頭部Agent會開始真正進入二線、三線城市,被非專業(yè)用戶廣泛使用,甚至包括我們父母這一代人,也會逐步開始接受和使用。

因此,在我看來,Agent的大規(guī)模滲透將是2026年我比較期待的事情。



徐達峰

如果說未來一年的Agent的話,我可能會分幾個層次看。

第一層次是數據和算法,再上層是模型能力,可以看到,這兩層的技術能力呈現慢慢收斂的趨勢。第三層是Agent的框架,以及和系統(tǒng)交互和集成,無論是C端還是B端,都可以看到有更多的數據管控、權限管控、接入集成等多方面的實踐。

另外再往上延伸至產品側與行業(yè)應用層面。目前可以看到越來越明顯的趨勢。

除了能解決一些日常小工具類的任務,或者一些小型的效率場景,也可以看到有一些Killer App(現象級應用)出現。這類應用往往會錨定泛娛樂賽道,給用戶提供很多情緒價值,甚至慢慢App擴展到智能硬件上,這些是能看到的趨勢。

當然,也期待2026年這樣的趨勢逐步爆發(fā),可以給大家?guī)砀嗟腁I Agent在各行業(yè),各領域的體驗。

AI Agent進入新發(fā)展階段的標志節(jié)點

量子位

最后一個問題,再替公眾朋友們試圖向三位嘉賓詢問一下不確定中的確定性。

像剛剛提到,不管是從技術需要的基礎設施,還是未來的產品形態(tài),其實都有可能還有很多新的內容出現。

如果從三位嘉賓的角度來看,有沒有哪個節(jié)點是你們覺得如果看到了就意味著AI Agent已經進入新的發(fā)展階段了,不是像現在這樣只是從無到有,而是真正徹底改寫,而且普惠大眾的,有沒有哪個標志性的節(jié)點是各位現在最期待的?

杜知恒

可能是我媽媽開始用Manus開始畫PPT或者做一個什么事情的時候開始。

我覺得當前Agent的滲透率雖然看起來如火如荼,但是在三、四線城市和人們日常生活中還是一個超級低的狀態(tài)。

可能我自己的觀察指標是身邊的年長,或者非技術行業(yè)的人真正開始在用一些Agent,改變他的生活方式,或者提升他的生活體驗。

趙天成

我覺得就是當你每天最高頻使用的三個APP里面有兩個是Agent,到那天可能就差不多了。

徐達峰

我比較贊同趙天成老師的看法,如果你每天用的軟件都已經是Agent,那就已經產生質變了。

量子位

確實,今年我們看到很多Agent產品出現,無論是現場和線上的觀眾可以多去嘗試嘗試不斷出現的新的Agent產品,看這些產品能不能帶來一些新的收獲和新的價值。

再次感謝三位嘉賓今天來到圓桌,跟我們從一線視角聊一聊AI Agent還需要進步的地方,以及現在明確能夠帶給我們的價值,謝謝大家。

— 完 —

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
動真格了!新華社對王莉的舉報起作用,范某被停職,結果大快人心

動真格了!新華社對王莉的舉報起作用,范某被停職,結果大快人心

番茄娛樂加
2025-12-19 10:48:58
截胡國安失??!海港豪擲千萬簽新援,冬窗將簽4將,趁火打劫蓉城

截胡國安失敗!海港豪擲千萬簽新援,冬窗將簽4將,趁火打劫蓉城

體壇鑒春秋
2025-12-19 13:49:23
銀行老同學私下叮囑:2026年前,家里有存款的,務必做這3件事

銀行老同學私下叮囑:2026年前,家里有存款的,務必做這3件事

愛看劇的阿峰
2025-12-19 13:33:33
摩爾線程一周時間從941跌到了662,高位追漲的股民快崩潰了

摩爾線程一周時間從941跌到了662,高位追漲的股民快崩潰了

財經智多星
2025-12-19 13:09:05
徐達剛送走朱元璋就對夫人說:小兒子長得最不像我快讓他混出城去

徐達剛送走朱元璋就對夫人說:小兒子長得最不像我快讓他混出城去

忠于法紀
2025-12-18 19:59:13
泰軍宣布重創(chuàng)柬埔寨!繳獲大批中國造導彈!打到洪森父子投降?

泰軍宣布重創(chuàng)柬埔寨!繳獲大批中國造導彈!打到洪森父子投降?

深度報
2025-12-17 23:06:04
影子調查|一起家校矛盾,沖突到“裂開”

影子調查|一起家校矛盾,沖突到“裂開”

澎湃新聞
2025-12-19 08:02:28
海南封關,新加坡坐不住了

海南封關,新加坡坐不住了

智谷趨勢
2025-12-19 14:12:25
柬埔寨再次故技重施,眼看打不過泰國,隨即公布阿努廷的私人照片

柬埔寨再次故技重施,眼看打不過泰國,隨即公布阿努廷的私人照片

低調看天下
2025-12-19 12:11:34
懸念不大了?本賽季能拿MVP的球星,大概率這6位!里夫斯上榜

懸念不大了?本賽季能拿MVP的球星,大概率這6位!里夫斯上榜

籃球掃地僧
2025-12-19 15:52:26
哈佛大學驚人發(fā)現:世界上最健康長壽的運動,竟然簡單到一學就會

哈佛大學驚人發(fā)現:世界上最健康長壽的運動,竟然簡單到一學就會

原來仙女不講理
2025-12-17 17:16:38
在黎智英被定罪后,現在最慌的恐怕就是趙少康了。

在黎智英被定罪后,現在最慌的恐怕就是趙少康了。

南權先生
2025-12-18 16:52:40
93年存款4萬5,《老舅》讓觀眾看清國產劇假窮人有多離譜

93年存款4萬5,《老舅》讓觀眾看清國產劇假窮人有多離譜

娛樂圈十三太保
2025-12-17 16:32:22
國防部:與柬泰邊境沖突無關,不要主觀臆測

國防部:與柬泰邊境沖突無關,不要主觀臆測

觀察者網
2025-12-18 19:24:05
海南封關動了誰的奶酪?答案顯而易見:新加坡為代表的傳統(tǒng)中轉港

海南封關動了誰的奶酪?答案顯而易見:新加坡為代表的傳統(tǒng)中轉港

知法而形
2025-12-17 09:45:58
曼城王朝接近落幕,瓜迪奧拉離別倒計時開啟?

曼城王朝接近落幕,瓜迪奧拉離別倒計時開啟?

體壇周報
2025-12-19 02:15:15
南京博物院真是越扒越有!更多細節(jié)曝光,鑒定真?zhèn)蔚牟⒉皇菍<?>
    </a>
        <h3>
      <a href=鋭娛之樂
2025-12-19 13:43:59
A股:不必等待了!下周一,股市或將迎來大級別的變化?

A股:不必等待了!下周一,股市或將迎來大級別的變化?

財經大拿
2025-12-19 11:35:45
2026央視跨年晚會陣容曝光,網友:看完明星名單,廁所都不敢上了

2026央視跨年晚會陣容曝光,網友:看完明星名單,廁所都不敢上了

銀河史記
2025-12-19 12:16:50
越南談中越戰(zhàn)爭:一代人的犧牲和貢獻,換來的是40年的經濟滯后

越南談中越戰(zhàn)爭:一代人的犧牲和貢獻,換來的是40年的經濟滯后

小豫講故事
2025-12-19 06:00:04
2025-12-19 16:07:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11882文章數 176340關注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

剎車失靈時速115飆490公里司機:下車后渾身抖無法說話

頭條要聞

剎車失靈時速115飆490公里司機:下車后渾身抖無法說話

體育要聞

沒有塔圖姆,還有塔禿姆

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔心的事還是發(fā)生

財經要聞

非法集資911億!"金融大鱷"終審被判無期

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

本地
旅游
家居
公開課
軍事航空

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風骨

旅游要聞

云南麗江玉龍雪山迎冬日"日照金山"壯美景觀

家居要聞

高端私宅 理想隱居圣地

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

媒體:美方官宣史上對臺單筆最大軍售 野心藏不住了

無障礙瀏覽 進入關懷版