網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

AI最瘋狂的一周，該知道的8大共識(shí)都在這了

2026-04-26 21:57:35　來(lái)源: 智東西

北京舉報(bào)

分享至

智東西
作者 GenAICon 2026

短短8天，全球AI領(lǐng)域發(fā)生的重磅新聞，發(fā)布節(jié)奏之密、信息密度之高、資金體量之大、涉及玩家之廣，堪稱驚心動(dòng)魄。

從4月16日到24日，Anthropic Claude Opus 4.7、阿里Qwen3.6-Max、月之暗面Kimi K2.6、OpenAI ChatGPT Images 2.0、螞蟻Ling-2.6-flash、小米MiMo-V2.5-Pro、騰訊Hy3、OpenAI GPT-5.5、DeepSeek-V4等9款前沿模型扎堆發(fā)布。

同一時(shí)期，亞馬遜和谷歌相繼表示分別擬向Anthropic投資250億美元和400億美元，馬斯克SpaceX宣布擬以600億美元收購(gòu)AI編程獨(dú)角獸Cursor，DeepSeek啟動(dòng)外部融資的傳聞亦沸沸揚(yáng)揚(yáng)。

這一周大事串聯(lián)起來(lái)，映射出5個(gè)清晰的趨勢(shì)：

AI競(jìng)爭(zhēng)的核心戰(zhàn)場(chǎng)已從“聊天”轉(zhuǎn)向“干活”；
中美AI頭部梯隊(duì)基本形成，并在持續(xù)沖鋒；
中國(guó)AI在開源和成本效率上展現(xiàn)出獨(dú)特競(jìng)爭(zhēng)力；
算力基礎(chǔ)設(shè)施將成為影響AI競(jìng)賽節(jié)奏的關(guān)鍵因素；
“投資+競(jìng)爭(zhēng)+合作”的新型多重產(chǎn)業(yè)關(guān)系正在確立。

值此期間，4月21日至22日，2026中國(guó)生成式AI大會(huì)（北京站）圓滿舉行。

大會(huì)由智東西主辦、智猩猩聯(lián)合主辦，集結(jié)73位產(chǎn)學(xué)研投嘉賓，圍繞“奔赴AGI 重塑未來(lái)”主題，通過1場(chǎng)開幕式、3場(chǎng)專題論壇、6場(chǎng)技術(shù)研討會(huì)，全景式解析AI產(chǎn)業(yè)的產(chǎn)業(yè)脈絡(luò)、創(chuàng)新范式、Token經(jīng)濟(jì)與中國(guó)機(jī)會(huì)。

議題跨度很大，從大語(yǔ)言模型、多模態(tài)模型、世界模型、智能體、AI眼鏡等前沿模型與應(yīng)用，到數(shù)據(jù)、芯片、存儲(chǔ)、通信、云服務(wù)等基礎(chǔ)設(shè)施。

嘉賓們各抒己見，聊痛點(diǎn)，講預(yù)判，立足當(dāng)下，探討未來(lái)，分享內(nèi)容之豐富，非常挑戰(zhàn)大腦容量。

一個(gè)明確的共識(shí)是，國(guó)產(chǎn)AI戰(zhàn)場(chǎng)，已經(jīng)從模型層擴(kuò)展到生態(tài)層。

我們整理了開幕式和3場(chǎng)專題論壇的嘉賓們分享的重點(diǎn)信息，希望能對(duì)你有啟發(fā)。

1、大模型怎么變強(qiáng)？達(dá)到垂域?qū)＜宜街皇菚r(shí)間問題

2、小心養(yǎng)龍蝦、買token踩坑！聊聊大模型服務(wù)商不會(huì)告訴你的那些事

3、從Claude Code泄露代碼，總結(jié)6個(gè)反共識(shí)觀點(diǎn)

4、OpenClaw之后，智能體時(shí)代的中國(guó)機(jī)會(huì)在哪里？

5、世界模型的多重路徑：視頻生成、多模態(tài)原生統(tǒng)一、3D生成

6、Token消耗量爆發(fā)，國(guó)產(chǎn)AI基礎(chǔ)設(shè)施如何協(xié)同與進(jìn)化？

7、大模型下半場(chǎng)，競(jìng)爭(zhēng)焦點(diǎn)變成場(chǎng)景、數(shù)據(jù)、品味

8、從“龍蝦”、AI眼鏡到token管理，拆解國(guó)產(chǎn)智能體落地潮

一、大模型怎么變強(qiáng)？達(dá)到垂域?qū)＜宜街皇菚r(shí)間問題

在開幕式上，中國(guó)人民大學(xué)高瓴人工智能學(xué)院教授趙鑫的演講圍繞一個(gè)根本問題：大模型怎么變強(qiáng)？

首先，大尺寸模型仍具有顯著的性能優(yōu)勢(shì)，通過預(yù)測(cè)下一個(gè)詞的預(yù)訓(xùn)練范式能夠建立非常強(qiáng)的基礎(chǔ)能力；在后訓(xùn)練方面，一個(gè)重要方向是RLVR（基于結(jié)果監(jiān)督的強(qiáng)化學(xué)習(xí)），能針對(duì)垂直領(lǐng)域提升模型能力，提供了超越“預(yù)測(cè)下一個(gè)詞監(jiān)督訓(xùn)練”的另一條Scaling路線，為復(fù)雜智能體環(huán)境的訓(xùn)練構(gòu)建了可行的訓(xùn)練途徑。

接下來(lái)，讓大模型學(xué)會(huì)使用工具，如搜索信息、用編程解決問題等。代碼執(zhí)行增強(qiáng)的推理鏈，解題過程更簡(jiǎn)潔清晰，顯著提升推理效率。

隨著任務(wù)復(fù)雜度提升，模型需要進(jìn)行大量輪次的交互，上下文窗口的管理成為挑戰(zhàn)。有兩種思路：一是通過模型自主壓縮上下文，二是使用文件來(lái)作為上下文的外部存儲(chǔ)介質(zhì)。

在多模態(tài)深度搜索場(chǎng)景中，圖片、視頻等內(nèi)容若直接token化，會(huì)急劇膨脹上下文。一個(gè)解決方案是搜索結(jié)果先寫入本地文件系統(tǒng)，同時(shí)生成簡(jiǎn)短摘要進(jìn)入上下文窗口，后續(xù)需要時(shí)再按需加載，從而實(shí)現(xiàn)穩(wěn)定的百輪級(jí)多模態(tài)搜索。

▲趙鑫

給大模型一臺(tái)虛擬電腦（如終端/沙盒），可在非代碼領(lǐng)域激發(fā)通用能力。

大規(guī)模訓(xùn)練需要大量多樣化的環(huán)境，手動(dòng)創(chuàng)建幾萬(wàn)個(gè)環(huán)境不現(xiàn)實(shí)。近期研究顯著增加了智能體類數(shù)據(jù)的引入，比如DeepSeek-V3.2在強(qiáng)化學(xué)習(xí)中顯著增加構(gòu)造的智能體任務(wù)和配套環(huán)境，這些仿真環(huán)境旨在低成本高效合成大規(guī)模訓(xùn)練數(shù)據(jù)。

怎么模擬復(fù)雜環(huán)境呢？大多數(shù)智能體操作僅需輕量的沙盒，如果采用基于Docker環(huán)境訓(xùn)練代碼智能體的方法，可擴(kuò)展瓶頸會(huì)集中在Docker執(zhí)行層。此時(shí)可以用大模型代替Docker提供執(zhí)行反饋，來(lái)減少對(duì)真實(shí)Docker的創(chuàng)建需求。

當(dāng)前多智能體系統(tǒng)的核心挑戰(zhàn)在于長(zhǎng)程任務(wù)的穩(wěn)定性，這需要制定合適的工作流。

對(duì)此，高瓴人工智能學(xué)院開源的AiScientist系統(tǒng)，將決策層與專家層分開，編排器專注階段級(jí)決策，專家負(fù)責(zé)復(fù)雜子任務(wù)，讓文件成為智能體協(xié)調(diào)“總線”，從而實(shí)現(xiàn)復(fù)雜編排與協(xié)作。

最后，趙鑫教授分享了三點(diǎn)預(yù)判：

1、模型能力擴(kuò)展受限于人的認(rèn)知。目前可利用算力的方式仍然有限，突破需要新的擴(kuò)展范式。

2、大模型達(dá)到垂直領(lǐng)域?qū)＜宜街皇菚r(shí)間問題，廣義AGI仍然困難。類似“下一個(gè)token預(yù)測(cè)”和RLVR這樣的重要訓(xùn)練擴(kuò)展范式，估計(jì)還需要出現(xiàn)1～2次，才能推動(dòng)廣義AGI的實(shí)現(xiàn)。

3、大部分創(chuàng)新是工程創(chuàng)新，AGI需要更多本質(zhì)創(chuàng)新。模型能力與Harness的發(fā)展是螺旋上升、互相適配的，基礎(chǔ)設(shè)施補(bǔ)強(qiáng)模型短板，模型提升后再推動(dòng)基礎(chǔ)設(shè)施演進(jìn)；技術(shù)難以形成持久的護(hù)城河，人才、數(shù)據(jù)更為關(guān)鍵。

二、小心養(yǎng)龍蝦、買token踩坑！聊聊大模型服務(wù)商不會(huì)告訴你的那些事

清程極智聯(lián)合創(chuàng)始人師天麾點(diǎn)破了當(dāng)前token行業(yè)亂象——買token藏有很多坑。

同一個(gè)模型，在不同服務(wù)商處購(gòu)買，效果不同，最終花費(fèi)不同，服務(wù)質(zhì)量可能差別巨大。

有次評(píng)測(cè)，他們發(fā)現(xiàn)某個(gè)服務(wù)商的模型明顯有問題，問過后，服務(wù)商承認(rèn)用的是int4。這種量化能把成本壓得非常低，但是模型效果很差。

提供同一個(gè)模型，報(bào)價(jià)便宜的服務(wù)商反而可能用起來(lái)總成本更高，因?yàn)?strong>緩存命中率不一樣。

緩存命中率是一個(gè)非常影響總成本的指標(biāo)。各家服務(wù)商因?yàn)榧夹g(shù)不同，緩存命中率相差很大，好的能超過80%，差的緩存幾乎跟沒有一樣。

但服務(wù)商不會(huì)告訴客戶這件事。

▲師天麾

AI Ping團(tuán)隊(duì)對(duì)國(guó)內(nèi)30多家服務(wù)商的600個(gè)大模型API服務(wù)進(jìn)行了測(cè)試，服務(wù)商包括模型廠商、互聯(lián)網(wǎng)大廠、云上市公司和MaaS廠商。

根據(jù)他們的測(cè)試，大型服務(wù)商（如云廠商、電信運(yùn)營(yíng)商），在提供相同的模型服務(wù)、價(jià)格相近的情況下，各家服務(wù)性能可能相差5倍甚至更多。

他們觀察到，近期國(guó)內(nèi)各家服務(wù)商的服務(wù)質(zhì)量，相比去年年底明顯差了很多。許多服務(wù)商不能給中小客戶保證質(zhì)量，響應(yīng)慢、有明顯性能問題。

“養(yǎng)龍蝦”等行業(yè)熱潮火爆，導(dǎo)致token供不應(yīng)求，又貴又慢。token服務(wù)又是黑盒，行業(yè)發(fā)展很快，也很亂，那怎么選對(duì)token服務(wù)商？

師天麾安利了清程極智研發(fā)的AI Ping：它對(duì)用戶關(guān)心的大模型服務(wù)指標(biāo)做了全面評(píng)測(cè)和匯總，并提供篩選排序和智能路由功能，以便用戶對(duì)不同大模型API服務(wù)進(jìn)行7×24評(píng)測(cè)和按需調(diào)用服務(wù)。

三、從Claude Code泄露代碼，總結(jié)6個(gè)反共識(shí)觀點(diǎn)

Pine AI首席科學(xué)家李博杰重點(diǎn)聊了聊從Claude Code泄露代碼中的收獲。

在他看來(lái)，Claude Code源碼里的五層權(quán)限判斷、錯(cuò)誤恢復(fù)、安全防護(hù)工具集、反蒸餾防御機(jī)制等設(shè)計(jì)，還有用做研究的方法做產(chǎn)品，都非常值得學(xué)習(xí)。

▲李博杰

李博杰還分享了從中總結(jié)出的6個(gè)反共識(shí)觀點(diǎn)：

1、圖形界面（GUI）的價(jià)值將逐漸降低，軟件價(jià)值正從界面轉(zhuǎn)向數(shù)據(jù)治理，沒有數(shù)據(jù)壁壘的SaaS大概率被干掉。

智能體閱讀和思考速度遠(yuǎn)超人類，但操作GUI的速度比人慢，因此GUI對(duì)智能體不友好。

Claude Code就是典型的GUI價(jià)值低、業(yè)務(wù)邏輯與數(shù)據(jù)治理價(jià)值高的產(chǎn)品形態(tài)，51萬(wàn)行源碼里沒有一個(gè)產(chǎn)品級(jí)GUI。

2、上下文是人類避免被AI取代的護(hù)城河。

AI能訪問的上下文遠(yuǎn)低于一個(gè)人類員工，比如吃飯時(shí)聊出來(lái)的設(shè)計(jì)目的、屎山代碼里的坑、沒表達(dá)出來(lái)的內(nèi)心想法。

告訴AI合適的上下文，也是用好AI的關(guān)鍵。

3、AI原生組織，本質(zhì)是用AI替代傳統(tǒng)的“上傳下達(dá)”層級(jí)結(jié)構(gòu)。

Anthropic、Kimi等公司的中層大幅壓縮，實(shí)現(xiàn)良好的上下文共享，讓高層看到基層信號(hào)，讓基層直接看到戰(zhàn)略上下文。

“砍掉高層的手腳，砍掉中層的屁股，砍掉基層的腦袋”，這個(gè)段子在AI原生公司中不成立了。

4、哪些人會(huì)被AI替代？

頭部（高價(jià)值決策與創(chuàng)造）和尾部（與物理世界深度集成的工作）相對(duì)安全，腰部（執(zhí)行型、無(wú)泛化能力的標(biāo)準(zhǔn)化工作）最為危險(xiǎn)。

AI是技術(shù)能力的放大器，推動(dòng)非技術(shù)能力的重要性比重上升。學(xué)習(xí)新知識(shí)、適應(yīng)新場(chǎng)景的能力很關(guān)鍵。

一人公司（OPC）不是一個(gè)人能開發(fā)App，大多數(shù)獨(dú)立開發(fā)者的瓶頸不是寫不出代碼，而是獲客、信任、運(yùn)營(yíng)這些稀缺能力。

5、“模型即Agent”遠(yuǎn)遠(yuǎn)不夠。

真正的智能體里有一堆復(fù)雜的Harness來(lái)兜底解決模型搞不定的部分，代碼量遠(yuǎn)超工具+提示詞本身。只有模型公司同時(shí)控制應(yīng)用層和兜底工程。

Agent= Model x Harness。大模型提供“大腦”，而Harness提供了“手腳”和“韁繩”，包括上下文怎么給、工具怎么調(diào)用、出錯(cuò)怎么恢復(fù)、安全怎么保障、緩存怎么共享、并行怎么協(xié)調(diào)等。

6、應(yīng)用層公司的護(hù)城河在技術(shù)之外。

Harness里的“屎山”反映了模型內(nèi)部模型團(tuán)隊(duì)和應(yīng)用團(tuán)隊(duì)之間的張力，是應(yīng)用層短期的技術(shù)杠桿，但是技術(shù)優(yōu)勢(shì)會(huì)被模型公司的飛輪吃掉。

頂尖模型的差距還會(huì)繼續(xù)拉大，中端模型將趨于商品化。應(yīng)用層公司的長(zhǎng)期護(hù)城河是數(shù)據(jù)、渠道、拍照、用戶信任、網(wǎng)絡(luò)效應(yīng)等等。

四、高端對(duì)話：OpenClaw之后，智能體時(shí)代的中國(guó)機(jī)會(huì)在哪里？

高端對(duì)話環(huán)節(jié)由智東西聯(lián)合創(chuàng)始人、總編輯張國(guó)仁主持，三位嘉賓均在智能體領(lǐng)域頗有建樹，分別是香港大學(xué)助理教授&博士生導(dǎo)師、Nanobot團(tuán)隊(duì)負(fù)責(zé)人黃超，網(wǎng)易有道LobsterAI項(xiàng)目負(fù)責(zé)人、智能硬件研發(fā)負(fù)責(zé)人王寧，峰瑞資本投資合伙人陳石。

黃超團(tuán)隊(duì)的Nanobot開源項(xiàng)目?jī)H用約4000行代碼，實(shí)現(xiàn)了原版OpenClaw用43萬(wàn)行（現(xiàn)已超百萬(wàn)行）代碼的核心功能。

王寧團(tuán)隊(duì)的LobsterAI是國(guó)內(nèi)大廠第一個(gè)開源的桌面級(jí)智能體產(chǎn)品，1周獲得超過3k star，還被OpenClaw創(chuàng)始人Peter Steinberger發(fā)文夸贊。

陳石有超過15年的連續(xù)創(chuàng)業(yè)經(jīng)歷，曾任阿里高管，曾經(jīng)是一名快樂的程序員和用戶增長(zhǎng)專家，如今也是一位對(duì)AI行業(yè)深入跟蹤觀察的投資人。

▲從左到右：張國(guó)仁、黃超、王寧、陳石

1、智能體行業(yè)變化太快，2026年會(huì)是標(biāo)志性一年

黃超：智能體演進(jìn)太快了，去年底MCP普及到現(xiàn)在的Skill和Harness，僅三四個(gè)月。2026年可能是智能體生態(tài)爆發(fā)的一年，智能體的能力邊界擴(kuò)展需要整個(gè)Skill生態(tài)、環(huán)境交互體系的協(xié)同成熟。

王寧：OpenClaw大大加速整個(gè)智能體落地進(jìn)程，各行業(yè)都認(rèn)識(shí)到智能體能幫企業(yè)干活、提效、掙錢。去年Chat類產(chǎn)品一直在找營(yíng)收來(lái)源，比如靠廣告，其實(shí)沒掙太多錢。今年可能是Agent產(chǎn)品商業(yè)化爆發(fā)的起點(diǎn)，真正能向用戶和企業(yè)收費(fèi)的Agent產(chǎn)品出現(xiàn)。

陳石：從去年下半年到今年年初，AI行業(yè)最大的變化是智能體開始在應(yīng)用層掙錢了，不再只是英偉達(dá)掙錢。OpenClaw開啟新的智能體范式，今年可能是AI真正能被大眾用起來(lái)的一年。

2、工程粗糙卻范式創(chuàng)新，OpenClaw為何能改變AI行業(yè)？

黃超：它的交互模式是創(chuàng)新的，看似簡(jiǎn)單的設(shè)計(jì)，讓社區(qū)感受到智能體更加主動(dòng)。此前的智能體工具感太重，OpenClaw點(diǎn)燃了人們對(duì)”通用個(gè)人助手”的長(zhǎng)期期待。

王寧：類比移動(dòng)互聯(lián)網(wǎng)早期，很多App最初都是小團(tuán)隊(duì)做的、很粗糙，但商業(yè)模式和用戶場(chǎng)景滿足得很好。OpenClaw做了類似的事。

陳石：它也許在工程上還比較粗糙，但應(yīng)用范式創(chuàng)新對(duì)行業(yè)影響非常大。

3、OpenClaw降溫了？現(xiàn)象級(jí)產(chǎn)品完成歷史使命

陳石：當(dāng)前OpenClaw本身可能并不是一個(gè)特別優(yōu)質(zhì)的產(chǎn)品，但它是一個(gè)象征意義重大的現(xiàn)象級(jí)產(chǎn)品，它的核心定位是在“開放域里做無(wú)終點(diǎn)的事”，這是人類歷史上是第一次讓普通用戶用AI在數(shù)字世界中進(jìn)行不設(shè)限制的探索。之前的智能體產(chǎn)品包括Claude Code、Claude Cowork和Manus都不在這個(gè)定位。OpenClaw更像是普通人心中的“數(shù)字助手”或者“數(shù)字伙伴”的形象。

王寧：DeepSeek 也是大概火了兩個(gè)月，但之后它讓“推理能力”快速滲透到了各行各業(yè)。OpenClaw也有點(diǎn)類似，它也加速了Agent產(chǎn)品走向更廣泛的行業(yè)應(yīng)用。熱度會(huì)回落，但能力滲透一旦開始，真正的行業(yè)價(jià)值才剛剛開始釋放。

黃超：降溫可能是因?yàn)閠oken燒得多，事情做得沒達(dá)到預(yù)期。OpenClaw完成了它的使命，建立了智能體在用戶中的心智。熱度下去說(shuō)不定是好事，可以讓大家沉淀下來(lái)思考：什么時(shí)候需要讓OpenClaw變成真正能幫我們搬磚的打工人。

4、高質(zhì)量Skill很少，Harness極其重要

黃超：雖然很多to-use模塊從MCP進(jìn)化到Skill，Skill像MCP工具調(diào)用說(shuō)明書，但MCP存在的問題，Skill也存在，比如質(zhì)量控制不好。

Skill很多，但高質(zhì)量的Skill很少，檢索與匹配效率低下。未來(lái)需要專門的平臺(tái)對(duì)高質(zhì)量Skill進(jìn)行管理和分發(fā)。

Harness與模型能力相輔相成。長(zhǎng)程任務(wù)是一大工程挑戰(zhàn)，上下文極度爆炸、實(shí)時(shí)環(huán)境交互復(fù)雜、中斷現(xiàn)象普遍，Harness顯得極其重要。

5、當(dāng)前AI行業(yè)的商業(yè)邏輯與創(chuàng)業(yè)建議

陳石：當(dāng)前AI行業(yè)的商業(yè)邏輯與移動(dòng)互聯(lián)網(wǎng)時(shí)代有根本性差異，不能做線性外推。

移動(dòng)互聯(lián)網(wǎng)時(shí)代有個(gè)著名的商業(yè)模式是“羊毛出在豬身上”，免費(fèi)獲客、廣告變現(xiàn)，但其前提是單用戶使用成本很低。但AI產(chǎn)品用戶使用越多，Token消耗越大，當(dāng)前的成本遠(yuǎn)高于廣告的eCPM，在商業(yè)上根本跑不通。

未來(lái)AI行業(yè)大部分的收入將被token生產(chǎn)與分發(fā)環(huán)節(jié)的公司收走。智能體能夠獨(dú)立存在的機(jī)會(huì)，在于廣泛收集人類的上下文（操作軌跡、使用場(chǎng)景、業(yè)務(wù)邏輯、行業(yè)知識(shí)），形成模型廠商搶不走的數(shù)據(jù)壁壘，用戶用得越多，越依賴，護(hù)城河越深。

建議早期智能體創(chuàng)業(yè)公司優(yōu)先考慮“前向收費(fèi)”，做不到就不要盲目擴(kuò)張，說(shuō)明還沒拿出能讓用戶愿意付費(fèi)的產(chǎn)品。另一個(gè)建議是“軟飯硬吃”，利用中國(guó)制造業(yè)供應(yīng)鏈優(yōu)勢(shì)，在通過軟件掌握用戶需求和產(chǎn)品技術(shù)積累后，做出軟硬件一體的產(chǎn)品，這類產(chǎn)品到海外很能打。

6、中國(guó)版下一代智能體框架，機(jī)會(huì)在哪？

王寧：OpenClaw給國(guó)內(nèi)大模型廠商帶來(lái)了新的機(jī)會(huì)，國(guó)內(nèi)模型價(jià)格大概只有海外模型的1/10，能力上又相差無(wú)幾，特別適合”龍蝦”場(chǎng)景。

企業(yè)級(jí)Agent也有一些新的機(jī)會(huì)。國(guó)內(nèi)已有不少國(guó)企和私企尋求將智能體產(chǎn)品在公司內(nèi)普及，并與內(nèi)部系統(tǒng)打通，需求涵蓋辦公自動(dòng)化、OA、財(cái)務(wù)、ERP和數(shù)據(jù)安全等場(chǎng)景。

黃超：國(guó)內(nèi)一直有應(yīng)用創(chuàng)新基因，有信心國(guó)內(nèi)機(jī)構(gòu)能打造出下一代真正成為打工人的智能體。

五、世界模型的多重路徑：視頻生成、多模態(tài)原生統(tǒng)一、3D生成

語(yǔ)言只是人類感知世界的通道之一，圖像、聲音、3D空間等多模態(tài)才構(gòu)成了物理世界的原始語(yǔ)言。

在世界模型方向，三位嘉賓從不同角度的分享，拼在一起很有意思。

1、智象未來(lái)姚霆：多模態(tài)創(chuàng)作智能體走向全模態(tài)，即將發(fā)布HiDream-O1-Image圖像大模型

智象未來(lái)（HiDream.ai）聯(lián)合創(chuàng)始人兼CTO姚霆分享說(shuō)，隨著語(yǔ)言模型與多模態(tài)大模型能力飛速躍升，多模態(tài)創(chuàng)作智能體的技術(shù)底座已基本成型，并將走向全模態(tài)世界模型。

▲姚霆

通用智能體的核心能力是：上下文管理、工具調(diào)用、開放域?qū)υ捙c任務(wù)自動(dòng)化，典型場(chǎng)景如定鬧鐘、訂外賣、制定旅行規(guī)劃。

在此基礎(chǔ)上，多媒體創(chuàng)作智能體還需解決專業(yè)性、協(xié)作性、一致性與可控性問題。其典型任務(wù)包括圖文內(nèi)容創(chuàng)作、視頻高光時(shí)刻剪輯、從故事到腳本到分鏡再到成片的完整視頻生成鏈路等。

當(dāng)前多模態(tài)生成模型的主流架構(gòu)存在一個(gè)缺陷：文本編碼與視覺編碼相互獨(dú)立，信息交互單向，且視覺VAE編碼器會(huì)造成信息損失。

下一代架構(gòu)的核心思路是將所有模態(tài)統(tǒng)一輸入到一個(gè)Unified Transformer，同時(shí)完成理解與生成，實(shí)現(xiàn)無(wú)損編碼+原生交互，走向“原生全模態(tài)”。

基于上述架構(gòu)，智象未來(lái)即將發(fā)布HiDream-O1-Image系列模型，并將開源一個(gè)8B參數(shù)量的版本，該開源模型在6項(xiàng)基準(zhǔn)測(cè)試中達(dá)到與FLUX.2、Qwen-Image同量級(jí)甚至略優(yōu)的水平，并適配本地部署和低代碼智能體調(diào)用場(chǎng)景，同步，智象未來(lái)以此架構(gòu)為基礎(chǔ)，逐步構(gòu)建智象下一代世界模型。

圍繞多媒體創(chuàng)作需求，智象未來(lái)提出HiDream Agent OS基礎(chǔ)設(shè)施，分為工具層、Skill層、Harness層，可實(shí)現(xiàn)工具、創(chuàng)意、經(jīng)驗(yàn)可復(fù)用。

該團(tuán)隊(duì)已推出全能創(chuàng)作智能體vivago Agent、視頻剪輯智能體HiClip Agent、影視創(chuàng)作智能體幀贊等智能體工具，其中幀贊已累計(jì)制作AI短劇漫劇超過5000分鐘。

姚霆認(rèn)為，多媒體創(chuàng)作智能體的終極目標(biāo)，是讓創(chuàng)作回歸靈感本身，將重復(fù)性、工具性的工作交給智能體，讓人專注于真正屬于人的創(chuàng)造力。

2、北京大學(xué)袁粒：大語(yǔ)言模型快到頭了，多模態(tài)原生統(tǒng)一才是未來(lái)方向

北京大學(xué)深圳研究生院助理教授&研究員、博士生導(dǎo)師袁粒認(rèn)為，大語(yǔ)言模型已逼近極限，多模態(tài)原生統(tǒng)一才是未來(lái)，沒有多模態(tài)原生統(tǒng)一，就沒有真正的世界模型。

同時(shí)，他認(rèn)為將token翻譯成“詞元”是默認(rèn)大模型以語(yǔ)言為中心，這也是為什么GPT-5數(shù)不清人有幾根手指，大模型只專注語(yǔ)言這一模態(tài)，無(wú)視其他物理模態(tài)（比如視覺），無(wú)法真正讓其走向物理AI。

多模型協(xié)作的方式在數(shù)字世界尚可運(yùn)行，但在物理世界存在兩大致命缺陷——高延遲和信息損失。以機(jī)器人搬水為例，這個(gè)任務(wù)對(duì)人類來(lái)說(shuō)很簡(jiǎn)單，當(dāng)前絕大多數(shù)機(jī)器人仍無(wú)法流暢完成。

人類大腦構(gòu)建的世界模型天然是多模態(tài)、統(tǒng)一的。當(dāng)前所謂的“世界模型”，本質(zhì)上仍是單模態(tài)模型。只有實(shí)現(xiàn)多模態(tài)原生統(tǒng)一，才能構(gòu)建出真正理解物理世界的世界模型。

▲袁粒

構(gòu)建多模態(tài)原生統(tǒng)一架構(gòu)，面臨五大技術(shù)挑戰(zhàn)：如何定義“原生多模態(tài)”、自回歸建模與擴(kuò)散建模融合、多模態(tài)視覺編碼器統(tǒng)一、消解模態(tài)沖突、訓(xùn)練數(shù)據(jù)清洗和標(biāo)注等。

袁粒團(tuán)隊(duì)在多模態(tài)理解、生成、架構(gòu)與統(tǒng)一方向均有一些代表性工作。例如，其Helios原生實(shí)時(shí)視頻架構(gòu)采用自回歸+擴(kuò)散Transformer，無(wú)需KV Cache等加速技巧，單卡可達(dá)近實(shí)時(shí)生成。

袁粒還展示了由其課題組多模態(tài)統(tǒng)一方法生成的圖像，無(wú)論是現(xiàn)實(shí)復(fù)雜場(chǎng)景生成還是數(shù)學(xué)虛擬生成都遠(yuǎn)超其余同期模型水平。

3、VAST梁鼎：3D+視頻，或許才是世界模型的終態(tài)

VAST CTO梁鼎分享說(shuō)，3D生成模型正在從單點(diǎn)能力走向完整的生產(chǎn)管線覆蓋，高模與低模兩條關(guān)鍵技術(shù)路線并行發(fā)展，Tripo大模型在游戲、工業(yè)、家裝、潮玩等行業(yè)已產(chǎn)生實(shí)質(zhì)影響，VR/XR與具身智能仿真環(huán)境的建設(shè)也高度依賴3D能力。

圍繞這兩條技術(shù)路線和對(duì)應(yīng)生產(chǎn)需求，VAST已經(jīng)推出了行業(yè)SOTA的兩款A(yù)I3D大模型：Trpo H3.1和Tripo P1.0。

Tripo H3.1追求高視覺質(zhì)量與貼圖精細(xì)度，適用于3D打印、工業(yè)設(shè)計(jì)、實(shí)體制造等對(duì)視覺還原度要求高、無(wú)需實(shí)時(shí)渲染的場(chǎng)景。

Tripo P1.0專為實(shí)時(shí)渲染引擎設(shè)計(jì)，核心優(yōu)勢(shì)包括直接從圖片生成低模、生成速度快、生成結(jié)果具備拓?fù)溆押煤蚒V友好的特性等，適用于游戲管線制作、UGC生成式玩法、移動(dòng)端3D資產(chǎn)生成等。

▲梁鼎

單個(gè)資產(chǎn)的生成只是起點(diǎn)，完整的3D制作管線還涉及部件拆分、貼圖編輯、骨骼綁定等環(huán)節(jié)。目前低模上的拆件與綁骨能力、場(chǎng)景級(jí)別的自動(dòng)化生成、從視頻中提取動(dòng)畫的能力等仍待突破。

當(dāng)前世界模型的構(gòu)建存在兩派：視頻原生派與3D原生派。這與早年3D生成領(lǐng)域2D升維與3D原生的路線之爭(zhēng)很相似。視頻路線的優(yōu)勢(shì)是生成效果好、訓(xùn)練數(shù)據(jù)充足，但存在長(zhǎng)時(shí)序記憶難、多人一致性難、推理成本高等局限性。3D路線的難點(diǎn)在于制作門檻與畫質(zhì)上限。

梁鼎認(rèn)為，兩條路線最終很可能走向融合，世界模型的終態(tài)或許是3D與視頻共同驅(qū)動(dòng)的統(tǒng)一方案，3D在其中將扮演不可或缺的結(jié)構(gòu)性角色。

六、Token消耗量爆發(fā)，國(guó)產(chǎn)AI基礎(chǔ)設(shè)施如何協(xié)同與進(jìn)化？

無(wú)論是前沿模型訓(xùn)練，還是蓬勃發(fā)展的AI應(yīng)用推理浪潮，都對(duì)AI基礎(chǔ)設(shè)施中的計(jì)算、存儲(chǔ)、互連架構(gòu)提出更高的協(xié)同要求，算力層也正從成本中心演變?yōu)橐詔oken為計(jì)量維度的利潤(rùn)中心。

如何推動(dòng)token成本持續(xù)下降，是擺在AI基礎(chǔ)設(shè)施供應(yīng)商們面前的共同考題。

在AI算力基礎(chǔ)設(shè)施專題論壇，嘉賓們從計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、云服務(wù)等不同維度，分享推動(dòng)國(guó)產(chǎn)AI算力走向普惠的可行路徑。

具身智能芯片方案如何支撐機(jī)器人集群算力需求？企業(yè)使用算力面臨哪些主要痛點(diǎn)？芯片架構(gòu)設(shè)計(jì)如何提升能效比？誰(shuí)是提升token生產(chǎn)效率的隱形障礙？國(guó)產(chǎn)AI算力生態(tài)怎樣形成聚合？來(lái)聽聽他們的答案。

1、芯橋張?chǎng)危壕呱碇悄苄枰绻?jié)點(diǎn)算力協(xié)同

芯橋半導(dǎo)體解決方案副總裁張?chǎng)握劦�，隨著具身智能機(jī)器人從單點(diǎn)執(zhí)行走向群體智能，算力問題也從單點(diǎn)性能提升轉(zhuǎn)向跨節(jié)點(diǎn)協(xié)同與分層調(diào)度。

受制于電池續(xù)航、板卡面積等條件，單臺(tái)機(jī)器人的算力存在物理上限。對(duì)此，芯橋半導(dǎo)體提出了五位一體、軟件協(xié)同的“大腦-小腦-肌肉”架構(gòu)，通過分布式方案來(lái)支撐機(jī)器人集群算力需求。

其中，在決策層，X200芯片提供682TOPS峰值算力、819.2GB/s HBM2E帶寬，支持50-100臺(tái)機(jī)器人協(xié)同作業(yè)；在感知層，S200邊緣計(jì)算芯片提供128GB顯存、66W被動(dòng)散熱、4800FPS極速解碼，以便機(jī)器人實(shí)時(shí)處理感知數(shù)據(jù)。

芯橋還提供宏觀任務(wù)調(diào)度與集群管理、精細(xì)單元控制與實(shí)時(shí)狀態(tài)監(jiān)控等功能。

▲張?chǎng)?/p>

2、Hammerspace王殿清：別浪費(fèi)了GPU服務(wù)器本地存儲(chǔ)

Hammerspace資深解決方案架構(gòu)師王殿清說(shuō)，AI產(chǎn)業(yè)正從模型軍備競(jìng)賽轉(zhuǎn)向推理效率、基礎(chǔ)設(shè)施重構(gòu)的系統(tǒng)性競(jìng)爭(zhēng)。存儲(chǔ)基礎(chǔ)設(shè)施存在數(shù)據(jù)分散、傳輸費(fèi)時(shí)費(fèi)力等不便，GPU服務(wù)器本地存儲(chǔ)一直未得到充分利用。打破存儲(chǔ)孤島是AI走向大規(guī)模落地的關(guān)鍵基礎(chǔ)條件。

高性能存儲(chǔ)設(shè)備的速度遠(yuǎn)超外部存儲(chǔ)，卻因?yàn)榇鎯?chǔ)孤島、不受保護(hù)、難以在本地存儲(chǔ)和外部共享存儲(chǔ)間移動(dòng)數(shù)據(jù)等問題，一直未被使用。以千節(jié)點(diǎn)集群為例，每節(jié)點(diǎn)數(shù)百TB的本地盤如果僅作臨時(shí)緩存，浪費(fèi)的存儲(chǔ)空間可達(dá)數(shù)百PB。

Hammerspace Tier 0技術(shù)可將GPU服務(wù)器磁盤配置為一個(gè)或多個(gè)NFS導(dǎo)出，由軟件統(tǒng)一納管，形成為一個(gè)全局可見、共享的存儲(chǔ)層。Meta便基于標(biāo)準(zhǔn)架構(gòu)，利用現(xiàn)有服務(wù)器、網(wǎng)絡(luò)、GPU，節(jié)省了多達(dá)數(shù)百萬(wàn)美元。

▲王殿清

3、GMI Cloud蔣劍彪：今年算力市場(chǎng)呈四大變化

GMI Cloud中國(guó)區(qū)總裁蔣劍彪分享了2026年AI產(chǎn)業(yè)的4大核心趨勢(shì)：1）推理成AI基礎(chǔ)設(shè)施的主要市場(chǎng)；2）智能體推動(dòng)token消耗千倍級(jí)增長(zhǎng)，主要客戶普遍提前鎖定算力資源；3）AI編程引爆一人公司（OPC）模式，成AIGC應(yīng)用下一個(gè)關(guān)鍵增長(zhǎng)引擎；4）智算中心從存儲(chǔ)倉(cāng)庫(kù)轉(zhuǎn)向算力工廠，追求極致算力密度、能效比與token吞吐量。

GMI Cloud是一家領(lǐng)先的AI Native Cloud服務(wù)商，是全球七大Reference Platform NVIDIA Cloud Partner之一，擁有遍布全球的數(shù)據(jù)中心，為企業(yè)AI應(yīng)用提供最新、最優(yōu)的GPU云服務(wù)，為全球新創(chuàng)公司、研究機(jī)構(gòu)和大型企業(yè)提供穩(wěn)定安全、高效經(jīng)濟(jì)的AI云服務(wù)解決方案。

蔣劍彪預(yù)告說(shuō)，GMI Cloud面向龍蝦智能體（Claws Agents）的全新生態(tài)產(chǎn)品The GMI Claw Marketplace即將上線，將面向企業(yè)用戶和AI開發(fā)者，提供一站式端到端解決方案。

▲蔣劍彪

4、九章云極張磊：讓算力像水電一樣管夠

九章云極DataCanvas解決方案專家張磊總結(jié)說(shuō)，企業(yè)使用算力有三大痛點(diǎn)——買不起、用不滿、管不好。九章云極以AI原生基礎(chǔ)設(shè)施與智算云為核心，希望將算力轉(zhuǎn)化為標(biāo)準(zhǔn)化的普惠AI資源。

作為普惠算力的核心載體，九章云極提出了算力服務(wù)單位“度”，定義1度算力=312TFLOPS*1小時(shí)，以便將不同算力卡通過統(tǒng)一技術(shù)指標(biāo)換算為一個(gè)標(biāo)準(zhǔn)度量單位。用戶可按需購(gòu)買、秒級(jí)啟用，僅對(duì)有效計(jì)算時(shí)間付費(fèi)，徹底避免了硬件資源閑置與浪費(fèi)，顯著降低了AI研發(fā)與使用的門檻與總擁有成本（TCO）。

面向AI原生時(shí)代，九章云極打造的Token Factory將算力從成本中心轉(zhuǎn)化為可創(chuàng)造業(yè)務(wù)價(jià)值的增長(zhǎng)中心，以token吞吐量作為核心效率指標(biāo)，直接支撐企業(yè)AI競(jìng)爭(zhēng)力提升。智算云平臺(tái)上打造了AI開發(fā)一站式賦能與模型調(diào)用服務(wù)能力，并支持跨區(qū)域、跨廠商的算力資源統(tǒng)一調(diào)度與智能編排，為大模型訓(xùn)練、推理、智能體開發(fā)等全場(chǎng)景提供高效、穩(wěn)定、彈性的算力支撐。

▲張磊

5、DDN李凡：疏通AI算力工廠的數(shù)據(jù)管道

DDN中國(guó)技術(shù)總監(jiān)李凡談道，AI基礎(chǔ)設(shè)施的競(jìng)爭(zhēng)已從單一硬件性能轉(zhuǎn)向系統(tǒng)工程能力，英偉達(dá)從2016年起就在其內(nèi)部集群采用DDN AI數(shù)據(jù)智能平臺(tái)。由DDN提供支持的AI工廠，GPU利用率可達(dá)99%，顯著降低電力消耗和空間占用。

KV Cache是當(dāng)前分布式推理場(chǎng)景的存儲(chǔ)熱點(diǎn)，對(duì)動(dòng)態(tài)擴(kuò)展性與元數(shù)據(jù)性能的要求超過峰值吞吐。DDN EXA/Infinia KV cache fabric方案可30倍加速推理和智能體，同時(shí)保障低延遲和低成本。

▲李凡

DDN雖為美國(guó)公司，但中國(guó)本土研發(fā)團(tuán)隊(duì)已從數(shù)人擴(kuò)展至80人，并深度參與國(guó)產(chǎn)算力生態(tài)，正與國(guó)產(chǎn)網(wǎng)絡(luò)、國(guó)產(chǎn)算力、大模型廠商合作，推進(jìn)系統(tǒng)級(jí)工程實(shí)踐。

國(guó)產(chǎn)SSD供應(yīng)商大普微旗下多款大容量QLC產(chǎn)品已完成DDN全平臺(tái)測(cè)試認(rèn)證，支持智能體數(shù)據(jù)大容量存儲(chǔ)，提供更快的token響應(yīng)。雙方將繼續(xù)深化合作，推出更強(qiáng)的PCIe 5.0 SSD產(chǎn)品組合。

▲大普微DapuStor高級(jí)總監(jiān)黃明達(dá)

6、光羽芯辰姜漢：存算一體翻倍提升AI芯片能效比

光羽芯辰產(chǎn)品市場(chǎng)總監(jiān)姜漢認(rèn)為，端側(cè)AI生態(tài)不能由單一價(jià)值鏈玩家獨(dú)立推動(dòng)，需聯(lián)合從操作系統(tǒng)層到App層的全棧合作伙伴共同構(gòu)建。作為一家端側(cè)AI大模型芯片創(chuàng)企，光羽芯辰已與頭部手機(jī)廠商、頭部PC廠商達(dá)成商業(yè)合作，未來(lái)還考慮應(yīng)用于具身智能機(jī)器人場(chǎng)景。

光羽芯辰是一家由AI頭部企業(yè)與存儲(chǔ)頭部企業(yè)等合資設(shè)立的公司，已完成多輪融資。該公司提出了將存算一體架構(gòu)與3D異構(gòu)集成技術(shù)相結(jié)合的端側(cè)AI解決方案，并率先將該方案實(shí)現(xiàn)于AI芯片產(chǎn)品中。

相比傳統(tǒng)架構(gòu)，其存算一體架構(gòu)可實(shí)現(xiàn)5倍能效比、10倍帶寬，響應(yīng)延遲降至1/10。光羽芯辰也提供硬件級(jí)可信執(zhí)行環(huán)境，并與OpenClaw等框架無(wú)縫集成，以加速端側(cè)AI應(yīng)用落地。

▲姜漢

7、上海AI Lab蔡政：為國(guó)產(chǎn)AI芯片快速搓出高性能算子

上海人工智能實(shí)驗(yàn)室DeepLink團(tuán)隊(duì)工程師蔡政強(qiáng)調(diào)，高性能算子體系是英偉達(dá)生態(tài)的核心護(hù)城河，也是國(guó)際AI競(jìng)爭(zhēng)的核心戰(zhàn)場(chǎng)，將各類基礎(chǔ)設(shè)施、模型能力、芯片技術(shù)、應(yīng)用場(chǎng)景協(xié)同，關(guān)鍵在于一個(gè)性能好、覆蓋廣、可演進(jìn)的算子體系。

目前國(guó)內(nèi)算子開發(fā)面臨門檻高、調(diào)優(yōu)難、架構(gòu)差異大且迭代快、遷移易損失性能等挑戰(zhàn)。

2025年KernelBench首次系統(tǒng)性評(píng)估了大模型自動(dòng)生成高性能算子的能力，結(jié)論是即使最先進(jìn)的模型在One-shot場(chǎng)景下，首輪算子通過率（編譯正確+精度正確）普遍不超過90%，甚至剔除掉生成了但是沒有實(shí)際運(yùn)行的結(jié)果之后，矯正后的算子通過率普遍不超過55%。

對(duì)此，DeepLink團(tuán)隊(duì)提出KernelSwift智能體進(jìn)化架構(gòu)，更充分地探索Kernel Search Space和利用Test Time Compute。在KernelBench L1/L2/L3測(cè)評(píng)中，該系統(tǒng)在英偉達(dá)平臺(tái)上整體性能領(lǐng)先，并且生成的算子代碼已經(jīng)應(yīng)用于生產(chǎn)級(jí)推理引擎SGLang和LMDeploy。

KernelSwift通過DeepLink自研AI編譯器DLCompiler的協(xié)同，實(shí)現(xiàn)了對(duì)華為昇騰、沐曦、寒武紀(jì)、海光、平頭哥、天數(shù)智芯等主流國(guó)產(chǎn)芯片的支持，跨平臺(tái)兼容率達(dá)90%。

▲蔡政

8、探微芯聯(lián)張羽：打造對(duì)標(biāo)英偉達(dá)NVLink的國(guó)產(chǎn)互聯(lián)方案

探微芯聯(lián)超節(jié)點(diǎn)與推訓(xùn)平臺(tái)技術(shù)專家張羽談道，大模型對(duì)顯存有極致要求，單芯片擴(kuò)展已逼近物理瓶頸，Scale-up超節(jié)點(diǎn)是未來(lái)長(zhǎng)期的主要發(fā)展方向，通過高性能互聯(lián)突破單GPU計(jì)算容量、存儲(chǔ)容量和訪存容量的限制。

探微芯聯(lián)以scale-up互聯(lián)資源池為核心，通過自研的ACCSwitch芯片與XPU端的ACCLink，將計(jì)算、內(nèi)存、存儲(chǔ)、CPU四大資源池整合成一個(gè)統(tǒng)一的計(jì)算系統(tǒng)，并圍繞芯片提供驅(qū)動(dòng)軟件棧，形成scale-up域互聯(lián)整體解決方案。

其方案可幫助計(jì)算卡廠商、DRAM廠商、存儲(chǔ)廠商構(gòu)建對(duì)標(biāo)英偉達(dá)NVLink生態(tài)的國(guó)產(chǎn)scale-up超節(jié)點(diǎn)系統(tǒng)。

▲張羽

9、圓桌討論：Token爆發(fā)元年，國(guó)產(chǎn)AI算力如何從可用到好用？

AI算力基礎(chǔ)設(shè)施專題論壇的圓桌討論由千芯智算董事長(zhǎng)陳巍主持，三位嘉賓分別是芯橋半導(dǎo)體解決方案副總裁張?chǎng)�、DDN中國(guó)技術(shù)總監(jiān)李凡、探微芯聯(lián)超節(jié)點(diǎn)與推訓(xùn)平臺(tái)技術(shù)專家張羽。

陳巍談道，根據(jù)國(guó)家統(tǒng)計(jì)局的數(shù)據(jù)，今年3月，我國(guó)日均token調(diào)用量已突破140萬(wàn)億，較2024年初的1000億增長(zhǎng)超過1400倍。AI推理已不再是單純的堆卡堆算力，而是進(jìn)入token工廠時(shí)代，每生成一個(gè)token，都在極致考驗(yàn)計(jì)算芯片、存儲(chǔ)、互連架構(gòu)的協(xié)同。

隨著推理時(shí)代到來(lái)，傳統(tǒng)基礎(chǔ)設(shè)施已無(wú)法滿足智能體和長(zhǎng)鏈路任務(wù)的需求。站在token爆發(fā)元年的風(fēng)口之上，國(guó)產(chǎn)AI算力如何從可用邁向好用？這個(gè)議題非常具有現(xiàn)實(shí)意義。

▲從左往右：陳巍、張?chǎng)巍⒗罘�、張�?/p>

幾位嘉賓分享的一些共識(shí)觀點(diǎn)包括：

（1）token成本是國(guó)產(chǎn)算力從可用到好用的關(guān)鍵命題，更低成本、更高token產(chǎn)出效率是前提。

（2）系統(tǒng)工程化協(xié)作是短板。發(fā)展計(jì)算、存儲(chǔ)、互聯(lián)、網(wǎng)絡(luò)、運(yùn)維的一體化工程能力，才能真正釋放token工廠的潛力。

（3）中國(guó)團(tuán)隊(duì)在模型量化等軟件層的能力已接近或超越國(guó)際水平，制程、良率等硬件層差距客觀存在，場(chǎng)景化需求可能會(huì)抹平部分技術(shù)差距。

（4）Scale-Up超節(jié)點(diǎn)是確定性長(zhǎng)期趨勢(shì)，是國(guó)產(chǎn)AI算力生態(tài)整合的關(guān)鍵抓手。

（5）AI下一個(gè)爆發(fā)點(diǎn)尚待觀望。未來(lái)Agent長(zhǎng)時(shí)序主動(dòng)執(zhí)行將改變計(jì)費(fèi)體系，對(duì)硬件成本、集群效率的要求將更嚴(yán)苛。

計(jì)算方面，張?chǎng)握劦紸I芯片設(shè)計(jì)正向定制化模型需求靠攏，例如針對(duì)矩陣計(jì)算做專項(xiàng)硬件加速（參考Groq思路），可同時(shí)實(shí)現(xiàn)資源節(jié)省、性能提升與成本下降，建議加強(qiáng)芯片層與落地場(chǎng)景的溝通，推動(dòng)硬件針對(duì)專屬場(chǎng)景的定制化改造。

在他看來(lái)，智能體落地不是單一模型運(yùn)算，而是多模型在不同場(chǎng)景、不同節(jié)點(diǎn)、不同步驟的分場(chǎng)景拆解，是否需要專用芯片支撐仍在探索中。

存儲(chǔ)方面，李凡提出存儲(chǔ)架構(gòu)割裂（HBM、DRAM、SSD各自孤立）是當(dāng)前制約token生產(chǎn)效率的隱性障礙，只有打通才能真正釋放算力。

他認(rèn)為，中國(guó)AI推理基礎(chǔ)設(shè)施的token輸出效率已超越國(guó)外水平，現(xiàn)階段主要問題是工程配合與生態(tài)整合不足，仍處于堆卡堆資源的初期階段，缺乏計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、運(yùn)維的系統(tǒng)級(jí)協(xié)作。

通信方面，張羽提到計(jì)算、存儲(chǔ)、互聯(lián)三者之間存在此消彼長(zhǎng)的平衡難題，把存儲(chǔ)做成HBM類混合存儲(chǔ)可行，但會(huì)將壓力轉(zhuǎn)移到通信側(cè)。

他建議，芯片內(nèi)部的平衡、芯片間互聯(lián)的平衡、存儲(chǔ)的平衡三者需統(tǒng)一建模，建議構(gòu)建性能建模工具，拆解大模型推理任務(wù)中的算子（通信算子、訪存算子、計(jì)算算子），預(yù)估各階段計(jì)算量、訪存帶寬需求，尋找計(jì)算與通信細(xì)粒度overlap的最優(yōu)點(diǎn)，從而實(shí)現(xiàn)最大化性能。

張羽預(yù)計(jì)未來(lái)3~5年，計(jì)算卡廠商、存儲(chǔ)廠商將逐步融入統(tǒng)一的Scale-Up超節(jié)點(diǎn)生態(tài)。

七、大模型下半場(chǎng)，競(jìng)爭(zhēng)焦點(diǎn)變成場(chǎng)景、數(shù)據(jù)、品味

在大模型專題論壇上，6位演講嘉賓分別從模型能力演進(jìn)、基礎(chǔ)設(shè)施重構(gòu)、行業(yè)應(yīng)用落地等維度展開分享。

模型層面，“任務(wù)完成度”成為廠商關(guān)注重點(diǎn)，即能否在真實(shí)場(chǎng)景中交付穩(wěn)定、可靠的結(jié)果。

基礎(chǔ)設(shè)施層面，AI訓(xùn)練和推理需要全新的數(shù)據(jù)存儲(chǔ)基礎(chǔ)設(shè)施，AI token工廠的每一層都需要被重新設(shè)計(jì)。

應(yīng)用層面，“理解場(chǎng)景”與“理解人”成為AI落地的必修課。大模型不能再僅僅滿足于簡(jiǎn)單生成，而要能理解語(yǔ)言之外的意圖、業(yè)務(wù)邏輯乃至心理。

1、智譜李子玄：Long Horizon成AI編程新重點(diǎn)

智譜Z.ai負(fù)責(zé)人李子玄認(rèn)為，AI編程的競(jìng)爭(zhēng)焦點(diǎn)正從單點(diǎn)生成轉(zhuǎn)向“Long Horizon（長(zhǎng)程任務(wù)）”能力。

他澄清，Long Horizon并非長(zhǎng)度的比較，而是要求模型執(zhí)行任務(wù)的過程中保持目標(biāo)與邏輯不失真，能從失敗中迭代優(yōu)化，交付高質(zhì)量的結(jié)果。

GLM-5.1正是體現(xiàn)這一能力的模型。

結(jié)合自身實(shí)踐，李子玄提出，如今的AI研究員要像產(chǎn)品經(jīng)理一樣懂場(chǎng)景，評(píng)測(cè)已經(jīng)成為引領(lǐng)模型發(fā)展的重要管理方法。而在PMF方面，企業(yè)需要進(jìn)行前瞻布局與技術(shù)儲(chǔ)備，才能在技術(shù)拐點(diǎn)到來(lái)時(shí)捕捉機(jī)遇。

▲李子玄

2、阿里云王作書：AI將帶來(lái)全局性機(jī)遇

阿里云千問大模型解決方案資深總監(jiān)王作書觀察到，大模型已走過學(xué)術(shù)奠基、產(chǎn)業(yè)投入階段，步入了商業(yè)加速期。當(dāng)前，模型推理能力顯著增強(qiáng)，多模態(tài)融合與開源生態(tài)日趨成熟，AI正從“聊天”進(jìn)化為核心生產(chǎn)力。

為此，阿里巴巴成立ATH事業(yè)群，圍繞“創(chuàng)造token、輸送token、應(yīng)用token”升級(jí)了其AI戰(zhàn)略，目前已圍繞著文本、多模態(tài)等多條主線研發(fā)模型，最新成果包括Qwen3.6系列模型、Qwen3.5-Omni、萬(wàn)相2.7等。

王作書透露，阿里大模型團(tuán)隊(duì)未來(lái)的三大技術(shù)目標(biāo)為提升知識(shí)規(guī)模和效率、增強(qiáng)智能水平和多模態(tài)融合。

她還提出了價(jià)值四象限的概念：未來(lái)AI將創(chuàng)新力/勞動(dòng)力為縱軸、產(chǎn)品力/生產(chǎn)力為橫軸持續(xù)擴(kuò)展，推動(dòng)消費(fèi)電子、生產(chǎn)系統(tǒng)等升級(jí)，帶來(lái)全局性機(jī)遇。

▲王作書

3、焱融科技張文濤：AI競(jìng)爭(zhēng)本質(zhì)是數(shù)據(jù)競(jìng)爭(zhēng)

焱融科技CTO張文濤觀察到，AI的競(jìng)爭(zhēng)本質(zhì)上是數(shù)據(jù)的競(jìng)爭(zhēng)，無(wú)論是訓(xùn)練還是推理，都對(duì)高性能、低延遲、去孤島化的數(shù)據(jù)存儲(chǔ)基礎(chǔ)設(shè)施有著迫切需求。

焱融應(yīng)對(duì)上述挑戰(zhàn)的思路是打造一套全棧AI存儲(chǔ)解決方案。具體來(lái)看，該公司的全閃存儲(chǔ)一體機(jī)產(chǎn)品F9000X采用了冷熱數(shù)據(jù)智能分層、彈性網(wǎng)絡(luò)等技術(shù)，使得每GiB/s帶寬成本下降60%，并在MLPerf Storage v2.0測(cè)試中排名榜首。

面向推理場(chǎng)景，焱融推出了涵蓋DRAM到本地盤再到遠(yuǎn)端共享存儲(chǔ)的多級(jí)KVCache緩存管理系統(tǒng)YRCache，并通過智能預(yù)取、異步卸載、零拷貝等技術(shù)實(shí)現(xiàn)加速。

同時(shí)，焱融科技也提供了企業(yè)全域數(shù)據(jù)管理平臺(tái)DataInsight，可以統(tǒng)一納管分散在各處的數(shù)據(jù)孤島，形成統(tǒng)一視圖，并支持自定義數(shù)據(jù)流向，給大模型訓(xùn)練提供便利。

▲張文濤

4、連信數(shù)字/連心云黃杏：理解“人”是AI進(jìn)入真實(shí)世界的關(guān)鍵

連信數(shù)字/連心云洞見研究院院長(zhǎng)黃杏認(rèn)為，現(xiàn)實(shí)中的管理者、面試官、家長(zhǎng)等群體，常常需要借助語(yǔ)言之外的信息來(lái)理解他人。同樣，當(dāng)前AI雖擅長(zhǎng)處理語(yǔ)言，但若想真正融入真實(shí)世界，就必須理解人心。

連信數(shù)字洞見研究院匯聚了心理學(xué)、算法與大數(shù)據(jù)的跨學(xué)科精英，“洞見人和”人本世界（心理）大模型以全球多源數(shù)據(jù)為底座，通過多模態(tài)感知與神經(jīng)符號(hào)AI的深度融合，改變了傳統(tǒng)的“經(jīng)驗(yàn)驅(qū)動(dòng)”分析，通過智能循證分析實(shí)現(xiàn)了對(duì)人類的深度洞察與全面刻畫。

這一模型已在公安、教育、司法、安全生產(chǎn)等行業(yè)落地實(shí)戰(zhàn)，并已覆蓋20多個(gè)省市，累計(jì)2000萬(wàn)+人群。

在大會(huì)現(xiàn)場(chǎng)，黃杏宣布，即日起，連信的所有模型能力與原生Agent將通過連心云能力平臺(tái)正式對(duì)外開放，賦能更多行業(yè)場(chǎng)景。

▲黃杏

5、上海AI Lab張鴻杰：統(tǒng)一多模態(tài)模型的關(guān)鍵不是技術(shù)選型

上海AI Lab青年研究員張鴻杰介紹，目前統(tǒng)一多模態(tài)大模型主要采用純自回歸、純擴(kuò)散與其他融合上述架構(gòu)的折中方案。但他認(rèn)為關(guān)鍵不是選路線，而是在統(tǒng)一上下文中實(shí)現(xiàn)理解與生成各有所長(zhǎng)，讓不同模態(tài)采用最適合的預(yù)測(cè)方式。

基于這一判斷，上海AI Lab研發(fā)了InternVL-U，一個(gè)4B參數(shù)的統(tǒng)一多模態(tài)大模型。具體來(lái)看，InternVL-U擁有統(tǒng)一上下文，但目標(biāo)照模態(tài)實(shí)現(xiàn)自適應(yīng)。這一模型采用InternVL 3.5的主干完成理解和推理，并把像素合成交給MMDiT，從而實(shí)現(xiàn)語(yǔ)義建模和視覺生成的分工。其理解與生成的視覺表征也完全解耦，理解用ViT高層語(yǔ)義特征，生成用VAE淺層重建特征，避免沖突。

目前，InternVL-U模型、數(shù)據(jù)管線與評(píng)測(cè)工具鏈均已開源，張鴻杰也呼吁社區(qū)一同參與到統(tǒng)一多模態(tài)模型的發(fā)展中來(lái)。

▲張鴻杰

6、商湯大裝置盧國(guó)強(qiáng)：AI系統(tǒng)的核心使用者，將從人轉(zhuǎn)變?yōu)锳gent

商湯大裝置產(chǎn)品總經(jīng)理盧國(guó)強(qiáng)認(rèn)為，行業(yè)正從“AI原生”邁向“Agent原生”新階段，未來(lái)AI系統(tǒng)的核心使用者將從人轉(zhuǎn)變?yōu)锳gent，交互方式、度量衡與安全邊界將因此發(fā)生根本性變化，帶來(lái)對(duì)Agent原生基礎(chǔ)設(shè)施的需求。

從具體設(shè)計(jì)上來(lái)看，Agent原生系統(tǒng)應(yīng)讓每一層都變得可發(fā)現(xiàn)、可理解、可操作。其中，算力層將由成本中心轉(zhuǎn)變?yōu)槔麧?rùn)中心，成為“收入工廠”；平臺(tái)層則通過token統(tǒng)一度量衡，實(shí)現(xiàn)智能化與標(biāo)準(zhǔn)化；應(yīng)用層需要實(shí)現(xiàn)“AI賦能AI”，使AI具備自主迭代能力。

基于此，商湯大裝置在2026年將愿景從“AI數(shù)字工廠”升級(jí)為“AI Token Factory”。這一工廠的原材料是算力、模型與數(shù)據(jù)，生產(chǎn)線是推理引擎、緩存與調(diào)度，產(chǎn)品是token，其每一層都需要進(jìn)行重新審視與設(shè)計(jì)，以更好服務(wù)Agent的需求。

▲盧國(guó)強(qiáng)

7、圓桌討論：AI下半場(chǎng)，大模型的演進(jìn)與終局

大模型專題論壇的圓桌討論由中信證券首席計(jì)算機(jī)行業(yè)分析師楊澤原主持，四位嘉賓分別是智譜Z.ai負(fù)責(zé)人李子玄、阿里云千問大模型解決方案資深總監(jiān)王作書、上海AI Lab青年研究員張鴻杰、商湯大裝置產(chǎn)品總經(jīng)理盧國(guó)強(qiáng)。

▲從左到右：楊澤原、李子玄、王作書、張鴻杰、盧國(guó)強(qiáng)

4位嘉賓先是結(jié)合自身背景談了幾個(gè)熱點(diǎn)話題。

編程模型方面，李子玄談道，在該領(lǐng)域保持領(lǐng)先的關(guān)鍵在于“品味”，也就是對(duì)技術(shù)趨勢(shì)的判斷力。對(duì)場(chǎng)景進(jìn)行細(xì)致挖掘、通過coding plan等渠道獲取反饋也很重要。

談及全模態(tài)模型，王作書認(rèn)為此類模型同時(shí)擁有“眼睛、嘴巴、耳朵”，將推動(dòng)智能邊界向三個(gè)方向拓展，分別是感知邊界、推理邊界和交互邊界，最終在視頻理解、自動(dòng)駕駛、實(shí)時(shí)音視頻交互提供更強(qiáng)的能力與更擬人的體驗(yàn)。

小尺寸多模態(tài)模型與大型原生多模態(tài)模型孰優(yōu)孰劣？張鴻杰稱，后者雖然架構(gòu)優(yōu)美，但訓(xùn)練代價(jià)大，也無(wú)法繼承現(xiàn)有模型的能力。相比之下，前者可在其他模型基礎(chǔ)上外擴(kuò)生成編輯能力，性能上限也不低。小模型在數(shù)據(jù)方面的短板可以結(jié)合Agent補(bǔ)齊，不必單打獨(dú)斗。

基礎(chǔ)設(shè)施方面，盧國(guó)強(qiáng)分享說(shuō)，盡管商湯大裝置已經(jīng)預(yù)判未來(lái)算力需求會(huì)大幅增長(zhǎng)，但其增幅仍然遠(yuǎn)遠(yuǎn)超出預(yù)期。在推理時(shí)代，模型獲得的輸入要遠(yuǎn)大于模型的輸出，這對(duì)基礎(chǔ)設(shè)施的每一層都提出挑戰(zhàn)，尤其是緩存效率。

嘉賓們也就幾個(gè)共同話題分享了觀點(diǎn)。

模型架構(gòu)、能力和場(chǎng)景迭代方面，多模態(tài)、空間智能、長(zhǎng)鏈路等被頻繁提及。李子玄總結(jié)道，目前模型迭代的本質(zhì)是智能提升和token效率優(yōu)化的循環(huán)，新應(yīng)用場(chǎng)景可能會(huì)因推理速度和穩(wěn)定性的提升而迎來(lái)爆發(fā)。

年初的龍蝦熱讓Harness走進(jìn)主流視野。4位嘉賓認(rèn)為，Harness可能會(huì)被模型逐漸內(nèi)化，或是與具體行業(yè)和場(chǎng)景結(jié)合得更為密切。

王作書談道，當(dāng)前Harness是模型的放大器，但長(zhǎng)期看會(huì)變成基礎(chǔ)設(shè)施被隱藏，模型向下做深邏輯與工具調(diào)用能力，Harness向上融入行業(yè)。張鴻杰覺得共生與內(nèi)化是漸進(jìn)過程，多模態(tài)的Harness比文本更具挑戰(zhàn)。盧國(guó)強(qiáng)提出模型決定上限，而Harness決定下限，兩者缺一不可。李子玄則預(yù)判，未來(lái)模型可能會(huì)自己“上發(fā)條”，不再依賴Harness，人只負(fù)責(zé)補(bǔ)充上下文。

談及廠商的全棧自主能力，幾位嘉賓都認(rèn)可其商業(yè)價(jià)值，但也不主張絕對(duì)化，而是要做好權(quán)衡與生態(tài)協(xié)同。全棧自主的落腳點(diǎn)最終仍是提供優(yōu)質(zhì)、穩(wěn)定、高效的服務(wù)與商業(yè)價(jià)值。

八、從“龍蝦”、AI眼鏡到token管理，拆解國(guó)產(chǎn)智能體落地潮

在AI智能體專題論壇，8位嘉賓分別從底層架構(gòu)、技術(shù)演進(jìn)、模型創(chuàng)新、硬件載體、垂直場(chǎng)景落地及企業(yè)級(jí)管控工具等方面，拆解智能體商業(yè)化路徑。

從大廠打造的開源桌面級(jí)“龍蝦”產(chǎn)品、智能體底層架構(gòu)創(chuàng)新，到AI編程、AI營(yíng)銷、AI眼鏡、token管理等賽道，他們正在推動(dòng)智能體更好地幫人們做事。

1、網(wǎng)易有道王寧：20余天速成國(guó)內(nèi)首個(gè)桌面級(jí)“龍蝦”

網(wǎng)易有道LobsterAI項(xiàng)目負(fù)責(zé)人、智能硬件研發(fā)負(fù)責(zé)人王寧分享說(shuō)，他們經(jīng)過20余天快速打磨，2月19日正式推出國(guó)內(nèi)大廠的第一個(gè)開源桌面級(jí)“龍蝦”LobsterAI。

其內(nèi)部認(rèn)為，OpenClaw是Agent時(shí)代的Linux系統(tǒng)，因此他們將有道“龍蝦”底層架構(gòu)切換為OpenClaw，上層保留自研GUI與業(yè)務(wù)流程，通過進(jìn)程通信實(shí)現(xiàn)兼容。

他提到Agent產(chǎn)品的未來(lái)新機(jī)遇包括Agent向各領(lǐng)域滲透、Skill即服務(wù)、開源生態(tài)共建、AI Native工作流、多Agent協(xié)作、Agent原生硬件等。

▲王寧

2、階躍星辰袁微：Agent技術(shù)核心轉(zhuǎn)向外部環(huán)境構(gòu)建

階躍星辰算法專家袁微提到AI Agent的演進(jìn)包括三個(gè)階段，分別是提示詞工程時(shí)代、上下文工程時(shí)代、Harness Engineering時(shí)代，當(dāng)下焦點(diǎn)已從模型本身轉(zhuǎn)向構(gòu)建完善外部運(yùn)行環(huán)境，是Agent從Demo走向產(chǎn)品的關(guān)鍵。

當(dāng)前處于Agent能力躍遷拐點(diǎn)，技術(shù)核心從模型競(jìng)賽轉(zhuǎn)向系統(tǒng)工程與環(huán)境構(gòu)建，Harness + OpenClaw是將基礎(chǔ)模型能力轉(zhuǎn)化為企業(yè)級(jí)可交付Agent產(chǎn)品的關(guān)鍵方案。其中，Harness是Agent的腳手架，對(duì)應(yīng)系統(tǒng)層，OpenClaw是Agent的調(diào)度引擎。

▲袁微

3、華為林煒哲：DLLM Agent有望成為下一代Agent系統(tǒng)基石

華為中央研究院先進(jìn)計(jì)算與存儲(chǔ)實(shí)驗(yàn)室大模型算法專家林煒哲提到，Diffusion模型在同等訓(xùn)練條件的智能體場(chǎng)景下，比AR Agent更快、規(guī)劃更優(yōu)、端到端效率更高。

他們研究發(fā)現(xiàn)，DLLM Agent在同等序列長(zhǎng)度、輪次約束下，能保持與AR Agent一致的任務(wù)精度，同時(shí)還能實(shí)現(xiàn)信息搜集調(diào)用量顯著下降、任務(wù)拆分更精準(zhǔn)、搜索輪次更少、耗時(shí)更短，疊加輕量采樣算法可大幅提高精度，而AR Agent疊加復(fù)雜算法會(huì)顯著增加消耗，進(jìn)一步拉開性能差距。

林煒哲認(rèn)為，DLLM Agent有望成為下一代Agent系統(tǒng)重要基石。

▲林煒哲

4、雷鳥創(chuàng)新程思婕：兩大判斷定調(diào)眼鏡是下一代AI最佳載體

如今智能眼鏡進(jìn)入爆發(fā)期，蘋果、小米、阿里等大廠入局，賽道轉(zhuǎn)向紅海。雷鳥創(chuàng)新AI負(fù)責(zé)人程思婕拋出結(jié)論：眼鏡是下一代AI的最佳載體。其兩大判斷依據(jù)是，眼鏡是最佳的全域數(shù)據(jù)采集終端和隨身智能體載體。

一方面，眼鏡可以全天候貼身佩戴、無(wú)感采集第一人稱交互數(shù)據(jù)、搶占物理世界原生數(shù)據(jù)入口，另一方面，其適配原生語(yǔ)音交互，支持一句話完成任務(wù)、打造個(gè)人隨身外腦、下一代個(gè)性化推薦系統(tǒng)。

此外她認(rèn)為，相較于機(jī)器人，智能眼鏡作為AI載體的優(yōu)勢(shì)是，可以通過數(shù)據(jù)飛輪實(shí)現(xiàn)數(shù)據(jù)閉環(huán)與模型迭代，僅作為輔助決策的“外腦”，無(wú)需底層控制，從而規(guī)避機(jī)器人的數(shù)據(jù)瓶頸、底層控制難題。

▲程思婕

5、阿里云沈林：5個(gè)準(zhǔn)則打通Agent上下文環(huán)境數(shù)據(jù)構(gòu)造

阿里云高級(jí)技術(shù)專家沈林分享了EventHouse實(shí)踐的5個(gè)準(zhǔn)則：

（1）Think like an Agent，給你的Agent足夠的信息感知能力；

（2）給你的信息編寫一本“圖書館館藏目錄”；

（3）知識(shí)不是“信息囤積”，和你的Agent做好“知識(shí)對(duì)賬”；

（4）每次知識(shí)迭代都是一次生產(chǎn)級(jí)變更發(fā)布；

（5）“簡(jiǎn)單”、“可靠”不是錦上添花，而是很多行業(yè)的入場(chǎng)券。

▲沈林

6、極狐馭碼宋�。篈I Coding已進(jìn)入準(zhǔn)交付級(jí)編程階段

AI Coding是AI技術(shù)落地的高價(jià)值入口，但目前市場(chǎng)上對(duì)AI Coding存在“玩具論”和“萬(wàn)能論”兩大暴論。極狐馭碼資深A(yù)I解決方案架構(gòu)師宋健認(rèn)為兩種觀點(diǎn)均有失偏頗，AI Coding已進(jìn)入準(zhǔn)交付級(jí)編程階段，有實(shí)用價(jià)值但仍需工程團(tuán)隊(duì)投入時(shí)間學(xué)習(xí)和實(shí)踐。

AI Coding智能體的五大關(guān)鍵技術(shù)是模式、規(guī)則、工作流、MCP、Skills，模式是將智能體預(yù)先劃分成不同角色、規(guī)則是為智能體定規(guī)矩、工作流類似寫腳本、MCP是擴(kuò)展智能體能力的工具箱、Skills是原子化的功能插件，協(xié)同用好這些關(guān)鍵技術(shù)和功能是企業(yè)實(shí)施AI Coding的關(guān)鍵。

▲宋健

7、Noumena AI趙歡：AI營(yíng)銷增長(zhǎng)潛力僅次于編程

Noumena AI（物自體科技）聯(lián)合創(chuàng)始人、產(chǎn)品算法負(fù)責(zé)人趙歡的判斷是，營(yíng)銷是僅次于AI Coding領(lǐng)域的爆發(fā)式增長(zhǎng)場(chǎng)景，且與Coding場(chǎng)景邏輯完全不同。

營(yíng)銷場(chǎng)景面臨數(shù)據(jù)割裂、人員流失導(dǎo)致經(jīng)驗(yàn)丟失、平臺(tái)算法迭代快、品牌方難以適配等痛點(diǎn)。Noumena AI推出了營(yíng)銷行業(yè)的龍蝦產(chǎn)品GrowClaw，不僅能解決典型的營(yíng)銷問題比如內(nèi)容洞察，達(dá)人篩選，內(nèi)容運(yùn)營(yíng)，投流分享等，還可以適配持續(xù)維護(hù)狀態(tài)、持續(xù)更新、多方協(xié)作的營(yíng)銷業(yè)務(wù)系統(tǒng)。

針對(duì)OpenClaw穩(wěn)定性差、非技術(shù)用戶上手難問題，趙歡稱他們?cè)趦?nèi)部打造了“龍蝦醫(yī)院”和“龍蝦學(xué)院”，以實(shí)現(xiàn)Agent故障自動(dòng)診斷以及AI自動(dòng)學(xué)習(xí)、快速為業(yè)務(wù)提供Skill等。

▲趙歡

8、清程極智李浩瑞：首發(fā)企業(yè)級(jí)token管理工具，即將開源

清程極智技術(shù)專家李浩瑞首次正式發(fā)布了其企業(yè)級(jí)token管理新品ATM（Agent Token Manager），該產(chǎn)品后續(xù)將開源。

ATM的核心功能是本地聚合網(wǎng)關(guān)、Agent身份級(jí)管控、智能路由下放、本地?cái)?shù)據(jù)存儲(chǔ)、Agent原生適配，他們實(shí)測(cè)顯示，本地網(wǎng)關(guān)融合云端、本地大模型后使得成本降低70%。

為了幫助企業(yè)在AI轉(zhuǎn)型中進(jìn)行token管控與質(zhì)量追蹤，清程極智的AI Ping可以在MaaS層通過持續(xù)模型服務(wù)評(píng)測(cè)，提供高質(zhì)量低價(jià)格token；ATM是本地網(wǎng)關(guān)，在本地通過Agent身份級(jí)管控實(shí)現(xiàn)精細(xì)化企業(yè)內(nèi)部治理。

▲李浩瑞

9、圓桌討論：OpenClaw x Harness Engineering，AI智能體的范式革命

圓桌討論環(huán)節(jié)由智東西聯(lián)合創(chuàng)始人、智猩猩總經(jīng)理何峰主持，四位嘉賓分別是階躍星辰算法專家袁微，雷鳥創(chuàng)新AI負(fù)責(zé)人程思婕，清程極智技術(shù)專家李浩瑞，Noumena AI（物自體科技）聯(lián)合創(chuàng)始人、產(chǎn)品算法負(fù)責(zé)人趙歡。

嘉賓們探討了當(dāng)下OpenClaw與Hermes Agent之間的“養(yǎng)蝦、養(yǎng)馬”爭(zhēng)論、Skill是否會(huì)吃掉App等諸多熱點(diǎn)話題。

▲從左到右：何峰、袁微、程思婕、李浩瑞、趙歡

袁微站在模型團(tuán)隊(duì)角度稱，OpenClaw開啟了AI智能體爆發(fā)元年，當(dāng)下Agent實(shí)現(xiàn)生產(chǎn)級(jí)交付的最大瓶頸是模型研發(fā)，因?yàn)槭忻嫔系耐ㄓ肂enchmark很難對(duì)應(yīng)每個(gè)人需求，因此他們?cè)噲D通過收集專家意見、用戶的實(shí)際體驗(yàn)、自建Benchmark等方式，讓模型體驗(yàn)和大多數(shù)人體感保持一致。

作為硬件廠商的代表，程思婕認(rèn)為Skills會(huì)逐步替代App，而當(dāng)下Skill變成App的壁壘在生態(tài)層面，需要大廠開放自己的原子能力。圍繞OpenClaw與眼鏡的結(jié)合，雷鳥創(chuàng)新制定了三步戰(zhàn)略，第一步是面向開發(fā)者，讓眼鏡作為輸入入口快速接入OpenClaw，第二步打通App讓其絲滑連接Agent，第三步是內(nèi)部自研類似框架。

作為Token服務(wù)商，李浩瑞提到一個(gè)現(xiàn)象，Hermes Agent出來(lái)后，OpenClaw的Token消耗在下降，這進(jìn)一步說(shuō)明，越來(lái)越聰明、越來(lái)越懂用戶的Agent是技術(shù)上的大趨勢(shì)。企業(yè)內(nèi)部管理Token的最大難點(diǎn)，就是不知道Token消耗流去了哪里，這也是他們打造本地Token管理工具的原因。

在營(yíng)銷這一垂類場(chǎng)景，趙歡認(rèn)為，OpenClaw是產(chǎn)品形態(tài)革新，能大幅降低非技術(shù)人群AI使用門檻，未來(lái)模型會(huì)逐步吃掉Harness，垂類廠商需構(gòu)建領(lǐng)域護(hù)城河。他們判斷一個(gè)場(chǎng)景是否真正適合Agent落地的兩個(gè)視角是，本身的技術(shù)場(chǎng)景匹配度，以及場(chǎng)景商業(yè)價(jià)值、落地困難程度。

結(jié)語(yǔ)：生成式AI產(chǎn)業(yè)開始告別“早期階段”

今年AI產(chǎn)業(yè)依然在飛速變化。年初的“養(yǎng)龍蝦”熱潮帶動(dòng)token消耗量爆發(fā)，密集迭代的各類大模型持續(xù)帶來(lái)新的驚喜，業(yè)界已經(jīng)對(duì)基準(zhǔn)測(cè)試分?jǐn)?shù)祛魅，轉(zhuǎn)而更看重真實(shí)的任務(wù)完成度，新一輪AI基建潮正如火如荼開展。

被業(yè)界期盼已久的DeepSeek-V4，也交出了一份具有開創(chuàng)意義的答卷：不僅繼續(xù)做到大幅壓低成本和性能領(lǐng)先，而且寫出了一個(gè)打破海外芯片依賴的新敘事。

這場(chǎng)空前的產(chǎn)業(yè)爆發(fā)之中，還有一些需要面對(duì)的問題。

模型迭代速度之快，正在給企業(yè)用戶帶來(lái)選擇疲勞。相比追逐新模型，企業(yè)更需要的是建立與模型無(wú)關(guān)的架構(gòu)能力。

模型能力與安全的矛盾也在激化。Anthropic手握強(qiáng)大的Mythos模型卻不敢全面發(fā)布，ChatGPT Images 2.0生成的圖像已經(jīng)以假亂真，其他旗艦?zāi)Ｐ屯瑯用媾R網(wǎng)絡(luò)安全風(fēng)險(xiǎn)的審慎評(píng)估。前沿能力的發(fā)布正成為一個(gè)越來(lái)越沉重的決策。

與此同時(shí)，炒作性宣傳和情緒生意也在侵蝕行業(yè)的判斷力，真正的技術(shù)進(jìn)展反而被淹沒在噪聲之中。在DeepSeek-V4新聞稿的結(jié)尾，有一句引自《荀子》的名言：“不誘于譽(yù)，不恐于誹，率道而行，端然正己。”也愿生成式AI道路上的前行者們，都有類似的定力。

而AI產(chǎn)品最終需要以真實(shí)的商業(yè)回報(bào)來(lái)驗(yàn)證。頭部企業(yè)交出了快速增長(zhǎng)的收入成績(jī)單，同時(shí)也在尋求巨額算力資源采購(gòu)，但這種支出比收入增長(zhǎng)更快的模式會(huì)持續(xù)多久，答案要等到新一代基礎(chǔ)設(shè)施真正投入運(yùn)營(yíng)之后才能揭曉。

AI正在不可逆轉(zhuǎn)地走向產(chǎn)業(yè)化，開始觸及軟件開發(fā)、知識(shí)工作和人機(jī)交互的底層范式。但截至目前，這個(gè)新型技術(shù)產(chǎn)業(yè)仍處于地基澆筑期，至于最終建成的大廈是什么模樣，可能連建設(shè)者自己都還無(wú)法完全想象。

2026年這個(gè)春天，生成式AI產(chǎn)業(yè)開始告別它的“早期階段”。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.