国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI最瘋狂的一周,該知道的8大共識(shí)都在這了

0
分享至


智東西
作者 GenAICon 2026

短短8天,全球AI領(lǐng)域發(fā)生的重磅新聞,發(fā)布節(jié)奏之密、信息密度之高、資金體量之大、涉及玩家之廣,堪稱驚心動(dòng)魄。

從4月16日到24日,Anthropic Claude Opus 4.7、阿里Qwen3.6-Max、月之暗面Kimi K2.6、OpenAI ChatGPT Images 2.0、螞蟻Ling-2.6-flash、小米MiMo-V2.5-Pro、騰訊Hy3、OpenAI GPT-5.5、DeepSeek-V4等9款前沿模型扎堆發(fā)布。

同一時(shí)期,亞馬遜和谷歌相繼表示分別擬向Anthropic投資250億美元400億美元,馬斯克SpaceX宣布擬以600億美元收購(gòu)AI編程獨(dú)角獸Cursor,DeepSeek啟動(dòng)外部融資的傳聞亦沸沸揚(yáng)揚(yáng)。

這一周大事串聯(lián)起來(lái),映射出5個(gè)清晰的趨勢(shì):

  • AI競(jìng)爭(zhēng)的核心戰(zhàn)場(chǎng)已從“聊天”轉(zhuǎn)向“干活”;
  • 中美AI頭部梯隊(duì)基本形成,并在持續(xù)沖鋒;
  • 中國(guó)AI在開源和成本效率上展現(xiàn)出獨(dú)特競(jìng)爭(zhēng)力;
  • 算力基礎(chǔ)設(shè)施將成為影響AI競(jìng)賽節(jié)奏的關(guān)鍵因素;
  • “投資+競(jìng)爭(zhēng)+合作”的新型多重產(chǎn)業(yè)關(guān)系正在確立。

值此期間,4月21日至22日,2026中國(guó)生成式AI大會(huì)(北京站)圓滿舉行。

大會(huì)由智東西主辦、智猩猩聯(lián)合主辦,集結(jié)73位產(chǎn)學(xué)研投嘉賓,圍繞“奔赴AGI 重塑未來(lái)”主題,通過1場(chǎng)開幕式、3場(chǎng)專題論壇、6場(chǎng)技術(shù)研討會(huì),全景式解析AI產(chǎn)業(yè)的產(chǎn)業(yè)脈絡(luò)、創(chuàng)新范式、Token經(jīng)濟(jì)與中國(guó)機(jī)會(huì)。

議題跨度很大,從大語(yǔ)言模型、多模態(tài)模型、世界模型、智能體、AI眼鏡等前沿模型與應(yīng)用,到數(shù)據(jù)、芯片、存儲(chǔ)、通信、云服務(wù)等基礎(chǔ)設(shè)施。

嘉賓們各抒己見,聊痛點(diǎn),講預(yù)判,立足當(dāng)下,探討未來(lái),分享內(nèi)容之豐富,非常挑戰(zhàn)大腦容量。

一個(gè)明確的共識(shí)是,國(guó)產(chǎn)AI戰(zhàn)場(chǎng),已經(jīng)從模型層擴(kuò)展到生態(tài)層。

我們整理了開幕式和3場(chǎng)專題論壇的嘉賓們分享的重點(diǎn)信息,希望能對(duì)你有啟發(fā)。

1、大模型怎么變強(qiáng)?達(dá)到垂域?qū)<宜街皇菚r(shí)間問題

2、小心養(yǎng)龍蝦、買token踩坑!聊聊大模型服務(wù)商不會(huì)告訴你的那些事

3、從Claude Code泄露代碼,總結(jié)6個(gè)反共識(shí)觀點(diǎn)

4、OpenClaw之后,智能體時(shí)代的中國(guó)機(jī)會(huì)在哪里?

5、世界模型的多重路徑:視頻生成、多模態(tài)原生統(tǒng)一、3D生成

6、Token消耗量爆發(fā),國(guó)產(chǎn)AI基礎(chǔ)設(shè)施如何協(xié)同與進(jìn)化?

7、大模型下半場(chǎng),競(jìng)爭(zhēng)焦點(diǎn)變成場(chǎng)景、數(shù)據(jù)、品味

8、從“龍蝦”、AI眼鏡到token管理,拆解國(guó)產(chǎn)智能體落地潮

一、大模型怎么變強(qiáng)?達(dá)到垂域?qū)<宜街皇菚r(shí)間問題

在開幕式上,中國(guó)人民大學(xué)高瓴人工智能學(xué)院教授趙鑫的演講圍繞一個(gè)根本問題:大模型怎么變強(qiáng)?

首先,大尺寸模型仍具有顯著的性能優(yōu)勢(shì),通過預(yù)測(cè)下一個(gè)詞的預(yù)訓(xùn)練范式能夠建立非常強(qiáng)的基礎(chǔ)能力;在后訓(xùn)練方面,一個(gè)重要方向是RLVR(基于結(jié)果監(jiān)督的強(qiáng)化學(xué)習(xí)),能針對(duì)垂直領(lǐng)域提升模型能力,提供了超越“預(yù)測(cè)下一個(gè)詞監(jiān)督訓(xùn)練”的另一條Scaling路線,為復(fù)雜智能體環(huán)境的訓(xùn)練構(gòu)建了可行的訓(xùn)練途徑。

接下來(lái),讓大模型學(xué)會(huì)使用工具,如搜索信息、用編程解決問題等。代碼執(zhí)行增強(qiáng)的推理鏈,解題過程更簡(jiǎn)潔清晰,顯著提升推理效率。

隨著任務(wù)復(fù)雜度提升,模型需要進(jìn)行大量輪次的交互,上下文窗口的管理成為挑戰(zhàn)。有兩種思路:一是通過模型自主壓縮上下文,二是使用文件來(lái)作為上下文的外部存儲(chǔ)介質(zhì)。

在多模態(tài)深度搜索場(chǎng)景中,圖片、視頻等內(nèi)容若直接token化,會(huì)急劇膨脹上下文。一個(gè)解決方案是搜索結(jié)果先寫入本地文件系統(tǒng),同時(shí)生成簡(jiǎn)短摘要進(jìn)入上下文窗口,后續(xù)需要時(shí)再按需加載,從而實(shí)現(xiàn)穩(wěn)定的百輪級(jí)多模態(tài)搜索。


▲趙鑫

給大模型一臺(tái)虛擬電腦(如終端/沙盒),可在非代碼領(lǐng)域激發(fā)通用能力。

大規(guī)模訓(xùn)練需要大量多樣化的環(huán)境,手動(dòng)創(chuàng)建幾萬(wàn)個(gè)環(huán)境不現(xiàn)實(shí)。近期研究顯著增加了智能體類數(shù)據(jù)的引入,比如DeepSeek-V3.2在強(qiáng)化學(xué)習(xí)中顯著增加構(gòu)造的智能體任務(wù)和配套環(huán)境,這些仿真環(huán)境旨在低成本高效合成大規(guī)模訓(xùn)練數(shù)據(jù)。

怎么模擬復(fù)雜環(huán)境呢?大多數(shù)智能體操作僅需輕量的沙盒,如果采用基于Docker環(huán)境訓(xùn)練代碼智能體的方法,可擴(kuò)展瓶頸會(huì)集中在Docker執(zhí)行層。此時(shí)可以用大模型代替Docker提供執(zhí)行反饋,來(lái)減少對(duì)真實(shí)Docker的創(chuàng)建需求。

當(dāng)前多智能體系統(tǒng)的核心挑戰(zhàn)在于長(zhǎng)程任務(wù)的穩(wěn)定性,這需要制定合適的工作流。

對(duì)此,高瓴人工智能學(xué)院開源的AiScientist系統(tǒng),將決策層與專家層分開,編排器專注階段級(jí)決策,專家負(fù)責(zé)復(fù)雜子任務(wù),讓文件成為智能體協(xié)調(diào)“總線”,從而實(shí)現(xiàn)復(fù)雜編排與協(xié)作。

最后,趙鑫教授分享了三點(diǎn)預(yù)判:

1、模型能力擴(kuò)展受限于人的認(rèn)知。目前可利用算力的方式仍然有限,突破需要新的擴(kuò)展范式。

2、大模型達(dá)到垂直領(lǐng)域?qū)<宜街皇菚r(shí)間問題,廣義AGI仍然困難。類似“下一個(gè)token預(yù)測(cè)”和RLVR這樣的重要訓(xùn)練擴(kuò)展范式,估計(jì)還需要出現(xiàn)1~2次,才能推動(dòng)廣義AGI的實(shí)現(xiàn)。

3、大部分創(chuàng)新是工程創(chuàng)新,AGI需要更多本質(zhì)創(chuàng)新。模型能力與Harness的發(fā)展是螺旋上升、互相適配的,基礎(chǔ)設(shè)施補(bǔ)強(qiáng)模型短板,模型提升后再推動(dòng)基礎(chǔ)設(shè)施演進(jìn);技術(shù)難以形成持久的護(hù)城河,人才、數(shù)據(jù)更為關(guān)鍵。

二、小心養(yǎng)龍蝦、買token踩坑!聊聊大模型服務(wù)商不會(huì)告訴你的那些事

清程極智聯(lián)合創(chuàng)始人師天麾點(diǎn)破了當(dāng)前token行業(yè)亂象——買token藏有很多坑

同一個(gè)模型,在不同服務(wù)商處購(gòu)買,效果不同,最終花費(fèi)不同,服務(wù)質(zhì)量可能差別巨大。

有次評(píng)測(cè),他們發(fā)現(xiàn)某個(gè)服務(wù)商的模型明顯有問題,問過后,服務(wù)商承認(rèn)用的是int4。這種量化能把成本壓得非常低,但是模型效果很差。

提供同一個(gè)模型,報(bào)價(jià)便宜的服務(wù)商反而可能用起來(lái)總成本更高,因?yàn)?strong>緩存命中率不一樣。

緩存命中率是一個(gè)非常影響總成本的指標(biāo)。各家服務(wù)商因?yàn)榧夹g(shù)不同,緩存命中率相差很大,好的能超過80%,差的緩存幾乎跟沒有一樣。

但服務(wù)商不會(huì)告訴客戶這件事。


▲師天麾

AI Ping團(tuán)隊(duì)對(duì)國(guó)內(nèi)30多家服務(wù)商的600個(gè)大模型API服務(wù)進(jìn)行了測(cè)試,服務(wù)商包括模型廠商、互聯(lián)網(wǎng)大廠、云上市公司和MaaS廠商。

根據(jù)他們的測(cè)試,大型服務(wù)商(如云廠商、電信運(yùn)營(yíng)商),在提供相同的模型服務(wù)、價(jià)格相近的情況下,各家服務(wù)性能可能相差5倍甚至更多

他們觀察到,近期國(guó)內(nèi)各家服務(wù)商的服務(wù)質(zhì)量,相比去年年底明顯差了很多。許多服務(wù)商不能給中小客戶保證質(zhì)量,響應(yīng)慢、有明顯性能問題。

“養(yǎng)龍蝦”等行業(yè)熱潮火爆,導(dǎo)致token供不應(yīng)求,又貴又慢。token服務(wù)又是黑盒,行業(yè)發(fā)展很快,也很亂,那怎么選對(duì)token服務(wù)商?

師天麾安利了清程極智研發(fā)的AI Ping:它對(duì)用戶關(guān)心的大模型服務(wù)指標(biāo)做了全面評(píng)測(cè)和匯總,并提供篩選排序和智能路由功能,以便用戶對(duì)不同大模型API服務(wù)進(jìn)行7×24評(píng)測(cè)和按需調(diào)用服務(wù)。

三、從Claude Code泄露代碼,總結(jié)6個(gè)反共識(shí)觀點(diǎn)

Pine AI首席科學(xué)家李博杰重點(diǎn)聊了聊從Claude Code泄露代碼中的收獲。

在他看來(lái),Claude Code源碼里的五層權(quán)限判斷、錯(cuò)誤恢復(fù)、安全防護(hù)工具集、反蒸餾防御機(jī)制等設(shè)計(jì),還有用做研究的方法做產(chǎn)品,都非常值得學(xué)習(xí)。


▲李博杰

李博杰還分享了從中總結(jié)出的6個(gè)反共識(shí)觀點(diǎn):

1、圖形界面(GUI)的價(jià)值將逐漸降低,軟件價(jià)值正從界面轉(zhuǎn)向數(shù)據(jù)治理,沒有數(shù)據(jù)壁壘的SaaS大概率被干掉。

智能體閱讀和思考速度遠(yuǎn)超人類,但操作GUI的速度比人慢,因此GUI對(duì)智能體不友好。

Claude Code就是典型的GUI價(jià)值低、業(yè)務(wù)邏輯與數(shù)據(jù)治理價(jià)值高的產(chǎn)品形態(tài),51萬(wàn)行源碼里沒有一個(gè)產(chǎn)品級(jí)GUI。

2、上下文是人類避免被AI取代的護(hù)城河。

AI能訪問的上下文遠(yuǎn)低于一個(gè)人類員工,比如吃飯時(shí)聊出來(lái)的設(shè)計(jì)目的、屎山代碼里的坑、沒表達(dá)出來(lái)的內(nèi)心想法。

告訴AI合適的上下文,也是用好AI的關(guān)鍵。

3、AI原生組織,本質(zhì)是用AI替代傳統(tǒng)的“上傳下達(dá)”層級(jí)結(jié)構(gòu)。

Anthropic、Kimi等公司的中層大幅壓縮,實(shí)現(xiàn)良好的上下文共享,讓高層看到基層信號(hào),讓基層直接看到戰(zhàn)略上下文。

“砍掉高層的手腳,砍掉中層的屁股,砍掉基層的腦袋”,這個(gè)段子在AI原生公司中不成立了。

4、哪些人會(huì)被AI替代?

頭部(高價(jià)值決策與創(chuàng)造)和尾部(與物理世界深度集成的工作)相對(duì)安全,腰部(執(zhí)行型、無(wú)泛化能力的標(biāo)準(zhǔn)化工作)最為危險(xiǎn)。

AI是技術(shù)能力的放大器,推動(dòng)非技術(shù)能力的重要性比重上升。學(xué)習(xí)新知識(shí)、適應(yīng)新場(chǎng)景的能力很關(guān)鍵。

一人公司(OPC)不是一個(gè)人能開發(fā)App,大多數(shù)獨(dú)立開發(fā)者的瓶頸不是寫不出代碼,而是獲客、信任、運(yùn)營(yíng)這些稀缺能力。

5、“模型即Agent”遠(yuǎn)遠(yuǎn)不夠。

真正的智能體里有一堆復(fù)雜的Harness來(lái)兜底解決模型搞不定的部分,代碼量遠(yuǎn)超工具+提示詞本身。只有模型公司同時(shí)控制應(yīng)用層和兜底工程。

Agent= Model x Harness。大模型提供“大腦”,而Harness提供了“手腳”和“韁繩”,包括上下文怎么給、工具怎么調(diào)用、出錯(cuò)怎么恢復(fù)、安全怎么保障、緩存怎么共享、并行怎么協(xié)調(diào)等。

6、應(yīng)用層公司的護(hù)城河在技術(shù)之外。

Harness里的“屎山”反映了模型內(nèi)部模型團(tuán)隊(duì)和應(yīng)用團(tuán)隊(duì)之間的張力,是應(yīng)用層短期的技術(shù)杠桿,但是技術(shù)優(yōu)勢(shì)會(huì)被模型公司的飛輪吃掉。

頂尖模型的差距還會(huì)繼續(xù)拉大,中端模型將趨于商品化。應(yīng)用層公司的長(zhǎng)期護(hù)城河是數(shù)據(jù)、渠道、拍照、用戶信任、網(wǎng)絡(luò)效應(yīng)等等。

四、高端對(duì)話:OpenClaw之后,智能體時(shí)代的中國(guó)機(jī)會(huì)在哪里?

高端對(duì)話環(huán)節(jié)由智東西聯(lián)合創(chuàng)始人、總編輯張國(guó)仁主持,三位嘉賓均在智能體領(lǐng)域頗有建樹,分別是香港大學(xué)助理教授&博士生導(dǎo)師、Nanobot團(tuán)隊(duì)負(fù)責(zé)人黃超,網(wǎng)易有道LobsterAI項(xiàng)目負(fù)責(zé)人、智能硬件研發(fā)負(fù)責(zé)人王寧,峰瑞資本投資合伙人陳石。

黃超團(tuán)隊(duì)的Nanobot開源項(xiàng)目?jī)H用約4000行代碼,實(shí)現(xiàn)了原版OpenClaw用43萬(wàn)行(現(xiàn)已超百萬(wàn)行)代碼的核心功能。

王寧團(tuán)隊(duì)的LobsterAI是國(guó)內(nèi)大廠第一個(gè)開源的桌面級(jí)智能體產(chǎn)品,1周獲得超過3k star,還被OpenClaw創(chuàng)始人Peter Steinberger發(fā)文夸贊。

陳石有超過15年的連續(xù)創(chuàng)業(yè)經(jīng)歷,曾任阿里高管,曾經(jīng)是一名快樂的程序員和用戶增長(zhǎng)專家,如今也是一位對(duì)AI行業(yè)深入跟蹤觀察的投資人。


▲從左到右:張國(guó)仁、黃超、王寧、陳石

1、智能體行業(yè)變化太快,2026年會(huì)是標(biāo)志性一年

黃超:智能體演進(jìn)太快了,去年底MCP普及到現(xiàn)在的Skill和Harness,僅三四個(gè)月。2026年可能是智能體生態(tài)爆發(fā)的一年,智能體的能力邊界擴(kuò)展需要整個(gè)Skill生態(tài)、環(huán)境交互體系的協(xié)同成熟。

王寧:OpenClaw大大加速整個(gè)智能體落地進(jìn)程,各行業(yè)都認(rèn)識(shí)到智能體能幫企業(yè)干活、提效、掙錢。去年Chat類產(chǎn)品一直在找營(yíng)收來(lái)源,比如靠廣告,其實(shí)沒掙太多錢。今年可能是Agent產(chǎn)品商業(yè)化爆發(fā)的起點(diǎn),真正能向用戶和企業(yè)收費(fèi)的Agent產(chǎn)品出現(xiàn)。

陳石:從去年下半年到今年年初,AI行業(yè)最大的變化是智能體開始在應(yīng)用層掙錢了,不再只是英偉達(dá)掙錢。OpenClaw開啟新的智能體范式,今年可能是AI真正能被大眾用起來(lái)的一年。

2、工程粗糙卻范式創(chuàng)新,OpenClaw為何能改變AI行業(yè)?

黃超:它的交互模式是創(chuàng)新的,看似簡(jiǎn)單的設(shè)計(jì),讓社區(qū)感受到智能體更加主動(dòng)。此前的智能體工具感太重,OpenClaw點(diǎn)燃了人們對(duì)”通用個(gè)人助手”的長(zhǎng)期期待。

王寧:類比移動(dòng)互聯(lián)網(wǎng)早期,很多App最初都是小團(tuán)隊(duì)做的、很粗糙,但商業(yè)模式和用戶場(chǎng)景滿足得很好。OpenClaw做了類似的事。

陳石:它也許在工程上還比較粗糙,但應(yīng)用范式創(chuàng)新對(duì)行業(yè)影響非常大。

3、OpenClaw降溫了?現(xiàn)象級(jí)產(chǎn)品完成歷史使命

陳石:當(dāng)前OpenClaw本身可能并不是一個(gè)特別優(yōu)質(zhì)的產(chǎn)品,但它是一個(gè)象征意義重大的現(xiàn)象級(jí)產(chǎn)品,它的核心定位是在“開放域里做無(wú)終點(diǎn)的事”,這是人類歷史上是第一次讓普通用戶用AI在數(shù)字世界中進(jìn)行不設(shè)限制的探索。之前的智能體產(chǎn)品包括Claude Code、Claude Cowork和Manus都不在這個(gè)定位。OpenClaw更像是普通人心中的“數(shù)字助手”或者“數(shù)字伙伴”的形象。

王寧:DeepSeek 也是大概火了兩個(gè)月,但之后它讓“推理能力”快速滲透到了各行各業(yè)。OpenClaw也有點(diǎn)類似,它也加速了Agent產(chǎn)品走向更廣泛的行業(yè)應(yīng)用。熱度會(huì)回落,但能力滲透一旦開始,真正的行業(yè)價(jià)值才剛剛開始釋放。

黃超:降溫可能是因?yàn)閠oken燒得多,事情做得沒達(dá)到預(yù)期。OpenClaw完成了它的使命,建立了智能體在用戶中的心智。熱度下去說(shuō)不定是好事,可以讓大家沉淀下來(lái)思考:什么時(shí)候需要讓OpenClaw變成真正能幫我們搬磚的打工人。

4、高質(zhì)量Skill很少,Harness極其重要

黃超:雖然很多to-use模塊從MCP進(jìn)化到Skill,Skill像MCP工具調(diào)用說(shuō)明書,但MCP存在的問題,Skill也存在,比如質(zhì)量控制不好。

Skill很多,但高質(zhì)量的Skill很少,檢索與匹配效率低下。未來(lái)需要專門的平臺(tái)對(duì)高質(zhì)量Skill進(jìn)行管理和分發(fā)。

Harness與模型能力相輔相成。長(zhǎng)程任務(wù)是一大工程挑戰(zhàn),上下文極度爆炸、實(shí)時(shí)環(huán)境交互復(fù)雜、中斷現(xiàn)象普遍,Harness顯得極其重要。

5、當(dāng)前AI行業(yè)的商業(yè)邏輯與創(chuàng)業(yè)建議

陳石:當(dāng)前AI行業(yè)的商業(yè)邏輯與移動(dòng)互聯(lián)網(wǎng)時(shí)代有根本性差異,不能做線性外推。

移動(dòng)互聯(lián)網(wǎng)時(shí)代有個(gè)著名的商業(yè)模式是“羊毛出在豬身上”,免費(fèi)獲客、廣告變現(xiàn),但其前提是單用戶使用成本很低。但AI產(chǎn)品用戶使用越多,Token消耗越大,當(dāng)前的成本遠(yuǎn)高于廣告的eCPM,在商業(yè)上根本跑不通。

未來(lái)AI行業(yè)大部分的收入將被token生產(chǎn)與分發(fā)環(huán)節(jié)的公司收走。智能體能夠獨(dú)立存在的機(jī)會(huì),在于廣泛收集人類的上下文(操作軌跡、使用場(chǎng)景、業(yè)務(wù)邏輯、行業(yè)知識(shí)),形成模型廠商搶不走的數(shù)據(jù)壁壘,用戶用得越多,越依賴,護(hù)城河越深。

建議早期智能體創(chuàng)業(yè)公司優(yōu)先考慮“前向收費(fèi)”,做不到就不要盲目擴(kuò)張,說(shuō)明還沒拿出能讓用戶愿意付費(fèi)的產(chǎn)品。另一個(gè)建議是“軟飯硬吃”,利用中國(guó)制造業(yè)供應(yīng)鏈優(yōu)勢(shì),在通過軟件掌握用戶需求和產(chǎn)品技術(shù)積累后,做出軟硬件一體的產(chǎn)品,這類產(chǎn)品到海外很能打。

6、中國(guó)版下一代智能體框架,機(jī)會(huì)在哪?

王寧:OpenClaw給國(guó)內(nèi)大模型廠商帶來(lái)了新的機(jī)會(huì),國(guó)內(nèi)模型價(jià)格大概只有海外模型的1/10,能力上又相差無(wú)幾,特別適合”龍蝦”場(chǎng)景。

企業(yè)級(jí)Agent也有一些新的機(jī)會(huì)。國(guó)內(nèi)已有不少國(guó)企和私企尋求將智能體產(chǎn)品在公司內(nèi)普及,并與內(nèi)部系統(tǒng)打通,需求涵蓋辦公自動(dòng)化、OA、財(cái)務(wù)、ERP和數(shù)據(jù)安全等場(chǎng)景。

黃超:國(guó)內(nèi)一直有應(yīng)用創(chuàng)新基因,有信心國(guó)內(nèi)機(jī)構(gòu)能打造出下一代真正成為打工人的智能體。

五、世界模型的多重路徑:視頻生成、多模態(tài)原生統(tǒng)一、3D生成

語(yǔ)言只是人類感知世界的通道之一,圖像、聲音、3D空間等多模態(tài)才構(gòu)成了物理世界的原始語(yǔ)言。

在世界模型方向,三位嘉賓從不同角度的分享,拼在一起很有意思。

1、智象未來(lái)姚霆:多模態(tài)創(chuàng)作智能體走向全模態(tài),即將發(fā)布HiDream-O1-Image圖像大模型

智象未來(lái)(HiDream.ai)聯(lián)合創(chuàng)始人兼CTO姚霆分享說(shuō),隨著語(yǔ)言模型與多模態(tài)大模型能力飛速躍升,多模態(tài)創(chuàng)作智能體的技術(shù)底座已基本成型,并將走向全模態(tài)世界模型。


▲姚霆

通用智能體的核心能力是:上下文管理、工具調(diào)用、開放域?qū)υ捙c任務(wù)自動(dòng)化,典型場(chǎng)景如定鬧鐘、訂外賣、制定旅行規(guī)劃。

在此基礎(chǔ)上,多媒體創(chuàng)作智能體還需解決專業(yè)性協(xié)作性、一致性可控性問題。其典型任務(wù)包括圖文內(nèi)容創(chuàng)作、視頻高光時(shí)刻剪輯、從故事到腳本到分鏡再到成片的完整視頻生成鏈路等。

當(dāng)前多模態(tài)生成模型的主流架構(gòu)存在一個(gè)缺陷:文本編碼與視覺編碼相互獨(dú)立,信息交互單向,且視覺VAE編碼器會(huì)造成信息損失。

下一代架構(gòu)的核心思路是將所有模態(tài)統(tǒng)一輸入到一個(gè)Unified Transformer,同時(shí)完成理解與生成,實(shí)現(xiàn)無(wú)損編碼+原生交互,走向“原生全模態(tài)”。

基于上述架構(gòu),智象未來(lái)即將發(fā)布HiDream-O1-Image系列模型,并將開源一個(gè)8B參數(shù)量的版本,該開源模型在6項(xiàng)基準(zhǔn)測(cè)試中達(dá)到與FLUX.2、Qwen-Image同量級(jí)甚至略優(yōu)的水平,并適配本地部署和低代碼智能體調(diào)用場(chǎng)景,同步,智象未來(lái)以此架構(gòu)為基礎(chǔ),逐步構(gòu)建智象下一代世界模型

圍繞多媒體創(chuàng)作需求,智象未來(lái)提出HiDream Agent OS基礎(chǔ)設(shè)施,分為工具層、Skill層、Harness層,可實(shí)現(xiàn)工具、創(chuàng)意、經(jīng)驗(yàn)可復(fù)用。

該團(tuán)隊(duì)已推出全能創(chuàng)作智能體vivago Agent視頻剪輯智能體HiClip Agent、影視創(chuàng)作智能體幀贊等智能體工具,其中幀贊已累計(jì)制作AI短劇漫劇超過5000分鐘。

姚霆認(rèn)為,多媒體創(chuàng)作智能體的終極目標(biāo),是讓創(chuàng)作回歸靈感本身,將重復(fù)性、工具性的工作交給智能體,讓人專注于真正屬于人的創(chuàng)造力。

2、北京大學(xué)袁粒:大語(yǔ)言模型快到頭了,多模態(tài)原生統(tǒng)一才是未來(lái)方向

北京大學(xué)深圳研究生院助理教授&研究員、博士生導(dǎo)師袁粒認(rèn)為,大語(yǔ)言模型已逼近極限,多模態(tài)原生統(tǒng)一才是未來(lái),沒有多模態(tài)原生統(tǒng)一,就沒有真正的世界模型。

同時(shí),他認(rèn)為將token翻譯成“詞元”是默認(rèn)大模型以語(yǔ)言為中心,這也是為什么GPT-5數(shù)不清人有幾根手指,大模型只專注語(yǔ)言這一模態(tài),無(wú)視其他物理模態(tài)(比如視覺),無(wú)法真正讓其走向物理AI。

多模型協(xié)作的方式在數(shù)字世界尚可運(yùn)行,但在物理世界存在兩大致命缺陷——高延遲信息損失。以機(jī)器人搬水為例,這個(gè)任務(wù)對(duì)人類來(lái)說(shuō)很簡(jiǎn)單,當(dāng)前絕大多數(shù)機(jī)器人仍無(wú)法流暢完成。

人類大腦構(gòu)建的世界模型天然是多模態(tài)、統(tǒng)一的。當(dāng)前所謂的“世界模型”,本質(zhì)上仍是單模態(tài)模型。只有實(shí)現(xiàn)多模態(tài)原生統(tǒng)一,才能構(gòu)建出真正理解物理世界的世界模型。


▲袁粒

構(gòu)建多模態(tài)原生統(tǒng)一架構(gòu),面臨五大技術(shù)挑戰(zhàn):如何定義“原生多模態(tài)”、自回歸建模與擴(kuò)散建模融合、多模態(tài)視覺編碼器統(tǒng)一、消解模態(tài)沖突、訓(xùn)練數(shù)據(jù)清洗和標(biāo)注等。

袁粒團(tuán)隊(duì)在多模態(tài)理解、生成、架構(gòu)與統(tǒng)一方向均有一些代表性工作。例如,其Helios原生實(shí)時(shí)視頻架構(gòu)采用自回歸+擴(kuò)散Transformer,無(wú)需KV Cache等加速技巧,單卡可達(dá)近實(shí)時(shí)生成。

袁粒還展示了由其課題組多模態(tài)統(tǒng)一方法生成的圖像,無(wú)論是現(xiàn)實(shí)復(fù)雜場(chǎng)景生成還是數(shù)學(xué)虛擬生成都遠(yuǎn)超其余同期模型水平。

3、VAST梁鼎:3D+視頻,或許才是世界模型的終態(tài)

VAST CTO梁鼎分享說(shuō),3D生成模型正在從單點(diǎn)能力走向完整的生產(chǎn)管線覆蓋,高模與低模兩條關(guān)鍵技術(shù)路線并行發(fā)展,Tripo大模型在游戲、工業(yè)、家裝、潮玩等行業(yè)已產(chǎn)生實(shí)質(zhì)影響,VR/XR與具身智能仿真環(huán)境的建設(shè)也高度依賴3D能力。

圍繞這兩條技術(shù)路線和對(duì)應(yīng)生產(chǎn)需求,VAST已經(jīng)推出了行業(yè)SOTA的兩款A(yù)I3D大模型:Trpo H3.1和Tripo P1.0。

Tripo H3.1追求高視覺質(zhì)量與貼圖精細(xì)度,適用于3D打印、工業(yè)設(shè)計(jì)、實(shí)體制造等對(duì)視覺還原度要求高、無(wú)需實(shí)時(shí)渲染的場(chǎng)景。

Tripo P1.0專為實(shí)時(shí)渲染引擎設(shè)計(jì),核心優(yōu)勢(shì)包括直接從圖片生成低模、生成速度快、生成結(jié)果具備拓?fù)溆押煤蚒V友好的特性等,適用于游戲管線制作、UGC生成式玩法、移動(dòng)端3D資產(chǎn)生成等。


▲梁鼎

單個(gè)資產(chǎn)的生成只是起點(diǎn),完整的3D制作管線還涉及部件拆分、貼圖編輯、骨骼綁定等環(huán)節(jié)。目前低模上的拆件與綁骨能力、場(chǎng)景級(jí)別的自動(dòng)化生成、從視頻中提取動(dòng)畫的能力等仍待突破。

當(dāng)前世界模型的構(gòu)建存在兩派:視頻原生派3D原生派。這與早年3D生成領(lǐng)域2D升維與3D原生的路線之爭(zhēng)很相似。視頻路線的優(yōu)勢(shì)是生成效果好、訓(xùn)練數(shù)據(jù)充足,但存在長(zhǎng)時(shí)序記憶難、多人一致性難、推理成本高等局限性。3D路線的難點(diǎn)在于制作門檻與畫質(zhì)上限。

梁鼎認(rèn)為,兩條路線最終很可能走向融合,世界模型的終態(tài)或許是3D與視頻共同驅(qū)動(dòng)的統(tǒng)一方案,3D在其中將扮演不可或缺的結(jié)構(gòu)性角色。

六、Token消耗量爆發(fā),國(guó)產(chǎn)AI基礎(chǔ)設(shè)施如何協(xié)同與進(jìn)化?

無(wú)論是前沿模型訓(xùn)練,還是蓬勃發(fā)展的AI應(yīng)用推理浪潮,都對(duì)AI基礎(chǔ)設(shè)施中的計(jì)算、存儲(chǔ)、互連架構(gòu)提出更高的協(xié)同要求,算力層也正從成本中心演變?yōu)橐詔oken為計(jì)量維度的利潤(rùn)中心。

如何推動(dòng)token成本持續(xù)下降,是擺在AI基礎(chǔ)設(shè)施供應(yīng)商們面前的共同考題。

在AI算力基礎(chǔ)設(shè)施專題論壇,嘉賓們從計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、云服務(wù)等不同維度,分享推動(dòng)國(guó)產(chǎn)AI算力走向普惠的可行路徑。

具身智能芯片方案如何支撐機(jī)器人集群算力需求?企業(yè)使用算力面臨哪些主要痛點(diǎn)?芯片架構(gòu)設(shè)計(jì)如何提升能效比?誰(shuí)是提升token生產(chǎn)效率的隱形障礙?國(guó)產(chǎn)AI算力生態(tài)怎樣形成聚合?來(lái)聽聽他們的答案。

1、芯橋張?chǎng)危壕呱碇悄苄枰绻?jié)點(diǎn)算力協(xié)同

芯橋半導(dǎo)體解決方案副總裁張?chǎng)握劦,隨著具身智能機(jī)器人從單點(diǎn)執(zhí)行走向群體智能,算力問題也從單點(diǎn)性能提升轉(zhuǎn)向跨節(jié)點(diǎn)協(xié)同與分層調(diào)度。

受制于電池續(xù)航、板卡面積等條件,單臺(tái)機(jī)器人的算力存在物理上限。對(duì)此,芯橋半導(dǎo)體提出了五位一體、軟件協(xié)同的“大腦-小腦-肌肉”架構(gòu),通過分布式方案來(lái)支撐機(jī)器人集群算力需求。

其中,在決策層,X200芯片提供682TOPS峰值算力、819.2GB/s HBM2E帶寬,支持50-100臺(tái)機(jī)器人協(xié)同作業(yè);在感知層,S200邊緣計(jì)算芯片提供128GB顯存、66W被動(dòng)散熱、4800FPS極速解碼,以便機(jī)器人實(shí)時(shí)處理感知數(shù)據(jù)。

芯橋還提供宏觀任務(wù)調(diào)度與集群管理、精細(xì)單元控制與實(shí)時(shí)狀態(tài)監(jiān)控等功能。


▲張?chǎng)?/p>

2、Hammerspace王殿清:別浪費(fèi)了GPU服務(wù)器本地存儲(chǔ)

Hammerspace資深解決方案架構(gòu)師王殿清說(shuō),AI產(chǎn)業(yè)正從模型軍備競(jìng)賽轉(zhuǎn)向推理效率、基礎(chǔ)設(shè)施重構(gòu)的系統(tǒng)性競(jìng)爭(zhēng)。存儲(chǔ)基礎(chǔ)設(shè)施存在數(shù)據(jù)分散、傳輸費(fèi)時(shí)費(fèi)力等不便,GPU服務(wù)器本地存儲(chǔ)一直未得到充分利用。打破存儲(chǔ)孤島是AI走向大規(guī)模落地的關(guān)鍵基礎(chǔ)條件

高性能存儲(chǔ)設(shè)備的速度遠(yuǎn)超外部存儲(chǔ),卻因?yàn)榇鎯?chǔ)孤島、不受保護(hù)、難以在本地存儲(chǔ)和外部共享存儲(chǔ)間移動(dòng)數(shù)據(jù)等問題,一直未被使用。以千節(jié)點(diǎn)集群為例,每節(jié)點(diǎn)數(shù)百TB的本地盤如果僅作臨時(shí)緩存,浪費(fèi)的存儲(chǔ)空間可達(dá)數(shù)百PB。

Hammerspace Tier 0技術(shù)可將GPU服務(wù)器磁盤配置為一個(gè)或多個(gè)NFS導(dǎo)出,由軟件統(tǒng)一納管,形成為一個(gè)全局可見、共享的存儲(chǔ)層。Meta便基于標(biāo)準(zhǔn)架構(gòu),利用現(xiàn)有服務(wù)器、網(wǎng)絡(luò)、GPU,節(jié)省了多達(dá)數(shù)百萬(wàn)美元。


▲王殿清

3、GMI Cloud蔣劍彪:今年算力市場(chǎng)呈四大變化

GMI Cloud中國(guó)區(qū)總裁蔣劍彪分享了2026年AI產(chǎn)業(yè)的4大核心趨勢(shì):1)推理成AI基礎(chǔ)設(shè)施的主要市場(chǎng);2)智能體推動(dòng)token消耗千倍級(jí)增長(zhǎng),主要客戶普遍提前鎖定算力資源;3)AI編程引爆一人公司(OPC)模式,成AIGC應(yīng)用下一個(gè)關(guān)鍵增長(zhǎng)引擎;4)智算中心從存儲(chǔ)倉(cāng)庫(kù)轉(zhuǎn)向算力工廠,追求極致算力密度、能效比與token吞吐量。

GMI Cloud是一家領(lǐng)先的AI Native Cloud服務(wù)商,是全球七大Reference Platform NVIDIA Cloud Partner之一,擁有遍布全球的數(shù)據(jù)中心,為企業(yè)AI應(yīng)用提供最新、最優(yōu)的GPU云服務(wù),為全球新創(chuàng)公司、研究機(jī)構(gòu)和大型企業(yè)提供穩(wěn)定安全、高效經(jīng)濟(jì)的AI云服務(wù)解決方案。

蔣劍彪預(yù)告說(shuō),GMI Cloud面向龍蝦智能體(Claws Agents)的全新生態(tài)產(chǎn)品The GMI Claw Marketplace即將上線,將面向企業(yè)用戶和AI開發(fā)者,提供一站式端到端解決方案。


▲蔣劍彪

4、九章云極張磊:讓算力像水電一樣管夠

九章云極DataCanvas解決方案專家張磊總結(jié)說(shuō),企業(yè)使用算力有三大痛點(diǎn)——買不起、用不滿、管不好。九章云極以AI原生基礎(chǔ)設(shè)施與智算云為核心,希望將算力轉(zhuǎn)化為標(biāo)準(zhǔn)化的普惠AI資源。

作為普惠算力的核心載體,九章云極提出了算力服務(wù)單位“度”,定義1度算力=312TFLOPS*1小時(shí),以便將不同算力卡通過統(tǒng)一技術(shù)指標(biāo)換算為一個(gè)標(biāo)準(zhǔn)度量單位。用戶可按需購(gòu)買、秒級(jí)啟用,僅對(duì)有效計(jì)算時(shí)間付費(fèi),徹底避免了硬件資源閑置與浪費(fèi),顯著降低了AI研發(fā)與使用的門檻與總擁有成本(TCO)。

面向AI原生時(shí)代,九章云極打造的Token Factory將算力從成本中心轉(zhuǎn)化為可創(chuàng)造業(yè)務(wù)價(jià)值的增長(zhǎng)中心,以token吞吐量作為核心效率指標(biāo),直接支撐企業(yè)AI競(jìng)爭(zhēng)力提升。智算云平臺(tái)上打造了AI開發(fā)一站式賦能與模型調(diào)用服務(wù)能力,并支持跨區(qū)域、跨廠商的算力資源統(tǒng)一調(diào)度與智能編排,為大模型訓(xùn)練、推理、智能體開發(fā)等全場(chǎng)景提供高效、穩(wěn)定、彈性的算力支撐。


▲張磊

5、DDN李凡:疏通AI算力工廠的數(shù)據(jù)管道

DDN中國(guó)技術(shù)總監(jiān)李凡談道,AI基礎(chǔ)設(shè)施的競(jìng)爭(zhēng)已從單一硬件性能轉(zhuǎn)向系統(tǒng)工程能力,英偉達(dá)從2016年起就在其內(nèi)部集群采用DDN AI數(shù)據(jù)智能平臺(tái)。由DDN提供支持的AI工廠,GPU利用率可達(dá)99%,顯著降低電力消耗和空間占用。

KV Cache是當(dāng)前分布式推理場(chǎng)景的存儲(chǔ)熱點(diǎn),對(duì)動(dòng)態(tài)擴(kuò)展性與元數(shù)據(jù)性能的要求超過峰值吞吐。DDN EXA/Infinia KV cache fabric方案可30倍加速推理和智能體,同時(shí)保障低延遲和低成本。


▲李凡

DDN雖為美國(guó)公司,但中國(guó)本土研發(fā)團(tuán)隊(duì)已從數(shù)人擴(kuò)展至80人,并深度參與國(guó)產(chǎn)算力生態(tài),正與國(guó)產(chǎn)網(wǎng)絡(luò)、國(guó)產(chǎn)算力、大模型廠商合作,推進(jìn)系統(tǒng)級(jí)工程實(shí)踐。

國(guó)產(chǎn)SSD供應(yīng)商大普微旗下多款大容量QLC產(chǎn)品已完成DDN全平臺(tái)測(cè)試認(rèn)證,支持智能體數(shù)據(jù)大容量存儲(chǔ),提供更快的token響應(yīng)。雙方將繼續(xù)深化合作,推出更強(qiáng)的PCIe 5.0 SSD產(chǎn)品組合。


▲大普微DapuStor高級(jí)總監(jiān)黃明達(dá)

6、光羽芯辰姜漢:存算一體翻倍提升AI芯片能效比

光羽芯辰產(chǎn)品市場(chǎng)總監(jiān)姜漢認(rèn)為,端側(cè)AI生態(tài)不能由單一價(jià)值鏈玩家獨(dú)立推動(dòng),需聯(lián)合從操作系統(tǒng)層到App層的全棧合作伙伴共同構(gòu)建。作為一家端側(cè)AI大模型芯片創(chuàng)企,光羽芯辰已與頭部手機(jī)廠商、頭部PC廠商達(dá)成商業(yè)合作,未來(lái)還考慮應(yīng)用于具身智能機(jī)器人場(chǎng)景。

光羽芯辰是一家由AI頭部企業(yè)與存儲(chǔ)頭部企業(yè)等合資設(shè)立的公司,已完成多輪融資。該公司提出了將存算一體架構(gòu)3D異構(gòu)集成技術(shù)相結(jié)合的端側(cè)AI解決方案,并率先將該方案實(shí)現(xiàn)于AI芯片產(chǎn)品中。

相比傳統(tǒng)架構(gòu),其存算一體架構(gòu)可實(shí)現(xiàn)5倍能效比、10倍帶寬,響應(yīng)延遲降至1/10。光羽芯辰也提供硬件級(jí)可信執(zhí)行環(huán)境,并與OpenClaw等框架無(wú)縫集成,以加速端側(cè)AI應(yīng)用落地。


▲姜漢

7、上海AI Lab蔡政:為國(guó)產(chǎn)AI芯片快速搓出高性能算子

上海人工智能實(shí)驗(yàn)室DeepLink團(tuán)隊(duì)工程師蔡政強(qiáng)調(diào),高性能算子體系是英偉達(dá)生態(tài)的核心護(hù)城河,也是國(guó)際AI競(jìng)爭(zhēng)的核心戰(zhàn)場(chǎng),將各類基礎(chǔ)設(shè)施、模型能力、芯片技術(shù)、應(yīng)用場(chǎng)景協(xié)同,關(guān)鍵在于一個(gè)性能好、覆蓋廣、可演進(jìn)的算子體系。

目前國(guó)內(nèi)算子開發(fā)面臨門檻高、調(diào)優(yōu)難、架構(gòu)差異大且迭代快、遷移易損失性能等挑戰(zhàn)。

2025年KernelBench首次系統(tǒng)性評(píng)估了大模型自動(dòng)生成高性能算子的能力,結(jié)論是即使最先進(jìn)的模型在One-shot場(chǎng)景下,首輪算子通過率(編譯正確+精度正確)普遍不超過90%,甚至剔除掉生成了但是沒有實(shí)際運(yùn)行的結(jié)果之后,矯正后的算子通過率普遍不超過55%。

對(duì)此,DeepLink團(tuán)隊(duì)提出KernelSwift智能體進(jìn)化架構(gòu),更充分地探索Kernel Search Space和利用Test Time Compute。在KernelBench L1/L2/L3測(cè)評(píng)中,該系統(tǒng)在英偉達(dá)平臺(tái)上整體性能領(lǐng)先,并且生成的算子代碼已經(jīng)應(yīng)用于生產(chǎn)級(jí)推理引擎SGLang和LMDeploy。

KernelSwift通過DeepLink自研AI編譯器DLCompiler的協(xié)同,實(shí)現(xiàn)了對(duì)華為昇騰、沐曦、寒武紀(jì)、海光、平頭哥、天數(shù)智芯等主流國(guó)產(chǎn)芯片的支持,跨平臺(tái)兼容率達(dá)90%。


▲蔡政

8、探微芯聯(lián)張羽:打造對(duì)標(biāo)英偉達(dá)NVLink的國(guó)產(chǎn)互聯(lián)方案

探微芯聯(lián)超節(jié)點(diǎn)與推訓(xùn)平臺(tái)技術(shù)專家張羽談道,大模型對(duì)顯存有極致要求,單芯片擴(kuò)展已逼近物理瓶頸,Scale-up超節(jié)點(diǎn)是未來(lái)長(zhǎng)期的主要發(fā)展方向,通過高性能互聯(lián)突破單GPU計(jì)算容量、存儲(chǔ)容量和訪存容量的限制。

探微芯聯(lián)以scale-up互聯(lián)資源池為核心,通過自研的ACCSwitch芯片與XPU端的ACCLink,將計(jì)算、內(nèi)存、存儲(chǔ)、CPU四大資源池整合成一個(gè)統(tǒng)一的計(jì)算系統(tǒng),并圍繞芯片提供驅(qū)動(dòng)軟件棧,形成scale-up域互聯(lián)整體解決方案。

其方案可幫助計(jì)算卡廠商、DRAM廠商、存儲(chǔ)廠商構(gòu)建對(duì)標(biāo)英偉達(dá)NVLink生態(tài)的國(guó)產(chǎn)scale-up超節(jié)點(diǎn)系統(tǒng)。


▲張羽

9、圓桌討論:Token爆發(fā)元年,國(guó)產(chǎn)AI算力如何從可用到好用?

AI算力基礎(chǔ)設(shè)施專題論壇的圓桌討論由千芯智算董事長(zhǎng)陳巍主持,三位嘉賓分別是芯橋半導(dǎo)體解決方案副總裁張?chǎng)、DDN中國(guó)技術(shù)總監(jiān)李凡、探微芯聯(lián)超節(jié)點(diǎn)與推訓(xùn)平臺(tái)技術(shù)專家張羽。

陳巍談道,根據(jù)國(guó)家統(tǒng)計(jì)局的數(shù)據(jù),今年3月,我國(guó)日均token調(diào)用量已突破140萬(wàn)億,較2024年初的1000億增長(zhǎng)超過1400倍。AI推理已不再是單純的堆卡堆算力,而是進(jìn)入token工廠時(shí)代,每生成一個(gè)token,都在極致考驗(yàn)計(jì)算芯片、存儲(chǔ)、互連架構(gòu)的協(xié)同。

隨著推理時(shí)代到來(lái),傳統(tǒng)基礎(chǔ)設(shè)施已無(wú)法滿足智能體和長(zhǎng)鏈路任務(wù)的需求。站在token爆發(fā)元年的風(fēng)口之上,國(guó)產(chǎn)AI算力如何從可用邁向好用?這個(gè)議題非常具有現(xiàn)實(shí)意義。


▲從左往右:陳巍、張?chǎng)巍⒗罘、張?/p>

幾位嘉賓分享的一些共識(shí)觀點(diǎn)包括:

(1)token成本是國(guó)產(chǎn)算力從可用到好用的關(guān)鍵命題,更低成本、更高token產(chǎn)出效率是前提。

(2)系統(tǒng)工程化協(xié)作是短板。發(fā)展計(jì)算、存儲(chǔ)、互聯(lián)、網(wǎng)絡(luò)、運(yùn)維的一體化工程能力,才能真正釋放token工廠的潛力。

(3)中國(guó)團(tuán)隊(duì)在模型量化等軟件層的能力已接近或超越國(guó)際水平,制程、良率等硬件層差距客觀存在,場(chǎng)景化需求可能會(huì)抹平部分技術(shù)差距。

(4)Scale-Up超節(jié)點(diǎn)是確定性長(zhǎng)期趨勢(shì),是國(guó)產(chǎn)AI算力生態(tài)整合的關(guān)鍵抓手。

(5)AI下一個(gè)爆發(fā)點(diǎn)尚待觀望。未來(lái)Agent長(zhǎng)時(shí)序主動(dòng)執(zhí)行將改變計(jì)費(fèi)體系,對(duì)硬件成本、集群效率的要求將更嚴(yán)苛。

計(jì)算方面,張?chǎng)握劦紸I芯片設(shè)計(jì)正向定制化模型需求靠攏,例如針對(duì)矩陣計(jì)算做專項(xiàng)硬件加速(參考Groq思路),可同時(shí)實(shí)現(xiàn)資源節(jié)省、性能提升與成本下降,建議加強(qiáng)芯片層與落地場(chǎng)景的溝通,推動(dòng)硬件針對(duì)專屬場(chǎng)景的定制化改造。

在他看來(lái),智能體落地不是單一模型運(yùn)算,而是多模型在不同場(chǎng)景、不同節(jié)點(diǎn)、不同步驟的分場(chǎng)景拆解,是否需要專用芯片支撐仍在探索中。

存儲(chǔ)方面,李凡提出存儲(chǔ)架構(gòu)割裂(HBM、DRAM、SSD各自孤立)是當(dāng)前制約token生產(chǎn)效率的隱性障礙,只有打通才能真正釋放算力。

他認(rèn)為,中國(guó)AI推理基礎(chǔ)設(shè)施的token輸出效率已超越國(guó)外水平,現(xiàn)階段主要問題是工程配合與生態(tài)整合不足,仍處于堆卡堆資源的初期階段,缺乏計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、運(yùn)維的系統(tǒng)級(jí)協(xié)作。

通信方面,張羽提到計(jì)算、存儲(chǔ)、互聯(lián)三者之間存在此消彼長(zhǎng)的平衡難題,把存儲(chǔ)做成HBM類混合存儲(chǔ)可行,但會(huì)將壓力轉(zhuǎn)移到通信側(cè)。

他建議,芯片內(nèi)部的平衡、芯片間互聯(lián)的平衡、存儲(chǔ)的平衡三者需統(tǒng)一建模,建議構(gòu)建性能建模工具,拆解大模型推理任務(wù)中的算子(通信算子、訪存算子、計(jì)算算子),預(yù)估各階段計(jì)算量、訪存帶寬需求,尋找計(jì)算與通信細(xì)粒度overlap的最優(yōu)點(diǎn),從而實(shí)現(xiàn)最大化性能。

張羽預(yù)計(jì)未來(lái)3~5年,計(jì)算卡廠商、存儲(chǔ)廠商將逐步融入統(tǒng)一的Scale-Up超節(jié)點(diǎn)生態(tài)。

七、大模型下半場(chǎng),競(jìng)爭(zhēng)焦點(diǎn)變成場(chǎng)景、數(shù)據(jù)、品味

在大模型專題論壇上,6位演講嘉賓分別從模型能力演進(jìn)、基礎(chǔ)設(shè)施重構(gòu)、行業(yè)應(yīng)用落地等維度展開分享。

模型層面,“任務(wù)完成度”成為廠商關(guān)注重點(diǎn),即能否在真實(shí)場(chǎng)景中交付穩(wěn)定、可靠的結(jié)果。

基礎(chǔ)設(shè)施層面,AI訓(xùn)練和推理需要全新的數(shù)據(jù)存儲(chǔ)基礎(chǔ)設(shè)施,AI token工廠的每一層都需要被重新設(shè)計(jì)。

應(yīng)用層面,“理解場(chǎng)景”與“理解人”成為AI落地的必修課。大模型不能再僅僅滿足于簡(jiǎn)單生成,而要能理解語(yǔ)言之外的意圖、業(yè)務(wù)邏輯乃至心理。

1、智譜李子玄:Long Horizon成AI編程新重點(diǎn)

智譜Z.ai負(fù)責(zé)人李子玄認(rèn)為,AI編程的競(jìng)爭(zhēng)焦點(diǎn)正從單點(diǎn)生成轉(zhuǎn)向“Long Horizon(長(zhǎng)程任務(wù))”能力。

他澄清,Long Horizon并非長(zhǎng)度的比較,而是要求模型執(zhí)行任務(wù)的過程中保持目標(biāo)與邏輯不失真,能從失敗中迭代優(yōu)化,交付高質(zhì)量的結(jié)果。

GLM-5.1正是體現(xiàn)這一能力的模型。

結(jié)合自身實(shí)踐,李子玄提出,如今的AI研究員要像產(chǎn)品經(jīng)理一樣懂場(chǎng)景,評(píng)測(cè)已經(jīng)成為引領(lǐng)模型發(fā)展的重要管理方法。而在PMF方面,企業(yè)需要進(jìn)行前瞻布局與技術(shù)儲(chǔ)備,才能在技術(shù)拐點(diǎn)到來(lái)時(shí)捕捉機(jī)遇。


▲李子玄

2、阿里云王作書:AI將帶來(lái)全局性機(jī)遇

阿里云千問大模型解決方案資深總監(jiān)王作書觀察到,大模型已走過學(xué)術(shù)奠基、產(chǎn)業(yè)投入階段,步入了商業(yè)加速期。當(dāng)前,模型推理能力顯著增強(qiáng),多模態(tài)融合與開源生態(tài)日趨成熟,AI正從“聊天”進(jìn)化為核心生產(chǎn)力。

為此,阿里巴巴成立ATH事業(yè)群,圍繞“創(chuàng)造token、輸送token、應(yīng)用token”升級(jí)了其AI戰(zhàn)略,目前已圍繞著文本、多模態(tài)等多條主線研發(fā)模型,最新成果包括Qwen3.6系列模型、Qwen3.5-Omni、萬(wàn)相2.7等。

王作書透露,阿里大模型團(tuán)隊(duì)未來(lái)的三大技術(shù)目標(biāo)為提升知識(shí)規(guī)模和效率、增強(qiáng)智能水平和多模態(tài)融合。

她還提出了價(jià)值四象限的概念:未來(lái)AI將創(chuàng)新力/勞動(dòng)力為縱軸、產(chǎn)品力/生產(chǎn)力為橫軸持續(xù)擴(kuò)展,推動(dòng)消費(fèi)電子、生產(chǎn)系統(tǒng)等升級(jí),帶來(lái)全局性機(jī)遇


▲王作書

3、焱融科技張文濤:AI競(jìng)爭(zhēng)本質(zhì)是數(shù)據(jù)競(jìng)爭(zhēng)

焱融科技CTO張文濤觀察到,AI的競(jìng)爭(zhēng)本質(zhì)上是數(shù)據(jù)的競(jìng)爭(zhēng),無(wú)論是訓(xùn)練還是推理,都對(duì)高性能、低延遲、去孤島化的數(shù)據(jù)存儲(chǔ)基礎(chǔ)設(shè)施有著迫切需求。

焱融應(yīng)對(duì)上述挑戰(zhàn)的思路是打造一套全棧AI存儲(chǔ)解決方案。具體來(lái)看,該公司的全閃存儲(chǔ)一體機(jī)產(chǎn)品F9000X采用了冷熱數(shù)據(jù)智能分層、彈性網(wǎng)絡(luò)等技術(shù),使得每GiB/s帶寬成本下降60%,并在MLPerf Storage v2.0測(cè)試中排名榜首。

面向推理場(chǎng)景,焱融推出了涵蓋DRAM到本地盤再到遠(yuǎn)端共享存儲(chǔ)的多級(jí)KVCache緩存管理系統(tǒng)YRCache,并通過智能預(yù)取、異步卸載、零拷貝等技術(shù)實(shí)現(xiàn)加速。

同時(shí),焱融科技也提供了企業(yè)全域數(shù)據(jù)管理平臺(tái)DataInsight,可以統(tǒng)一納管分散在各處的數(shù)據(jù)孤島,形成統(tǒng)一視圖,并支持自定義數(shù)據(jù)流向,給大模型訓(xùn)練提供便利。


▲張文濤

4、連信數(shù)字/連心云黃杏:理解“人”是AI進(jìn)入真實(shí)世界的關(guān)鍵

連信數(shù)字/連心云洞見研究院院長(zhǎng)黃杏認(rèn)為,現(xiàn)實(shí)中的管理者、面試官、家長(zhǎng)等群體,常常需要借助語(yǔ)言之外的信息來(lái)理解他人。同樣,當(dāng)前AI雖擅長(zhǎng)處理語(yǔ)言,但若想真正融入真實(shí)世界,就必須理解人心

連信數(shù)字洞見研究院匯聚了心理學(xué)、算法與大數(shù)據(jù)的跨學(xué)科精英,“洞見人和”人本世界(心理)大模型以全球多源數(shù)據(jù)為底座,通過多模態(tài)感知與神經(jīng)符號(hào)AI的深度融合,改變了傳統(tǒng)的“經(jīng)驗(yàn)驅(qū)動(dòng)”分析,通過智能循證分析實(shí)現(xiàn)了對(duì)人類的深度洞察與全面刻畫。

這一模型已在公安、教育、司法、安全生產(chǎn)等行業(yè)落地實(shí)戰(zhàn),并已覆蓋20多個(gè)省市,累計(jì)2000萬(wàn)+人群。

在大會(huì)現(xiàn)場(chǎng),黃杏宣布,即日起,連信的所有模型能力與原生Agent將通過連心云能力平臺(tái)正式對(duì)外開放,賦能更多行業(yè)場(chǎng)景。


▲黃杏

5、上海AI Lab張鴻杰:統(tǒng)一多模態(tài)模型的關(guān)鍵不是技術(shù)選型

上海AI Lab青年研究員張鴻杰介紹,目前統(tǒng)一多模態(tài)大模型主要采用純自回歸、純擴(kuò)散與其他融合上述架構(gòu)的折中方案。但他認(rèn)為關(guān)鍵不是選路線,而是在統(tǒng)一上下文中實(shí)現(xiàn)理解與生成各有所長(zhǎng),讓不同模態(tài)采用最適合的預(yù)測(cè)方式

基于這一判斷,上海AI Lab研發(fā)了InternVL-U,一個(gè)4B參數(shù)的統(tǒng)一多模態(tài)大模型。具體來(lái)看,InternVL-U擁有統(tǒng)一上下文,但目標(biāo)照模態(tài)實(shí)現(xiàn)自適應(yīng)。這一模型采用InternVL 3.5的主干完成理解和推理,并把像素合成交給MMDiT,從而實(shí)現(xiàn)語(yǔ)義建模和視覺生成的分工。其理解與生成的視覺表征也完全解耦,理解用ViT高層語(yǔ)義特征,生成用VAE淺層重建特征,避免沖突。

目前,InternVL-U模型、數(shù)據(jù)管線與評(píng)測(cè)工具鏈均已開源,張鴻杰也呼吁社區(qū)一同參與到統(tǒng)一多模態(tài)模型的發(fā)展中來(lái)。


▲張鴻杰

6、商湯大裝置盧國(guó)強(qiáng):AI系統(tǒng)的核心使用者,將從人轉(zhuǎn)變?yōu)锳gent

商湯大裝置產(chǎn)品總經(jīng)理盧國(guó)強(qiáng)認(rèn)為,行業(yè)正從“AI原生”邁向“Agent原生”新階段,未來(lái)AI系統(tǒng)的核心使用者將從人轉(zhuǎn)變?yōu)锳gent,交互方式、度量衡與安全邊界將因此發(fā)生根本性變化,帶來(lái)對(duì)Agent原生基礎(chǔ)設(shè)施的需求。

從具體設(shè)計(jì)上來(lái)看,Agent原生系統(tǒng)應(yīng)讓每一層都變得可發(fā)現(xiàn)、可理解、可操作。其中,算力層將由成本中心轉(zhuǎn)變?yōu)槔麧?rùn)中心,成為“收入工廠”;平臺(tái)層則通過token統(tǒng)一度量衡,實(shí)現(xiàn)智能化與標(biāo)準(zhǔn)化;應(yīng)用層需要實(shí)現(xiàn)“AI賦能AI”,使AI具備自主迭代能力。

基于此,商湯大裝置在2026年將愿景從“AI數(shù)字工廠”升級(jí)為“AI Token Factory”。這一工廠的原材料是算力、模型與數(shù)據(jù),生產(chǎn)線是推理引擎、緩存與調(diào)度,產(chǎn)品是token,其每一層都需要進(jìn)行重新審視與設(shè)計(jì),以更好服務(wù)Agent的需求。


▲盧國(guó)強(qiáng)

7、圓桌討論:AI下半場(chǎng),大模型的演進(jìn)與終局

大模型專題論壇的圓桌討論由中信證券首席計(jì)算機(jī)行業(yè)分析師楊澤原主持,四位嘉賓分別是智譜Z.ai負(fù)責(zé)人李子玄、阿里云千問大模型解決方案資深總監(jiān)王作書、上海AI Lab青年研究員張鴻杰、商湯大裝置產(chǎn)品總經(jīng)理盧國(guó)強(qiáng)。


▲從左到右:楊澤原、李子玄、王作書、張鴻杰、盧國(guó)強(qiáng)

4位嘉賓先是結(jié)合自身背景談了幾個(gè)熱點(diǎn)話題。

編程模型方面,李子玄談道,在該領(lǐng)域保持領(lǐng)先的關(guān)鍵在于“品味”,也就是對(duì)技術(shù)趨勢(shì)的判斷力。對(duì)場(chǎng)景進(jìn)行細(xì)致挖掘、通過coding plan等渠道獲取反饋也很重要。

談及全模態(tài)模型,王作書認(rèn)為此類模型同時(shí)擁有“眼睛、嘴巴、耳朵”,將推動(dòng)智能邊界向三個(gè)方向拓展,分別是感知邊界、推理邊界和交互邊界,最終在視頻理解、自動(dòng)駕駛、實(shí)時(shí)音視頻交互提供更強(qiáng)的能力與更擬人的體驗(yàn)。

小尺寸多模態(tài)模型與大型原生多模態(tài)模型孰優(yōu)孰劣?張鴻杰稱,后者雖然架構(gòu)優(yōu)美,但訓(xùn)練代價(jià)大,也無(wú)法繼承現(xiàn)有模型的能力。相比之下,前者可在其他模型基礎(chǔ)上外擴(kuò)生成編輯能力,性能上限也不低。小模型在數(shù)據(jù)方面的短板可以結(jié)合Agent補(bǔ)齊,不必單打獨(dú)斗。

基礎(chǔ)設(shè)施方面,盧國(guó)強(qiáng)分享說(shuō),盡管商湯大裝置已經(jīng)預(yù)判未來(lái)算力需求會(huì)大幅增長(zhǎng),但其增幅仍然遠(yuǎn)遠(yuǎn)超出預(yù)期。在推理時(shí)代,模型獲得的輸入要遠(yuǎn)大于模型的輸出,這對(duì)基礎(chǔ)設(shè)施的每一層都提出挑戰(zhàn),尤其是緩存效率。

嘉賓們也就幾個(gè)共同話題分享了觀點(diǎn)。

模型架構(gòu)、能力和場(chǎng)景迭代方面,多模態(tài)、空間智能、長(zhǎng)鏈路等被頻繁提及。李子玄總結(jié)道,目前模型迭代的本質(zhì)是智能提升和token效率優(yōu)化的循環(huán),新應(yīng)用場(chǎng)景可能會(huì)因推理速度和穩(wěn)定性的提升而迎來(lái)爆發(fā)。

年初的龍蝦熱讓Harness走進(jìn)主流視野。4位嘉賓認(rèn)為,Harness可能會(huì)被模型逐漸內(nèi)化,或是與具體行業(yè)和場(chǎng)景結(jié)合得更為密切。

王作書談道,當(dāng)前Harness是模型的放大器,但長(zhǎng)期看會(huì)變成基礎(chǔ)設(shè)施被隱藏,模型向下做深邏輯與工具調(diào)用能力,Harness向上融入行業(yè)。張鴻杰覺得共生與內(nèi)化是漸進(jìn)過程,多模態(tài)的Harness比文本更具挑戰(zhàn)。盧國(guó)強(qiáng)提出模型決定上限,而Harness決定下限,兩者缺一不可。李子玄則預(yù)判,未來(lái)模型可能會(huì)自己“上發(fā)條”,不再依賴Harness,人只負(fù)責(zé)補(bǔ)充上下文。

談及廠商的全棧自主能力,幾位嘉賓都認(rèn)可其商業(yè)價(jià)值,但也不主張絕對(duì)化,而是要做好權(quán)衡與生態(tài)協(xié)同。全棧自主的落腳點(diǎn)最終仍是提供優(yōu)質(zhì)、穩(wěn)定、高效的服務(wù)與商業(yè)價(jià)值。

八、從“龍蝦”、AI眼鏡到token管理,拆解國(guó)產(chǎn)智能體落地潮

在AI智能體專題論壇,8位嘉賓分別從底層架構(gòu)、技術(shù)演進(jìn)、模型創(chuàng)新、硬件載體、垂直場(chǎng)景落地及企業(yè)級(jí)管控工具等方面,拆解智能體商業(yè)化路徑。

從大廠打造的開源桌面級(jí)“龍蝦”產(chǎn)品、智能體底層架構(gòu)創(chuàng)新,到AI編程、AI營(yíng)銷、AI眼鏡、token管理等賽道,他們正在推動(dòng)智能體更好地幫人們做事。

1、網(wǎng)易有道王寧:20余天速成國(guó)內(nèi)首個(gè)桌面級(jí)“龍蝦”

網(wǎng)易有道LobsterAI項(xiàng)目負(fù)責(zé)人、智能硬件研發(fā)負(fù)責(zé)人王寧分享說(shuō),他們經(jīng)過20余天快速打磨,2月19日正式推出國(guó)內(nèi)大廠的第一個(gè)開源桌面級(jí)“龍蝦”LobsterAI。

其內(nèi)部認(rèn)為,OpenClaw是Agent時(shí)代的Linux系統(tǒng),因此他們將有道“龍蝦”底層架構(gòu)切換為OpenClaw,上層保留自研GUI與業(yè)務(wù)流程,通過進(jìn)程通信實(shí)現(xiàn)兼容。

他提到Agent產(chǎn)品的未來(lái)新機(jī)遇包括Agent向各領(lǐng)域滲透、Skill即服務(wù)、開源生態(tài)共建、AI Native工作流、多Agent協(xié)作、Agent原生硬件等。


▲王寧

2、階躍星辰袁微:Agent技術(shù)核心轉(zhuǎn)向外部環(huán)境構(gòu)建

階躍星辰算法專家袁微提到AI Agent的演進(jìn)包括三個(gè)階段,分別是提示詞工程時(shí)代、上下文工程時(shí)代、Harness Engineering時(shí)代,當(dāng)下焦點(diǎn)已從模型本身轉(zhuǎn)向構(gòu)建完善外部運(yùn)行環(huán)境,是Agent從Demo走向產(chǎn)品的關(guān)鍵。

當(dāng)前處于Agent能力躍遷拐點(diǎn),技術(shù)核心從模型競(jìng)賽轉(zhuǎn)向系統(tǒng)工程與環(huán)境構(gòu)建,Harness + OpenClaw是將基礎(chǔ)模型能力轉(zhuǎn)化為企業(yè)級(jí)可交付Agent產(chǎn)品的關(guān)鍵方案。其中,Harness是Agent的腳手架,對(duì)應(yīng)系統(tǒng)層,OpenClaw是Agent的調(diào)度引擎。


▲袁微

3、華為林煒哲:DLLM Agent有望成為下一代Agent系統(tǒng)基石

華為中央研究院先進(jìn)計(jì)算與存儲(chǔ)實(shí)驗(yàn)室大模型算法專家林煒哲提到,Diffusion模型在同等訓(xùn)練條件的智能體場(chǎng)景下,比AR Agent更快、規(guī)劃更優(yōu)、端到端效率更高

他們研究發(fā)現(xiàn),DLLM Agent在同等序列長(zhǎng)度、輪次約束下,能保持與AR Agent一致的任務(wù)精度,同時(shí)還能實(shí)現(xiàn)信息搜集調(diào)用量顯著下降、任務(wù)拆分更精準(zhǔn)、搜索輪次更少、耗時(shí)更短,疊加輕量采樣算法可大幅提高精度,而AR Agent疊加復(fù)雜算法會(huì)顯著增加消耗,進(jìn)一步拉開性能差距。

林煒哲認(rèn)為,DLLM Agent有望成為下一代Agent系統(tǒng)重要基石。


▲林煒哲

4、雷鳥創(chuàng)新程思婕:兩大判斷定調(diào)眼鏡是下一代AI最佳載體

如今智能眼鏡進(jìn)入爆發(fā)期,蘋果、小米、阿里等大廠入局,賽道轉(zhuǎn)向紅海。雷鳥創(chuàng)新AI負(fù)責(zé)人程思婕拋出結(jié)論:眼鏡是下一代AI的最佳載體。其兩大判斷依據(jù)是,眼鏡是最佳的全域數(shù)據(jù)采集終端和隨身智能體載體。

一方面,眼鏡可以全天候貼身佩戴、無(wú)感采集第一人稱交互數(shù)據(jù)、搶占物理世界原生數(shù)據(jù)入口,另一方面,其適配原生語(yǔ)音交互,支持一句話完成任務(wù)、打造個(gè)人隨身外腦、下一代個(gè)性化推薦系統(tǒng)。

此外她認(rèn)為,相較于機(jī)器人,智能眼鏡作為AI載體的優(yōu)勢(shì)是,可以通過數(shù)據(jù)飛輪實(shí)現(xiàn)數(shù)據(jù)閉環(huán)與模型迭代,僅作為輔助決策的“外腦”,無(wú)需底層控制,從而規(guī)避機(jī)器人的數(shù)據(jù)瓶頸、底層控制難題。


▲程思婕

5、阿里云沈林:5個(gè)準(zhǔn)則打通Agent上下文環(huán)境數(shù)據(jù)構(gòu)造

阿里云高級(jí)技術(shù)專家沈林分享了EventHouse實(shí)踐的5個(gè)準(zhǔn)則:

(1)Think like an Agent,給你的Agent足夠的信息感知能力;

(2)給你的信息編寫一本“圖書館館藏目錄”;

(3)知識(shí)不是“信息囤積”,和你的Agent做好“知識(shí)對(duì)賬”;

(4)每次知識(shí)迭代都是一次生產(chǎn)級(jí)變更發(fā)布;

(5)“簡(jiǎn)單”、“可靠”不是錦上添花,而是很多行業(yè)的入場(chǎng)券。


▲沈林

6、極狐馭碼宋。篈I Coding已進(jìn)入準(zhǔn)交付級(jí)編程階段

AI Coding是AI技術(shù)落地的高價(jià)值入口,但目前市場(chǎng)上對(duì)AI Coding存在“玩具論”和“萬(wàn)能論”兩大暴論。極狐馭碼資深A(yù)I解決方案架構(gòu)師宋健認(rèn)為兩種觀點(diǎn)均有失偏頗,AI Coding已進(jìn)入準(zhǔn)交付級(jí)編程階段,有實(shí)用價(jià)值但仍需工程團(tuán)隊(duì)投入時(shí)間學(xué)習(xí)和實(shí)踐。

AI Coding智能體的五大關(guān)鍵技術(shù)是模式、規(guī)則、工作流、MCP、Skills,模式是將智能體預(yù)先劃分成不同角色、規(guī)則是為智能體定規(guī)矩、工作流類似寫腳本、MCP是擴(kuò)展智能體能力的工具箱、Skills是原子化的功能插件,協(xié)同用好這些關(guān)鍵技術(shù)和功能是企業(yè)實(shí)施AI Coding的關(guān)鍵。


▲宋健

7、Noumena AI趙歡:AI營(yíng)銷增長(zhǎng)潛力僅次于編程

Noumena AI(物自體科技)聯(lián)合創(chuàng)始人、產(chǎn)品算法負(fù)責(zé)人趙歡的判斷是,營(yíng)銷是僅次于AI Coding領(lǐng)域的爆發(fā)式增長(zhǎng)場(chǎng)景,且與Coding場(chǎng)景邏輯完全不同

營(yíng)銷場(chǎng)景面臨數(shù)據(jù)割裂、人員流失導(dǎo)致經(jīng)驗(yàn)丟失、平臺(tái)算法迭代快、品牌方難以適配等痛點(diǎn)。Noumena AI推出了營(yíng)銷行業(yè)的龍蝦產(chǎn)品GrowClaw,不僅能解決典型的營(yíng)銷問題比如內(nèi)容洞察,達(dá)人篩選,內(nèi)容運(yùn)營(yíng),投流分享等,還可以適配持續(xù)維護(hù)狀態(tài)、持續(xù)更新、多方協(xié)作的營(yíng)銷業(yè)務(wù)系統(tǒng)。

針對(duì)OpenClaw穩(wěn)定性差、非技術(shù)用戶上手難問題,趙歡稱他們?cè)趦?nèi)部打造了“龍蝦醫(yī)院”和“龍蝦學(xué)院”,以實(shí)現(xiàn)Agent故障自動(dòng)診斷以及AI自動(dòng)學(xué)習(xí)、快速為業(yè)務(wù)提供Skill等。


▲趙歡

8、清程極智李浩瑞:首發(fā)企業(yè)級(jí)token管理工具,即將開源

清程極智技術(shù)專家李浩瑞首次正式發(fā)布了其企業(yè)級(jí)token管理新品ATM(Agent Token Manager),該產(chǎn)品后續(xù)將開源。

ATM的核心功能是本地聚合網(wǎng)關(guān)、Agent身份級(jí)管控、智能路由下放、本地?cái)?shù)據(jù)存儲(chǔ)、Agent原生適配,他們實(shí)測(cè)顯示,本地網(wǎng)關(guān)融合云端、本地大模型后使得成本降低70%

為了幫助企業(yè)在AI轉(zhuǎn)型中進(jìn)行token管控與質(zhì)量追蹤,清程極智的AI Ping可以在MaaS層通過持續(xù)模型服務(wù)評(píng)測(cè),提供高質(zhì)量低價(jià)格token;ATM是本地網(wǎng)關(guān),在本地通過Agent身份級(jí)管控實(shí)現(xiàn)精細(xì)化企業(yè)內(nèi)部治理。


▲李浩瑞

9、圓桌討論:OpenClaw x Harness Engineering,AI智能體的范式革命

圓桌討論環(huán)節(jié)由智東西聯(lián)合創(chuàng)始人、智猩猩總經(jīng)理何峰主持,四位嘉賓分別是階躍星辰算法專家袁微,雷鳥創(chuàng)新AI負(fù)責(zé)人程思婕,清程極智技術(shù)專家李浩瑞,Noumena AI(物自體科技)聯(lián)合創(chuàng)始人、產(chǎn)品算法負(fù)責(zé)人趙歡。

嘉賓們探討了當(dāng)下OpenClaw與Hermes Agent之間的“養(yǎng)蝦、養(yǎng)馬”爭(zhēng)論、Skill是否會(huì)吃掉App等諸多熱點(diǎn)話題。


▲從左到右:何峰、袁微、程思婕、李浩瑞、趙歡

袁微站在模型團(tuán)隊(duì)角度稱,OpenClaw開啟了AI智能體爆發(fā)元年,當(dāng)下Agent實(shí)現(xiàn)生產(chǎn)級(jí)交付的最大瓶頸是模型研發(fā),因?yàn)槭忻嫔系耐ㄓ肂enchmark很難對(duì)應(yīng)每個(gè)人需求,因此他們?cè)噲D通過收集專家意見、用戶的實(shí)際體驗(yàn)、自建Benchmark等方式,讓模型體驗(yàn)和大多數(shù)人體感保持一致。

作為硬件廠商的代表,程思婕認(rèn)為Skills會(huì)逐步替代App,而當(dāng)下Skill變成App的壁壘在生態(tài)層面,需要大廠開放自己的原子能力。圍繞OpenClaw與眼鏡的結(jié)合,雷鳥創(chuàng)新制定了三步戰(zhàn)略,第一步是面向開發(fā)者,讓眼鏡作為輸入入口快速接入OpenClaw,第二步打通App讓其絲滑連接Agent,第三步是內(nèi)部自研類似框架。

作為Token服務(wù)商,李浩瑞提到一個(gè)現(xiàn)象,Hermes Agent出來(lái)后,OpenClaw的Token消耗在下降,這進(jìn)一步說(shuō)明,越來(lái)越聰明、越來(lái)越懂用戶的Agent是技術(shù)上的大趨勢(shì)。企業(yè)內(nèi)部管理Token的最大難點(diǎn),就是不知道Token消耗流去了哪里,這也是他們打造本地Token管理工具的原因。

在營(yíng)銷這一垂類場(chǎng)景,趙歡認(rèn)為,OpenClaw是產(chǎn)品形態(tài)革新,能大幅降低非技術(shù)人群AI使用門檻,未來(lái)模型會(huì)逐步吃掉Harness,垂類廠商需構(gòu)建領(lǐng)域護(hù)城河。他們判斷一個(gè)場(chǎng)景是否真正適合Agent落地的兩個(gè)視角是,本身的技術(shù)場(chǎng)景匹配度,以及場(chǎng)景商業(yè)價(jià)值、落地困難程度。

結(jié)語(yǔ):生成式AI產(chǎn)業(yè)開始告別“早期階段”

今年AI產(chǎn)業(yè)依然在飛速變化。年初的“養(yǎng)龍蝦”熱潮帶動(dòng)token消耗量爆發(fā),密集迭代的各類大模型持續(xù)帶來(lái)新的驚喜,業(yè)界已經(jīng)對(duì)基準(zhǔn)測(cè)試分?jǐn)?shù)祛魅,轉(zhuǎn)而更看重真實(shí)的任務(wù)完成度,新一輪AI基建潮正如火如荼開展。

被業(yè)界期盼已久的DeepSeek-V4,也交出了一份具有開創(chuàng)意義的答卷:不僅繼續(xù)做到大幅壓低成本和性能領(lǐng)先,而且寫出了一個(gè)打破海外芯片依賴的新敘事。

這場(chǎng)空前的產(chǎn)業(yè)爆發(fā)之中,還有一些需要面對(duì)的問題。

模型迭代速度之快,正在給企業(yè)用戶帶來(lái)選擇疲勞。相比追逐新模型,企業(yè)更需要的是建立與模型無(wú)關(guān)的架構(gòu)能力。

模型能力與安全的矛盾也在激化。Anthropic手握強(qiáng)大的Mythos模型卻不敢全面發(fā)布,ChatGPT Images 2.0生成的圖像已經(jīng)以假亂真,其他旗艦?zāi)P屯瑯用媾R網(wǎng)絡(luò)安全風(fēng)險(xiǎn)的審慎評(píng)估。前沿能力的發(fā)布正成為一個(gè)越來(lái)越沉重的決策。

與此同時(shí),炒作性宣傳和情緒生意也在侵蝕行業(yè)的判斷力,真正的技術(shù)進(jìn)展反而被淹沒在噪聲之中。在DeepSeek-V4新聞稿的結(jié)尾,有一句引自《荀子》的名言:“不誘于譽(yù),不恐于誹,率道而行,端然正己。”也愿生成式AI道路上的前行者們,都有類似的定力。

而AI產(chǎn)品最終需要以真實(shí)的商業(yè)回報(bào)來(lái)驗(yàn)證。頭部企業(yè)交出了快速增長(zhǎng)的收入成績(jī)單,同時(shí)也在尋求巨額算力資源采購(gòu),但這種支出比收入增長(zhǎng)更快的模式會(huì)持續(xù)多久,答案要等到新一代基礎(chǔ)設(shè)施真正投入運(yùn)營(yíng)之后才能揭曉。

AI正在不可逆轉(zhuǎn)地走向產(chǎn)業(yè)化,開始觸及軟件開發(fā)、知識(shí)工作和人機(jī)交互的底層范式。但截至目前,這個(gè)新型技術(shù)產(chǎn)業(yè)仍處于地基澆筑期,至于最終建成的大廈是什么模樣,可能連建設(shè)者自己都還無(wú)法完全想象。

2026年這個(gè)春天,生成式AI產(chǎn)業(yè)開始告別它的“早期階段”。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
100元五糧液!市盈率13.74倍+股息率5.7%,錯(cuò)殺還是陷阱?

100元五糧液!市盈率13.74倍+股息率5.7%,錯(cuò)殺還是陷阱?

慧眼看世界哈哈
2026-04-26 14:03:43
不露面不知道,一露面嚇一跳,這些明星怎么都老成這個(gè)樣子了

不露面不知道,一露面嚇一跳,這些明星怎么都老成這個(gè)樣子了

孤城落日
2026-04-20 19:26:14
22萬(wàn)起!比亞迪官宣:4月29日,新車上市

22萬(wàn)起!比亞迪官宣:4月29日,新車上市

高科技愛好者
2026-04-26 22:54:20
雖遠(yuǎn)必誅!22歲中國(guó)女孩被日籍男尿澆頭,中領(lǐng)事館重拳出擊太解氣

雖遠(yuǎn)必誅!22歲中國(guó)女孩被日籍男尿澆頭,中領(lǐng)事館重拳出擊太解氣

叮當(dāng)當(dāng)科技
2026-04-26 20:39:03
她倆要一起上節(jié)目破除“不和”傳言啦!

她倆要一起上節(jié)目破除“不和”傳言啦!

奮斗在韓國(guó)
2026-04-24 19:21:35
“我讓他住手,可他不聽”:中國(guó)民科狂發(fā)500篇預(yù)印本,女兒被迫收獲100+署名

“我讓他住手,可他不聽”:中國(guó)民科狂發(fā)500篇預(yù)印本,女兒被迫收獲100+署名

化學(xué)人生
2026-04-26 20:10:10
寶馬X5也不再堅(jiān)挺,3.0T版最高降13萬(wàn),豪車也開始香了

寶馬X5也不再堅(jiān)挺,3.0T版最高降13萬(wàn),豪車也開始香了

西莫的藝術(shù)宮殿
2026-04-26 18:17:33
威廉凱特再搬家:離宮殿更遠(yuǎn),離父母更近,王室排場(chǎng)更淡了

威廉凱特再搬家:離宮殿更遠(yuǎn),離父母更近,王室排場(chǎng)更淡了

世界王室那些事
2026-04-26 19:05:34
馬蹄露緊急發(fā)文澄清信息量不少,評(píng)論區(qū)兩極分化,還有更可怕一幕

馬蹄露緊急發(fā)文澄清信息量不少,評(píng)論區(qū)兩極分化,還有更可怕一幕

冷紫葉
2026-04-25 19:18:16
中東的戰(zhàn)火,終究還是燒到了中國(guó)頭上!

中東的戰(zhàn)火,終究還是燒到了中國(guó)頭上!

故事終將光明磊落
2026-04-25 15:03:28
比亞迪旗艦SUV爆了!大唐預(yù)售24小時(shí)訂單突破3萬(wàn)臺(tái)

比亞迪旗艦SUV爆了!大唐預(yù)售24小時(shí)訂單突破3萬(wàn)臺(tái)

快科技
2026-04-26 15:47:36
最新畫面曝光!特朗普撤離時(shí)疑摔倒,梅拉尼婭鉆桌子下,萬(wàn)斯躲椅背后被拽走…槍手曾為哈里斯競(jìng)選捐款,供述行動(dòng)目標(biāo)

最新畫面曝光!特朗普撤離時(shí)疑摔倒,梅拉尼婭鉆桌子下,萬(wàn)斯躲椅背后被拽走…槍手曾為哈里斯競(jìng)選捐款,供述行動(dòng)目標(biāo)

新民晚報(bào)
2026-04-26 19:52:49
親手送吳亦凡入獄5年后,都美竹迎噩耗,法院出手或使其飯碗不保

親手送吳亦凡入獄5年后,都美竹迎噩耗,法院出手或使其飯碗不保

老吳教育課堂
2026-04-25 01:00:44
CBA官宣最佳陣容:胡金秋賀希寧領(lǐng)銜一陣 周琦張鎮(zhèn)麟領(lǐng)銜二陣

CBA官宣最佳陣容:胡金秋賀希寧領(lǐng)銜一陣 周琦張鎮(zhèn)麟領(lǐng)銜二陣

醉臥浮生
2026-04-26 18:11:33
可能5人禁賽!這就是今年季后賽最大沖突!

可能5人禁賽!這就是今年季后賽最大沖突!

柚子說(shuō)球
2026-04-26 22:04:56
300965,籌劃重大資產(chǎn)重組!停牌

300965,籌劃重大資產(chǎn)重組!停牌

中國(guó)基金報(bào)
2026-04-26 19:12:30
兵敗如山倒!國(guó)產(chǎn)新能源或已經(jīng)證明:中國(guó)壓根不需要二線豪華品牌

兵敗如山倒!國(guó)產(chǎn)新能源或已經(jīng)證明:中國(guó)壓根不需要二線豪華品牌

詩(shī)酒趁的年華
2026-04-24 18:12:26
3-0,申花5連勝積分達(dá)到10分 蓋伊連場(chǎng)破門 河南把握機(jī)會(huì)能力太差

3-0,申花5連勝積分達(dá)到10分 蓋伊連場(chǎng)破門 河南把握機(jī)會(huì)能力太差

替補(bǔ)席看球
2026-04-26 22:00:22
莫斯科遇襲!烏克蘭攻擊俄最大雅羅斯拉夫爾煉油廠

莫斯科遇襲!烏克蘭攻擊俄最大雅羅斯拉夫爾煉油廠

項(xiàng)鵬飛
2026-04-26 22:04:22
19歲小伙連吃幾天小龍蝦,劇烈頭痛、行走困難!確診為“橫紋肌溶解癥”

19歲小伙連吃幾天小龍蝦,劇烈頭痛、行走困難!確診為“橫紋肌溶解癥”

環(huán)球網(wǎng)資訊
2026-04-26 07:43:11
2026-04-26 23:52:49
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報(bào)道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來(lái)的千行百業(yè)產(chǎn)業(yè)變革。
11688文章數(shù) 117048關(guān)注度
往期回顧 全部

科技要聞

漲價(jià)浪潮下,DeepSeek推動(dòng)AI“價(jià)格戰(zhàn)”

頭條要聞

以色列政壇重大變局 內(nèi)塔尼亞胡迎來(lái)勁敵

頭條要聞

以色列政壇重大變局 內(nèi)塔尼亞胡迎來(lái)勁敵

體育要聞

森林狼3比1掘金:逆境中殺出了多孫穆?!

娛樂要聞

僅次《指環(huán)王》的美劇,有第二季

財(cái)經(jīng)要聞

事關(guān)新就業(yè)群體,中辦、國(guó)辦發(fā)文

汽車要聞

預(yù)售19.38萬(wàn)元起 哈弗猛龍PLUS七座版亮相

態(tài)度原創(chuàng)

本地
藝術(shù)
手機(jī)
公開課
軍事航空

本地新聞

云游中國(guó)|逛世界風(fēng)箏都 留學(xué)生探秘中國(guó)傳統(tǒng)文化

藝術(shù)要聞

總投資35億!汾酒集團(tuán)太原的地標(biāo)大樓,呈現(xiàn)白酒文化!

手機(jī)要聞

鴻蒙6,玻璃,光,和我

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗總統(tǒng):不會(huì)在壓力、威脅下進(jìn)行談判

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版