国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

深度|阿里?ICLR 255?篇霸榜!基座是明牌,系統(tǒng)是暗牌,做實(shí)比做強(qiáng)更狠

0
分享至


Z Highlights

  • 從論文分布上看,基座大模型吃掉51.8%的份額,多模態(tài)感知再切走 20.8%。光是這兩個(gè)方向,就卷走了超過七成的火力。

  • 如果說基座大模型是明牌,那計(jì)算機(jī)系統(tǒng)就是阿里的暗牌。表面上看,系統(tǒng)方向只有 5 篇論文,數(shù)量少得可憐。但整個(gè) ICLR 2026 在系統(tǒng)方向的占比僅 0.8%,阿里的偏好指數(shù)高達(dá) 2.44,重倉程度甚至超過基座大模型。

  • 誰能解決泛化問題,誰能壓縮系統(tǒng)成本,誰能打通模型落地的最后一公里,誰才是下一個(gè)時(shí)代的贏家。阿里系的研究重心,已經(jīng)從做強(qiáng)轉(zhuǎn)向做實(shí)。

AI 頂會(huì)江湖,風(fēng)向正在悄然生變。

當(dāng)全球 5340 篇論文涌入 ICLR 2026,阿里系以 255 篇接收論文、10 篇 Oral 的硬核戰(zhàn)績,拿下 4.8%的全球份額。這不是簡單的數(shù)字堆砌,在這份成績單背后,藏著阿里 AI 戰(zhàn)略的深層邏輯:從單兵突進(jìn)轉(zhuǎn)向生態(tài)作戰(zhàn),從論文工廠轉(zhuǎn)向產(chǎn)業(yè)閉環(huán)。


關(guān)于 ICLR:國際表征學(xué)習(xí)大會(huì)(ICLR)是深度學(xué)習(xí)領(lǐng)域頂級(jí)會(huì)議,與 NeurIPS、ICML 并稱機(jī)器學(xué)習(xí)三大頂會(huì),近期被 CCF 評(píng)為 A 類會(huì)議。2026 年 ICLR 覆蓋大語言模型、生成模型、多模態(tài)學(xué)習(xí)、AI 安全、機(jī)器學(xué)習(xí)系統(tǒng)等多個(gè)前沿方向。


255篇背后:一場產(chǎn)學(xué)研的鐵三角實(shí)驗(yàn)

翻開阿里系的論文版圖,一個(gè)反常識(shí)的數(shù)據(jù)炸場:96.1% 的論文依賴外部合作,純阿里獨(dú)立完成的僅占 2.7%。但一個(gè)細(xì)節(jié)更值得玩味:這份龐大的合作名單里,海外高校幾乎缺席。

這不是能力短板,而是一場更為極致的本土化閉環(huán)實(shí)驗(yàn)——阿里正在把自己變成一塊磁石,不玩閉門造車的原創(chuàng)神話,而是搭建產(chǎn)業(yè)平臺(tái) + 國內(nèi)高校網(wǎng)絡(luò)的新范式。純阿里獨(dú)立完成的論文,只有 7 篇,占比 2.7%。剩下的 97.3%呢?

  • 阿里-高校合作 168 篇(65.9%)

  • 阿里-高校-企業(yè)混合 77 篇(30.2%)

  • 純阿里-企業(yè)合作 3 篇(1.2%)


圖 7 阿里系論文合作版圖分布

本土 AI 全明星陣容包括:

  • 浙江大學(xué) 51 篇

  • 清華大學(xué) 43 篇

  • 香港科技大學(xué) 31 篇

  • 北京大學(xué) 29 篇

  • 中科院自動(dòng)化所 20 篇

甚至連字節(jié)跳動(dòng)(13 篇)、騰訊(9 篇)這些友商,都在阿里系的合作網(wǎng)絡(luò)里刷臉。在頂會(huì)賽場上,競合關(guān)系的邊界正在模糊——今天的對手,明天的合作者。

0% 的海外依賴,2.7% 的獨(dú)舞,96.1% 的群像,阿里在用數(shù)據(jù)證明:在這個(gè)時(shí)代,做平臺(tái)比做孤島更有殺傷力。這些頭部高校不僅是論文產(chǎn)出機(jī)器,更是阿里的人才蓄水池和技術(shù)風(fēng)向標(biāo)。

基座大模型吃掉半壁江山,多模態(tài)感知緊追不舍

如果說論文數(shù)量是面子,那研究方向就是里子。阿里系的火力高度集中在兩大高地:基座大模型(51.8%)和多模態(tài)感知(20.8%)。光是這兩個(gè)方向,就吞掉了超過七成的彈藥。

這與 ICLR 的整體趨勢同頻共振,但阿里的打法更重——當(dāng)行業(yè)還在卷參數(shù)規(guī)模,他們已經(jīng)開始死磕可用性重構(gòu)。10 篇 Oral 論文透露了研究重心正從能力突破轉(zhuǎn)向場景閉環(huán):泛化、推理、效率、落地這四個(gè)關(guān)鍵詞,構(gòu)成了阿里 AI 的新坐標(biāo)系。

過去兩年,大模型賽道充斥著大力出奇跡的狂熱。但阿里系在 ICLR 2026 的選題,明顯冷靜了下來。

他們不再只關(guān)心模型能做什么,而是追問模型在真實(shí)世界怎么用得起來。系統(tǒng)效率優(yōu)化、復(fù)雜環(huán)境泛化、推理可靠性保障,這些聽起來不那么性感的方向,正在成為新的技術(shù)高地。這種轉(zhuǎn)向,與阿里的產(chǎn)業(yè)基因密不可分。作為年研發(fā)投入超 15%、坐擁數(shù)萬塊 GPU 集群和數(shù)十億級(jí)真實(shí)業(yè)務(wù)數(shù)據(jù)的云服務(wù)商,阿里比純研究機(jī)構(gòu)更清楚:技術(shù)價(jià)值最終要在產(chǎn)業(yè)閉環(huán)里兌現(xiàn)。依托 7000 余名技術(shù)人才(含 2000+博士)和魔搭社區(qū)等開放平臺(tái),阿里已經(jīng)構(gòu)建起全球領(lǐng)先的 AI 全棧能力。

但 255 篇論文也拋出了一個(gè)新命題:當(dāng)外部合作成為主流產(chǎn)出模式,如何在工程能力、場景需求與學(xué)術(shù)原創(chuàng)之間找到更深層的平衡?這不僅是阿里的挑戰(zhàn),也是中國產(chǎn)業(yè) AI 的集體課題。畢竟,頂會(huì)論文只是入場券,定義下一代 AI 基礎(chǔ)設(shè)施的能力,才是真正的終局之戰(zhàn)。

計(jì)算機(jī)系統(tǒng)方向偷偷發(fā)力,全力押注工程可落地

255 篇論文背后,阿里系的彈藥到底投向了哪里?


圖 1 阿里系論文數(shù)量概覽

基座大模型:阿里的超配戰(zhàn)略

數(shù)據(jù)不會(huì)說謊。ICLR 2026 整體接收論文中,基座大模型方向占 33.2%,而阿里系在這一方向的占比高達(dá) 51.8%——偏好指數(shù) 1.56,超配幅度接近六成。這意味著當(dāng)行業(yè)還在均衡布局時(shí),阿里選擇了把雞蛋放在最重的籃子里。


圖 2 阿里系論文研究領(lǐng)域大類分布

更細(xì)顆粒度地看,阿里系在 foundation or frontier models(含 LLM)方向砸了 72 篇論文,占總量 28.2%;多模態(tài)應(yīng)用 47 篇、數(shù)據(jù)集與評(píng)測基準(zhǔn) 30 篇、生成模型 30 篇——從底層架構(gòu)到上層應(yīng)用,從訓(xùn)練數(shù)據(jù)到評(píng)測標(biāo)準(zhǔn),阿里正在構(gòu)建一套完整的技術(shù)閉環(huán)。


圖 3 阿里系論文一級(jí)研究方向 Top 10

一個(gè)值得玩味的細(xì)節(jié)是Junyang Lin(林俊旸)一人署名 8 篇論文,其中 1 篇 Oral。這位阿里大模型骨干的選題清單,堪稱阿里技術(shù)路線的縮影——多模態(tài)推理、軟件工程智能體、推測式解碼、全模態(tài)感知...清一色的大模型+多模態(tài)主線。

系統(tǒng)方向是被忽視的隱形重倉


圖 4 阿里與整體 ICLR 方向分布對比


圖 5 阿里方向偏好指數(shù)

如果說基座大模型是明牌,那計(jì)算機(jī)系統(tǒng)方向就是阿里的暗牌。表面上看,系統(tǒng)方向只有 5 篇論文,數(shù)量少得可憐。但別忘了,整個(gè) ICLR 2026 在系統(tǒng)方向的占比僅 0.8%——阿里的偏好指數(shù)高達(dá) 2.44,重倉程度甚至超過基座大模型。

這透露了一個(gè)關(guān)鍵信號(hào):當(dāng)所有人都在卷模型能力,阿里已經(jīng)開始死磕底層基礎(chǔ)設(shè)施。畢竟,對于手握數(shù)萬塊 GPU 集群的云服務(wù)商來說,系統(tǒng)效率才是真正的護(hù)城河。

Oral 質(zhì)量占比:與大盤持平,未見明顯超車


圖 6 阿里與整體 ICLR Oral 占比對比

最后看一個(gè)硬核指標(biāo):Oral 占比。阿里系 Oral 論文 10 篇,占比 3.9%;ICLR 整體 Oral 占比 4.2%。-0.3 個(gè)百分點(diǎn)的差距,說明阿里在論文質(zhì)量上穩(wěn)住了基本盤,但并未形成顯著的精品優(yōu)勢。

換句話說,相比頂級(jí)突破性成果,阿里更擅長規(guī)?;a(chǎn)出,把三個(gè)特征串起來看,阿里在 ICLR 2026 的打法已經(jīng)非常清晰:

1.方向聚焦:基座大模型絕對重倉,多模態(tài)緊隨其后,系統(tǒng)方向暗中發(fā)力

2.生態(tài)作戰(zhàn):96%的論文依賴外部合作,把自己變成產(chǎn)業(yè)研究平臺(tái)

3.工程導(dǎo)向:偏好指數(shù)顯示,阿里明顯回避純理論方向,全力押注工程可落地領(lǐng)域

這不是傳統(tǒng)意義上的學(xué)術(shù)機(jī)構(gòu)打法,而是平臺(tái)型科技公司的典型策略——用產(chǎn)業(yè)資源換學(xué)術(shù)影響力,用合作網(wǎng)絡(luò)換規(guī)模效應(yīng),最終目標(biāo)不是頂會(huì)獎(jiǎng)杯,而是 AI 基礎(chǔ)設(shè)施的定義權(quán)。

注:

  • 偏好指數(shù) = 阿里在某方向的論文占比 / 整體 ICLR 在該方向的論文占比。偏好指數(shù)大于 1 表示阿里在該方向相對超配,小于 1 表示相對低配。

  • 占比差值 = 阿里在某方向的論文占比 - 整體 ICLR 在該方向的論文占比,用于直觀看結(jié)構(gòu)差異。

  • 本文新增的這些指標(biāo)都屬于描述性統(tǒng)計(jì),用于說明方向結(jié)構(gòu),不做顯著性檢驗(yàn)。

10篇Oral看阿里系ICLR 2026的真正重心


我們聚焦在阿里系在 ICLR 上的 10 篇Oral文章,相關(guān)研究大致沿著泛化性、推理可靠性、計(jì)算效率以及對齊與交互能力四條主線展開,并逐步形成了從數(shù)據(jù)構(gòu)建、模型設(shè)計(jì)、先驗(yàn)注入、推理增強(qiáng)到評(píng)測范式重構(gòu)的多層次研究圖景。

首先,在泛化能力方面,現(xiàn)有工作已不再滿足于封閉分布下的性能提升,而是更加關(guān)注模型在未見偽造類型、跨域場景以及復(fù)雜真實(shí)環(huán)境中的魯棒性。一類研究從數(shù)據(jù)與基準(zhǔn)構(gòu)建入手,試圖通過更貼近實(shí)際應(yīng)用條件的訓(xùn)練與評(píng)測設(shè)置縮小實(shí)驗(yàn)環(huán)境與工業(yè)場景之間的差距。例如,HydraFake 強(qiáng)調(diào)多樣化偽造技術(shù)、真實(shí)世界 forgery 以及嚴(yán)格的 out-of-domain 協(xié)議,從數(shù)據(jù)層面推動(dòng)深偽檢測研究由“同分布識(shí)別”轉(zhuǎn)向“面向開放場景的泛化檢測”;另一類工作從模型機(jī)制本身出發(fā)增強(qiáng)泛化能力。以 Camera-Aware MLLM 為代表的研究指出,僅依賴 RGB 輸入的空間智能建模容易將幾何屬性與相機(jī)成像條件混合編碼,導(dǎo)致模型過擬合于訓(xùn)練相機(jī)分布,因此有必要將相機(jī)內(nèi)參顯式納入視覺 token 的條件建模之中,并輔以相機(jī)感知的數(shù)據(jù)增強(qiáng)策略與幾何先驗(yàn)蒸餾,以提升跨相機(jī)條件下的空間推理能力。

推理能力與可靠性方面,一條重要方向是通過結(jié)構(gòu)化推理機(jī)制增強(qiáng)模型的中間決策質(zhì)量。Veritas 通過在傳統(tǒng) chain-of-thought 之外引入 planning 與 self-reflection 等關(guān)鍵模式,使模型能夠以更接近人工鑒偽流程的方式逐步分析偽造線索;VC-STaR 從視覺對比的角度出發(fā),利用對比式 VQA 樣本幫助模型更準(zhǔn)確地定位判別性視覺證據(jù),并在此基礎(chǔ)上生成質(zhì)量更高、幻覺更少的視覺推理路徑,進(jìn)而實(shí)現(xiàn)視覺推理能力的自我提升。


VERITAS

效率與優(yōu)化方面,相關(guān)研究主要覆蓋訓(xùn)練階段與推理階段兩個(gè)層面。訓(xùn)練階段的工作更多關(guān)注如何在不犧牲最終性能的前提下降低傳統(tǒng)優(yōu)化范式中的冗余設(shè)計(jì)。WSM 即代表了一類重新審視學(xué)習(xí)率衰減機(jī)制的研究,其核心觀點(diǎn)在于通過 checkpoint merging 建立學(xué)習(xí)率調(diào)度與模型平均之間的形式聯(lián)系,從而以一種 decay-free 的方式近似或替代常見的 cosine decay、linear decay 等退火策略。該類方法的意義不僅在于優(yōu)化效率本身,也在于其為長期預(yù)訓(xùn)練和后續(xù)監(jiān)督微調(diào)提供了更統(tǒng)一的訓(xùn)練動(dòng)力學(xué)解釋。

對齊、交互與決策能力方面,研究關(guān)注點(diǎn)則進(jìn)一步擴(kuò)展至模型如何在開放環(huán)境中適應(yīng)用戶偏好、完成動(dòng)態(tài)任務(wù)并實(shí)現(xiàn)可擴(kuò)展的行為優(yōu)化。P-GenRM 代表了個(gè)性化對齊方向的重要進(jìn)展,其通過將用戶偏好表征為結(jié)構(gòu)化評(píng)價(jià)鏈,并在測試階段引入基于個(gè)體與原型的雙粒度縮放機(jī)制,使獎(jiǎng)勵(lì)模型不僅能夠適配特定用戶的細(xì)粒度偏好,還能借助相似用戶群體的原型知識(shí)增強(qiáng)對新用戶的泛化能力。


P-GenRM

綜合來看,一方面,研究者通過更真實(shí)的數(shù)據(jù)分布、動(dòng)態(tài)交互環(huán)境和更嚴(yán)格的評(píng)測協(xié)議不斷暴露現(xiàn)有模型在開放世界中的能力缺口;另一方面,又通過結(jié)構(gòu)化推理、先驗(yàn)知識(shí)注入、訓(xùn)練與解碼機(jī)制優(yōu)化以及個(gè)性化對齊等方法,系統(tǒng)性地彌補(bǔ)模型在泛化性、可靠性、效率和實(shí)用性上的不足。

作者: Cheng Gao, Shi Yuchen, Wang Shijie

*排名不分先后,按照首字母排序

Ref.

https://arxiv.org/pdf/2602.12116

https://arxiv.org/pdf/2508.21048

https://papercopilot.com/statistics/iclr-statistics/

數(shù)據(jù)來自 openreview 公開信息

加入ZF討論群,請先添加小助手微信

我們相信認(rèn)知能夠跨越階層,

致力于為年輕人提供高質(zhì)量的科技和財(cái)經(jīng)內(nèi)容。

稿件經(jīng)采用可獲邀進(jìn)入Z Finance內(nèi)部社群,優(yōu)秀者將成為簽約作者,00后更有機(jī)會(huì)成為Z Finance的早期共創(chuàng)成員。

我們正在招募新一期的實(shí)習(xí)生

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
錢再多有什么用!丁克了大半輩子的馬蘭,終究是為自己的荒唐買單

錢再多有什么用!丁克了大半輩子的馬蘭,終究是為自己的荒唐買單

一盅情懷
2026-04-29 16:29:59
巴黎5-4拜仁:這場進(jìn)球大戰(zhàn)暴露了英超什么秘密?

巴黎5-4拜仁:這場進(jìn)球大戰(zhàn)暴露了英超什么秘密?

競技風(fēng)云錄
2026-04-29 20:34:22
去銀行注銷銀行卡,柜員問銷卡還是銷戶?一字之差后果完全不一樣

去銀行注銷銀行卡,柜員問銷卡還是銷戶?一字之差后果完全不一樣

復(fù)轉(zhuǎn)這些年
2026-04-16 12:15:01
開拓者1比4出局楊瀚森尚未出汗,最快下賽季重返CBA

開拓者1比4出局楊瀚森尚未出汗,最快下賽季重返CBA

姜大叔侃球
2026-04-29 12:46:01
Manus,徹底涼涼了

Manus,徹底涼涼了

技術(shù)領(lǐng)導(dǎo)力
2026-04-27 20:37:27
71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

月滿大江流
2026-04-16 13:54:38
中科大少年班監(jiān)控事件!同學(xué)爆出更多細(xì)節(jié),沒弒母已經(jīng)很不錯(cuò)了!

中科大少年班監(jiān)控事件!同學(xué)爆出更多細(xì)節(jié),沒弒母已經(jīng)很不錯(cuò)了!

知曉科普
2026-04-29 07:00:24
上海文旅局:29日起,上海居民可赴金門、馬祖旅游

上海文旅局:29日起,上海居民可赴金門、馬祖旅游

上觀新聞
2026-04-29 20:21:11
實(shí)錘!羽協(xié)主席張軍被查,10余人落馬

實(shí)錘!羽協(xié)主席張軍被查,10余人落馬

史海流年號(hào)
2026-04-29 17:54:38
醫(yī)生發(fā)現(xiàn):堅(jiān)持走路鍛煉的老人,過不了半個(gè)月,會(huì)迎來4大改善

醫(yī)生發(fā)現(xiàn):堅(jiān)持走路鍛煉的老人,過不了半個(gè)月,會(huì)迎來4大改善

蜉蝣說
2026-04-29 16:56:00
1981年,陳伯達(dá)被判刑18年,出獄后提出唯一要求,組織:盡管提

1981年,陳伯達(dá)被判刑18年,出獄后提出唯一要求,組織:盡管提

瑾瑜聊情感
2025-07-04 18:06:06
卡巴耶娃:普京的緋聞女友,傳聞為他生下二子,普京卻不承認(rèn)再婚

卡巴耶娃:普京的緋聞女友,傳聞為他生下二子,普京卻不承認(rèn)再婚

莫地方
2026-04-29 00:10:03
鄧華妻子向梁興初求助,梁興初瞪著副政委:敢動(dòng)老紅軍,你掂量下

鄧華妻子向梁興初求助,梁興初瞪著副政委:敢動(dòng)老紅軍,你掂量下

觀史搜尋著
2026-03-07 02:10:58
不訪華了?特朗普聯(lián)合27國對華施壓,話音剛落,秒被中方制裁打臉

不訪華了?特朗普聯(lián)合27國對華施壓,話音剛落,秒被中方制裁打臉

鐵錘簡科
2026-04-29 14:32:40
北京一姑娘,因“生菜吃成老樁”火了,網(wǎng)友:種一次吃三年,值啊

北京一姑娘,因“生菜吃成老樁”火了,網(wǎng)友:種一次吃三年,值啊

原廣工業(yè)
2026-04-29 19:59:41
又一國家將開戰(zhàn)?防長身亡、首都危在旦夕,真相遠(yuǎn)比想象更殘酷

又一國家將開戰(zhàn)?防長身亡、首都危在旦夕,真相遠(yuǎn)比想象更殘酷

阿晪美食
2026-04-29 19:02:29
官宣!英超賽程確定,曼城周末后少賽兩場,曼聯(lián)利物浦可能改期

官宣!英超賽程確定,曼城周末后少賽兩場,曼聯(lián)利物浦可能改期

嗨皮看球
2026-04-29 19:48:03
2026斯諾克世錦賽再起爭議!羅伯遜公開呼吁禁用奧沙利文專屬巧粉

2026斯諾克世錦賽再起爭議!羅伯遜公開呼吁禁用奧沙利文專屬巧粉

冷桂零落
2026-04-29 18:36:43
余承東在華為權(quán)力排名

余承東在華為權(quán)力排名

生活新鮮市
2026-04-27 18:30:53
十年前,易建聯(lián)花1000萬在洛杉磯買下豪宅,如今出售市值多少?

十年前,易建聯(lián)花1000萬在洛杉磯買下豪宅,如今出售市值多少?

小蘭聊歷史
2026-04-26 08:44:22
2026-04-29 21:31:00
ZFinance
ZFinance
Z世代的一站式AI、科技和財(cái)經(jīng)資訊
174文章數(shù) 15關(guān)注度
往期回顧 全部

科技要聞

今晨庭審紀(jì)實(shí)|馬斯克當(dāng)庭講述OpenAI被偷走

頭條要聞

男子詐騙熟人350萬 朋友圈發(fā)文"我跑路了 你們報(bào)案吧"

頭條要聞

男子詐騙熟人350萬 朋友圈發(fā)文"我跑路了 你們報(bào)案吧"

體育要聞

一場九球狂歡,各路神仙批量下凡

娛樂要聞

馬頔一句話,孫楊媽媽怒罵節(jié)目組2小時(shí)

財(cái)經(jīng)要聞

蘇州,率先進(jìn)入牛市

汽車要聞

技術(shù)天花板再摸高 全能型的奕境X9首秀

態(tài)度原創(chuàng)

游戲
藝術(shù)
手機(jī)
公開課
軍事航空

《GTA6》發(fā)售那天太多人請假!T2老板預(yù)測

藝術(shù)要聞

這些女神,竟然都是攝影師切爾尼亞季耶夫的復(fù)古作品!

手機(jī)要聞

手機(jī)版DLSS!三星ENSS跑分超競品15%:卻無游戲適配

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國參議院否決限制特朗普對古巴動(dòng)武的決議

無障礙瀏覽 進(jìn)入關(guān)懷版