国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

楊立昆發(fā)布史上最“輕”世界模型,單GPU可訓,規(guī)劃速度提升48倍

0
分享至

在通往通用智能(AGI)的道路上,世界模型(World Model)正被視為最關鍵的下一步。

通俗來說,世界模型就像是給 AI 裝上了一個“大腦模擬器”。它讓機器人不再僅僅是機械地執(zhí)行指令,而是具備了在想象空間中預演未來的能力。當一個機械臂試圖抓取杯子時,世界模型允許它在真正動手前,先在腦海中模擬不同動作可能導致的結果。

為了構建這種模型,圖靈獎得主楊立昆提出了聯(lián)合嵌入預測架構(JEPA)。該方法不直接讓 AI 預測復雜的畫面變化,而是先把畫面“壓縮”成一串簡單的核心特征,再讓 AI 學怎么預測這些核心特征的變化。這樣一來,AI 不用關注畫面的細枝末節(jié),只抓關鍵規(guī)律,效率會高很多。

然而,傳統(tǒng) JEPA 技術打造的 “模擬器”,始終存在核心痛點,成為其落地應用的阻礙。

其一,訓練易 “表示崩潰”,穩(wěn)定性差。為了輕松完成特征預測任務,AI 會出現(xiàn)“偷懶”行為:將所有不同的視覺輸入映射為幾乎相同的潛特征,看似預測精準,實則這些特征毫無實際價值,這一問題被稱為“表示崩潰”;其二,超參數(shù)繁瑣,調參成本極高。主流端到端 JEPA 方法如 PLDM 擁有 6 個可調超參數(shù),參數(shù)的細微變化都會導致模型性能天差地別,調參不僅需要大量的時間和計算資源,且參數(shù)無法跨任務復用,換一個任務就需要重新調試,門檻極高。

其三,計算成本高,規(guī)劃運行緩慢。部分方法為避免“表示崩潰”,會依賴提前訓練好的超大視覺預訓練模型作為基礎,雖能提升穩(wěn)定性,卻讓模型體積臃腫、編碼效率低下,AI 完成一次決策規(guī)劃需要耗費大量時間。

近日,楊立昆團隊發(fā)表的論文,提出了一款名為 LeWorldModel(簡稱 LeWM)的全新世界模型,核心解決了傳統(tǒng) JEPA 訓練不穩(wěn)定、易崩潰、超參數(shù)多、計算成本高的問題,是首個能從原始像素數(shù)據(jù)端到端穩(wěn)定訓練的世界模型。整個模型就 2 個核心組件、2 個損失項,15M 參數(shù),單 GPU 幾小時就能訓完,只有 1 個有效可調超參數(shù)。


(來源:上述論文)

LeWM 的組成特別精簡,包括兩部分。一個是編碼器,用輕量的視覺模型,把攝像頭拍的彩色畫面,變成一串簡短的核心特征,抓住畫面里的關鍵信息;另一個是預測器,根據(jù) “當前的核心特征以及要做的動作”,精準預測下一步的核心特征,比如 “推一下方塊,它的位置特征會變成什么樣”,學懂環(huán)境的運行規(guī)律。

LeWM 最核心的突破,在于用兩個簡單且有科學支撐的訓練目標,從根本上解決了傳統(tǒng) JEPA 的“表示崩潰”問題,徹底摒棄了經(jīng)驗性技巧。其一為預測損失,是讓 AI 精準預測未來的核心特征,保證學的規(guī)律有用;其二是 SIGReg 正則化,逼著 AI 把核心特征分布得均勻多樣,不讓它把所有畫面都映射成一樣的特征。

同時,LeWM 把調參的難度降到了最低,過去要調 6 個參數(shù),現(xiàn)在只需要調 1 個,而且調參的方法特別簡單,不用反復試錯,普通人也能上手。

在實際性能測試中,研究團隊在二維導航、機械臂控制、推方塊等經(jīng)典連續(xù)控制任務上測試了 LeWM,并與當前主流的 JEPA 方法(DINO-WM、PLDM)、行為克隆(GCBC)、離線強化學習(GCIVL、GCIQL)等方法展開對比。

在二維導航任務中,智能體需要從一個房間穿過唯一的門,導航至另一個房間的指定目標位置,考驗 AI 的路徑規(guī)劃和環(huán)境感知能力。LeWM 在該任務中雖略遜于傳統(tǒng)方法,但其潛特征仍能精準捕捉智能體的位置信息,后續(xù)研究證實,這一表現(xiàn)差異并非源于特征學習不足,而是簡單環(huán)境的內(nèi)在維度與 SIGReg 的正則化要求存在適配性問題,并非模型本身的性能缺陷。


圖 | LeWM 在不同任務測試中的表現(xiàn)(來源:上述論文)

在推方塊任務中,LeWM 實現(xiàn)了性能突破,成功率比主流端到端方法 PLDM 高出 18%,更關鍵的是,僅依靠純像素輸入的 LeWM,性能竟超越了額外融合機器人本體感受信息(關節(jié)狀態(tài)、運動數(shù)據(jù))的 DINO-WM,充分證明其能從純視覺畫面中,精準捕捉到任務所需的全部關鍵規(guī)律,無需額外信息輔助。

除此之外,LeWM 的規(guī)劃效率更是實現(xiàn)了質的飛躍。因為模型輕、特征簡單,LeWM 做決策規(guī)劃的速度,最高是傳統(tǒng)大模型方法的 48 倍,單次規(guī)劃不到 1 秒,不同任務、不同環(huán)境下速度都很穩(wěn)定。

同時,LeWM 的訓練穩(wěn)定性遠超傳統(tǒng)方法:傳統(tǒng) PLDM 的訓練曲線波動劇烈,像“坐過山車”,而 LeWM 的訓練曲線平滑單調收斂,預測損失穩(wěn)步下降,SIGReg 損失在訓練初期快速下降后趨于平穩(wěn),且不同隨機種子下的訓練結果方差極小,可復現(xiàn)性大幅提升,徹底解決了傳統(tǒng)方法“一次成功、次次翻車”的問題。


圖 | LeWM 訓練路徑(來源:上述論文)

最厲害的是,LeWM 造的 “模擬器”,不是單純靠死記硬背數(shù)據(jù),而是真的學懂了物理世界的規(guī)律。

實驗中,研究人員能從 LeWM 的核心特征里,精準提取出物體位置、角度、速度這些物理量,精度比傳統(tǒng)方法高很多;更有趣的是,給 LeWM 看三種視頻:物體正常運動、物體顏色突然變了、物體突然瞬移(違反物理規(guī)律),LeWM 對瞬移會表現(xiàn)出明顯的驚訝(預測誤差驟增),對顏色變化卻幾乎沒反應。這說明它能分清“只是外觀變了”和“物理規(guī)律被打破了”,真正理解了世界的運行邏輯,而不是只記得畫面的表面特征。

當然,目前 LeWM 還有一些小短板:比如現(xiàn)在只能做短期的決策規(guī)劃,規(guī)劃太久會積累誤差;在特別簡單的環(huán)境里,部分訓練規(guī)則的效果會打折扣;訓練時還需要明確的“動作標簽”,比如“推方塊”要標注出推的方向和力度。

針對這些問題,研究團隊也指出了未來的改進方向,比如把長任務拆成短任務實現(xiàn)長期規(guī)劃、讓模型從海量自然視頻里學通用物理規(guī)律、讓模型自己從畫面里學動作,不用額外標注。

1.https://arxiv.org/pdf/2603.19312

運營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
關辛回應焦泊喬離隊之事!

關辛回應焦泊喬離隊之事!

體育哲人
2026-03-28 18:06:26
兩性關系:不管你信不信,女性過了65歲后,基本都有這7個現(xiàn)狀

兩性關系:不管你信不信,女性過了65歲后,基本都有這7個現(xiàn)狀

王二哥老搞笑
2026-03-24 09:47:27
4-2,打爆日本張本美和,王曼昱強勢復出,蒯曼陳幸同出戰(zhàn)世乒賽

4-2,打爆日本張本美和,王曼昱強勢復出,蒯曼陳幸同出戰(zhàn)世乒賽

冷桂零落
2026-03-28 15:36:03
隊記談焦泊喬:他想要個官方通報,但球隊不想出,球迷:無法調和

隊記談焦泊喬:他想要個官方通報,但球隊不想出,球迷:無法調和

南海浪花
2026-03-28 11:44:31
張雪峰好兄弟曝內(nèi)情泣不成聲,人民日報悼念官媒定義,衛(wèi)健委追責

張雪峰好兄弟曝內(nèi)情泣不成聲,人民日報悼念官媒定義,衛(wèi)健委追責

潮鹿逐夢
2026-03-26 10:55:41
二戰(zhàn)后,地表上有1億顆地雷,人工清理要4000年,被一種動物搞定

二戰(zhàn)后,地表上有1億顆地雷,人工清理要4000年,被一種動物搞定

芳芳歷史燴
2026-03-25 23:19:30
A股:大家站穩(wěn)扶好了,尾盤很明顯,明天,3月30日,很可能這樣走

A股:大家站穩(wěn)扶好了,尾盤很明顯,明天,3月30日,很可能這樣走

股市皆大事
2026-03-29 09:25:37
國際觀察|胡塞武裝“扣動扳機”,伊朗攤牌了嗎

國際觀察|胡塞武裝“扣動扳機”,伊朗攤牌了嗎

新華社
2026-03-28 22:57:03
砸了個寂寞!70艘貨船被扣,美方指責中方公報私仇,實力差太多!

砸了個寂寞!70艘貨船被扣,美方指責中方公報私仇,實力差太多!

一家說
2026-03-28 19:17:43
KTV聚會照被瘋傳!郭麒麟認了是本人!嚴浩翔私生公開小號關注列表

KTV聚會照被瘋傳!郭麒麟認了是本人!嚴浩翔私生公開小號關注列表

觀察鑒娛
2026-03-28 09:22:06
中國拒絕出席G7峰會,法國表示將采取措施應對

中國拒絕出席G7峰會,法國表示將采取措施應對

二大爺觀世界
2026-03-28 22:45:28
蕭敬騰與林有慧巴塞羅那街頭被偶遇,素顏狀態(tài)真實,年齡差藏不住

蕭敬騰與林有慧巴塞羅那街頭被偶遇,素顏狀態(tài)真實,年齡差藏不住

暖心萌阿菇?jīng)?/span>
2026-03-29 09:13:41
孫儷這組比基尼太好看了吧!不知道便宜了誰?

孫儷這組比基尼太好看了吧!不知道便宜了誰?

東方不敗然多多
2026-03-29 09:25:06
西蒙斯開心曬漁獲引熱議!球迷羨慕:手握兩億美刀過上最爽的日子

西蒙斯開心曬漁獲引熱議!球迷羨慕:手握兩億美刀過上最爽的日子

羅說NBA
2026-03-29 06:55:46
釋永信“開光”真相大白,過程不堪入目,易中天也有牽扯

釋永信“開光”真相大白,過程不堪入目,易中天也有牽扯

尋墨閣
2026-03-25 11:39:10
國務院食安辦、市場監(jiān)管總局約談相關地方市級人民政府負責人,督辦“3·15”晚會曝光問題整改

國務院食安辦、市場監(jiān)管總局約談相關地方市級人民政府負責人,督辦“3·15”晚會曝光問題整改

界面新聞
2026-03-28 19:04:36
委內(nèi)瑞拉石油,引爆美方4個煉油廠,特朗普做的孽,終于來了報應

委內(nèi)瑞拉石油,引爆美方4個煉油廠,特朗普做的孽,終于來了報應

阿握聊事
2026-03-28 12:27:56
太逆天了!約基奇!MVP最新排行榜公布

太逆天了!約基奇!MVP最新排行榜公布

技巧君侃球
2026-03-29 00:07:10
原來精神小妹的生活方式這么離譜!看完網(wǎng)友分享,大開眼界了

原來精神小妹的生活方式這么離譜!看完網(wǎng)友分享,大開眼界了

另子維愛讀史
2026-03-02 19:55:07
NBA官宣!東契奇被禁賽!湖人遭受雙重打擊

NBA官宣!東契奇被禁賽!湖人遭受雙重打擊

籃球教學論壇
2026-03-29 09:25:30
2026-03-29 10:16:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16500文章數(shù) 514808關注度
往期回顧 全部

科技要聞

馬斯克承認xAI"建錯了",11位創(chuàng)始人均離職

頭條要聞

牛彈琴:特朗普親口對沙特說出傲慢的話 全世界不敢相信

頭條要聞

牛彈琴:特朗普親口對沙特說出傲慢的話 全世界不敢相信

體育要聞

全球第二大車企,也救不了這支德甲隊?

娛樂要聞

陳牧馳陳冰官宣得子 曬一家三口握拳照

財經(jīng)要聞

臥底"科技與狠活"培訓:化工調味劑泛濫

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達/華為新一代座艙

態(tài)度原創(chuàng)

本地
旅游
親子
房產(chǎn)
公開課

本地新聞

在濰坊待了三天,沒遇到一個“濰坊人”

旅游要聞

武漢:一城繁花 全域皆景

親子要聞

醫(yī)院設兒童智能輸液椅,看動畫9元/小時引家長不滿投訴

房產(chǎn)要聞

首日430組來訪,單日120組認籌!海口首個真四代,徹底爆了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版