国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

732M模型超越7B!機(jī)器人操控新范式:從視頻中「悟」物理

0
分享至


新智元報(bào)道

編輯:LRST

【新智元導(dǎo)讀】機(jī)器人操控的「數(shù)據(jù)困境」一直是行業(yè)痛點(diǎn):要讓機(jī)器人學(xué)會精細(xì)操作,傳統(tǒng)方法需要大量人工標(biāo)注的動作演示數(shù)據(jù),成本高昂、周期漫長。這個瓶頸能否被突破?

大型視頻生成模型在海量視頻上訓(xùn)練,已經(jīng)隱式地學(xué)會了物理世界的運(yùn)行規(guī)律:物體如何運(yùn)動、力如何傳遞、空間關(guān)系如何演化。

這些知識與機(jī)器人操控所需的物理直覺高度一致。

關(guān)鍵問題是能否把這些視頻模型已經(jīng)掌握的物理先驗(yàn),轉(zhuǎn)移到機(jī)器人控制上?

中山大學(xué)王廣潤教授給出了一個創(chuàng)新答案:不靠海量動作數(shù)據(jù),直接從視頻生成模型中「借」物理直覺。從PAR(物理自回歸模型)到其進(jìn)階版本PhysGen(從預(yù)訓(xùn)練視頻模型中學(xué)習(xí)物理),兩項(xiàng)工作一脈相承,共享同一套物理自回歸核心框架,并與英偉達(dá)今年2月發(fā)布的DreamDojo在核心思路上高度重合——當(dāng)兩條獨(dú)立探索的路線收斂到同一個方向,這或許意味著某種底層規(guī)律正在被揭示。


PAR論文鏈接:https://arxiv.org/abs/2508.09822

項(xiàng)目主頁:https://hcplab-sysu.github.io/PhysicalAutoregressiveModel

論文發(fā)表時間:2025年8月13日


PhysGen論文鏈接:https://arxiv.org/abs/2603.00110

論文發(fā)表時間:2026年2月18日

傳統(tǒng)方法把「看環(huán)境」和「做動作」分成兩個任務(wù)。

PAR反其道而行之:把視頻幀和機(jī)器人動作編碼成同一種「物理token」,讓模型在同一個自回歸過程中,既預(yù)測「世界接下來會變成什么樣」,也同步輸出「機(jī)器人該做什么動作」,這與人類「眼手協(xié)調(diào)」的直覺高度吻合。

這樣做的好處是:動作不再是孤立的指令序列,而是與環(huán)境演化深度綁定的聯(lián)合預(yù)測。


圖1:物理token自回歸的運(yùn)作方式:預(yù)測未來的幀與動作聯(lián)合體,與真實(shí)環(huán)境同步演化

三個技術(shù)要點(diǎn)

  1. 連續(xù)表示,不離散化:幀與動作都用連續(xù)向量表達(dá),避免離散量化帶來的精度損失

  2. 隱式逆運(yùn)動學(xué):通過特殊的因果掩碼設(shè)計(jì),讓模型在看到未來畫面后再決定當(dāng)前動作

  3. 高效推理:借鑒LLM的KV-Cache技術(shù),實(shí)現(xiàn)實(shí)時控制

效果如何?

在ManiSkill基準(zhǔn)測試中:

  • PushCube任務(wù)達(dá)到100%成功率

  • 總體平均成功率74%,居所有方法第二,僅次于需要大規(guī)模動作預(yù)訓(xùn)練的RDT(84%)

  • 在PickCube與StackCube任務(wù)上,同樣超過或接近需要動作預(yù)訓(xùn)練的強(qiáng)基準(zhǔn)方法

  • 額外引入?yún)?shù)僅30M


圖2:ManiSkill基準(zhǔn)成功率對比(零動作預(yù)訓(xùn)練,媲美SOTA)

PhysGen

對物理自回歸路線的深化

PhysGen在2026年2月公開發(fā)布,是PAR路線的延續(xù)。它完整保留了PAR的核心架構(gòu)(物理token、連續(xù)表示、因果掩碼),并在此基礎(chǔ)上做了三處關(guān)鍵改進(jìn)。

三項(xiàng)升級

① 前瞻規(guī)劃(Lookahead-MTP)讓模型每次預(yù)測時「多看幾步」——同時預(yù)測未來3個token,訓(xùn)練時全監(jiān)督,推理時只執(zhí)行第一個。這相當(dāng)于給機(jī)器人配了短期規(guī)劃能力。

② 高效訓(xùn)練(LoRA微調(diào))用參數(shù)高效的方式微調(diào)大模型,訓(xùn)練成本大幅降低——單張A100顯卡,60小時內(nèi)完成訓(xùn)練。

③ 真實(shí)世界驗(yàn)證不止在仿真環(huán)境,PhysGen在Franka Panda真實(shí)機(jī)械臂上完成了四項(xiàng)任務(wù)測試,包括抓取透明物體這種高難度場景。

效果有多強(qiáng)?

LIBERO仿真基準(zhǔn):


圖3:732M參數(shù)、在零大規(guī)模動作預(yù)訓(xùn)練的前提下,Physgen取得平均90.8%成功率

真實(shí)世界任務(wù):


圖4: 真實(shí)機(jī)器人實(shí)驗(yàn)性能對比

在最考驗(yàn)物理感知的透明物體抓取任務(wù)中,PhysGen反超了需要大規(guī)模預(yù)訓(xùn)練的π0模型——這說明從視頻學(xué)到的物理直覺,在處理視覺欺騙性強(qiáng)的場景時更有優(yōu)勢。

與英偉達(dá)DreamDojo的深度同源

今年2月,英偉達(dá)發(fā)布了DreamDojo——一個基于大規(guī)模視頻訓(xùn)練的通用機(jī)器人世界模型。對比PAR/PhysGen與DreamDojo,會發(fā)現(xiàn)兩條路線在核心技術(shù)理念上驚人一致。

兩個系統(tǒng)的本質(zhì)目標(biāo)完全一致:預(yù)測未來的「物理量」——也就是未來的動作和視頻的聯(lián)合體。

這個設(shè)計(jì)背后的哲學(xué)是:機(jī)器人操控不是「先看畫面,再決定動作」的串行過程,而是「世界如何演化」與「機(jī)器人如何行動」的聯(lián)合預(yù)測問題。動作和視頻不是兩個獨(dú)立變量,而是物理世界演化的共同結(jié)果。


架構(gòu)共識:自回歸建模

在如何預(yù)測這個「未來物理量」的問題上,兩個系統(tǒng)不約而同地選擇了自回歸架構(gòu)。

為什么是自回歸?因?yàn)槲锢硎澜绲难莼?strong>序列性、因果性的——當(dāng)前時刻的狀態(tài)決定下一時刻的狀態(tài),下一時刻又影響再下一時刻。自回歸模型天然契合這種逐步展開的物理過程。


表示共識:連續(xù)空間建模

在如何表達(dá)「物理量」的問題上,兩個系統(tǒng)都選擇了連續(xù)表示,而非離散化。

這是一個關(guān)鍵決策:物理世界本質(zhì)上是連續(xù)的(位置、速度、力都是連續(xù)量),離散化會引入量化誤差,這些誤差在長時序預(yù)測中會累積放大。連續(xù)表示則能保持物理量的原生精度。


訓(xùn)練共識:零動作預(yù)訓(xùn)練

兩個系統(tǒng)都驗(yàn)證了同一個重要結(jié)論:不需要大規(guī)模機(jī)器人動作數(shù)據(jù)預(yù)訓(xùn)練,就能實(shí)現(xiàn)強(qiáng)大的操控能力。

這背后的邏輯是:視頻數(shù)據(jù)本身已經(jīng)包含了豐富的物理先驗(yàn)(物體運(yùn)動規(guī)律、力學(xué)關(guān)系、空間推理),這些先驗(yàn)可以直接遷移到機(jī)器人控制任務(wù)上。


時間線印證

中大團(tuán)隊(duì)的PAR在2025年8月公開,PhysGen在2026年3月公開,DreamDojo在2026年2月發(fā)布。

三者獨(dú)立推進(jìn),卻在四個核心決策上同步收斂:

① 預(yù)測目標(biāo):未來動作+視頻聯(lián)合體(物理量)② 架構(gòu)選擇:自回歸逐步展開(契合物理因果)③ 表示方法:連續(xù)空間建模(避免量化誤差)④ 訓(xùn)練范式:零動作預(yù)訓(xùn)練(視頻物理先驗(yàn)遷移)

這不是偶然的相似,而是對同一底層規(guī)律的共同發(fā)現(xiàn)。

其中最核心的洞察是:

世界模型不是為了「看起來好」,而是為了「指導(dǎo)動作」

這是PAR/PhysGen與傳統(tǒng)視頻生成模型的根本區(qū)別。

傳統(tǒng)視頻生成模型(如Sora、Runway)追求的是視覺保真度——生成的視頻要看起來真實(shí)、「美觀流暢。

但對于機(jī)器人操控而言,世界模型的根本目的不是生成一段視覺上美觀的未來視頻,而是希望生成的未來視頻能對下一步的物理動作起到實(shí)質(zhì)性的前瞻與指導(dǎo)作用

核心哲學(xué)總結(jié)

對世界模型的理解,可以歸結(jié)為一句話:

世界模型的價(jià)值不在于生成「好看的視頻」,而在于生成「對動作有指導(dǎo)意義的物理預(yù)測」。視頻只是物理演化的可視化載體,真正重要的是其中蘊(yùn)含的物理因果關(guān)系——這些因果關(guān)系決定了「做什么動作會導(dǎo)致什么結(jié)果」,而這正是機(jī)器人決策的核心依據(jù)。

這也是為什么PhysGen能用732M參數(shù)超越7B級模型——它沒有把算力浪費(fèi)在「讓視頻更美」上,而是專注于「讓物理預(yù)測更準(zhǔn)」。

從PAR到PhysGen,正在驗(yàn)證一條清晰的技術(shù)路線:把機(jī)器人操控問題重新定義為「預(yù)測未來物理量」——未來的動作和視頻聯(lián)合體,并用自回歸模型在連續(xù)空間中逐步展開這個預(yù)測過程。

更重要的是,明確了世界模型的根本目的:不是生成視覺上美觀的未來視頻,而是生成對下一步物理動作有實(shí)質(zhì)指導(dǎo)作用的物理預(yù)測。這個理念體現(xiàn)在物理token聯(lián)合建模、因果掩碼逆運(yùn)動學(xué)、前瞻多步規(guī)劃、真實(shí)世界物理挑戰(zhàn)驗(yàn)證等一系列設(shè)計(jì)中,并通過732M參數(shù)超越7B級模型的效率,以及透明物體抓取超越π0的效果,得到了實(shí)踐檢驗(yàn)。

而英偉達(dá)DreamDojo在預(yù)測目標(biāo)、架構(gòu)選擇、表示方法、訓(xùn)練范式四個核心決策上的同步跟進(jìn),則從另一個側(cè)面印證了這一方向的潛力。

作者介紹

王廣潤系國家海外高層次青年人才基金及華為戰(zhàn)略人才基金獲得者,中山大學(xué)計(jì)算機(jī)學(xué)院青年研究員、博士生導(dǎo)師,拓元智慧首席科學(xué)家。華為「天才少年計(jì)劃」最高級別入選者;曾赴英國牛津大學(xué)擔(dān)任Research Fellow,師從英國皇家科學(xué)院院士、皇家工程院院士 Philip H.S. Torr 教授。

主要從事新一代AI架構(gòu)、大物理模型與世界模型、多模態(tài)生成式AI方向研究。獲吳文俊人工智能優(yōu)秀博士論文獎(全國僅9人)、《Pattern Recognition》全球當(dāng)年唯一最佳論文、全球AI華人新星榜(當(dāng)年機(jī)器學(xué)習(xí)領(lǐng)域全球僅25人);擔(dān)任多個CCF A類會議領(lǐng)域主席;在多項(xiàng)國際競賽中獲得金牌;研究成果被圖靈獎得主Yann LeCun引用。

參考資料:

https://arxiv.org/abs/2603.00110

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
人民日報(bào)痛批大學(xué)生 “沉睡” 現(xiàn)象:躺平四年,畢業(yè)真的會失業(yè)!

人民日報(bào)痛批大學(xué)生 “沉睡” 現(xiàn)象:躺平四年,畢業(yè)真的會失業(yè)!

復(fù)轉(zhuǎn)這些年
2026-03-25 10:02:32
林志玲、呂良偉2公里,黃曉明5公里、張朝陽半馬!新聞馬拉松群星完賽

林志玲、呂良偉2公里,黃曉明5公里、張朝陽半馬!新聞馬拉松群星完賽

馬拉松跑步健身
2026-03-27 21:54:40
4名U23首秀+10名小將!國足這場大變臉,把世界杯球隊(duì)跑抽筋了!

4名U23首秀+10名小將!國足這場大變臉,把世界杯球隊(duì)跑抽筋了!

看透足球?qū)?/span>
2026-03-28 08:17:40
朝鮮為什么不承認(rèn)上甘嶺戰(zhàn)役,全世界都知道的事實(shí)!

朝鮮為什么不承認(rèn)上甘嶺戰(zhàn)役,全世界都知道的事實(shí)!

阿諬體育評論
2026-03-20 22:10:13
取消交強(qiáng)險(xiǎn)呼聲居高不下!交通部重磅落地,車主們:太贊了

取消交強(qiáng)險(xiǎn)呼聲居高不下!交通部重磅落地,車主們:太贊了

侃故事的阿慶
2026-03-26 17:57:43
泰國征兵拿張凌赫做廣告 泰陸軍發(fā)言人:支持!

泰國征兵拿張凌赫做廣告 泰陸軍發(fā)言人:支持!

看看新聞Knews
2026-03-26 21:37:02
瘋了!皇馬要挖巴薩核心?弗洛倫蒂諾想復(fù)刻菲戈世紀(jì)轉(zhuǎn)會

瘋了!皇馬要挖巴薩核心?弗洛倫蒂諾想復(fù)刻菲戈世紀(jì)轉(zhuǎn)會

瀾歸序
2026-03-28 04:57:46
美媒:004型航母,全長345米,寬86米,世界噸位第一?

美媒:004型航母,全長345米,寬86米,世界噸位第一?

健身狂人
2026-03-27 20:24:21
馬伊琍官宣了,文章公開認(rèn)愛,恭喜!

馬伊琍官宣了,文章公開認(rèn)愛,恭喜!

美芽
2026-03-28 12:02:59
78歲連路都走不穩(wěn)還開演唱會,全網(wǎng)罵聲一片,她卻揚(yáng)言回饋粉絲

78歲連路都走不穩(wěn)還開演唱會,全網(wǎng)罵聲一片,她卻揚(yáng)言回饋粉絲

洲洲影視娛評
2026-01-28 12:23:18
中國小電驢海外殺瘋了,油價(jià)暴漲,東南亞一車難求,日本摩托看懵

中國小電驢海外殺瘋了,油價(jià)暴漲,東南亞一車難求,日本摩托看懵

有范又有料
2026-03-27 16:54:24
歐爾班:中國簡直不可戰(zhàn)勝

歐爾班:中國簡直不可戰(zhàn)勝

觀察者網(wǎng)
2026-03-27 21:59:51
人社部:職稱評審將重大調(diào)整?。?>
    </a>
        <h3>
      <a href=新浪財(cái)經(jīng)
2026-03-25 21:42:36
對手主教練親自上場!樊振東3-0“欺負(fù)”52歲孟慶宇 賽后表達(dá)歉意

對手主教練親自上場!樊振東3-0“欺負(fù)”52歲孟慶宇 賽后表達(dá)歉意

風(fēng)過鄉(xiāng)
2026-03-28 08:52:50
高校設(shè)“考公考編學(xué)院”,是對高等教育最大的嘲諷

高校設(shè)“考公考編學(xué)院”,是對高等教育最大的嘲諷

聽心堂
2026-03-26 10:06:01
霸凌奇觀,美國兩黨聯(lián)手圍攻中國運(yùn)動員

霸凌奇觀,美國兩黨聯(lián)手圍攻中國運(yùn)動員

雪中風(fēng)車
2026-02-26 08:25:05
陳妍希紅毯胖出新高度!臀肥大、后背勒出兩層肉,裙子被撐到崩開

陳妍希紅毯胖出新高度!臀肥大、后背勒出兩層肉,裙子被撐到崩開

觀察鑒娛
2026-03-28 10:00:00
“??颇猩跑?小時”事件,被全網(wǎng)嘲笑:無知的人連裝都不會裝

“專科男生古茗8小時”事件,被全網(wǎng)嘲笑:無知的人連裝都不會裝

妍妍教育日記
2026-02-26 20:37:12
阿卡豪擲重金預(yù)訂豪華游艇,尺寸超越納達(dá)爾600萬美元最貴座駕

阿卡豪擲重金預(yù)訂豪華游艇,尺寸超越納達(dá)爾600萬美元最貴座駕

網(wǎng)球之家
2026-03-27 22:29:00
美軍中央部司令:超10000個伊朗軍事目標(biāo)被確認(rèn)摧毀

美軍中央部司令:超10000個伊朗軍事目標(biāo)被確認(rèn)摧毀

清濱酒客
2026-03-28 12:16:55
2026-03-28 12:48:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14831文章數(shù) 66720關(guān)注度
往期回顧 全部

科技要聞

遭中國學(xué)界"拉黑"后,這家AI頂會低頭道歉

頭條要聞

媒體:"霍爾木茲決戰(zhàn)"攤牌了 美給伊朗開出"投降"條件

頭條要聞

媒體:"霍爾木茲決戰(zhàn)"攤牌了 美給伊朗開出"投降"條件

體育要聞

“我是全家最差勁的運(yùn)動員”

娛樂要聞

王一博改名上熱搜!個人時代正式開啟!

財(cái)經(jīng)要聞

我在小吃培訓(xùn)機(jī)構(gòu)學(xué)習(xí)“科技與狠活”

汽車要聞

置換補(bǔ)貼價(jià)4.28萬起 第五代宏光MINIEV正式上市

態(tài)度原創(chuàng)

健康
手機(jī)
房產(chǎn)
數(shù)碼
教育

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

手機(jī)要聞

手機(jī)芯片跑出筆記本功耗:外媒測試三星Exynos 2600

房產(chǎn)要聞

6.8萬方!天河員村再征地,金融城西區(qū)開發(fā)全面提速

數(shù)碼要聞

華碩新款商務(wù)本ExpertBook B3 G1,配置超豐富!

教育要聞

步入高中應(yīng)該如何學(xué)習(xí)英語,單詞和語法哪個比重大,刷題有用嗎?

無障礙瀏覽 進(jìn)入關(guān)懷版