国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

HSImul3R:給三維交互重建裝上物理大腦

0
分享至



在具身智能狂飆突進的今天,讓機器人像人一樣在復雜場景中靈活交互,已成為學術(shù)界與工業(yè)界的共同愿景。其中的核心挑戰(zhàn)在于人體 - 場景交互建模,這需要深入理解人體運動、空間布局以及交互的穩(wěn)定性。從圖像或視頻中重建人體 - 場景交互(HSI),不僅能提供高保真的監(jiān)督信號,還能幫助構(gòu)建可擴展的、仿真就緒(Simulation-ready)的數(shù)據(jù)集。

然而,現(xiàn)有方法普遍存在 “感知 - 仿真鴻溝”(Perception–Simulation Gap):許多在視覺上極其逼真的人體交互重建結(jié)果,一旦丟進物理仿真器,就會因為違背物理定律(如身體穿透物體、重心不穩(wěn)等)而瞬間崩塌。這一鴻溝很大程度上源于人體與環(huán)境建模的分離。現(xiàn)有研究很少捕捉兩者間明確的物理耦合,而是分為三個獨立方向:1)3D 場景重建(如 NeRF, 3DGS),側(cè)重環(huán)境幾何而忽視人體動力學;2)人體動作估計,雖具魯棒性但在隔離狀態(tài)下重建,缺乏物理接觸或環(huán)境約束;3)交互建模,通常受限于規(guī)模和物理驗證不足。盡管近期出現(xiàn)了一些統(tǒng)一框架,但仍主要在 2D 圖像空間優(yōu)化,優(yōu)先考慮視覺對齊而非幾何與物理的有效性。因此,重建結(jié)果缺乏尺度和接觸精度,無法用于仿真部署。

為了彌合這一鴻溝,來自南洋理工大學 S-Lab,ACE Robotics,和上海人工智能實驗室的研究團隊推出了 HSImul3R—— 一個仿真就緒的人體 - 場景交互 3D 重建框架。該框架將重建表述為一個雙向物理感知優(yōu)化問題。物理仿真器充當 “主動監(jiān)督者”,實現(xiàn)人體運動與場景幾何之間的閉環(huán)優(yōu)化。

  • 正向優(yōu)化:在固定場景幾何下細化人體運動。利用 3D 生成模型的結(jié)構(gòu)先驗建立尺度一致的對齊后,他們將重建結(jié)果集成到模擬器中,進行針對場景的強化學習,利用物理信號(如關(guān)鍵點跟蹤一致性和幾何接觸約束)優(yōu)化運動穩(wěn)定性。
  • 反向優(yōu)化:在經(jīng)物理驗證的動作下細化場景幾何。針對結(jié)構(gòu)缺陷導致的穩(wěn)定性問題,他們提出了直接仿真獎勵優(yōu)化(DSRO),利用仿真器反饋的獎勵來增強重力穩(wěn)定性和交互可行性。

此外,他們采集構(gòu)建了 HSIBench 數(shù)據(jù)集,包含 19 類物體、50 多個運動序列及 300 個獨特交互實例。



想深入了解 HSImul3R 的技術(shù)細節(jié)?我們已經(jīng)為你準備好了完整的論文、項目主頁!



  • 論文標題:HSImul3R: Physics-in-the-Loop Reconstruction of Simulation-Ready Human-Scene Interactions
  • arXiv: https://arxiv.org/abs/2603.15612
  • Project Page:https://yukangcao.github.io/HSImul3R/
  • GitHub:https://github.com/yukangcao/HSImul3R

方法



以日常采集到的視頻或圖片作為輸入,HSImul3R 通過 Physics-in-the-loop 的優(yōu)化管線實現(xiàn)了模擬就緒的人體 - 場景交互重建。本文以圖片輸入的情況作為講解。首先,他們提出了在重建管線中注入顯式 3D 生成先驗,以實現(xiàn)更優(yōu)的人體 - 場景對齊。隨后:(1)在正向優(yōu)化中,作者提出了場景針對性強化學習,通過優(yōu)化人體運動來提高在仿真器中的交互穩(wěn)定性。(2)在反向優(yōu)化中,作者引入了直接仿真獎勵優(yōu)化(DSRO),利用仿真器關(guān)于穩(wěn)定性的反饋來精細化場景幾何。

具體而言,他們根據(jù)仿真的穩(wěn)定性反饋定義了四種結(jié)果類型:第一類:物體在重力作用下無法保持自穩(wěn);第二類:物體在人體交互過程中失去平衡;第三類:物體雖能達到穩(wěn)定狀態(tài),但不能和人體產(chǎn)生有意義的交互;第四類:物體和人體實現(xiàn)了穩(wěn)定的交互。

人體 - 場景交互重建與對齊



通過顯式 3D 結(jié)構(gòu)先驗進行對齊:盡管完成了上述初步對齊,兩個關(guān)鍵問題依然存在:

(1) 重建的場景幾何常包含結(jié)構(gòu)錯誤,如組件斷開、表面缺失或非封閉拓撲;

(2) 人體 - 場景對齊僅依賴于基于 2D 投影的監(jiān)督,缺乏 3D 幾何感知且易受遮擋影響。

這些缺陷不可避免地導致物理仿真器中的物理不穩(wěn)定和漂移。為解決這些挑戰(zhàn),作者利用預訓練生成模型的 3D結(jié)構(gòu)先驗來修正場景幾何,并施加更穩(wěn)健的交互約束。















正向優(yōu)化:基于場景的人體動作優(yōu)化

在完成人體 - 場景交互的初始 3D 重建和對齊后,下一步是確保其在物理仿真器中具有穩(wěn)定的動力學表現(xiàn)。一種直接的方法是采用運動跟蹤技術(shù)將重建的人體姿態(tài)重定向并放到仿真器中。然而,這樣直接仿真原始重建結(jié)果的做法往往無法產(chǎn)生穩(wěn)定的交互。在許多情況下,人形機器人會無意中碰撞附近的物體,導致物體與身體分離并獨立靜置于地面。這種不穩(wěn)定性是因為傳統(tǒng)的 3D 重建未考慮重力與交互力,無法驗證姿態(tài)與物體放置在物理上是否可實現(xiàn)。

為解決此問題,作者在基于強化學習的運動跟蹤中引入了針對場景的監(jiān)督信號







反向優(yōu)化:仿真器引導的物體精細化

盡管帶有場景針對性強化學習的正向優(yōu)化增強了仿真穩(wěn)定性,作者仍觀察到穩(wěn)定性比例尚不理想。研究發(fā)現(xiàn),該問題很大程度上源于顯式 3D 生成先驗的質(zhì)量不一,主要原因有二:(1) 生成的物體常包含結(jié)構(gòu)缺陷(尤其是細長幾何體),例如桌椅缺失腿部,導致其在無交互的情況下也無法在仿真器中自穩(wěn);(2) 輸入圖像中人體造成的嚴重遮擋常導致生成的物體出現(xiàn)表面畸變或異常凸起。這些局限使得人形機器人在仿真中難以建立穩(wěn)定且符合物理規(guī)律的接觸。

直接仿真獎勵優(yōu)化 (DSRO):受 DSO 啟發(fā),他們提出了直接仿真獎勵優(yōu)化(DSRO),這是一種利用物理仿真反饋作為監(jiān)督信號來精細化 3D 顯式物體生成的創(chuàng)新方法。不同于依賴人工標注或 3D 真值的方法,DSRO 直接利用仿真結(jié)果來評估生成物體及其與人體交互的物理合理性。

形式上,我們將 DSRO 目標定義為:





穩(wěn)定性由三個標準判定:(1) 物體必須在模擬器重力作用下保持直立和物理穩(wěn)定;(2) 重建場景必須達到穩(wěn)定的最終狀態(tài);(3) 交互必須包含實際接觸,而非物體獨立靜置于地面。

HSIBench 數(shù)據(jù)集及仿真實驗



為了支持本框架的訓練與基準測試,作者們構(gòu)建了一個專門針對人體 - 場景交互的數(shù)據(jù)集 ——HSIBench。該數(shù)據(jù)集通過系統(tǒng)性地采集交互場景構(gòu)建而成,邀請了三名志愿者(兩男一女)與多種物體進行交互,包括 8 把椅子、3 張桌子和 3 個沙發(fā)。

HSIBench 共記錄了300 個獨特的 HSI 案例,每個案例均從16 個不同視角進行拍攝,以提供豐富的多視圖監(jiān)督信號。上圖中,作者提供了部分數(shù)據(jù)的示例圖和仿真結(jié)果。

真機實驗



除了仿真模擬之外,作者們基于 HSImul3R 優(yōu)化的人體運動軌跡,實現(xiàn)了 sim-to-real 的真機實驗。其中,他們首先利用 GMR 將人體動作重定向至 宇樹 G1 人形機器人的形態(tài)。這些重定向后的動作隨后被用作擴散引導強化學習(Diffusion-guided RL)的先驗,在 IsaacGym 仿真器中訓練全身控制策略。該框架允許智能體在強化學習訓練階段利用擴散模型的生成先驗來學習穩(wěn)健的平衡能力。訓練完成后,生成的控制策略通過 Unitree SDK 直接部署到 G1 人形機器人硬件上。

如上圖所示,該策略在 宇樹 G1 真機上的成功部署表明,HSImul3R 精細化后的動作能夠?qū)崿F(xiàn)穩(wěn)定的機器人 - 場景交互。該框架為利用 YouTube 等平臺的海量低成本數(shù)據(jù)來增強大規(guī)模具身智能模型的訓練數(shù)據(jù)提供了可擴展的基礎(chǔ)。

總結(jié)

本文介紹了 HSImul3R,一個能夠從非校準稀疏視角中重建仿真就緒人體 - 場景交互的框架。該方法方法集成了:(1)接觸感知交互模型,旨在緩解 3D 重建中的人與場景穿模的問題;(2)場景針對性強化學習策略,用以提升仿真器內(nèi)的交互穩(wěn)定性;(3)直接仿真獎勵優(yōu)化(DSRO)方案,利用仿真反饋微調(diào)圖生 3D 生成模型,從而提高仿真成功率。此外,作者們采集了 HSIBench 數(shù)據(jù)集以支持訓練與評估。實驗證明,HSImul3R 在穩(wěn)定仿真與高質(zhì)量 3D 重建方面均達到了高保真效果,性能顯著優(yōu)于現(xiàn)有最先進方法。

盡管 HSImul3R 在仿真就緒重建領(lǐng)域邁出了第一步,但仍存在以下局限:

1.成功率仍有提升空間:尤其是在涉及復雜交互或多物體(超過三個)的場景下;

2.交互深度不足:在部分失敗案例中,人體與物體趨向于各自獨立站立,而非產(chǎn)生有意義的實質(zhì)性交互;

3.模型偏見:微調(diào)后的圖生 3D 模型不可避免地繼承了原始 MIDI 數(shù)據(jù)集及 HSIBench 的偏見,這可能限制其在域外場景的泛化能力。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
澳門世界杯:衛(wèi)冕冠軍4-0大勒布倫,雨果王楚欽連續(xù)2年半決賽相遇

澳門世界杯:衛(wèi)冕冠軍4-0大勒布倫,雨果王楚欽連續(xù)2年半決賽相遇

乒談
2026-04-04 22:34:36
落難的鳳凰不如雞,多位明星無戲可拍,淪落到給景區(qū)打工,太辛酸

落難的鳳凰不如雞,多位明星無戲可拍,淪落到給景區(qū)打工,太辛酸

阿傖說事
2026-03-29 19:45:09
中超再現(xiàn)奇葩1幕:3個進球被吹,視頻回放看了足足11分鐘!

中超再現(xiàn)奇葩1幕:3個進球被吹,視頻回放看了足足11分鐘!

邱澤云
2026-04-04 23:32:50
張凌赫被高層開研討會處理???

張凌赫被高層開研討會處理!?

八卦瘋叔
2026-04-04 10:32:03
杜月笙救人一命后,對方送來二十根金條,他只留下一個梨

杜月笙救人一命后,對方送來二十根金條,他只留下一個梨

千秋文化
2026-03-31 20:54:38
蔣介石孫子召開發(fā)布會,提出“兩蔣”移靈大陸,2句話讓世人唏噓

蔣介石孫子召開發(fā)布會,提出“兩蔣”移靈大陸,2句話讓世人唏噓

老謝談史
2026-03-18 18:33:35
舅舅是蔣介石,1936年他踩了警察局長小老婆腳,局長打他三耳光

舅舅是蔣介石,1936年他踩了警察局長小老婆腳,局長打他三耳光

宅家伍菇?jīng)?/span>
2025-08-20 15:52:52
2架美國“黑鷹”被伊朗山民擊中!秘密武器遭曝光,伊朗:新防空系統(tǒng)將陸續(xù)亮相!特朗普40年前就說要“搶伊朗石油”、奪哈爾克島

2架美國“黑鷹”被伊朗山民擊中!秘密武器遭曝光,伊朗:新防空系統(tǒng)將陸續(xù)亮相!特朗普40年前就說要“搶伊朗石油”、奪哈爾克島

每日經(jīng)濟新聞
2026-04-05 01:14:41
中東局勢:4月5日下午最新消息

中東局勢:4月5日下午最新消息

第一校尉
2026-04-05 17:25:52
獨家供應(yīng)商談張雪:當年他獨自造車在QQ上賣,先收錢后制造,奪冠比我想象的更早

獨家供應(yīng)商談張雪:當年他獨自造車在QQ上賣,先收錢后制造,奪冠比我想象的更早

極目新聞
2026-04-04 10:39:03
2-2!波爾圖主場爆冷,本菲卡差8分,穆帥計劃有變:葡超要爭冠

2-2!波爾圖主場爆冷,本菲卡差8分,穆帥計劃有變:葡超要爭冠

體育知多少
2026-04-05 08:42:38
落選國家隊后,李盈瑩現(xiàn)身,體形太消瘦,說了一句話讓人心疼

落選國家隊后,李盈瑩現(xiàn)身,體形太消瘦,說了一句話讓人心疼

跑者排球視角
2026-04-05 09:08:36
執(zhí)教球隊不足三個月,多位媒體人:新疆隊主帥格蘭離任

執(zhí)教球隊不足三個月,多位媒體人:新疆隊主帥格蘭離任

懂球帝
2026-04-05 15:30:06
鄭麗文訪陸前夕突生變數(shù),美方信函曝光,局勢反轉(zhuǎn)有著什么信號

鄭麗文訪陸前夕突生變數(shù),美方信函曝光,局勢反轉(zhuǎn)有著什么信號

薦史
2026-04-05 14:32:36
身材炸裂!NBA 場邊的 “人間尤物”,個個顏值能打還不是花瓶

身材炸裂!NBA 場邊的 “人間尤物”,個個顏值能打還不是花瓶

橙星文娛
2026-04-05 10:34:51
新能源汽車銷量同比降21%,為何電車賣不動了?三個原因制約銷量

新能源汽車銷量同比降21%,為何電車賣不動了?三個原因制約銷量

王五說說看
2026-04-04 12:21:39
有一種病叫“性成癮”:一旦發(fā)作,比煙癮、酒癮厲害多了,很痛苦

有一種病叫“性成癮”:一旦發(fā)作,比煙癮、酒癮厲害多了,很痛苦

熊貓醫(yī)學社
2026-04-05 12:05:03
華為新品官宣:4月10日,正式開售上市!

華為新品官宣:4月10日,正式開售上市!

科技堡壘
2026-04-04 12:04:09
95年我被關(guān)派出所,我問長官:你認識我舅嗎?長官:你舅算哪根蔥

95年我被關(guān)派出所,我問長官:你認識我舅嗎?長官:你舅算哪根蔥

荔枝人物記
2025-07-29 09:09:07
潛伏在中國的反華家族,靠大陸收入上億,今國家出手下場大快人心

潛伏在中國的反華家族,靠大陸收入上億,今國家出手下場大快人心

混沌錄
2026-04-05 16:33:20
2026-04-05 19:27:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12681文章數(shù) 142613關(guān)注度
往期回顧 全部

科技要聞

花200薅5千算力,Claude冷血斷供“龍蝦”

頭條要聞

自稱將勞斯萊斯變現(xiàn) 陳光標曬捐款圖:張雪遲遲未提車

頭條要聞

自稱將勞斯萊斯變現(xiàn) 陳光標曬捐款圖:張雪遲遲未提車

體育要聞

CBA最老球員,身價7500萬美元

娛樂要聞

好用心!宋慧喬為好友慶生做一桌美食

財經(jīng)要聞

誰造出了優(yōu)思益這頭“怪物”?

汽車要聞

家用SUV沒駕駛樂趣?極氪8X第一個不同意

態(tài)度原創(chuàng)

親子
本地
藝術(shù)
游戲
軍事航空

親子要聞

別把過敏當感冒 這份兒童春季過敏防護指南請收好

本地新聞

跟著歌聲游安徽,聽古村回響

藝術(shù)要聞

懷素的這件“臨終絕筆”,徹底改寫了書法史

終極對決鎖定2027!PS6、Xbox新主機同步發(fā)售剛正面

軍事要聞

美飛行員獲救細節(jié):美伊發(fā)生激烈交火 至少4死1傷

無障礙瀏覽 進入關(guān)懷版