国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

一文速通「機器人3D場景表示」發(fā)展史

0
分享至



隨著機器人領域的飛速發(fā)展,我們有一個問題不斷需要思考,究竟如何讓機器人像人類一樣理解世界,學習周圍環(huán)境的表示。對于機器人來說,究竟是需要精確的坐標,還是語義的物體概念,還是隱式的空間認識推理模型?

在本文中,上海交通大學、波恩大學等院校的研究團隊全面總結了當前機器人技術中常用的場景表示方法。這些方法包括傳統(tǒng)的點云、體素柵格、符號距離函數(shù)以及場景圖等傳統(tǒng)幾何表示方式,同時也涵蓋了最新的神經(jīng)網(wǎng)絡表示技術,如神經(jīng)輻射場、3D 高斯散布模型以及新興的 3D 基礎模型。

雖然目前的 SLAM 與定位系統(tǒng)主要依賴點云、體素這類稀疏表示方式,但密集型場景表示方法在導航、避障等后續(xù)任務中無疑會發(fā)揮關鍵作用。此外,神經(jīng)輻射場、3D 高斯散布模型以及基礎模型這類神經(jīng)網(wǎng)絡表示技術,非常適合整合高層次的語義信息與基于語言的先驗知識,從而實現(xiàn)更全面的 3D 場景理解與智能體行為控制。本文的目標是為新手和資深研究人員提供一份有價值的參考資料,幫助他們探索 3D 場景表示技術的未來發(fā)展方向及其在機器人技術中的應用。



  • 標題:What Is The Best 3D Scene Representation for Robotics? From Geometric to Foundation Models
  • 作者:Tianchen Deng, Yue Pan, Shenghai Yuan, Dong Li, Chen Wang, Mingrui Li, Long Chen, Lihua Xie, Danwei Wang, Jingchuan Wang, Javier Civera, Hesheng Wang, Weidong Chen
  • 機構:Shanghai Jiao Tong University、University of Bonn、Chinese Academy of Sciences、University of Zaragoza、Nanyang Technological University
  • 原文鏈接:https://arxiv.org/abs/2512.03422
  • 代碼鏈接:https://github.com/dtc111111/awesomerepresentation-for-robotics

一、機器人 3D 場景發(fā)展史



機器人 3D 場景表示發(fā)展史和代表性工作

幾何場景表示:

  • Point Cloud 點云場景表示:通過離散的三維點來表示場景,通過雷達或者相機傳感器獲得。
  • Voxel 體素場景表示:通過將三維空間離散化,轉(zhuǎn)變成規(guī)則的立方體柵格,通過在柵格內(nèi)存儲不同的信息,比如密度,占用率等實現(xiàn)場景建模
  • Mesh 網(wǎng)格場景表示:通過三角化面片構建連續(xù)的場景幾何場景表示,精細度更高。
  • SDF 符號距離場:通過表示空間點到物體表面的距離,實現(xiàn)連續(xù)的場景幾何表示。

近年來,深度學習、計算機圖形學與機器人技術的融合推動了顯著進展。在眾多推動這一進展的技術中,神經(jīng)輻射場(NeRF)、三維高斯濺射和基礎模型(Foundation Model,F(xiàn)M)作為極具前景的創(chuàng)新脫穎而出,從而實現(xiàn)真正的通用具身智能。



機器人 3D 三維表征研究熱度變化

3D 神經(jīng)場景表示

  • NeRF 神經(jīng)輻射場:通過連續(xù)的場景表示讓機器人理解世界,基于神經(jīng)網(wǎng)絡 MLP 構建,可以進行地圖預測,但是速度較慢。
  • 3DGS 高斯?jié)姙R:將場景表示為 3D 高斯橢球,從而實現(xiàn)高速的渲染,適合實時建圖。
  • Foundation Model 基礎模型: 通過現(xiàn)有的 transformer 等編碼器,將三維世界壓縮成類似于語言的 token,將三維世界的理解變成可推理的人類語言。從而實現(xiàn)空間感知推理,成為「3D 版本的 GPT」。



三維場景表征在機器人不同模塊的應用:感知,建圖,定位,操作,導航

在建圖和定位模塊(第 V 節(jié))中,現(xiàn)有方法在 SLAM 和定位領域取得了令人矚目的成果。神經(jīng)場景表示能夠?qū)崿F(xiàn)對環(huán)境的更精確、更密集的建模,這對避障特別有益。這一能力對于機器人的導航和操作至關重要。

該模塊分為三部分:(i)場景重建:場景表示的地圖重建能力包括幾何精度和渲染質(zhì)量,以及在靜態(tài)場景、大規(guī)模戶外場景和動態(tài)場景中的重建能力。(iii)SLAM:SLAM 部分主要包括不同場景表示方法在 SLAM 過程中的地圖精度、位姿精度和實時性能。(iv)全局定位:全局定位主要涉及使用現(xiàn)有地圖進行定位時的精度和實時性能。

在操作模塊(第 VI-A 節(jié))中,本文主要比較了基于不同場景表示方法的抓取框架。傳統(tǒng)方法在抓取方面具有更高的實時性能和計算效率,但在泛化能力和處理復雜目標操作任務方面存在局限。相比之下,基于神經(jīng)網(wǎng)絡的場景表示在生成新視角和跨多個場景泛化方面具有一定能力,使其更能適應復雜任務?;诨A模型的方法能夠?qū)崿F(xiàn)零樣本抓取任務,具備強大的泛化能力。此外,語言信息的集成使這些模型能夠支持交互式抓取,并增強了它們理解和規(guī)劃高級認知任務的能力。

在導航模塊(第 VI 節(jié))中,與傳統(tǒng)的場景表示方法相比,神經(jīng)場景表示能夠提供高度準確的環(huán)境重建。此外,它們還有助于更好地融合語義和語言信息,從而能夠執(zhí)行更復雜的導航任務。我們將導航模塊分為兩個部分:(i)規(guī)劃:從當前位置到目標目的地生成最優(yōu)或可行路徑,同時避開障礙物。(ii)探索:主動導航并繪制先前未知區(qū)域的地圖。



不同 3D 場景表示的特點對比,包含連續(xù)性,存儲效率,真實性,靈活性,幾何表示精度。

二、現(xiàn)有方法的問題與未來發(fā)展方向

1、端到端通用網(wǎng)絡還是模塊化?

目前,大多數(shù)機器人系統(tǒng)都建立在模塊化智能(Modular Intelligence)的基礎上。為了完成復雜任務,系統(tǒng)會將導航或操作等功能分解為獨立的模塊,例如感知、建圖、定位、操作和導航。這種設計雖然有助于實現(xiàn)各種機器人功能,但其模塊化特性在本質(zhì)上可能會限制機器人智能的進一步發(fā)展。

盡管模塊化解決方案引入了有用的歸納偏置(Inductive Biases)并支持有效的特定任務性能,但它們通常面臨泛化能力有限和遷移性差的問題。在實際應用中,這些系統(tǒng)往往需要在不同場景下進行重復的傳感器校準、特定環(huán)境建模以及參數(shù)重新調(diào)優(yōu)。此外,在高度復雜的環(huán)境中,構建精確的模型仍然極具挑戰(zhàn)性?;A模型的最新進展提供了一條替代路徑,即實現(xiàn)端到端智能。

2、數(shù)據(jù)瓶頸

盡管神經(jīng)場景表示(Neural Scene Representations)在準確性和泛化性方面具有顯著優(yōu)勢,但一個主要的挑戰(zhàn)在于,與訓練大語言模型(LLM)和視覺語言模型(VLM)所使用的互聯(lián)網(wǎng)規(guī)模的文本與圖像語料庫相比,機器人特有的數(shù)據(jù)非常匱乏。這種局限性顯著阻礙了機器人領域神經(jīng)場景表示和基礎模型的發(fā)展。

為了解決這一問題,研究重點已轉(zhuǎn)向增強神經(jīng)場景表示在有限數(shù)據(jù)情況下的泛化能力。另一個方向則是利用世界模型(World Models)來預測以動作為條件的(Conditioned on actions)狀態(tài)轉(zhuǎn)移,從而生成額外的訓練數(shù)據(jù)集。

3、實時性瓶頸

與傳統(tǒng)的場景表示相比,在機器人領域部署神經(jīng)場景表示的另一個關鍵瓶頸在于其推理時間(Inference Time),這仍是制約可靠實時應用的一個限制因素。目前神經(jīng)網(wǎng)絡的部署策略通常分為兩大類:

第一類是基于云端的部署。通常托管在遠程數(shù)據(jù)中心,并通過 API 進行訪問。在這種模式下,響應延遲和服務時間很大程度上取決于底層的網(wǎng)絡路由、帶寬以及數(shù)據(jù)中心的計算能力。因此,在將此類模型集成到自主機器人技術棧之前,必須仔細權衡網(wǎng)絡的可靠性和延遲問題。

第二類是邊緣計算平臺上的車載 / 機載部署(Onboard Deployment)。此類方案通常采用模型蒸餾(Model Distillation)和量化(Quantization)等技術來減小模型體積,從而實現(xiàn)實時推理。然而,這往往以犧牲泛化能力為代價。一個極具前景的未來方向在于硬件 - 算法協(xié)同設計(Hardware–Algorithm Co-design),旨在同時提高推理效率并保持模型的泛化性能,以滿足機器人實時部署的需求。

本文探討了機器人不同模塊最適合的三維場景表示方法,研究了相關方法、并討論了挑戰(zhàn)和未來方向。本文的主要貢獻如下:

  • 全面、最新的綜述與基準測試:本文對機器人領域的不同場景表示方法進行了廣泛且最新的綜述,涵蓋了經(jīng)典方法和前沿方法。對于每個模塊,團隊都提供了詳細介紹,并突出了該模塊中不同場景表示的優(yōu)勢。
  • 三維場景表示的未來方向:在機器人領域的每個模塊中,團隊指出了當前研究的技術局限性,并提出了幾個有前景的未來研究方向,旨在激勵這一快速發(fā)展領域的進一步進步。
  • 開源項目:團隊在 GitHub 上發(fā)布了一個開源項目,整理了機器人領域不同場景表示的相關文章,并將繼續(xù)向該項目添加新的研究成果和技術,網(wǎng)址為https://github.com/dtc111111/awesome-representation-for-robotics。團隊希望更多研究人員能夠利用它獲取最新的研究信息。

對更多實驗結果和文章細節(jié)感興趣的讀者,可以閱讀一下論文原文~

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
黃仁勛:AI將顛覆就業(yè)市場,電工水管工薪酬可達六位數(shù)!

黃仁勛:AI將顛覆就業(yè)市場,電工水管工薪酬可達六位數(shù)!

荊楚寰宇文樞
2026-01-22 22:55:17
紅棗就這樣吃太厲害了,我才吃了3天超管用,做法簡單,誰用誰好

紅棗就這樣吃太厲害了,我才吃了3天超管用,做法簡單,誰用誰好

今日養(yǎng)生之道
2026-01-22 07:32:02
1982年河南200槍支失竊,多年未破,一退休干警查出真相,遭滅口

1982年河南200槍支失竊,多年未破,一退休干警查出真相,遭滅口

文史道
2026-01-21 18:08:19
西方媒體:中國不可怕,可怕的是中國用垃圾發(fā)電,拿下全球第一!

西方媒體:中國不可怕,可怕的是中國用垃圾發(fā)電,拿下全球第一!

書紀文譚
2026-01-23 14:22:40
事實證明,70后注定是,中國有史以來,人生經(jīng)歷最豐富的一代

事實證明,70后注定是,中國有史以來,人生經(jīng)歷最豐富的一代

阿器談史
2026-01-22 22:43:30
曝火箭想用電風扇換后衛(wèi),但不會交易范喬丹,也不削謝潑德角色

曝火箭想用電風扇換后衛(wèi),但不會交易范喬丹,也不削謝潑德角色

只扣籃的教練
2026-01-23 16:02:27
重返英超?阿爾瓦雷斯不滿馬競,阿森納、切爾西同時開啟談判

重返英超?阿爾瓦雷斯不滿馬競,阿森納、切爾西同時開啟談判

夜白侃球
2026-01-23 16:19:43
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
廣東程序員高廣輝去世!僅32歲,妻子曝死因,死后不能進祖墳

廣東程序員高廣輝去世!僅32歲,妻子曝死因,死后不能進祖墳

八斗小先生
2026-01-22 13:38:12
周六利空,10個中字頭年報暴雷,中國中冶利潤腰斬,8個陷入虧損

周六利空,10個中字頭年報暴雷,中國中冶利潤腰斬,8個陷入虧損

鵬哥投研
2026-01-23 10:04:23
頂級陽謀:普京的一記“劇毒”回馬槍,把白宮逼到了懸崖邊

頂級陽謀:普京的一記“劇毒”回馬槍,把白宮逼到了懸崖邊

宇視天下
2026-01-22 23:20:10
安東尼奧看人真準!棄用2大國腳后,中國隊成奪冠熱門

安東尼奧看人真準!棄用2大國腳后,中國隊成奪冠熱門

何老師呀
2026-01-22 23:11:08
何慶魁風波升級! 稱當年寫劇本累傷,趙本山表態(tài)令人意外

何慶魁風波升級! 稱當年寫劇本累傷,趙本山表態(tài)令人意外

林雁飛
2026-01-23 14:18:52
不許報復美國,美方話音剛落,歐盟作出決定,將逐步淘汰中國制造

不許報復美國,美方話音剛落,歐盟作出決定,將逐步淘汰中國制造

明天見灌裝冰塊
2026-01-23 03:31:46
烏克蘭無人機突襲,俄軍導彈基地被炸得灰飛煙滅!

烏克蘭無人機突襲,俄軍導彈基地被炸得灰飛煙滅!

世界探索者探索
2026-01-23 17:24:53
2026泰晤士世界學科排名揭曉:北京大學、浙江大學、中山大學分別有11個學科上榜

2026泰晤士世界學科排名揭曉:北京大學、浙江大學、中山大學分別有11個學科上榜

TOP大學來了
2026-01-21 17:42:38
馮瀟霆老婆原來是她,曾是央視編導才貌雙全,卻甘愿當丈夫的后盾

馮瀟霆老婆原來是她,曾是央視編導才貌雙全,卻甘愿當丈夫的后盾

削桐作琴
2026-01-23 16:45:09
徹底崩盤!基輔上演“大逃亡”,美軍M270被俄打爆,小澤幻想破滅

徹底崩盤!基輔上演“大逃亡”,美軍M270被俄打爆,小澤幻想破滅

紀中百大事
2026-01-23 16:26:34
陳光標怒撕遮羞布:梁小龍哪里是病死,分明是被折騰死的!

陳光標怒撕遮羞布:梁小龍哪里是病死,分明是被折騰死的!

冷紫葉
2026-01-23 16:30:24
注意!個人所得稅不能再零申報!

注意!個人所得稅不能再零申報!

祥順財稅俱樂部
2026-01-23 09:07:03
2026-01-23 18:11:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12179文章數(shù) 142547關注度
往期回顧 全部

科技要聞

TikTok守住了算法"靈魂" 更握緊了"錢袋子"

頭條要聞

21歲女孩確診白血病后急尋親生父母:已簽病危通知書

頭條要聞

21歲女孩確診白血病后急尋親生父母:已簽病危通知書

體育要聞

跑個步而已,他們在燃什么?

娛樂要聞

劉大錘曝料 將王星越的“體面”撕粉碎

財經(jīng)要聞

茂名首富,這次糟了

汽車要聞

主打家庭大六座 奕境首款SUV將北京車展亮相

態(tài)度原創(chuàng)

時尚
家居
旅游
教育
公開課

告別臃腫!這種簡約的高級穿法,別拒絕

家居要聞

在家度假 160平南洋混搭宅

旅游要聞

走進伊春冰雪森林,赴一場童話之約

教育要聞

經(jīng)典平均數(shù)問題,輕松搞定!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版