国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

CVPR 2026|DROID-W:復(fù)雜室外動態(tài)場景,也能穩(wěn)定SLAM

0
分享至





圖1:給定任意動態(tài)視頻,DROID-W 能夠估計準(zhǔn)確的動態(tài)點云,相機位姿,以及動態(tài)不確定性。



  • 論文標(biāo)題:DROID-SLAM in the Wild
  • 論文:https://arxiv.org/pdf/2603.19076
  • 項目主頁:https://moyangli00.github.io/droid-w
  • 代碼:https://github.com/MoyangLi00/DROID-W
  • 數(shù)據(jù)集:https://cvg-data.inf.ethz.ch/DROID-W
  • 作者單位:蘇黎世聯(lián)邦理工,微軟

SLAM 在自動駕駛、機器人、AR/VR 乃至具身智能系統(tǒng)中都是至關(guān)重要的環(huán)節(jié),它決定了算法能否在一個陌生環(huán)境中一邊“看懂世界”,一邊“知道自己在哪”。

最近,蘇黎世聯(lián)邦理工與微軟的研究團隊提出了 DROID-W:一種基于動態(tài)不確定性感知的稠密可微 Bundle Adjustment(BA)的動態(tài) SLAM 框架。該工作在 RTX 5090 上可以達到 ~30 FPS 的實時性能,即將正式發(fā)表于 CVPR 2026。并且,該工作提出的動態(tài)不確定性感知模塊可以即插即用地應(yīng)用到多種 SLAM 框架中,有效提升其在真實動態(tài)環(huán)境中的性能。

傳統(tǒng) SLAM 困境:為什么現(xiàn)有方法不通用


傳統(tǒng) SLAM 系統(tǒng)大都基于靜態(tài)場景的假設(shè),然而在真實世界中,行人穿梭、車輛駛過、樹影晃動、反光玻璃……這些看似再日常不過的因素,都會打破“靜態(tài)場景”假設(shè),進而導(dǎo)致嚴(yán)重的跟蹤漂移,建圖錯誤。過去的動態(tài) SLAM 系統(tǒng)往往依賴于動態(tài)物體語意分割 / 檢測等先驗移除動態(tài)物體,但需提前預(yù)知動態(tài)物體類別,嚴(yán)重限制了其在真實物理世界的廣泛應(yīng)用。基于不確定性感知的動態(tài) SLAM 方案 WildGS-SLAM 依賴于高質(zhì)量的動態(tài)場景高斯建圖來估計動態(tài)不確定性,但真實環(huán)境中的建圖面臨巨大挑戰(zhàn),嚴(yán)重限制了其性能。

與很多依賴預(yù)定義動態(tài)類別、語義分割先驗或靜態(tài)場景建圖的方法不同,DROID-W 選擇了一條更“底層”的路線:不去預(yù)設(shè)什么東西會動,不需要建立高質(zhì)量靜態(tài)場景,而是讓系統(tǒng)自己從多視角觀測中識別哪些區(qū)域不可靠,并在優(yōu)化時自動降低這些區(qū)域的影響。真正實現(xiàn)了讓單目 SLAM 系統(tǒng)適用于“隨手拍”的真實動態(tài)場景。

讓不確定性進入 BA,動態(tài)區(qū)域不再“拖后腿”



圖2: DROID-W 系統(tǒng)架構(gòu)。系統(tǒng)從序列輸入的圖片中首先選擇關(guān)鍵幀,用于提取 DINO 特征,DROID 特征并估計單目深度圖。DROID 特征繼而被送入 ConvGRU 估計對應(yīng)像素,基于 BA 優(yōu)化相機位姿和深度。DINO 特征和優(yōu)化后的位姿,深度被用于優(yōu)化像素級動態(tài)不確定性。兩優(yōu)化交替進行,最終輸出動態(tài)點云和準(zhǔn)確的相機軌跡。

DROID-SLAM 是經(jīng)典的將深度學(xué)習(xí)與優(yōu)化優(yōu)雅結(jié)合的 SLAM 框架,其通過稠密可微 BA 持續(xù)更新相機位姿和場景結(jié)構(gòu)。但在動態(tài)場景里,傳統(tǒng) BA 默認(rèn)的剛體運動關(guān)系被打破,錯誤殘差會嚴(yán)重影響擾亂優(yōu)化方向與準(zhǔn)確性。

基于此,DROID-W 的關(guān)鍵改進,就是把“動態(tài)帶來的不可靠性”顯式建模為逐像素的動態(tài)不確定性。DROID-W 通過度量幀與幀之間的 DINO 特征相似度來衡量物體運動的動態(tài)不確定性。這些高不確定區(qū)域的殘差項在 BA 優(yōu)化中會被自動抑制,從而減少動態(tài)干擾對相機軌跡和幾何結(jié)構(gòu)估計的影響。但是位姿,深度,動態(tài)不確定性的大規(guī)模聯(lián)合 Gauss-Newton 優(yōu)化會帶來高昂的計算成本,不適用于在線系統(tǒng)。為此,作者提出了交替優(yōu)化的解決方案。系統(tǒng)一邊執(zhí)行位姿與深度的優(yōu)化,一邊根據(jù)多視角視覺特征的一致性迭代更新動態(tài)不確定性。

不靠“先驗名單”,

而是讓模型自己發(fā)現(xiàn)動態(tài)干擾


過去不少動態(tài) SLAM 方法的思路,是先識別“可能運動的東西”再把它們 mask 掉,比如人、車、寵物等。但這種做法天然依賴類別先驗:當(dāng)場景中出現(xiàn)未知動態(tài)物體、非剛體運動、局部遮擋或強反光區(qū)域時,系統(tǒng)往往就不夠穩(wěn)了。DROID-W 則更強調(diào)觀測一致性本身

論文中,研究者借助 DINO 特征來衡量跨視角的一致性,并通過一個局部仿射映射加 Softplus 激活,把這些特征轉(zhuǎn)化為連續(xù)的不確定性估計。相比把動態(tài)直接做成硬分割 mask,這種連續(xù)表達更細膩:它不只是告訴系統(tǒng)“哪里不能看”,而是進一步告訴系統(tǒng)“哪里該少信一點,哪里可以多信一點”。 這帶來一個很重要的好處:系統(tǒng)不會因為場景里有動態(tài)物體,就粗暴地把整塊區(qū)域全部丟掉。當(dāng)一個物體只有局部在動,或者重新靜止下來時,DROID-W 仍然有機會利用其中可靠的信息繼續(xù)跟蹤。這種“軟抑制”策略,比一刀切的動態(tài) masking 更適合真實世界。

不只是改方法,還做了更“野”的測試集



圖3: DROID-W 數(shù)據(jù)集實例。

為了驗證方法是否真的適用于真實場景,作者并沒有把實驗局限在常見的室內(nèi)動態(tài)數(shù)據(jù)集上。除了 Bonn、TUM 和 DyCheck 這些常用數(shù)據(jù)集外,論文還引入了新的 DROID-W 數(shù)據(jù)集:這是一組更偏室外、更加開放、也更接近真實拍攝條件的數(shù)據(jù),包含 7 段 Downtown 序列,并配有 RTK 支持的真值軌跡。DROID-W 數(shù)據(jù)集包含高動態(tài)場景、圖像過曝、鏡面反射、太陽光暈等高難度片段,很好的模擬了真實野外環(huán)境中的復(fù)雜場景。除此之外,作者還進一步測試了多段來自 YouTube 的動態(tài)視頻片段,用來評估系統(tǒng)在真正“in-the-wild”視頻中的通用性與魯棒性。

實驗結(jié)果


DROID-W 在多個動態(tài)數(shù)據(jù)集上都取得了最優(yōu)的表現(xiàn)。作者指出,在 Bonn、TUM、DyCheck 等數(shù)據(jù)集上,方法依靠更穩(wěn)定的不確定性估計,在高動態(tài)序列中明顯優(yōu)于原始 DROID-SLAM,也優(yōu)于多種現(xiàn)有動態(tài) SLAM 方法。 尤其值得注意的是在作者新提出的 DROID-W Dataset --更大尺度、更偏真實世界的室外動態(tài)數(shù)據(jù)集--作者提出的方法在該數(shù)據(jù)集上平均軌跡誤差僅為 23 厘米,而 DROID-SLAM 誤差卻為 1.46 米。



圖4:動態(tài)不確定性估計定性對比。第一行:輸入的視頻幀;其余行:基線方法與 DROID-W 的對比。DROID-W 能夠在各種場景下輸出準(zhǔn)確可靠的動態(tài)不確定性。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
美稱獲以色列總理尊重?;鹂陬^承諾

美稱獲以色列總理尊重?;鹂陬^承諾

財聯(lián)社
2026-04-08 10:25:13
中國股市:如果手中有20萬,建議死啃這兩條線,幾乎吃掉所有利潤

中國股市:如果手中有20萬,建議死啃這兩條線,幾乎吃掉所有利潤

股經(jīng)縱橫談
2026-04-08 21:49:55
莫言:你細心觀察一下你的身邊人,凡是動不動就生氣的人,沒有一個是智者,生活多半過得一團糟糕

莫言:你細心觀察一下你的身邊人,凡是動不動就生氣的人,沒有一個是智者,生活多半過得一團糟糕

二胡的歲月如歌
2025-10-21 18:57:28
鄭麗文向全島喊話,必須徹查民進黨,沒想到對大陸露出了狐貍尾巴

鄭麗文向全島喊話,必須徹查民進黨,沒想到對大陸露出了狐貍尾巴

看盡人間百態(tài)
2026-03-10 08:25:05
無視停戰(zhàn)協(xié)議,以色列瘋狂打擊,特朗普罕見失聲,巴總理前后兩難

無視停戰(zhàn)協(xié)議,以色列瘋狂打擊,特朗普罕見失聲,巴總理前后兩難

書紀(jì)文譚
2026-04-08 13:45:53
2萬炒到2000萬!“中國第一股民”楊百萬臨終遺言:股市訣竅就4字

2萬炒到2000萬!“中國第一股民”楊百萬臨終遺言:股市訣竅就4字

一方聊市
2026-04-02 19:35:03
北大連夜報喜!1納米芯片繞開光刻機,中國換道超車,西方失算了

北大連夜報喜!1納米芯片繞開光刻機,中國換道超車,西方失算了

豬小艷吖
2026-04-08 13:41:40
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
炸場!半個娛樂圈和頂級富豪都來了,抬頭千萬名畫,低頭億萬身家

炸場!半個娛樂圈和頂級富豪都來了,抬頭千萬名畫,低頭億萬身家

藝能八卦局
2026-03-29 07:09:54
很嚴(yán)重!全紅嬋已經(jīng)報警,280人群主放任成員辱罵運動員涉嫌違法

很嚴(yán)重!全紅嬋已經(jīng)報警,280人群主放任成員辱罵運動員涉嫌違法

蜜桔娛樂
2026-04-08 15:19:10
超越香農(nóng)芯創(chuàng)!天華新能一季度凈利最高預(yù)增32120%,暫列A股“預(yù)增王”

超越香農(nóng)芯創(chuàng)!天華新能一季度凈利最高預(yù)增32120%,暫列A股“預(yù)增王”

北京商報
2026-04-08 17:41:04
特朗普:我同意暫停對伊朗的轟炸和襲擊行動,為期兩周

特朗普:我同意暫停對伊朗的轟炸和襲擊行動,為期兩周

極目新聞
2026-04-08 07:00:22
解放戰(zhàn)爭最悲壯的一戰(zhàn),一個師全軍覆沒,戰(zhàn)后前線總指揮連降四級

解放戰(zhàn)爭最悲壯的一戰(zhàn),一個師全軍覆沒,戰(zhàn)后前線總指揮連降四級

浩舞默畫
2026-04-07 09:06:55
達里奧撰文警告:世界大戰(zhàn)正在“醞釀”中,美伊戰(zhàn)爭只是其中之一!

達里奧撰文警告:世界大戰(zhàn)正在“醞釀”中,美伊戰(zhàn)爭只是其中之一!

財聯(lián)社
2026-04-08 15:24:12
1998年數(shù)萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

1998年數(shù)萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

哄動一時啊
2026-02-17 22:21:25
1977年,李敏見到失散多年的親姐楊月花,楊月花卻向李敏提一要求

1977年,李敏見到失散多年的親姐楊月花,楊月花卻向李敏提一要求

磊子講史
2025-12-23 20:04:20
此人屠殺百萬民眾,卻被專家吹捧為千古完人、民族英雄,實在可笑

此人屠殺百萬民眾,卻被專家吹捧為千古完人、民族英雄,實在可笑

長風(fēng)文史
2026-04-07 20:53:07
伊朗革命衛(wèi)隊前指揮官蘇萊曼尼親屬在美隱秘生活:車內(nèi)堆滿奢侈品

伊朗革命衛(wèi)隊前指揮官蘇萊曼尼親屬在美隱秘生活:車內(nèi)堆滿奢侈品

梁濆愛玩車
2026-04-06 09:09:52
以色列仍在打擊伊朗導(dǎo)彈發(fā)射設(shè)施

以色列仍在打擊伊朗導(dǎo)彈發(fā)射設(shè)施

新京報
2026-04-08 09:39:18
榮耀官宣與張雪機車戰(zhàn)略合作!張雪發(fā)聲感謝

榮耀官宣與張雪機車戰(zhàn)略合作!張雪發(fā)聲感謝

小南看車
2026-04-08 21:20:38
2026-04-09 00:47:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12712文章數(shù) 142618關(guān)注度
往期回顧 全部

科技要聞

造出地表最強AI,卻死活不給你用!

頭條要聞

央視披露:78億變1億 河南三地現(xiàn)巨額數(shù)據(jù)造假

頭條要聞

央視披露:78億變1億 河南三地現(xiàn)巨額數(shù)據(jù)造假

體育要聞

40歲,但實力倒退12年

娛樂要聞

侯佩岑全家悉尼度假,一家四口幸福滿溢

財經(jīng)要聞

天津海河乳業(yè)回應(yīng)直播間涉黃

汽車要聞

20萬級滿配華為全家桶 華境S是懂家庭的大六座

態(tài)度原創(chuàng)

時尚
游戲
房產(chǎn)
家居
公開課

50歲,我媽在戀綜搶男人

真愛拉電線!《終末地》日本市場收入超中國:全球第一

房產(chǎn)要聞

正式動工!珠城馬場地塊,簽約華爾道夫!

家居要聞

自在恣意 侘寂風(fēng)別墅

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版