国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

探索社交導航的新境界:如何讓機器人在人群中優(yōu)雅穿行?

0
分享至

在擁擠的商場或辦公室里,一個機器人如何才能像人類一樣,優(yōu)雅地避開行人,不打擾他人,同時高效到達目的地?這個看似簡單的問題,卻隱藏著人工智能領域的一個重大挑戰(zhàn)。傳統(tǒng)導航技術(shù)在靜態(tài)環(huán)境中表現(xiàn)出色,但在有人類活動的動態(tài)場景中往往顯得笨拙生硬。本文介紹了一種基于"近距感知任務"的創(chuàng)新方法,通過模擬人類對即時和潛在危險的感知能力,使機器人能在人群中自然穿行。這種方法不僅提高了導航成功率,更通過精細化的"遭遇"分析,揭示了機器人如何在各種社交情境中做出適當決策的內(nèi)在機制。

人機共舞的挑戰(zhàn)

想象一下,你正在一個擁擠的購物中心走動。當你看到迎面走來的人,你會自然地調(diào)整步伐、改變方向以避免碰撞。這種能力對我們?nèi)祟悂碚f似乎很簡單,但對機器人來說卻是一項極具挑戰(zhàn)性的任務。這就是社交導航(Social Navigation)所要解決的核心問題:讓機器人在有人類活動的環(huán)境中安全、有效且符合社交禮儀地移動。

社交導航與傳統(tǒng)的機器人導航有著本質(zhì)區(qū)別。傳統(tǒng)導航主要關(guān)注如何在靜態(tài)環(huán)境中從起點到達終點,而社交導航則需要考慮環(huán)境中動態(tài)變化的人類因素。就像我們在日常生活中會遇到各種"社交情境"一樣,機器人也會面臨多種人機互動場景:它可能需要面對迎面走來的人,處理道路交叉口的讓行問題,應對突然從拐角處出現(xiàn)的人,或者安全地跟隨前方的人行走。

早期的導航算法在模擬器中表現(xiàn)出色,例如在名為"PointGoal Navigation"的任務中,機器人只需要到達指定的位置點。研究人員發(fā)現(xiàn),經(jīng)過數(shù)十億步的訓練后,一個沒有任何傳感器和執(zhí)行噪聲的智能體幾乎可以達到完美的表現(xiàn)。但這些算法在加入人類因素后表現(xiàn)急劇下降,因為它們無法理解和預測人類的行為模式。

現(xiàn)有的社交導航模型存在明顯局限。一些方法依賴于全局規(guī)劃和完整地圖,但這在真實世界中往往難以獲??;另一些方法雖然采用了端到端的強化學習訓練,但沒有明確編碼社交行為,導致機器人在面對人類時表現(xiàn)生硬,甚至可能造成危險。

2021年,在iGibson交互式挑戰(zhàn)賽中,Yokoyama等人提出的方法取得了第一名,但該方法并沒有在其導航策略中明確編碼任何社交行為。這凸顯了一個關(guān)鍵問題:我們需要一種能夠明確理解和處理人機互動的導航系統(tǒng),而不僅僅是簡單地避開障礙物。

社交導航評估標準也存在問題。傳統(tǒng)指標如成功率和路徑效率難以全面衡量社交導航的質(zhì)量。例如,高成功率可能是以冒險和不禮貌的行為為代價的,而這在與人類共存的環(huán)境中是不可接受的。安全性和社交合規(guī)性應該成為關(guān)鍵考量因素。

近距感知的革新

針對這些挑戰(zhàn),研究者提出了一種基于"近距感知任務"的創(chuàng)新方法,旨在賦予機器人類似人類的社交感知能力。這種方法的核心是兩個互補的近距感知任務:風險估計和近距指南針。

風險估計任務旨在處理短距離社交互動,告知智能體即將發(fā)生碰撞的危險。具體來說,它計算了一個代表智能體與最近人物距離的標量值。當最近的人物超過一定距離(如Dr米)時,風險值為0;當智能體與人物發(fā)生碰撞時,風險值為1。這種機制使機器人能夠感知到迫在眉睫的碰撞風險,并采取適當?shù)谋茏寗幼鳌?/p>

近距指南針則模擬了社交動態(tài)的長距離組成部分。它不僅捕捉更大半徑范圍(Dc >; Dr)內(nèi)的社交互動,還提供了人物可能來向的弱指示。這就像人類能夠根據(jù)先前的觀察、對環(huán)境的部分了解和人物軌跡來推測人們的行蹤一樣,期望機器人在訓練時獲得類似的知識。

近距指南針的工作原理是將智能體周圍空間分割成若干個扇區(qū),計算每個扇區(qū)中人物的風險值。整個指南針表示為一個向量,通過從北方開始順時針展開扇區(qū)序列來實現(xiàn)。這使機器人能夠感知到不同方向上可能存在的人物,并據(jù)此規(guī)劃安全路徑。

這兩個任務共同構(gòu)成了一個端到端的社交導航架構(gòu),能夠從RGB-D和GPS+指南針傳感器中提取嵌入,并通過狀態(tài)注意力機制融合多個任務嵌入,最終采樣出機器人應執(zhí)行的動作。與傳統(tǒng)方法不同的是,這種架構(gòu)明確地將社交感知能力注入到導航策略中,使機器人能夠推斷出符合常識的社交行為。

為了實現(xiàn)這些近距感知任務,研究團隊設計了一個包含兩個主要模塊的框架:近距特征提取和策略架構(gòu)。近距特征提取模塊從模擬器獲取近距信息,并提取描述社交互動某些方面的特征。策略架構(gòu)則從RGB-D和GPS+指南針傳感器中提取嵌入,作為近距感知任務的輸入。

通過實驗驗證,這種方法在Gibson4+和Habitat-Matterport3D數(shù)據(jù)集上都表現(xiàn)出色。特別是,當將兩個近距感知任務與自我監(jiān)督輔助任務結(jié)合使用時,模型在成功率、路徑效率和人物碰撞率等指標上都取得了顯著提升。

值得注意的是,不同的模型表現(xiàn)出不同的導航策略。有些模型傾向于冒險與人物互動以獲取潛在的更高效路徑,而其他模型則傾向于保持安全距離,避免與人物互動。這反映了社交導航的不同方法:冒險還是保守,這取決于具體應用場景的需求。

在面對突發(fā)危險的能力測試中,搭載近距感知任務的模型表現(xiàn)出色。當遇到視野受限的"盲角"場景時,這些模型能夠維持適當?shù)木€性速度,而基線模型則需要剎車和倒退,表現(xiàn)出更高的不確定性和風險。

總的來說,基于近距感知任務的社交導航方法不僅提高了導航成功率,還通過明確編碼社交行為,使機器人能夠在人類環(huán)境中安全、有效且禮貌地移動。這代表了社交導航研究的一個重要進步,為未來家庭助理機器人等實體智能體融入人類社會邁出了關(guān)鍵一步。

遭遇解析新方法

傳統(tǒng)的社交導航評估方式往往只關(guān)注整體成功率、路徑效率或避碰能力,難以真正反映機器人在社交場景中的表現(xiàn)。為了解決這個問題,研究團隊提出了一種精細化的評估方案,通過分析機器人與人類的"遭遇"來評價社交導航的質(zhì)量。

什么是"遭遇"?簡單來說,就是機器人與人類在空間上產(chǎn)生互動的短暫片段。研究者將遭遇定義為在特定時間框架內(nèi),滿足三個約束條件的軌跡子序列:時間約束(時間框架大于閾值Tmin)、空間約束(機器人與人類的測地距離小于閾值Dmax)以及朝向約束(在前Tfront個時間步中,人類在機器人前方)。

基于這些約束,研究者將遭遇分為四類,每一類都代表了日常生活中常見的社交場景:

正面接近型遭遇是指機器人和人類從相反方向走來,軌跡大致平行。在這種情況下,機器人應該稍微偏離原路線以避免正面碰撞。判斷標準是人在初始時間步內(nèi)對機器人可見,且兩者軌跡方向之間的角度接近180度。

交叉型遭遇是指機器人和人類的軌跡以約90度相交。面對這種情況,機器人可能需要停下來讓人先行,或者減速并稍微改變方向。判斷標準是人在初始時間步內(nèi)對機器人可見,兩者軌跡方向之間的角度接近90度,且軌跡相交。

盲角型遭遇是機器人從最初被遮擋的位置接近人類,比如拐角或狹窄的門道。在這種視野受限的情況下,機器人應該謹慎行動以避免撞車。判斷標準是人在初始時間步內(nèi)對機器人不可見,且測地距離與歐幾里得距離之差小于0.5。

人物跟隨型遭遇是指人類和機器人朝同一方向行進。機器人必須與人保持安全距離,并保持相對較低的線性速度。判斷標準是人在初始時間步內(nèi)對機器人可見,且兩者軌跡方向之間的角度很小。

針對每種遭遇類型,研究者提出了三個關(guān)鍵指標來評估社交導航質(zhì)量:遭遇存活率(ESR)是指特定類別中沒有發(fā)生人類碰撞的遭遇百分比;平均線性速度(ALV)是指機器人在遭遇中的平均線性速度;平均距離(AD)是指機器人在遭遇中與人類的平均距離。

這種基于遭遇的評估方法相比傳統(tǒng)指標有明顯優(yōu)勢。它不僅能捕捉到機器人在不同社交場景中的表現(xiàn)差異,還能提供關(guān)于機器人如何處理特定類型互動的詳細信息。比如,一個機器人可能在處理交叉型遭遇時表現(xiàn)出色,但在面對盲角型遭遇時卻表現(xiàn)糟糕。這種細粒度的評估能夠幫助研究者識別和改進社交導航算法中的具體缺陷。

這種評估方法的靈感來源于機器人學領域的類似嘗試。Pirk等人曾通過問卷調(diào)查收集人類與機器人之間特定類型互動的統(tǒng)計數(shù)據(jù)。不同的是,本研究提出的方法是完全自動化的,適用于包含數(shù)千個場景的模擬測試集。

在實際應用中,研究者隨機抽樣了500個驗證場景,對不同模型在各類遭遇中的表現(xiàn)進行了統(tǒng)計。通過分析遭遇數(shù)量與存活率的關(guān)系,發(fā)現(xiàn)了兩種類型的導航策略:一種傾向于冒險與人類互動以獲取潛在更高效的路線,另一種傾向于避免遭遇并保持安全距離。

特別值得注意的是盲角型遭遇的表現(xiàn)分析。通過繪制平均距離和平均線性速度與遭遇完成百分比的關(guān)系圖,研究者發(fā)現(xiàn)基線模型在面對突發(fā)危險時需要剎車和倒退(線性速度約為-0.5),而搭載近距感知任務的模型則能夠在整個遭遇過程中保持適當?shù)恼€性速度。這表明近距感知任務能夠顯著提高機器人應對高風險、高不確定性情境的能力。

多維驗證與前瞻

為了全面評估基于近距感知任務的社交導航方法的有效性,研究團隊在兩個公共數(shù)據(jù)集上進行了廣泛實驗:Gibson4+和HM3D-S。

Gibson4+數(shù)據(jù)集包含86個場景,其中64個用于訓練,8個用于驗證,14個用于測試。而HM3D-S是研究團隊基于HM3D創(chuàng)建的一個專為社交導航設計的新數(shù)據(jù)集,包含900個場景(800個用于訓練,30個用于驗證,70個用于測試),每個場景的可行走面積平均比Gibson4+更大。

在訓練過程中,每個模型在Gibson4+上訓練了約1億步(相當于2.5天訓練時間),并在HM3D-S上進一步微調(diào)了約4000萬步(相當于1天訓練時間)。這種分階段訓練策略旨在減少計算成本,同時確保模型能夠適應不同環(huán)境的特點。

實驗結(jié)果表明,單獨使用近距感知任務的模型就能顯著提高社交導航性能。在Gibson4+上,風險估計(Risk-only)和近距指南針(Compass-only)模型表現(xiàn)相似,兩者在各項指標上的差異不到0.7%。但在更大的HM3D-S環(huán)境中,近距指南針模型略勝一籌,成功率高出1.1%,人類碰撞率低0.93%,時間長度加權(quán)成功率(STL)高1.44%。這一差異符合預期,因為近距指南針任務專門用于處理長距離近距信息,在更大的場景中發(fā)揮更大作用。

當將近距感知任務與自監(jiān)督任務結(jié)合時,性能進一步提升。這種組合顯著提高了成功率加權(quán)路徑長度(SPL)和成功率指標,也積極影響了人類碰撞率。在Gibson4+上,結(jié)合風險估計任務的自監(jiān)督模型(Aux+Risk)使人類碰撞率減少了1.52%,在HM3D-S上減少了2.47%。研究者推測,自監(jiān)督任務由于基于動作的對比性質(zhì)或試圖恢復導航反向動力學,幫助近距感知模型實現(xiàn)更平滑的軌跡,通過更精確的線性和角速度調(diào)節(jié)提高性能。

綜合各項指標,結(jié)合所有任務的模型(Proximity+Aux)表現(xiàn)最佳。在Gibson4+上,該模型實現(xiàn)了77.24%的成功率、55.23%的SPL和19.50%的人類碰撞率。在HM3D-S上,實現(xiàn)了70.16%的成功率、47.60%的SPL和22.09%的人類碰撞率。

通過精細化的遭遇分析,研究者發(fā)現(xiàn)不同模型采用不同的社交導航策略。例如,Risk-only模型傾向于避免遭遇,在跟隨型和交叉型遭遇中存活率較低(分別為74.11%和86.85%),總遭遇數(shù)也最少(僅188次)。相反,Compass-only模型在各類遭遇中存活率較高,總遭遇數(shù)也較多(279次)。有趣的是,兩個表現(xiàn)最佳的模型Proximity tasks和Proximity+Aux采用了這兩種不同的策略,但在整體指標上表現(xiàn)相當。

在定性分析中,研究者展示了兩個成功管理遭遇的案例。在一個正面遭遇中,機器人在看到人后移動到一側(cè)并讓路,讓人們離開后再繼續(xù)前進。在一個交叉遭遇中,機器人看到行人后讓行,讓行人通過后再繼續(xù)其路徑。

盡管取得了顯著進展,當前社交導航研究仍面臨一個重大限制:模擬器中人類運動模擬的簡單性。目前主流的模擬器(如Habitat、iGibson或AI2Thor)都沒有實現(xiàn)具有復雜導航模式和自然動畫的人類。這意味著社交元素如社交暗示和近距離學等尚未被現(xiàn)有模型充分利用。雖然研究繼承了這些問題,但即使在這種簡化模型下,所學習的行為和討論的特性仍代表了該領域的重要進步,為未來工作奠定了基礎。

展望未來,研究團隊計劃專注于模擬更自然的人類行為,并實驗模擬到真實世界(sim2real)的域遷移,進一步提升社交導航技術(shù)在實際應用中的表現(xiàn)。

參考資料

  1. Cancelli, E., Campari, T., Serafini, L., Chang, A. X., &; Ballan, L. (2023). Exploiting Proximity-Aware Tasks for Embodied Social Navigation. ICCV.

  2. Ye, J., et al. (2021). Auxiliary Tasks and Exploration Enable ObjectNav. ICCV.

  3. Pirk, S., et al. (2020). Modeling Mobile Agent-Environment Interactions with Activity Spaces. IEEE Robotics and Automation Letters.

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
國王險勝獨行俠:威少21+9總助攻超魔術(shù)師 弗拉格23+6+5

國王險勝獨行俠:威少21+9總助攻超魔術(shù)師 弗拉格23+6+5

醉臥浮生
2025-12-28 08:17:13
銀行女經(jīng)理挪用12個儲戶3000萬,事發(fā)后與丈夫雙雙自盡,儲戶天塌了

銀行女經(jīng)理挪用12個儲戶3000萬,事發(fā)后與丈夫雙雙自盡,儲戶天塌了

觀世記
2025-12-27 15:02:35
普京警告澤連斯基

普京警告澤連斯基

新京報政事兒
2025-12-28 07:17:38
海豚為何如此親近人類?看看你在海豚眼中長什么樣,就不難理解了

海豚為何如此親近人類?看看你在海豚眼中長什么樣,就不難理解了

半解智士
2025-12-26 20:49:05
姜昆助理辟謠不到一天,被狠狠“打臉”,姜昆女兒被扒,果不簡單

姜昆助理辟謠不到一天,被狠狠“打臉”,姜昆女兒被扒,果不簡單

阿纂看事
2025-12-27 21:44:07
安菲爾德感人一幕!若塔幼子擔任球童,裁判躬身擊掌,你永不獨行

安菲爾德感人一幕!若塔幼子擔任球童,裁判躬身擊掌,你永不獨行

奧拜爾
2025-12-27 23:25:56
沒想到,身價已暴漲10倍,網(wǎng)友:雞蛋都快配不上它了

沒想到,身價已暴漲10倍,網(wǎng)友:雞蛋都快配不上它了

魯中晨報
2025-12-26 16:01:12
這次,姜昆的"澄清"徹底淪為笑話,一份天氣預報,把他們?nèi)鲑u了

這次,姜昆的"澄清"徹底淪為笑話,一份天氣預報,把他們?nèi)鲑u了

千言娛樂記
2025-12-27 19:56:34
“奶奶喜喪,能來送送最后一程嗎?”哈爾濱女子因朋友少謙卑求助,眾多網(wǎng)友冒大雪趕來

“奶奶喜喪,能來送送最后一程嗎?”哈爾濱女子因朋友少謙卑求助,眾多網(wǎng)友冒大雪趕來

瀟湘晨報
2025-12-27 19:16:16
36歲銀行經(jīng)理和丈夫自殺,曾大量挪用儲戶資金!有人140萬存款只剩8.8元!警方回應撤案

36歲銀行經(jīng)理和丈夫自殺,曾大量挪用儲戶資金!有人140萬存款只剩8.8元!警方回應撤案

揚子晚報
2025-12-27 20:55:38
生娃“獎房子”,真金白銀鼓勵生育|新京報快評

生娃“獎房子”,真金白銀鼓勵生育|新京報快評

新京報
2025-12-27 19:47:14
大地色系的權(quán)威:棕色戰(zhàn)袍的靜默宣言

大地色系的權(quán)威:棕色戰(zhàn)袍的靜默宣言

疾跑的小蝸牛
2025-12-23 15:34:21
52歲何晴腦瘤康復后素顏報平安,這張舊照藏著太多堅韌!

52歲何晴腦瘤康復后素顏報平安,這張舊照藏著太多堅韌!

無心小姐姐
2025-12-27 22:19:42
大家都看走眼了:最愛享受的泰王,居然相當精通權(quán)謀

大家都看走眼了:最愛享受的泰王,居然相當精通權(quán)謀

黃娜老師
2025-12-27 01:28:41
女孩在家被人打傷后續(xù)!被認定互毆,警方回應,上門家長錄音克制

女孩在家被人打傷后續(xù)!被認定互毆,警方回應,上門家長錄音克制

奇思妙想草葉君
2025-12-28 01:17:28
南博前院長被帶走不到12小時,令人"厭惡"的事發(fā)生了,不止一件

南博前院長被帶走不到12小時,令人"厭惡"的事發(fā)生了,不止一件

社會日日鮮
2025-12-26 11:09:21
建議中老年人:別太心疼錢,這4種零食該吃就吃,腿腳有勁精神足

建議中老年人:別太心疼錢,這4種零食該吃就吃,腿腳有勁精神足

阿龍美食記
2025-12-27 18:48:48
43695人觀戰(zhàn)!永州隊1-0問鼎湘超:3輪下克上 美女老板送球員汽車

43695人觀戰(zhàn)!永州隊1-0問鼎湘超:3輪下克上 美女老板送球員汽車

風過鄉(xiāng)
2025-12-27 22:25:33
3-0!40歲C羅里程碑戰(zhàn)雙響 率隊10戰(zhàn)全勝+4分領跑 1年40球創(chuàng)紀錄

3-0!40歲C羅里程碑戰(zhàn)雙響 率隊10戰(zhàn)全勝+4分領跑 1年40球創(chuàng)紀錄

我愛英超
2025-12-28 00:49:49
保定大量商戶突然關(guān)閉,整個街道冷冷清清

保定大量商戶突然關(guān)閉,整個街道冷冷清清

映射生活的身影
2025-12-27 18:09:05
2025-12-28 09:55:00
臆說歷史 incentive-icons
臆說歷史
作有深度的歷史解讀
162文章數(shù) 233關(guān)注度
往期回顧 全部

科技要聞

新任NASA掌門放話:特朗普任期內(nèi)必將重返月球

頭條要聞

四川原副省長葉寒冰被通報:長期出入私人會所聚餐飲酒

頭條要聞

四川原副省長葉寒冰被通報:長期出入私人會所聚餐飲酒

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

張昊唯逃稅涉黃風波落幕:法院認定朋友造謠

財經(jīng)要聞

英偉達的收購史

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

時尚
手機
家居
房產(chǎn)
公開課

這些穿搭才最適合普通人!不露腿、不花哨,簡約舒適又顯氣質(zhì)

手機要聞

小米引領小屏、小米引領大屏,友商都懵了

家居要聞

格調(diào)時尚 智慧品質(zhì)居所

房產(chǎn)要聞

年銷20億+!中交·藍色港灣用好房子致敬好生活

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版