国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

全球首個(gè)!機(jī)器人也有“高德”了,銀河通用聯(lián)合北大研發(fā)

0
分享至



銀河通用推出全球首個(gè)跨本體全域環(huán)視的導(dǎo)航基座大模型。

作者 | 許麗思

編輯 | 漠影

機(jī)器人前瞻11月5日?qǐng)?bào)道,今天,銀河通用聯(lián)合北京大學(xué)、阿德萊德大學(xué)、浙江大學(xué)等團(tuán)隊(duì),推出了全球首個(gè)跨本體全域環(huán)視的導(dǎo)航基座大模型——NavFoM(Navigation Foundation Model)。

在今年6月,銀河通用發(fā)布端到端導(dǎo)航大模型TrackVLA,讓機(jī)器狗在未訓(xùn)練過的真實(shí)場(chǎng)景跟隨用戶,完成自主移動(dòng)、避障、轉(zhuǎn)向,并能聽懂語音語音指令。而這次發(fā)布的NavFoM則是讓機(jī)器人具備了更強(qiáng)的自主性,在完全未知的環(huán)境中自己決定去哪、怎么走。


比如,在執(zhí)行送甜點(diǎn)的任務(wù)時(shí),NavFoM能夠讓機(jī)器狗跟隨用戶行動(dòng),遇到人流密集的情況,自主避開;而當(dāng)跟隨的人員從視線消失后,它可以自主分析尋找。


機(jī)器狗支持從跟隨模式切換至導(dǎo)航模式,自主規(guī)劃路線,知道過馬路要走斑馬線,避開可移動(dòng)物體,遵守交規(guī);導(dǎo)航讓走過街天橋,機(jī)器狗也是說一不二,穩(wěn)妥地完成上樓梯、下樓梯的過程,最終將物品送抵目的地。



01.

模型支持適配多種不同本體,

讓機(jī)器人學(xué)會(huì)自己找路

NavFoM作為基座大模型,具有以下三大亮點(diǎn):

全場(chǎng)景:同時(shí)支持室內(nèi)和室外場(chǎng)景,未見過的場(chǎng)景Zero-Shot運(yùn)行,無需建圖和額外采集訓(xùn)練數(shù)據(jù);

多任務(wù):支持自然語言指令驅(qū)動(dòng)的目標(biāo)跟隨和自主導(dǎo)航等不同細(xì)分導(dǎo)航任務(wù);

跨本體:可快速低成本適配機(jī)器狗、輪式人形、腿式人形、無人機(jī)、甚至汽車等不同尺寸的異構(gòu)本體。

除此之外,該模型允許開發(fā)人員以之為基座,通過后訓(xùn)練,進(jìn)一步進(jìn)化成滿足特定導(dǎo)航要求的應(yīng)用模型。

而這背后,是NavFoM重新定義了機(jī)器人導(dǎo)航的底層邏輯。過去,導(dǎo)航任務(wù)往往被拆分成識(shí)別、定位、規(guī)劃等獨(dú)立模塊,模型之間缺乏統(tǒng)一語言。

NavFoM則建立了一個(gè)新的通用范式:“視頻流+文本指令→動(dòng)作軌跡”。無論是“跟著那個(gè)人走”,還是“找到門口的紅車”,在NavFoM里都是同一種輸入輸出形式。模型不再依賴模塊化拼接,而是端到端地完成“看到—理解—行動(dòng)”的全過程。


NavFoM通過兩項(xiàng)關(guān)鍵技術(shù)創(chuàng)新構(gòu)建統(tǒng)一學(xué)習(xí)范式,讓機(jī)器人不僅看得懂、記得住、學(xué)得會(huì),還能聯(lián)合利用不同本體、不同任務(wù)和不同場(chǎng)景的數(shù)據(jù)實(shí)現(xiàn)知識(shí)共享:

1、TVI Tokens(Temporal-Viewpoint-Indexed Tokens)——讓模型理解時(shí)間與方向

不同相機(jī)、不同角度、不同時(shí)間拍到的畫面,常常讓模型“迷失”。TVI Tokens就像時(shí)間軸與方向羅盤,給每一幀畫面加上時(shí)間和視角的標(biāo)記,讓模型知道這幅圖像來自哪個(gè)角度、哪個(gè)時(shí)刻,從而理解空間的連續(xù)變化。它讓模型同時(shí)兼容單目、環(huán)視、無人機(jī)等多種視覺輸入方式,具備“世界在變化”的時(shí)空理解能力。


2、BATS策略(Budget-Aware Token Sampling)——讓模型在算力受限下依然聰明

導(dǎo)航時(shí)的視頻數(shù)據(jù)極其龐大,不可能每一幀都處理。BATS策略像人類的注意力系統(tǒng),會(huì)動(dòng)態(tài)判斷哪些畫面是“關(guān)鍵幀”,哪些可以略過。越靠近當(dāng)前時(shí)刻、越重要的場(chǎng)景,采樣概率越高,從而節(jié)省算力又不損失判斷準(zhǔn)確性。這一機(jī)制讓 NavFoM,這一7B參數(shù)級(jí)別的基座模型也能在真實(shí)機(jī)器人上毫秒級(jí)響應(yīng),兼顧實(shí)時(shí)性與精度。


▲左為給定Token上限,在不同幀數(shù)下的采樣分布;右為給定視頻幀數(shù),在不同Token上限下的采樣分布

02.

以千萬級(jí)高質(zhì)量數(shù)據(jù)為基礎(chǔ),一個(gè)模型驅(qū)動(dòng)所有形態(tài)

銀河通用構(gòu)建了一個(gè)跨任務(wù)數(shù)據(jù)集:包含八百萬條跨任務(wù)、跨本體導(dǎo)航數(shù)據(jù),覆蓋視覺語言導(dǎo)航,目標(biāo)導(dǎo)航,目標(biāo)跟蹤,自動(dòng)駕駛,網(wǎng)絡(luò)導(dǎo)航數(shù)據(jù)等多種任務(wù);以及四百萬條開放問答數(shù)據(jù),讓模型具備語言與空間之間的語義理解能力,這一訓(xùn)練量約為以往工作的兩倍左右。


▲訓(xùn)練數(shù)據(jù)量對(duì)比

為降低訓(xùn)練對(duì)硬件的需求并支持更大規(guī)模訓(xùn)練,團(tuán)隊(duì)還對(duì)圖像數(shù)據(jù)采用了視覺特征緩存(cache)機(jī)制,從而減少在線計(jì)算開銷、提升訓(xùn)練效率,這些數(shù)據(jù)覆蓋了四足、人形、輪式、無人機(jī)等多種機(jī)器人形態(tài)。


▲數(shù)據(jù)預(yù)處理

NavFoM在多個(gè)國(guó)際公開基準(zhǔn)上均達(dá)到或刷新SOTA水平:在VLN-CE、HM3D-OVON、NavSim等任務(wù)中表現(xiàn)領(lǐng)先;在目標(biāo)搜索、視覺語言導(dǎo)航、自動(dòng)駕駛等任務(wù)上均展現(xiàn)強(qiáng)大的跨任務(wù)泛化能力。更重要的是,它能在真實(shí)機(jī)器人上直接部署,無需針對(duì)任務(wù)微調(diào),只需修改自然語言指令或相機(jī)配置即可。

在實(shí)測(cè)中,NavFoM能夠驅(qū)動(dòng)多種形態(tài)機(jī)器人執(zhí)行復(fù)雜任務(wù):四足機(jī)器人長(zhǎng)程自主跟隨、輪式機(jī)器人室內(nèi)外混合導(dǎo)航、無人機(jī)復(fù)雜地形規(guī)劃飛行、自動(dòng)駕駛系統(tǒng)的路徑推理與避障決策。

03.

針對(duì)不同場(chǎng)景需求,已發(fā)布三個(gè)應(yīng)用模型

以NavFoM的統(tǒng)一架構(gòu)為基石,銀河通用針對(duì)不同的落地需求,訓(xùn)練并發(fā)布了三個(gè)的應(yīng)用模型:

TrackVLA++:其能力相對(duì)于TrackVLA顯著升級(jí),能實(shí)現(xiàn)30分鐘以上穩(wěn)定的長(zhǎng)程自主跟隨,室內(nèi)和室外均不在話下、并能適應(yīng)多種更復(fù)雜路況和地形。


UrbanVLA:針對(duì)室外場(chǎng)景應(yīng)用需求,和第三方地圖軟件打通,可根據(jù)地圖指引,自主規(guī)劃最優(yōu)路線并行至目的地,在街道、天橋、單元樓等各種環(huán)境中穿梭自如。


MM-Nav:支持360°無死角厘米級(jí)純視覺避障,解決了躲避玻璃、細(xì)線等難題。


04.

結(jié)語:機(jī)器人具有方向感,是未來具身智能大規(guī)模落地的關(guān)鍵

像NavFoM這樣的基座模型的出現(xiàn),讓機(jī)器人具備理解空間、適應(yīng)變化、自主行走的能力,是未來具身智能大規(guī)模落地的關(guān)鍵。

當(dāng)機(jī)器人能夠在陌生街區(qū)中找路、在人群中穿行、在復(fù)雜空間中預(yù)測(cè)障礙,擁有了像人類一樣的方向感時(shí),就能進(jìn)一步突破固定場(chǎng)景作業(yè)的限制,融入更多核心應(yīng)用領(lǐng)域,加速人機(jī)協(xié)同時(shí)代的到來。


2025中國(guó)具身智能機(jī)器人大會(huì)預(yù)告


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中美日首次世界500強(qiáng)排名斷崖差距:美151家,日149家,中國(guó)呢?

中美日首次世界500強(qiáng)排名斷崖差距:美151家,日149家,中國(guó)呢?

阿柒的訊
2025-12-04 19:39:35
丈夫全程喊“剎車”妻子仍撞上騎自行車男子,被撞人經(jīng)搶救無效死亡,交警披露事故細(xì)節(jié)

丈夫全程喊“剎車”妻子仍撞上騎自行車男子,被撞人經(jīng)搶救無效死亡,交警披露事故細(xì)節(jié)

環(huán)球網(wǎng)資訊
2025-12-21 15:55:49
一口氣“炫”光整盒魔芋爽!27歲小伙半夜痛醒進(jìn)醫(yī)院,確診為糞石性腸梗阻

一口氣“炫”光整盒魔芋爽!27歲小伙半夜痛醒進(jìn)醫(yī)院,確診為糞石性腸梗阻

觀威海
2025-12-18 16:30:05
銀行人勸告:家里有老人存款的,務(wù)必加上第二存款人!越早越安心

銀行人勸告:家里有老人存款的,務(wù)必加上第二存款人!越早越安心

小白鴿財(cái)經(jīng)
2025-12-17 07:05:02
石破茂卸任后直言:中日若開戰(zhàn),日本百分之百會(huì)亡國(guó)

石破茂卸任后直言:中日若開戰(zhàn),日本百分之百會(huì)亡國(guó)

丹徒生
2025-11-12 05:53:54
“兔子警官”李語蔚入圍!因執(zhí)勤視頻在網(wǎng)絡(luò)上走紅,可以熟練駕駛500斤的警用摩托車

“兔子警官”李語蔚入圍!因執(zhí)勤視頻在網(wǎng)絡(luò)上走紅,可以熟練駕駛500斤的警用摩托車

環(huán)球網(wǎng)資訊
2025-12-21 09:27:21
CBA最新排名更新,廣東隊(duì)4連勝卻收壞消息,遼寧隊(duì)要爭(zhēng)第一

CBA最新排名更新,廣東隊(duì)4連勝卻收壞消息,遼寧隊(duì)要爭(zhēng)第一

宗介說體育
2025-12-22 12:54:23
南博前院長(zhǎng)“賣慘”不到24小時(shí),雙重身份被扒,神秘買家曝光?

南博前院長(zhǎng)“賣慘”不到24小時(shí),雙重身份被扒,神秘買家曝光?

奇思妙想草葉君
2025-12-22 11:01:59
中央巡視組已進(jìn)駐山東濟(jì)南、青島...

中央巡視組已進(jìn)駐山東濟(jì)南、青島...

濟(jì)寧人
2025-12-22 00:08:48
張柏芝:我給謝霆鋒生了2個(gè)兒子,現(xiàn)在還年輕,王菲拿什么跟我比

張柏芝:我給謝霆鋒生了2個(gè)兒子,現(xiàn)在還年輕,王菲拿什么跟我比

小熊侃史
2025-12-22 11:22:03
一言難盡,烏加特一腳長(zhǎng)傳直接出底線,失誤直接導(dǎo)致對(duì)方射門

一言難盡,烏加特一腳長(zhǎng)傳直接出底線,失誤直接導(dǎo)致對(duì)方射門

懂球帝
2025-12-22 14:18:54
補(bǔ)貼來啦!請(qǐng)抓緊申報(bào)確認(rèn)

補(bǔ)貼來啦!請(qǐng)抓緊申報(bào)確認(rèn)

城市日歷
2025-12-22 10:58:04
被爆不雅照,或許跟馮紹峰結(jié)婚生兒子的人,就是她了

被爆不雅照,或許跟馮紹峰結(jié)婚生兒子的人,就是她了

蒂蒂茱家
2025-12-22 13:37:32
16年了,不顧所有人反對(duì),嫁大20歲徐威的張怡寧,得到幸福了嗎?

16年了,不顧所有人反對(duì),嫁大20歲徐威的張怡寧,得到幸福了嗎?

妙知
2025-11-25 17:17:45
廣東流感已達(dá)流行高峰,發(fā)熱、呼吸道癥狀就診患者開始減少

廣東流感已達(dá)流行高峰,發(fā)熱、呼吸道癥狀就診患者開始減少

南方都市報(bào)
2025-12-22 14:03:49
清朝一秀才屢試不第,無奈回鄉(xiāng),卻因一件小事被康熙皇帝御筆親封

清朝一秀才屢試不第,無奈回鄉(xiāng),卻因一件小事被康熙皇帝御筆親封

牛魔王與芭蕉扇
2025-09-23 10:41:21
攜程被大量用戶卸載!注銷按鈕點(diǎn)擊超300萬次,平臺(tái)暫未發(fā)布道歉

攜程被大量用戶卸載!注銷按鈕點(diǎn)擊超300萬次,平臺(tái)暫未發(fā)布道歉

火山詩話
2025-12-21 06:24:06
7歲女兒交給老師畫的第一張全家福,畫里爸爸沒有臉,老師果斷報(bào)警

7歲女兒交給老師畫的第一張全家福,畫里爸爸沒有臉,老師果斷報(bào)警

罪案洞察者
2025-12-02 11:25:59
美聯(lián)儲(chǔ)降息周期開啟,歷史表明這3類資產(chǎn)漲最猛!當(dāng)下布局正當(dāng)時(shí)

美聯(lián)儲(chǔ)降息周期開啟,歷史表明這3類資產(chǎn)漲最猛!當(dāng)下布局正當(dāng)時(shí)

小白鴿財(cái)經(jīng)
2025-12-22 07:05:03
徹底決裂!周定洋發(fā)文告別徐正源,疑對(duì)成都蓉城不滿,續(xù)約沒戲了

徹底決裂!周定洋發(fā)文告別徐正源,疑對(duì)成都蓉城不滿,續(xù)約沒戲了

羅掌柜體育
2025-12-22 12:13:19
2025-12-22 14:44:49
機(jī)器人前瞻
機(jī)器人前瞻
專注于機(jī)器人報(bào)道的媒體
270文章數(shù) 5關(guān)注度
往期回顧 全部

科技要聞

商湯聯(lián)創(chuàng)親自下場(chǎng) 痛批主流機(jī)器人技術(shù)大錯(cuò)

頭條要聞

上海女子"喊冤"汽車壓上石頭爆胎無人賠償 網(wǎng)友吵翻了

頭條要聞

上海女子"喊冤"汽車壓上石頭爆胎無人賠償 網(wǎng)友吵翻了

體育要聞

戴琳,中國(guó)足球的反向代言人

娛樂要聞

星光大賞看點(diǎn)全在臺(tái)下

財(cái)經(jīng)要聞

人民幣快漲到7了!

汽車要聞

可享88元抵2000元等多重權(quán)益 昊鉑A800開啟盲訂

態(tài)度原創(chuàng)

手機(jī)
親子
旅游
時(shí)尚
公開課

手機(jī)要聞

國(guó)產(chǎn)手機(jī)電池率先跨入萬級(jí)時(shí)代,榮耀WIN全系搭載10000mAh電池

親子要聞

3毫米缺損奪走五月齡嬰兒:一場(chǎng)本可避免的醫(yī)療悲??!

旅游要聞

新酒店 | 太倉金茂隱逸玫瑰莊園酒店亮相,隱于田園的理想生活場(chǎng)

紅色不流行了?今年最火的穿搭居然是它

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版