国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

2700GB高質(zhì)量數(shù)據(jù),訓(xùn)出空間智能SOTA,背后秘訣全棧開源

0
分享至

一凡 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

什么在限制空間智能落地?

從自動(dòng)駕駛到具身智能,行業(yè)對(duì)此的共識(shí)是:數(shù)據(jù)

因?yàn)閿?shù)據(jù)不夠,模型泛化能力就弱,只能靠硬件來(lái)湊。

這在機(jī)器人身上體現(xiàn)得尤為明顯。機(jī)器人要感知空間,常用的硬件是RGB-D相機(jī),它既能看懂RGB圖像,又能感知深度,從而獲取到三維立體信息,讓機(jī)器人理解物理世界。

但問題是,機(jī)器人的這雙眼并不靠譜,遇到鏡子、電梯、玻璃門等透明物體或者反光表面,RGB-D相機(jī)就容易失效,導(dǎo)致機(jī)器人感知異常。

這些場(chǎng)景繞不開,躲不掉,都是機(jī)器人走進(jìn)千家萬(wàn)戶,一定會(huì)碰到的問題,必須要解決。但因?yàn)槿鄙贁?shù)據(jù)底座,行業(yè)過(guò)去的解決方式一般是靠堆硬件,補(bǔ)短板,強(qiáng)化感知能力。

這種局面即將迎來(lái)改變。因?yàn)榫驮趧倓?,具身智能的基建玩家出手,?duì)癥下藥,推出了一個(gè)開源數(shù)據(jù)基座?;谶@個(gè)基座訓(xùn)練的模型,都已經(jīng)實(shí)現(xiàn)SOTA了。

空間智能卡在哪兒了?

空間智能給了機(jī)器人一雙眼睛和小腦,機(jī)器人靠它才能實(shí)現(xiàn)感知、規(guī)劃、導(dǎo)航和精細(xì)操作。

比如說(shuō)機(jī)器人需要拿起面前的杯子,它不光要看懂這是杯子,還需要知道杯子離自己有多遠(yuǎn)、邊界在哪兒。

問題是,實(shí)現(xiàn)空間智能并不容易,需要依靠大規(guī)模、高質(zhì)量的數(shù)據(jù)?;ヂ?lián)網(wǎng)上已有的海量RGB圖像,規(guī)模確實(shí)大但不符合要求,因?yàn)樗荒堋拔埂苯oAI二維信息,AI很難從中生長(zhǎng)出三維空間的理解能力。

所以行業(yè)這些年一直在給AI補(bǔ)空間理解這門課,路線也不少,有RGB-D相機(jī)、激光雷達(dá)和3D重建等方法。

其中RGB-D相機(jī)路線一直都很受歡迎,因?yàn)?strong>它就像給AI開了“第三只眼”,不光能測(cè)長(zhǎng)和寬,還能測(cè)量距離,而且不需要復(fù)雜后處理,可以實(shí)時(shí)感知環(huán)境。

但RGB-D路線也有不足,主要有兩個(gè)問題。首先第一個(gè)問題是,采集任務(wù)本身比較困難,不是說(shuō)簡(jiǎn)單地舉個(gè)相機(jī),找個(gè)機(jī)位,“咔嚓”一拍就完事兒。不僅需要檢查左右圖像一致性,還要對(duì)RGB圖像和深度信息進(jìn)行時(shí)空同步,以及處理不同硬件之間的差異。

這還不算完,獲取到RGB-D數(shù)據(jù)后,第二個(gè)問題接著就來(lái)了,研究者會(huì)發(fā)現(xiàn)其實(shí)RGB-D相機(jī)有時(shí)候很不靠譜,碰到玻璃、鏡面、金屬反光材質(zhì)和白墻這種低紋理表面就容易失效。

還是以機(jī)器人拿杯子為例,咱們?nèi)粘I羁吹降谋右话愣奸L(zhǎng)這樣:



而在RGB-D相機(jī)的深度傳感器下,杯子be like醬嬸兒:



在機(jī)器人的視角里,兩個(gè)杯子直接連成了一塊,根本難以分辨,也自然無(wú)法準(zhǔn)確拿取。RGB-D相機(jī)的不穩(wěn)定,進(jìn)一步導(dǎo)致了高質(zhì)量RGB-D數(shù)據(jù)的缺失。

螞蟻靈波開源空間智能數(shù)據(jù)基建

為了緩解行業(yè)的數(shù)據(jù)痛點(diǎn),螞蟻靈波最近開源了LingBot-Depth-Dataset數(shù)據(jù)集,其總體規(guī)模達(dá)到2.71TB,包含300萬(wàn)對(duì)標(biāo)注RGB-D數(shù)據(jù),每一對(duì)樣本都包含一張RGB圖像、傳感器原始深度圖和真值深度圖

其中大部分都是真實(shí)數(shù)據(jù),大約有200萬(wàn)對(duì),140萬(wàn)對(duì)是由多臺(tái)RGB-D相機(jī)采集自真實(shí)室內(nèi)場(chǎng)景的數(shù)據(jù)RobbyReal(如下圖所示),以及58萬(wàn)對(duì)由機(jī)器人在VLA任務(wù)中采集的數(shù)據(jù)RobbyVla



這些真實(shí)數(shù)據(jù)的來(lái)源非常廣泛,包括住宅、教室、博物館、商店、醫(yī)院、健身房和電梯等各種生活場(chǎng)景,數(shù)據(jù)來(lái)源豐富,作為訓(xùn)練底座時(shí)就能增強(qiáng)模型的泛化性。

此外還有約100萬(wàn)對(duì)由雙相機(jī)視角渲染生成的合成數(shù)據(jù)RobbySim



其余部分都是RobbySimVal,含有3.8萬(wàn)條數(shù)據(jù),作為仿真數(shù)據(jù)的驗(yàn)證集。這種虛實(shí)融合采集數(shù)據(jù)的方式,既能覆蓋一些邊緣場(chǎng)景,也能降低數(shù)據(jù)采集成本。



規(guī)模大、場(chǎng)景豐富,只是數(shù)據(jù)集可以被行業(yè)廣泛使用的必要條件,但還不是全部。

LingBot-Depth-Dataset還有一個(gè)值得關(guān)注的地方在于數(shù)據(jù)分布的多樣性,它在構(gòu)建時(shí)使用Orbbec 335、335L,RealSense D405、D415、D435、D455這6款主流深度相機(jī)進(jìn)行采集,不同相機(jī)在成像特性、噪聲模式、深度精度上各有差異,使得數(shù)據(jù)集天然覆蓋了多種傳感器分布,為下游研究和模型訓(xùn)練提供了更豐富的數(shù)據(jù)基礎(chǔ)。

這意味著這座數(shù)據(jù)金礦,可以被更多研發(fā)團(tuán)隊(duì)挖掘,成為空間智能的數(shù)據(jù)基建。

打造具身智能的“大腦平臺(tái)”

螞蟻靈波開源的這套數(shù)據(jù)基建,緩解了開源社區(qū)缺乏真實(shí)場(chǎng)景拍攝數(shù)據(jù)的問題,不僅量大管飽,而且戰(zhàn)績(jī)可查

今年年初,螞蟻靈波發(fā)布了LingBot-Depth模型,LingBot-Depth主要基于LingBot-Depth-Dataset數(shù)據(jù)集訓(xùn)練,在多項(xiàng)權(quán)威深度補(bǔ)全基準(zhǔn)測(cè)試如iBims、NYUv2和DIODE上實(shí)現(xiàn)了SOTA



而當(dāng)LingBot-Depth部署到真實(shí)環(huán)境后,可以驅(qū)動(dòng)機(jī)器人穩(wěn)健抓取透明和反光物體,這在以往可以說(shuō)是天方夜譚的事情。



隨后,螞蟻靈波又緊接著開源了LingBot-VLA,打通視覺、語(yǔ)言和動(dòng)作,驅(qū)動(dòng)機(jī)器人做出決策。

緊隨其后開源的LingBot-World,則為模型提供了仿真訓(xùn)練場(chǎng)。

當(dāng)時(shí)壓軸登場(chǎng)的LingBot-VA,則率先讓世界模型直接驅(qū)動(dòng)機(jī)器人動(dòng)作,實(shí)現(xiàn)了“邊推演,邊執(zhí)行”,引領(lǐng)了具身研究的趨勢(shì)。



從感知到?jīng)Q策,從模型到數(shù)據(jù),螞蟻靈波正在打造具身智能的“大腦平臺(tái)”。其最新開源成果,也啟發(fā)著行業(yè)思維轉(zhuǎn)向。

物理AI數(shù)據(jù)先行

追根溯源來(lái)看,這種通過(guò)軟件方法加強(qiáng)感知能力,而不是一味堆傳感器的思想,體現(xiàn)了計(jì)算機(jī)科學(xué)中的軟件硬件等效原理

那軟件和硬件手段應(yīng)該如何取舍?與具身智能同屬物理AI的自動(dòng)駕駛行業(yè),已在該問題上形成了共識(shí),值得參考借鑒:

首先最值得重視的是數(shù)據(jù)和算法架構(gòu)。前者是AI迭代的基石,后者是指將多個(gè)算法整合形成合力,并長(zhǎng)期積累的能力。

其次才是堆更多數(shù)量和價(jià)格更高的傳感器。自動(dòng)駕駛從業(yè)者普遍認(rèn)為,隨著數(shù)據(jù)越來(lái)越多,再加上算法架構(gòu)持續(xù)升級(jí),模型的空間感知能力會(huì)越來(lái)越強(qiáng),這時(shí)再堆傳感器,雖然有用,但是提升的效果會(huì)越來(lái)越弱。

正是有了這樣的共識(shí),行業(yè)才打下了硬件成本,為自動(dòng)駕駛商業(yè)化繁榮奠定了基礎(chǔ)。

自動(dòng)駕駛的實(shí)踐已經(jīng)證明,物理AI落地,優(yōu)先考慮軟件手段,這并不會(huì)削弱空間智能,還可以推動(dòng)商業(yè)化。這同樣也是螞蟻靈波開源一系列模型和數(shù)據(jù)集,給具身智能行業(yè)帶來(lái)的啟發(fā):

加強(qiáng)空間智能,數(shù)據(jù)算法優(yōu)先,不必追逐昂貴硬件。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
突發(fā)!特斯拉新款 Model Y 發(fā)布,有點(diǎn)離譜

突發(fā)!特斯拉新款 Model Y 發(fā)布,有點(diǎn)離譜

新浪財(cái)經(jīng)
2026-04-11 04:45:06
不到24小時(shí),以色列迎來(lái)6個(gè)噩耗,內(nèi)塔尼亞胡或被關(guān)進(jìn)大牢

不到24小時(shí),以色列迎來(lái)6個(gè)噩耗,內(nèi)塔尼亞胡或被關(guān)進(jìn)大牢

小彭的燦爛筆記1
2026-04-11 11:44:18
季后賽首輪對(duì)陣預(yù)測(cè)!湖人一輪游,勇士打雷霆,哈登能沖擊總冠軍

季后賽首輪對(duì)陣預(yù)測(cè)!湖人一輪游,勇士打雷霆,哈登能沖擊總冠軍

籃球掃地僧
2026-04-11 22:01:06
美驅(qū)逐艦在伊朗警告下從霍爾木茲海峽折返

美驅(qū)逐艦在伊朗警告下從霍爾木茲海峽折返

每日經(jīng)濟(jì)新聞
2026-04-11 22:17:31
伊朗稱美國(guó)同意在黎巴嫩?;?>
    </a>
        <h3>
      <a href=伊朗稱美國(guó)同意在黎巴嫩?;?/a> 每日經(jīng)濟(jì)新聞
2026-04-11 22:17:26
伊朗一戰(zhàn)重塑格局,經(jīng)過(guò)這一戰(zhàn),中美之間至少50年內(nèi)不會(huì)爆發(fā)戰(zhàn)爭(zhēng)

伊朗一戰(zhàn)重塑格局,經(jīng)過(guò)這一戰(zhàn),中美之間至少50年內(nèi)不會(huì)爆發(fā)戰(zhàn)爭(zhēng)

趣文說(shuō)娛
2026-04-11 20:10:31
遼寧一車牌號(hào)帶8888的奔馳S450L疑似作為陪葬品下葬,當(dāng)?shù)孛裾郑阂蚜私?,正在核?shí)

遼寧一車牌號(hào)帶8888的奔馳S450L疑似作為陪葬品下葬,當(dāng)?shù)孛裾郑阂蚜私猓诤藢?shí)

臺(tái)州交通廣播
2026-04-10 14:45:26
熱刺球員集體破防:德澤爾比3周教完前任3年的課

熱刺球員集體破防:德澤爾比3周教完前任3年的課

體育硬核說(shuō)
2026-04-11 06:51:45
原來(lái)我們都被他騙了?陳坤兒子的生母,其實(shí)早在14年前就公開了

原來(lái)我們都被他騙了?陳坤兒子的生母,其實(shí)早在14年前就公開了

凡知
2026-04-11 19:10:48
可繞過(guò)彈劾直接罷免特朗普,萬(wàn)斯已經(jīng)公開翻臉,將提前奪權(quán)?

可繞過(guò)彈劾直接罷免特朗普,萬(wàn)斯已經(jīng)公開翻臉,將提前奪權(quán)?

聞識(shí)
2026-04-11 07:51:54
王艷竟然生了一個(gè)“男版的自己”網(wǎng)友:王志才祖宗 18 代都要感謝

王艷竟然生了一個(gè)“男版的自己”網(wǎng)友:王志才祖宗 18 代都要感謝

她時(shí)尚丫
2026-04-11 22:09:58
超級(jí)巨大失誤!王國(guó)明致敬王大雷,出擊失誤送空門,瓦科笑納大禮

超級(jí)巨大失誤!王國(guó)明致敬王大雷,出擊失誤送空門,瓦科笑納大禮

奧拜爾
2026-04-11 20:29:27
“人間悲劇”張紫妍:被31位財(cái)閥灌藥性侵,總統(tǒng)都無(wú)法替她申冤

“人間悲劇”張紫妍:被31位財(cái)閥灌藥性侵,總統(tǒng)都無(wú)法替她申冤

她時(shí)尚丫
2026-04-07 23:22:56
張雪越火,王鑄的980越?jīng)觯】诒?,車再?gòu)?qiáng)也難賣,該如何破局

張雪越火,王鑄的980越?jīng)觯】诒?,車再?gòu)?qiáng)也難賣,該如何破局

小怪吃美食
2026-04-10 12:11:25
遼陽(yáng)奔馳陪葬后續(xù):多部門介入,豪車當(dāng)天被挖出,律師稱已涉違法

遼陽(yáng)奔馳陪葬后續(xù):多部門介入,豪車當(dāng)天被挖出,律師稱已涉違法

觀察鑒娛
2026-04-11 11:35:30
荷蘭紅燈區(qū):在這里沒有做不到,只有你想不到的大尺度

荷蘭紅燈區(qū):在這里沒有做不到,只有你想不到的大尺度

番外行
2026-03-21 13:03:00
張雪峰婚紗照太驚艷!一身西裝帥氣逼人,這份美好女兒可珍藏一生

張雪峰婚紗照太驚艷!一身西裝帥氣逼人,這份美好女兒可珍藏一生

秋姐居
2026-04-11 22:18:55
一個(gè)人可以絕望到什么程度 看網(wǎng)友講述 感同身受到淚流滿面。

一個(gè)人可以絕望到什么程度 看網(wǎng)友講述 感同身受到淚流滿面。

侃神評(píng)故事
2026-03-14 15:15:06
40余歲女子從日本“人肉”背回244本淫穢漫畫,法院:走私淫穢物品,判一年六個(gè)月

40余歲女子從日本“人肉”背回244本淫穢漫畫,法院:走私淫穢物品,判一年六個(gè)月

極目新聞
2026-04-11 12:39:46
不到一個(gè)停車位大?清朝花15英鎊買下的英國(guó)土地,今天仍屬中國(guó)!

不到一個(gè)停車位大?清朝花15英鎊買下的英國(guó)土地,今天仍屬中國(guó)!

丁丁鯉史紀(jì)
2026-04-01 15:47:56
2026-04-11 22:52:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12457文章數(shù) 176449關(guān)注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

霍爾木茲海峽突傳大消息 特朗普最新發(fā)聲

頭條要聞

霍爾木茲海峽突傳大消息 特朗普最新發(fā)聲

體育要聞

換帥之后,他們從降級(jí)區(qū)沖到升級(jí)區(qū)

娛樂要聞

鄭鈞回應(yīng)兒子走路:會(huì)監(jiān)督他挺直腰板

財(cái)經(jīng)要聞

從日本翻身看:這次誰(shuí)能扛住高油價(jià)?

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬(wàn)起

態(tài)度原創(chuàng)

本地
游戲
旅游
健康
公開課

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

夢(mèng)幻西游這裝備刷飛賊都不配嗎?牡丹亭新出3速極品玉魄

旅游要聞

火出圈!成都人民公園相親角被老外包圍了

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版