国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

放大招!螞蟻靈波“王炸”模型四連發(fā),機(jī)器人要成精了?

0
分享至

四天開(kāi)源四個(gè)模型,螞蟻靈波直接攤開(kāi)了一張具身智能的完整底牌。

從【看清】玻璃,到【理解】任務(wù),再到【模擬】世界,最后到【行動(dòng)】落地 ——一套覆蓋感知、決策與仿真與執(zhí)行的完整技術(shù)棧全集開(kāi)源。

自1月27日起,螞蟻集團(tuán)旗下靈波科技(RobbyAnt)發(fā)起「開(kāi)源周」,打出了一套嚴(yán)密的組合拳:

起手即是破局,LingBot-Depth 率先亮相,解決了機(jī)器人視覺(jué)中“看不透”的頑疾;

緊隨其后,LingBot-VLA 接管大腦,讓機(jī)器人真正具備了理解抽象指令的通感;

第三天,LingBot-World 構(gòu)建高保真環(huán)境,為機(jī)器人打造了一個(gè)極低成本的試錯(cuò)空間;

而在今天,全球首個(gè)自回歸視頻-動(dòng)作模型 LingBot-VA 壓軸登場(chǎng),讓機(jī)器人真正學(xué)會(huì)“邊推演、邊行動(dòng)”。

這套全家桶并非功能的簡(jiǎn)單堆砌。這四個(gè)模型單拎出來(lái),每一個(gè)的指標(biāo)都足以在行業(yè)內(nèi)炸場(chǎng)。

那么,它們究竟強(qiáng)在哪里?


眼睛:破解透明難題,讓機(jī)器人“看見(jiàn)不可見(jiàn)”

家居機(jī)器人撞上玻璃門,工業(yè)機(jī)械臂抓不到透明零件,這些行業(yè)經(jīng)典痛點(diǎn),源于傳統(tǒng)深度相機(jī)在透明與反光材質(zhì)前的功能性失明。

首日開(kāi)源的LingBot-Depth 選擇了一條巧妙路徑:不依賴昂貴硬件升級(jí),而是通過(guò)掩碼深度建模(MDM)算法,讓現(xiàn)有傳感器獲得超越自身規(guī)格的感知能力。

研究團(tuán)隊(duì)構(gòu)建了包含200萬(wàn)組真實(shí)場(chǎng)景數(shù)據(jù)和100萬(wàn)組合成數(shù)據(jù)的訓(xùn)練集,實(shí)現(xiàn)在稀疏深度補(bǔ)全任務(wù)中,誤差降低約 47%, 室內(nèi)場(chǎng)景相對(duì)誤差降低超過(guò) 70%。

在真機(jī)驗(yàn)證中,啟用LingBot-Depth后的機(jī)器人抓取完全透明的塑料杯,成功率從0躍升至50%。



項(xiàng)目鏈接: https://technology.robbyant.com/lingbot-depth

HuggingFace 鏈接:https://huggingface.co/robbyant/lingbot-depth

技術(shù)報(bào)告鏈接:https://github.com/Robbyant/lingbot-depth/blob/main/tech-report.pdf

▍大腦:20000小時(shí)真實(shí)數(shù)據(jù),喂出最強(qiáng)開(kāi)源VLA基座

有了好眼睛,更需要一個(gè)好腦子。但機(jī)器人的“腦子”一直有個(gè)頑疾:在A機(jī)器人上訓(xùn)練的技能,換到B機(jī)器人上就宕機(jī);在實(shí)驗(yàn)室桌子能完成的任務(wù),換張桌子就抓瞎。

LingBot-VLA的解決方案簡(jiǎn)單粗暴,用海量、多樣化的真實(shí)數(shù)據(jù),硬生生喂出常識(shí)和泛化能力:20000小時(shí)真實(shí)機(jī)器人操作數(shù)據(jù),覆蓋9種不同構(gòu)型的雙臂機(jī)器人。

這一數(shù)據(jù)量不僅創(chuàng)下開(kāi)源領(lǐng)域新紀(jì)錄,更重要的是,研究團(tuán)隊(duì)首次在真實(shí)機(jī)器人任務(wù)中系統(tǒng)驗(yàn)證了VLA模型的Scaling Law:隨著預(yù)訓(xùn)練數(shù)據(jù)從3000小時(shí)逐步擴(kuò)展到20000小時(shí),模型在下游任務(wù)的成功率持續(xù)提升,且尚未出現(xiàn)飽和跡象。



技術(shù)架構(gòu)上,LingBot-VLA采用專家混合Transformer設(shè)計(jì),并創(chuàng)新性地將LingBot-Depth提供的深度信息通過(guò)可學(xué)習(xí)查詢對(duì)齊機(jī)制注入模型,賦予機(jī)器人精確的空間感知能力。

在上海交通大學(xué)開(kāi)源的GM-100真實(shí)機(jī)器人評(píng)測(cè)基準(zhǔn)中,引入深度信息的LingBot-VLA平均成功率達(dá) 17.3%,超越此前公認(rèn)最強(qiáng)的Pi0.5。



在仿真基準(zhǔn)RoboTwin 2.0中,面對(duì)高度隨機(jī)化干擾,其成功率也比π0.5領(lǐng)先近10個(gè)百分點(diǎn)。



這驗(yàn)證了一個(gè)關(guān)鍵假設(shè):一個(gè)在海量、異構(gòu)真實(shí)數(shù)據(jù)中訓(xùn)練的大腦,能夠?qū)W會(huì)跨越硬件差異的本質(zhì)操作邏輯,真正實(shí)現(xiàn)“一個(gè)大腦,適配多個(gè)身體”。

項(xiàng)目網(wǎng)站:https://technology.robbyant.com/lingbot-vla

模型:

https://huggingface.co/collections/robbyant/lingbot-vla

https://www.modelscope.cn/collections/Robbyant/LingBot-VLA

數(shù)據(jù)集:

https://huggingface.co/datasets/robbyant/lingbot-GM-100

GitHub:https://github.com/Robbyant/lingbot-vla

技術(shù)報(bào)告:https://arxiv.org/abs/2601.18692

▍模擬:高保可交互的“虛擬演練場(chǎng)”開(kāi)源

在真實(shí)世界訓(xùn)練機(jī)器人,成本高昂、效率低下、風(fēng)險(xiǎn)不小。于是,有一個(gè)能夠試錯(cuò)、學(xué)習(xí)和推演的環(huán)境很重要。

LingBot-World 就是在構(gòu)建一個(gè)與物理世界規(guī)律一致的 高保真、可交互仿真環(huán)境。不止是一個(gè)視頻生成模型,更是一個(gè)物理規(guī)律嚴(yán)謹(jǐn)?shù)氖澜缒M器。

它的強(qiáng)大,讓人瞠目:

十分鐘超長(zhǎng)生成:畫(huà)面穩(wěn)定不崩壞,解決了長(zhǎng)視頻生成的記憶難題。

實(shí)時(shí)交互:你可以用WASD鍵盤像玩游戲一樣實(shí)時(shí)探索這個(gè)世界,也可以用自然語(yǔ)言下令:“前面放個(gè)煙花”、“變成冰雪世界”,世界隨之改變。

嚴(yán)格物理規(guī)律:貓咪撞到沙發(fā)會(huì)停下,不會(huì)穿模;鏡頭移開(kāi)再回來(lái),物體仍在并符合邏輯。


高動(dòng)態(tài)環(huán)境下,鏡頭長(zhǎng)時(shí)間移開(kāi)后返回,車輛形態(tài)外觀仍保持一致



鏡頭長(zhǎng)時(shí)間移開(kāi)后返回,房屋仍存在且結(jié)構(gòu)一致


這意味著,機(jī)器人可以在這個(gè)虛擬世界里進(jìn)行無(wú)數(shù)次零成本的人生模擬,學(xué)習(xí)技能、試錯(cuò)規(guī)劃,再將經(jīng)驗(yàn)無(wú)損遷移到現(xiàn)實(shí)。

更讓社區(qū)沸騰的是,相比其他頂尖團(tuán)隊(duì)的閉源策略,螞蟻靈波選擇了完全開(kāi)源 。國(guó)內(nèi)外網(wǎng)友一片驚呼:“對(duì)開(kāi)源社區(qū)是巨大勝利!”“這是具身智能的重大進(jìn)步!”

項(xiàng)目網(wǎng)站:https://technology.robbyant.com/lingbot-world

模型:

https://huggingface.co/collections/robbyant/lingbot-world

https://www.modelscope.cn/collections/Robbyant/LingBot-world

數(shù)據(jù)集:Code:https://github.com/Robbyant/lingbot-world

技術(shù)報(bào)告: https://github.com/robbyant/lingbotworld/blob/main/LingBot_World_paper.pdf

▍執(zhí)行:從“看懂世界”到“改變世界”

接下來(lái),還有一個(gè)關(guān)鍵問(wèn)題懸而未決:如何將世界模型中推演的未來(lái),高效、可靠地變?yōu)闄C(jī)器人在物理世界中 執(zhí)行的當(dāng)下?

今天開(kāi)源的 LingBot-VA,正是打通了落地的答案,是全球首個(gè)自回歸視頻-動(dòng)作一體化世界模型。

它的核心突破在于“邊推演,邊行動(dòng)”。

傳統(tǒng)的流程是,先讓世界模型完整推演一遍任務(wù)視頻,再讓另一個(gè)控制模型去學(xué)習(xí)模仿。而LingBot-VA將二者融合:在每一步,模型根據(jù)當(dāng)前觀測(cè),同步生成下一幀的世界畫(huà)面和達(dá)成該畫(huà)面的機(jī)器人動(dòng)作。

它擁有長(zhǎng)期記憶:能記住完整的歷史交互,避免在相似狀態(tài)中陷入循環(huán)。例如,在“開(kāi)右盒-關(guān)右盒-開(kāi)左盒”的任務(wù)中,它能清晰區(qū)分關(guān)盒前后的相同狀態(tài),不會(huì)卡殼。

它具備少樣本快速學(xué)習(xí)能力:僅需30-50條真實(shí)演示,就能快速適應(yīng)新任務(wù),極大降低了部署成本。

它構(gòu)建了“預(yù)測(cè)-執(zhí)行-感知-修正”的實(shí)時(shí)閉環(huán):在生成每一步時(shí),都會(huì)納入實(shí)時(shí)傳感器反饋進(jìn)行修正,確保想象不偏離現(xiàn)實(shí)。

在真實(shí)機(jī)器人評(píng)測(cè)中,面對(duì)制作早餐、高精度插入、柔性衣物折疊等高難度任務(wù),LingBot-VA平均成功率較頂級(jí)基線模型提升20%。

在仿真評(píng)測(cè)中,它更是將雙臂協(xié)同操作的成功率推至 90%以上,刷新行業(yè)紀(jì)錄。

至此,世界模型賦能具身操作的路徑終于形成:Depth提供精準(zhǔn)的眼睛,VLA充當(dāng)通用的“大腦,World構(gòu)建可無(wú)限試錯(cuò)的模擬環(huán)境,而VA則賦予實(shí)時(shí)將想象落地的“手腳”。

一個(gè)智能體從感知環(huán)境、理解任務(wù)、模擬推演到最終執(zhí)行的完整能力鏈路,被完全打通。

項(xiàng)目網(wǎng)站:https://technology.robbyant.com/lingbot-va

模型:

https://huggingface.co/collections/robbyant/lingbot-va

https://www.modelscope.cn/collections/Robbyant/LingBot-va

數(shù)據(jù)集:https://github.com/Robbyant/lingbot-va

技術(shù)報(bào)告:https://github.com/Robbyant/lingbot-va/blob/master/LingBot_VA_paper.pdf

▍結(jié)語(yǔ)與未來(lái)

螞蟻靈波此次四天四模型的體系化開(kāi)源,背后是清晰的產(chǎn)業(yè)判斷。

當(dāng)前機(jī)器人行業(yè)面臨的核心痛點(diǎn)是場(chǎng)景碎片化與硬件非標(biāo)化。傳統(tǒng)的為每款機(jī)器人、每個(gè)場(chǎng)景定制算法的模式,成本高、周期長(zhǎng)、難以規(guī)?;?。

LingBot系列提供的是一種 “基座+適配”新范式:通過(guò)開(kāi)源經(jīng)過(guò)海量真實(shí)數(shù)據(jù)預(yù)訓(xùn)練的通用模型與工具鏈,企業(yè)可以用更少的數(shù)據(jù)、更低的算力,快速適配自己的特定場(chǎng)景和機(jī)器人本體。

通過(guò)這次體系化的開(kāi)源,可以看到螞蟻靈波的戰(zhàn)略定位也愈發(fā)明晰:不下場(chǎng)制造機(jī)器人軀體,而是專注于打造可規(guī)?;瘡?fù)用的最強(qiáng)大腦與核心能力,為行業(yè)提供一套標(biāo)準(zhǔn)的智能基座。

另一種程度上,開(kāi)源也意味著以開(kāi)放協(xié)作定義的新周期剛剛開(kāi)始。那個(gè)屬于通用具身智能的未來(lái),正在以更清晰、更務(wù)實(shí)的路徑加速到來(lái)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
太準(zhǔn)了,以色列炸伊朗基地的四枚炸彈,炸點(diǎn)竟連成一條直線!

太準(zhǔn)了,以色列炸伊朗基地的四枚炸彈,炸點(diǎn)竟連成一條直線!

阿龍聊軍事
2026-03-02 19:20:20
中國(guó)那些所謂專家在伊朗問(wèn)題上又一次出糗,接下來(lái)看他們?cè)侔劝壬?>
    </a>
        <h3>
      <a href=壹家言
2026-03-01 21:05:09
美軍新型彈道導(dǎo)彈首次投入實(shí)戰(zhàn)

美軍新型彈道導(dǎo)彈首次投入實(shí)戰(zhàn)

觀察者網(wǎng)
2026-03-02 16:42:09
伊拉克民兵組織稱襲擊巴格達(dá)機(jī)場(chǎng)內(nèi)美軍目標(biāo)

伊拉克民兵組織稱襲擊巴格達(dá)機(jī)場(chǎng)內(nèi)美軍目標(biāo)

界面新聞
2026-03-02 11:14:08
這個(gè)死磕王楚欽的裁判,決賽就沒(méi)讓她上場(chǎng)

這個(gè)死磕王楚欽的裁判,決賽就沒(méi)讓她上場(chǎng)

楊仔述
2026-03-02 11:13:02
600259,尾盤直線漲停!有色板塊,全線走強(qiáng)!

600259,尾盤直線漲停!有色板塊,全線走強(qiáng)!

證券時(shí)報(bào)e公司
2026-03-02 17:53:53
河北省政協(xié)原副主席姜德果嚴(yán)重違紀(jì)違法被開(kāi)除黨籍

河北省政協(xié)原副主席姜德果嚴(yán)重違紀(jì)違法被開(kāi)除黨籍

界面新聞
2026-03-02 16:33:07
為什么說(shuō)要得饒人處且饒人?網(wǎng)友:卡里幾千萬(wàn),為了5塊錢命沒(méi)了

為什么說(shuō)要得饒人處且饒人?網(wǎng)友:卡里幾千萬(wàn),為了5塊錢命沒(méi)了

另子維愛(ài)讀史
2026-02-25 23:23:26
庫(kù)明加轉(zhuǎn)會(huì)連爆三場(chǎng) 老鷹球迷主場(chǎng)高喊:謝謝勇士!

庫(kù)明加轉(zhuǎn)會(huì)連爆三場(chǎng) 老鷹球迷主場(chǎng)高喊:謝謝勇士!

體壇周報(bào)
2026-03-02 16:26:34
下班快回家!深圳全市預(yù)警生效,大風(fēng)大雨要來(lái)了!官方:濕度大≠回南天!

下班快回家!深圳全市預(yù)警生效,大風(fēng)大雨要來(lái)了!官方:濕度大≠回南天!

深圳晚報(bào)
2026-03-02 19:06:59
2100枚核彈24小時(shí)待命,張召忠曾發(fā)出警告:一旦開(kāi)戰(zhàn),將無(wú)處可逃

2100枚核彈24小時(shí)待命,張召忠曾發(fā)出警告:一旦開(kāi)戰(zhàn),將無(wú)處可逃

近史博覽
2026-01-22 12:52:47
黃金都靠邊站!2026年最瘋漲的,竟是你隨手扔的舊東西

黃金都靠邊站!2026年最瘋漲的,竟是你隨手扔的舊東西

小陸搞笑日常
2026-03-02 01:34:50
繼位姜昆,周煒當(dāng)選曲協(xié)會(huì)長(zhǎng)后引發(fā)爭(zhēng)議,過(guò)往言論被指不妥

繼位姜昆,周煒當(dāng)選曲協(xié)會(huì)長(zhǎng)后引發(fā)爭(zhēng)議,過(guò)往言論被指不妥

小熊侃史
2026-02-28 15:42:23
A股:行情十分異常,大幅放量下跌!做好準(zhǔn)備,新一輪大漲開(kāi)啟?

A股:行情十分異常,大幅放量下跌!做好準(zhǔn)備,新一輪大漲開(kāi)啟?

虎哥閑聊
2026-03-02 11:36:36
王石不再裝了!丟棄假發(fā)套反更顯年輕,現(xiàn)身香港聚會(huì)仍位居C位!

王石不再裝了!丟棄假發(fā)套反更顯年輕,現(xiàn)身香港聚會(huì)仍位居C位!

娛樂(lè)團(tuán)長(zhǎng)
2026-03-01 20:02:05
媒體人:不了解楊瀚森場(chǎng)下訓(xùn)練情況,但英語(yǔ)進(jìn)步速度讓人憂慮

媒體人:不了解楊瀚森場(chǎng)下訓(xùn)練情況,但英語(yǔ)進(jìn)步速度讓人憂慮

懂球帝
2026-03-02 13:29:16
逃離三亞大潰??!一萬(wàn)四天價(jià)機(jī)票逼瘋打工人,中產(chǎn)游客已窮哭

逃離三亞大潰?。∫蝗f(wàn)四天價(jià)機(jī)票逼瘋打工人,中產(chǎn)游客已窮哭

烈史
2026-02-26 14:51:59
令人擔(dān)心的事發(fā)生,多位明星全家被困中東,甄子丹的話,有人信了

令人擔(dān)心的事發(fā)生,多位明星全家被困中東,甄子丹的話,有人信了

墨印齋
2026-03-02 13:44:53
伊朗為什么不學(xué)澤連斯基給民眾發(fā)槍?

伊朗為什么不學(xué)澤連斯基給民眾發(fā)槍?

昊軒看世界
2026-03-01 11:02:14
如今黃河已成懸河,為啥不讓挖泥船把泥沙清走,讓黃河整體下移?

如今黃河已成懸河,為啥不讓挖泥船把泥沙清走,讓黃河整體下移?

天下十三洲獵奇
2026-03-01 00:21:41
2026-03-02 19:51:00
機(jī)器人大講堂 incentive-icons
機(jī)器人大講堂
立德機(jī)器人平臺(tái),是一個(gè)集媒體品牌、智庫(kù)咨詢、投資孵化、引智招商為一體的機(jī)器人垂直領(lǐng)域服務(wù)平臺(tái)
6315文章數(shù) 4577關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

美記者詢問(wèn)就伊朗局勢(shì)中方會(huì)采取什么行動(dòng) 外交部回應(yīng)

頭條要聞

美記者詢問(wèn)就伊朗局勢(shì)中方會(huì)采取什么行動(dòng) 外交部回應(yīng)

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對(duì)手主帥

娛樂(lè)要聞

美伊以沖突爆發(fā),多位明星被困中東

財(cái)經(jīng)要聞

金銀大漲 市場(chǎng)仍在評(píng)估沖突會(huì)否長(zhǎng)期化

汽車要聞

國(guó)民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

房產(chǎn)
家居
本地
公開(kāi)課
軍事航空

房產(chǎn)要聞

方案突然曝光!??诒睅煷蟾叫#钟袝?shū)包大盤殺出!

家居要聞

萬(wàn)物互聯(lián) 享科技福祉

本地新聞

津南好·四時(shí)總相宜

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美軍動(dòng)用新型武器:山寨伊朗的

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版