国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

機器人的手終于跟上腦子了?騰訊系創(chuàng)企推出端到端VLA模型

0
分享至


機器人前瞻(公眾號:robot_pro)
作者 許麗思
編輯 漠影

機器人前瞻12月11日報道,今天,星塵智能發(fā)布端到端全身VLA模型——Lumo-1,讓機器人心手合一,想清楚就干活,借助具身化VLM、跨本體聯(lián)合訓(xùn)練、推理-動作真機訓(xùn)練、以及強化學(xué)習(xí)校準(zhǔn)對齊等方式,配合繩驅(qū)機器人S1的真機訓(xùn)練,將大模型“心智”轉(zhuǎn)化為全身到手的絲滑操作。

Lumo-1展現(xiàn)出較強的操作智能與泛化能力,在多步驟長時序、精細(xì)靈巧操作、可泛化抓取放置等三大類核心操作任務(wù)中,超越了π0、π0.5等先進模型,尤其在未見過的物體、場景和指令等分布外情況(Out of Distribution,簡稱OOD),以及抽象、模糊、需擴展推理的指令中,優(yōu)勢明顯。


▲通用抓取放置測試結(jié)果


▲長時序與靈巧操作任務(wù)對比結(jié)果

一、熱面包、整理文具、打包食物,讓機器人像人一樣推理、行動

人類執(zhí)行復(fù)雜任務(wù)時不只是調(diào)用“動作庫”,而是實時進行多層次推理——理解抽象語義、拆解子任務(wù)、感知空間關(guān)系、規(guī)劃運動路徑。

從走路、跳舞到后空翻,動作模仿教會了機器人“怎么動”,而到端盤子、分揀水果、熱食物等復(fù)雜操作時,機器人不能只模仿,更要識別復(fù)雜環(huán)境,理解“為什么做”的任務(wù)意圖,再轉(zhuǎn)化為“動手這么做”的連貫操作。

Lumo-1就賦予了機器人像人一樣推理,從而像人一樣行動的能力。

比如,盡管沒見過這塊面包,Lumo-1可以讓機器人通過推理識別它,推理出加熱=用微波爐,以及開門、拿起、放入、關(guān)門、旋鈕、等待、取出等……無需編程,長序列全靠推理完成。


機器人可以在混亂桌面中快速找齊文具,還能精細(xì)處理不同形狀、材質(zhì)和尺寸的物品。


在執(zhí)行把可樂放進藍(lán)盤的任務(wù)時,當(dāng)可樂靠近機器人左臂時,推理用左臂抓??;當(dāng)人為在左臂與可樂間增加障礙物(未訓(xùn)練場景),實時推理出“左臂受阻→右臂繞行成本更低”,自主切換策略。


機器人在給玩偶配對時,能推理出不同玩偶(雪寶、米妮、三眼怪)與紙片上哪個角色(艾爾莎、米奇、巴斯光年)來自同一動畫。


打包食物時,機器人全程快速絲滑,面對奧利奧、油條等分布外物體也能執(zhí)行。


在紙上機器人報個菜名,比如“腸仔意面”,它就能識別并挑選出對應(yīng)食材。


二、三階訓(xùn)練,VLM認(rèn)知轉(zhuǎn)化為VLA智能

Lumo-1包括了三階段訓(xùn)練架構(gòu):

階段1:具身化VLM(Embodied VLM)

在精選的視覺-語言數(shù)據(jù)上持續(xù)預(yù)訓(xùn)練,讓模型具備空間理解、規(guī)劃、軌跡推斷等“具身語義”。Lumo-1在7個經(jīng)典具身推理基準(zhǔn)中大部分超過RoboBrain-7B、Robix-7B等專用模型。


▲精選數(shù)據(jù)集旨在不損傷預(yù)訓(xùn)練VLM的通用多模態(tài)理解與推理能力前提下,強化核心具身推理能力

階段2:跨本體聯(lián)合訓(xùn)練

融合跨機器人、多視角軌跡、VLM數(shù)據(jù)上聯(lián)合訓(xùn)練,強化了指令跟隨、物體定位與空間推理能力,使模型開始理解“動作是什么,與指令和觀測是什么關(guān)系”。


▲Astribot S1機器人上收集的樣本任務(wù)

階段3:真機推理-動作訓(xùn)練(S1軌跡)

利用繩驅(qū)機器人Astribot S1高度仿人的示教軌跡,進行帶推理過程的動作訓(xùn)練,讓模型習(xí)得真實世界可執(zhí)行的動作模式,比如:怎么用雙手協(xié)同處理物體、如何執(zhí)行長序列操作、如何將推理一步步落實為軌跡等。

最后,加入強化學(xué)習(xí)推理-行動對齊(RL Alignment),校準(zhǔn)對齊高級推理與低級動作之間的誤差,設(shè)計了視覺、動作與推理一致、動作執(zhí)行、推理格式等多維度的獎勵信號,通過基于GRPO的學(xué)習(xí)方案鼓勵模型選擇更準(zhǔn)確、連貫、符合物理規(guī)則的動作。

實驗表明,該方案使模型在任務(wù)成功率、動作合理性與泛化能力上顯著超越模仿專家示范的原始表現(xiàn)。

三、三大技術(shù)拆解:層層遞進的“推理-動作”引擎

1、動作空間建模:從”高頻噪聲”到”關(guān)鍵路徑”

在Lumo-1里,通過動作空間建模SAT(Spatial Action Tokenizer),機器人將動作軌跡轉(zhuǎn)化為可復(fù)用、組合的“動作單詞庫”,能像寫句子一樣組合動作,或者復(fù)用、解釋和預(yù)測動作。

技術(shù)上,SAT將連續(xù)動作軌跡壓縮成最短路徑點,并把旋轉(zhuǎn)/平移的增量動作聚類成緊湊token等,在保持動作空間意義時,減少數(shù)據(jù)收集引入的無關(guān)噪音,比FAST與分桶方法等更緊湊和穩(wěn)定。

2、結(jié)構(gòu)化推理:讓機器人擁有“常識與思考能力”

Lumo-1將推理拆解為兩個維度:文字推理與視覺推理。

模型進行多種形式的具身文本推理:

  • 抽象概念推理整合視覺觀測和指令以推斷隱含語義(”低熱量”→排除可樂);
  • 子任務(wù)推理旨在推斷到達(dá)最終目標(biāo)的最優(yōu)中間步驟(微波爐加熱→開門→取物→放入→關(guān)門→旋鈕→取出);
  • 視覺觀測描述強調(diào)對顯著場景特征和可操作物體的準(zhǔn)確識別和分析;
  • 運動推理包括對夾爪空間關(guān)系的文字推斷,以及運動方向的闡述。

然后再進一步執(zhí)行視覺推理,以實現(xiàn)基于感知的推斷和運動估計。

通過結(jié)構(gòu)化推理(Structured Reasoning),機器人大腦不再死記軌跡,而是形成解釋動作的結(jié)構(gòu)化推理鏈,從執(zhí)行動作到「執(zhí)行想法」,使「為什么這樣做」先于「怎么做」。

最終,它把視覺理解映射為路徑點預(yù)測,讓2D預(yù)測自然落到3D控制上,實現(xiàn)更有目的性、情境化的動作生成。

在S1真機部署中,讓機器人“把代表愛情的花放進花瓶”,S1能理解玫瑰代表的文化隱喻;當(dāng)指令換成”把KFC里的東西放進藍(lán)色容器”,它能推理出炸雞、漢堡等關(guān)聯(lián)物品。在“把畫海洋的工具放進綠盤子”這種任務(wù)中,S1也能準(zhǔn)確找到藍(lán)色的畫筆。


3、強化學(xué)習(xí)推理-行動對齊(RL Alignment)

Lumo-1在最后加入強化學(xué)習(xí)推理-行動對齊(RL Alignment),校準(zhǔn)對齊高級推理與低級動作之間的誤差,在真實軌跡中反饋迭代,通過視覺、動作與推理一致、動作執(zhí)行、推理格式等多維度GRPO風(fēng)格獎勵信號,鼓勵模型選擇更準(zhǔn)確、連貫、符合物理規(guī)則的動作。

四、AI模型能力提升,是機器人大規(guī)模落地的關(guān)鍵

星塵智能團隊采用數(shù)據(jù)受限擴展定律驗證訓(xùn)練策略,結(jié)果顯示:在固定模型規(guī)模下,數(shù)據(jù)多樣性(場景、物體、指令的覆蓋面)對泛化能力的影響遠(yuǎn)超數(shù)據(jù)重復(fù)次數(shù)。這說明了,除了堆數(shù)據(jù)量,也可以抓數(shù)據(jù)質(zhì)量。

另外,Lumo-1在7個多模態(tài)基準(zhǔn)測試中的6個優(yōu)于backbone模型Qwen2.5-VL-7B,并超越專門的具身模型RoboBrain-7B和Robix-7B。更關(guān)鍵的是,融入動作學(xué)習(xí)后,模型的核心多模態(tài)感知和推理能力未受損——這證明“推理”與“動作”并非零和博弈。

目前,AI模型能力不足是導(dǎo)致了機器人沒能真正大規(guī)模落地的關(guān)鍵原因。而當(dāng)機器人不再只靠預(yù)設(shè)腳本,而是能夠在開放環(huán)境中理解語義、拆解任務(wù)并自主執(zhí)行時,具身智能也就加快從“能動”走向“會做事”的新階段。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
官宣:李盈瑩決定回國

官宣:李盈瑩決定回國

極目新聞
2025-12-21 20:40:21
中央安全生產(chǎn)考核巡查組在廣東發(fā)現(xiàn):一幼兒園存多處嚴(yán)重風(fēng)險隱患,鐵柵欄封窗、消防栓不出水

中央安全生產(chǎn)考核巡查組在廣東發(fā)現(xiàn):一幼兒園存多處嚴(yán)重風(fēng)險隱患,鐵柵欄封窗、消防栓不出水

紅星新聞
2025-12-18 19:56:24
內(nèi)地上映第二天,電影《阿凡達(dá)3》票房破2億,觀眾:電影時長太長,看完體驗很不好

內(nèi)地上映第二天,電影《阿凡達(dá)3》票房破2億,觀眾:電影時長太長,看完體驗很不好

臺州交通廣播
2025-12-20 13:51:54
比抑郁更嚴(yán)重的精神心理危機,籠罩著千百萬中國青少年…

比抑郁更嚴(yán)重的精神心理危機,籠罩著千百萬中國青少年…

心理提升課堂
2025-12-21 09:04:21
祖巴茨缺席10場!無緣5大卡位戰(zhàn),詹皇一腳墊掉哈登小卡北伐希望

祖巴茨缺席10場!無緣5大卡位戰(zhàn),詹皇一腳墊掉哈登小卡北伐希望

嘴炮體壇
2025-12-22 12:15:12
曾醫(yī)生號源秒空:是給網(wǎng)上那些滿嘴仁義道德的人一記響亮耳光

曾醫(yī)生號源秒空:是給網(wǎng)上那些滿嘴仁義道德的人一記響亮耳光

詩意世界
2025-12-22 11:28:27
南京博物館:捐贈已歸國家,無義務(wù)返還

南京博物館:捐贈已歸國家,無義務(wù)返還

映射生活的身影
2025-12-19 17:13:17
當(dāng)美國海軍突襲中國貨船時,外界普遍認(rèn)為北京只能默默承受損失。

當(dāng)美國海軍突襲中國貨船時,外界普遍認(rèn)為北京只能默默承受損失。

安安說
2025-12-21 14:41:07
北京工大附中體育老師李想猝死,年僅39歲,生前常健身,滿身肌肉

北京工大附中體育老師李想猝死,年僅39歲,生前常健身,滿身肌肉

180視角
2025-12-22 11:38:11
醫(yī)生多次強調(diào)老人立刻停止食用4種堅果,吃得越多,肺會越差

醫(yī)生多次強調(diào)老人立刻停止食用4種堅果,吃得越多,肺會越差

健康科普365
2025-12-22 09:17:36
日本鬼子說的“八嘎呀路”,翻譯成中文到底是什么意思?

日本鬼子說的“八嘎呀路”,翻譯成中文到底是什么意思?

西樓知趣雜談
2025-12-20 22:00:18
戰(zhàn)友聚會AA制每人交3500元,因兒子高燒39度會沒去成,次日民警上門

戰(zhàn)友聚會AA制每人交3500元,因兒子高燒39度會沒去成,次日民警上門

罪案洞察者
2025-12-16 14:42:51
瑞典,挪威,芬蘭北歐三國地處惡劣寒地,經(jīng)濟實力為何如此強大呢

瑞典,挪威,芬蘭北歐三國地處惡劣寒地,經(jīng)濟實力為何如此強大呢

向航說
2025-12-17 00:05:03
冬至了,地球比夏至距離太陽更近500萬公里,為何反而更冷?

冬至了,地球比夏至距離太陽更近500萬公里,為何反而更冷?

火星一號
2025-12-20 22:53:16
清朝一秀才屢試不第,無奈回鄉(xiāng),卻因一件小事被康熙皇帝御筆親封

清朝一秀才屢試不第,無奈回鄉(xiāng),卻因一件小事被康熙皇帝御筆親封

牛魔王與芭蕉扇
2025-09-23 10:41:21
房子貶值后才想通:那幾百萬不是憑空消失了,是被偷走了...

房子貶值后才想通:那幾百萬不是憑空消失了,是被偷走了...

深度報
2025-12-19 23:14:12
120多萬的卡宴只要60多萬?很多網(wǎng)友激動了!打飛的到海南買進口車,可行嗎?

120多萬的卡宴只要60多萬?很多網(wǎng)友激動了!打飛的到海南買進口車,可行嗎?

都市快報橙柿互動
2025-12-19 18:00:00
萬元羽絨服賣不動了!擠爆專柜的中產(chǎn)標(biāo)配,如今黃牛打折都沒人要

萬元羽絨服賣不動了!擠爆專柜的中產(chǎn)標(biāo)配,如今黃牛打折都沒人要

比利
2025-12-21 16:17:30
“伊斯坎德爾-M”原形畢露,“雌鹿”又遭損失!簡評俄烏空襲斗法

“伊斯坎德爾-M”原形畢露,“雌鹿”又遭損失!簡評俄烏空襲斗法

鷹眼Defence
2025-12-21 18:02:28
少將軍銜處于什么水平?想要成為一名少將,晉升難度究竟有多大?

少將軍銜處于什么水平?想要成為一名少將,晉升難度究竟有多大?

源溯歷史
2025-12-16 21:19:53
2025-12-22 14:47:00
機器人前瞻
機器人前瞻
專注于機器人報道的媒體
270文章數(shù) 5關(guān)注度
往期回顧 全部

科技要聞

商湯聯(lián)創(chuàng)親自下場 痛批主流機器人技術(shù)大錯

頭條要聞

上海女子"喊冤"汽車壓上石頭爆胎無人賠償 網(wǎng)友吵翻了

頭條要聞

上海女子"喊冤"汽車壓上石頭爆胎無人賠償 網(wǎng)友吵翻了

體育要聞

戴琳,中國足球的反向代言人

娛樂要聞

星光大賞看點全在臺下

財經(jīng)要聞

人民幣快漲到7了!

汽車要聞

可享88元抵2000元等多重權(quán)益 昊鉑A800開啟盲訂

態(tài)度原創(chuàng)

游戲
本地
家居
數(shù)碼
公開課

當(dāng)年火遍網(wǎng)吧的國產(chǎn)游戲,如今又“霸占”網(wǎng)吧來給玩家開黑

本地新聞

云游安徽|走進銅陵,照見三千年不滅的爐火

家居要聞

現(xiàn)代手法 詮釋東方文化

數(shù)碼要聞

OPPO Pad Air5預(yù)熱:12.1寸2.8K超清柔光屏,12月25日發(fā)布

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版