国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

VLA不夠了?觸覺,將改寫具身智能新格局

0
分享至



機器之心發(fā)布

2026 年,「數(shù)據(jù)」正成為具身智能競賽的新焦點,京東、百度等科技巨頭紛紛入局。然而,喧囂之中,一個根本問題懸而未決:什么樣的數(shù)據(jù),才是具身智能真正需要的?

近日,全球最大的工程與應(yīng)用科學(xué)專業(yè)組織 IEEE(電氣電子工程師學(xué)會)旗下的旗艦出版物 IEEE Spectrum,對機器人學(xué)家王煜進行了一次深度專訪。

這位深耕機器人領(lǐng)域近 40 年的學(xué)者給出了自己的判斷:當前主流的 VLA(視覺 - 語言 - 動作)架構(gòu)不足以支撐機器人真正走向落地,包含物理交互信息的數(shù)據(jù),才是機器人理解現(xiàn)實世界、實現(xiàn)穩(wěn)定操作的關(guān)鍵所在。



  • 訪談鏈接:https://spectrum.ieee.org/daimon-robotics-physical-ai
  • 原文作者:Sujeet Dutta,Wiley 科學(xué)與工程部高級編輯

上世紀80年代,作為中國首批公派留學(xué)生,王煜進入卡內(nèi)基梅隆大學(xué)機器人研究所,成為時任所長的 Matt Mason 教授招收的第一位博士生,專攻機器人抓取力學(xué)與操作規(guī)劃——這正是當下具身智能操作能力的學(xué)術(shù)源頭。他曾在多所院校任教,與李澤湘共同創(chuàng)辦香港科技大學(xué)機器人研究院,培養(yǎng)了大批活躍于今日產(chǎn)業(yè)一線的人才。

王煜被斯坦福大學(xué)評為全球前 2% 頂尖科學(xué)家,并作為 IEEE 機器人與自動化協(xié)會管理委員會唯一代表中國機構(gòu)的學(xué)者,持續(xù)在國際具身智能領(lǐng)域傳遞中國聲音。

從液壓到電動、從工業(yè)到生活場景,再到如今的人工智能時代,王煜經(jīng)歷了現(xiàn)代機器人學(xué)的每一次范式轉(zhuǎn)換。因此,他對當下狂熱中的思考格外值得傾聽。

在王煜看來,機器人下一個亟待解鎖的能力是「操作」(manipulation),且時機日臻成熟。

如今機器人能完成驚艷的 demo,卻仍難以在真實環(huán)境中自主感知、決策并穩(wěn)定執(zhí)行操作,根本原因在于對視覺的過度依賴—— 當機器人嘗試拿起一只玻璃杯、采摘一顆草莓、插拔一根電線時,視覺只能告訴它「物體在哪兒」,卻無法告知它力度是否恰當、角度是否到位、操作是否完成。

材質(zhì)、摩擦、接觸力、形變,這些決定操作成敗的物理反饋信息,恰恰是視覺的盲區(qū),也是機器人操作中長期缺失的一環(huán)。

王煜認為,觸覺是打開這扇大門的鑰匙。觸覺包含了接觸力、接觸狀態(tài)、形變、紋理與材質(zhì)等信息,能夠填補視覺的盲區(qū)與錯覺,讓機器人從「識別物體」走向「理解物體、操控物體」。

基于這一判斷,他與團隊提出了 VTLA(視覺 - 觸覺 - 語言 - 動作)框架,在主流 VLA 架構(gòu)中引入觸覺,將其視作與視覺同等重要的感知模態(tài)。



王煜教授

這些主張并未停留在論文里。幾年前,王煜與博士后段江嘩共同創(chuàng)立「戴盟機器人」,將多年積累的觸覺感知研究推向工程化落地。這家公司過去以含觸覺感知的硬件研發(fā)為聞名,2026 年第一季度的營收已超過去年全年。

上個月,戴盟正式發(fā)布含觸覺模態(tài)的物理世界具身數(shù)據(jù)集 Daimon Infinity,并開源其中 10000 小時數(shù)據(jù),正式入場眼下最熱的具身數(shù)據(jù)賽道。

一位以「操作」為研究命題的學(xué)者,為何在此刻選擇加入數(shù)據(jù)之爭?這背后的判斷,或許能讓我們窺見未來幾年的具身智能走向。

在這次專訪中,王煜系統(tǒng)闡釋了他對機器人操作、觸覺感知、具身數(shù)據(jù)與物理 AI 的思考:為什么 VLA 架構(gòu)會遭遇瓶頸?觸覺數(shù)據(jù)為何被長期忽視,又為何不可或缺?所謂「物理智能」究竟意味著什么?作為一位見證了機器人學(xué)半個世紀發(fā)展的研究者,他如何看待人形機器人未來的可能性與邊界?

以下為 IEEE Spectrum 專訪王煜的譯文,出于篇幅考慮略有刪減:

提問:今年 4 月,戴盟機器人聯(lián)合多家頭部學(xué)術(shù)機構(gòu)和企業(yè),共同發(fā)布規(guī)模最大、最全面的具身操作數(shù)據(jù)集。為何選擇現(xiàn)在發(fā)布數(shù)據(jù)集,而不是繼續(xù)專注硬件開發(fā)?

王煜:隨著具身智能的發(fā)展,越來越多人意識到數(shù)據(jù)的重要性:數(shù)據(jù)不足是目前具身智能發(fā)展的瓶頸,尤其是包含物理交互信息的數(shù)據(jù),這將是提升機器人在現(xiàn)實世界操作能力的關(guān)鍵。

數(shù)據(jù)的質(zhì)量、可靠性和成本,已成為研發(fā)和商業(yè)落地需要重點關(guān)注的問題。

這恰好也是戴盟擅長的事。依托領(lǐng)先的視觸覺技術(shù),我們能夠提供含多模態(tài)觸覺的高質(zhì)量數(shù)據(jù) ——不僅包含接觸力,還有接觸形變、接觸狀態(tài)、滑移摩擦、物體材質(zhì)與紋理等信息,完整還原物理交互的過程?;谶^往的技術(shù)積累,我們也研發(fā)了數(shù)據(jù)處理管線,將觸覺與視覺、動作軌跡、語音文本等模態(tài)精準融合,轉(zhuǎn)化為模型訓(xùn)練可用的數(shù)據(jù)。

面對行業(yè)的數(shù)據(jù)空缺,我想采集數(shù)據(jù)是我們戴盟能做好、也應(yīng)該做的事情。



今年 4 月,戴盟發(fā)布含觸覺全模態(tài)物理世界數(shù)據(jù)集 Daimon-Infinity

提問:戴盟聲稱數(shù)據(jù)集年底能達到超百萬小時規(guī)模,你們是如何做到這一點的?

王煜:我們打造了全球最大規(guī)模的外發(fā)式具身數(shù)據(jù)采集網(wǎng)絡(luò)—— 依托于輕便化設(shè)備,數(shù)據(jù)采集不再局限于數(shù)采場,而是可以進入各類真實場景,不受空間限制,實現(xiàn)了低成本、跨場景、高度真實性的采集,從而具備了每年數(shù)百萬小時數(shù)據(jù)的生產(chǎn)能力。

提問:Daimon-Infinity 由多家機構(gòu)聯(lián)合發(fā)布,他們?nèi)绾螀⑴c其中?

王煜:此次數(shù)據(jù)集,我們聯(lián)合了全球數(shù)十家機構(gòu)合作共建,包括北京大學(xué)、清華大學(xué)、香港科技大學(xué)等中國高校,以及 DeepMind、美國西北大學(xué)、新加坡國立大學(xué)等全球頂尖研究團隊,另外還有中國移動、匯川技術(shù)、上聲電子等產(chǎn)業(yè)方。他們選擇與戴盟合作,是對我們將觸覺加入具身數(shù)據(jù)這一路線的認可。

通過在科研、制造等實際場景下進行采集,這些合作方幫助我們收集到了高度真實、以實際場景為驅(qū)動的數(shù)據(jù);反過來,他們將這些數(shù)據(jù)用于自己的模型訓(xùn)練。此外,我們開源了 10000 小時數(shù)據(jù),希望含觸覺的數(shù)據(jù)能推動更多具身模型的進化。

提問:目前機器人領(lǐng)域的主流范式是 VLA 模型,但戴盟團隊提出了 VTLA 框架。為什么加入了觸覺?

王煜:觸覺信息對于機器人的操作能力至關(guān)重要,它能提供與物體接觸時的物理反饋, 引導(dǎo)機器人手進行可靠的操作。如果沒有觸覺,機器人可能無法在黑暗環(huán)境中判斷物體的位置,可能因無法感知滑移狀態(tài)而導(dǎo)致玻璃杯掉落,更有可能因為無法控制力度而導(dǎo)致操作任務(wù)失敗,甚至造成損害。

VLA 已經(jīng)不足以滿足機器人操作的需求,因此我們擴展了框架,納入觸覺數(shù)據(jù),創(chuàng)建了 VTLA。

重要的是,我們采用的視觸覺感知技術(shù),與 VLA 所基于的視覺框架非常契合。它捕捉指尖表面的形變,將觸覺信息轉(zhuǎn)化為視覺圖像,并從中推斷出力和其他接觸狀態(tài) —— 而圖像數(shù)據(jù)天然適合集成到 VLA 中,這降低了框架擴展的門檻。



搭載視觸覺傳感器的夾爪,通過精準感知觸覺,賦能精細操作

提問:您和團隊開發(fā)了世界上首個單色光視觸覺技術(shù),為什么選擇了這條技術(shù)路線?

王煜:從開始研究觸覺感知時,我們就明確了自身需求:我們想要的是能夠高度模擬人類指尖皮膚觸覺的傳感器。

生理學(xué)研究已充分證實人類指尖所具備的能力 —— 知道我們觸摸了什么、是什么材質(zhì)、力如何分布,以及當大腦控制手時,它是否移動到正確的位置。我們知道,在機器人手上復(fù)制這些能力將大有裨益。

在調(diào)研現(xiàn)有技術(shù)時,我們發(fā)現(xiàn)了多種類型的觸覺感知技術(shù),包括三色光視觸覺傳感及其他更簡單的設(shè)計。我們將這些技術(shù)的優(yōu)勢整合到一個解決方案中,使其在保持良好性能的同時又不會過于復(fù)雜,并將成本、可靠性和靈敏度控制在令人滿意的范圍內(nèi),最終研發(fā)了單色光視觸覺技術(shù)。隨著人們對觸覺認知的日益加深,這些技術(shù)將攜手并進。



全模態(tài)觸覺信息,包含力 / 力矩、形狀、材質(zhì)、接觸信息四大維度

提問:你們的視觸覺傳感器正是基于這一技術(shù),相比傳統(tǒng)觸覺傳感器有什么核心優(yōu)勢?

王煜:我們在去年推出了全球首個多維高分辨率高頻率視觸覺傳感器,在指尖大小的模塊上裝載了 11 萬個感知單元,是業(yè)內(nèi)目前最高的密度。

另一個優(yōu)勢是頻率和帶寬,即我們檢測觸覺變化、傳輸并實時處理信號的速度。其他方面則主要與工程技術(shù)相關(guān),如可靠性、漂移、硅膠表面耐用性及對電磁、光學(xué)及其他環(huán)境因素的抗干擾能力。

觸覺的重要性正被越來越多人意識到,我們的視觸覺傳感器也得到了更多人的使用,我相信這會讓整個行業(yè)都邁上一個新臺階。

我們的一位潛在客戶正在便利店中部署人形機器人,在密密麻麻的貨架上,機器人需要伸入非常狹小的空間才能取出物品 —— 人類至少需要三根纖細的手指才能完成抓取任務(wù)。諸如此類的場景,我們看到了對于觸覺的非常具體的需求。



戴盟視觸覺傳感器具有高感知單元密度

提問:戴盟目前的商業(yè)模式和戰(zhàn)略重點是什么?數(shù)據(jù)集在其中是什么角色?

王煜:我們最初專注于制造高性能的觸覺感知設(shè)備,尤其是搭載于機器人手的傳感器。但隨著具身智能的發(fā)展,大家逐漸意識到,行業(yè)需要不僅僅是一個組件,而是整個技術(shù)鏈:設(shè)備、大規(guī)模高質(zhì)量的數(shù)據(jù),以及最終能夠在實際應(yīng)用環(huán)境中構(gòu)建、訓(xùn)練和部署機器人模型的框架。

現(xiàn)在,我們將自己的商業(yè)戰(zhàn)略定位為「3D」:設(shè)備(Devices)、數(shù)據(jù)(Data)和部署(Deployment)。我們研發(fā)用于數(shù)據(jù)采集和構(gòu)建觸覺生態(tài)的設(shè)備,并通過在合作伙伴的應(yīng)用場景里部署,完成含觸覺數(shù)據(jù)的落地與閉環(huán)驗證。在這個模式里,任何一環(huán)都不可或缺。

提問:您之前提出了「具身技能」的概念,認為這是人形機器人超越「僅擁有先進人工智能大腦」的關(guān)鍵。您為什么會提出這一觀點?過去兩年行業(yè)快速發(fā)展,您對具身技能的定義是否有所改變?

王煜:機器人的發(fā)展一路走來,如今已到了電氣、電子和機電一體化硬件技術(shù)融合的階段,這是過去 20 年里取得的巨大進步。由于硬件的快速發(fā)展,機器人現(xiàn)在完全是電動的,不再需要液壓系統(tǒng)。現(xiàn)代電子技術(shù)提供了高帶寬和高扭矩,如果我們能將智能融入這些機械系統(tǒng),就能創(chuàng)造出真正意義上的人形機器人 —— 能夠在非結(jié)構(gòu)化環(huán)境中運行、決策并自主穩(wěn)定地執(zhí)行操作的機器人。

人工智能的出現(xiàn)恰逢其時,大量資源投入其中,特別是大語言模型。它們?nèi)缃癖煌茝V到世界模型中,賦能物理智能(physical AI)—— 我們希望這些能力最終能在現(xiàn)實世界中落地。如今研究重點更加明確,例如在家庭環(huán)境中,人們更傾向于使用人形機器人。這是一個令人興奮的領(lǐng)域,如果我們最終能夠制造出安全、可靠且經(jīng)濟高效的機器人,它將為社會帶來巨大的益處。



搭載了戴盟觸覺感知技術(shù)的機器人在工廠線上部署

提問:機器人如今能進行令人印象深刻的 demo,但距離真正進入實際應(yīng)用仍存在差距。什么因素可能觸發(fā)實際部署?哪些場景最有可能率先實現(xiàn)大規(guī)模部署?

王煜:我認為通用機器人的大規(guī)模部署之路仍然漫長,但我們已經(jīng)看到特定領(lǐng)域的可行性。

這與自動駕駛汽車非常相似,無人駕駛出租車尚未全面部署,但移動機器人在酒店業(yè)已經(jīng)得到廣泛應(yīng)用。在中國,幾乎所有大型酒店都配備了送餐機器人 —— 沒有機械臂,只是一臺從酒店大堂取外賣的小型機器人。外賣員只需放置食物并選擇房間號,機器人便會自行導(dǎo)航、自行使用電梯,最終將食物送達客房。

酒店及餐廳的機器人,為其他場景的應(yīng)用提供了范本,例如夜間藥店和便利店。我預(yù)計在短期內(nèi),這些場所將全面部署人形機器人,并在之后擴展到其他領(lǐng)域。我們可以期待,在未來,包括人形機器人在內(nèi)的自主機器人將逐步滲透到特定行業(yè),為行業(yè)創(chuàng)造價值。

我們的愿景始終是讓機器人實現(xiàn)強大的操控能力,并發(fā)展成為人類可靠的合作伙伴。未來,機器人或許會無縫融入我們的日常生活,真正造福并服務(wù)于人類。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
以色列前總理貝內(nèi)特:伊朗實質(zhì)上已經(jīng)向該地區(qū)再次宣戰(zhàn)

以色列前總理貝內(nèi)特:伊朗實質(zhì)上已經(jīng)向該地區(qū)再次宣戰(zhàn)

一種觀點
2026-05-05 19:24:58
1-2出局 35歲悲情巨星遺憾揮別!闖蕩17年 歐冠0冠 西甲0冠

1-2出局 35歲悲情巨星遺憾揮別!闖蕩17年 歐冠0冠 西甲0冠

葉青足球世界
2026-05-06 07:54:58
偉偉道來 | 伊朗的反應(yīng)為何如此激烈

偉偉道來 | 伊朗的反應(yīng)為何如此激烈

經(jīng)濟觀察報
2026-05-06 11:40:46
吳宜澤透露拿到獎金后準備在英國買房,50萬英鎊獎金需交稅超23萬鎊,實際到手約26.5萬鎊

吳宜澤透露拿到獎金后準備在英國買房,50萬英鎊獎金需交稅超23萬鎊,實際到手約26.5萬鎊

大風新聞
2026-05-06 11:53:02
定了!斯諾克巨星邀請賽5月9日開桿,吳宜澤領(lǐng)銜,6世界冠軍出戰(zhàn)

定了!斯諾克巨星邀請賽5月9日開桿,吳宜澤領(lǐng)銜,6世界冠軍出戰(zhàn)

劉姚堯的文字城堡
2026-05-06 08:31:36
女性跑步:暴露這個隱私,是性感嗎?

女性跑步:暴露這個隱私,是性感嗎?

馬拉松跑步健身
2026-05-05 19:18:07
吳宜澤社媒回復(fù)趙心童、丁俊暉:一起加油,永遠的大哥

吳宜澤社媒回復(fù)趙心童、丁俊暉:一起加油,永遠的大哥

懂球帝
2026-05-05 19:39:09
在中國人民公安大學(xué),穿了四年警服,畢業(yè)五年后,我們宿舍四個人,沒一個在出現(xiàn)場

在中國人民公安大學(xué),穿了四年警服,畢業(yè)五年后,我們宿舍四個人,沒一個在出現(xiàn)場

侃故事的阿慶
2026-05-06 09:21:32
被延長的搶救時間,被卡住的工傷認定

被延長的搶救時間,被卡住的工傷認定

新京報
2026-05-06 11:03:07
51歲女子包養(yǎng)24歲男孩,嫌男孩不行被殺,2014年男孩說她索取無度

51歲女子包養(yǎng)24歲男孩,嫌男孩不行被殺,2014年男孩說她索取無度

漢史趣聞
2026-05-05 11:40:36
世錦賽慶功宴!新科冠軍吳宜澤休閑裝亮相 網(wǎng)友:艾倫不來,誰敢動筷子

世錦賽慶功宴!新科冠軍吳宜澤休閑裝亮相 網(wǎng)友:艾倫不來,誰敢動筷子

畫夕
2026-05-05 14:38:17
廣州第一爛尾樓 兩千家庭半生遺憾!

廣州第一爛尾樓 兩千家庭半生遺憾!

說故事的阿襲
2026-05-05 20:20:30
8.84億的美國工廠說關(guān)就關(guān)?曹德旺:美國不講理,我就不陪玩了

8.84億的美國工廠說關(guān)就關(guān)?曹德旺:美國不講理,我就不陪玩了

番外行
2026-05-06 10:29:59
伯納烏大地震!皇馬放話出售姆巴佩,天價報價就接

伯納烏大地震!皇馬放話出售姆巴佩,天價報價就接

奶蓋熊本熊
2026-05-06 00:00:36
《陳翔六點半》人走茶涼,賺不到錢球球退出,根本原因早就注定了

《陳翔六點半》人走茶涼,賺不到錢球球退出,根本原因早就注定了

汪巗的創(chuàng)業(yè)之路
2026-05-06 12:26:17
47歲高圓圓在公園被抓拍,麒麟臂、涼拖鞋,活脫脫一個買菜大姐

47歲高圓圓在公園被抓拍,麒麟臂、涼拖鞋,活脫脫一個買菜大姐

胖松松與瘦二毛
2026-05-06 12:40:53
張亮兒子17歲當?shù)耍。?>
    </a>
        <h3>
      <a href=八卦瘋叔
2026-05-06 11:04:32
連線四川華鎣女游客玩秋千身亡目擊者:其撞到瀑布凸出處大石

連線四川華鎣女游客玩秋千身亡目擊者:其撞到瀑布凸出處大石

南方都市報
2026-05-06 12:38:05
中美同時向全球下達禁令,各國都傻眼了!美媒:中國此舉史無前例

中美同時向全球下達禁令,各國都傻眼了!美媒:中國此舉史無前例

福建睿平
2026-05-06 08:56:38
男子和妻子的弟媳纏綿,怕妻子聽到聲音,2017年弟媳竟被他捂死了

男子和妻子的弟媳纏綿,怕妻子聽到聲音,2017年弟媳竟被他捂死了

漢史趣聞
2026-05-05 11:36:31
2026-05-06 14:55:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12925文章數(shù) 142643關(guān)注度
往期回顧 全部

科技要聞

“馬斯克不懂AI”:OpenAI當庭戳老底

頭條要聞

男子購百萬保險被邀免費游老撾 花數(shù)十萬買"熊膽"心虛

頭條要聞

男子購百萬保險被邀免費游老撾 花數(shù)十萬買"熊膽"心虛

體育要聞

活塞1比0騎士:坎寧安不再是一個人了

娛樂要聞

神仙友誼!楊紫連續(xù)10年為張一山慶生

財經(jīng)要聞

人形機器人七小龍:誰真能賣 誰在講故事?

汽車要聞

領(lǐng)克10/領(lǐng)克10+ 無論能源形式 領(lǐng)克都要快樂

態(tài)度原創(chuàng)

藝術(shù)
健康
房產(chǎn)
數(shù)碼
教育

藝術(shù)要聞

震撼!康斯坦丁攝影作品里的性感曲線讓人驚艷!

干細胞治燒燙傷面臨這些“瓶頸”

房產(chǎn)要聞

五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

數(shù)碼要聞

七彩虹戰(zhàn)斧B860M超級黑刃主板圖賞:899元的“千元旗艦”

教育要聞

六條邏輯主線替代四個大概念,反映了怎樣的理念? | 高中課標修訂解讀⑥

無障礙瀏覽 進入關(guān)懷版