国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

模型、數(shù)據(jù)、落地之爭:具身智能來到“破曉”時刻

0
分享至



文|魏琳華

編|王一粟

“具身智能,究竟發(fā)展到了哪個節(jié)點?”對于這個火爆但早期的產(chǎn)業(yè),不少人都有這個疑問。

一方面,是資本用真金白銀投出的繁盛。據(jù)不完全統(tǒng)計,中國具身智能相關企業(yè)數(shù)量已接近百萬家。今年下半年,包括宇樹科技、智元機器人在內(nèi)的多家公司拿到過億融資、頭部企業(yè)籌劃上市。熱錢涌動,創(chuàng)業(yè)者云集,仿佛下一個萬億級產(chǎn)業(yè)的黎明已然到來。

而另一方面,卻是大量籠罩在行業(yè)上空懸而未決的陰霾,具身智能行業(yè)充滿了基礎性的路線之爭。

“具身智能目前來看有三座大山:第一,數(shù)據(jù)稀缺性。第二,數(shù)據(jù)泛化性。第三,產(chǎn)品落地?!比A為云中國區(qū)云原生企業(yè)業(yè)務部部長李鵬程說。


華為云中國區(qū)云原生企業(yè)業(yè)務部部長李鵬程

深入到產(chǎn)業(yè)腹地,不難發(fā)現(xiàn),下階段無論是模型路線、數(shù)據(jù)策略還是落地效果,整個行業(yè)都遠未形成共識。參與者們仿佛站在一個巨大的十字路口,行業(yè)正在“兩條腿走路”,在未確定范式之前,朝著不同的方向先展開探索。

從模型上來說,行業(yè)的討論主要聚焦在VLA、世界模型等不同架構上,目前使用VLA存在的問題是,它的泛化性有限,難以解決跨本體、跨任務的情況;從數(shù)據(jù)上來說,是使用真機數(shù)據(jù)還是合成數(shù)據(jù)為主,兩條路線各有優(yōu)劣勢,而沒有人確認哪條路徑更優(yōu)。

在不確定的路徑中,具身智能行業(yè)的玩家們正在通過不同路線的探索,合力向著“智能”的方向前進。

11月14日,由華為云主辦的《具身智能產(chǎn)業(yè)實踐高峰論壇》上,來自學術、產(chǎn)業(yè)、企業(yè)界的嘉賓共同探討具身智能行業(yè)的發(fā)展和實踐經(jīng)驗。

模型路線之爭:從VLA到世界模型

“具身智能目前還處在非常初級的階段?!痹跁h現(xiàn)場,多位嘉賓給出了相同的判斷。

“現(xiàn)在到處都是問題,不管是機器人本體、可靠性、核心零部件成本、性能,到軟件、大腦、小腦,或者大小腦本身是一個不明確的定義,這些都是要攻克的問題。”提到具身智能當前發(fā)展的情況,華為云物理智能創(chuàng)新實驗室負責人周順波說。

其中,模型架構和數(shù)據(jù)來源,成為頻頻提起的兩個問題。

極佳科技合伙人、副總裁毛繼明指出,目前最大的瓶頸在于“通用模型”本身不夠通用。


極佳科技合伙人、副總裁毛繼明

行業(yè)所面臨的,是具身智能的第一重,也是最根本的挑戰(zhàn):如何讓模型跨越從“認知”到“物理”的鴻溝,真正獲得人類與生俱來的通識能力。

當數(shù)據(jù)來源塵埃未定,通往智能巔峰的模型路徑是一片迷霧。目前,VLA(視覺-語言-動作)模型和世界模型(World Model)是兩條最受關注,也最具爭議的技術路線。

VLA模型是當下的主流選擇,它更像一個“翻譯官”,將人類的語言指令直接翻譯成機器人的動作序列。它的優(yōu)勢在于路徑更短,更容易在特定任務上看到效果。



然而在真實使用中, VLA模型遇到了很多問題。華為技術專家表示,目前VLA模型在通用化、自主化操作以及長程精細化操作幾個維度上難以做到兼容和平衡。模型本身對物理世界缺乏深層次的理解和預判能力,這讓它難以解決更多固定場景之外的復雜問題。

首先是數(shù)據(jù)依賴的嚴重性。VLA模型本質(zhì)上仍然是通過大量特定任務的數(shù)據(jù)進行訓練,但這種泛化仍然是建立在海量數(shù)據(jù)訓練基礎上的。當面對一個全新任務時,如果訓練數(shù)據(jù)中缺乏足夠相似的場景,模型很可能無法直接處理。

“現(xiàn)在通用模型這塊確實還很不通用,這種局限性在面對新環(huán)境、新任務時尤為明顯?!币晃患钨e直言不諱:“現(xiàn)在很多demo是挑了最好的給大家看,真正上線用的時候很多工廠良率控制要求很高,但凡只有90%成功率都不行?!?/p>

更關鍵的是架構本身的固有問題。VLA模型需要同時處理視覺輸入、語言理解和動作輸出三個不同模態(tài)的信息,這種復雜性導致計算開銷巨大,推理速度緩慢。

在工廠的實際應用中,機器人需要滿足嚴格的時間節(jié)拍要求,而VLA模型的思考和規(guī)劃周期比較長,往往無法滿足實時性的需求。

面對VLA模型的困境,世界模型路線正在成為一個重要的技術方向。

與VLA不同,世界模型試圖讓機器人建立對物理世界的底層理解,就如同人類基于對世界的通識認知來理解和執(zhí)行任務。它的核心是通過構建機器人對物理規(guī)律、物體屬性、動作結(jié)果的深層理解,解決機器人在跨本體、跨任務場景的泛化能力。

世界模型的另一個重要優(yōu)勢是其在數(shù)據(jù)生成方面的潛力。通過對物理世界的理解,模型可以生成大量高質(zhì)量的合成數(shù)據(jù),這恰好解決了當前機器人訓練數(shù)據(jù)稀缺的問題。

“VLA跟世界模型現(xiàn)在都處在GPT2的時刻,它們還有很大的潛力可以挖,但距離真正的通用型還有比較長的路要走。但是我們覺得這個時間并不會很長,兩年內(nèi)可能就會迎來這樣的時刻?!?/strong>毛繼明說。

真機采集、仿真生成,具身企業(yè)怎么選?

除了模型路線的變化,數(shù)據(jù)問題也成為制約行業(yè)發(fā)展的另一大瓶頸。是使用真機數(shù)據(jù)還是合成數(shù)據(jù)?對于兩條路徑的可能性,多位嘉賓表示,目前還沒有探索出一條確切的路徑。

但不可否認的是,在算法還有待優(yōu)化的現(xiàn)階段,研發(fā)企業(yè)需要真機數(shù)據(jù)驗證算法的準確性。

周順波一針見血地指出了問題所在:“根據(jù)我們的研發(fā)實踐,現(xiàn)在沒有任何一個場景可以用100%合成數(shù)據(jù)完成物理世界的落地。所以真機數(shù)據(jù)確實是很重要的一個數(shù)據(jù)來源?!?/p>

怎么采集真機數(shù)據(jù),也是一門學問。

“我們也踩了很多坑,前期做數(shù)據(jù)標注、數(shù)據(jù)采集的時候很多數(shù)據(jù)是廢掉的。因為讓數(shù)據(jù)標注人員做數(shù)據(jù)采集的時候發(fā)現(xiàn)并沒有一個很好的標準,這個標準是通過不斷優(yōu)化模型,反向做數(shù)據(jù)采集的設計,這樣能夠采集到更高質(zhì)量的數(shù)據(jù),喂給模型,讓模型更泛化?!瘪鰟油ㄓ寐?lián)合創(chuàng)始人兼市場副總裁、訊飛創(chuàng)投投資顧問周甲甲說。


聆動通用聯(lián)合創(chuàng)始人兼市場副總裁、訊飛創(chuàng)投投資顧問 周甲甲

為了解決數(shù)據(jù)標準化和共享問題,一些企業(yè)開始構建數(shù)據(jù)服務平臺,先去確立標準。

周順波介紹了華為云的相關實踐:“構建具身生態(tài)我們在積極推進,但是我覺得更重要的點是現(xiàn)在行業(yè)里面并沒有對于數(shù)據(jù)的認知,不知道應該采集什么樣的數(shù)據(jù),所以需要先建立標準?!?/strong>

他表示,華為云正在構建一套端到端的工具鏈,放在了自家平臺CloudRobo中。該工具鏈不僅可以對接數(shù)采廠、穿戴式數(shù)采,也可以對真機數(shù)據(jù)做數(shù)據(jù)增廣,或者是基于仿真平臺做數(shù)據(jù)合成。

真機數(shù)據(jù)的最大優(yōu)勢是其可信度和真實性。但真機數(shù)據(jù)采集的成本極其高昂,超高質(zhì)量數(shù)據(jù)有限,這成為制約行業(yè)發(fā)展的一大瓶頸。

面對真機數(shù)據(jù)的高成本、質(zhì)量低問題,仿真數(shù)據(jù)也成為當下具身智能企業(yè)嘗試的重點路徑之一。

它不僅具備成本優(yōu)勢,在后期提升泛化性上,起到至關重要的作用:當現(xiàn)有階段的真機數(shù)據(jù)種類、場景范圍覆蓋有限的情況下,使用針對性生成的合成數(shù)據(jù),能夠幫助模型有效提升泛化能力。

毛繼明拋出了一個問題:“真正的通用怎么可能通過采集能夠達到那么大的通用?這是不可能的?!?/p>

也就是說,要讓機器人學會處理一萬種不同的場景,不可能要求企業(yè)真的去采集到對應的所有數(shù)據(jù),唯一的出路,是在世界模型中合成數(shù)據(jù),提供給模型訓練。

不過,相比于真機數(shù)據(jù),仿真數(shù)據(jù)目前的效果有限,實際訓練效果距離真機數(shù)據(jù)還有一定差距。

“合成數(shù)據(jù)可能有上限,尤其現(xiàn)在基于仿真引擎合成數(shù)據(jù)?!敝茼槻ㄕf,“現(xiàn)在剛體的物理仿真可能還行,但是如果上升到流體柔體,其實合成數(shù)據(jù)的性能會被仿真性能給鎖死,這也是大家關注世界模型價值的原因。”

因此,行業(yè)正處在一個“真機”與“合成”混用的階段,真機數(shù)據(jù)是“種子”,用來錨定真實情況,合成數(shù)據(jù)則被用來實現(xiàn)規(guī)?;头夯?。

且根據(jù)不同的場景,真機和仿真數(shù)據(jù)的混合比例也會動態(tài)調(diào)整。毛繼明透露,在“疊衣服”任務上,合成數(shù)據(jù)的最佳比例高達90%;而在“收拾桌子”這種剛體操作上,則是70%左右。

產(chǎn)業(yè)落地:工廠、娛樂場景探索可能性

在模型和數(shù)據(jù)這兩座大山之下,具身智能的產(chǎn)業(yè)化落地,目前還有一段漫長的路要走。

“哪怕只是打螺絲,現(xiàn)在交給機器人還是不太能做得好?!?/strong>一汽模具研發(fā)負責人王瀚霄說。從實際應用的效果來看,當前大多數(shù)機器人系統(tǒng)在工廠環(huán)境中的表現(xiàn)遠未達到商用要求。面對基礎的裝配操作,實際上涉及到復雜的感知、規(guī)劃和控制流程,需要各個層面的技術協(xié)調(diào)配合。

更關鍵的是成功率的嚴格要求。上述嘉賓表示,在現(xiàn)實中,工業(yè)場景要求至少90%的成功率,而目前大多數(shù)系統(tǒng)只能達到10%左右的水平。此外,在操作靈活性和工作效率上,當前機器人表現(xiàn)出的水平也遠未滿足要求。

談及人形機器人產(chǎn)業(yè)化落地條件,也同樣存著大量亟待解決的問題。

北京人形機器人創(chuàng)新中心具身大模型負責人鞠笑竹表示,需要能夠做到四種能力:多本體、多任務協(xié)同工作能力、自主學習能力、跨本體泛化操作能力和全自主導航能力。

“我們要解決真正的問題是,未來1-2年時間之內(nèi),現(xiàn)在采集的數(shù)據(jù)訓練模型能不能高效復用到下一步技術上?跨本體問題不解決,那可能采的數(shù)據(jù)作用都會大打折扣?!本闲χ裾f,“此外,未來機器人進入到場景之后,除了采集數(shù)據(jù)、訓練部署給到廠家之外,還能做到干中學的效果,包括解決當下被人詬病的自主導航能力——機器人后面老有一個遙控器推著?!?/p>



躍入產(chǎn)業(yè)端,企業(yè)需要解決的不單單是技術問題,還存在大量圍繞機器人運行本身需要考慮的供應問題。在這個過程中,產(chǎn)業(yè)端需要一套更加清晰的標準和工具支撐能力。

扎根產(chǎn)業(yè)端,不做機器人本體,只做“賣鏟人”,華為云通過實踐和探索,給出了一套自己的答案:

“基于華為工具鏈平臺,它圍繞著數(shù)據(jù)生產(chǎn)、具身智能模型訓推、評測,是數(shù)據(jù)閉環(huán)的平臺?!敝茼槻ㄕf,“這個閉環(huán)就會涉及到運行態(tài),運行態(tài)會涉及到一些華為傳統(tǒng)的優(yōu)勢,比如多模態(tài)數(shù)據(jù)2D、3D的甚至包括觸覺的,這些數(shù)據(jù)怎么做無損壓縮?以及到底計算是發(fā)生在端側(cè)還是云上,還是邊側(cè),算力怎么自適應的卸載等等?!?/strong>

而在更多資金涌入具身智能行業(yè)的情況下,未來行業(yè)可能會率先在哪些領域取得落地成果?

對此,勢乘資本合伙人劉英航表示,目前頭部具身智能企業(yè)正在聯(lián)合企業(yè)場景完成一些復雜挑戰(zhàn),比如進工廠擰螺絲。此外,一些人形機器人的銷售大單去往了商業(yè)表演、導覽、教育科研等行業(yè)。

“我們最近看了一些新項目,大家做的是偏應用類的,跟具身、AI硬件結(jié)合的項目,他們做的往往都是基于物理世界模型、運控能力做了陪伴、戶外、攝影這些能力,其實這些也回避了交互能力現(xiàn)在不足的點。”劉英航說,“這塊可能有下一個大疆的可能性?!?/p>

毛繼明則表示,極佳看到了世界模型更適合對通用性要求更高的泛服務和家庭場景,所以這兩方面是極佳當前的主攻方向。不過客觀來講,具身智能確實更有可能會在工業(yè)場景和娛樂場景兩個領域率先商業(yè)化落地。

“商業(yè)化落地的原則是優(yōu)先選擇其中約束條件明確、技術難度相對較低的場景進行突破?!?毛繼明表示。工業(yè)場景因為有很多約束條件在,可以使得企業(yè)有些辦法走捷徑,繞開一些通用性、泛化性問題,所以被認為是最有可能率先實現(xiàn)突破的領域。

同時,娛樂場景也被視為一個快速的突破口?!皧蕵贩较蛭业呐袛嗨枰裆虡I(yè)化場景那么嚴肅,所以有可能通過其他的點打動消費者,進而形成商業(yè)化的閉環(huán)?!?毛繼明說。

回顧過去三年的投資演進,從“看人投團隊”到“看demo投項目”再到“看落地”,資本的理性回歸正在推動行業(yè)回歸技術本質(zhì)。

雖然當前的融資繁榮與實際能力之間存在巨大差距,但正如大語言模型經(jīng)歷了從GPT-1到GPT-3的跨越式發(fā)展,具身智能也必將在解決技術路線過程中,逐步接近“通用”時刻。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
國學大師南懷瑾生前談2026,火運做火事,三件大家關心的都解決

國學大師南懷瑾生前談2026,火運做火事,三件大家關心的都解決

山九
2025-12-21 08:10:13
意外嗎?曝周定洋將加盟深圳新鵬城,海港虎視眈眈,成都蓉城心痛

意外嗎?曝周定洋將加盟深圳新鵬城,海港虎視眈眈,成都蓉城心痛

羅掌柜體育
2025-12-20 10:48:56
勇士復仇太陽結(jié)束3連敗!追夢被驅(qū)逐庫里28+9+6 菜鳥轟20分成奇兵

勇士復仇太陽結(jié)束3連??!追夢被驅(qū)逐庫里28+9+6 菜鳥轟20分成奇兵

鍋子籃球
2025-12-21 12:23:16
中信信悅灣官方售樓處發(fā)布:首推E棟302㎡,僅74套!豪宅序列爭

中信信悅灣官方售樓處發(fā)布:首推E棟302㎡,僅74套!豪宅序列爭

開發(fā)商售樓中心
2025-12-21 12:23:31
皮克福德:我們在進攻端不夠高效,拉亞幾乎沒真正做出過撲救

皮克福德:我們在進攻端不夠高效,拉亞幾乎沒真正做出過撲救

懂球帝
2025-12-21 07:41:58
特朗普:不排除開戰(zhàn)可能性

特朗普:不排除開戰(zhàn)可能性

新民周刊
2025-12-20 09:13:12
停播7年,那個挽救無數(shù)司機的“網(wǎng)紅交警”譚喬,卻挽救不了自己

停播7年,那個挽救無數(shù)司機的“網(wǎng)紅交警”譚喬,卻挽救不了自己

以茶帶書
2025-12-18 17:14:01
1958年蔣介石最后一次見張學良,說道:西安的事對國家損失太大了

1958年蔣介石最后一次見張學良,說道:西安的事對國家損失太大了

興趣知識
2025-12-18 19:29:24
年僅20歲!新晉女神!人美氣質(zhì)好,絕對的優(yōu)質(zhì)

年僅20歲!新晉女神!人美氣質(zhì)好,絕對的優(yōu)質(zhì)

伊人河畔
2025-12-20 20:51:00
普京拒付金正恩派兵報酬,因朝鮮軍隊戰(zhàn)績不佳,僅支付20%報酬

普京拒付金正恩派兵報酬,因朝鮮軍隊戰(zhàn)績不佳,僅支付20%報酬

環(huán)球熱點快評
2025-12-17 09:19:03
基辛格重評朝鮮戰(zhàn)爭:朝鮮戰(zhàn)爭中國一箭三雕,最大的失敗者是蘇聯(lián)

基辛格重評朝鮮戰(zhàn)爭:朝鮮戰(zhàn)爭中國一箭三雕,最大的失敗者是蘇聯(lián)

好點點
2024-07-09 17:23:56
絞盡腦汁地從老百姓口袋里掏錢,他們是不遺余力的

絞盡腦汁地從老百姓口袋里掏錢,他們是不遺余力的

胖胖說他不胖
2025-12-21 10:00:14
瓜迪奧拉:曼城應該準備新主帥了!弗里克:我愿和巴薩續(xù)約!

瓜迪奧拉:曼城應該準備新主帥了!弗里克:我愿和巴薩續(xù)約!

足球偵探
2025-12-21 09:05:06
終于官宣!老年證將全面作廢,以后坐公交逛公園就用它

終于官宣!老年證將全面作廢,以后坐公交逛公園就用它

陳博世財經(jīng)
2025-12-20 14:27:24
美國再次扣押委內(nèi)瑞拉油輪,特朗普:全面封鎖是認真的

美國再次扣押委內(nèi)瑞拉油輪,特朗普:全面封鎖是認真的

藍色海邊
2025-12-21 11:37:31
隨著萊斯特城1-4,考文垂1-1,英冠最新積分榜出爐:蘭帕德率隊領跑

隨著萊斯特城1-4,考文垂1-1,英冠最新積分榜出爐:蘭帕德率隊領跑

側(cè)身凌空斬
2025-12-21 07:04:21
換教練立竿見影,梁偉鏗/王昶2-1驚喜闖進決賽,總決賽一路逆襲

換教練立竿見影,梁偉鏗/王昶2-1驚喜闖進決賽,總決賽一路逆襲

真理是我親戚
2025-12-20 23:08:44
美國庫恩基金會主席:“十五五”規(guī)劃建議概述四個相互關聯(lián)戰(zhàn)略支柱,旨在推動強國建設

美國庫恩基金會主席:“十五五”規(guī)劃建議概述四個相互關聯(lián)戰(zhàn)略支柱,旨在推動強國建設

環(huán)球網(wǎng)資訊
2025-12-20 14:49:16
頂薪鎖死爭冠路:范子銘困局,是CBA金元泡沫的潰爛切片

頂薪鎖死爭冠路:范子銘困局,是CBA金元泡沫的潰爛切片

隱龍?zhí)煜耾
2025-12-21 11:08:50
31+28!頂級復仇!杜蘭特驅(qū)逐掘金主帥:你給勞資出去!

31+28!頂級復仇!杜蘭特驅(qū)逐掘金主帥:你給勞資出去!

貴圈真亂
2025-12-21 11:26:40
2025-12-21 13:00:49
光錐智能 incentive-icons
光錐智能
來這里,看千行百業(yè)的數(shù)字化、智能化。
881文章數(shù) 138關注度
往期回顧 全部

科技要聞

生態(tài)適配已超95% 鴻蒙下一關:十萬個應用

頭條要聞

醫(yī)生被控強奸2名幼女案再審 其檢察官父親作無罪辯護

頭條要聞

醫(yī)生被控強奸2名幼女案再審 其檢察官父親作無罪辯護

體育要聞

送快船西部墊底!鵜鶘大勝步行者獲4連勝

娛樂要聞

鹿晗關曉彤戀愛期間毫不避諱?

財經(jīng)要聞

百年老店陷貼牌爭議 同仁堂必須作出取舍

汽車要聞

-30℃,標致508L&凡爾賽C5 X冰雪"大考"

態(tài)度原創(chuàng)

本地
房產(chǎn)
游戲
教育
家居

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風骨

房產(chǎn)要聞

中交·藍色港灣一周年暨藍調(diào)生活沙龍圓滿舉行

魔獸世界:安其拉神殿最讓人無法抗拒的武器,哪款能讓你逆襲?

教育要聞

“好崩潰,女兒買這種低俗餅干”,家長曬出實物圖,堪比夜店游戲

家居要聞

高端私宅 理想隱居圣地

無障礙瀏覽 進入關懷版