国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

具身智能集體 “開智”,春晚只是開始

0
分享至



作者:呂鑫燚

出品:具身研習(xí)社

春晚聚光燈照亮了具身智能一個(gè)顯性的變化。

2025年,宇樹H1的亮相尚處于技術(shù)驗(yàn)證階段。彼時(shí),其僅能完成基礎(chǔ)舞蹈動(dòng)作,運(yùn)動(dòng)控制能力缺乏集中化展示,整機(jī)動(dòng)態(tài)軌跡的流暢度不足,且在自主移動(dòng)與地面適應(yīng)性上存在不足之處,表明人形機(jī)器人從實(shí)驗(yàn)室技術(shù)向?qū)嵱没a(chǎn)品轉(zhuǎn)型的階段性瓶頸。

進(jìn)入2026年馬年春晚,宇樹攜G1與H2兩款人形機(jī)器人重磅登場(chǎng),以全球首次全自主人形機(jī)器人集群武術(shù)表演刷新行業(yè)認(rèn)知。16臺(tái)機(jī)器人組成的集群實(shí)現(xiàn)了快速跑位,完成醉拳、雙截棍、舞劍等高難度武術(shù)動(dòng)作,手持長(zhǎng)棍與武術(shù)表演者精準(zhǔn)配合,并實(shí)現(xiàn)道具的快速更換與穩(wěn)定抓持。



短短一年間,無論是運(yùn)動(dòng)控制還是操作軌跡絲滑度和群體協(xié)同,具身智能都展現(xiàn)了質(zhì)的飛躍。

舞臺(tái)之外,具身智能的作業(yè)智能也邁過涌現(xiàn)時(shí)刻,核心突破在于長(zhǎng)序列任務(wù)執(zhí)行與柔性物體操控兩大技術(shù)難點(diǎn)的規(guī)?;涞亍S绕涫且呀?jīng)出色完成行業(yè)公認(rèn)的高難度任務(wù)動(dòng)作“疊衣服”。該動(dòng)作涉及柔性形變感知、時(shí)序動(dòng)作規(guī)劃、精細(xì)力控反饋等全鏈路挑戰(zhàn),是具身智能從結(jié)構(gòu)化場(chǎng)景走向非結(jié)構(gòu)化場(chǎng)景的關(guān)鍵壁壘。

在我們驚嘆于機(jī)器人高難度動(dòng)作時(shí),更值得穿透“炫技”表象,探究其背后的產(chǎn)業(yè)范式革命。最核心的疑問在于:機(jī)器人的能力躍升,僅僅是技術(shù)參數(shù)的堆砌嗎?

答案顯然是否定的。

無論是通過umi等方式緩解“數(shù)據(jù)饑渴”,還是借助閉環(huán)反饋填平“虛實(shí)鴻溝”,這些技術(shù)迭代都只是具身智能躍遷的“表層切面”。真正推動(dòng)行業(yè)質(zhì)變的,是底層思考邏輯的根本性重構(gòu)。機(jī)器人正在告別“照貓畫虎”的模仿學(xué)習(xí)路徑,轉(zhuǎn)向“理解世界、預(yù)判未來”的模式。

用一個(gè)通俗的熱梗形容,人形機(jī)器人乃至整個(gè)具身智能領(lǐng)域,正在集體“開智”。

不過,這場(chǎng)“開智”革命并非單一路徑的勝利。當(dāng)下,支撐這一范式轉(zhuǎn)變的技術(shù)路線已分化為幾大核心派系,不同技術(shù)邏輯的碰撞與融合,正共同定義著具身智能的產(chǎn)業(yè)走向。



“開智”的核心錨點(diǎn)在于其智能基座——模型。作為控制感知、決策與執(zhí)行的“神經(jīng)中樞”,模型的架構(gòu)設(shè)計(jì)直接決定機(jī)器人理解物理世界、適配復(fù)雜任務(wù)的能力邊界,而這場(chǎng)關(guān)于“如何讓機(jī)器人真正開智”的產(chǎn)業(yè)競(jìng)賽,正圍繞VLA架構(gòu)的演進(jìn)與爭(zhēng)議進(jìn)入深水區(qū)。

行業(yè)曾形成明確共識(shí):人形機(jī)器人的能力突破離不開端到端VLA(Vision-Language-Action,視覺-語言-動(dòng)作)架構(gòu)的核心驅(qū)動(dòng)。這種通過融合視覺感知、語言理解與動(dòng)作生成三大模態(tài),打破了傳統(tǒng)“感知-規(guī)劃-控制”分層架構(gòu)的信息損耗難題,實(shí)現(xiàn)端到端閉環(huán)。



谷歌DeepMind、智元機(jī)器人等中外企業(yè)的技術(shù)落地,印證了其在結(jié)構(gòu)化場(chǎng)景中適配準(zhǔn)確率,也逐步成為人形機(jī)器人從實(shí)驗(yàn)室走向商業(yè)化的核心技術(shù)底座。

但隨著需求側(cè)向非結(jié)構(gòu)化場(chǎng)景、長(zhǎng)序列復(fù)雜任務(wù)的延伸,VLA架構(gòu)的“萬金油”屬性逐漸失效。

例如,王興興就曾評(píng)價(jià)行業(yè)常見的VLA模型,屬于“傻瓜式架構(gòu)”,對(duì)這類模型持懷疑態(tài)度。此外,多個(gè)業(yè)內(nèi)人士也開始討論VLA模型究竟是具身智能的終局,還是一種階段性的過渡方案。

其實(shí)這些爭(zhēng)議看起來是“口水戰(zhàn)”,但其焦點(diǎn)最終匯聚于一個(gè)核心命題:“VLA中的L(語言)是否必要?”這場(chǎng)行業(yè)思辨的蔓延,本質(zhì)是對(duì)具身智能底層邏輯的重新審視。

此前業(yè)內(nèi)過度關(guān)注語言的必要性,是從LLM中吸取的成功經(jīng)驗(yàn),但具身智能需要和物理世界進(jìn)行真正的交互,而這種交互的骨架是否依舊為語言,目前尚不得知。李飛飛在a16z播客訪談中曾提到,“語言從根本上來說是一種純粹生成的信號(hào),世界上本沒有語言”



星海圖CTO趙行表示,具身智能需要平行于大語言模型的“Large Action Model”,這類模型要以“動(dòng)作”為核心,而非語言。他解釋道,人類智能的進(jìn)化是“先有動(dòng)作、再有視覺、最后有語言”,機(jī)器人要適應(yīng)物理世界,也應(yīng)該遵循類似邏輯。

這場(chǎng)架構(gòu)之爭(zhēng)的本質(zhì),無關(guān)單一技術(shù)路線的優(yōu)劣,而指向一個(gè)更根本的產(chǎn)業(yè)命題:機(jī)器人到底該以何種方式理解世界?是通過人類語言這一“間接符號(hào)”,還是通過動(dòng)作與環(huán)境的 “直接交互”構(gòu)建認(rèn)知?或者是以世界模型為核心,讓機(jī)器人在自己世界里“腦補(bǔ)”動(dòng)作流,進(jìn)而更絲滑的在真實(shí)世界執(zhí)行?

業(yè)內(nèi)逐漸形成的共識(shí)是,具身智能的終局架構(gòu),必然是對(duì)物理世界認(rèn)知邏輯的精準(zhǔn)抽象。它可能保留VLA架構(gòu)的跨模態(tài)融合優(yōu)勢(shì),也可能剝離冗余的語言中介,但其核心必須適配機(jī)器人作為物理實(shí)體的交互本質(zhì),實(shí)現(xiàn)“感知-決策-執(zhí)行”與物理世界規(guī)律的深度對(duì)齊。



由此可見,當(dāng)業(yè)內(nèi)在尋找下一個(gè)模型架構(gòu)時(shí),模型的打開方式成為重中之重。即我們?cè)撊绾沃罊C(jī)器人究竟需要什么樣的模型架構(gòu)?

答案早已藏在機(jī)器人落地的底層邏輯中:那些真正轉(zhuǎn)化為生產(chǎn)力的人形機(jī)器人,無不是聽懂了場(chǎng)景訴求、從真實(shí)交互中生長(zhǎng)而來;模型架構(gòu)的進(jìn)化,同樣需要回歸機(jī)器人與世界對(duì)話的原生方式。

說白了,機(jī)器人到底該如何理解世界,這個(gè)事機(jī)器人自己已經(jīng)給出答案了。

機(jī)器人在真實(shí)工作場(chǎng)景中,無論是疊衣服還是擰螺絲,其本質(zhì)都是要具備“長(zhǎng)時(shí)序記憶與實(shí)時(shí)反饋能力”“動(dòng)態(tài)場(chǎng)景的隨機(jī)應(yīng)變能力”。這兩大能力的核心,絕非簡(jiǎn)單的“記住過往數(shù)據(jù)”,而是“預(yù)判未來狀態(tài)”。

舉個(gè)例子,人類執(zhí)行疊衣服、裝配零件等任務(wù)時(shí),不會(huì)逐幀依賴視覺反饋,而是會(huì)基于物理常識(shí)預(yù)判下一步動(dòng)作的結(jié)果:疊襯衫時(shí)提前預(yù)判布料的褶皺走向,擰螺絲時(shí)預(yù)判扭矩達(dá)到閾值后的狀態(tài)。機(jī)器人要實(shí)現(xiàn)同樣的“絲滑操作”,關(guān)鍵便在于將“記憶”升級(jí)為“預(yù)測(cè)”,通過模型推演未來多幀的場(chǎng)景變化與動(dòng)作后果。

這些重點(diǎn)不在于“記住”而是“預(yù)測(cè)”。

誰能捏準(zhǔn)這個(gè)邏輯,誰才是真正把機(jī)器人模型架構(gòu)這個(gè)事玩明白了。螞蟻靈波開源的具身世界模型LingBot-VA,就是將“先預(yù)測(cè)、再動(dòng)作”的架構(gòu)邏輯推向極致。

該模型創(chuàng)新性地提出自回歸視頻-動(dòng)作世界建??蚣埽诵耐黄圃谟趯ⅰ邦A(yù)測(cè)世界狀態(tài)”與“生成動(dòng)作序列”深度綁定,實(shí)現(xiàn)了“邊預(yù)測(cè),邊動(dòng)作”。簡(jiǎn)單來說就是,該模型不再是機(jī)械地執(zhí)行預(yù)設(shè)指令,而是在每一步操作時(shí),大腦都在實(shí)時(shí)推演接下來的畫面。



想象一下你在干精細(xì)活之前,是不是腦海里已經(jīng)知道每一個(gè)步驟該怎么做,也知道這個(gè)動(dòng)作完事后物體會(huì)有什么樣的變化。

LingBot-VA不止和人類思維模式相同。其工作中的特性,也和人類高度重合。能記住自己剛剛干了什么,還能真正擁有泛化,和人類一樣學(xué)會(huì)了洗盤子,就會(huì)洗碗,做到舉一反三。就連清洗細(xì)小的透明試管的高精度任務(wù),LingBot-VA加持下機(jī)器人已經(jīng)是可以輕松拿捏。

英偉達(dá)的DreamGen,也是同樣的路子,先生成視頻,再反推動(dòng)作。它把基礎(chǔ)模型架構(gòu)分為上下兩個(gè)部分,上半部分是一個(gè)視頻模型,負(fù)責(zé)預(yù)測(cè)未來;下半部分負(fù)責(zé)看著預(yù)測(cè)出來的視頻,反推并輸出動(dòng)作。

插個(gè)題外話,英偉達(dá)DreamGen推出時(shí),有業(yè)內(nèi)人士曾評(píng)價(jià)這是一條被寄予厚望的技術(shù)路線。不過從當(dāng)下的視角來看,其也沒有跑通閉環(huán)。

問題出在哪?現(xiàn)實(shí)世界是充滿變量的,一旦機(jī)器人在執(zhí)行中出現(xiàn)微小的物理偏差(比如手滑了一下),由于視頻是提前生成好的,模型無法實(shí)時(shí)修正畫面,機(jī)器人只能硬著頭皮按原計(jì)劃走,導(dǎo)致“腦子想的和手做的”徹底脫節(jié)。

不過,這并不代表DreamGen是一次失敗的嘗試。相反,它的出現(xiàn)從產(chǎn)業(yè)層面印證了一個(gè)關(guān)鍵判斷:世界模型是機(jī)器人在真實(shí)物理世界作業(yè)的核心支撐,只是在當(dāng)時(shí)尚未抵達(dá)產(chǎn)業(yè)臨界點(diǎn)。而LingBot-VA的問世,才真正補(bǔ)齊了最后一塊短板,成為具身世界模型完整閉環(huán)跑通的標(biāo)志性拐點(diǎn)。

歸根結(jié)底,“用機(jī)器人的視角打開世界”,本質(zhì)是讓模型架構(gòu)回歸物理世界的本質(zhì)規(guī)律,機(jī)器人不需要像人類一樣通過語言理解“重力”“摩擦力”,但需要通過預(yù)測(cè)能力感知這些物理規(guī)則;不需要記住每一個(gè)場(chǎng)景的操作參數(shù),但需要能推演不同場(chǎng)景下的動(dòng)作后果。

這種以“預(yù)測(cè)”為核心的架構(gòu)邏輯,恰好契合了機(jī)器人與物理世界交互的原生需求:擺脫對(duì)人類認(rèn)知中介(語言)的依賴,直接通過“預(yù)測(cè)-行動(dòng)”的閉環(huán),建立與世界的直接連接。

而這,正是具身智能走向“適配世界”的重要跨越。



從現(xiàn)在的視角來看,我們?cè)撍伎嫉牟⒉秽笥贚ingBot-VA架構(gòu),而是這條架構(gòu)跑通后,具身智能將迎來什么樣的革新。

一個(gè)清晰的變化是,具身世界模型有望成為具身智能關(guān)鍵能力,也是具身智能的重要基座。

支撐這一轉(zhuǎn)變的是其融合了“世界模型”與 “物理動(dòng)作反饋閉環(huán)”。這并非簡(jiǎn)單的技術(shù)疊加,而是深度融合。世界模型為機(jī)器人搭建起可預(yù)判、可推演的虛擬世界,提前模擬動(dòng)作后果與環(huán)境變化;物理動(dòng)作反饋則將現(xiàn)實(shí)交互中的數(shù)據(jù)實(shí)時(shí)回灌模型,持續(xù)校準(zhǔn)虛擬與現(xiàn)實(shí)的偏差,形成自進(jìn)化閉環(huán)。

它不僅從根源上重構(gòu)了機(jī)器人理解物理世界的底層邏輯,讓機(jī)器人擺脫對(duì)人工指令、標(biāo)注數(shù)據(jù)與固定軌跡的依賴,更成為破解非結(jié)構(gòu)化場(chǎng)景適配難、長(zhǎng)時(shí)序任務(wù)穩(wěn)定性差、柔性操作精度不足等行業(yè)落地瓶頸的核心能力支柱。

站在產(chǎn)業(yè)視角審視,我們不應(yīng)該否認(rèn)VLA的貢獻(xiàn),也不能盲目推崇VA的未來。而是站在機(jī)器人的視角來看世界,聽機(jī)器人自己說需要什么樣的模型架構(gòu)。

這場(chǎng)模型架構(gòu)變革,是產(chǎn)業(yè)更清醒的信號(hào)之一,也是具身智能走向規(guī)?;逃玫年P(guān)鍵一躍。模型架構(gòu)的底層突破,直接決定了機(jī)器人的泛化能力、作業(yè)精度與落地成本,將推動(dòng)行業(yè)從舞臺(tái)化的技術(shù)展示,走向工業(yè)、家政、特種作業(yè)等真實(shí)場(chǎng)景的生產(chǎn)力釋放;也將為整機(jī)研發(fā)、場(chǎng)景方案、商業(yè)化落地劃定清晰的技術(shù)主線。具身智能集體 “開智”,春晚只是開始

原創(chuàng)呂鑫燚具身研習(xí)社2026年2月18日 09:39吉林

聲明:包含AI生成內(nèi)容

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
大鬧亞航后續(xù):女子冒充空姐,正臉曝光已社死,寫保證書只是開始

大鬧亞航后續(xù):女子冒充空姐,正臉曝光已社死,寫保證書只是開始

社會(huì)日日鮮
2026-04-24 07:15:27
“最佳空腹血糖”是多少?建議:過63歲以后,血糖最好控制這范圍

“最佳空腹血糖”是多少?建議:過63歲以后,血糖最好控制這范圍

醫(yī)學(xué)科普匯
2026-04-24 20:20:03
146年來,全球僅有120位醫(yī)生獲得的殊榮,瑞金這位醫(yī)生拿到了!

146年來,全球僅有120位醫(yī)生獲得的殊榮,瑞金這位醫(yī)生拿到了!

上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院
2026-04-24 18:55:17
中美金融戰(zhàn),意外地幫中國(guó)解決了,房地產(chǎn)這個(gè)尾大不掉的問題

中美金融戰(zhàn),意外地幫中國(guó)解決了,房地產(chǎn)這個(gè)尾大不掉的問題

南宗歷史
2026-04-24 05:20:02
陳首富終究吞不下云南白藥 | 棱鏡

陳首富終究吞不下云南白藥 | 棱鏡

新浪財(cái)經(jīng)
2026-04-24 17:04:15
悲催!37歲名牌大學(xué)畢業(yè)、年薪30萬女醫(yī)生被技術(shù)男嫌棄,當(dāng)場(chǎng)崩潰

悲催!37歲名牌大學(xué)畢業(yè)、年薪30萬女醫(yī)生被技術(shù)男嫌棄,當(dāng)場(chǎng)崩潰

火山詩話
2026-04-24 06:14:58
斯諾克世錦賽:趙心童迎首勝!單桿64分追平丁俊暉,囧哥3-5到5-5

斯諾克世錦賽:趙心童迎首勝!單桿64分追平丁俊暉,囧哥3-5到5-5

劉姚堯的文字城堡
2026-04-24 22:22:43
內(nèi)存漲價(jià)了,安卓終于想起要管流氓 APP 了

內(nèi)存漲價(jià)了,安卓終于想起要管流氓 APP 了

互聯(lián)網(wǎng)放大鏡
2026-04-23 13:34:06
iPhone 18"不漲價(jià)"?蘋果把屏幕砍回四年前,然后叫它"先進(jìn)OLED"

iPhone 18"不漲價(jià)"?蘋果把屏幕砍回四年前,然后叫它"先進(jìn)OLED"

互聯(lián)網(wǎng)放大鏡
2026-04-23 12:37:46
美媒稱,革命衛(wèi)隊(duì)總司令瓦希迪成為美軍最新打擊目標(biāo)

美媒稱,革命衛(wèi)隊(duì)總司令瓦希迪成為美軍最新打擊目標(biāo)

山河路口
2026-04-24 13:23:02
華為系“圍獵”小米

華為系“圍獵”小米

電動(dòng)汽車觀察家
2026-04-23 15:21:05
6億成本拖9年,《美人魚2》難產(chǎn),華誼申請(qǐng)破產(chǎn),周星馳也很無奈

6億成本拖9年,《美人魚2》難產(chǎn),華誼申請(qǐng)破產(chǎn),周星馳也很無奈

八卦南風(fēng)
2026-04-24 17:50:24
廣東省政府副秘書長(zhǎng)吳耿淡被查

廣東省政府副秘書長(zhǎng)吳耿淡被查

上觀新聞
2026-04-24 18:11:03
DeepSeek+華為,黃仁勛:我們的噩夢(mèng)來了!

DeepSeek+華為,黃仁勛:我們的噩夢(mèng)來了!

藍(lán)字計(jì)劃
2026-04-24 19:59:54
北京首鋼50分大勝!超級(jí)外援首秀9分,曾凡博爆發(fā),麥基18分

北京首鋼50分大勝!超級(jí)外援首秀9分,曾凡博爆發(fā),麥基18分

體壇瞎白話
2026-04-24 21:25:36
2026了,《穿普拉達(dá)的女王2》華裔角色竟然叫這名,日韓網(wǎng)民怒了

2026了,《穿普拉達(dá)的女王2》華裔角色竟然叫這名,日韓網(wǎng)民怒了

觀察者網(wǎng)
2026-04-24 20:06:36
大理民宿市場(chǎng)涼透了!7000家民宿廝殺,有人虧百萬仍沒賣出去…

大理民宿市場(chǎng)涼透了!7000家民宿廝殺,有人虧百萬仍沒賣出去…

火山詩話
2026-04-23 09:14:07
A股,尾盤傳來一個(gè)“重磅利好”信號(hào),下周,或?qū)⒂瓉泶笞儽P!

A股,尾盤傳來一個(gè)“重磅利好”信號(hào),下周,或?qū)⒂瓉泶笞儽P!

夜深愛雜談
2026-04-24 21:31:35
“兩高”最新司法解釋引巨大爭(zhēng)議,網(wǎng)友:有些內(nèi)容太可怕了!

“兩高”最新司法解釋引巨大爭(zhēng)議,網(wǎng)友:有些內(nèi)容太可怕了!

娛樂圈見解說
2026-04-24 08:11:57
20余萬元尚未解救被困緬甸園區(qū)女孩,同園區(qū)逃生者講述驚魂一刻

20余萬元尚未解救被困緬甸園區(qū)女孩,同園區(qū)逃生者講述驚魂一刻

界面新聞
2026-04-24 13:05:29
2026-04-24 23:23:00
具身研習(xí)社
具身研習(xí)社
記錄具身智能浪潮迭代。
145文章數(shù) 1關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價(jià)格依然"屠夫級(jí)"

頭條要聞

賴清德面臨彈劾投票 島內(nèi)網(wǎng)友:不記名投票一定過

頭條要聞

賴清德面臨彈劾投票 島內(nèi)網(wǎng)友:不記名投票一定過

體育要聞

上海男籃23連勝+主場(chǎng)全勝 姚明之后最強(qiáng)一季

娛樂要聞

停工16個(gè)月!趙露思證實(shí)接拍新劇

財(cái)經(jīng)要聞

LG財(cái)閥內(nèi)斗:百億美元商業(yè)帝國(guó)爭(zhēng)奪戰(zhàn)

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態(tài)度原創(chuàng)

藝術(shù)
教育
旅游
公開課
軍事航空

藝術(shù)要聞

2025最繪畫--第四屆中國(guó)青年油畫作品展 | 油畫選刊(三)

教育要聞

公辦高校:著力提升研究生“抬頭率”

旅游要聞

蓉城花正好 “我心中的成都最美賞花地”指南發(fā)布

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美伊陷入互相封鎖僵局

無障礙瀏覽 進(jìn)入關(guān)懷版