国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

第一視角效率超過真機,深度機智發(fā)布全球首個以人類學(xué)習(xí)范式構(gòu)建的具身基座模型

0
分享至


千余小時人類第一視角,結(jié)果超越真機數(shù)萬小時。

作者丨齊鋮湧

編輯丨林覺民

2026年,具身智能的泡沫與烈火同時燃燒。

多家具身頭部公司遞交招股書,IPO進行時;Figure AI、Physical Intelligence等美國公司融資額屢創(chuàng)新高,將行業(yè)熱度推向頂點。國內(nèi)創(chuàng)業(yè)公司緊急跟進——堆數(shù)據(jù)、搶場景、拼本體,十萬小時真機數(shù)據(jù)成為新的軍備競賽標(biāo)的。

但喧囂之下,一個心照不宣的困境正在浮現(xiàn):沒有人知道正確的技術(shù)路線究竟是什么。遙操作、仿真合成、互聯(lián)網(wǎng)視頻、人類第一視角……數(shù)據(jù)類型的選擇尚未收斂;行星減速、諧波力控、電驅(qū)液壓……本體結(jié)構(gòu)的爭論也還沒落地。行業(yè)在"大力出奇跡"的信仰下狂奔,卻鮮有人追問:這些海量數(shù)據(jù),究竟在教機器人什么?

最近,AI科技評論觀察到,越來越多具身智能公司開始探索一條新的數(shù)據(jù)路徑:"人類第一視角數(shù)據(jù)"。

2026年以來,行業(yè)多家公司紛紛組建新團隊跟進這一路線。其中,以微軟亞洲研究院前首席研究員、現(xiàn)任北京中關(guān)村學(xué)院具身方向負(fù)責(zé)人陳凱的觀點,引發(fā)了行業(yè)的熱烈討論。

3月27號,作為深度機智的創(chuàng)始人,陳凱在中關(guān)村論壇「全球?qū)υ挕蛊叫姓搲F(xiàn)場,代表深度機智和中關(guān)村兩院,發(fā)布了首個以人類學(xué)習(xí)范式構(gòu)建的具身智能基座模型PhysBrain 1.0,并公布了他們的研究成果。


這個模型僅使用千余小時人類第一視角數(shù)據(jù)、零動作軌跡數(shù)據(jù)預(yù)訓(xùn)練,在多個具身智能領(lǐng)域國際權(quán)威榜單上超越了用數(shù)萬小時真機數(shù)據(jù)的競爭對手,在多個國際Benchmark 上取得SOTA,比Physical Intelligence 和英偉達等頭部巨頭表現(xiàn)更好。

某種程度上,一場具身智能領(lǐng)域關(guān)于"物理常識"的革命,正在悄然開啟。

01


模型缺乏物理常識,是具身領(lǐng)域的巨大痛點

"目前不管是VLM(視覺語言模型)還是世界模型,始終會卡在一個點上:它們?nèi)狈ξ锢沓WR。"深度機智創(chuàng)始人陳凱在中關(guān)村論壇上直接指出了這一行業(yè)痛點。

這個判斷直指當(dāng)前具身智能的核心困境。和很多學(xué)者遇到的情況一樣,陳凱提到 VLM 模型不理解空間、時序,"桌子上面放了幾個杯子,它數(shù)不清有幾個";視頻生成模型"視覺上足以亂真,但運動的真實性和物理真實性比較差"。這些看似基礎(chǔ)的能力缺失,讓機器人在面對真實世界的復(fù)雜性時屢屢碰壁。

問題的根源在于數(shù)據(jù)與學(xué)習(xí)的錯位。當(dāng)前行業(yè)主流的做法——遙操作采集真機數(shù)據(jù)、仿真合成虛擬數(shù)據(jù)、或是模仿人類手部軌跡,本質(zhì)上都是在教機器人"模仿動作",而非"理解世界"。

"現(xiàn)在非常多的做法——背動作、背軌跡——其實是手把手地教猴子干活。"陳凱用了一個形象的比喻,"而我們正在嘗試的是:請菩提祖師把小猴子變成孫悟空,讓它先理解世界,再去學(xué)習(xí)技能。"


這種"理解優(yōu)先"的方法論,正在獲得越來越多證據(jù)的支持。深度機智近期發(fā)布的PhysBrain 1.0具身智能基座模型體系正式針對這樣的思路,做出的階段性成果。

這一結(jié)果挑戰(zhàn)了一個行業(yè)默認(rèn)假設(shè):更多的數(shù)據(jù),是否必然帶來更好的智能?

02


人類第一視角數(shù)據(jù):被重新發(fā)現(xiàn)的數(shù)據(jù)富礦

"人類第一視角數(shù)據(jù),因為它是人看過去的第一視角的世界,收集的是真實物理世界的數(shù)據(jù),天然就蘊含著各種各樣的物理常識。"陳凱解釋道自己為什么要押注這一路線。

無獨有偶,這種數(shù)據(jù)類型的價值,在2024-2025年間逐漸被重新發(fā)現(xiàn)。2025年5月,特斯拉宣布減少遙操作,轉(zhuǎn)向人類第一視角;6月,Generalist AI發(fā)布"扔積木"的擬人行為Demo;11月,同樣是Generalist AI宣稱驗證具身智能Scaling Law;12月,Physical Intelligence確認(rèn)人類數(shù)據(jù)價值;2026年2-3月,英偉達發(fā)表論文交叉驗證。

行業(yè)共識迅速形成:人類第一視角數(shù)據(jù)不是遙操作的替代品,而是通往"物理常識"的關(guān)鍵路徑。

但分歧依然存在。英偉達的論文仍專注手部軌跡預(yù)訓(xùn)練,而深度機智選擇"直接上來就要增強VLM本身——讓它依據(jù)人看到的這個世界去理解世界"。陳凱認(rèn)為,這種差異讓深度機智"在整個流程上應(yīng)該比英偉達略有領(lǐng)先"。

更深層的差異在于數(shù)據(jù)的"多樣性"。遙操作數(shù)據(jù)記錄機器人視角,任務(wù)和場景由人工設(shè)計;UMI(通用操作接口)數(shù)據(jù)需要人手持夾爪,"很難想象工廠主要求員工不能用手干活"。


而人類第一視角數(shù)據(jù)捕捉的是真實生活,"哪怕是靜靜地發(fā)呆,看到外面車水馬龍,光影流動,也隱含著空間關(guān)系、物理規(guī)律與場景邏輯,這些數(shù)據(jù)都有價值"。

這種多樣性帶來的不僅是數(shù)據(jù)量的節(jié)省,更是學(xué)習(xí)質(zhì)量的躍遷。

03


軌跡擬合物理常識

方法論的范式轉(zhuǎn)移

"智能涌現(xiàn)"現(xiàn)象為這場革命提供了最直觀的證據(jù)。

深度機智的實驗觀察中,訓(xùn)練數(shù)據(jù)全是一次成功的抓拿放任務(wù),但在測試時發(fā)現(xiàn),有時機械臂碰到胡蘿卜沒夾到時,竟"自發(fā)選擇推"——推一次沒推進去,換角度加大力度再推,最后才轉(zhuǎn)變策略夾起來。另一個案例中,機械爪夾方塊太靠后掉落,它主動回來撿,第一次沒撿起,第二次"做了一個非常輕微的旋轉(zhuǎn)"成功夾起。

"這種靈活性,甚至你都沒有辦法預(yù)編程把它搞出來。"陳凱描述這一現(xiàn)象時強調(diào),"千小時人類數(shù)據(jù)增強物理常識,自發(fā)地把人類靈活變通的能力遷移到了機器人身上。"

這種"涌現(xiàn)"能力揭示了一個深層規(guī)律:當(dāng)模型具備足夠的物理常識,它不再依賴精確的軌跡模仿,而是能夠像人類一樣"理解情境、靈活應(yīng)對"。這正是"物理常識"革命的核心,從"教動作"到"教理解"的范式轉(zhuǎn)移。

Generalist AI聯(lián)合創(chuàng)始人將這種能力稱為"智能的暗物質(zhì)"(TheDark Matterof Robotics: Physical Commonsense)。DeepMind的哈薩比斯則認(rèn)為,原生多模態(tài)模型可以更好地理解物理世界,從而成為機器人的大腦。

"所有的這些點都?xì)w結(jié)到一個:要先去理解這個世界,然后再到這個世界里面去行動。"陳凱總結(jié)道。

04


跨本體能力:物理常識的遷移效應(yīng)

"物理常識"革命的另一個重要成果,是"跨本體能力"的涌現(xiàn)。

傳統(tǒng)方法需要"把不同形態(tài)的機器人的數(shù)據(jù)做聯(lián)合訓(xùn)練"才能實現(xiàn)技能遷移。但深度機智觀察到:"有了一個理解物理常識的大腦,自然而然知道適配什么樣的身體。"

這一發(fā)現(xiàn)顛覆了"一個機器人一套數(shù)據(jù)"的行業(yè)慣例。用LoRA預(yù)訓(xùn)練action expert,再用Franka機械臂微調(diào),數(shù)據(jù)需求大幅下降——"不同形態(tài)機器人背后的物理規(guī)律一模一樣"。

"跨本體是物理智能增強自然而然會出現(xiàn)的結(jié)果,并不是刻意地把多種機器人數(shù)據(jù)放在一起訓(xùn)練出來的結(jié)果。"陳凱解釋道。

這意味著,物理常識具有跨平臺、跨形態(tài)的通用性。一旦模型掌握了"物體受力會移動""抓取需要摩擦力"等基礎(chǔ)規(guī)律,它就能將這些知識遷移到新的硬件平臺上,而無需從頭學(xué)習(xí)。

這種通用性,正是通往"具身通用智能"的關(guān)鍵階梯。

05


人類學(xué)習(xí)路線正在國內(nèi)悄然崛起

在全球具身智能競賽中,中國與美國呈現(xiàn)出不同的側(cè)重。

過去,中國和美國在具身智能領(lǐng)域內(nèi),其實是各有側(cè)重,中國聚焦本體,美國是聚焦在大腦上。比較典型的是宇樹科技等公司在硬件迭代上取得顯著成績,但"具身大腦上的團隊其實并沒有那么多"。

這一格局正在改變。2025-2026年間,國內(nèi)開始涌現(xiàn)專注"大腦"的團隊。隨著“人類學(xué)習(xí)路線”的價值逐漸被驗證,深度機智等企業(yè)的崛起,也標(biāo)志著行業(yè)重心開始發(fā)生轉(zhuǎn)移。

從某種角度上,國內(nèi)目前的路徑和認(rèn)知上和世界一流科學(xué)家區(qū)別不大,但需要更多的投入。其中,數(shù)據(jù)成本優(yōu)勢尤為明顯,美國標(biāo)注第一視角27萬小時話費巨額資金,中國千萬小時人力歷史數(shù)據(jù)今年整個行業(yè)就會達到。

2026年,"物理常識"革命仍處于早期,盡管深度機智的千小時數(shù)據(jù)"涌現(xiàn)"了糾錯、變通、跨本體等能力,但陳凱承認(rèn)這仍是"偶然的智能涌現(xiàn)"。2026年底是否會出現(xiàn)"效果出人意料好的具身智能大模型"?兩三年能否重現(xiàn)ChatGPT時刻?

更深層的挑戰(zhàn)在于行業(yè)生態(tài)。

"物理常識"的提取、標(biāo)注、利用,需要全新的模型架構(gòu)和訓(xùn)練方法,與當(dāng)前主流的VLA架構(gòu)并不完全兼容。這意味著,擁抱"物理常識"革命,可能需要重構(gòu)底層技術(shù)基礎(chǔ)設(shè)施。

但回報同樣誘人。一旦機器人具備真正的"物理常識",它將不再是"反復(fù)教什么,勉強會什么"的專用工具,而是"理解情境、靈活應(yīng)對"的通用助手。這將徹底改變制造業(yè)、服務(wù)業(yè)、危險作業(yè)等無數(shù)領(lǐng)域的生產(chǎn)力圖景。

在這方面的認(rèn)知上,陳凱提到"這可能是人工智能的最后一個機會,也是最大的一次。",這或許是對這場革命押注的決心。

當(dāng)行業(yè)仍在"大力出奇跡"的信仰下堆砌數(shù)據(jù)時,一條"理解優(yōu)先"的新路徑已經(jīng)顯現(xiàn)。它不是對數(shù)據(jù)量的否定,而是對學(xué)習(xí)質(zhì)的重構(gòu)——從"模仿動作"到"理解世界",從"馴猴子"到"變孫悟空"。

這場"物理常識"革命能否成功,將決定具身智能的下一個十年。而2026年,正是關(guān)鍵的轉(zhuǎn)折之年。


未經(jīng)「AI科技評論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進行轉(zhuǎn)載!

公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時需標(biāo)注來源并插入本公眾號名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
巔峰之夜!亞冠決賽今晚打響:吉達vs町田 馬寧擔(dān)任第四官員

巔峰之夜!亞冠決賽今晚打響:吉達vs町田 馬寧擔(dān)任第四官員

新英體育
2026-04-25 09:09:10
中組部人社部規(guī)定:公職人員違紀(jì)后待遇一文講清

中組部人社部規(guī)定:公職人員違紀(jì)后待遇一文講清

笑熬漿糊111
2026-04-23 00:05:18
曝克洛普同意接掌皇馬!提出九大轉(zhuǎn)會要求,這三人必須買

曝克洛普同意接掌皇馬!提出九大轉(zhuǎn)會要求,這三人必須買

瀾歸序
2026-04-25 05:46:16
丁俊暉4-4逼平趙心童!聽聽賽后媒體專家都怎么說,墨菲壓力很大

丁俊暉4-4逼平趙心童!聽聽賽后媒體專家都怎么說,墨菲壓力很大

觀察鑒娛
2026-04-25 09:45:26
上海德云社換明星陣容也不火,上座率不高,觀眾評價更不好

上海德云社換明星陣容也不火,上座率不高,觀眾評價更不好

我就是個碼字的
2026-04-23 07:30:03
052D過橫當(dāng)水道后,遼寧艦抵臺海,日本向中國抗議,不滿東海行動

052D過橫當(dāng)水道后,遼寧艦抵臺海,日本向中國抗議,不滿東海行動

老赳說歷史
2026-04-23 16:08:53
兩性關(guān)系:60歲后男人必深交的3種女人,第三種定晚年質(zhì)量

兩性關(guān)系:60歲后男人必深交的3種女人,第三種定晚年質(zhì)量

王二哥老搞笑
2026-04-25 17:12:08
“濕氣”最怕這種豆,中老年人每周吃2次,利尿消水腫,健脾祛濕

“濕氣”最怕這種豆,中老年人每周吃2次,利尿消水腫,健脾祛濕

江江食研社
2026-04-21 22:30:03
烏專家:中國“榨干”蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們造出2.0

烏專家:中國“榨干”蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們造出2.0

馬蹄燙嘴說美食
2026-04-24 18:45:06
眼紅啊!從年薪20萬到125萬,一上海交大碩士特斯拉6年收入345萬

眼紅啊!從年薪20萬到125萬,一上海交大碩士特斯拉6年收入345萬

火山詩話
2026-04-23 07:11:53
建議中老年人:若不差錢,少吃饅頭和米飯,多吃4種主食,身體棒

建議中老年人:若不差錢,少吃饅頭和米飯,多吃4種主食,身體棒

華庭講美食
2026-04-25 17:36:42
又奪冠了!霍思燕的蒙古獒爆火,狠狠給中國犬種爭了口氣

又奪冠了!霍思燕的蒙古獒爆火,狠狠給中國犬種爭了口氣

超人強動物俱樂部
2026-04-25 13:16:54
長川科技(300604.SZ):2025年年報凈利潤為13.31億元

長川科技(300604.SZ):2025年年報凈利潤為13.31億元

界面新聞
2026-04-25 10:33:11
古裝劇都是騙人的:真實的古代百姓餐桌,現(xiàn)代人看一眼就想吐

古裝劇都是騙人的:真實的古代百姓餐桌,現(xiàn)代人看一眼就想吐

富貴說
2026-04-19 14:52:13
丁寶楨為何敢殺安德海?除了手握重兵,他還擁有這2項大權(quán)

丁寶楨為何敢殺安德海?除了手握重兵,他還擁有這2項大權(quán)

雍親王府
2026-04-22 19:20:03
離橫掃只差1場,湖人怎么贏的,4件事很正確,一人要拿大合同了

離橫掃只差1場,湖人怎么贏的,4件事很正確,一人要拿大合同了

體壇大辣椒
2026-04-25 11:16:37
剛剛宣布,降息50個基點

剛剛宣布,降息50個基點

中國基金報
2026-04-24 19:35:36
穆里尼奧:帥位問題該說的都說了,賽季結(jié)束后我有10天做決定

穆里尼奧:帥位問題該說的都說了,賽季結(jié)束后我有10天做決定

懂球帝
2026-04-24 21:15:11
文班亞馬缺陣,馬刺20歲+21歲組合橫空出世!NBA未來是他們的?

文班亞馬缺陣,馬刺20歲+21歲組合橫空出世!NBA未來是他們的?

體育妞世界
2026-04-25 15:26:33
詹姆斯29+13+6絕平三分拯救湖人!41歲季后賽父子連線

詹姆斯29+13+6絕平三分拯救湖人!41歲季后賽父子連線

布斯基
2026-04-25 19:09:47
2026-04-25 19:44:49
AI科技評論 incentive-icons
AI科技評論
點評學(xué)術(shù),服務(wù)AI
7222文章數(shù) 20749關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4發(fā)布!黃仁勛預(yù)言的"災(zāi)難"降臨

頭條要聞

現(xiàn)場視頻:殲-15掛彈起飛硬剛外軍航母編隊滋擾

頭條要聞

現(xiàn)場視頻:殲-15掛彈起飛硬剛外軍航母編隊滋擾

體育要聞

火箭0-3觸發(fā)百分百出局定律:本季加時賽9戰(zhàn)8敗

娛樂要聞

鄧超最大的幸運,就是遇見孫儷

財經(jīng)要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態(tài)度原創(chuàng)

親子
數(shù)碼
本地
房產(chǎn)
教育

親子要聞

我國兒童腫瘤生存率首次納入年報體系!5年達76%,不同癌種差異顯著

數(shù)碼要聞

雷達感應(yīng)自動開關(guān)燈,Yeelight新品來了

本地新聞

云游中國|逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

房產(chǎn)要聞

新一輪教育大爆發(fā)來了!海口,開始瘋狂建學(xué)校!

教育要聞

我國“就業(yè)率逼近100%”的5所雙非大學(xué),500多分就能上!

無障礙瀏覽 進入關(guān)懷版