国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

一位務(wù)實(shí)的科學(xué)家和他為機(jī)器人推開(kāi)的那扇門(mén)|甲子光年

0
分享至




“誰(shuí)有本事做個(gè)機(jī)器人,讓它到千家萬(wàn)戶都能開(kāi)門(mén),這就叫牛。”

作者|劉楊楠 沈伊人

編輯|王博

故事要從北京亦莊說(shuō)起。

在這片曾以工業(yè)與制造園區(qū)著稱的土地上,廠房林立,路網(wǎng)密布,各色機(jī)械設(shè)備構(gòu)成了這里長(zhǎng)期以來(lái)的底色。但在2023年,這里的氣質(zhì)悄然發(fā)生了變化。

2023年冬天,北京亦莊(北京經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū))悄然完成了一次“組局”。多方力量匯集,北京人形機(jī)器人創(chuàng)新中心有限公司(以下簡(jiǎn)稱“北京人形”)注冊(cè)成立,它被賦予的使命并不掩飾其野心——打造通用機(jī)器人平臺(tái)和通用具身智能平臺(tái),構(gòu)建軟硬件協(xié)同的技術(shù)底座,為尚未成熟的人形機(jī)器人產(chǎn)業(yè)搭起一條更穩(wěn)定的路徑。

這個(gè)故事的起點(diǎn),與其說(shuō)是公司成立,不如說(shuō)是一群科學(xué)家和工程師的重新出發(fā)。有人在過(guò)去的創(chuàng)業(yè)周期中積累過(guò)經(jīng)驗(yàn),也看過(guò)行業(yè)的盲區(qū)與浮躁;他們選擇再次入局,是因?yàn)槭冀K不甘心于“機(jī)器人能跑會(huì)跳,卻難以真正落地”的現(xiàn)狀。

唐劍就是其中之一。


北京人形機(jī)器人創(chuàng)新中心有限公司CTO 唐劍

這位曾任美國(guó)雪城大學(xué)終身教授、獲得過(guò)IEEE Fellow頭銜的科學(xué)家,在學(xué)術(shù)界研究了半輩子“AI驅(qū)動(dòng)的系統(tǒng)控制”。后來(lái)進(jìn)入產(chǎn)業(yè)界,先后擔(dān)任滴滴智能控制首席科學(xué)家、美的公司首席AI官,積累了豐富的產(chǎn)業(yè)落地經(jīng)驗(yàn)。

2024年夏天,他來(lái)到了亦莊,成為了北京人形機(jī)器人創(chuàng)新中心有限公司CTO。他把這次重新出發(fā)歸因于與公司CEO熊友軍“志趣相投”,以及想要“讓人形機(jī)器人真正能進(jìn)千家萬(wàn)戶”的理想。

今年,因?yàn)橐粓?chǎng)人形機(jī)器人半程馬拉松,北京人形研發(fā)的“具身天工”機(jī)器人出圈了。


“具身天工Ultra”機(jī)器人獲得全球首個(gè)人形機(jī)器人半程馬拉松冠軍

這次出圈給北京人形帶來(lái)了大量關(guān)注,同時(shí)也讓公眾產(chǎn)生了一些誤解——“‘具身天工’只會(huì)跑步”“這只是一場(chǎng)秀”“機(jī)器人跑馬拉松沒(méi)有意義”。

“能跑”僅僅是北京人形“具身天工”機(jī)器人的一個(gè)標(biāo)簽,在今年8月舉行的世界機(jī)器人大會(huì)上,「甲子光年」就注意到北京人形發(fā)布了具身世界模型體系、具身多模態(tài)大模型、人形機(jī)器人全自主導(dǎo)航系統(tǒng)、跨本體VLA模型等創(chuàng)新技術(shù),并實(shí)現(xiàn)了復(fù)雜場(chǎng)景下的異構(gòu)多本體協(xié)同工作。

就在上個(gè)月,北京人形發(fā)布了一個(gè)讓機(jī)器人真正“看見(jiàn)、理解并行動(dòng)于世界”的具身世界模型——WoW(World-Omniscient World Model),幫助具身智能機(jī)器人快速學(xué)習(xí)掌握各項(xiàng)技能,助力行業(yè)打造“好用”的機(jī)器人。

其實(shí),北京人形既不是傳統(tǒng)國(guó)企,也不是一般意義上的創(chuàng)業(yè)公司,它從誕生之初就承載著整合行業(yè)資源的使命。翻開(kāi)股東名單,優(yōu)必選、小米機(jī)器人、京城機(jī)電……這些在市場(chǎng)上或?yàn)椤案?jìng)爭(zhēng)對(duì)手”的企業(yè),在這里成為了“同桌隊(duì)友”。

一方面,北京人形是“國(guó)家地方共建具身智能機(jī)器人創(chuàng)新中心”;另一方面,北京人形仍需自籌資金,直面市場(chǎng)競(jìng)爭(zhēng)。

這種特殊生態(tài)位,也要求北京人形需要承擔(dān)更多商業(yè)目標(biāo)之外的社會(huì)責(zé)任,攻克那些初創(chuàng)嫌太重、國(guó)企嫌太難、高校嫌太工程的共性難題。

在北京人形成立兩周年之際,「甲子光年」與唐劍進(jìn)行了一次深入的對(duì)話。

我們能感受到的是,以唐劍為代表的北京人形技術(shù)團(tuán)隊(duì)極為務(wù)實(shí),不執(zhí)念于訓(xùn)練與scaling law,目標(biāo)明確,就是要提升機(jī)器人操作能力,實(shí)現(xiàn)快速落地。目前,北京人形圍繞具身智能進(jìn)行全棧布局,軟硬件并舉,大力推進(jìn)開(kāi)源、數(shù)據(jù)采集與行業(yè)標(biāo)準(zhǔn)。

雖然還有未完成的目標(biāo),但唐劍多年技術(shù)理想也終于有望形成現(xiàn)實(shí)的回環(huán)——把機(jī)器人從實(shí)驗(yàn)室送進(jìn)千行百業(yè)、千家萬(wàn)戶。

1.人形機(jī)器人的雙重瓶頸

當(dāng)前,在從實(shí)驗(yàn)室研發(fā)邁向多場(chǎng)景應(yīng)用的關(guān)鍵時(shí)期,具身智能產(chǎn)業(yè)正面臨著一場(chǎng)嚴(yán)峻考驗(yàn)。

在當(dāng)下的創(chuàng)投圈與產(chǎn)業(yè)界,流傳著一種觀點(diǎn),“具身智能的落地,難點(diǎn)不在具身,難在智能?!?這種觀點(diǎn)認(rèn)為,隨著宇樹(shù)、具身天工、松延動(dòng)力等企業(yè)的努力,運(yùn)動(dòng)控制的上限已被不斷突破,現(xiàn)在的瓶頸核心在于大模型不夠聰明。

對(duì)于這個(gè)觀點(diǎn),唐劍雖不否認(rèn),卻并不完全認(rèn)同。

事實(shí)上,在具身智能領(lǐng)域,一直有一個(gè)核心共識(shí)是“硬件決定下限,軟件決定上限”,即機(jī)器人的硬件形態(tài)由場(chǎng)景與用戶需求定義,而軟件則用于解鎖硬件的潛能。

然而,當(dāng)前行業(yè)中普遍存在一種線性的開(kāi)發(fā)模式:本體團(tuán)隊(duì)完成硬件后交由運(yùn)控團(tuán)隊(duì),運(yùn)控調(diào)試完畢再交給算法團(tuán)隊(duì)。在唐劍看來(lái),這種流水線作業(yè)并非最優(yōu)解。

真正的突破需要軟硬件深度協(xié)同、雙向閉環(huán)。例如,為實(shí)現(xiàn)更優(yōu)的運(yùn)動(dòng)控制,北京人形的算法團(tuán)隊(duì)會(huì)向硬件團(tuán)隊(duì)反饋關(guān)鍵指標(biāo),機(jī)器人不僅要輕量化,其上下肢的重量分配比例更是至關(guān)重要。只有軟硬件雙向奔赴,機(jī)器人才能實(shí)現(xiàn)系統(tǒng)性能的最大化。

只是,目前來(lái)看,機(jī)器人的硬件和軟件各有瓶頸。他將行業(yè)瓶頸分為線性瓶頸與非線性瓶頸兩大維度。

“現(xiàn)在其實(shí)你看到的運(yùn)動(dòng)表現(xiàn)特別出色的,都是一些小尺寸的機(jī)器。其實(shí)真正的全尺寸、真的非常類人的機(jī)器人,比如身高在1.6米以上的,在整個(gè)運(yùn)動(dòng)性能上還沒(méi)有表現(xiàn)得特別出色?!?唐劍直言。

業(yè)界公認(rèn),隨著機(jī)器人身高和體重的增長(zhǎng),運(yùn)動(dòng)控制的難度呈指數(shù)上升。目前的硬件技術(shù)路線尚未完全收斂,依然面臨著諸多物理層面的限制,唐劍將其歸類為“線性瓶頸”。

例如,關(guān)節(jié)與散熱方面, 關(guān)節(jié)的扭矩密度目前仍然較低,且在大負(fù)載運(yùn)動(dòng)下發(fā)熱現(xiàn)象嚴(yán)重,直接限制了機(jī)器人的爆發(fā)力和持久性。

在精細(xì)操作方面,靈巧手是核心。想要高自由度,體積就很難做??;想要體積小,自由度往往受限,通常只有6個(gè),這使得精細(xì)操作(如穿針引線或復(fù)雜裝配)極難掌握。


天軼2.0在世界人形機(jī)器人運(yùn)動(dòng)會(huì)獲物料整理冠軍

端側(cè)算力方面,公眾在演示視頻中看到的流暢動(dòng)作,后臺(tái)往往拖著一臺(tái)搭載英偉達(dá)4090顯卡的高性能工作站。真正依靠機(jī)器人板載芯片(如Orin)進(jìn)行實(shí)時(shí)推理時(shí),算力依然捉襟見(jiàn)肘。行業(yè)一直期待著下一代芯片(如Thor)或國(guó)產(chǎn)算力芯片的突破。

機(jī)器人續(xù)航方面,現(xiàn)有電池能量密度低,而固態(tài)電池雖然能量密度高,但循環(huán)壽命短,尚無(wú)法滿足商業(yè)化落地對(duì)續(xù)航和壽命的雙重需求。

盡管困難重重,但唐劍對(duì)此態(tài)度相對(duì)樂(lè)觀。他之所以稱其為“線性瓶頸”,是因?yàn)檫@些問(wèn)題本質(zhì)上是工程問(wèn)題,“假以時(shí)日,只要有資本和人力投入下來(lái),每年都會(huì)有一個(gè)比較大的進(jìn)步?!?/p>

相比之下,更棘手、也更具不確定性的是非線性瓶頸,其核心在于軟件,包括數(shù)據(jù)、算法以及配套的軟件開(kāi)發(fā)工具鏈。

“核心就是大模型的泛化能力什么時(shí)候能達(dá)到ChatGPT時(shí)刻?” 唐劍表示,“我不知道,很難講。什么時(shí)候有突破,也可能就是明年,也可能是很長(zhǎng),三年、五年甚至十年的時(shí)間。”

在這個(gè)非線性瓶頸中,數(shù)據(jù)以及機(jī)器人的大腦、小腦都均面臨不同程度的瓶頸。

數(shù)據(jù)方面,行業(yè)極度缺乏高質(zhì)量、標(biāo)準(zhǔn)化的具身交互數(shù)據(jù)。一方面,高質(zhì)量、場(chǎng)景化的數(shù)據(jù)集采集成本極高。單一企業(yè)難以覆蓋足夠多的場(chǎng)景,導(dǎo)致模型泛化能力受限;另一方面,很多創(chuàng)業(yè)公司都將辛苦采集的數(shù)據(jù)視為核心壁壘,互不開(kāi)放。加之機(jī)器量產(chǎn)斷檔、檢測(cè)標(biāo)準(zhǔn)缺失,導(dǎo)致實(shí)驗(yàn)室成果難以轉(zhuǎn)化為穩(wěn)定可靠的產(chǎn)品。

此外,機(jī)器人大腦的核心發(fā)力點(diǎn)在于理解物理世界的運(yùn)行規(guī)律,并能將想法高效反饋到動(dòng)作上。而小腦則需在跑步、打拳等空間移動(dòng)的基礎(chǔ)上,在精細(xì)化操作上尋求突破。

近期,運(yùn)控算法層面出現(xiàn)了一波小爆發(fā)。通過(guò)引入新的算法,如應(yīng)對(duì)外部擾動(dòng)的魯棒性算法,小尺寸機(jī)器人的抗干擾能力大幅提升。唐劍預(yù)測(cè),這股技術(shù)浪潮很快會(huì)傳導(dǎo)至全尺寸機(jī)器人,帶來(lái)運(yùn)控能力的整體躍升。

但他也強(qiáng)調(diào),無(wú)論是本體的輕量化設(shè)計(jì),還是軟件的泛化能力,未來(lái)依然有巨大的提升空間。

面對(duì)上述瓶頸,行業(yè)內(nèi)各玩家的布局目前更加碎片化:有人專攻小腦,有人死磕大腦,有人只做本體。這種選擇背后,往往反映了創(chuàng)業(yè)團(tuán)隊(duì)資金和人員稟賦的局限。

2.北京人形的“具身基建”

站在獨(dú)特的生態(tài)位上,北京人形自成立之初就選擇了全棧布局。唐劍表示,整個(gè)創(chuàng)新中心定位為平臺(tái)型企業(yè),提供兩大平臺(tái)。

第一個(gè)是硬件平臺(tái),即“具身天工”和“天軼”系列機(jī)器人。這不僅是終端產(chǎn)品,更是開(kāi)放的二次開(kāi)發(fā)載體。

通用機(jī)器人平臺(tái)聚焦于物理基座,突破了高性能一體化關(guān)節(jié)與輕量化本體技術(shù),為工業(yè)分揀、特種作業(yè)等場(chǎng)景提供了穩(wěn)定靈活的硬件載體。


具身天工物流場(chǎng)景作業(yè)

外界對(duì)北京人形的認(rèn)知始于“具身天工”在機(jī)器人馬拉松上的奪冠。唐劍透露,“具身天工”接下來(lái)的優(yōu)化方向是提升柔順度和擬人性,“軟硬件都需要往前進(jìn)步才行,這是一個(gè)相輔相成的過(guò)程。”

第二個(gè)是軟件平臺(tái),這也是某種程度上被外界低估的。北京人形推出的“慧思開(kāi)物”的一站式通用具身智能開(kāi)發(fā)平臺(tái)填補(bǔ)了具身智能通用軟件系統(tǒng)的空白,旨在解決跨本體、跨場(chǎng)景的適配難題。

唐劍對(duì)「甲子光年」詳細(xì)解讀了“慧思開(kāi)物”的技術(shù)架構(gòu)。

其中,具身“大腦”負(fù)責(zé)告訴機(jī)器人該怎么干,它背后拖著兩個(gè)關(guān)鍵模型,一個(gè)是VLM(視覺(jué)-語(yǔ)言模型),推理時(shí)真正使用的大模型,負(fù)責(zé)感知和決策;一個(gè)是世界模型,作為一個(gè)輔助工具,幫助VLM進(jìn)行自主進(jìn)化和訓(xùn)練。

在“慧思開(kāi)物”的大腦架構(gòu)中,世界模型是當(dāng)下最引人注目的技術(shù)高地。

依托于圖靈獎(jiǎng)得主楊立昆(Yann LeCun)的定義,唐劍給出了一個(gè)通俗的解釋:“比方說(shuō)我現(xiàn)在給你一個(gè)‘狀態(tài)’(桌子上有杯子),然后給你一個(gè)‘動(dòng)作’(我去抓杯子)。世界模型要做的,就是準(zhǔn)確預(yù)測(cè)出基于這個(gè)動(dòng)作,未來(lái)幾幀會(huì)發(fā)生什么?!?/p>

目前市面上存在很多視頻生成模型,但唐劍指出,評(píng)判具身世界模型的核心指標(biāo)不是畫(huà)面的清晰度,而是“對(duì)物理規(guī)律的遵循”與“時(shí)空一致性”。

“一般的視頻生成模型更重視視覺(jué)效果。比如手碰到杯子,如果模型不懂物理規(guī)律,手可能會(huì)直接穿模過(guò)去,或者杯子紋絲不動(dòng)。這在做宣傳視頻時(shí)沒(méi)問(wèn)題,但在控制機(jī)器人時(shí)是致命的?!?唐劍解釋道。

為了實(shí)現(xiàn)這種物理直覺(jué),目前大多團(tuán)隊(duì)選擇“視頻模型基座+機(jī)器人數(shù)據(jù)后訓(xùn)練”的路徑。北京人形也采取了這一策略:基于開(kāi)源基礎(chǔ)模型,集中算力注入特有的300萬(wàn)條機(jī)器人操作數(shù)據(jù),整個(gè)訓(xùn)練過(guò)程消耗的算力約為百卡級(jí)。

唐劍明確表示:“沒(méi)必要自己從零做預(yù)訓(xùn)練,完全可以選一個(gè)特別牛的、已經(jīng)預(yù)訓(xùn)練好的模型?!?這就像小孩子已經(jīng)通過(guò)書(shū)本(互聯(lián)網(wǎng)數(shù)據(jù))認(rèn)識(shí)了世界,現(xiàn)在要做的是帶他去工廠實(shí)地操作。

值得注意的是,北京人形研發(fā)的WoW(我悟)世界模型,并非單一模型,而是一個(gè)系統(tǒng)。


WoW(我悟)世界模型

這套系統(tǒng)基于北京人形自研的SOPHIA架構(gòu)建立了一套“雙向反饋機(jī)制”, 大腦(VLM)會(huì)對(duì)世界模型生成的視頻進(jìn)行反饋,這些反饋被引入強(qiáng)化學(xué)習(xí)(RL)架構(gòu),作為獎(jiǎng)勵(lì)函數(shù)去微調(diào)世界模型。這種機(jī)制迫使生成的內(nèi)容盡量符合物理規(guī)律,而非僅僅看起來(lái)逼真 。

在唐劍看來(lái),包括WoW在內(nèi)的所有世界模型都承載著三個(gè)關(guān)鍵使命:

一是輔助大腦自主進(jìn)化,當(dāng)機(jī)器人遇到新任務(wù)時(shí),WoW結(jié)合蒙特卡洛樹(shù)搜索(MCTS)算法,在數(shù)字世界里預(yù)演無(wú)數(shù)種路徑,并由獎(jiǎng)勵(lì)模型打分。這些“模擬數(shù)據(jù)”反過(guò)來(lái)微調(diào)VLM,讓大腦在沒(méi)有實(shí)戰(zhàn)的情況下學(xué)會(huì)解決問(wèn)題。

二是直接生成大量符合物理規(guī)律的機(jī)器人操作軌跡視頻,解決行業(yè)最頭疼的訓(xùn)練數(shù)據(jù)短缺問(wèn)題。

三是直接控制機(jī)器人的操作。目前,WoW未來(lái)不僅能生成視頻,還能像VLA一樣,將生成的視頻轉(zhuǎn)化為光流,再映射到關(guān)節(jié)角度,直接生成控制信號(hào)驅(qū)動(dòng)機(jī)器人。

在“大腦”提供智能的基礎(chǔ)上,具身“小腦”負(fù)責(zé)具體操作(Do it)。它分為兩個(gè)子平臺(tái),一個(gè)負(fù)責(zé)具身操作,涵蓋元技能庫(kù)、泛化抓取、技能拆解和錯(cuò)誤處理;一個(gè)負(fù)責(zé)具身運(yùn)控, 負(fù)責(zé)全身控制、雙臂協(xié)作、穩(wěn)定行走和移動(dòng)導(dǎo)航(SLAM)。

小腦的核心則是跨本體的VLA(視覺(jué)-語(yǔ)言-動(dòng)作)模型XR-1,負(fù)責(zé)將大腦的抽象指令轉(zhuǎn)化為具體的、毫秒級(jí)的電機(jī)控制信號(hào),確保機(jī)器人走得穩(wěn)、抓得準(zhǔn)。

11月13日,北京人形全面開(kāi)源了一項(xiàng)技術(shù)成果,即具身智能VLM模型——Pelican-VL(天鶘)。

在由1000多張英偉達(dá)A800 GPU組成的算力集群上,團(tuán)隊(duì)消耗了數(shù)萬(wàn)GPU小時(shí),從海量原始數(shù)據(jù)中蒸餾出數(shù)億Token的高質(zhì)量元數(shù)據(jù),最終訓(xùn)練出了這個(gè)覆蓋7B、72B參數(shù)規(guī)模的具身多模態(tài)大腦。在基線基礎(chǔ)上性能提升20.3%。

如果你對(duì)“72B參數(shù)”或“20.3% 性能提升”這樣的數(shù)字不敏感,不妨想象這樣一個(gè)場(chǎng)景:面對(duì)“把鞋子放鞋架、垃圾扔桶里、衣服放洗衣機(jī)”這樣一連串復(fù)雜的復(fù)合指令,搭載Pelican-VL(天鶘)的機(jī)器人能像人類一樣,先環(huán)顧房間構(gòu)建語(yǔ)義地圖,再自動(dòng)拆解任務(wù)序列,依次移動(dòng)去執(zhí)行。它不僅能“看圖聽(tīng)話”,還能在執(zhí)行中不斷根據(jù)環(huán)境變化調(diào)整計(jì)劃。

慧思開(kāi)物這套“大腦+小腦”的架構(gòu)形成了完整的閉環(huán):由具身“大腦”進(jìn)行任務(wù)規(guī)劃,調(diào)用具身“小腦”的技能庫(kù)執(zhí)行具體動(dòng)作,并將執(zhí)行反饋傳遞回大腦。

不過(guò),技術(shù)閉環(huán)只是產(chǎn)業(yè)快速發(fā)展的起點(diǎn)。真正的挑戰(zhàn)在于,如何讓這套系統(tǒng)走出實(shí)驗(yàn)室,在真實(shí)、復(fù)雜的產(chǎn)業(yè)環(huán)境中落地應(yīng)用。

3.眾人拾柴火焰高

北京人形造平臺(tái)的核心目的,實(shí)則是為具身智能軟硬件生態(tài)提供一個(gè)載體。

平臺(tái)必須向下連接多種規(guī)格、多種形態(tài)的硬件本體,上層長(zhǎng)出豐富多元、融合各場(chǎng)景業(yè)務(wù)邏輯的機(jī)器人軟件應(yīng)用。只有當(dāng)硬件、平臺(tái)、應(yīng)用三者形成閉環(huán),才能讓具身智能的技術(shù)創(chuàng)新跳出“低效”“碎片化”“重復(fù)建設(shè)”的惡性循環(huán),找到自己的“scaling law”。

而這項(xiàng)系統(tǒng)工程,無(wú)法只靠一兩家公司完成,北京人形希望成為在行業(yè)背后推一把的力量。

10月19日,在IROS 2025(2025年智能機(jī)器人與系統(tǒng)國(guó)際會(huì)議)期間,北京人形正式開(kāi)放了慧思開(kāi)物SDK,為開(kāi)發(fā)者提供了從技能調(diào)用到場(chǎng)景部署的完整工具鏈。

“這就像當(dāng)年寫(xiě)安卓APP的企業(yè),”唐劍比喻道,“很多二次開(kāi)發(fā)企業(yè)可能就幾個(gè)人,核心是把不同場(chǎng)景的業(yè)務(wù)邏輯寫(xiě)進(jìn)機(jī)器人的腦袋里?!?無(wú)論是導(dǎo)覽、分揀還是特種作業(yè),開(kāi)發(fā)者不需要懂復(fù)雜的運(yùn)控算法或大模型訓(xùn)練,只需利用SDK這個(gè)“炮彈”,去攻克各自領(lǐng)域的山頭。

目前發(fā)布的版本主要針對(duì)具備一定基礎(chǔ)的高級(jí)開(kāi)發(fā)者。唐劍透露,預(yù)計(jì)在明年第一季度,將釋放帶有GUI(圖形用戶界面)的版本,甚至支持低代碼/零代碼開(kāi)發(fā),進(jìn)一步降低門(mén)檻。

目前的SDK已能支持具身天工、天軼、以及Franka和UR機(jī)械臂等多種本體。

除了工具鏈,北京人形還在積極打破“數(shù)據(jù)荒”。唐劍透露,北京人形近期可能會(huì)開(kāi)源至少30萬(wàn)條軌跡數(shù)據(jù)。這些數(shù)據(jù)不僅包含視覺(jué)信息,更關(guān)鍵的是包含了觸覺(jué)傳感器數(shù)據(jù),這對(duì)于精細(xì)操作至關(guān)重要。

同時(shí),作為“國(guó)地共建”中心,北京人形開(kāi)始介入行業(yè)基礎(chǔ)規(guī)范建設(shè),包括牽頭制定《人形機(jī)器人智能化分級(jí)》標(biāo)準(zhǔn),并聯(lián)合北航、優(yōu)必選等機(jī)構(gòu)立項(xiàng)《具身智能從業(yè)人員能力要求》,試圖填補(bǔ)行業(yè)人才評(píng)價(jià)和數(shù)據(jù)規(guī)范的空白。

一切技術(shù)和生態(tài)的努力,終極目的都是讓機(jī)器人走入千行百業(yè)。但這依然步履維艱。

唐劍坦言:“我們的主要收入還是機(jī)器人銷售,客戶主要是教育科研機(jī)構(gòu)?!边@印證了行業(yè)的一個(gè)尷尬現(xiàn)狀:最先為具身智能買單的,依然是把機(jī)器人買回去做研究的人,而不是讓機(jī)器人去干活的人。

真實(shí)的應(yīng)用場(chǎng)景需求極其復(fù)雜。目前,北京人形正在推進(jìn)多個(gè)POC(概念驗(yàn)證)項(xiàng)目,試圖跨越從Demo到“實(shí)地干活”的鴻溝。

例如,北京人形和電科院達(dá)成合作,機(jī)器人嘗試進(jìn)行復(fù)雜的電力巡檢任務(wù);在工業(yè)場(chǎng)景,公司也和福田康明斯工廠達(dá)成合作,讓天軼機(jī)器人嘗試連續(xù)搬運(yùn)箱子。


具身天工在工廠搬箱子

唐劍告訴「甲子光年」:“現(xiàn)在的機(jī)器人可以接受語(yǔ)音指令,比如‘拿兩個(gè)箱子放在架子第二層’,這些都能實(shí)現(xiàn)?!?/p>

4. 讓機(jī)器人走入千家萬(wàn)戶的夢(mèng)想

阻礙機(jī)器人從實(shí)驗(yàn)室走向千家萬(wàn)戶、千行百業(yè)的最大障礙,是泛化能力。

“機(jī)器人泛化能力不夠的話,就單說(shuō)開(kāi)門(mén)這一個(gè)我們?nèi)祟惪雌饋?lái)很簡(jiǎn)單的動(dòng)作,一旦遇到門(mén)顏色變了、把手形狀變了,或者光線暗了一點(diǎn),它就打不開(kāi)了?!碧苿ρa(bǔ)充道。

這正是VLA模型和世界模型當(dāng)下最真實(shí)的瓶頸。

在學(xué)術(shù)論文中,機(jī)器人往往是在固定的桌面上操作固定的物體;但在現(xiàn)實(shí)中,沒(méi)有兩片完全相同的樹(shù)葉,也沒(méi)有兩個(gè)完全相同的工廠環(huán)境。唐劍冷靜指出:“老實(shí)講,直到今年大家才覺(jué)得VLA進(jìn)化到確實(shí)能用了。之前基本都停留在學(xué)術(shù)文章上?!?/p>

客觀來(lái)看,VLA模型在訓(xùn)練時(shí)與特定的機(jī)器人本體綁定較強(qiáng)。換一個(gè)機(jī)器人形態(tài),例如從人形機(jī)器人換成四足機(jī)器狗,甚至是換一種機(jī)器人本體構(gòu)型,模型就需要相應(yīng)后訓(xùn)練數(shù)據(jù)重新適配。

目前,北京人形的XR-1已經(jīng)能夠在7款機(jī)械臂上具備泛化能力,但這種泛化能力來(lái)之不易。北京人形采集了這七款機(jī)械臂的運(yùn)動(dòng)軌跡數(shù)據(jù),并進(jìn)行相應(yīng)訓(xùn)練才實(shí)現(xiàn)的。在實(shí)際部署到特定場(chǎng)景時(shí),還需要選定最終的本體,并針對(duì)該場(chǎng)景采集幾十到上百條數(shù)據(jù)對(duì)模型進(jìn)行微調(diào),以確保其在該場(chǎng)景下達(dá)到最優(yōu)性能。

整體上看,VLA模型要具備泛化能力,整個(gè)過(guò)程相對(duì)繁瑣且不夠經(jīng)濟(jì)。

聊到最后,我們問(wèn)了唐劍一個(gè)問(wèn)題:“如果現(xiàn)在讓你寫(xiě)一篇論文,你最想寫(xiě)什么?”

唐劍沉思片刻回答,自己想去深度反思VLA架構(gòu)本身到底是不是具身操作的最優(yōu)解,去解決行業(yè)最底層的泛化難題。

這種對(duì)底層技術(shù)路徑的審視,也塑造了他對(duì)更宏大技術(shù)命題的獨(dú)特看法。

他不熱衷于爭(zhēng)論特定的架構(gòu)是否收斂,也不迷信某個(gè)模型是否已經(jīng)涌現(xiàn)智能,“我覺(jué)得有可能是殊途同歸,多種架構(gòu)最終都能實(shí)現(xiàn)智能涌現(xiàn)。”

相比之下,他更看重機(jī)器人在物理世界中的實(shí)際價(jià)值:“誰(shuí)有本事做個(gè)機(jī)器人,讓它到千家萬(wàn)戶都能開(kāi)門(mén),這就叫牛?!?/strong>

在唐劍看來(lái),真正的具身智能不能停留在論文指標(biāo),而應(yīng)體現(xiàn)在每一扇能被穩(wěn)定打開(kāi)的門(mén)上。

在2023年的冬天,唐劍就是這樣想的;而在2025年的冬天,雖然還有未完成的目標(biāo),但不同的是,他的身邊有了更多志同道合的人。

他們恰恰在踐行著北京人形作為“國(guó)家具身智能基建”的真正價(jià)值——不止于探索技術(shù)的上限,更要守住產(chǎn)業(yè)落地的底線,讓機(jī)器人在真實(shí)的物理世界里,穩(wěn)定、可靠地把事做成。

(封面圖及文中配圖來(lái)源:北京人形)



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
擺爛!曼聯(lián)24歲懶王獻(xiàn)戰(zhàn)犯表演:7數(shù)據(jù)掛零 場(chǎng)上蠕動(dòng)+跑都不想跑

擺爛!曼聯(lián)24歲懶王獻(xiàn)戰(zhàn)犯表演:7數(shù)據(jù)掛零 場(chǎng)上蠕動(dòng)+跑都不想跑

風(fēng)過(guò)鄉(xiāng)
2025-12-27 06:44:54
大烏龍!0分張鎮(zhèn)麟?yún)⒓淤惡蟀l(fā)布會(huì):被告知沒(méi)資格 無(wú)奈趕緊離開(kāi)

大烏龍!0分張鎮(zhèn)麟?yún)⒓淤惡蟀l(fā)布會(huì):被告知沒(méi)資格 無(wú)奈趕緊離開(kāi)

醉臥浮生
2025-12-27 22:06:14
法國(guó)、德國(guó)、英國(guó)、加拿大、丹麥、西班牙、意大利、荷蘭、挪威等14國(guó)發(fā)表聯(lián)合聲明

法國(guó)、德國(guó)、英國(guó)、加拿大、丹麥、西班牙、意大利、荷蘭、挪威等14國(guó)發(fā)表聯(lián)合聲明

每日經(jīng)濟(jì)新聞
2025-12-25 07:29:06
中山大學(xué)教授太不要臉了!高中生兒子發(fā)表3篇SCI論文,被質(zhì)疑學(xué)術(shù)造假

中山大學(xué)教授太不要臉了!高中生兒子發(fā)表3篇SCI論文,被質(zhì)疑學(xué)術(shù)造假

回旋鏢
2025-12-27 19:14:15
美國(guó)頁(yè)巖油陷阱!廢水回注正在失控,或引發(fā)人類巨大災(zāi)難

美國(guó)頁(yè)巖油陷阱!廢水回注正在失控,或引發(fā)人類巨大災(zāi)難

新浪財(cái)經(jīng)
2025-10-07 21:58:33
借3500元10天后要還4970元,蘋(píng)果應(yīng)用商場(chǎng)一借款A(yù)pp遭投訴:未審核強(qiáng)制放款,私人賬戶轉(zhuǎn)賬,年化利率超1500%

借3500元10天后要還4970元,蘋(píng)果應(yīng)用商場(chǎng)一借款A(yù)pp遭投訴:未審核強(qiáng)制放款,私人賬戶轉(zhuǎn)賬,年化利率超1500%

大風(fēng)新聞
2025-12-27 21:18:11
輪船拉導(dǎo)彈!美國(guó)萬(wàn)萬(wàn)沒(méi)有想到東大的反擊計(jì)劃會(huì)如此極端!

輪船拉導(dǎo)彈!美國(guó)萬(wàn)萬(wàn)沒(méi)有想到東大的反擊計(jì)劃會(huì)如此極端!

阿龍聊軍事
2025-12-27 22:07:28
徐湖平被查,兒子兒媳光速跑路!這家人的操作比宮斗劇還“精彩”

徐湖平被查,兒子兒媳光速跑路!這家人的操作比宮斗劇還“精彩”

畫(huà)夕
2025-12-27 20:28:24
張鎮(zhèn)麟加盟首次0分!上海大勝送四川7連敗 古德溫20+5+6

張鎮(zhèn)麟加盟首次0分!上海大勝送四川7連敗 古德溫20+5+6

醉臥浮生
2025-12-27 21:16:05
小米也漲價(jià)了!內(nèi)存壓力傳導(dǎo)至手機(jī)廠商,業(yè)界稱終端再不漲明年必定虧損

小米也漲價(jià)了!內(nèi)存壓力傳導(dǎo)至手機(jī)廠商,業(yè)界稱終端再不漲明年必定虧損

澎湃新聞
2025-12-26 20:22:27
姜昆風(fēng)波事態(tài)升級(jí),具體行程被扒出,當(dāng)事人曝視頻并不是拼接

姜昆風(fēng)波事態(tài)升級(jí),具體行程被扒出,當(dāng)事人曝視頻并不是拼接

凡知
2025-12-27 17:31:13
再反轉(zhuǎn)!助理辟謠姜昆沒(méi)出國(guó),網(wǎng)友曝飛機(jī)上合照,這次又社死

再反轉(zhuǎn)!助理辟謠姜昆沒(méi)出國(guó),網(wǎng)友曝飛機(jī)上合照,這次又社死

知法而形
2025-12-26 23:23:24
保定大量商戶突然關(guān)閉,整個(gè)街道冷冷清清

保定大量商戶突然關(guān)閉,整個(gè)街道冷冷清清

映射生活的身影
2025-12-27 18:09:05
國(guó)家終于出手了!被牽連的何止李梓萌,全紅嬋成龍也沒(méi)逃過(guò)

國(guó)家終于出手了!被牽連的何止李梓萌,全紅嬋成龍也沒(méi)逃過(guò)

暖心萌阿菇?jīng)?/span>
2025-12-27 01:25:19
黃循財(cái):不允許任何國(guó)家和企業(yè)借新加坡為中轉(zhuǎn)點(diǎn)轉(zhuǎn)運(yùn)芯片出口中國(guó)

黃循財(cái):不允許任何國(guó)家和企業(yè)借新加坡為中轉(zhuǎn)點(diǎn)轉(zhuǎn)運(yùn)芯片出口中國(guó)

百態(tài)人間
2025-12-27 16:40:18
太稀罕了!深圳一家公司通知供應(yīng)商趕緊對(duì)賬,12月底結(jié)清所有貨款

太稀罕了!深圳一家公司通知供應(yīng)商趕緊對(duì)賬,12月底結(jié)清所有貨款

火山詩(shī)話
2025-12-27 09:04:18
前一夜還劍拔弩張,今天40分鐘就談攏,打了20天的泰柬為何突然停手?

前一夜還劍拔弩張,今天40分鐘就談攏,打了20天的泰柬為何突然停手?

上觀新聞
2025-12-27 17:32:06
中方下“逐客令”,直言:一粒大米也不要,直接叫停900萬(wàn)噸訂單

中方下“逐客令”,直言:一粒大米也不要,直接叫停900萬(wàn)噸訂單

愛(ài)吃醋的貓咪
2025-12-27 16:24:13
75歲港星小36歲未婚妻被曝已婚,冬至與丈夫在老家吃飯,兒子16歲

75歲港星小36歲未婚妻被曝已婚,冬至與丈夫在老家吃飯,兒子16歲

觀察鑒娛
2025-12-27 10:00:22
AI大神吳恩達(dá):很多計(jì)算機(jī)專業(yè)應(yīng)屆生找不到工作,是因?yàn)楦咝Un程嚴(yán)重滯后

AI大神吳恩達(dá):很多計(jì)算機(jī)專業(yè)應(yīng)屆生找不到工作,是因?yàn)楦咝Un程嚴(yán)重滯后

爆角追蹤
2025-12-27 12:33:54
2025-12-28 03:15:00
甲子光年
甲子光年
中國(guó)科技產(chǎn)業(yè)化前沿智庫(kù)
3302文章數(shù) 9254關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

美媒:特朗普顯然觸及了中國(guó)的紅線 中方怒了

頭條要聞

美媒:特朗普顯然觸及了中國(guó)的紅線 中方怒了

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂(lè)要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

注意,開(kāi)始拉物價(jià)了!

汽車要聞

好音響比大屏更重要?車企開(kāi)始“聽(tīng)”用戶的

態(tài)度原創(chuàng)

家居
房產(chǎn)
健康
藝術(shù)
軍事航空

家居要聞

格調(diào)時(shí)尚 智慧品質(zhì)居所

房產(chǎn)要聞

年銷20億+!中交·藍(lán)色港灣用好房子致敬好生活

這些新療法,讓化療不再那么痛苦

藝術(shù)要聞

驚艷!這件木雕美得讓人心動(dòng),絕對(duì)不容錯(cuò)過(guò)!

軍事要聞

俄稱已控制庫(kù)皮揚(yáng)斯克 正清繳烏軍

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版