国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

圓桌論壇:具身數(shù)據(jù)如何塑造行業(yè)未來? | GAIR 2025

0
分享至

雷峰網(wǎng)訊 高質(zhì)量數(shù)據(jù)正在成為具身本體性能突破和成本控制的瓶頸。在具身智能從技術演示走向規(guī)模落地的關鍵轉(zhuǎn)折期,對于數(shù)據(jù)的需求和爭論也變得越發(fā)火熱。從遙操作到UMI,從動捕到仿真數(shù)據(jù),具身數(shù)據(jù)的未來在數(shù)采工廠,還是名為In-the-wild的美好愿景?

2025年12月13日,第八屆GAIR大會的數(shù)據(jù)&一腦多形專場,舉辦了主題為具身數(shù)據(jù)的圓桌論壇。圓桌主持人為英諾天使基金 ED,石麻筆記主理人王建明,并邀請了諾亦騰機器人創(chuàng)始人戴若犁,極數(shù)迭代CEO、深圳AIRS訪問研究員佟顯喬,鹿明機器人CTO丁琰,共同圍繞具身數(shù)據(jù)的質(zhì)量、采集以及數(shù)據(jù)飛輪等議題,展開了一場深度對話。

對機器人而言,什么是好的數(shù)據(jù)?王建明以數(shù)據(jù)質(zhì)量切入,幾位嘉賓就“以終為始”達成了共識,最終的模型性能、訓練中機器人的受益程度反映著數(shù)據(jù)的質(zhì)量。丁琰進一步指出,采集成本和各種數(shù)采方式對于不同場景和硬件的適配與否,都是決定數(shù)據(jù)質(zhì)量的關鍵環(huán)節(jié)。

未來的數(shù)據(jù)采集方式或?qū)⒆呦蚨嘣?。作為一家有?shù)據(jù)能力的創(chuàng)業(yè)公司,丁琰表示,鹿明機器人正在籌建自己的數(shù)采廠。出于成本考慮,現(xiàn)階段采用 UMI方式進行數(shù)據(jù)采集,但未來仍可能引進更多方案。“遙操作、 UMI(Universal Manipulation Interface)、動捕、仿真數(shù)據(jù),存在即合理?!倍$鼜娬{(diào)。

戴若犁就In-the-wild的數(shù)據(jù)采集方式發(fā)出了提醒,他指出這是一種高度考驗技術水平的方案,其落地需要先后克服軟硬件易用性、組織管理能力兩道難關,而在當前的時間節(jié)點,邁過前者的技術門檻無疑更為重要。

具體而言,在采集階段需要低摩擦、高精度、多模態(tài)的數(shù)采設備,野采數(shù)據(jù)的利用,還需要從稀疏原始數(shù)據(jù)中得到稠密信息的技術方案。戴若犁認為,一條可行的鏈路是通過世界模型進行先驗估計,輸出更豐富的模態(tài)及維度數(shù)據(jù)。相較之下,遠未到比拼人力組織能力的時間。

佟顯喬認為,數(shù)據(jù)采集行業(yè)仍處于早期階段,數(shù)據(jù)、本體、模型公司仍在相互磨合。不同的模型公司提出了不同的需求,這意味著數(shù)據(jù)公司不能停留于堆人力的體力活階段,而是要懂模型、給建議。“模型公司也需要你的knowledge”,佟顯喬強調(diào),“一個個批次之后,大家才能一起做得更好?!?/p>

以下是此次圓桌討論的精彩分享,AI科技評論進行了不改變原意的編輯整理:

王建明:我們這個panel的話題是數(shù)據(jù),所以我的第一個問題,是想請各位先定義一下,對于機器人來說什么是好的數(shù)據(jù)?請戴博先開始吧。

戴若犁:我覺得還是以終為始,最終在訓練模型、機器人的時候能夠獲得收益,而且收益比較高的數(shù)據(jù)是好數(shù)據(jù)。

佟顯喬:我覺得這一定是從最后的模型出發(fā),什么數(shù)據(jù)最后能訓練出一個比較好的模型,就是好的數(shù)據(jù)。我們今天基本上是這樣定義,但是因為今天模型的狀態(tài)沒有收斂,用什么樣的數(shù)據(jù)能訓練出什么樣的模型,不知道,所以其實也很難定義哪個是好的數(shù)據(jù)。

丁琰:第一數(shù)據(jù)必須要能訓練出一個模型,才是比較好的數(shù)據(jù)。第二點是數(shù)據(jù)收集成本要比較低,如果特別高,那整個行業(yè)還是接受不了。還有一點,就是數(shù)據(jù)的采集要適應場景、適應硬件。

王建明:剛才大家都提到,好的數(shù)據(jù)首先對于模型訓練要有好的效果,那么在這個前提下,數(shù)據(jù)公司怎么知道如何提供好的數(shù)據(jù)?

通常來說,這些數(shù)據(jù)都是提供給模型公司或者本體公司,模型效果掌握在客戶的手上。是客戶知道自己想要什么樣的數(shù)據(jù),找到數(shù)據(jù)公司來定點運營,還是數(shù)據(jù)公司自己知道什么樣的數(shù)據(jù)對模型公司好,來反哺給模型公司?你們認為在整個具身智能的鏈路里,數(shù)據(jù)公司跟模型、本體或者應用公司之間,關于數(shù)據(jù)這件事情的認知,是一個什么樣的一個鏈路呢?

戴若犁:目前在前端商業(yè)實踐上,我看到的是反過來的。不是說模型公司想得特別透徹,就能夠給出命題作文,而是如果有足夠體量的數(shù)據(jù),且里邊蘊含的信息足夠多,就能夠訓出效果。如果訓不出效果其實有很多原因,可能是模型架構(gòu)不對,可能訓練方法不對,這個鍋不一定是數(shù)據(jù)來背。所以我目前看到的是,如果你有足量且明確知道這一類數(shù)據(jù)里面蘊含足夠多的信息有待挖掘,那其實對于模型是有反向影響能力的。比如你有一個特別大體量的數(shù)據(jù)集,即使這個數(shù)據(jù)集的模態(tài)、維度、精度和傳感器的方式方法選擇跟模型方原本的期待并不一樣,他們也會愿意去改變訓練的方式,甚至于讓模型的架構(gòu)去適應數(shù)據(jù)集本身。

佟顯喬:我看到的其實跟戴總看到的比較類似,很多時候模型公司找到我們是說,這樣做行不行,那樣做行不行,他們其實也需要你的knowledge。在這個過程中,大家還有一個磨合,比如一開始說這樣采,很可能采完這一批次以后,下一批他說我覺得這樣做應該更好。

所以其實目前來看,可能因為行業(yè)還是早期階段,所以沒有一個統(tǒng)一的方式,大家都是在相互磨合。甚至你會發(fā)現(xiàn)不同模型公司,需求可能千差萬別,提的要求也很不一樣。所以作為一個數(shù)據(jù)公司,我覺得不能只是純粹做labor的工作,你還是要懂一些模型,你需要跟他們?nèi)ソ涣?,給他們建議,這樣大家才能一起做得更好。

丁琰:我還是比較認同佟博士的觀點,我認為就是做數(shù)據(jù)和做算法的公司是分不開的,數(shù)據(jù)和算法是不拆家的。到底什么是算法?你要搞一些非常高深的模型架構(gòu),做一些很創(chuàng)新的探索,可能沒有到這種級別。但是你如果要把市面上常見的主流算法和數(shù)據(jù)模型全部玩熟,我覺得還是非常非常必要的。不然的話,你采出來的數(shù)據(jù)很多是很臟的,基本上不能用。

跟行業(yè)里的人進行交流的時候,我就發(fā)現(xiàn)很多公司沒有訓練基礎模型的能力,他們對于數(shù)據(jù)的理解是非常簡單的,認為只要按照指令把數(shù)據(jù)給采了就行。但其實這些數(shù)據(jù)往往是不能用的。

每個任務都需要進行一些特定的任務設計,比如大家都會疊衣服,但其實這里面技巧性非常強。你這個技巧怎么來的?其實是在采了一堆數(shù)據(jù)之后訓,發(fā)現(xiàn)有一些問題,然后再去改進采集技巧,再來訓,最終才能得到一個比較好的效果。在這個數(shù)據(jù)采集和算法迭代的過程中,你會獲得很多know-how和insight,這些東西是在數(shù)據(jù)公司是非常關鍵的,這些東西才是真正寶貴的價值,而不是只是把這個數(shù)據(jù)采完交付給客戶,客戶愛怎么訓怎么訓就得了。這個是完全不一樣的。

另外一點就是,說到底是數(shù)據(jù)決定,我認為現(xiàn)階段做算法的人和做數(shù)據(jù)的人要不斷地進行迭代,最后才能去完成這個東西。像我們公司就是,我們自己也做一些基礎模型的訓練,然后會對數(shù)據(jù)本身有一些 know-how 和insight,知道怎么采。但是我們自己得到的這些經(jīng)驗教訓,可能只能針對于部分任務,比如說pick and place,或者是針對于工業(yè)場景,因為我們還是做工業(yè)場景比較多。但如果是做精細化的任務,比如我今天跟客戶去聊,系鞋帶、疊衣服、疊紙盒子,這些任務就是另外一種 know-how和insight了??赡艿酶蛻粢黄鸪砷L,才能獲得很好的know-how和積累。

王建明:據(jù)我自己觀察,行業(yè)其實階段性地對不同類型數(shù)據(jù)的側(cè)重點是不一樣的。比如從2023年下半年開始,同構(gòu)遙操這種數(shù)據(jù)采集范式被帶火了。 UMI這個工作是23年年末地,但實際上它近期被Sunday Robotics 還有 the generalist 帶火了。24年我覺得數(shù)采還是以同構(gòu)遙操為主,到了今年上半年,有一些動捕的數(shù)據(jù)采集范式也被帶火了,我感覺肯定也有一些北美進展的淵源。

就各位的觀察,目前中美在數(shù)據(jù)這個問題上面,你們覺得最大的非共識是什么?共識又是什么?你們或多或少跟北美的一些客戶有聯(lián)系,你認為他們現(xiàn)在重點的這個數(shù)據(jù)采集范式又是什么?

戴若犁:首先我覺得現(xiàn)在中美之間在機器人上完全沒有代差。他們不是開玩笑嗎,說Our Chinese better than your Chinese。我大概每兩個月在灣區(qū)待兩周,在灣區(qū)談生意需要說英文的時間還是挺少的,其實都是同一撥人,同學、朋友、師兄、師弟、學生,一起聊天。所以首先我沒有覺得中美有特別大的,共識方面的差異,大家其實都還挺一樣的。但我覺得中美在數(shù)據(jù)上面其實有一個特別大的區(qū)別,就是美國好像沒有地方政府的助力。數(shù)據(jù)這件事情,特別是數(shù)采廠,有地方政府助力,就會比較傾向于本體公司和地方政府合作,然后得到非常大的機會,拿到當期收入去建以遙操作為主的數(shù)采中心,也就比較少有機會孵化出來像 generative 或者Sunday 這樣In-the-wild或者 UMI的方式去采數(shù)據(jù)。

所以這個分水嶺我覺得很有意思。就是如果沒有這么多特別eager地想要幫助創(chuàng)業(yè)者,幫助企業(yè)招商引資的地方政府,可能就不會有這么多的數(shù)采中心用遙操作去采數(shù)據(jù),可能也就會促使像 UMI這樣的方式早一點在中國落地。

這件事情完全不是因為技術的共識有差異或有代差導致的,我覺得反而是一種資源詛咒。我小時候打籃球,彈跳非常好,雙手隨便抓筐哐哐地扣,但是我技術非常差。我現(xiàn)在歲數(shù)大了,打球打得越來越差,被原來打球沒我打得好的人隨便過,我這就是資源詛咒,因為我小時候資源太豐富了。所以我覺得這就可能不是代差,而是資源詛咒。

王建明: UMI這樣的方式去年出來,我感覺當時可能也有一些人在關注,但實際上是今年有一些北美公司把它release出來,才受到更廣泛的關注。

戴若犁: UMI就是很合理呀。 UMI其實是human-centric,它只是末端執(zhí)行器end effector 被置換了的human-centric,所以說它就是很合理,它somehow可以跨本體。

王建明:丁博士, UMI是你之前一個比較著名的工作,可能在這種數(shù)據(jù)采集方式上面,你們應該是第一批關注,并且在這個基礎上去迭代做工程化的。可以聊聊你們對 UMI的看法嗎?

丁琰:這項工作其實我們在24年3月份就開始做了,當時在上海 AI Lab的時候就啟動了這個項目,做到現(xiàn)在一直沒有換過。我確實看到了數(shù)采方式從遙操作到 UMI,一路在迭代的過程。

其實我感覺中美之間是有代差的,至少在模型,或者是引領具身智能發(fā)展方向上有,可能北美那邊的模型或者資源還是比較多。因為之前我們做 UMI的時候還是比較默默無聞的,沒有人關注,整個大陸好像只有我們一家公司,或者只有我們這一個團隊在做這件事,也是我們自己一直在迭代。直到Sunday Robotics發(fā)布出一個非常牛逼的模型,基本上全中國或者全世界的關注點才轉(zhuǎn)向 UMI。我們的產(chǎn)品剛好在這個時間點工程化出來了,基本上整個具身智能圈子的同行都在瘋狂地采購和咨詢,所以我覺得確實美國那塊的人還是在引領一些潮流和方向。特別是 UMI這個東西,如果只有我們一家公司來做,其實我很難想象到底什么時候能火起來。雖然我們自己很堅信 UMI,但是可能整個中國的同行并不是很堅信。很感謝美國的這些公司引領這些潮流。

然后關于非共識,在一些技術路線上其實是有一點點非共識,但是gap很小,可能很快就彌補上來了。等到Sunday Robotics出來之后,中國的公司就一擁而上地探索 UMI,很快就把這個非共識給填起來了。

我們自己在做 UMI的時候,其實也會有一些自己的know-how 和insight。舉個例子,Sunday Robotics其實更偏向于一種后處理的方式,它把設備分發(fā)給Airbnb那些工作人員,或者是眾包人員去采,采完之后再把它收集回來處理。我們覺得這種方式稍微有一點點不太合理,因為我自己在建數(shù)采廠的過程中,發(fā)現(xiàn)人員是非常難管理的。如果是通過這種方式去做,后續(xù)處理流程的時間和消耗是異常的巨大。所以我們自己是選取的前處理,前處理的意思就是把時間花在前面,不要花在后面,在采集過程中我就及時評估和反饋數(shù)據(jù)到底好還是不好,有什么問題當場就處理掉,最后收集起來的數(shù)據(jù)100%是合格的。

剛剛那個戴博士說的human-centric data其實有一點點像 UMI,但是 UMI又很特殊,它更多針對于二指夾爪這一塊。真正的human-centric更多地偏向五指,二指比較特殊,但是二指又是一個很重要的領域,因為整個中國使用二指夾爪的這個比例份額我認為還是大于99.9% 的,用五指靈巧手的份額目前來看偏少。主要是這個硬件本身不是特別穩(wěn)定,所以大家用起來,真正落地的還是二指為主, UMI就在這個生態(tài)里面占據(jù)了一個比較重要位置。雖然它屬于human-centric這個分支,但是它又跟五指有區(qū)別,這是我們對 UMI的認知。

當然 UMI其實還有很多問題,比如說active perception,要不要帶頭部視角?我們在跟客戶聊的過程中就會發(fā)現(xiàn),因為原始的 UMI只有兩個夾爪,只有手部這兩個相機,這種configuration的配置它對硬件設計就會有一些要求,它會希望這個腕部相機的畫面是稍微比較大的,它可以獲得更多environment的feature,這樣就利于訓練嘛。

但是如果你加上一個頭部相機,那還需不需要這么大的一個畫面?這也是一個問題。你如果加上一個頭部的畫面,它又會引申出一些其他的問題。比如坐標系之間的對齊,或者是你用哪個坐標系。還有頭部要不要動?對于輪式雙臂來說,頭部一般是固定的,沒有這個自由度。如果你想引入一個active perception,有一些工作是在頭上加了一個小機械臂,把這個小機械臂上掛一個攝像頭,這就會彌補active perception所帶來的自由度問題。但是這樣又引發(fā)一些其他的問題,比如市面上沒有這種機器人,頭上還長一個機械臂,所以說這些問題其實都沒有被解決。這個 UMI的探索之路其實還是很長很長的,至少目前來說,我們覺得整個中國大陸或者全世界的具身智能圈子,對這方面的探索基本上屬于空白,或者說沒有做很多。我覺得在這方面,可能中美之間都會有一些這個共識或非共識在里面。

王建明:對。剛才戴博也說到了資源稟賦的問題,我確實也觀察到,北美它有很多配套模型公司的數(shù)采或者數(shù)據(jù)處理公司,或者設備公司,可能它們都是專門去服務某一些大公司的。那國內(nèi)的話,我們目前當然看到了有一些數(shù)據(jù)相關的創(chuàng)業(yè)公司,但更多的還是政府支持的數(shù)采工廠。

所以我的一個問題是,這種這種政府支持的數(shù)采工廠是不是真的可以解決數(shù)據(jù)問題?在這個過程中,作為有一定數(shù)據(jù)能力的創(chuàng)業(yè)公司,你們覺得應該怎么跟這些數(shù)采工廠合作?或者有什么建議給到這些有資源稟賦的單位?

佟顯喬:我覺得中國這兩年,各個地方政府大量地建訓練廠,對行業(yè)肯定是有促進作用。但是現(xiàn)在建的大量訓練場都是用的遙操方式,那7這是不是正確的?這個也很難說。

再一個,政府肯定是滯后的。如果以后的方向變了,以這種In-the-wild的方式做數(shù)采,可能他也會改變。所以就剛才討論的這個問題,我覺得如果以后通用機器人的能力要到來的話,一定是需要In-the-wild這種方式的數(shù)據(jù),因為首先它必定要跨本體,第二一定是要大量數(shù)據(jù)。那用任何一個本體去采,即使你有那么多訓練場,也不太可能達到這個目標。

各地訓練場是地方政府投資,然后買本體,給很多做本體的公司帶來了收入。政府肯定也不想做賠錢的生意,采完的數(shù)據(jù)要賣回去,那數(shù)據(jù)賣回去以后,大家拿數(shù)據(jù)訓練模型,可能是形成了這樣的一個小閉環(huán),我覺得短期內(nèi)對這個行業(yè)肯定是有促進的作用。但這件事是從商業(yè)上的考量,是不是導致了技術的方向不一定一直在正確的方向上,也是有可能的。不過這個行業(yè)因發(fā)展很快,其實去年的方向和今年也不一樣,所以這個我覺得都是走一步看一步。

丁琰:其實我們鹿明公司自己也正在籌建數(shù)采廠,目前有兩個正在籌建過程中。我們自己是采用的 UMI這種方式,主要的原因還是在于成本?,F(xiàn)在的數(shù)采廠建設成本里,有70% ~ 80%可能都是買機器人硬件的花銷,這方面的成本會造成整個數(shù)據(jù)成本異常高昂。那有沒有人能消耗這些數(shù)據(jù),其實還是有點未可知。因為這種大規(guī)模的批量建的數(shù)采廠,本身如果數(shù)據(jù)管理做不到位,數(shù)據(jù)基本上都是廢的,沒有人會買。我跟同行去交流,大家對這些數(shù)據(jù)的吐槽還是挺多的,主要就是在于精細化管理沒有做到位。

我覺得這也是前期的一種正常狀態(tài),隨著后面的發(fā)展,可能會大家會對數(shù)據(jù)管理會更精細,或者引進不同的數(shù)采方式,彌補數(shù)采廠數(shù)據(jù)的多元化問題。我覺得不管是遙操作也好, UMI也好,動捕也好,仿真數(shù)據(jù)也好,存在即合理,只是不同份額的問題。我覺得未來的數(shù)采可能會更加多元化一點。

戴若犁:我在北京有辦公室,有團隊,在深圳也有,北京市和深圳市的領導來調(diào)研,我其實給他們都寫過這樣的建議。其實他們也很關心,到底應該怎么花錢,怎么幫助企業(yè)是最有價值的。我覺得其實就是要看最終數(shù)據(jù)的成本構(gòu)成。

比如我們說兩類數(shù)據(jù)。一種是數(shù)采工廠的,那個數(shù)據(jù)的成本大概有50%是設備的攤銷折舊。如果按照5年攤銷,大概有50%是人力的工時,剩下的都可以忽略。如果是剛才說的野采,大概60%是人力,大概40%是場景的協(xié)調(diào),比如租500個Airbnb或者途家的房子去采生活服務,在這邊硬件攤銷又可以被忽略了。

所以我當時跟兩邊政府領導說的就是,不管是做數(shù)據(jù)的公司,還是做模型本體的公司,如果可以幫助他們在需要數(shù)據(jù)的時候,能夠在人力的補貼或者是場景的協(xié)調(diào)上降成本,或者在前置的設備投入上能夠幫助企業(yè)的話,那其實就直接在成本里頭幫助了大家。也可以考慮請我們這樣的數(shù)據(jù)服務公司,來采集一些普適的,可以跨本體的數(shù)據(jù)集,把這個數(shù)據(jù)集開放給大家,讓大家在早期試錯的時候不用每一家都自己花很多錢去做。這個可以幫助所有人,我是這么認為的。

王建明:現(xiàn)在很多賣本體的公司,他們經(jīng)常會有ToG這種銷售模式,其實很大一個點就是消耗他們的本體用來做數(shù)據(jù)采集。我覺得戴博提到的In-the-wild這個數(shù)據(jù)采集方式上,如果政府部門可以調(diào)動一些,比如國有的超市,或者政府部門能夠介入的一些人力操作的部分,讓In-the-wild這個數(shù)據(jù)采集的能力組織起來,其實不需要投入太多的這個資金,更多是資源的調(diào)度。這樣跟數(shù)據(jù)公司配合起來,可能會比購買一堆本體來得更直接,和對行業(yè)的推動會更有作用一點。

其實我們剛才也提到了,在工廠里面采集數(shù)據(jù)對量有一定的需求,但是可能更需要的是In-the-wild這個數(shù)量級的數(shù)據(jù)采集。各位在In-the-wild的數(shù)據(jù)采集上面有一些什么樣的觀察和思考?我先說說我的想法。我覺得In-the-wild這種數(shù)據(jù),其實更多是運營能力的問題。那么是不是像美團、餓了么這一類公司,會更適合做這種數(shù)據(jù)的運營?作為數(shù)據(jù)公司來說怎么看這個問題?

戴若犁:In-the-wild的數(shù)據(jù),分兩部分。一部分是你說的,美團、餓了么這種人力動員,高效卷人力的能力,另外一部分可能是設備能力,就是說你要有優(yōu)質(zhì)的、對于操作的摩擦很低的 low-friction 設備,而且能夠采到足夠的modality,就是模態(tài)和精度,那這是兩部分。另外一部分是數(shù)據(jù)的利用,In-the-wild采回來的數(shù)據(jù)最大的問題是稀疏,模態(tài)稀疏,維度也稀疏,信息也稀疏,那有沒有辦法從稀疏的數(shù)據(jù)里邊挖出來稠密的信息,甚至于增廣出稠密的信息?這也是很考驗水平的。比如世界模型,現(xiàn)在有一條鏈路就是稀疏性信息進到一個世界模型,通過大量的先驗估計出來更豐富的模態(tài)跟維度,這些其實都跟那個美團、餓了么的人力組織就不太相關了。

所以我覺得其實In-the-wild也是一個非??简灱夹g水平的事情,如果只是靠人力組織的能力,那你的生意就是人力組織。到最后其實你拿出來什么能力,你賺到什么錢,這是非常公平的一個事情。

佟顯喬:我覺得In-the-wild在現(xiàn)在這個時間點其實屬于非常早期的階段,目前來看人力管理那部分還是第二步。第一步是怎么采集,硬件設備、軟件的易用性,和數(shù)據(jù)的處理,不管你是online處理還是后處理,都得先讓人可以很快地用起來。

這些東西成熟以后,后面拼的才是人力組織能力。這就有點像自動駕駛行業(yè),現(xiàn)在數(shù)據(jù)標注就變成了標框了,但是早期階段,大家用不同的工具,標注的效率和數(shù)據(jù)采集效率其實是不一樣的。到后邊這個東西成熟以后,大家就變成比拼誰人力成本搞得低,誰組織得好,這個是第二步。所以In-the-wild在具身這塊,其實還是早期階段。目前來看還是從技術的角度,要把采集設備這些技術角度做得更好,才能到下一個階段。

丁琰:我跟那個佟博的想法還是比較一致的。Collect data In-the-wild 確實是一個很好的愿景,但是我估計大規(guī)模需求應該還是在明年下半年才會起來。因為現(xiàn)在整個模型的架構(gòu)還不是很清楚,對數(shù)據(jù)的探索,其實還在通過樣本數(shù)據(jù)或者是小批量數(shù)據(jù)去試驗的階段。大家雖然嘴上說collect data In-the-wild,但其實并沒有要那么多的數(shù)據(jù),大部分數(shù)據(jù)應該還是出自于數(shù)采工廠。

我覺得collect data In-the-wild 肯定是要做的,但是這樣對于數(shù)采設備會提出更高的要求。舉個例子,我們便攜版本和全功能版本之間的區(qū)別就是,便攜版本沒有激光。因為激光沒有辦法在野外進行采集,它不可能隨時隨地給你提供一個電源和基站,并且激光可能還會受強光、紅外線等等的影響,還有遮擋之類的各種情況,其實就相當于有些設備In-the-wild是完全不能用的,所以怎么去設計一個數(shù)采設備是重中之重,這是第一步。

第二步是,我覺得野外采集并沒有想象中那么簡單,不是說你隨便雇一個工人,他拿著設備亂采,這個數(shù)據(jù)就能用了。我們對于數(shù)據(jù)質(zhì)量的要求始終是很高的,如果數(shù)據(jù)量非常非常大的話,可能數(shù)據(jù)質(zhì)量臟一點也無所謂,但是如果你的數(shù)據(jù)量還沒有達到一定級別,其實數(shù)據(jù)質(zhì)量要比數(shù)據(jù)數(shù)量重要得多得多。所以怎么在In-the-wild這個過程中保證數(shù)據(jù)的質(zhì)量,怎么培訓這些工人,其實也不是那么簡單的。

像美團或餓了么,他們有大量的場景和普通的工人,但我覺得他們并不能在一開始就作為主力軍去采集數(shù)據(jù),至少在很長一段時間里是不可能的。前期階段應該還是以一些比較well train的,有很多采集技巧的工人,拿著這個合格的數(shù)采設備在野外進行采集為主。

王建明:我還有最后兩個問題。剛才也提到,除了工廠的數(shù)據(jù)采集,In-the-wild的數(shù)據(jù)采集,其實還有一種是有模型能力并且解決場景問題的公司,自己去做數(shù)據(jù)采集。舉個例子來說,主機廠自己有數(shù)據(jù)處理能力和模型能力,我感覺這一類公司確實也有趨勢,最近一段時間有可能是受北美一些公司的影響,他們可能在解決場景的問題的過程中同時積累數(shù)據(jù)和模型,把自己的小飛輪滾起來。一個一個場景解決了之后,就由小飛輪變成大飛輪。那你們覺得在這個過程中,這類公司會不會更容易積累數(shù)據(jù)?這些數(shù)據(jù)跟數(shù)據(jù)公司沒有什么關系,這會讓你們覺得很擔憂嗎?

戴若犁:我覺得這是一個很好的期待,但很大的問題就是,是不是真的能夠落地。我親身經(jīng)歷了好幾個很大的革命,比如說自動駕駛、大語言模型, AR、VR。坦白來說,具身智能現(xiàn)在每年是 200 億美元、300 億美元的錢撒到這個行業(yè),但是如果跟之前的AR、VR、大語言模型和自動駕駛相比,百億級別的錢進到這個行業(yè)的時候,那三個行業(yè)的成熟度比現(xiàn)在具身智能的成熟度要高非常非常多。大家想想看,百億規(guī)模的錢進到 VR 行業(yè)的時候,Oculus已經(jīng)可以做成一個350美元的設備賣給你,你回家可以玩過山車了,但現(xiàn)在是沒有這樣的機器人的。然后自動駕駛,07年的時候,美國的DARPA挑戰(zhàn)賽就有六支隊伍可以完全無人干預地完成幾十英里的自動駕駛,那是18 年以前。

所以具身智能現(xiàn)在的狀態(tài),其實我覺得很奇怪。建明也是投資人,為什么你們?nèi)雸鰰@么早?投資都投到大學教授里面去了。這其實是很奇怪的一件事情,我是高度懷疑,包括國內(nèi)的一些公司,真的能夠進到人類的家庭,讓小飛輪轉(zhuǎn)起來嗎?我特別希望可以,但是我不信。

佟顯喬:我的觀點也是。舉個例子,從最早的深度學習去做感知,到后來感知的范式變成了BEV,再到后來的端到端、VLA,其實具身就是處在一個非常早期的階段,最后是什么樣?很難說。像你說的一些垂直領域的機器人,可能它們干的活相對比較簡單。比如到車廠里邊去擰螺絲,訓一個這樣的小模型。也許以今天的能力,他們自己采數(shù)據(jù)就能解決,但這可能也不是具身機器人的最終追求。到底是哪條路能先來?這個事其實很難判斷,但我們肯定都是沖著那個最大的,或者是終極階段去的。從數(shù)據(jù)的角度來說,不管你是垂直領域還是通用領域,你采的數(shù)據(jù),你需要的東西和訓的模型結(jié)構(gòu)其實還是那些?,F(xiàn)在這個早期階段,大家也只能follow著正確的方向走,我覺得很難判斷最后哪個能成。

丁琰:其實我是很羨慕和佩服那些公司的。比如說剛剛提到一個例子是Dyna,我們公司肯定沒有他們那種資源,他們是可以完成一個數(shù)據(jù)采集、數(shù)據(jù)訓練,反哺反饋,然后再落地的整個閉環(huán),有點像一個獨立的王國在運行這件事。他們的know-how和insight的積累速度是非??斓?。

絕大部分公司不能比擬這個過程。但是他們也會有一個小問題,就是除非資源非常多才能把整套邏輯和這個王國搭建起來,不然資源太分散的話可能搞不定。比如有些公司可能把90%資源全部投來訓模型,但如果每個環(huán)節(jié)都想做,你又想采數(shù)據(jù),又想訓模型,又想去真機部署,那你得花費很多的資源去布置每一個陣地,這是很累的。他們?nèi)绻苁氐米?,那肯定是最好,但?shù)據(jù)公司的一個缺陷就是,他對于模型的理解肯定沒有別的公司強,如果你不是大量地訓模型,這個know-how和insight總歸還是會比模型公司少。

但是他還有個活下去的路徑。比如你做一個疊衣服的任務,那個know-how和insight 是針對于疊衣服這個任務本身而言的。但是對于其它任務,比如系鞋帶,這個know-how就沒有了。他不可能把所有的場景、所有的小任務、小場景全給搞定,他不可能有那么大的know-how。

但是做數(shù)據(jù)的公司就會有一條活路,這是我突然想出來的。我們是不是可以在和不同客戶打交道地過程中,有些客戶是疊衣服的,有些客戶是系鞋帶的,有些客戶是做飯的,幫助他們?nèi)カ@取know-how。他們自己可能也沒有那么多資源,所以我們聯(lián)合起來,做數(shù)據(jù)的公司和做模型的公司拼在一起,就可以把每個小場景做閉環(huán)。這可能也是一個數(shù)據(jù)公司活下來的一個途徑之一

王建明:最后一個問題。各位可以說說在機器人這個行業(yè),個人的vision、你們創(chuàng)辦公司的vision,以及你們覺得大概到什么時間點,這個vision是可以夠得著的嗎?

戴若犁:我們公司的slogan叫做 we don' t make robots,we make them Intelligent。我們這個機器人公司不造機器人,我最大的期待,也不是vision,就是期待真的造機器人的那些杰出的企業(yè)和人,他們能活得好,他們能夠融到大錢,做大生意,這樣我們好好地做個配角就行了。

佟顯喬:我說一下我的vision。為什么做具身數(shù)據(jù)這個行業(yè),我覺得從數(shù)據(jù)切入是在這個不確定的行業(yè)里邊,最確定性的一件事情。今天這個行業(yè)還在早期階段,最后是什么樣?long way to go??赡苁?,可能20年,在這個過程中,我覺得數(shù)據(jù)是唯一確定的事情,而且數(shù)據(jù)積累的know-how,實際就是模型積累的。所以為什么我和深圳AIRS一起去做這件事情?也是因為覺得,從數(shù)據(jù)的角度切入,去follow最先進的方向,做具身智能這件事,是一個長期偏確定性的創(chuàng)業(yè)機會。

丁琰:機器人的場景非常非常多,我們鹿明就希望守住自己這一塊地,在這一塊地里做到top1的級別。我們自己在做 UMI數(shù)據(jù)的時候,目前來說還是最快的一家,我們想守住自己的陣地,把各種東西探明白、搞清楚,然后服務大家。我們的理解是, UMI這塊還有好多問題沒有解決,甚至沒幾家能夠把它真正用起來,還有比較長的路要走。另外從在工廠里采到在野外采數(shù)據(jù),又是另外一個跨越。在工廠里采,采完下一步其實就到要實現(xiàn)落地的階段了,這可能還是一個比較長的過程,要在兩到三年之內(nèi)完成,這是我個人和公司的愿景。

王建明:謝謝各位嘉賓,那么數(shù)據(jù)環(huán)節(jié)的探討就先到這里。

雷峰網(wǎng)文章

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
滿是心酸!42歲著名歌手江蘇走穴,賓客只顧吃席沒人搭理

滿是心酸!42歲著名歌手江蘇走穴,賓客只顧吃席沒人搭理

查爾菲的筆記
2026-01-04 13:13:57
20歲高中生上學途中被鄰居惡意撞亡案一審宣判,被告人王某桂被判處死刑

20歲高中生上學途中被鄰居惡意撞亡案一審宣判,被告人王某桂被判處死刑

極目新聞
2026-01-05 10:25:17
最高9.8分,美劇史上的入門級Top.10,建議收藏

最高9.8分,美劇史上的入門級Top.10,建議收藏

來看美劇
2026-01-04 20:33:49
“立即放人”,中方發(fā)出最強音,特朗普:不會因馬杜羅與華鬧矛盾

“立即放人”,中方發(fā)出最強音,特朗普:不會因馬杜羅與華鬧矛盾

別人都叫我阿螫
2026-01-04 17:06:32
街道辦回應“揚塵逼遷”:是忘加水導致的誤操作

街道辦回應“揚塵逼遷”:是忘加水導致的誤操作

映射生活的身影
2026-01-04 18:09:17
中國的某些軍事專家和“神棍” 差不多!

中國的某些軍事專家和“神棍” 差不多!

回旋鏢
2026-01-04 17:00:38
上海多處魔方公寓停止運營:強制搬出、電梯停運、交接混亂,租客身陷“兩難”

上海多處魔方公寓停止運營:強制搬出、電梯停運、交接混亂,租客身陷“兩難”

上觀新聞
2026-01-05 06:50:10
騰訊回應元寶AI辱罵用戶:模型異常輸出,不存在人工回復

騰訊回應元寶AI辱罵用戶:模型異常輸出,不存在人工回復

IT之家
2026-01-04 16:52:59
委內(nèi)瑞拉代總統(tǒng)致信美國及世界,強調(diào)和平與對話

委內(nèi)瑞拉代總統(tǒng)致信美國及世界,強調(diào)和平與對話

界面新聞
2026-01-05 09:54:27
美國是否存在“占領”委內(nèi)瑞拉計劃?魯比奧回應

美國是否存在“占領”委內(nèi)瑞拉計劃?魯比奧回應

環(huán)球網(wǎng)資訊
2026-01-05 10:35:20
馬杜羅來不及驚慌。

馬杜羅來不及驚慌。

沈述慢撩
2026-01-04 18:58:29
28歲樊振東留洋首冠!6小時內(nèi)連贏4場+橫掃奧恰洛夫 獲德國杯MVP

28歲樊振東留洋首冠!6小時內(nèi)連贏4場+橫掃奧恰洛夫 獲德國杯MVP

我愛英超
2026-01-05 02:07:06
不敢相信!中國游客的日本住宿預訂量,在春節(jié)期間同比增加六成!

不敢相信!中國游客的日本住宿預訂量,在春節(jié)期間同比增加六成!

奇思妙想草葉君
2026-01-04 11:48:00
委內(nèi)瑞拉結(jié)束了,伊朗也快了,警察叛變,叛軍入城,神棍不知所終

委內(nèi)瑞拉結(jié)束了,伊朗也快了,警察叛變,叛軍入城,神棍不知所終

金召點評
2026-01-05 01:00:03
快船遭遇重創(chuàng)!小瓊斯確診右膝內(nèi)側(cè)副韌帶二級扭傷 至少休戰(zhàn)六周

快船遭遇重創(chuàng)!小瓊斯確診右膝內(nèi)側(cè)副韌帶二級扭傷 至少休戰(zhàn)六周

羅說NBA
2026-01-05 08:22:35
美國對委內(nèi)瑞拉動手,對中國既是利空,也是利好,中國會如何抉擇

美國對委內(nèi)瑞拉動手,對中國既是利空,也是利好,中國會如何抉擇

阿胡
2026-01-04 19:11:41
委副總統(tǒng)已代理總統(tǒng)職權,特朗普稱要“管理”委內(nèi)瑞拉,多國要求美釋放馬杜羅夫婦

委副總統(tǒng)已代理總統(tǒng)職權,特朗普稱要“管理”委內(nèi)瑞拉,多國要求美釋放馬杜羅夫婦

環(huán)球網(wǎng)資訊
2026-01-05 07:13:30
好萊塢著名影星喬治·克魯尼攜全家入籍法國,特朗普諷刺:他根本不是什么明星!之前兩人就公開“互懟”過

好萊塢著名影星喬治·克魯尼攜全家入籍法國,特朗普諷刺:他根本不是什么明星!之前兩人就公開“互懟”過

極目新聞
2026-01-05 10:25:17
42歲金莎商演3首歌35萬,敬業(yè)凍紅胳膊堅持掙干凈錢

42歲金莎商演3首歌35萬,敬業(yè)凍紅胳膊堅持掙干凈錢

車窗起霧q
2026-01-04 11:37:31
廣東92年小伙領養(yǎng)12歲外甥女?當事人回應

廣東92年小伙領養(yǎng)12歲外甥女?當事人回應

極目新聞
2026-01-04 19:33:43
2026-01-05 11:23:00
雷峰網(wǎng) incentive-icons
雷峰網(wǎng)
關注智能與未來!
68264文章數(shù) 656049關注度
往期回顧 全部

科技要聞

雷軍新年首播:確認汽車業(yè)務降速

頭條要聞

特朗普:美方正與委代總統(tǒng)接觸 將在適當時候與其交談

頭條要聞

特朗普:美方正與委代總統(tǒng)接觸 將在適當時候與其交談

體育要聞

女子世界第一,9年前在咖啡店洗碗

娛樂要聞

黃宗澤奪雙料視帝,淚灑頒獎臺憶往昔

財經(jīng)要聞

李迅雷:擴內(nèi)需要把重心從"投"轉(zhuǎn)向"消"

汽車要聞

最高續(xù)航310km 嵐圖泰山8或?qū)⑸习肽臧l(fā)布

態(tài)度原創(chuàng)

家居
本地
親子
時尚
手機

家居要聞

白色大理石 奢華現(xiàn)代

本地新聞

即將過去的2025年,對重慶的影響竟然如此深遠

親子要聞

2026年育兒補貼今天開始申領 操作指南請查收

今年冬天最流行的4雙鞋,配闊腿褲時髦又高級!

手機要聞

消息稱聯(lián)想moto X70 Air Pro確認有手寫筆,可實現(xiàn)不少AI功能

無障礙瀏覽 進入關懷版