国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

對(duì)話原力靈機(jī)唐文斌:純“世界模型”路線走不通

0
分享至


作者 | 鄭敏芳 編輯 | 松壑

一場(chǎng)關(guān)于具身智能的“數(shù)據(jù)暗戰(zhàn)”正在悄然打響。

今年 1 月,湖北人形機(jī)器人創(chuàng)新中心向智元機(jī)器人交付了數(shù)千小時(shí)的訓(xùn)練數(shù)據(jù),完成了國(guó)內(nèi)首例定制化人形機(jī)器人數(shù)據(jù)交易。

行業(yè)巨頭方面,京東日前喊出了建成全球規(guī)模最大、場(chǎng)景最全的具身智能數(shù)據(jù)采集中心的口號(hào),計(jì)劃動(dòng)員超10萬(wàn)內(nèi)部員工及最多50萬(wàn)外部人員,開(kāi)啟一場(chǎng)史無(wú)前例的“人海戰(zhàn)術(shù)”。

視線轉(zhuǎn)向海外,韓國(guó)機(jī)器人公司 Robotis 于今年 1 月在烏茲別克斯坦設(shè)立子公司,計(jì)劃在一塊 11 萬(wàn)平方米的土地上建起一座巨大的“數(shù)據(jù)工廠”,用于收集機(jī)器人行為數(shù)據(jù)。

按小時(shí)計(jì)費(fèi)的定制化交易、數(shù)十萬(wàn)人的大動(dòng)員、遠(yuǎn)赴中亞建廠,這一系列舉措都折射出整個(gè)具身智能行業(yè)沉重的“數(shù)據(jù)焦慮”。

與在互聯(lián)網(wǎng)語(yǔ)料中成長(zhǎng)的大語(yǔ)言模型不同,具身智能需要理解世界并與真實(shí)世界進(jìn)行交互,這對(duì)數(shù)據(jù)的真實(shí)性、模態(tài)等都提出了更高的要求。

這也是原力靈機(jī)創(chuàng)始人兼CEO唐文斌當(dāng)下正在攻堅(jiān)的難題之一。

回溯履歷,唐文斌更為人熟知的身份是上一波AI浪潮中明星獨(dú)角獸曠視科技的聯(lián)合創(chuàng)始人兼CTO。

成立僅一年的原力靈機(jī)已經(jīng)悄然吸金超10億元,拿下了阿里、蔚來(lái)、君聯(lián)、啟明等頭部機(jī)構(gòu)的投資。

目前原力靈機(jī)已發(fā)布旗下首個(gè)具身原生大模型 DM0,并與華勤技術(shù)達(dá)成戰(zhàn)略合作,實(shí)現(xiàn)數(shù)據(jù)采集機(jī)器人 DOS?W1 的量產(chǎn)交付。

在經(jīng)歷了上一波AI落地的洗禮后,唐文斌對(duì)行業(yè)有了更多的敬畏之心。

在日前與華爾街見(jiàn)聞·全天候科技的對(duì)話中,唐文斌分享了原力靈機(jī)的數(shù)據(jù)采集思路:不依賴單一來(lái)源,而是以“質(zhì)量?數(shù)量?多樣性”的組合方式實(shí)施分布式采集,以此填滿機(jī)器人的能力空間。

對(duì)于通過(guò)世界模型生成數(shù)據(jù),讓機(jī)器人能夠模仿學(xué)習(xí)的路線,唐文斌認(rèn)為這條路難以走通,他指出更為可行的范式是將世界模型與VLA(視覺(jué)-語(yǔ)言-動(dòng)作)模型相統(tǒng)一。即不僅能預(yù)測(cè)未來(lái)世界,還能據(jù)此反推出所需的精準(zhǔn)動(dòng)作。

當(dāng)行業(yè)玩家們正以各自的方式瘋狂“囤積”數(shù)據(jù)糧草時(shí),究竟哪種路線才能“笑到最后”,市場(chǎng)正在拭目以待。

以下是對(duì)話實(shí)錄。

詳細(xì)數(shù)據(jù)采集

全天候科技:能否分享你們的數(shù)據(jù)采集思路?

唐文斌:目前我們還是模仿加強(qiáng)化學(xué)習(xí)的方式。

模仿涉及數(shù)據(jù)分布的模擬。我們的目標(biāo)是讓數(shù)據(jù)盡可能地填滿機(jī)器人的能力空間,見(jiàn)過(guò)足夠多的東西。核心在于識(shí)別未見(jiàn)過(guò)場(chǎng)景的處理能力,數(shù)據(jù)的價(jià)值便在于此,所以我們的數(shù)據(jù)采集是圍繞開(kāi)放環(huán)境和實(shí)際場(chǎng)景展開(kāi)。

但我們會(huì)希望數(shù)據(jù)保持高質(zhì)量的同時(shí),還能夠盡可能的填滿這個(gè)空間,所以我覺(jué)得數(shù)據(jù)是一個(gè)“質(zhì)量?數(shù)量?多樣性”的組合問(wèn)題。

全天候科技:那數(shù)據(jù)如何進(jìn)行采集?

唐文斌:其實(shí)我們并不依賴某一種數(shù)據(jù)來(lái)源,這樣做也沒(méi)必要,基本上是一個(gè)組合模式。真機(jī)數(shù)據(jù)方面,主要通過(guò)各種經(jīng)過(guò)校準(zhǔn)的傳感器進(jìn)行采集,具體包括類似外骨骼等,但確實(shí)采集成本會(huì)比較高。

同時(shí),我們也會(huì)通過(guò)無(wú)本體和第一人稱視角收集數(shù)據(jù),形成更大規(guī)模的數(shù)據(jù)集,這其實(shí)就是介于真機(jī)和合成數(shù)據(jù)的中間派了。

除此之外,還有采集成本更低的互聯(lián)網(wǎng)數(shù)據(jù)。

全天候科技:能否具體解釋無(wú)本體采集?

唐文斌:無(wú)本體的意思就是說(shuō)它可能是一個(gè)手套或手持夾爪,沒(méi)有機(jī)械臂、機(jī)器人的身體,所以相當(dāng)于就只是用了一個(gè)末端裝置。我記錄了這個(gè)末端裝置的大致位置和狀態(tài),目前這種數(shù)據(jù)采集方式也被稱為UMI。

今天,我們討論的第一人稱視角數(shù)據(jù)也很多,例如通過(guò)眼鏡拍攝操作過(guò)程,這也是一種無(wú)本體的采集方式。

全天候科技:每個(gè)人的AI眼鏡數(shù)據(jù)都具有隱私性,應(yīng)該沒(méi)有人愿意公開(kāi)自己眼鏡的數(shù)據(jù)供采集。你們?cè)趺唇鉀Q這個(gè)問(wèn)題?

唐文斌:確實(shí),如果我作為眼鏡的用戶,我也不想把我的數(shù)據(jù)分享給大家。但是訓(xùn)練的話,我們可以請(qǐng)一些第三方的數(shù)據(jù)采集員,通過(guò)日常佩戴眼鏡記錄工作流程,然后數(shù)據(jù)也會(huì)被記下來(lái)。

當(dāng)然,我們也希望眼鏡本身的功能可以更加強(qiáng)大,比如有立體視覺(jué)、多目的能力。同時(shí)我們未來(lái)可能還會(huì)增加手環(huán)、手套的裝置用于采集數(shù)據(jù)。

所以整體來(lái)看我們采集的對(duì)象是多樣化的。第一類是機(jī)器人本身,可以遙控操作;第二類是類似于夾爪等的無(wú)本體,即“人的身體+機(jī)器人末端”的裝置;第三類是完全針對(duì)人體的采集;第四類則是對(duì)物理世界的描述。

全天候科技:例如在末端傳感器中,主要采集的是力的數(shù)據(jù)嗎?

唐文斌 :不只是力度,我們還是希望數(shù)據(jù)是多模態(tài)的,比如包括增加視角。

實(shí)操方面,因?yàn)槭直劭赡軙?huì)遮擋部分?jǐn)?shù)據(jù),我們可以眼睛部位裝配一個(gè)相機(jī),兩個(gè)手腕上也可能各有兩個(gè)相機(jī),形成多視角的數(shù)據(jù)。

全天候科技:這種采集成本會(huì)很高嗎?

唐文斌:這其實(shí)就是一個(gè)數(shù)據(jù)質(zhì)量、數(shù)量和多樣性的復(fù)雜問(wèn)題。如果需要采集所有模塊的數(shù)據(jù),成本將變得非常高昂。所以我們采用分布式的采集策略,有些數(shù)據(jù)我們會(huì)盡可能地保證其完整性,而有些數(shù)據(jù)為了降低成本、增加數(shù)量和提高速度,可能就不再那么注重完整性。

這是一個(gè)權(quán)衡的問(wèn)題,我們擁有自己的采集工具,并且廣泛地與其他行業(yè)合作。

全天候科技:今年2月你們跟華勤技術(shù)合作推出了數(shù)據(jù)采集機(jī)器人,能否分享這款機(jī)器人的情況?

唐文斌:這款機(jī)器人主要是用在科研的場(chǎng)景,有點(diǎn)類似于ALOHA機(jī)器人的形態(tài),同行也有在做這個(gè)。(注:ALOHA代表"A Low-cost Open-source Hardware system for bimanual teleOperation",是一種用于雙手遠(yuǎn)程操作的低成本開(kāi)源硬件系統(tǒng))

但是目前市場(chǎng)的數(shù)據(jù)采集機(jī)器人存在兩大痛點(diǎn),

一方面是可靠性,產(chǎn)品表現(xiàn)確實(shí)不盡如人意,例如頻繁故障會(huì)對(duì)科研工作產(chǎn)生負(fù)面影響,降低工作效率。

我們目前也無(wú)法確保產(chǎn)品的長(zhǎng)時(shí)間穩(wěn)定性,所以我們的改進(jìn)點(diǎn)是簡(jiǎn)化了修理過(guò)程,設(shè)計(jì)了模塊化可拆卸的產(chǎn)品結(jié)構(gòu)。一旦某個(gè)部件損壞,用戶可以快速更換。例如很多地方的連接處都不是螺絲,是那種旋鈕,所以可能30秒就能修好了;

另一方面是成本仍然比較高,所以我們通過(guò)與華勤的合作設(shè)計(jì)了一款類似ALOHA的產(chǎn)品,支持主從、拖拽式操作。最核心就是修得快,價(jià)格便宜。(注:主從是指人通過(guò)操控主臂,實(shí)現(xiàn)對(duì)從臂的實(shí)時(shí)遠(yuǎn)程控制,動(dòng)作零延遲復(fù)刻,以此實(shí)現(xiàn)實(shí)現(xiàn)低成本、高精度的雙臂精細(xì)操作數(shù)據(jù)的采集。)

全天候科技:同行買過(guò)這個(gè)機(jī)器人去采集數(shù)據(jù)嗎?

唐文斌 :是的,其實(shí)行業(yè)的痛點(diǎn)還是比較一致的,所以其實(shí)大家都會(huì)買同行的產(chǎn)品回去搭配一起使用。

世界模型路線走不通

全天候科技:能不能聊一聊對(duì)世界模型和VLA的看法?

唐文斌:這里要區(qū)分兩點(diǎn),就是理解世界和生成世界是不一樣的。

我們今天討論的大模型能力,大家普遍關(guān)注的是它們理解世界的能力。世界模型實(shí)際上是在嘗試預(yù)測(cè)未來(lái),即預(yù)測(cè)下一幀可能會(huì)是什么樣子的,而VLA的實(shí)質(zhì)是與世界交互。

這些模型具有共通性,但又能夠從不同的角度解決問(wèn)題。

我們覺(jué)得最佳的策略是相結(jié)合。只有這樣,我們才能真正理解并生成內(nèi)容,理解和與世界交互。

理論上來(lái)說(shuō),如果能夠預(yù)測(cè)未來(lái)世界,我們便能夠反向推斷出我們應(yīng)該如何操作。而如果我們知道如何操作,那說(shuō)明我們是能夠預(yù)測(cè)未來(lái)的發(fā)展。

所以我們現(xiàn)在的技術(shù)框架里世界模型跟VLA是統(tǒng)一的,就是我們希望一個(gè)模型既能夠理解這個(gè)世界,同時(shí)又能預(yù)測(cè)后續(xù)。

如此一來(lái),模型不僅能執(zhí)行動(dòng)作,還能預(yù)測(cè)執(zhí)行該動(dòng)作后世界將如何變化。

全天候科技 :行業(yè)的技術(shù)框架是否和你們不同?

唐文斌:確實(shí),目前一些公司主張僅使用世界模型。有觀點(diǎn)是認(rèn)為通過(guò)世界模型生成數(shù)據(jù),讓機(jī)器人能夠模仿學(xué)習(xí),這樣就產(chǎn)生了一個(gè)無(wú)限的數(shù)據(jù)源。

但我自己覺(jué)得這條路是走不通的,因?yàn)槿绻澜缒P鸵呀?jīng)實(shí)現(xiàn)了,那生成的問(wèn)題就已經(jīng)解決了,大家也不需要通過(guò)生成的數(shù)據(jù)再去訓(xùn)練機(jī)器人了。

那另外一條路就是我們和很多同行會(huì)去做的,就是通過(guò)預(yù)測(cè)未來(lái)世界模型,然后根據(jù)這個(gè)模型反推出所需的動(dòng)作,這種方法涉及到先預(yù)測(cè)未來(lái)的場(chǎng)景或世界狀態(tài),再計(jì)算出相應(yīng)的動(dòng)作序列,這種范式其實(shí)就是我剛才講的相結(jié)合統(tǒng)一的模型框架。

全天候科技 :從場(chǎng)景上來(lái)說(shuō),由于當(dāng)前工廠的產(chǎn)線自動(dòng)化程度很高,機(jī)器人進(jìn)廠打工會(huì)不會(huì)沒(méi)有用武之地?

唐文斌 :確實(shí)當(dāng)前工廠的自動(dòng)化解決方案已經(jīng)相當(dāng)成熟。但我們想去解決的是原來(lái)解決不了的問(wèn)題,或者是原來(lái)解決起來(lái)成本很高的問(wèn)題。

但其實(shí)大家看到的很多自動(dòng)化產(chǎn)線對(duì)泛化性要求是沒(méi)有那么高的,即不需要對(duì)象、環(huán)境和任務(wù)的泛化。例如可能SKU就幾個(gè),光照等外部環(huán)境條件已經(jīng)過(guò)調(diào)節(jié)。

那當(dāng)前解決不了的問(wèn)題其實(shí)是對(duì)象多樣化,環(huán)境也隨時(shí)在變化,甚至可能會(huì)有很多不同的任務(wù)。

以物流場(chǎng)景為例,現(xiàn)在大家的機(jī)器人做的主要是搬運(yùn)工作,但是沒(méi)有做好手上的操作,因?yàn)檫@對(duì)泛化性的要求很高。

例如你購(gòu)買了一瓶可樂(lè)和一包薯片,操作員就會(huì)把可樂(lè)和薯片分別包裝好。由于商品種類繁多且環(huán)境條件不斷變化,這個(gè)其實(shí)就很難用自動(dòng)化設(shè)備解決。

還有包裝的場(chǎng)景,以瓶裝沐浴露為例,我們收到產(chǎn)品時(shí)會(huì)發(fā)現(xiàn)瓶口部纏一圈塑料膜,這是為了防止沐浴露泄露。

實(shí)際操作過(guò)程中,目前通常是操作人員基于經(jīng)驗(yàn),纏上保鮮膜再放入泡沫袋中,并在封口貼上標(biāo)簽,這就沒(méi)辦法通過(guò)自動(dòng)化設(shè)備來(lái)完成。

我們現(xiàn)在主要是在物流、工業(yè)上有做一些嘗試。

全天候科技:你們是傾向于在特定場(chǎng)景進(jìn)行集中開(kāi)發(fā),還是想在多個(gè)場(chǎng)景同時(shí)鋪開(kāi)?

唐文斌:這個(gè)要分兩頭講,觀察大模型的發(fā)展,尤其是當(dāng)前最新的進(jìn)展,可以發(fā)現(xiàn)一個(gè)共同的趨勢(shì)。如果我們現(xiàn)在只構(gòu)建了一個(gè)垂直領(lǐng)域的模型,它是無(wú)法達(dá)到真正有泛化能力的模型,這是行不通的。

因此,從模型的角度來(lái)看,我們必須堅(jiān)定地追求泛化性,追求更加通用的技術(shù)能力。

但從應(yīng)用場(chǎng)景落地的角度來(lái)看,我們確實(shí)得一個(gè)一個(gè)場(chǎng)景去落地,逐一實(shí)現(xiàn)。

所以我們內(nèi)部經(jīng)常強(qiáng)調(diào)產(chǎn)品落地有兩點(diǎn)核心,首先,我們的解決方案必須能夠形成閉環(huán),即解決客戶業(yè)務(wù)中的所有問(wèn)題和異常情況,滿足所有流程需求。其次,我們需確保成本可控,讓客戶覺(jué)得合作劃算。

只有在滿足這兩個(gè)前提條件時(shí),客戶才可能考慮規(guī)?;瘧?yīng)用我們的產(chǎn)品。

所以我們每實(shí)施一個(gè)場(chǎng)景,都必須清晰地理解客戶價(jià)值,并確保這兩個(gè)要點(diǎn)都能得以實(shí)現(xiàn)。這是一個(gè)逐年下單的過(guò)程。

我們內(nèi)部把這個(gè)過(guò)程描述為模型發(fā)展與應(yīng)用落地之間的關(guān)系,它們之間存在45度夾角,即它們相關(guān)但并不絕對(duì)相關(guān)。

當(dāng)然,我們的模型需要朝著那個(gè)通用方向發(fā)展。

對(duì)場(chǎng)景要有敬畏之心

全天候科技 :所以你們是主張通用機(jī)器人的路線嗎?

唐文斌:我個(gè)人認(rèn)為模型具有通用性,但硬件很難實(shí)現(xiàn)。

其實(shí)我們的雙手非常靈活,一只可以執(zhí)行精細(xì)操作,同時(shí)也能舉起20斤的重物,甚至更厲害還能舉起50斤的重物。

但是受到物理學(xué)和材料學(xué)的限制,能夠舉起2公斤商品的機(jī)械臂和能舉起20公斤重物的機(jī)械臂肯定不同,因?yàn)樗鼈兊墓β拭芏炔煌?/p>

所以我們認(rèn)為如果你采用一個(gè)通用的設(shè)計(jì)并應(yīng)用到具體場(chǎng)景中,很容易發(fā)現(xiàn)這是欠設(shè)計(jì)或者過(guò)設(shè)計(jì)。

欠設(shè)計(jì)就是可能重量限制無(wú)法通過(guò),或者是傳感器的安裝空間過(guò)于狹窄,導(dǎo)致無(wú)法解決問(wèn)題;可能恰好能搞定,但這可能過(guò)度設(shè)計(jì)了,價(jià)格就會(huì)變得很高。

以輪式雙臂為例,當(dāng)重心較高時(shí),它跑得更快。但一旦速度起來(lái),它就很難停下來(lái),否則就會(huì)摔倒。

這時(shí)我們可能會(huì)發(fā)現(xiàn),在某些場(chǎng)景中,靜止不動(dòng)可能是一個(gè)更優(yōu)的選擇,讓移動(dòng)的車輛將物品送過(guò)來(lái)。

因此,可能在這些場(chǎng)合會(huì)存在過(guò)度設(shè)計(jì)的問(wèn)題。

我們的內(nèi)部邏輯是讓模型具有通用性,并且能夠適應(yīng)不同的硬件平臺(tái)。

全天候科技 :所以現(xiàn)在投資人比較看重你們的能力是模型?

唐文斌:對(duì),我們團(tuán)隊(duì)的獨(dú)特之處在于不僅從事機(jī)器人場(chǎng)景的研發(fā),而且深入理解模型。我們?cè)跁缫暤奈锪黝I(lǐng)域積累了豐富的經(jīng)驗(yàn),并且具備一定的規(guī)模,因此對(duì)產(chǎn)品有較深的理解,同時(shí)我們擁有一群專注于模型優(yōu)化的專業(yè)人士。

全天候科技:因?yàn)楹芏嗫赡苣骋粋€(gè)行業(yè)內(nèi)的公司對(duì)于本行業(yè)的需求會(huì)比較了解,但你們是模型業(yè)務(wù)起家,會(huì)不會(huì)對(duì)場(chǎng)景需求的了解程度比較弱?

唐文斌:其實(shí)之前我們?cè)跁缫暤臅r(shí)候就做了很多的場(chǎng)景了,所以我覺(jué)得我們還算是一幫被教育過(guò)的人。

這其實(shí)是心態(tài)問(wèn)題,其實(shí)機(jī)器人行業(yè)是需要兩撥人,一波人更懂技術(shù),一波人更懂場(chǎng)景,我們其實(shí)是站在中間的人。

其實(shí)光搞技術(shù)的人會(huì)對(duì)場(chǎng)景做很多的假設(shè),他覺(jué)得不就是這些。但真實(shí)場(chǎng)景中的魔鬼隱藏在細(xì)節(jié)之中。例如當(dāng)出現(xiàn)問(wèn)題時(shí),生產(chǎn)流程不能停,因此必須有完善的異常處理流程。

因此,技術(shù)工作的人必須對(duì)場(chǎng)景懷有敬畏之心。

但行業(yè)的人也有很多問(wèn)題,我們歷史上就是很多同事對(duì)技術(shù)上會(huì)有兩種狀態(tài),一開(kāi)始覺(jué)得技術(shù)無(wú)所不能,一旦涉及到AI智能,他們就會(huì)期望你能解決所有問(wèn)題。然而當(dāng)他們發(fā)現(xiàn)某些問(wèn)題無(wú)法解決時(shí),就會(huì)感到極度失望,進(jìn)而選擇回歸到傳統(tǒng)的、基于規(guī)則的方法。

但今天模型的發(fā)展其實(shí)既不是能達(dá)到無(wú)所不能,也不是什么都不行,是在一個(gè)中間階段,并且斜率很高,處于快速發(fā)展?fàn)顟B(tài)。

所以我們非常需要能夠既對(duì)場(chǎng)景有判斷,理解算法及其發(fā)展速度的人。同時(shí),也需要有人來(lái)設(shè)計(jì)應(yīng)該如何著手解決當(dāng)前的問(wèn)題,讓項(xiàng)目盡快啟動(dòng)。

我們今天所從事的所有工作實(shí)質(zhì)上都是在滿足需求。我們肯定會(huì)有自己視野上的局限。

所以我主張廣泛學(xué)習(xí)和多角度觀察,但我們也應(yīng)有自己判斷的標(biāo)準(zhǔn),選擇那些能夠持續(xù)生存下來(lái)的場(chǎng)景。

全天候科技:那你們?cè)趺炊ㄎ蛔约旱哪繕?biāo)客群呢?是機(jī)器人公司,還是場(chǎng)景應(yīng)用方?

唐文斌 :其實(shí)還是場(chǎng)景應(yīng)用方。

坦白說(shuō),無(wú)論是國(guó)內(nèi)還是國(guó)外的同行,大家所使用的模型都不太成熟。因此今天大家并沒(méi)有達(dá)到將模型直接部署到機(jī)器人公司的設(shè)備上,經(jīng)過(guò)簡(jiǎn)單訓(xùn)練后就能使用的狀態(tài)。

我認(rèn)為在模型尚未成熟的情況下,要實(shí)現(xiàn)場(chǎng)景落地應(yīng)用,垂直整合是必要的。

如果我們自身都搞不定這個(gè)場(chǎng)景,卻期望合作伙伴和客戶能夠解決,這無(wú)疑是美好的幻想。我相信有朝一日,我們可能自己做了一些垂直的場(chǎng)景,而可能更多的場(chǎng)景可以通過(guò)開(kāi)放平臺(tái)的方式,與我們的合作伙伴一起完成。他們既可以用我們的硬件,也可以只用我們的大腦,去自主探索更多可能性。

全天候科技:所以這是你們對(duì)模型開(kāi)源的原因,就是希望更多人能加入進(jìn)來(lái)?

唐文斌:開(kāi)源有兩方面的考慮。首先我們希望更多人使用我們的框架和模型,這樣大家可以共同探索更多應(yīng)用場(chǎng)景并推動(dòng)技術(shù)的落地。其次,盡管當(dāng)前行業(yè)熱度很高,但整體模型的成熟度仍處于初級(jí)階段,促進(jìn)相互交流和進(jìn)步至關(guān)重要。

全天候科技:你之前提到2026年的核心目標(biāo)是每個(gè)場(chǎng)景部署1000臺(tái)可持續(xù)運(yùn)轉(zhuǎn)的設(shè)備,能否分享一下這個(gè)目標(biāo)完成的情況?

唐文斌:這可能要到下半年才能實(shí)現(xiàn)持續(xù)運(yùn)行。目前我們還在進(jìn)行POC測(cè)試。

我們對(duì)自有場(chǎng)景實(shí)現(xiàn)批量化的潛力還是很有信心的。

其實(shí)要讓機(jī)器人能夠持續(xù)運(yùn)行,必須找到容錯(cuò)環(huán)節(jié)。坦白說(shuō),當(dāng)前模型驅(qū)動(dòng)的方法還無(wú)法做到百分之百的準(zhǔn)確率。

如果任務(wù)失敗怎么辦?這個(gè)問(wèn)題必須有答案。我們需要探討通過(guò)什么種方式接管任務(wù),讓失敗的任務(wù)能夠被恢復(fù)。同時(shí)我們還需評(píng)估這種失敗對(duì)企業(yè)的影響,判斷這種影響是否可接受。

在采取了兜底方案之后,我們還需要確認(rèn)整個(gè)系統(tǒng)的ROI。

全天候科技:說(shuō)到ROI的話,那客戶會(huì)直接提出說(shuō)你們可以幫助產(chǎn)線節(jié)約多少錢嗎?

唐文斌:客戶通常會(huì)直接問(wèn)我們能多久回本。

如果一個(gè)項(xiàng)目需要超過(guò)五年才能回本,那就不用做了。

如果預(yù)計(jì)兩到三年內(nèi)就能回本,那就是立馬干。在當(dāng)前的B2B環(huán)境中,我們大多數(shù)決策都是基于理性的分析,算清到底能為客戶提升多少效率。比如機(jī)器人能夠延長(zhǎng)某些生產(chǎn)環(huán)節(jié)的運(yùn)作時(shí)間,更高效地利用現(xiàn)有設(shè)備,為客戶帶來(lái)價(jià)值。

全天候科技 :能否劇透后續(xù)的模型更新情況?

唐文斌:今年我們的核心議題將集中在泛化性上。

全天候科技:去年才創(chuàng)業(yè)來(lái)做具身智能的模型,你覺(jué)得會(huì)不會(huì)太晚了?

唐文斌:其實(shí)在很多年前我們就很想做一個(gè)通用機(jī)器人了,當(dāng)時(shí)我們覺(jué)得技術(shù)上不成熟。但是隨著DeepSeek等大模型的發(fā)展后,確實(shí)讓我對(duì)這件事變得更有信心了。

全天候科技:如果讓你給2026年具身智能行業(yè)1個(gè)關(guān)鍵詞,你覺(jué)得會(huì)是什么?

唐文斌:我想給2個(gè)關(guān)鍵詞,一是模型能力的提升,二是場(chǎng)景的持續(xù)運(yùn)行。

我認(rèn)為當(dāng)前的模型還處于早期階段,但發(fā)展速度很快,所以我們要努力提升模型的算法能力,包括在對(duì)象、環(huán)境適應(yīng)性和任務(wù)泛化性上都有所提升,模型的泛化能力是至關(guān)重要的。其次,關(guān)于場(chǎng)景的應(yīng)用,我認(rèn)為單純的POC沒(méi)太大意義,它只是一個(gè)起點(diǎn),重點(diǎn)在于如何在實(shí)際場(chǎng)景中持續(xù)運(yùn)行,今年確實(shí)已經(jīng)到時(shí)候了。

*本文為全天候科技原創(chuàng)作品,未經(jīng)授權(quán)不得轉(zhuǎn)載,如需轉(zhuǎn)載,請(qǐng)?jiān)诤笈_(tái)回復(fù)“轉(zhuǎn)載”二字,獲取轉(zhuǎn)載格式要求。



點(diǎn)“在看”,變好看哦。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
先被里瓦爾多全面逆襲,后遭齊達(dá)內(nèi)強(qiáng)勢(shì)碾壓,全能戰(zhàn)士時(shí)運(yùn)不濟(jì)

先被里瓦爾多全面逆襲,后遭齊達(dá)內(nèi)強(qiáng)勢(shì)碾壓,全能戰(zhàn)士時(shí)運(yùn)不濟(jì)

足籃大世界
2026-03-26 10:52:09
陰虛、陽(yáng)虛分不清?喝口水就明白了,一文辯證調(diào)理

陰虛、陽(yáng)虛分不清?喝口水就明白了,一文辯證調(diào)理

養(yǎng)生雜志官方
2026-03-12 20:43:10
追夢(mèng):很開(kāi)心文班發(fā)聲爭(zhēng)奪MVP,你不說(shuō)就沒(méi)人注意你

追夢(mèng):很開(kāi)心文班發(fā)聲爭(zhēng)奪MVP,你不說(shuō)就沒(méi)人注意你

體壇周報(bào)
2026-03-27 08:20:15
隨著意大利2-0,丹麥4-0,波蘭2-1,歐預(yù)賽附加賽決賽對(duì)陣出爐

隨著意大利2-0,丹麥4-0,波蘭2-1,歐預(yù)賽附加賽決賽對(duì)陣出爐

側(cè)身凌空斬
2026-03-27 06:59:31
神木麗:從自卑田徑少女到“六邊形戰(zhàn)士”的逆襲傳奇

神木麗:從自卑田徑少女到“六邊形戰(zhàn)士”的逆襲傳奇

碧波萬(wàn)覽
2026-03-27 00:57:08
笑麻了,在成都帶狗子打網(wǎng)約車,司機(jī)抱了一路!網(wǎng)友:狗子好開(kāi)心

笑麻了,在成都帶狗子打網(wǎng)約車,司機(jī)抱了一路!網(wǎng)友:狗子好開(kāi)心

夜深愛(ài)雜談
2026-03-26 20:41:30
70歲后才懂得:親手帶大的孫輩,不管孫子還是外孫,都有5個(gè)現(xiàn)實(shí)

70歲后才懂得:親手帶大的孫輩,不管孫子還是外孫,都有5個(gè)現(xiàn)實(shí)

藝鑒在線
2026-03-20 18:31:57
一人睡遍整個(gè)娛樂(lè)圈?司曉迪打響了2026年第一炮

一人睡遍整個(gè)娛樂(lè)圈?司曉迪打響了2026年第一炮

閱毒君
2026-01-05 07:05:06
聯(lián)合國(guó)曾譴責(zé)“記者被殺”,如今卻被曝是武裝指揮官

聯(lián)合國(guó)曾譴責(zé)“記者被殺”,如今卻被曝是武裝指揮官

桂系007
2026-03-24 19:31:41
想拿中國(guó)尿素救春耕?先把欠中企的百億欠款還了!否則一粒不售

想拿中國(guó)尿素救春耕?先把欠中企的百億欠款還了!否則一粒不售

小小科普員
2026-03-26 19:07:33
11打10!FIFA第5仍1-2落敗 近4場(chǎng)僅1勝 名帥能帶隊(duì)問(wèn)鼎世界杯?

11打10!FIFA第5仍1-2落敗 近4場(chǎng)僅1勝 名帥能帶隊(duì)問(wèn)鼎世界杯?

狍子歪解體壇
2026-03-27 06:07:23
沉迷養(yǎng)豬的丁磊,去年賺了338億

沉迷養(yǎng)豬的丁磊,去年賺了338億

大佬灼見(jiàn)
2026-03-13 12:21:50
岳云鵬現(xiàn)身上海,氣場(chǎng)跟以前完全不一樣了,助理當(dāng)街抽煙也不避諱

岳云鵬現(xiàn)身上海,氣場(chǎng)跟以前完全不一樣了,助理當(dāng)街抽煙也不避諱

仙味少女心
2026-03-24 16:47:29
鄭麗文再挺蕭旭岑,殺雞儆猴開(kāi)除一人黨籍:藍(lán)營(yíng)人士別做敵人的刀

鄭麗文再挺蕭旭岑,殺雞儆猴開(kāi)除一人黨籍:藍(lán)營(yíng)人士別做敵人的刀

桑啟紅原
2026-03-27 06:01:16
張雪峰去世巨額遺產(chǎn)曝光,能給女兒留下多少錢?

張雪峰去世巨額遺產(chǎn)曝光,能給女兒留下多少錢?

藍(lán)鯨新聞
2026-03-26 17:41:20
寧夏石嘴山公布寧夏錦華化工有限公司“1·31”一般中毒和窒息事故調(diào)查報(bào)告

寧夏石嘴山公布寧夏錦華化工有限公司“1·31”一般中毒和窒息事故調(diào)查報(bào)告

極目新聞
2026-03-27 00:18:26
中年男人最大的悲哀是什么?網(wǎng)友:說(shuō)到底就是自己能力差唄

中年男人最大的悲哀是什么?網(wǎng)友:說(shuō)到底就是自己能力差唄

帶你感受人間冷暖
2026-03-23 00:02:19
美汽油價(jià)格逼近4美元!特朗普政府又出新招:豁免夏季汽油銷售限制

美汽油價(jià)格逼近4美元!特朗普政府又出新招:豁免夏季汽油銷售限制

財(cái)聯(lián)社
2026-03-26 10:30:15
烏媒:烏克蘭外長(zhǎng)稱終止116項(xiàng)國(guó)際協(xié)議

烏媒:烏克蘭外長(zhǎng)稱終止116項(xiàng)國(guó)際協(xié)議

財(cái)聯(lián)社
2026-03-26 20:24:11
局勢(shì)惡化!英外長(zhǎng)急致電北京,六國(guó)發(fā)表聯(lián)合聲明,特朗普把路走絕

局勢(shì)惡化!英外長(zhǎng)急致電北京,六國(guó)發(fā)表聯(lián)合聲明,特朗普把路走絕

薦史
2026-03-27 07:49:41
2026-03-27 09:48:49
全天候科技 incentive-icons
全天候科技
幫助投資者理解科技
3810文章數(shù) 14998關(guān)注度
往期回顧 全部

科技要聞

OpenAI果斷砍掉"成人模式",死磕生產(chǎn)力

頭條要聞

65歲上海老伯相信"33歲女老師"給自己生兒子 被騙16萬(wàn)

頭條要聞

65歲上海老伯相信"33歲女老師"給自己生兒子 被騙16萬(wàn)

體育要聞

申京努力了,然而杜蘭特啊

娛樂(lè)要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

很反常!油價(jià)向上,黃金向下

汽車要聞

一汽奧迪A6L e-tron開(kāi)啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

教育
數(shù)碼
房產(chǎn)
本地
公開(kāi)課

教育要聞

中考報(bào)名!剛剛,2026山東一市公布中考報(bào)名操作流程

數(shù)碼要聞

中國(guó)耳機(jī)市場(chǎng)6年來(lái)首次下滑:銷量跌回2億 2026還要降

房產(chǎn)要聞

勁銷64億后,??谶@座改善標(biāo)桿盤,又要引爆樓市!

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬(wàn)遍

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版