国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

對(duì)話南理工楊劍飛:機(jī)器人走進(jìn)家庭之前,必須先學(xué)會(huì)如何與人共處

0
分享至

楊劍飛的履歷精準(zhǔn)地踩中了過(guò)去十年科技浪潮的每一個(gè)節(jié)點(diǎn):2012 年,他進(jìn)入中山大學(xué)那個(gè)為了響應(yīng)互聯(lián)網(wǎng)潮而特設(shè)的“移動(dòng)信息工程學(xué)院”;2014 年加入大疆實(shí)習(xí)做視覺(jué)算法,見(jiàn)證了無(wú)人機(jī)作為會(huì)飛的機(jī)器人的元年 ;與此同時(shí),他頻繁出沒(méi)于上海、武漢、臺(tái)北的黑客松賽場(chǎng),在 48 小時(shí)的極限編程中,反復(fù)訓(xùn)練自己從 0 到 0.1 的產(chǎn)品化能力。

隨后,他在新加坡南洋理工大學(xué)、加州大學(xué)伯克利、東京大學(xué)和哈佛大學(xué)之間穿梭,最終將目光鎖定在“Physical AI”(物理人工智能)——一個(gè)試圖用多模態(tài)感知去重新解碼物理世界的宏大命題。

一年前,他回到新加坡南洋理工大學(xué)創(chuàng)立了 MARS 實(shí)驗(yàn)室(Multimodal embodied AI & Robotic Systems Lab),正式開(kāi)啟了他的教職生涯。

盡管如此,他仍稱(chēng)自己是個(gè)“躺平”的人——求學(xué)階段享受在南洋理工的椰林泳池邊喝著啤酒看論文,晚上則化身英雄聯(lián)盟征戰(zhàn)東南亞的玩家。他堅(jiān)信高效學(xué)習(xí)遠(yuǎn)勝于耗時(shí)間。

在與我們的對(duì)話中,楊劍飛少有學(xué)究式的晦澀,更多的是一種兼具極客與產(chǎn)品經(jīng)理視角的直率。他毫不避諱地指出具身智能賽道全鏈路創(chuàng)業(yè)模式下的同質(zhì)化問(wèn)題,也坦承自己比起卷模型,更在意如何讓機(jī)器人安全地與人共處并服務(wù)于人類(lèi)的生活。

從看見(jiàn)到感知,讓機(jī)器人更懂世界

DeepTech:你在 NTU 創(chuàng)立實(shí)驗(yàn)室時(shí),選擇了“Physical AI(物理人工智能)”這個(gè)關(guān)鍵詞,為什么強(qiáng)調(diào)“物理”?

楊劍飛:這與我的研究背景密切相關(guān)。過(guò)去我一直在做 AI 與物理系統(tǒng)的結(jié)合(比如 IoT 和機(jī)器人),本質(zhì)上就是利用人工智能去觀測(cè)并理解物理世界。

我的研究始于計(jì)算機(jī)視覺(jué)和多模態(tài)感知,最初我以為 RGB 相機(jī)加上雷達(dá),已經(jīng)足以構(gòu)建一個(gè)較完整的三維世界表征。但在哈佛訪學(xué)期間,與做光學(xué)和實(shí)驗(yàn)物理的研究者深入交流后,我意識(shí)到我們對(duì)物理世界的認(rèn)知其實(shí)非常有限。真實(shí)世界遠(yuǎn)比視覺(jué)呈現(xiàn)復(fù)雜得多:多光譜信息、各種電磁信號(hào)、空氣中的通信波段,都是真實(shí)存在卻難以直接感知的維度。

因此,Physical AI 的核心并不只是讓機(jī)器人行動(dòng),而是回答一個(gè)更基礎(chǔ)的問(wèn)題:我們?nèi)绾胃鼫?zhǔn)確、更全面地觀測(cè)物理世界,并用 AI 去解釋這些觀測(cè)?

這條路徑在其他學(xué)科也同樣成立。生命科學(xué)中,從顯微鏡到基因測(cè)序,各種技術(shù)的出現(xiàn)本質(zhì)上都是創(chuàng)造新的觀測(cè)方式,隨后再由 AI 進(jìn)行分析。正因如此,我認(rèn)為 Physical AI 是一個(gè)未來(lái)幾十年都值得投入的方向。它關(guān)乎 AI 的邊界,也關(guān)乎我們?nèi)绾卫斫庹鎸?shí)世界本身。

DeepTech:既然 Physical AI 的核心是重新定義我們?nèi)绾斡^測(cè)物理世界,那在人機(jī)交互的設(shè)備層面,你最近關(guān)注到哪些值得探索的新載體?比如,你今年初參與了 Meta Project Aria(AR 眼鏡項(xiàng)目)。

楊劍飛:對(duì),這個(gè)項(xiàng)目主要利用 Meta 的 Aria 智能眼鏡進(jìn)行場(chǎng)景識(shí)別,希望借此提升人與機(jī)器的交互能力。我們關(guān)注的是更長(zhǎng)期的趨勢(shì):未來(lái)什么設(shè)備可能取代手機(jī),或成為新的核心交互入口?

我認(rèn)為會(huì)是 XR 眼鏡。

過(guò)去十多年,XR 眼鏡受限于顯示、芯片和電池,但現(xiàn)在這些技術(shù)正在突破,使它具備成為下一代終端的條件。短期來(lái)說(shuō),XR 眼鏡可以成為和用戶自然交互的入口;長(zhǎng)期來(lái)說(shuō),隨著邊緣算力的發(fā)展,眼鏡能夠?qū)崟r(shí)捕捉用戶看到的世界,并將這些信息反饋給家中的機(jī)器人,使其理解用戶關(guān)注的內(nèi)容,從而提供更加自然的輔助。

因此,XR 眼鏡給了 AI 一雙人類(lèi)的眼睛,我們申請(qǐng)了 Meta Aria Project,就是與學(xué)生一起探索 XR 眼鏡與具身智能結(jié)合的可能性。目前項(xiàng)目仍在早期階段,但這是我們認(rèn)為非常值得投入的新方向。

DeepTech:這是否意味著,你認(rèn)為未來(lái)的具身智能是一種更高級(jí)、更即時(shí)的具身形態(tài)?

楊劍飛:我認(rèn)為,如果討論具身智能或 Physical AI,XR 眼鏡本身就應(yīng)當(dāng)被視為其中的一部分。當(dāng)前市面上的 XR 眼鏡之所以受限,主要在于端側(cè)算力不足,而為了控制重量,它們也無(wú)法搭載更強(qiáng)的處理能力,因此設(shè)備側(cè)的 AI 能力仍然非常有限。

但 Meta 的 Project Aria 與傳統(tǒng)消費(fèi)級(jí)產(chǎn)品不同,它是專(zhuān)門(mén)為科研設(shè)計(jì)的設(shè)備,重量更大,但也配置了更強(qiáng)的端側(cè)算力。這使我們能夠在其上實(shí)現(xiàn)更加實(shí)時(shí)的感知處理,并探索更高級(jí)的 Physical AI 交互模式。

從這個(gè)角度看,AR 眼鏡并不僅是信息呈現(xiàn)設(shè)備,它實(shí)際上是具身智能生態(tài)中的一個(gè)重要節(jié)點(diǎn),能夠在用戶與環(huán)境之間提供連續(xù)、實(shí)時(shí)的感知與反饋。

DeepTech:2026 年,你的團(tuán)隊(duì)會(huì)重點(diǎn)投入在哪些研究方向?在具身智能即將迎來(lái)應(yīng)用化階段的背景下,你認(rèn)為哪些問(wèn)題最值得提前布局?

楊劍飛:2026 年,我們的重點(diǎn)仍將放在以人為本(human-centric)的具身智能研究方向上,比如更加安全和自然的人機(jī)交互(Human-Robot Interaction)。我判斷具身智能可能在未來(lái) 3-5 年里逐步落地,而一旦進(jìn)入實(shí)際應(yīng)用階段,如何讓機(jī)器人以更自然、更友好、更加符合人類(lèi)習(xí)慣的方式進(jìn)行交互,將成為不可回避的問(wèn)題。盡管這些課題在傳統(tǒng)意義上未必屬于核心性能指標(biāo),但我個(gè)人非常重視其中的人性化價(jià)值,因此也會(huì)持續(xù)深耕這一方向。

與此同時(shí),我們團(tuán)隊(duì)中負(fù)責(zé)多模態(tài)與大模型的學(xué)生也已經(jīng)開(kāi)始在 VLA 方向發(fā)力。一個(gè)關(guān)鍵問(wèn)題是:VLA 是否可以接入更多模態(tài),從而實(shí)現(xiàn)更精確的動(dòng)作表達(dá)?在什么場(chǎng)景下,多模態(tài)輸入是必要的?哪些任務(wù)又不能僅依賴純視覺(jué)(pure vision)就能完成?

這些問(wèn)題的背后,其實(shí)都是關(guān)于不同模態(tài)的數(shù)據(jù)如何共同影響具身智能能力的更深層探索。因此,從整體上看,我們 2026 年的研究仍將圍繞我們 MARS Lab 的兩個(gè)主線展開(kāi):多模態(tài)感知與以人為中心的具身智能。

通用機(jī)器人真正要落地在哪?

DeepTech:目前市面上出現(xiàn)不同的聲音,有些人認(rèn)為最大的場(chǎng)景是進(jìn)工廠,擰螺絲、分揀電池、搬東西;也有人認(rèn)為,機(jī)械臂已經(jīng)夠用了,趨勢(shì)應(yīng)該是個(gè)人和家庭。你比較看好機(jī)器人在哪些場(chǎng)景的應(yīng)用?

楊劍飛:我認(rèn)為核心仍在 to C 端。工業(yè)場(chǎng)景固然重要,但在高度結(jié)構(gòu)化、可預(yù)設(shè)的工廠環(huán)境里,傳統(tǒng)工業(yè)機(jī)器人本身就能做得更好。具身機(jī)器人只有在處理工業(yè)機(jī)器人難以覆蓋的問(wèn)題才具備價(jià)值,例如拆解不規(guī)則物體、處理雜亂環(huán)境。但這類(lèi)需求往往更適合由專(zhuān)門(mén)的工業(yè)自動(dòng)化公司來(lái)解決,也不是通用具身智能最具潛力的方向。

具身智能真正值得期待的,是走進(jìn)家庭,解決開(kāi)放世界中可廣泛泛化的真實(shí)任務(wù)。但家庭場(chǎng)景的復(fù)雜性極高,遠(yuǎn)非兩三年能夠完全攻克,因此廣泛落地必然是一個(gè)長(zhǎng)期過(guò)程。

在我看來(lái),一個(gè)關(guān)鍵節(jié)點(diǎn)是:在 to C 端出現(xiàn)第一個(gè)真正意義上的“殺手級(jí)應(yīng)用(killer app)”。它能讓普通消費(fèi)者第一次明確感受到“家里有一個(gè)具身機(jī)器人是有實(shí)際價(jià)值的”。在這個(gè)節(jié)點(diǎn)出現(xiàn)之前,具身智能的大規(guī)模普及都只能算是過(guò)渡階段。

DeepTech:如果說(shuō) to C 的話,人形是最好的形態(tài)嗎?

楊劍飛:在不同的 to C 場(chǎng)景中,不同結(jié)構(gòu)的機(jī)器人設(shè)計(jì)有著不同的優(yōu)勢(shì),但如果討論的是通用型家用機(jī)器人,人形形態(tài)的適配性更強(qiáng),大致體現(xiàn)在兩個(gè)方面。

其一是環(huán)境友好性與任務(wù)靈活性。家庭空間從本質(zhì)上就是按照“人”的尺度、動(dòng)作和可達(dá)性設(shè)計(jì)的。人形機(jī)器人能夠在相同的結(jié)構(gòu)中完成多樣任務(wù),包括上、下臺(tái)階等輪式機(jī)器人難以處理的動(dòng)作;在海外大量家庭為多層 house 的情況下,這種能力尤為重要。因此,在開(kāi)放家庭環(huán)境里,人形形態(tài)天然更具普適性。

其二是情感層面的可接受度。人們對(duì)小鵬機(jī)器人等產(chǎn)品產(chǎn)生關(guān)注,不僅因?yàn)槠洳綉B(tài)逼真,更因?yàn)槠渫庥^、材質(zhì)與比例在視覺(jué)與情感上帶來(lái)了擬人化的溫度。這種溫度并不必然來(lái)自技術(shù)本身,而是來(lái)自人形結(jié)構(gòu)、織物包裹等設(shè)計(jì)細(xì)節(jié)所營(yíng)造的心理連接。正如科幻作品長(zhǎng)期呈現(xiàn)的圖景,當(dāng)機(jī)器真正融入日常生活,人們往往希望它像一個(gè)人。

人形并非唯一解,但在通用家用機(jī)器人領(lǐng)域,它確實(shí)具備更強(qiáng)的環(huán)境適配性與情感親和力,這兩點(diǎn)共同構(gòu)成了它在 to C 市場(chǎng)的重要潛力。當(dāng)然人形不一定是雙足,這是更加細(xì)節(jié)的討論了。

中國(guó)“全都要” vs 美國(guó)“單點(diǎn)破”

DeepTech:從你的觀察來(lái)看,中美在自身智能的發(fā)展路徑上有什么差異?

楊劍飛:在中國(guó),產(chǎn)業(yè)發(fā)展往往沿著供應(yīng)鏈自下而上展開(kāi)。完整而高效的制造體系,使國(guó)內(nèi)迅速涌現(xiàn)出一批具身智能創(chuàng)業(yè)團(tuán)隊(duì)。許多公司由具備北美或國(guó)內(nèi)頂尖科研背景的研究者創(chuàng)立,將硬件基礎(chǔ)與博士階段積累的軟件與模型能力結(jié)合,形成較完整的技術(shù)鏈路。

但在與二十多家創(chuàng)業(yè)者交流后,我注意到一個(gè)普遍特征:我國(guó)的公司傾向于全鏈路式創(chuàng)新。從本體、感知、控制到大模型,甚至數(shù)據(jù)采集,幾乎所有環(huán)節(jié)都在一家公司內(nèi)自研。這種方式雖能構(gòu)建統(tǒng)一的平臺(tái)與獨(dú)立的生態(tài)系統(tǒng),但也容易導(dǎo)致資源分散,難以在某個(gè)關(guān)鍵層面實(shí)現(xiàn)突破;加之供應(yīng)鏈成熟、造一臺(tái)機(jī)器人門(mén)檻降低,同質(zhì)化問(wèn)題隨之加劇。

相比之下,美國(guó)生態(tài)的分層更為清晰。許多團(tuán)隊(duì)只專(zhuān)注某一技術(shù)層,如Physical Intelligence 主攻大模型、genesis 做仿真平臺(tái)、generalist 聚焦工業(yè)智能大模型等;硬件端則大量采購(gòu)成熟的中國(guó)產(chǎn)品來(lái)驗(yàn)證模型能力。這樣的模式使創(chuàng)新資源得以集中,也更容易形成差異化。當(dāng)然,也有 Figure AI、Tesla Optimus 等選擇全棧路線的例外,但他們擁有少數(shù)團(tuán)隊(duì)才具備的資源規(guī)模。

在模型層面也呈現(xiàn)類(lèi)似差異。目前最具影響力的開(kāi)源模型仍來(lái)自美國(guó)體系,如 π 系列。國(guó)內(nèi)雖然不斷有模型宣布開(kāi)源,我們實(shí)驗(yàn)室測(cè)試了部分模型也有不錯(cuò)的性能,但整體上聲量大于可用性,尚未出現(xiàn)一個(gè)能夠真正被社區(qū)采納、持續(xù)演進(jìn)的基礎(chǔ)模型。國(guó)內(nèi)缺乏長(zhǎng)期維護(hù)開(kāi)源項(xiàng)目、沉淀開(kāi)源社區(qū)文化的土壤,也是原因之一。

從科研與產(chǎn)業(yè)雙重視角看,在開(kāi)源模型能力上美國(guó)仍占優(yōu)勢(shì);但中國(guó)在機(jī)器人硬件、供應(yīng)鏈和工程化效率上的領(lǐng)先同樣顯著,也正因如此,美國(guó)許多團(tuán)隊(duì)愿意直接采購(gòu)中國(guó)本體。我也非常希望我國(guó)具身智能能有 DeepSeek 一樣的模型出現(xiàn)。

DeepTech:中國(guó)具身智能行業(yè)在高速發(fā)展的同時(shí),也伴隨一定的過(guò)熱預(yù)期。你怎么看當(dāng)前行業(yè)的真實(shí)進(jìn)度與外界敘事之間的落差?

楊劍飛:當(dāng)然,中國(guó)的優(yōu)勢(shì)同樣十分突出,尤其體現(xiàn)在制造體系和工程化能力上。依托松山湖等地高度成熟的機(jī)器人供應(yīng)鏈,我們?cè)谟布倔w和人形機(jī)器人生產(chǎn)上的速度與成本控制具備全球競(jìng)爭(zhēng)力:產(chǎn)品可以做得快、做得多、做得好,迭代周期也明顯短于海外。

這種差距在行業(yè)內(nèi)部也被越來(lái)越多的海外團(tuán)隊(duì)直接承認(rèn)。過(guò)去大家習(xí)慣說(shuō)“做中國(guó)的特斯拉”、“做中國(guó)的谷歌”,而如今,美國(guó)創(chuàng)業(yè)者開(kāi)始出現(xiàn)希望“做美國(guó)的宇樹(shù)”的說(shuō)法,這本身就折射出中國(guó)硬件能力在具身智能時(shí)代的領(lǐng)先地位。

DeepTech:從產(chǎn)業(yè)結(jié)構(gòu)來(lái)看,從 2023 到 2025,機(jī)器人行業(yè)的熱度幾乎是指數(shù)級(jí)上升。在你看來(lái),是哪些變量讓行業(yè)突然進(jìn)入加速度階段?

楊劍飛:過(guò)去這一波具身智能的熱度,并非偶然,我認(rèn)為真正的拐點(diǎn)出現(xiàn)在 2022 到 2023 年,其背后至少有三股力量共同推動(dòng)。

首先是大模型的出現(xiàn)。最初大家主要關(guān)注基于大模型的智能體與線上應(yīng)用,但機(jī)器人研究者很快意識(shí)到,大模型具備解決高層任務(wù)規(guī)劃的潛力。它不僅能生成動(dòng)作序列,還能為機(jī)器人提供通往開(kāi)放世界的思考能力。這使得原本局限在封閉環(huán)境中的機(jī)器人,有了邁向通用智能的可能。

第二個(gè)關(guān)鍵變量是算力。大模型本身依賴算力堆疊,而機(jī)器人也在經(jīng)歷同樣的算力躍遷。例如英偉達(dá)近年來(lái)推出的 Star、Jetson Nano 等邊緣計(jì)算平臺(tái),顯著提升了端側(cè)的 AI 運(yùn)行能力,推動(dòng)了自動(dòng)駕駛、AGV 和服務(wù)機(jī)器人等應(yīng)用的實(shí)際落地。

第三,是硬件與供應(yīng)鏈的成熟。以松山湖為代表的制造集群逐步形成,大疆等企業(yè)帶動(dòng)了上游零部件體系的完善,催生出割草機(jī)、泳池清潔機(jī)器人等上一代產(chǎn)品的商業(yè)成功。這些積累為今天的人形機(jī)器人奠定了基礎(chǔ)。

此外,國(guó)家層面的推動(dòng)同樣重要。春晚上連續(xù)兩年出現(xiàn)機(jī)器人,從側(cè)面體現(xiàn)了政策與社會(huì)層面對(duì)行業(yè)的關(guān)注,也幫助不少企業(yè)在關(guān)鍵階段獲得資源和認(rèn)知紅利。綜合制造優(yōu)勢(shì)與人才供給,我相信中國(guó)在具身智能領(lǐng)域具備真正實(shí)現(xiàn)突破、甚至領(lǐng)跑的可能性。

打造機(jī)器人的“ChatGPT 時(shí)刻”

DeepTech:另一個(gè)所有人都在關(guān)心的問(wèn)題是數(shù)據(jù)。機(jī)器人數(shù)據(jù)的采集成本極高,也很不連續(xù)。你認(rèn)為合成數(shù)據(jù)會(huì)成為真正的解決方案嗎?還是說(shuō),數(shù)據(jù)要在未來(lái)以一種完全不同的方式被生成?

楊劍飛:在我看來(lái),仿真數(shù)據(jù)和真實(shí)數(shù)據(jù)必然是兩條并行路線,各有優(yōu)勢(shì)也各有局限。仿真最大的好處是規(guī)?;菀?,但始終存在模擬與現(xiàn)實(shí)的差距;真實(shí)數(shù)據(jù)尤其是操作類(lèi)數(shù)據(jù)采集成本高,但價(jià)值更直接、可遷移性更強(qiáng)。

近年來(lái)也出現(xiàn)了一些提升真實(shí)數(shù)據(jù)效率的方法,例如 UMI 通過(guò)統(tǒng)一夾爪,讓 generalist 和 Sunday AI 等團(tuán)隊(duì)可以快速擴(kuò)展真實(shí)數(shù)據(jù)規(guī)模。這說(shuō)明真實(shí)數(shù)據(jù)并非不能擴(kuò)展,只是幅度無(wú)法像仿真一樣成倍增長(zhǎng)。再比如最近 PI 發(fā)現(xiàn)大量的第一視角人類(lèi)視頻訓(xùn)練可以促進(jìn)具身智能模型的“智能涌現(xiàn)”,而第一視角視頻相比于遙操作數(shù)據(jù)是更容易 scale up 的。

因此,大多數(shù)團(tuán)隊(duì)最終都會(huì)采用混合策略:預(yù)訓(xùn)練依賴大量仿真數(shù)據(jù)和視頻數(shù)據(jù),具體任務(wù)和場(chǎng)景落地則必須回到真實(shí)數(shù)據(jù)進(jìn)行校準(zhǔn)。同時(shí),世界模型的路線正在興起,讓模型在類(lèi)似仿真的環(huán)境中繼續(xù)強(qiáng)化學(xué)習(xí),成為第三條可補(bǔ)充的路徑。

行業(yè)的共識(shí)逐漸清晰:有效數(shù)據(jù)不會(huì)來(lái)自單一來(lái)源,而是多種數(shù)據(jù)形式的組合。未來(lái)的關(guān)鍵不在于簡(jiǎn)單擴(kuò)大數(shù)據(jù)工廠規(guī)模,而在于探索新的數(shù)據(jù)范式,從而提高數(shù)據(jù)采集效率與利用效率。只有這樣,才能真正構(gòu)建出具有強(qiáng)泛化能力的具身智能模型。

DeepTech:如果機(jī)器人數(shù)據(jù)來(lái)自不同國(guó)家,它們是否會(huì)出現(xiàn)地域特性,甚至價(jià)值觀差異?

楊劍飛:這種情況在未來(lái)的確非常有可能出現(xiàn),也正是當(dāng)下數(shù)據(jù)體系的核心短板之一。現(xiàn)階段的機(jī)器人數(shù)據(jù)收集往往是高度中心化的:數(shù)據(jù)通常來(lái)自同一地區(qū)、同一團(tuán)隊(duì)、同一種環(huán)境與交互方式,因此不可避免地帶有特定地域與文化的行為偏差。這使得模型難以獲得真正普適的行為模式。

如果具身智能要走向全球化,它的數(shù)據(jù)體系必須像互聯(lián)網(wǎng)一樣實(shí)現(xiàn)分布式采集,來(lái)自不同國(guó)家、不同文化、不同家庭與不同工作場(chǎng)景的真實(shí)數(shù)據(jù)共同匯聚,形成新的 Internet——機(jī)器人數(shù)據(jù)互聯(lián)網(wǎng)。只有在這種高度差異性的數(shù)據(jù)結(jié)構(gòu)下,才有可能誕生真正意義上的“機(jī)器人領(lǐng)域的 ChatGPT 時(shí)刻”。

否則,今天許多機(jī)器人系統(tǒng)所依賴的依然只是局域網(wǎng)級(jí)別的智能,它們?cè)谔囟ōh(huán)境下表現(xiàn)良好,但難以跨文化、跨場(chǎng)景遷移。要突破這一限制,構(gòu)建全球化、分布式的數(shù)據(jù)流將是關(guān)鍵步驟。

DeepTech:基礎(chǔ)模型開(kāi)源與否,會(huì)決定行業(yè)走向。你認(rèn)為開(kāi)源基礎(chǔ)模型,會(huì)加速具身智能的發(fā)展,還是反而帶來(lái)新的不確定性?對(duì)于做機(jī)器人系統(tǒng)的人來(lái)說(shuō),開(kāi)源意味著機(jī)會(huì)還是隱患?

楊劍飛:開(kāi)源無(wú)疑會(huì)加速行業(yè)發(fā)展,也會(huì)帶來(lái)大量不確定性。但在技術(shù)探索的早期階段,這種不確定性本身就是創(chuàng)新的源頭。以數(shù)據(jù)采集為例,UMI 提供了一個(gè)開(kāi)源夾爪,隨后社區(qū)迅速基于這一接口展開(kāi)改進(jìn):有人直接使用比如 Generalist,有人將其改造成三指靈巧手例如 Sunday AI,開(kāi)源硬件的啟發(fā)性在這里得到充分體現(xiàn)。

軟件層面更是如此。圍繞 PaLM-E、PaLI-X 或 π 系列模型的微調(diào)與改造已經(jīng)遍布學(xué)術(shù)界。盡管許多工作只是小規(guī)模實(shí)驗(yàn)或分?jǐn)?shù)優(yōu)化,但確實(shí)也有研究在模型接入新模態(tài)、更高效的數(shù)據(jù)利用、以及強(qiáng)化學(xué)習(xí)訓(xùn)練等方向取得實(shí)質(zhì)性進(jìn)展。因此,在機(jī)器人領(lǐng)域,開(kāi)源基礎(chǔ)模型的價(jià)值甚至比在純軟件領(lǐng)域更大,因?yàn)樗軌蛲瑫r(shí)撬動(dòng)硬件、算法、數(shù)據(jù)和應(yīng)用多個(gè)層面的創(chuàng)新。

我們也可以從行業(yè)的成功案例看到這一邏輯。宇樹(shù)的人形機(jī)器人之所以迅速普及,是因?yàn)閹缀跛袊?guó)家的實(shí)驗(yàn)室都會(huì)至少采購(gòu)一臺(tái);PaLM-E、π 系列模型之所以成為研究基礎(chǔ),是因?yàn)榇罅抗ぷ鞫冀⒃谒鼈冎希辉诖竽P皖I(lǐng)域,Llama 和 DeepSeek 系列發(fā)布后一年內(nèi)便積累了龐大的社區(qū)貢獻(xiàn)。

一家公司的資源再多,它能專(zhuān)注的范圍依然有限。但當(dāng)它以開(kāi)源方式激發(fā)了研究社區(qū)的創(chuàng)造力,社區(qū)基于其架構(gòu)所衍生的成果反過(guò)來(lái)又會(huì)強(qiáng)化其技術(shù)生態(tài)。這正是開(kāi)源在機(jī)器人時(shí)代尤其關(guān)鍵的原因,也是推動(dòng)企業(yè)最終取得成功的重要路徑。

DeepTech:近期,多所高校開(kāi)始討論是否應(yīng)該設(shè)立“具身智能”本科專(zhuān)業(yè)。作為長(zhǎng)期從事該領(lǐng)域科研和教學(xué)的研究者,你怎么看待本科階段培養(yǎng)具身智能人才的可行性?

楊劍飛:長(zhǎng)期以來(lái),一個(gè)常被討論的問(wèn)題是:機(jī)器人行業(yè)發(fā)展多年,為什么高校中真正設(shè)立機(jī)器人本科專(zhuān)業(yè)的并不多?

核心原因在于,機(jī)器人是高度系統(tǒng)化的工程領(lǐng)域,涵蓋機(jī)械、電子、控制、自動(dòng)化、計(jì)算機(jī)等多學(xué)科。本科階段如果課程設(shè)計(jì)不夠聚焦,學(xué)生很容易學(xué)得很雜,卻沒(méi)有哪一項(xiàng)真正學(xué)深。因此,無(wú)論國(guó)內(nèi)還是海外,關(guān)于是否要在本科階段開(kāi)設(shè)機(jī)器人專(zhuān)業(yè)一直存在爭(zhēng)議。

過(guò)去十多年,我認(rèn)為更加推動(dòng)機(jī)器人教育進(jìn)步并培養(yǎng)學(xué)生實(shí)踐能力的,其實(shí)不是課程,而是競(jìng)賽。系統(tǒng)化的比賽機(jī)制讓學(xué)生必須在團(tuán)隊(duì)中完成整機(jī)設(shè)計(jì)、調(diào)試與迭代,這種做出來(lái)的訓(xùn)練方式遠(yuǎn)比課堂更能塑造一個(gè)準(zhǔn)機(jī)器人工程師。我在大疆參與 RoboMaster 比賽系統(tǒng)測(cè)試時(shí)就明顯感受到,全棧型人才往往來(lái)自高校頂尖戰(zhàn)隊(duì)。

因此,本科專(zhuān)業(yè)更多是一種組織框架,而真正決定學(xué)生能力的,是他們是否有機(jī)會(huì)參與系統(tǒng)級(jí)工程,把一個(gè)機(jī)器人從零做成可運(yùn)行的產(chǎn)品。在這個(gè)意義上,機(jī)器人教育的核心不在課程,而在工程實(shí)踐本身。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
游戲結(jié)束,中國(guó)運(yùn)回2313噸金條,石油人民幣要來(lái)了,特朗普攔不住

游戲結(jié)束,中國(guó)運(yùn)回2313噸金條,石油人民幣要來(lái)了,特朗普攔不住

南宗歷史
2026-04-17 16:05:20
無(wú)法無(wú)天!從醫(yī)生到病人全是演員!網(wǎng)友:以后誰(shuí)還敢信中醫(yī)?

無(wú)法無(wú)天!從醫(yī)生到病人全是演員!網(wǎng)友:以后誰(shuí)還敢信中醫(yī)?

華人星光
2026-04-15 12:55:39
許家印親自面試女大學(xué)生!建恒大歌舞團(tuán)目的曝光:貴賓房非??植?>
    </a>
        <h3>
      <a href=許家印親自面試女大學(xué)生!建恒大歌舞團(tuán)目的曝光:貴賓房非??植?/a> 風(fēng)過(guò)鄉(xiāng)
2026-04-17 07:14:57
皇馬終于醒悟!高價(jià)水貨將被送走,球迷集體拍手叫好

皇馬終于醒悟!高價(jià)水貨將被送走,球迷集體拍手叫好

奶蓋熊本熊
2026-04-17 04:40:41
大佬站隊(duì)、鄭麗文得強(qiáng)援!國(guó)民黨1人嚇破膽,連忙否認(rèn)“2個(gè)太陽(yáng)”

大佬站隊(duì)、鄭麗文得強(qiáng)援!國(guó)民黨1人嚇破膽,連忙否認(rèn)“2個(gè)太陽(yáng)”

云景侃記
2026-04-17 09:48:27
意外!鄭州40歲女子患肝癌,臨終前懇求前夫接走女兒,前夫回復(fù)!

意外!鄭州40歲女子患肝癌,臨終前懇求前夫接走女兒,前夫回復(fù)!

青梅侃史啊
2026-04-17 19:48:25
隨著北京上海贏球,CBA排名大變天:北京進(jìn)入四強(qiáng),山東第八不保

隨著北京上海贏球,CBA排名大變天:北京進(jìn)入四強(qiáng),山東第八不保

中國(guó)籃壇快訊
2026-04-18 00:02:52
DO談曼聯(lián)中場(chǎng)引援;羅馬諾:曼聯(lián)和巴薩仍未就拉什福德的交易達(dá)成共識(shí)

DO談曼聯(lián)中場(chǎng)引援;羅馬諾:曼聯(lián)和巴薩仍未就拉什福德的交易達(dá)成共識(shí)

MUREDS
2026-04-17 23:34:38
河北小伙結(jié)婚前夕慘死,母親卻為兇手求情,真兇出獄后人間蒸發(fā)

河北小伙結(jié)婚前夕慘死,母親卻為兇手求情,真兇出獄后人間蒸發(fā)

碎碎紀(jì)實(shí)
2026-04-17 09:34:31
47:52!美投票結(jié)果出來(lái)了,特朗普態(tài)度轉(zhuǎn)變,希拉里:美處于弱勢(shì)

47:52!美投票結(jié)果出來(lái)了,特朗普態(tài)度轉(zhuǎn)變,希拉里:美處于弱勢(shì)

蘭妮搞笑分享
2026-04-18 00:54:33
曝烏克蘭突襲攻入俄羅斯領(lǐng)土!控制庫(kù)爾斯克5塊陣地

曝烏克蘭突襲攻入俄羅斯領(lǐng)土!控制庫(kù)爾斯克5塊陣地

項(xiàng)鵬飛
2026-04-16 19:16:05
伊朗軍隊(duì)總司令:美以讓伊朗屈服的企圖將永遠(yuǎn)落空

伊朗軍隊(duì)總司令:美以讓伊朗屈服的企圖將永遠(yuǎn)落空

財(cái)聯(lián)社
2026-04-16 20:02:16
上喂阿祖下睡士兵男孩!底特律變?nèi)伺鞒珊谂勰虌?>
    </a>
        <h3>
      <a href=游民星空
2026-04-16 18:19:55
53歲男子每天吃維生素B12,半年后去檢查,醫(yī)生疑惑:吃了啥?

53歲男子每天吃維生素B12,半年后去檢查,醫(yī)生疑惑:吃了啥?

醫(yī)學(xué)原創(chuàng)故事會(huì)
2026-04-16 23:40:12
銅梁龍2-0十人新鵬城暫登頂,向余望、陳純新破門(mén),本科維奇染紅

銅梁龍2-0十人新鵬城暫登頂,向余望、陳純新破門(mén),本科維奇染紅

懂球帝
2026-04-17 21:53:29
青春風(fēng)暴,青島德比中17歲王庚睿與17歲鄺兆鐳替補(bǔ)登場(chǎng)

青春風(fēng)暴,青島德比中17歲王庚睿與17歲鄺兆鐳替補(bǔ)登場(chǎng)

懂球帝
2026-04-17 20:04:11
太可惡!上海警方通報(bào):何某、王某等7人被依法采取刑事強(qiáng)制措施!受害車(chē)主超200人

太可惡!上海警方通報(bào):何某、王某等7人被依法采取刑事強(qiáng)制措施!受害車(chē)主超200人

環(huán)球網(wǎng)資訊
2026-04-17 14:26:18
霍爾木茲火光沖天,臺(tái)當(dāng)局突然傳出大動(dòng)靜,真拿解放軍當(dāng)軟柿子?

霍爾木茲火光沖天,臺(tái)當(dāng)局突然傳出大動(dòng)靜,真拿解放軍當(dāng)軟柿子?

流年顛簸
2026-04-16 09:19:30
俄媒批評(píng):中國(guó)車(chē)輛耐用度僅為德系一半!易腐蝕、品質(zhì)不及歐美

俄媒批評(píng):中國(guó)車(chē)輛耐用度僅為德系一半!易腐蝕、品質(zhì)不及歐美

老鵜愛(ài)說(shuō)事
2026-04-06 06:35:02
李小冉唱得好不好,我不評(píng)價(jià),但是老公肯定后悔讓她參加節(jié)目了

李小冉唱得好不好,我不評(píng)價(jià),但是老公肯定后悔讓她參加節(jié)目了

南萬(wàn)說(shuō)娛26
2026-04-16 09:07:20
2026-04-18 02:07:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16591文章數(shù) 514885關(guān)注度
往期回顧 全部

科技要聞

7家頭部平臺(tái)被罰沒(méi)35.97億元

頭條要聞

特朗普:感謝伊朗開(kāi)放霍爾木茲海峽

頭條要聞

特朗普:感謝伊朗開(kāi)放霍爾木茲海峽

體育要聞

中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

娛樂(lè)要聞

劉德華摯友潘宏彬離世 曾一起租房住

財(cái)經(jīng)要聞

"影子萬(wàn)科"2.0:管理層如何吸血萬(wàn)物云?

汽車(chē)要聞

又快又穩(wěn)的開(kāi)掛動(dòng)力! 阿維塔06T全系搭分布式電驅(qū)

態(tài)度原創(chuàng)

旅游
時(shí)尚
家居
藝術(shù)
公開(kāi)課

旅游要聞

三月三登泰山!蟠桃會(huì)+古風(fēng)巡游驚艷出圈

今日熱點(diǎn):許光漢否認(rèn)和周子瑜戀情;郝熠然與誠(chéng)實(shí)一口終止合作……

家居要聞

法式線條 時(shí)光靜淌

藝術(shù)要聞

你絕對(duì)想不到!文森特的色粉作品竟如此驚艷!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版