国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

機器人是怎么學會干活的:一部當代簡史

0
分享至


(來源:麻省理工科技評論)

機器人學家過去的特點是:夢做得很大,東西造得很小。他們滿懷壯志要匹敵甚至超越人體的驚人復雜度,然后把整個職業(yè)生涯花在給汽車工廠打磨機械臂上;目標是 C-3PO(《星球大戰(zhàn)》里的人形機器人,能說六百多萬種語言,會走路、會社交、有情感反應(yīng),是科幻電影中最經(jīng)典的“像人一樣的機器人”形象),做出來的是掃地機器人 Roomba。

這些研究者中許多人的真正野心,是科幻片里的那種機器人——能在世界中自由移動、適應(yīng)不同環(huán)境、安全而有益地與人互動。對有社會使命感的人來說,這樣的機器可以幫助行動不便的人、緩解孤獨感、承擔對人類來說太危險的工作。對更看重商業(yè)前景的人來說,它意味著一種取之不盡、不用發(fā)工資的勞動力來源。但不管出發(fā)點是什么,一段漫長的失敗史讓硅谷大多數(shù)人不敢在“有用的機器人”上下注。

這個局面變了。機器還沒造出來,但錢已經(jīng)涌進來了:僅 2025 年一年,企業(yè)和投資者就向人形機器人砸了 61 億美元,是 2024 年投資額的四倍。

發(fā)生了什么?機器學習與世界互動的方式經(jīng)歷了一場革命。

設(shè)想你想在家里裝一雙機械臂,只讓它做一件事:疊衣服。它該怎么學會?你可以先寫規(guī)則:檢查面料,算出它被拉伸到什么程度會撕裂;識別襯衫的領(lǐng)子;把夾爪移到左袖,抬起來,向內(nèi)折疊精確到多少距離;右袖重復一遍;如果襯衫轉(zhuǎn)了方向,相應(yīng)地調(diào)整方案;如果袖子擰了,糾正它……規(guī)則的數(shù)量很快就會爆炸,但如果真的把每種情況都窮舉了,確實能產(chǎn)出可靠的結(jié)果。這就是機器人學最初的手藝:預判一切可能性,提前寫好代碼。

大約 2015 年前后,前沿領(lǐng)域開始換打法:在數(shù)字世界里搭建機械臂和衣服的仿真模型,每次成功疊好就給程序一個獎勵信號,失敗了就扣分。通過反復試錯、迭代幾百萬次,程序自己摸索出越來越好的技巧——跟 AI 學下棋用的方法一樣。

2022 年 ChatGPT 的問世引爆了當前這輪熱潮。大語言模型在海量文本上訓練,工作原理不是試錯,而是學會預測一句話里下一個詞應(yīng)該是什么。類似的模型被移植到機器人領(lǐng)域后,很快就能吃進圖像、傳感器讀數(shù)和機器人關(guān)節(jié)的位置信息,預測機器接下來該做什么動作,每秒鐘發(fā)出幾十條運動指令。

依賴能吃下大量數(shù)據(jù)的 AI 模型,似乎不管機器人是需要跟人說話、在環(huán)境中移動,還是完成復雜任務(wù),都管用。而且它還和其他想法結(jié)合在一起,比如即使機器人還不完美也先放出去,讓它在真實工作環(huán)境里繼續(xù)學習。今天,硅谷的機器人學家們又開始做大夢了。



Jibo - Jibo

早在大語言模型時代之前,一臺可以活動的社交機器人就已經(jīng)在和人聊天了。

2014 年,MIT 的機器人學家辛西婭·布里澤爾(Cynthia Breazeal)向世界介紹了一款沒有手臂、沒有腿、沒有臉的機器人,叫 Jibo。它看上去像一盞臺燈。布里澤爾的目標是為家庭打造一款社交機器人,這個想法通過眾籌拉到了 370 萬美元。早期預訂價 749 美元。

早期的 Jibo 能做自我介紹,能跳舞逗孩子開心,但也就僅此而已了。它的愿景一直是成為一種有實體的助手,從日程管理、處理郵件到講故事什么都能干。它確實贏得了一批忠實用戶,但公司最終在 2019 年關(guān)閉了。


(來源:麻省理工科技評論)

回頭來看,Jibo 最需要的是更好的語言能力。它當時的競爭對手是蘋果的 Siri 和亞馬遜的 Alexa,而這些技術(shù)在當時都依賴大量的腳本預設(shè)?;\統(tǒng)來說,當你跟它們說話時,軟件會把你的語音轉(zhuǎn)成文字,分析你想要什么,然后從預先批準的回復片段里拼出一個回應(yīng)。這些片段可以很有趣,但也重復、無聊——用一個詞來說就是“很機械”。對一款定位社交和家庭的機器人來說,這是硬傷。

此后發(fā)生的事情大家都知道了:機器生成語言的方式發(fā)生了一場革命。如今任何一家頭部 AI 公司的語音模式都已經(jīng)做到了引人入勝、令人印象深刻,多家硬件初創(chuàng)公司正在嘗試(但大多失?。┐蛟炖眠@項能力的產(chǎn)品。

但新能力也帶來新風險:預設(shè)腳本的對話不太會跑偏,AI 生成的對話就不一定了。比如一些流行的 AI 玩具就曾跟孩子聊過如何找到火柴和刀。



OpenAI - Dactyl

一只用仿真訓練的機器手,嘗試模擬真實世界的不可預測性和變化。

到 2018 年,所有頂尖機器人實驗室都在努力拋棄舊式的腳本規(guī)則,轉(zhuǎn)而通過試錯來訓練機器人。OpenAI 嘗試在虛擬環(huán)境中訓練它的機器手 Dactyl——用機器手和手掌大小的立方體的數(shù)字模型。立方體的每個面上有字母和數(shù)字,模型可能設(shè)定一個任務(wù),比如“轉(zhuǎn)動立方體,讓帶有字母 O 的紅色面朝上”。


(來源:麻省理工科技評論)

問題在于:機器手可能在仿真世界里做得非常好,但當你把這個程序拿到現(xiàn)實世界、讓它操作真正的立方體時,兩個世界之間的細微差異就可能導致失靈。顏色可能略有不同,機器人指尖的可變形橡膠可能比仿真里的更有彈性。

解決方案叫做“域隨機化”(domain randomization):你本質(zhì)上是創(chuàng)造出幾百萬個略有差異的仿真世界,每個世界里的摩擦力、光照、顏色都被隨機調(diào)整;接觸了足夠多的變化之后,機器人在真實世界中操控立方體的能力就會更強。這個方法在 Dactyl 上成功了。一年后它用同樣的核心技術(shù)完成了更難的任務(wù):解魔方(盡管成功率只有 60%,面對特別復雜的打亂時只有 20%)。

不過仿真技術(shù)有其局限性,這種方法在今天扮演的角色已經(jīng)比 2018 年小得多了。OpenAI 在 2021 年關(guān)閉了機器人業(yè)務(wù),但最近重新啟動了這個部門,據(jù)報道正在聚焦人形機器人。



Google DeepMind - RT-2

從互聯(lián)網(wǎng)上的海量圖片中學習,幫助機器人把語言指令轉(zhuǎn)化為動作。

2022 年前后,Google 的機器人團隊在做一些有點奇怪的事情。他們花了 17 個月,把機器人遙控器交給人類,拍下他們做各種事情的視頻——從拿起薯片袋到開罐頭。團隊最終編錄了 700 種不同的任務(wù)。


(來源:麻省理工科技評論)

Google 的目的是構(gòu)建和測試機器人領(lǐng)域最早的大規(guī)?;A(chǔ)模型之一。思路和大語言模型類似:把大量文本輸入進去,將其標記化為算法能處理的格式,然后生成輸出。Google 的 RT-1 接收的輸入包括機器人看到的畫面和機械臂各部件的位置信息,然后接受一條指令,將其轉(zhuǎn)化為驅(qū)動機器人運動的指令。對于見過的任務(wù),它的成功率達到 97%;對于沒見過的指令,成功率也有 76%。

第二代 RT-2 在次年發(fā)布,走得更遠。它不再只用機器人專屬的數(shù)據(jù)來訓練,而是擴大了范圍:像當時很多研究者在做的視覺-語言模型一樣,它在互聯(lián)網(wǎng)上的通用圖片上訓練,這讓機器人能夠理解場景中各種物體在哪里。

“一大堆新能力突然被解鎖了,”Google DeepMind 的機器人學家卡尼什卡·拉奧(Kanishka Rao)說。他主導了兩代模型的開發(fā)?!拔覀儸F(xiàn)在能執(zhí)行‘把可樂罐放到泰勒·斯威夫特的照片旁邊’這種指令了?!?/p>

2025 年,Google DeepMind 進一步融合了大語言模型和機器人的世界,發(fā)布了 Gemini Robotics 模型,在理解自然語言指令方面有了進一步提升。



Covariant - RFM-1

2017 年,在 OpenAI 關(guān)閉第一支機器人團隊之前,一批工程師從中拆分出來,創(chuàng)辦了一個叫 Covariant 的項目。他們的目標不是造科幻片里的人形機器人,而是造最務(wù)實的那種:一條能在倉庫里拿東西、搬東西的機械臂。Covariant 構(gòu)建了一套類似 Google 基礎(chǔ)模型思路的系統(tǒng),把它部署到 Crate & Barrel 等公司運營的倉庫里,同時把這些倉庫當作數(shù)據(jù)采集管道。

到 2024 年,Covariant 發(fā)布了一款機器人模型 RFM-1,你可以像跟同事說話一樣跟它互動。比如你先給機械臂看一堆筒裝網(wǎng)球,然后讓它把每一筒分別放到不同的區(qū)域。機器人還能做出回應(yīng)——比如預判自己可能抓不穩(wěn)這個物品,然后主動問你應(yīng)該用哪種吸盤。

這類交互在實驗室里做過,但 Covariant 是在大規(guī)模的真實環(huán)境中落地。公司在每個客戶的場地都部署了攝像頭和數(shù)據(jù)采集設(shè)備,源源不斷地給模型反饋更多訓練數(shù)據(jù)。


(來源:麻省理工科技評論)

它還不完美。2024 年 3 月的一次演示中,面前擺著一堆廚房用品,機器人被要求把香蕉放回原來的位置。它先拿起一塊海綿,又拿起一個蘋果,接著又拿了一堆別的東西,折騰半天才完成任務(wù)。

聯(lián)合創(chuàng)始人 Peter Chen 當時告訴我,它“還不理解回溯自己步驟這個新概念。但這是個很好的例子——在缺乏好的訓練數(shù)據(jù)的場景里,它可能還不太行?!?/p>

Peter Chen 和另一位聯(lián)合創(chuàng)始人彼得·阿貝爾(Pieter Abbeel)后來被亞馬遜聘用。亞馬遜目前在許可使用 Covariant 的機器人模型(亞馬遜沒有回應(yīng)關(guān)于具體用途的提問,但該公司僅在美國就運營著大約 1300 座倉庫)。



Agility Robotics - Digit

多家企業(yè)正把這款人形機器人投入真實工作場景。

涌入機器人初創(chuàng)公司的新一輪投資,主要瞄準的不是燈狀或臂狀的機器人,而是人形的。人形機器人理論上可以無縫進入人類目前工作的空間和崗位,不用為了適應(yīng)什么巨型機械臂之類的新形態(tài)去改造流水線。

說起來容易做起來難。在人形機器人確實出現(xiàn)在真實倉庫中的少數(shù)案例里,它們往往被限制在測試區(qū)和試點項目中。


(來源:麻省理工科技評論)

不過 Agility 的人形機器人 Digit 確實在做一些真正的活。它的一些設(shè)計更多是出于功能考慮而非科幻審美,例如裸露的關(guān)節(jié)、頭部明顯不像人等。亞馬遜、豐田和 GXO(一家物流巨頭,客戶包括蘋果和耐克)都部署了 Digit,這讓它成為最早被企業(yè)視為“真的能省錢”而不只是新奇噱頭的人形機器人之一。它們每天的工作就是搬運、移動和堆疊貨運周轉(zhuǎn)箱。

不過目前的 Digit 離硅谷押注的那種“像人一樣的幫手”還差得遠。比如它只能搬起 35 磅的東西,而且每次 Agility 把 Digit 做得更有力,電池就更重,充電就更頻繁。標準制定機構(gòu)也表示,人形機器人需要比大多數(shù)工業(yè)機器人更嚴格的安全規(guī)則,因為它們被設(shè)計成可以移動的,而且會長時間在人類身邊工作。

但 Digit 說明了一件事:這場機器人訓練的革命并沒有匯聚到某一種單一方法上。Agility 依賴的仿真技術(shù)和 OpenAI 訓練機器手時用的類似,同時公司也在和 Google 的 Gemini 模型合作,幫助機器人適應(yīng)新環(huán)境。十多年的實驗把整個行業(yè)帶到了今天這個節(jié)點:現(xiàn)在,它們開始想把機器人造得越來越大。

https://www.technologyreview.com/2026/04/17/1135416/how-robots-learn-brief-contemporary-history/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
六個省級黨委領(lǐng)導班子調(diào)整

六個省級黨委領(lǐng)導班子調(diào)整

上觀新聞
2026-04-20 16:16:16
人民日報聯(lián)合工信部緊急預警:全體iPhone用戶,請立刻升級系統(tǒng)!

人民日報聯(lián)合工信部緊急預警:全體iPhone用戶,請立刻升級系統(tǒng)!

小柱解說游戲
2026-04-19 20:52:59
太難了!貴州女子哭訴生意不好,想把女兒生活費2000降到1600遭拒

太難了!貴州女子哭訴生意不好,想把女兒生活費2000降到1600遭拒

火山詩話
2026-04-20 13:51:19
大跌眼鏡!“做空閨蜜”登熱搜,勸閨蜜不婚不育,自己孩子10歲了

大跌眼鏡!“做空閨蜜”登熱搜,勸閨蜜不婚不育,自己孩子10歲了

火山詩話
2026-04-20 07:28:33
以軍:打死阿里·里達·阿巴斯

以軍:打死阿里·里達·阿巴斯

南方都市報
2026-04-19 21:17:31
發(fā)現(xiàn)利智也沒想象那么漂亮??!這是他和李連杰結(jié)婚當天拍的照片

發(fā)現(xiàn)利智也沒想象那么漂亮??!這是他和李連杰結(jié)婚當天拍的照片

阿廢冷眼觀察所
2026-04-20 14:24:52
5月1日起物業(yè)行業(yè)徹底大變天!新規(guī)落地,業(yè)主終于不用再忍氣吞聲

5月1日起物業(yè)行業(yè)徹底大變天!新規(guī)落地,業(yè)主終于不用再忍氣吞聲

另子維愛讀史
2026-04-19 19:37:43
越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

混沌錄
2026-04-19 17:27:06
一場119-84的狂勝,讓火箭湖人都感到絕望,掘金也徹底后悔了

一場119-84的狂勝,讓火箭湖人都感到絕望,掘金也徹底后悔了

毒舌NBA
2026-04-20 07:51:44
巴基斯坦陸軍參謀長同特朗普通話

巴基斯坦陸軍參謀長同特朗普通話

財聯(lián)社
2026-04-20 17:14:06
美伊戰(zhàn)事期間真實的特朗普:抱怨、焦慮、搖擺不定!救飛行員時被幕僚擋戰(zhàn)情室外

美伊戰(zhàn)事期間真實的特朗普:抱怨、焦慮、搖擺不定!救飛行員時被幕僚擋戰(zhàn)情室外

紅星新聞
2026-04-20 15:36:11
馬卡:馬競?cè)牱岛綍r飛機上彌漫著葬禮般的氛圍

馬卡:馬競?cè)牱岛綍r飛機上彌漫著葬禮般的氛圍

懂球帝
2026-04-20 10:40:10
貴州茅臺股價盤中反超源杰科技,重新成為A股市場股價“一哥”

貴州茅臺股價盤中反超源杰科技,重新成為A股市場股價“一哥”

界面新聞
2026-04-20 10:52:14
住了33年的房屋要被強拆還地,臺灣婦人叫囂:我是大日本帝國臣民

住了33年的房屋要被強拆還地,臺灣婦人叫囂:我是大日本帝國臣民

金牛傳聲
2026-04-19 12:27:48
牡丹江男子拽住跳樓女友整整五分鐘,力竭松手女方墜亡,法院判了

牡丹江男子拽住跳樓女友整整五分鐘,力竭松手女方墜亡,法院判了

奇思妙想草葉君
2026-04-18 12:15:59
歸元S平臺到底有多強?魏牌V9X原生AI深度解析

歸元S平臺到底有多強?魏牌V9X原生AI深度解析

極果酷玩
2026-04-19 23:30:18
被蘋果、華為干倒的諾基亞,又殺回來了!

被蘋果、華為干倒的諾基亞,又殺回來了!

大佬灼見
2026-04-19 10:28:53
收拾完伊朗,下一個輪到中國?以色列發(fā)戰(zhàn)爭威脅,中方送出5個字

收拾完伊朗,下一個輪到中國?以色列發(fā)戰(zhàn)爭威脅,中方送出5個字

千羽解讀
2026-04-18 10:12:15
確定!英超爭冠不會有附加賽,如果同分,曼城比阿森納多一個優(yōu)勢

確定!英超爭冠不會有附加賽,如果同分,曼城比阿森納多一個優(yōu)勢

嗨皮看球
2026-04-20 11:23:17
突發(fā)!340億開源巨頭徹底撤離中國,419名頂級工程師被瘋搶,18年深耕終落幕…

突發(fā)!340億開源巨頭徹底撤離中國,419名頂級工程師被瘋搶,18年深耕終落幕…

新浪財經(jīng)
2026-04-20 04:31:06
2026-04-20 18:19:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16600文章數(shù) 514891關(guān)注度
往期回顧 全部

科技要聞

華為Pura90逆周期定價,4699元起,未漲價

頭條要聞

小伙入職僅一天公司40多部手機集體"失靈" 警方提醒

頭條要聞

小伙入職僅一天公司40多部手機集體"失靈" 警方提醒

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

鹿晗生日上熱搜,被關(guān)曉彤撕下體面

財經(jīng)要聞

月之暗面IPO迷局

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

旅游
本地
家居
數(shù)碼
公開課

旅游要聞

英國倫敦:維多利亞與阿爾伯特博物館東館即將開放

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

家居要聞

自然慢調(diào) 慢享時光

數(shù)碼要聞

華為MateBook 14鴻蒙版筆記本官宣搭載麒麟X90處理器

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版