国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

自變量WALL-B :以世界統(tǒng)一模型架構(gòu),解鎖進(jìn)入家庭能力

0
分享至



作者:呂鑫燚

出品:具身研習(xí)社

鮮少有人意識到,具身智能不是在模仿人,而是對人類行為的精準(zhǔn)解構(gòu)和復(fù)現(xiàn)。

更具體一點(diǎn)來說,人形機(jī)器人從來不是在逐幀模仿人類的動(dòng)作軌跡,更不是靠海量示教、視頻投喂訓(xùn)練出來的 “動(dòng)作復(fù)刻機(jī)器”。它真正要完成的核心命題,是拆解人類完成一個(gè)行為背后的完整決策閉環(huán)。就像你不會(huì)專門去訓(xùn)練把桌子邊緣的盤子往里推推這個(gè)動(dòng)作,但這件事情則是機(jī)器人融入生活中一定會(huì)遇到的問題。

從環(huán)境的多模態(tài)感知、任務(wù)的意圖判斷、全局的動(dòng)作規(guī)劃,到末端的微調(diào)、實(shí)時(shí)的誤差修正、突發(fā)狀況的應(yīng)急應(yīng)對,把人類憑借本能和經(jīng)驗(yàn)就能下意識完成的動(dòng)作,拆解成可被算法理解、可被硬件執(zhí)行、可在不同場景中自由遷移的邏輯單元。

而我們所說的復(fù)現(xiàn),從來不是在固定場景、固定條件下完成一次嚴(yán)絲合縫的動(dòng)作復(fù)刻,而是讓機(jī)器人擁有和人類同源的 “行為通用能力”。就像人類學(xué)會(huì)了 “端取” 這個(gè)動(dòng)作,就能端紙杯、玻璃杯、易碎的陶瓷碗,能在平穩(wěn)的桌面端、在顛簸的移動(dòng)場景中端,能給自己喂水、也能精準(zhǔn)地給他人遞物。具身智能要實(shí)現(xiàn)的,正是這種基于底層行為邏輯的、跨場景的能力遷移,而不是永遠(yuǎn)困在預(yù)設(shè)指令里的 “提線木偶”。

因此,具身智能不應(yīng)陷在模仿人類的陷阱,而是找到屬于自身的“Born this way”

自變量機(jī)器人前不久發(fā)布的新模型WALL-B正是對這一困局的精準(zhǔn)解剖。



WALL-B是全球首個(gè)基于世界統(tǒng)一模型架構(gòu)(WorldUnifiedModel,WUM)的具身智能基礎(chǔ)模型,是一次從底層架構(gòu)到訓(xùn)練范式的全面重寫,標(biāo)志著具身基礎(chǔ)模型從VLA架構(gòu)向原生多模態(tài)融合架構(gòu)的重大跨越。通俗而言,這意味著機(jī)器人從 “基因?qū)用妗?就具備了理解物理世界、解讀行為意圖的能力,能夠由內(nèi)而外地構(gòu)建起與真實(shí)世界相匹配的認(rèn)知邏輯,而非停留在 “照貓畫虎” 式的表面模仿,只知其然不知其所以然。

只有機(jī)器人基因里就更貼合人類的行為模式與認(rèn)知邏輯,具身智能才能真正無縫融入人類社會(huì)。

而這一愿景的實(shí)現(xiàn),既非遙不可及的未來,也不是孤立的技術(shù)驗(yàn)證:它將在 30 多天后成為現(xiàn)實(shí)。



我們習(xí)以為常的「下意識」動(dòng)作,是人類智能最精妙的體現(xiàn)。不妨用「做一碗番茄炒蛋」這個(gè)最普通的家務(wù)來拆解問題。

一個(gè)普通人做飯時(shí),是多感官全開的狀態(tài):眼睛要分辨番茄的成熟度、雞蛋的新鮮度,還要留意灶臺(tái)的火候;手要感受菜刀的重量、番茄的軟硬,顛勺時(shí)能精準(zhǔn)感知鍋里食材的分量;耳朵要聽油燒熱的聲音,判斷什么時(shí)候下雞蛋最合適;甚至皮膚能感覺到窗外吹進(jìn)來的風(fēng),順手把快要被吹到鍋里的廚房紙挪開。整個(gè)過程行云流水,所有信息是同步輸入、同步處理、同步輸出的。

我們從來不會(huì)把一個(gè)完整的動(dòng)作拆成「識別物體→理解目標(biāo)→生成軌跡」三個(gè)孤立的步驟,而是讓視覺、觸覺、聽覺、本體感在大腦中瞬間融合,形成對當(dāng)下場景的整體判斷,然后自然而然地做出反應(yīng)。

但長期以來,機(jī)器人恰恰缺少這種「下意識」。

基于 VLA(視覺 - 語言 - 動(dòng)作)架構(gòu)的機(jī)器人,做這件事就像三個(gè)互不認(rèn)識的人在接力:視覺模塊先識別出「這是番茄」「這是菜刀」,把結(jié)果傳給語言模塊;語言模塊理解「把番茄切成塊」的指令,再翻譯成動(dòng)作語言傳給動(dòng)作模塊;動(dòng)作模塊最后生成一條預(yù)設(shè)的切菜軌跡。

數(shù)據(jù)在這三個(gè)模塊之間每傳遞一次,就會(huì)發(fā)生一次信息損耗,這就是為什么我們總看到機(jī)器人切菜要么太輕切不動(dòng),要么太重把菜剁爛。它根本沒有「看到」完整的世界,只是在執(zhí)行一串翻譯過來的命令。

自變量機(jī)器人剛剛發(fā)布的世界統(tǒng)一模型 WALL-B,第一次真正試圖解決這個(gè)問題。它沒有在 VLA 架構(gòu)上修修補(bǔ)補(bǔ),而是從底層重構(gòu)了機(jī)器人的「大腦」,采用了全球首個(gè)世界統(tǒng)一模型架構(gòu)。



這個(gè)思路其實(shí)很像蘋果當(dāng)年推出 M1 芯片時(shí)的革命。在 M1 之前,電腦的 CPU、GPU、內(nèi)存各自獨(dú)立,數(shù)據(jù)需要在不同部件之間來回搬運(yùn),產(chǎn)生大量延遲和損耗;而統(tǒng)一內(nèi)存架構(gòu)讓所有處理單元共享同一塊內(nèi)存,數(shù)據(jù)不需要再搬家,性能直接躍升了一個(gè)量級。

在機(jī)器人領(lǐng)域,VLA 架構(gòu)就像是 M1 之前的電腦,視覺、語言、動(dòng)作三個(gè)模塊各自為政,就像三個(gè)只會(huì)說自己方言的人,需要層層翻譯才能溝通。而 WUM 架構(gòu)的核心理念,就是把視覺、語言、動(dòng)作、物理預(yù)測等所有能力整合,徹底消除模塊之間的邊界和數(shù)據(jù)搬運(yùn)的損耗。

這意味著WALL-B 第一次實(shí)現(xiàn)了真正的「多模態(tài)進(jìn)、多模態(tài)出」。它不再是「先看、再想、再動(dòng)」,而是整個(gè)動(dòng)作執(zhí)行過程沒有任何延遲,就像人類的「下意識」一樣自然。



WALL-B 因此擁有了「原生本體感」。它不需要盯著自己的手臂,也不需要依賴外部傳感器,就能內(nèi)在地知道自己的身高、臂展,知道自己能不能夠到書架頂層的書,能不能穿過廚房的窄門。這種內(nèi)生的空間感知能力,是之前所有機(jī)器人都不具備的。

更重要的是,WALL-B 和所有之前的機(jī)器人最大的不同,在于它理解這個(gè)世界運(yùn)行的基本規(guī)律。它知道重力會(huì)讓懸空的物體掉下來,知道摩擦力會(huì)讓推出去的箱子慢慢停下,知道慣性會(huì)讓裝滿水的杯子在移動(dòng)時(shí)灑出來。當(dāng)它看到一個(gè)盤子一半露在桌沿外,不需要見過一模一樣的場景,就能預(yù)測到「這個(gè)盤子會(huì)掉下來摔碎」,然后主動(dòng)伸手把它推回去。

這種對物理規(guī)律的理解,才是機(jī)器人能在真實(shí)家庭中生存的關(guān)鍵。家庭環(huán)境是世界上最隨機(jī)、最碎片化的場景:今天孩子把玩具扔在沙發(fā)上,明天貓把水杯打翻在地毯上,后天你買了一個(gè)新形狀的碗。你不可能把所有可能的情況都放進(jìn)訓(xùn)練數(shù)據(jù)里,但物理規(guī)律是永遠(yuǎn)不變的。

WALL-B 正是抓住了這一點(diǎn)。它不需要針對每個(gè)家庭重新訓(xùn)練,只要掌握了基本的物理常識,就能在任何一個(gè)從未去過的家庭里應(yīng)對新場景。就像一個(gè)第一次去朋友家做客的人,不需要?jiǎng)e人教,也知道不能把熱水杯放在木質(zhì)茶幾上,知道開門時(shí)要注意后面有沒有人。



更符合人類行為本質(zhì)的是 WUM 架構(gòu)不會(huì)害怕失敗,目前主流機(jī)器人在任務(wù)失敗后通常直接停止,而WALL-B 的行為模式則完全不同:它在失敗后會(huì)調(diào)整策略再次嘗試。成功后會(huì)將經(jīng)驗(yàn)直接更新到模型參數(shù)中。它會(huì)從錯(cuò)誤中學(xué)習(xí),會(huì)在和世界的交互中自我進(jìn)化。

人類的「下意識」,是幾百萬年進(jìn)化刻在基因里的本能。而機(jī)器人的「下意識」,才剛剛邁出第一步,當(dāng)機(jī)器人走上發(fā)布會(huì)舞臺(tái)上,撿起王潛隨意丟落的紙團(tuán),或許正是具身智能真正走進(jìn)我們生活的開始。



所有醫(yī)生在剛上崗的時(shí)候,都會(huì)面臨一個(gè)轉(zhuǎn)折點(diǎn):知識是從課本里學(xué)的,但人不會(huì)照著教科書生病。

這個(gè)現(xiàn)象和機(jī)器人進(jìn)入真實(shí)世界如出一轍。在絕對完美的實(shí)驗(yàn)室環(huán)境里用標(biāo)準(zhǔn)化數(shù)據(jù)喂養(yǎng),永遠(yuǎn)訓(xùn)練不出一個(gè)能解決實(shí)際問題的機(jī)器人。

自變量把這種數(shù)據(jù)形象地稱為 "糖水?dāng)?shù)據(jù)"干凈、可控、量大,就像糖水一樣甜,但除了甜沒有太高營養(yǎng)價(jià)值。用這類數(shù)據(jù)訓(xùn)練出的模型,能精準(zhǔn)完成實(shí)驗(yàn)室里預(yù)設(shè)的每一個(gè)動(dòng)作,卻無法應(yīng)對真實(shí)家庭中隨時(shí)變化的自然光、隨意擺放的物品、孩子和寵物的隨機(jī)動(dòng)作。

與之相對的是 "牛奶數(shù)據(jù)"。真實(shí)家庭環(huán)境中采集的嘈雜、多變、充滿隨機(jī)性的數(shù)據(jù)。這種數(shù)據(jù)采集成本高、獲取難度大,但卻是真正能讓機(jī)器人 "長身體、更聰明" 的營養(yǎng)來源。

自變量機(jī)器人選擇了這條看似最難的道路,團(tuán)隊(duì)進(jìn)入了數(shù)百個(gè)真實(shí)家庭進(jìn)行模型訓(xùn)練。有的家庭地面散落著拖鞋、快遞箱、玩具和襪子;有的家庭中貓會(huì)突然跳上桌子;有的家庭廚房燈光偏暖色而客廳偏冷色。

這涉及到的是不規(guī)則光照變化、無規(guī)律的人類運(yùn)動(dòng)軌跡、各式各樣的動(dòng)線和操作物體,在這種高度不可控的環(huán)境中訓(xùn)練、學(xué)習(xí),是模型必須學(xué)會(huì)應(yīng)對的真實(shí)條件。畢竟,實(shí)驗(yàn)室中無法模擬無規(guī)律的變量,但這就是我們家庭環(huán)境中的日常,因此牛奶數(shù)據(jù)對于訓(xùn)練模型而言,是真正訓(xùn)練出具備零樣本泛化能力的具身智能基礎(chǔ)模型必然要走的路徑。

但這還不足以還原WALL-B的完整圖景,其數(shù)據(jù)策略為“實(shí)驗(yàn)室數(shù)據(jù)打底、真實(shí)環(huán)境數(shù)據(jù)提質(zhì)”。其中,實(shí)驗(yàn)室數(shù)據(jù)用于建立基本能力,類似于人類的「通識教育」識別常見物體、執(zhí)行基礎(chǔ)動(dòng)作。真實(shí)家庭數(shù)據(jù)則讓模型學(xué)會(huì)在不確定環(huán)境中生存,在高動(dòng)態(tài)環(huán)境中一次又一次完成沒有劇本的任務(wù)。

更為重要的是,自變量 CTO 王昊在群訪中進(jìn)一步提到,WALL-B在做推理或者是執(zhí)行任務(wù)的同時(shí)一直在做數(shù)據(jù)的回流,所以并不會(huì)有所謂迭代周期的概念,它是實(shí)現(xiàn)在線式的學(xué)習(xí)。



當(dāng)機(jī)器人在真實(shí)家庭中完成每一次任務(wù)、應(yīng)對每一個(gè)突發(fā)狀況時(shí),都會(huì)產(chǎn)生新的高質(zhì)量數(shù)據(jù)反哺模型,形成一個(gè)由真實(shí)隨機(jī)、不可預(yù)測的現(xiàn)實(shí)數(shù)據(jù)所驅(qū)動(dòng)的正向飛輪。這個(gè)飛輪一旦轉(zhuǎn)動(dòng)起來,就會(huì)成為難以復(fù)制的核心壁壘,隨著時(shí)間的推移復(fù)制窗口期也會(huì)逐步擴(kuò)大。

這種迭代方式也正是具身企業(yè)長久競爭力的關(guān)鍵。



一個(gè)家庭成員的誕生,這是自變量機(jī)器人這場發(fā)布會(huì)的主題,也是一個(gè)極易被行業(yè)忽略的本質(zhì)定義 ,機(jī)器人在家庭場景中首先是「成員」,而非「保姆」。

我們當(dāng)然有理由期待,未來的家庭機(jī)器人能媲美甚至超越一個(gè)優(yōu)秀的保姆。

但回歸客觀現(xiàn)實(shí),當(dāng)下所有走進(jìn)家庭的機(jī)器人,本質(zhì)上都只是一個(gè) “新來的成員”。



它會(huì)像每一個(gè)初入陌生家庭的人一樣,需要一點(diǎn)點(diǎn)摸清家里的動(dòng)線,記住每個(gè)人的作息習(xí)慣,慢慢讀懂你的情緒與偏好。它會(huì)犯錯(cuò),會(huì)手忙腳亂,會(huì)做出讓人哭笑不得的舉動(dòng),但也會(huì)在一次次與家人的磨合中持續(xù)進(jìn)化,越來越懂這個(gè)家。

這正是自變量科技堅(jiān)持的進(jìn)家庭初心。王潛在發(fā)布會(huì)上直言,自變量從創(chuàng)立之初就沒想過要打造一個(gè) “無所不能的完美保姆”,而是要做一個(gè)能真正扎根家庭、與家人共同成長的 “新成員”。

5 月 25 日,自變量機(jī)器人將開啟進(jìn)入家庭的腳步,從擺鞋子、疊衣服到覆蓋家庭里那些零散卻耗時(shí)的長尾需求。但自變量機(jī)器人也在現(xiàn)場坦誠表示,這并不意味著機(jī)器人能實(shí)現(xiàn)百分之百的全自主運(yùn)行,會(huì)有人工為安全和體驗(yàn)兜底。

很多人會(huì)問,既然還不完美,為什么要急著走進(jìn)家庭?答案藏在具身智能的迭代邏輯里。不應(yīng)該為機(jī)器人預(yù)設(shè) “要做多少次才能學(xué)會(huì)某件事” 的條條框框,最好的方式就是讓它直接去做、去嘗試,在真實(shí)的人機(jī)交互中收集數(shù)據(jù)、修正不足。

如果因?yàn)榭謶?“不行” 就按下前進(jìn)的暫停鍵,機(jī)器人永遠(yuǎn)只能停留在實(shí)驗(yàn)室的預(yù)設(shè)場景里,永遠(yuǎn)無法真正理解復(fù)雜多變的真實(shí)家庭生活。

從產(chǎn)業(yè)演進(jìn)的視角看,這一步的意義遠(yuǎn)不止于一款產(chǎn)品的落地。它標(biāo)志著通用機(jī)器人終于走出了實(shí)驗(yàn)室的 “溫室”,開始直面最開放、最復(fù)雜的家庭場景。這是具身智能發(fā)展史上的一個(gè)巨大轉(zhuǎn)折,當(dāng)機(jī)器人開始在千萬個(gè)真實(shí)家庭中邊做邊學(xué)、持續(xù)迭代,那個(gè)屬于物理世界的 “Aha moment”,或許真的比我們想象中來得更快。

從 “工具” 到 “成員”,這是改寫人與機(jī)器的關(guān)系瞬間,也重新定義了未來家庭的形態(tài)。這條路注定漫長,但每一步堅(jiān)定的邁進(jìn),都在為這個(gè)時(shí)代寫下新的注腳。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
大鬧亞航后續(xù):女子冒充空姐,正臉曝光已社死,寫保證書只是開始

大鬧亞航后續(xù):女子冒充空姐,正臉曝光已社死,寫保證書只是開始

社會(huì)日日鮮
2026-04-24 07:15:27
“最佳空腹血糖”是多少?建議:過63歲以后,血糖最好控制這范圍

“最佳空腹血糖”是多少?建議:過63歲以后,血糖最好控制這范圍

醫(yī)學(xué)科普匯
2026-04-24 20:20:03
146年來,全球僅有120位醫(yī)生獲得的殊榮,瑞金這位醫(yī)生拿到了!

146年來,全球僅有120位醫(yī)生獲得的殊榮,瑞金這位醫(yī)生拿到了!

上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院
2026-04-24 18:55:17
中美金融戰(zhàn),意外地幫中國解決了,房地產(chǎn)這個(gè)尾大不掉的問題

中美金融戰(zhàn),意外地幫中國解決了,房地產(chǎn)這個(gè)尾大不掉的問題

南宗歷史
2026-04-24 05:20:02
陳首富終究吞不下云南白藥 | 棱鏡

陳首富終究吞不下云南白藥 | 棱鏡

新浪財(cái)經(jīng)
2026-04-24 17:04:15
悲催!37歲名牌大學(xué)畢業(yè)、年薪30萬女醫(yī)生被技術(shù)男嫌棄,當(dāng)場崩潰

悲催!37歲名牌大學(xué)畢業(yè)、年薪30萬女醫(yī)生被技術(shù)男嫌棄,當(dāng)場崩潰

火山詩話
2026-04-24 06:14:58
斯諾克世錦賽:趙心童迎首勝!單桿64分追平丁俊暉,囧哥3-5到5-5

斯諾克世錦賽:趙心童迎首勝!單桿64分追平丁俊暉,囧哥3-5到5-5

劉姚堯的文字城堡
2026-04-24 22:22:43
內(nèi)存漲價(jià)了,安卓終于想起要管流氓 APP 了

內(nèi)存漲價(jià)了,安卓終于想起要管流氓 APP 了

互聯(lián)網(wǎng)放大鏡
2026-04-23 13:34:06
iPhone 18"不漲價(jià)"?蘋果把屏幕砍回四年前,然后叫它"先進(jìn)OLED"

iPhone 18"不漲價(jià)"?蘋果把屏幕砍回四年前,然后叫它"先進(jìn)OLED"

互聯(lián)網(wǎng)放大鏡
2026-04-23 12:37:46
美媒稱,革命衛(wèi)隊(duì)總司令瓦希迪成為美軍最新打擊目標(biāo)

美媒稱,革命衛(wèi)隊(duì)總司令瓦希迪成為美軍最新打擊目標(biāo)

山河路口
2026-04-24 13:23:02
華為系“圍獵”小米

華為系“圍獵”小米

電動(dòng)汽車觀察家
2026-04-23 15:21:05
6億成本拖9年,《美人魚2》難產(chǎn),華誼申請破產(chǎn),周星馳也很無奈

6億成本拖9年,《美人魚2》難產(chǎn),華誼申請破產(chǎn),周星馳也很無奈

八卦南風(fēng)
2026-04-24 17:50:24
廣東省政府副秘書長吳耿淡被查

廣東省政府副秘書長吳耿淡被查

上觀新聞
2026-04-24 18:11:03
DeepSeek+華為,黃仁勛:我們的噩夢來了!

DeepSeek+華為,黃仁勛:我們的噩夢來了!

藍(lán)字計(jì)劃
2026-04-24 19:59:54
北京首鋼50分大勝!超級外援首秀9分,曾凡博爆發(fā),麥基18分

北京首鋼50分大勝!超級外援首秀9分,曾凡博爆發(fā),麥基18分

體壇瞎白話
2026-04-24 21:25:36
2026了,《穿普拉達(dá)的女王2》華裔角色竟然叫這名,日韓網(wǎng)民怒了

2026了,《穿普拉達(dá)的女王2》華裔角色竟然叫這名,日韓網(wǎng)民怒了

觀察者網(wǎng)
2026-04-24 20:06:36
大理民宿市場涼透了!7000家民宿廝殺,有人虧百萬仍沒賣出去…

大理民宿市場涼透了!7000家民宿廝殺,有人虧百萬仍沒賣出去…

火山詩話
2026-04-23 09:14:07
A股,尾盤傳來一個(gè)“重磅利好”信號,下周,或?qū)⒂瓉泶笞儽P!

A股,尾盤傳來一個(gè)“重磅利好”信號,下周,或?qū)⒂瓉泶笞儽P!

夜深愛雜談
2026-04-24 21:31:35
“兩高”最新司法解釋引巨大爭議,網(wǎng)友:有些內(nèi)容太可怕了!

“兩高”最新司法解釋引巨大爭議,網(wǎng)友:有些內(nèi)容太可怕了!

娛樂圈見解說
2026-04-24 08:11:57
20余萬元尚未解救被困緬甸園區(qū)女孩,同園區(qū)逃生者講述驚魂一刻

20余萬元尚未解救被困緬甸園區(qū)女孩,同園區(qū)逃生者講述驚魂一刻

界面新聞
2026-04-24 13:05:29
2026-04-24 23:23:00
具身研習(xí)社
具身研習(xí)社
記錄具身智能浪潮迭代。
145文章數(shù) 1關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價(jià)格依然"屠夫級"

頭條要聞

賴清德面臨彈劾投票 島內(nèi)網(wǎng)友:不記名投票一定過

頭條要聞

賴清德面臨彈劾投票 島內(nèi)網(wǎng)友:不記名投票一定過

體育要聞

上海男籃23連勝+主場全勝 姚明之后最強(qiáng)一季

娛樂要聞

停工16個(gè)月!趙露思證實(shí)接拍新劇

財(cái)經(jīng)要聞

LG財(cái)閥內(nèi)斗:百億美元商業(yè)帝國爭奪戰(zhàn)

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態(tài)度原創(chuàng)

旅游
健康
游戲
家居
軍事航空

旅游要聞

蓉城花正好 “我心中的成都最美賞花地”指南發(fā)布

干細(xì)胞如何讓燒燙傷皮膚"再生"?

PS獨(dú)占登PC純屬被逼無奈!跨平臺(tái)只為活下去?

家居要聞

自然肌理 溫潤美學(xué)

軍事要聞

美伊陷入互相封鎖僵局

無障礙瀏覽 進(jìn)入關(guān)懷版