国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenAI投的機器人公司,發(fā)世界模型,靠“想象”干活兒

0
分享至


機器人前瞻(公眾號:robot_pro)
作者 江宇
編輯 漠影

機器人前瞻1月14日報道,昨日,OpenAI投資的挪威人形機器人公司1X發(fā)布了一款全新世界模型“1X World Model(1XWM)”,用于賦予機器人通識行為能力,并提升其對物理世界的理解與推理能力。

1XWM是一種在推理階段可通過文字和初始畫面生成未來視頻、再從中推理出機器人動作的世界模型,訓(xùn)練時借助了網(wǎng)頁視頻和少量機器人數(shù)據(jù)。

其主要應(yīng)用對象為1X正在量產(chǎn)的人形機器人Neo,這是一款“穿著瑜伽服、表情呆萌”的陪伴型機器人,主打家庭使用場景。

1X創(chuàng)始人兼CEO Bernt B?rnich稱:“Neo如今能夠?qū)⑷我庵噶钷D(zhuǎn)化為新動作,即便此前從未執(zhí)行過類似任務(wù)。這標(biāo)志著其通往‘自我學(xué)習(xí)’能力的起點,未來幾乎可以掌握人類所能想到的任何技能?!?/p>


▲1X創(chuàng)始人兼CEO Bernt B?rnich

不過,官方也澄清稱,當(dāng)前模型仍需經(jīng)過視頻與動作的雙重建模過程,尚未實現(xiàn)真正“零樣本即執(zhí)行”。

一、利用視頻推理世界,1XWM跳出“圖像到動作”的舊思路

不同于多數(shù)以圖文輸入直接預(yù)測動作的VLA(視覺語言動作)模型路線,1XWM通過“文字指導(dǎo)的視頻生成”推理機器人應(yīng)執(zhí)行的動作路徑。

其核心由兩個部分構(gòu)成:一是基于14B視頻生成模型訓(xùn)練的主干World Model(WM),用于預(yù)測場景的未來狀態(tài);二是Inverse Dynamics Model(IDM),將視頻幀序列轉(zhuǎn)化為實際可執(zhí)行的機器人動作軌跡。


▲圖源:1X World Model技術(shù)博客

這一流程可簡單概括為:接收文字指令與起始視頻幀,WM生成未來的視頻片段,IDM提取控制動作,Neo執(zhí)行任務(wù)。得益于NEO與人類動態(tài)結(jié)構(gòu)的高度擬合,模型在物理互動(如摩擦、慣性、接觸)等方面能實現(xiàn)更真實的轉(zhuǎn)譯。

整體架構(gòu)在設(shè)計上強調(diào)了將人形結(jié)構(gòu)視作模型泛化的前提

該模型無需大規(guī)模真實機器人數(shù)據(jù),僅通過900小時第一視角人類視頻中訓(xùn)練出的操控直覺,結(jié)合70小時Neo特定數(shù)據(jù)進行微調(diào),即可在視覺-空間-物理層面展現(xiàn)出較強泛化能力。

這一訓(xùn)練策略顯著提升了模型對“從未見過的物體與動作”的適應(yīng)力,使得Neo能完成雙手配合、與人交互等未曾直接訓(xùn)練過的復(fù)雜任務(wù)。

二、視頻質(zhì)量可預(yù)估任務(wù)成功率,模型探索“自我改進飛輪”

為了量化1XWM在真實世界中的能力,1X進行了多輪測試,包括廚房、衣物處理等實際任務(wù)。


▲抽紙巾


▲擺放椅子

▲比耶

測試數(shù)據(jù)顯示,該模型在大部分任務(wù)上表現(xiàn)穩(wěn)定,盡管在如“倒牛奶”和“畫笑臉”等更精細(xì)的操作中仍有挑戰(zhàn)。


▲1XWM在不同家務(wù)任務(wù)上的成功率

研究團隊還發(fā)現(xiàn):生成視頻的物理真實性與動作成功率呈正相關(guān)。若生成的視頻動作存在物理邏輯錯誤(如物體漂浮、深度錯位),實際機器人執(zhí)行幾乎為0%成功率。

基于這一觀察,團隊測試了“多版本生成、優(yōu)選最佳”的策略,并發(fā)現(xiàn)將單次生成擴展為8次并挑選最優(yōu)者,可顯著提升任務(wù)成功率。


▲抽紙巾任務(wù)中,不同生成次數(shù)對執(zhí)行成功率的影響(“拉紙巾”任務(wù)成功率從30%提升至45%)

在提升視頻質(zhì)量方面,1X團隊使用了“文字說明增強”策略,即用VLM模型擴寫訓(xùn)練視頻的任務(wù)描述文字,以更好對齊視頻生成模型的文字理解能力。

另一個關(guān)鍵是加入了第一視角人類操作視頻的訓(xùn)練階段,這一做法顯著提升了模型在新任務(wù)和新環(huán)境上的泛化質(zhì)量。


▲洗碗

1XWM當(dāng)前每輪推理需約11秒,能生成5秒真實世界可執(zhí)行的動作視頻,并已與Verda團隊合作優(yōu)化GPU推理。

下一步,1X計劃加速模型響應(yīng)速度,并探索長時任務(wù)的閉環(huán)重規(guī)劃機制,逐步邁向機器人“通識行動力”與“自我提升閉環(huán)”的目標(biāo)。

1X團隊稱,1XWM已經(jīng)具備“由機器人自身經(jīng)驗驅(qū)動探索、評估與策略優(yōu)化”的機制,只需保持任務(wù)覆蓋的非零成功率,就有望持續(xù)推進性能提升與任務(wù)泛化,進入真正意義上的“自我改進飛輪”。

結(jié)語: 生成視頻,推理動作,再到執(zhí)行

1XWM尚未實現(xiàn)真正意義上的“零樣本即執(zhí)行”,但它提供了一種新思路:機器人不再直接從數(shù)據(jù)中學(xué)動作,而是先生成一段對未來的“視頻想象”,再從中推理出可執(zhí)行的動作路徑。

在這種架構(gòu)下,視頻成為連接任務(wù)場景、推理與行動的中間環(huán)節(jié)。當(dāng)模型能夠基于當(dāng)前場景主動生成對未來的預(yù)測,并據(jù)此推理出下一步動作時,具身智能或許正邁向更高層次的泛化能力。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
特朗普瘋了?并沒有。杰利亞金贊同格拉濟耶夫,并預(yù)測了后續(xù)走向

特朗普瘋了?并沒有。杰利亞金贊同格拉濟耶夫,并預(yù)測了后續(xù)走向

生活魔術(shù)專家
2026-03-03 00:17:46
揭秘蕩寇志中梁山108好漢下場:36人被凌遲,66人陣亡,3人被虐殺

揭秘蕩寇志中梁山108好漢下場:36人被凌遲,66人陣亡,3人被虐殺

談史論天地
2026-02-28 09:14:10
都被史記騙了!春秋戰(zhàn)國打仗有50萬大軍,明清湊15萬兵力都費勁?

都被史記騙了!春秋戰(zhàn)國打仗有50萬大軍,明清湊15萬兵力都費勁?

老達(dá)子
2026-03-02 06:40:03
該出大招了!小學(xué)生,加速減少了

該出大招了!小學(xué)生,加速減少了

城市財經(jīng)
2026-03-02 11:38:06
美媒:中日空戰(zhàn)將一邊倒!不僅靠最強4.5代殲-15,解放軍還有殺招

美媒:中日空戰(zhàn)將一邊倒!不僅靠最強4.5代殲-15,解放軍還有殺招

起喜電影
2026-03-02 16:59:17
迪拜人設(shè)崩了

迪拜人設(shè)崩了

睡前馬戲團
2026-03-02 16:21:05
越南人民軍軍銜詳解

越南人民軍軍銜詳解

擦菠蘿的海綿寶寶
2026-03-02 09:39:33
江蘇一光伏企業(yè)宣布裁員!

江蘇一光伏企業(yè)宣布裁員!

新浪財經(jīng)
2026-03-02 18:11:34
成龍安排好身后事才2個月,翁靜晶再曝大瓜,沒給他留一絲體面

成龍安排好身后事才2個月,翁靜晶再曝大瓜,沒給他留一絲體面

星星沒有你亮
2026-02-28 20:40:21
9金4銀!中國隊跳水世界杯加拿大站完美收官

9金4銀!中國隊跳水世界杯加拿大站完美收官

北青網(wǎng)-北京青年報
2026-03-02 10:45:02
你有知道哪些炸裂的秘密?網(wǎng)友:我有個秘密說出來肯定大家要笑死

你有知道哪些炸裂的秘密?網(wǎng)友:我有個秘密說出來肯定大家要笑死

帶你感受人間冷暖
2026-01-29 00:10:05
東北男人“新戰(zhàn)袍”:4000元的迪桑特,成了體制內(nèi)的隱形工牌

東北男人“新戰(zhàn)袍”:4000元的迪桑特,成了體制內(nèi)的隱形工牌

夢在深巷aqa
2026-02-25 00:15:06
伊朗被漏透成篩子了

伊朗被漏透成篩子了

老鷹哥
2026-03-03 00:06:21
伊朗用“霍拉姆沙赫爾-4”導(dǎo)彈發(fā)動第十波攻勢

伊朗用“霍拉姆沙赫爾-4”導(dǎo)彈發(fā)動第十波攻勢

每日經(jīng)濟新聞
2026-03-02 16:58:03
中國還會不會出現(xiàn)第2個毛澤東?外國專家:天才的出現(xiàn)具有偶然性

中國還會不會出現(xiàn)第2個毛澤東?外國專家:天才的出現(xiàn)具有偶然性

沈言論
2025-08-05 22:20:03
伊朗最高領(lǐng)袖哈梅內(nèi)伊的妻子因傷勢過重去世

伊朗最高領(lǐng)袖哈梅內(nèi)伊的妻子因傷勢過重去世

每日經(jīng)濟新聞
2026-03-03 00:32:43
伊朗人民等到了改變國運的機會,古巴人民也快了

伊朗人民等到了改變國運的機會,古巴人民也快了

基本常識
2026-03-01 22:14:59
伊朗媒體公布反擊美軍軍事行動結(jié)果

伊朗媒體公布反擊美軍軍事行動結(jié)果

新華社
2026-03-01 00:03:30
來搞笑的?超級杯花名冊漏洞百出:照片古早且粗糙,譯名疊詞

來搞笑的?超級杯花名冊漏洞百出:照片古早且粗糙,譯名疊詞

懂球帝
2026-03-02 22:29:12
中核集團的顧軍被查了。最讓人脊背發(fā)涼的是他的第一個身份

中核集團的顧軍被查了。最讓人脊背發(fā)涼的是他的第一個身份

南權(quán)先生
2026-02-02 16:05:36
2026-03-03 01:39:00
機器人前瞻
機器人前瞻
專注于機器人報道的媒體
378文章數(shù) 8關(guān)注度
往期回顧 全部

科技要聞

蘋果中國官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

媒體:拉里賈尼走向前臺 四大關(guān)鍵變量將決定伊朗命運

頭條要聞

媒體:拉里賈尼走向前臺 四大關(guān)鍵變量將決定伊朗命運

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經(jīng)要聞

油價飆升 美伊沖突將如何攪動全球經(jīng)濟

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

旅游
親子
家居
藝術(shù)
公開課

旅游要聞

熱度飆升!非遺、冰雪…禹州元宵“文旅大餐”承包圓滿佳節(jié)!

親子要聞

45歲這年,我這個二胎媽媽決定做一件“瘋狂”的事

家居要聞

萬物互聯(lián) 享科技福祉

藝術(shù)要聞

這四位老人的花鳥畫,竟讓人欲罷不能!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版