国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

捅破具身智能天花板!極佳新VLA大模型,長時程任務(wù)近100%成功率

0
分享至

允中 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

疊衣服、沖咖啡、折紙盒。

這些看似瑣碎的小事,曾是具身智能跨不過去的“長時程”深淵。

但現(xiàn)在,紀(jì)錄被刷新了:數(shù)小時零失誤、持續(xù)穩(wěn)定運(yùn)轉(zhuǎn)。

還記得此前在RoboChallenge斬獲全球第一的GigaBrain-0.1嗎?



它的進(jìn)化體——GigaBrain-0.5M*VLA大模型現(xiàn)在悄然登場了。

性能更強(qiáng)大,依靠世界模型條件驅(qū)動,以世界模型對未來狀態(tài)與價值的預(yù)測結(jié)果作為條件輸入,可顯著提升模型在長時程任務(wù)中的魯棒性。

在此基礎(chǔ)上,GigaBrain-0.5M*創(chuàng)新引入人在回路持續(xù)學(xué)習(xí)機(jī)制,系統(tǒng)依托經(jīng)人工篩選與校正的模型推演軌跡開展迭代訓(xùn)練,基于真實環(huán)境交互反饋持續(xù)優(yōu)化決策策略,最終實現(xiàn)“行動—反思—進(jìn)化”的閉環(huán)式持續(xù)學(xué)習(xí)與自主迭代升級。



在與主流方法RECAP的正面硬剛中,它直接把任務(wù)成功率強(qiáng)行拉升了30%

能反思、會進(jìn)化,具身智能的“原生范式”,這次看來真的變天了。

基于世界模型的強(qiáng)化學(xué)習(xí)的訓(xùn)練范式

在GigaBrain-0.5M*的研發(fā)中,極佳視界團(tuán)隊提出基于世界模型的強(qiáng)化學(xué)習(xí)范式,并采用迭代式四階段閉環(huán)訓(xùn)練流程:

  • 基于大規(guī)模機(jī)器人操作數(shù)據(jù)完成世界模型預(yù)訓(xùn)練,實現(xiàn)對未來狀態(tài)及對應(yīng)價值的精準(zhǔn)預(yù)測;
  • 以世界模型輸出的未來狀態(tài)預(yù)測與價值評估為條件,對策略網(wǎng)絡(luò)進(jìn)行微調(diào),以指引動作決策;
  • 將條件化策略部署至真實物理環(huán)境,依托人在環(huán)(Human-in-the-Loop)干預(yù)機(jī)制,采集模型自主推演軌跡數(shù)據(jù);
  • 利用經(jīng)篩選后的有效軌跡數(shù)據(jù)集,聯(lián)合優(yōu)化世界模型與決策策略,實現(xiàn)模型持續(xù)學(xué)習(xí)與自主進(jìn)化。



數(shù)小時連續(xù)零失誤執(zhí)行

在與AWR、RECAP等主流模仿學(xué)習(xí)與強(qiáng)化學(xué)習(xí)基線方法的系統(tǒng)對比中,GigaBrain-0.5M*展現(xiàn)出顯著優(yōu)勢,在相同任務(wù)設(shè)定下,相較于由π*0.6所提出的RECAP基線,任務(wù)成功率提升近30%,并實現(xiàn)了穩(wěn)定可靠的模型效果。

尤其在高難度長時程任務(wù)中,面對折紙盒、咖啡制備、衣物折疊等包含多階段操作、精細(xì)感知與持續(xù)決策的復(fù)雜場景,GigaBrain?0.5M*均實現(xiàn)接近100%的任務(wù)成功率,并可穩(wěn)定復(fù)現(xiàn)成功執(zhí)行軌跡,充分彰顯出卓越的策略魯棒性。



高效且準(zhǔn)確的價值預(yù)測

實驗結(jié)果表明,基于世界模型的價值預(yù)測方案在執(zhí)行效率與預(yù)測精度上,均優(yōu)于π*0.6所提出的VLM方案。

該方案的核心優(yōu)勢源自對未來狀態(tài)的顯式建模與世界模型單步降噪機(jī)制,可為價值函數(shù)提供關(guān)鍵的時序上下文支撐,讓價值估計實現(xiàn)更高效、更精準(zhǔn)、更穩(wěn)定的輸出。

疊衣服任務(wù)為例:

  • 任務(wù)初期,機(jī)械臂反復(fù)調(diào)整衣物姿態(tài)時,預(yù)測價值呈現(xiàn)合理波動;
  • 當(dāng)衣物擺正、進(jìn)入穩(wěn)定疊放階段,價值曲線穩(wěn)步上升;
  • 若中途出現(xiàn)干擾物,價值驟降以反映任務(wù)受阻;
  • 待干擾物被移除后,價值迅速恢復(fù)增長趨勢。

這種與任務(wù)物理進(jìn)程高度對齊的價值演化,正是世界模型提供“認(rèn)知先驗”的直接體現(xiàn)。



上萬小時的訓(xùn)練數(shù)據(jù)

GigaBrain-0.5M*的基座模型GigaBrain-0.5基于總計10,931小時的多樣化機(jī)器人操作數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,其中:

  • 61%(6,653小時)由自研具身世界模型GigaWorld高保真合成,覆蓋紋理遷移、視角變換、人手到機(jī)械臂映射等豐富場景;
  • 剩余39%(4,278小時)源自真實機(jī)器人采集,確保策略在物理世界中的可執(zhí)行性。

海量數(shù)據(jù)的引入,顯著拓展了模型的任務(wù)覆蓋廣度與策略魯棒性,使其在面對復(fù)雜、長時程操作任務(wù)時具備更強(qiáng)的泛化能力;

而GigaWorld生成的合成數(shù)據(jù),則有效突破了真實采集的長尾瓶頸。



通過可控地生成新紋理、新物體位姿與新觀測視角下的訓(xùn)練樣本,增強(qiáng)了模型在分布外場景中的適應(yīng)性,為具身智能走向開放世界奠定了數(shù)據(jù)基石。

這背后,是極佳視界對具身智能進(jìn)化路徑的深遠(yuǎn)布局。

通過“基模-本體-場景”的深度打磨,極佳圍繞世界模型平臺GigaWorld、通用具身大腦GigaBrain、原生本體Maker構(gòu)筑起了一套能自我進(jìn)化的閉環(huán)生態(tài)。

這種體系化的作戰(zhàn)方式,讓極佳視界不僅在實驗室里斬獲冠軍,更具備了將進(jìn)化效率提升10-100倍的硬實力,致力于推動通用機(jī)器人服務(wù)千行百業(yè)、走進(jìn)千家萬戶。

論文鏈接:
https://arxiv.org/pdf/2602.12099
項目鏈接:
https://gigabrain05m.github.io/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
歐冠16強(qiáng)已定12席:英超6隊全入圍!去年亞軍出局 意甲或全軍覆沒

歐冠16強(qiáng)已定12席:英超6隊全入圍!去年亞軍出局 意甲或全軍覆沒

我愛英超
2026-02-25 06:26:28
別再存定期了!央行釋放重要信號:普通人的財富保衛(wèi),主戰(zhàn)場已變

別再存定期了!央行釋放重要信號:普通人的財富保衛(wèi),主戰(zhàn)場已變

復(fù)轉(zhuǎn)小能手
2026-02-24 17:31:33
綠地建設(shè)集團(tuán)破產(chǎn)審查

綠地建設(shè)集團(tuán)破產(chǎn)審查

地產(chǎn)微資訊
2026-02-23 18:36:51
博德閃耀CEO:我們必須使用人工草皮,這里根本種不了天然草

博德閃耀CEO:我們必須使用人工草皮,這里根本種不了天然草

懂球帝
2026-02-25 12:18:36
吵架將孩子扔河里后續(xù):原因曝光,夫妻身份被扒,娃狀態(tài)讓人擔(dān)憂

吵架將孩子扔河里后續(xù):原因曝光,夫妻身份被扒,娃狀態(tài)讓人擔(dān)憂

社會日日鮮
2026-02-24 09:37:52
巴拿馬強(qiáng)硬接管長和雙港口,關(guān)鍵時刻,中方給特朗普訪華潑了冷水

巴拿馬強(qiáng)硬接管長和雙港口,關(guān)鍵時刻,中方給特朗普訪華潑了冷水

阿銍武器裝備科普
2026-02-25 10:51:38
徐湖平家族:若不事發(fā)~

徐湖平家族:若不事發(fā)~

瓜哥的動物日記
2026-02-25 11:11:12
你經(jīng)歷過道德綁架嗎?網(wǎng)友:事實證明沒有道德就不會被綁架

你經(jīng)歷過道德綁架嗎?網(wǎng)友:事實證明沒有道德就不會被綁架

帶你感受人間冷暖
2026-02-21 19:12:24
無一隊幸免!文班亞馬生涯3年至今已帽遍聯(lián)盟29支球隊!

無一隊幸免!文班亞馬生涯3年至今已帽遍聯(lián)盟29支球隊!

田先生籃球
2026-02-24 16:23:19
18點05分CCTV5直播!中國PK日本男籃!郭士強(qiáng)重用2小將贏球概率大

18點05分CCTV5直播!中國PK日本男籃!郭士強(qiáng)重用2小將贏球概率大

老吳說體育
2026-02-25 12:14:49
美論壇:如果中國發(fā)電量真的世界第一,為什么夜晚沒有印度亮?

美論壇:如果中國發(fā)電量真的世界第一,為什么夜晚沒有印度亮?

咸魚金腦袋
2026-02-25 14:09:20
女子在河南中靈山失聯(lián)10日后遺體被找到,父親發(fā)聲:希望弄清女兒死因,讓她死得明明白白

女子在河南中靈山失聯(lián)10日后遺體被找到,父親發(fā)聲:希望弄清女兒死因,讓她死得明明白白

揚(yáng)子晚報
2026-02-25 11:16:22
WTT新加坡大滿貫爆冷!日本兩大主力0-3慘敗,韓國頭號種子一輪游

WTT新加坡大滿貫爆冷!日本兩大主力0-3慘敗,韓國頭號種子一輪游

越嶺尋蹤
2026-02-24 14:37:34
中國第一監(jiān)獄:關(guān)的幾乎全是高官,為防止泄密,牢房內(nèi)有特殊布置

中國第一監(jiān)獄:關(guān)的幾乎全是高官,為防止泄密,牢房內(nèi)有特殊布置

瓦倫西亞月亮
2026-02-20 17:37:18
韓信剛死滿朝歡呼,張良一句話嚇癱劉邦:四十萬匈奴壓境 誰去退

韓信剛死滿朝歡呼,張良一句話嚇癱劉邦:四十萬匈奴壓境 誰去退

老謝談史
2026-02-24 11:12:25
徹底癱瘓!兩年了為何許家印遲遲不判刑?真相比你想象的更復(fù)雜

徹底癱瘓!兩年了為何許家印遲遲不判刑?真相比你想象的更復(fù)雜

歷史偉人錄
2026-02-24 18:19:45
精神小妹的生活原來是這樣的!網(wǎng)友:終于知道她們?yōu)樯抖歼@么瘦了

精神小妹的生活原來是這樣的!網(wǎng)友:終于知道她們?yōu)樯抖歼@么瘦了

深度報
2026-02-11 23:35:03
江西南昌一家人自駕返程途中發(fā)生車禍,目擊者稱一半的車身被大貨車擠壓

江西南昌一家人自駕返程途中發(fā)生車禍,目擊者稱一半的車身被大貨車擠壓

觀威海
2026-02-25 10:26:09
18分鐘輸28分!隊魂成拖油瓶,所有輸球組合里都有他!真砸手里了

18分鐘輸28分!隊魂成拖油瓶,所有輸球組合里都有他!真砸手里了

阿浪的籃球故事
2026-02-24 16:06:20
我用三個真實的病例告訴你:為啥我總建議重癥病人去一線城市看病

我用三個真實的病例告訴你:為啥我總建議重癥病人去一線城市看病

千秋文化
2026-02-24 20:25:25
2026-02-25 14:44:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12198文章數(shù) 176392關(guān)注度
往期回顧 全部

科技要聞

“機(jī)器人只跳舞,沒什么用”

頭條要聞

15歲少女和姐姐吵架后失聯(lián)半月 父親懸賞100萬尋人

頭條要聞

15歲少女和姐姐吵架后失聯(lián)半月 父親懸賞100萬尋人

體育要聞

曝雄鹿計劃今夏追小卡 字母哥渴望與其并肩作戰(zhàn)

娛樂要聞

撒貝寧到沈陽跑親戚 老婆李白模特身材

財經(jīng)要聞

春節(jié)檔"開門黑" 電影票少賣了7000萬張

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

房產(chǎn)
健康
手機(jī)
教育
藝術(shù)

房產(chǎn)要聞

330萬人涌入!春節(jié)全國樓市,第一個賣爆的區(qū)域出現(xiàn)了!

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

手機(jī)要聞

三星被曝上調(diào)Galaxy S26 Ultra初期產(chǎn)量 額外增產(chǎn)約一百萬部

教育要聞

【調(diào)劑專區(qū)】26考研調(diào)劑信息第二彈

藝術(shù)要聞

這位藝術(shù)家的馬賽克畫讓人驚嘆不已!

無障礙瀏覽 進(jìn)入關(guān)懷版