国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

世界模型和具身大腦最新突破:90%生成數(shù)據(jù),VLA性能暴漲300%

0
分享至

允中 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

VLA模型性能暴漲300%,背后訓(xùn)練數(shù)據(jù)還首次實現(xiàn)90%由世界模型生成。

這是來自國產(chǎn)世界模型玩家的最新突破,相關(guān)模型代碼和訓(xùn)練框架還全都開源了。



具身智能邁向開放世界落地的最大瓶頸,長期以來并非算法本身,而是高質(zhì)量、大規(guī)模真實機器人交互數(shù)據(jù)的極度稀缺

真機數(shù)據(jù)采集成本高昂、周期漫長,且難以覆蓋多樣化的開放場景,嚴重限制了VLA大模型的規(guī)?;?xùn)練與泛化能力。而傳統(tǒng)仿真雖能快速生成數(shù)據(jù),卻受限于顯著的Sim-to-Real gap,難以支撐真實世界的魯棒部署。

世界模型(World Model)被認為是破解這一困境的關(guān)鍵:通過學(xué)習(xí)真實世界的規(guī)律,世界模型可以生成高保真、可控、多樣化的具身交互數(shù)據(jù),突破真機數(shù)據(jù)不足的限制。

在此背景下,剛剛獲得華為投資的國產(chǎn)世界模型公司極佳視界發(fā)布并開源具身世界模型GigaWorld-0,成功將世界模型生成數(shù)據(jù)在VLA訓(xùn)練中的占比提升至90%。

所訓(xùn)練的VLA模型在新紋理(訓(xùn)練中未見材質(zhì)表面)、新視角(訓(xùn)練中未見的觀測角度)、新物體位置(訓(xùn)練中未見的空間布局)三大泛化維度上均實現(xiàn)近300%的性能提升,標志著具身智能正式邁入“數(shù)據(jù)高效、高泛化、低成本”的新階段



作為具身智能邁向規(guī)?;c數(shù)據(jù)高效的關(guān)鍵基礎(chǔ)設(shè)施,GigaWorld-0由兩大協(xié)同組件構(gòu)成:

  • GigaWorld-0-Video基于視頻生成基座模型,生成紋理豐富、視覺逼真具身操作數(shù)據(jù);
  • GigaWorld-0-3D則融合3D生成、3D Gaussian Splatting重建、可微分物理引擎,確保生成數(shù)據(jù)在幾何結(jié)構(gòu)與物理動力學(xué)的準確性。



高效的世界模型架構(gòu)

針對當前世界模型在生成時面臨的計算效率低、細節(jié)控制不足等挑戰(zhàn),GigaWorld-0-Video重點提升了稀疏注意力建模能力動態(tài)專家計算能力,在保持視覺保真度的同時顯著降低計算開銷,為VLA模型提供高質(zhì)量、可擴展的合成訓(xùn)練數(shù)據(jù)。



稀疏注意力機制:高效建模長程時空依賴

GigaWorld-0-Video采用基于稀疏注意力的Diffusion Transformer(DiT)作為生成主干,摒棄傳統(tǒng)全注意力帶來的平方級計算復(fù)雜度。

該機制僅在局部時空鄰域與關(guān)鍵語義區(qū)域間建立注意力連接,從而在生成高幀率、長序列視頻時,顯著降低內(nèi)存占用與推理延遲。

MoE架構(gòu):提升生成多樣性與可控性

在DiT的前饋網(wǎng)絡(luò)模塊中,GigaWorld-0-Video參考DeepSeek V3集成混合專家(Mixture-of-Experts,MoE)架構(gòu)。

每個視頻Token動態(tài)路由至多個專家網(wǎng)絡(luò)。確保不同語義區(qū)域由專屬專家處理,實現(xiàn)細粒度的內(nèi)容控制。

幾何一致、物理準確的世界模型建模

GigaWorld-0-3D通過融合生成與重建技術(shù),顯著提升了在稀疏觀測條件下的場景建模能力,并結(jié)合可微分物理引擎,實現(xiàn)了對機械臂操作過程的高保真物理仿真。

該系統(tǒng)不僅生成幾何一致、視覺逼真的靜態(tài)背景資產(chǎn),還精準復(fù)現(xiàn)了機械臂與物體交互中的動力學(xué)行為,為具身智能體提供兼具幾何一致性與物理準確性的訓(xùn)練數(shù)據(jù)。

生成式重建:幾何一致性與視覺保真度的協(xié)同優(yōu)化

在幾何一致性渲染方面,GigaWorld-0-3D融合極佳視界積淀的生成式重建技術(shù),有效突破稀疏觀測下的建模瓶頸。

系統(tǒng)首先基于稀疏輸入視圖,初始化高斯場景表示。隨后引入專用的視圖修復(fù)生成模型,顯著緩解因視角缺失導(dǎo)致的幾何扭曲。最終,將修復(fù)后稠密、一致的多視角圖像作為增強輸入,驅(qū)動第二階段的高精度3DGS重建,從而在新視角合成中同時保障幾何一致性與視覺保真度。



可微分物理引擎:高效精準的物理建模

在物理準確性建模方面,GigaWorld-0-3D引入基于物理信息神經(jīng)網(wǎng)絡(luò)(PINNs)的可微分物理引擎,實現(xiàn)對機械臂動力學(xué)的自動參數(shù)辨識。

通過三步流程:以隨機物理參數(shù)生成仿真軌跡、訓(xùn)練可微替代模型逼近系統(tǒng)動力學(xué)、再以梯度下降優(yōu)化參數(shù)匹配真實運動,高效生成物理合理、交互可信的數(shù)據(jù)。



高效世界模型訓(xùn)練框架

GigaWorld-0是業(yè)內(nèi)首個采用FP8精度端到端訓(xùn)練的世界模型,標志著世界模型訓(xùn)練邁入高能效新階段。

通過將FP8與稀疏注意力深度結(jié)合,GigaWorld-0在保持生成質(zhì)量的同時,顯著降低顯存占用與訓(xùn)練成本,實現(xiàn)了視覺保真度與計算效率的最佳平衡。

為這一突破提供基礎(chǔ)的,是極佳視界自研的GigaTrain高效訓(xùn)練框架。

GigaTrain是一個為大規(guī)模生成模型量身打造的統(tǒng)一分布式訓(xùn)練系統(tǒng),支持DeepSpeed ZeRO、FSDP2、FP8混合精度、梯度檢查點等先進訓(xùn)練技術(shù),既可支撐超大規(guī)模預(yù)訓(xùn)練,也能在8×H20等常規(guī)硬件上高效完成微調(diào)。

GigaTrain現(xiàn)已全面開源(GitHub:https://github.com/open-gigaai/giga-train),極佳視界還同步開放了詳細的資源消耗基準與配置模板,助力社區(qū)開發(fā)者快速復(fù)現(xiàn)、遷移并定制GigaWorld-0,推動具身智能數(shù)據(jù)生成的普惠化與標準化。



可泛化具身數(shù)據(jù)引擎

在PBench(Robot Set)基準上,研究團隊將GigaWorld-0與當前最先進的世界模型進行了全面對比,包括Cosmos-Predict2-14B、Cosmos-Predict2.5-2B、Wan2.2-5B和Wan2.2-14B。

盡管GigaWorld-0模型僅激活20億參數(shù)(2B),為所有對比模型中最小,卻在整體評分上顯著領(lǐng)先,取得最高性能。

這一結(jié)果證明GigaWorld-0在具身智能任務(wù)中兼具生成質(zhì)量與推理效率,是目前極具性價比的世界模型方案。



GigaWorld-0的價值還不僅體現(xiàn)在高質(zhì)量視頻與3D場景的生成能力上,更關(guān)鍵的是其作為可泛化具身數(shù)據(jù)引擎在真實世界中的有效性。

在VLA模型GigaBrain-0上,研究團隊系統(tǒng)性地驗證了GigaWorld-0生成數(shù)據(jù)對下游具身智能任務(wù)的提升作用。實驗在真實機器人平臺上進行,聚焦三大開放世界泛化挑戰(zhàn):新紋理泛化、新視角泛化、與新物體位置泛化。

結(jié)果表明:隨著GigaWorld-0生成數(shù)據(jù)在訓(xùn)練混合數(shù)據(jù)中比例的提升,GigaBrain-0在上述三類泛化場景下的任務(wù)成功率與動作精度均呈現(xiàn)顯著且穩(wěn)定的增長趨勢。

項目鏈接:
https://giga-world-0.github.io/
論文鏈接:
https://arxiv.org/pdf/2511.19861
代碼鏈接:
https://github.com/open-gigaai/giga-world-0

關(guān)于極佳視界

極佳視界成立于2023年,是國內(nèi)第一家“純血”物理AI公司——創(chuàng)業(yè)就以世界模型為切入點,專注于「世界模型平臺 x 具身基礎(chǔ)模型」,致力以雙輪閉環(huán)走向物理世界通用智能。

在「世界模型」方向,極佳視界是國內(nèi)技術(shù)創(chuàng)新和產(chǎn)業(yè)落地的領(lǐng)跑者,相關(guān)產(chǎn)品技術(shù)已廣泛應(yīng)用于自動駕駛、具身智能、內(nèi)容創(chuàng)作等相關(guān)方向。

在「具身大腦」方向,極佳視界通過全球領(lǐng)先的「世界模型平臺」提供大規(guī)模高質(zhì)量閉環(huán)數(shù)據(jù),相比純真機數(shù)據(jù)訓(xùn)練效率提升1-2個數(shù)量級以上,同時真機效果達到國內(nèi)領(lǐng)先。

極佳視界的創(chuàng)始人兼CEO黃冠,是清華大學(xué)自動化系A(chǔ)I方向博士。曾擔任地平線機器人視覺感知技術(shù)負責(zé)人、鑒智機器人合伙人&算法副總裁等知名企業(yè)技術(shù)和高管崗位,并擁有三星中國研究院、微軟亞洲研究院等頂尖研究機構(gòu)工作經(jīng)歷。

黃冠之外,聯(lián)合創(chuàng)始人、首席科學(xué)家朱政同樣有清華自動化系背景。他2019年博士畢業(yè)于中國科學(xué)院自動化研究所,此后在清華大學(xué)自動化系從事博士后研究。Google Scholar顯示,朱政的論文被引數(shù)達到1.7w+,h-index為50。

公司核心團隊還包括清華、北大、中科院、中科大、WashU、CMU等全球知名院校頂尖研究人員,以及來自微軟、三星、地平線、百度、博世、NBC環(huán)球影業(yè)等全球知名企業(yè)高管,核心團隊兼具業(yè)內(nèi)領(lǐng)先的研究能力和大規(guī)模的產(chǎn)業(yè)落地經(jīng)驗。

目前,極佳視界是國內(nèi)少有在「世界模型」和「具身大腦」方向都擁有世界級綜合實力的團隊,在自動駕駛世界模型方向已經(jīng)和多個頭部主機廠達成簽約合作,在具身世界模型、具身大腦等方向已經(jīng)和多個具身本體、終端公司達成簽約合作,應(yīng)用于科研、教育、展覽、數(shù)據(jù)采集、工業(yè)、服務(wù)、家庭等多個場景。

就在11月,極佳視界剛剛完成億元級A1輪融資,由華為哈勃、華控基金聯(lián)合投資。這也是該公司兩個月內(nèi)連續(xù)完成的第三輪融資。

— 完 —

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
呆妹兒剛拿下年度第一,就在直播間哭訴:下播陪大哥時間被排滿

呆妹兒剛拿下年度第一,就在直播間哭訴:下播陪大哥時間被排滿

喜歡歷史的阿繁
2025-12-27 15:39:52
驚傳噩耗!“狗血劇女王” 急性心臟衰竭離世,死訊封鎖9日才公開

驚傳噩耗!“狗血劇女王” 急性心臟衰竭離世,死訊封鎖9日才公開

一盅情懷
2025-12-27 17:19:39
澤連斯基的妻子有多美?登美時尚雜志封面,兩人戀愛八年兒女雙全

澤連斯基的妻子有多美?登美時尚雜志封面,兩人戀愛八年兒女雙全

阿器談史
2025-12-26 16:18:56
一位博主聲稱:“我不擔心中國能夠打敗日本,擔心的是

一位博主聲稱:“我不擔心中國能夠打敗日本,擔心的是

南權(quán)先生
2025-11-29 17:28:46
我調(diào)任市委書記后,被初戀嘲笑,秘書叫我書記后她驚呆了

我調(diào)任市委書記后,被初戀嘲笑,秘書叫我書記后她驚呆了

秋風(fēng)專欄
2025-12-23 15:18:07
元旦開始咸魚翻身!家有這 3 生肖,財運大開,事業(yè)喜事扎堆來!

元旦開始咸魚翻身!家有這 3 生肖,財運大開,事業(yè)喜事扎堆來!

人閒情事
2025-12-27 16:42:36
18歲男生把17歲女生弄懷孕生娃,手術(shù)的婦科醫(yī)生居然發(fā)視頻點贊

18歲男生把17歲女生弄懷孕生娃,手術(shù)的婦科醫(yī)生居然發(fā)視頻點贊

張曉磊
2025-12-25 11:49:44
中字頭某局血腥大裁員,工程人寒冬已至!

中字頭某局血腥大裁員,工程人寒冬已至!

黯泉
2025-12-24 13:24:12
冬天第一大補,不是牛羊肉,而是它,常吃潤肺補脾胃,增強免疫力

冬天第一大補,不是牛羊肉,而是它,常吃潤肺補脾胃,增強免疫力

秀廚娘
2025-12-27 19:16:44
2026年,幼兒園關(guān)停潮已經(jīng)來了

2026年,幼兒園關(guān)停潮已經(jīng)來了

沒有偏旁的常慶
2025-12-26 08:14:36
消失4年后,54歲主持人程雷高調(diào)官宣一則喜訊,原來一切早有預(yù)兆

消失4年后,54歲主持人程雷高調(diào)官宣一則喜訊,原來一切早有預(yù)兆

桑葚愛動畫
2025-12-06 13:02:15
中央特科最美傳奇女特工被判槍決,毛主席拍案大怒:她是全黨的恩人

中央特科最美傳奇女特工被判槍決,毛主席拍案大怒:她是全黨的恩人

睡前講故事
2025-12-21 16:15:28
徐湖平在部隊期間因“手腳不干凈”,被營長岳振華踢出了軍隊?

徐湖平在部隊期間因“手腳不干凈”,被營長岳振華踢出了軍隊?

方圓文史
2025-12-27 16:56:27
43695人觀戰(zhàn)!永州1-0常德 逆襲奪湘超冠軍 美女老板承諾獎勵豪車

43695人觀戰(zhàn)!永州1-0常德 逆襲奪湘超冠軍 美女老板承諾獎勵豪車

我愛英超
2025-12-27 22:16:15
南京博物院又揭大瓜,前文物局局長曾問:賣幾個兵馬俑行不行?

南京博物院又揭大瓜,前文物局局長曾問:賣幾個兵馬俑行不行?

鶴羽說個事
2025-12-23 11:25:52
嚴防死守36年,利智還是輸了,李連杰終是沒放下一直虧欠的“她”

嚴防死守36年,利智還是輸了,李連杰終是沒放下一直虧欠的“她”

法老不說教
2025-12-24 18:25:17
緊急提醒!這款常用藥或?qū)е伦詺A向

緊急提醒!這款常用藥或?qū)е伦詺A向

中國新聞周刊
2025-12-27 12:29:03
大風(fēng)追蹤 | “原告被要求給被告支付拘留體檢費279元”,大風(fēng)新聞報道后法院退錢,執(zhí)行法官被批評教育

大風(fēng)追蹤 | “原告被要求給被告支付拘留體檢費279元”,大風(fēng)新聞報道后法院退錢,執(zhí)行法官被批評教育

大風(fēng)新聞
2025-12-26 22:31:03
卡梅隆:若《阿凡達》第四部及第五部未能拍成,將舉行新聞發(fā)布會

卡梅?。喝簟栋⒎策_》第四部及第五部未能拍成,將舉行新聞發(fā)布會

IT之家
2025-12-27 20:52:05
47歲蘭帕德快禿成光頭!率隊8分領(lǐng)跑英冠:破44年魔咒 主場8連斬

47歲蘭帕德快禿成光頭!率隊8分領(lǐng)跑英冠:破44年魔咒 主場8連斬

風(fēng)過鄉(xiāng)
2025-12-27 10:12:42
2025-12-28 06:35:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11928文章數(shù) 176345關(guān)注度
往期回顧 全部

科技要聞

小米也漲價了!業(yè)界稱終端再不漲明年必虧

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認定朋友造謠

財經(jīng)要聞

注意,開始拉物價了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

家居
旅游
游戲
時尚
教育

家居要聞

格調(diào)時尚 智慧品質(zhì)居所

旅游要聞

來廣東跨年,大家的選擇就是最寶貴的信任票

我真幸運:《泰拉瑞亞》1.4.5更新定檔1月份!

穿好雪地靴的4個訣竅,還挺有效!

教育要聞

家長對于孩子正向的反饋太缺少了

無障礙瀏覽 進入關(guān)懷版