国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

賽迪前瞻:我國具身智能數據集工程化落地亟待破解四大瓶頸

0
分享至


具身智能包括本體、數據集、模型、場景四大組成要素,其中,數據集關系到具身智能的智能涌現(xiàn)和能力泛化。當前,在數據集領域,國家級數據訓練場、行業(yè)級開源社區(qū)與企業(yè)級數據開發(fā)平臺協(xié)同發(fā)力,形成了“真機遙操+靈巧手采集+仿真數據”三層數據供給體系,支撐視覺-語言-動作(VLA)模型與世界模型并進式發(fā)展。但具身智能數據集供給仍呈現(xiàn)點狀分散格局,受限于標注工具不足、采集成本高昂、多模態(tài)技術滯后與標準體系缺失等瓶頸,掣肘了具身智能從技術驗證向規(guī)?;虡I(yè)應用的進程。亟需培育高質量具身智能數據訓練場,打造數據集標注平臺,建設數據集開源社區(qū),研制數據集標準規(guī)范,開展規(guī)模化場景應用示范,探索具身智能數據集產業(yè)高質量發(fā)展的“中國路徑”。

一、我國具身智能數據集的建設現(xiàn)狀

從建設主體看,國家級數據訓練場、行業(yè)級開源社區(qū)與企業(yè)級數據開發(fā)平臺協(xié)同發(fā)力,具身智能數據集開發(fā)生態(tài)縱深性發(fā)展。一是國家級訓練場構建“2+N”數據生產體系。國家層面,已在北京和上海建成2個國家級具身智能訓練場。其中,北京國家地方共建具身智能機器人創(chuàng)新中心已建成近萬平米的中試驗證工廠,年產能達數千臺套,配備近百套關鍵測試儀器,支持整機、一體化關節(jié)、機械臂等全鏈條測試驗證。上海國家地方共建人形機器人創(chuàng)新中心訓練場已部署102臺異構人形機器人,具備每日生成5萬條數據的能力。地方層面,河南、江蘇、北京、深圳等省市正積極推進人形機器人創(chuàng)新中心分訓練場建設。其中河南分訓練場聚焦12大傳統(tǒng)產業(yè),部署近百臺機器人,覆蓋20多個真實場景。二是行業(yè)級開源社區(qū)推動關鍵資源共建共享。地方、企業(yè)及科研機構主動開放資源,以共建方式降低行業(yè)創(chuàng)新門檻。如傅利葉智能開源了包含3萬條真機數據的ActionNet數據集及配套工具鏈,地瓜機器人等也積極打造開發(fā)者社區(qū)。北京國家地方共建具身智能機器人創(chuàng)新中心上線了開源社區(qū),提供具身天工機器人本體、慧思開物SDK、RoboMIND數據集及訓練工具鏈等資源。三是機器人本體企業(yè)和技術服務平臺企業(yè)推動企業(yè)級數據研發(fā)和服務。機器人本體企業(yè)基于自有硬件進行真機數據的采集積累,如智元機器人AgiBot World真機數據集、宇樹科技G1機器人操作數據集、帕西OmniSharing DB全模態(tài)具身智能數據集。技術服務平臺企業(yè)則提供數據采集平臺、仿真工具、數據標注服務等數據服務,助力企業(yè)數據集開發(fā)。如群核科技提供虛擬數字道場平臺SpatialVerse,通過生成可交互的三維合成數據,支持機器人進行避障、抓取及緊急制動等任務的仿真訓練;智源研究院則打造高保真仿真框架AgiBot Digital World,為機器人設計提供仿真數據生成解決方案。

從技術路徑看,形成了數據供給“真機遙操+靈巧手采集+仿真數據”三層體系,規(guī)模化采集能力初步建成。一是真機遙操。智元機器人、傅利葉智能等企業(yè),通過覆蓋單臂、多臂、人形、四足等多形態(tài)機器人,可在家居、餐飲、工業(yè)、辦公等200多個真實場景中執(zhí)行復雜操作,積累大量真實交互數據。二是靈巧手采集,通過觸覺傳感器精準記錄人手精細動作,為精密裝配、柔性物體操控等任務提供關鍵數據。靈巧智能DexCanvas數據集,匯聚了22類人手操作模式、超1000小時真人多模態(tài)演示數據,驅動五指靈巧操作模型。三是仿真數據。銀河通用、光輪智能、深信科創(chuàng)、云道智造等企業(yè),借助物理引擎和圖形學構建虛擬環(huán)境,可低成本生成大規(guī)模數據。

從建設成效看,具身智能數據集支撐VLA與世界模型發(fā)展,涌現(xiàn)一批典型模型。一是在VLA模型方向,大規(guī)模、多模態(tài)數據集為其提供了訓練基礎,使機器人能夠融合視覺感知、語言理解與動作控制,高效執(zhí)行復雜任務。比如銀河通用機器人依托具身大模型GraspVLA,通過十億幀數據訓練,掌握機器人泛化閉環(huán)抓取能力。星動紀元發(fā)布VLA模型ERA-42驅動的雙足機器人,學習人類操作視頻和真機數據,可實現(xiàn)4m/s疾速奔跑、360°旋轉跳及工業(yè)級精細作業(yè)。二是在世界模型方向,機器人通過海量視頻數據,學習環(huán)境中物體與事件的演變規(guī)律,提升其對未來狀態(tài)的預測與因果推理能力。如智元機器人的Genie Envisioner世界模型平臺,基于3000小時的真機操控視頻數據,賦能機器人實現(xiàn)“制作三明治”“倒茶”“擦拭桌面”等任務。宇樹科技基于5個涵 蓋 機 械 臂 和 人 形 機 器 人 的 任 務 數 據 集 , 搭 建UnifoLM-WMA-0世界模型架構。三是技術架構正從分層架構向端到端演進,VLA與世界模型或將融合。當前具身智能仍以分層架構為主,隨著仿真與真實數據的進一步融合,“世界模型為大腦、VLA為手眼”的融合架構將成為新趨勢。

二、具身智能數據集工程化落地存在四大瓶頸

當前,我國具身智能數據集建設已形成多主體協(xié)同、多層次供給的格局,但仍呈點狀分散狀態(tài)。要實現(xiàn)具身智能領域的技術迭代與規(guī)模化商業(yè)落地,必須加快推進數據集工程化落地——即構建覆蓋數據采集、標注、應用、評估全流程的標準化和產品化,實現(xiàn)數據集的高效生產與可靠復用,為具身智能模型訓練與場景適配提供系統(tǒng)化支撐。目前,該進程仍面臨四大瓶頸制約。

(一)數據標注工具制約高質量數據集構建

一是具身智能標注工具仍顯匱乏。VLA模型要求對視覺場景、語言指令及動作軌跡進行時空關聯(lián)標注,世界模型更需要標注視頻序列中的物理屬性、物體狀態(tài)變化及潛在的因果聯(lián)系。然而,現(xiàn)有工具多側重于靜態(tài)圖像或簡單視頻標注,難以高效支持VLA模型和世界模型對長序列、3D空間和物理動態(tài)標注的需求,數據標注精度不足。二是缺乏數據標注全生命周期平臺。標注規(guī)范、工具接口和數據格式各異,使得不同企業(yè)的標注數據復用性與集成性較差,制約了數據生態(tài)的協(xié)同效率。

(二)數據采集成本限制數據集規(guī)模化擴張

一是軟硬件投入高。與傳統(tǒng)AI數據集采集相比,構建覆蓋多任務、多環(huán)境的具身智能真實數據集需投入大量機器人、傳感器及專業(yè)標注工具,成本高昂,單臺設備產生一萬小時訓練數據需要消耗上百萬元。二是人員成本高。一個數采員一天只能采集300-500條數據,如果是復雜任務,數據采集產出會更低。

(三)多模態(tài)融合技術影響數據集有效性

一是仿真數據的遷移可靠性不足。由于物理引擎難以完全模擬復雜的真實力學特性,如接觸、摩擦、材料變形,導致依托仿真數據訓練的策略模型遷移到真實環(huán)境時出現(xiàn)顯著性能衰減。例如依托仿真數據LIBERO-LONG訓練的世界模型在辦公桌面的現(xiàn)實環(huán)境中失效。二是多模態(tài)數據精準融合困難。視覺和觸覺數據的精度需求存在跨量級鴻溝,精準對齊和標注仍是行業(yè)難題,制約人形機器人作業(yè)的精確性和適應性。盡管戴盟、帕西尼、疊動等企業(yè)在傳感器與算法層面已取得突破,但高精度的視觸覺融合技術仍有待攻克。

(四)數據標準缺失阻礙數據集共享與復用

一是開源數據標準化程度不高。不同機構的開源數據集在數據格式、標注體系、傳感器參數與任務定義等方面存在顯著差異,缺乏統(tǒng)一的本體描述與接口規(guī)范,導致數據難以跨項目集成與復用。此外,數據采集設備、環(huán)境配置與操作協(xié)議不統(tǒng)一,也使得多源數據難以有效對齊與合并。二是具身智能數據標準體系有待完善。目前國家和地方層面發(fā)布或正在起草的標準多集中于數據生產環(huán)節(jié),對數據質量評估、數據集泛化性能評測等,仍需更完善的標準制定和平臺支持。

三、對策建議

(一)加強載體建設,培育高質量數據訓練場

一是支持國家級具身智能數據訓練場聚焦行業(yè)發(fā)展的前瞻性、基礎性問題,攻克共性技術難題、制定數據標準、建設普惠性基礎設施。二是鼓勵有條件的地方立足自身產業(yè)優(yōu)勢,通過設立專項、配套政策與資金,建設一批聚焦工業(yè)裝配、家庭服務等細分領域的具身智能數據訓練場,構建特色化、差異化的具身智能數據體系。

(二)突破關鍵技術,打造數據集標注平臺

一是強化軟硬件協(xié)同,系統(tǒng)發(fā)展具身智能多模態(tài)傳感器、仿真建模、數字孿生等關鍵技術,深度適配VLA模型和世界模型發(fā)展。二是突破數據處理的核心算法,加強多模態(tài)數據融合、仿真-真實數據遷移、數據合成與增強等核心技術攻關,為高效、高精度數據標注提供核心驅動力。三是鼓勵標注企業(yè)與機器人企業(yè)共建具身智能多模態(tài)數據集標注平臺,加強核心算法研發(fā),推動標注工具智能化,形成可復用、可推廣的行業(yè)級解決方案。

(三)注重開源開放,建設數據集開源社區(qū)

一是建設具身智能開源社區(qū),推動基礎模型、訓練數據、工具鏈、操作系統(tǒng)、仿真環(huán)境等技術開源,推動構建萬億級多模態(tài)開源數據庫。二是支持高校、龍頭企業(yè)與開源社區(qū)共建課程與實踐平臺,通過舉辦具身智能算法競賽、設立開源貢獻獎勵等方式,培育一批既懂技術又具開源精神的復合型人才,激發(fā)產業(yè)創(chuàng)新活力。

(四)加快標準制定,研制數據集標準規(guī)范

一是加強標準統(tǒng)籌。堅持“統(tǒng)籌部署、軟硬協(xié)同、急用先上、開源先行”的原則,加快推進具身智能分行業(yè)、分場景數據集標準體系制定,積極推動開源數據集標準化。二是突出核心任務。面向物體抓取、自主導航、復雜指令遵循等核心任務,支持行業(yè)建設具身智能數據集測試標準體系。三是開展評測認證。鼓勵第三方機構建立數據集質量評測與認證體系,推動標準在典型場景中先行試用與迭代優(yōu)化,為數據流通與應用建立基礎信任。

(五)深化行業(yè)應用,開展規(guī)模化場景應用示范

一是聚焦工業(yè)制造、商業(yè)零售、醫(yī)療康養(yǎng)、家政服務等重點領域,開展場景征集與任務揭榜,探索具身智能應用新業(yè)態(tài)。二是組織開展具身智能數據集典型案例遴選,支持行業(yè)企業(yè)打造可推廣可復制的示范應用標桿,推動具身智能規(guī)?;逃寐涞亍?/p>

來源 | 賽迪智庫

編輯 | 辦公室


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
醫(yī)生告誡:每天睡前玩手機的人,不用半年時間,睡眠或有這6變化

醫(yī)生告誡:每天睡前玩手機的人,不用半年時間,睡眠或有這6變化

白話電影院
2026-04-05 15:34:47
不登島不轟炸!美國深夜一招絕殺:伊朗一天損失2億,徹底扛不住

不登島不轟炸!美國深夜一招絕殺:伊朗一天損失2億,徹底扛不住

和海看日出
2026-04-14 01:21:30
中央5臺直播乒乓球時間表:4月14日CCTV5轉播國乒!附國乒動態(tài)!

中央5臺直播乒乓球時間表:4月14日CCTV5轉播國乒!附國乒動態(tài)!

史智文道
2026-04-14 14:57:02
心源性猝死的人越來越多?醫(yī)生強調:寧可打打牌,建議別做這7事

心源性猝死的人越來越多?醫(yī)生強調:寧可打打牌,建議別做這7事

醫(yī)學原創(chuàng)故事會
2026-03-29 23:50:13
感覺鐘楚曦衣服都要掉了,但是一臉鎮(zhèn)定美的讓人忘記了旁邊是娜扎

感覺鐘楚曦衣服都要掉了,但是一臉鎮(zhèn)定美的讓人忘記了旁邊是娜扎

阿廢冷眼觀察所
2026-04-12 08:09:14
中方無視美國封鎖,054A強勢護航油輪過航,美國緊急改口防打臉

中方無視美國封鎖,054A強勢護航油輪過航,美國緊急改口防打臉

淡然小司
2026-04-14 13:37:04
鞏立姣高調宣布退役5個月減肥40斤 相當于從身上扒下來一頭小豬

鞏立姣高調宣布退役5個月減肥40斤 相當于從身上扒下來一頭小豬

勁爆體壇
2026-04-13 16:12:05
伊朗到現(xiàn)在都不敢相信,40多天的血戰(zhàn),給自己打出了半個世紀國運

伊朗到現(xiàn)在都不敢相信,40多天的血戰(zhàn),給自己打出了半個世紀國運

共工之錨
2026-04-14 00:43:37
飄了?會員為山姆帶來1400億營收,山姆卻將90天無憂退貨縮至7天

飄了?會員為山姆帶來1400億營收,山姆卻將90天無憂退貨縮至7天

青眼財經
2026-04-13 23:20:36
約P?多人運動?夜夜不重樣?“娛圈鐵腎”的瓜

約P?多人運動?夜夜不重樣?“娛圈鐵腎”的瓜

萌姐
2026-04-11 18:44:38
秦楓為什么死磕到底?從王石事件來看看這位“爆料女王”的底氣

秦楓為什么死磕到底?從王石事件來看看這位“爆料女王”的底氣

童叔不飆車
2026-04-14 00:01:43
看上去像“公務員”,其實連編制都沒有的6個職業(yè)

看上去像“公務員”,其實連編制都沒有的6個職業(yè)

細說職場
2026-04-12 17:02:40
歐爾班也沒想到,落選17分鐘后,馮德萊恩就嘲笑,來安慰的卻是他

歐爾班也沒想到,落選17分鐘后,馮德萊恩就嘲笑,來安慰的卻是他

書紀文譚
2026-04-14 13:30:01
鄭麗文試駕小米汽車!雷軍樂開了花

鄭麗文試駕小米汽車!雷軍樂開了花

李東陽朋友圈
2026-04-13 15:10:32
網友拍到蘇州博物館例行閉館日有人參觀,質疑特權現(xiàn)象;館方回應:系該博物館工會組織的員工活動場,所有入館人員均需員工申報及本人陪同

網友拍到蘇州博物館例行閉館日有人參觀,質疑特權現(xiàn)象;館方回應:系該博物館工會組織的員工活動場,所有入館人員均需員工申報及本人陪同

極目新聞
2026-04-14 15:20:52
52歲樸樹近況:無兒無女,沒錢沒房,成了要錢不要命的“瘋子”

52歲樸樹近況:無兒無女,沒錢沒房,成了要錢不要命的“瘋子”

一娛三分地
2026-04-13 14:50:00
經典重生!豐田再度推出AE86車型 最大188匹馬力

經典重生!豐田再度推出AE86車型 最大188匹馬力

CNMO科技
2026-04-13 15:40:05
丘吉爾回憶揭秘:若不是1945年那兩個蘑菇云,日本將從地球上消失

丘吉爾回憶揭秘:若不是1945年那兩個蘑菇云,日本將從地球上消失

飯小妹說歷史
2026-04-14 10:25:44
小米汽車市場危機,開始公開化

小米汽車市場危機,開始公開化

浙江車網
2026-04-13 09:15:19
Jon Stewart發(fā)現(xiàn)特朗普耶穌梗圖里的病人是自己:「嚇得我半死」

Jon Stewart發(fā)現(xiàn)特朗普耶穌梗圖里的病人是自己:「嚇得我半死」

娛圈觀察員
2026-04-14 16:19:48
2026-04-14 16:52:49
中國電子信息產業(yè)發(fā)展研究院 incentive-icons
中國電子信息產業(yè)發(fā)展研究院
工信部直屬的科研事業(yè)單位
2972文章數 912關注度
往期回顧 全部

科技要聞

離職同事"煉化"成AI?這屆公司不需要活人了

頭條要聞

大陸公布十項惠臺政策 民進黨當局擬封殺

頭條要聞

大陸公布十項惠臺政策 民進黨當局擬封殺

體育要聞

他做對了所有事,卻被整個職業(yè)網壇放逐了八年

娛樂要聞

宋祖兒劉宇寧戀情大反轉 正主火速辟謠

財經要聞

許家印受審當庭表示認罪悔罪

汽車要聞

售12.99萬起/續(xù)航2000km 風云T9L上市

態(tài)度原創(chuàng)

本地
家居
數碼
公開課
軍事航空

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

家居要聞

現(xiàn)代融合 自然靈動

數碼要聞

黃仁勛要造整機:NVIDIA密謀收購大型PC廠商!官方回應

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗要求五個中東國家賠償戰(zhàn)爭損失

無障礙瀏覽 進入關懷版