国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

開源1萬小時具身智能數(shù)據(jù),這家公司是為了什么?

0
分享至

機器之心發(fā)布

想象一下,你正在訓練一個未來的家庭機器人。你希望它能像人一樣,輕松地疊好一件襯衫,整理雜亂的桌面,甚至系好一雙鞋的鞋帶。但最大的瓶頸是什么?不是算法,不是硬件,而是數(shù)據(jù) —— 海量的、來自真實世界的、雙手協(xié)同的、長程的、多模態(tài)的高質(zhì)量數(shù)據(jù)。

因此為了整個具身智能探索加速,開源集合成為了大家的共同選擇,從谷歌 Open-X Embodiment、智元 AgiBot Digital World,到智源 RoboCOIN 與它石智航的 World In Your Hands,都在試圖構(gòu)建更龐大、更完善的數(shù)據(jù)集合,并開源給到全行業(yè)。

但在 1 月 6 日,有一家公司將這件事做到新高度,進行了超過 1 萬小時、接近百萬 clips 的具身數(shù)據(jù)集合開放,這是行業(yè)最大規(guī)模、也是泛化程度最高的開源數(shù)據(jù)集合,它就是簡智機器人的 “10Kh RealOmni-Open DataSet”



(下載地址為:https://huggingface.co/datasets/genrobot2025/10Kh-RealOmin-OpenData,其他數(shù)據(jù)正在陸續(xù)上傳。國內(nèi)也與阿里魔搭、百度百舸合作,方便國內(nèi)用戶下載。)

這批數(shù)據(jù)集合和之前不同點在哪兒?

總體規(guī)模大,這個體量甚至已經(jīng)超越很多具身公司自己所儲備的數(shù)據(jù),而在量大的同時,這個數(shù)據(jù)集合還期望它更加“實用”

首先需要它具備足夠強的 “技能深度”,在簡智開源數(shù)據(jù)集合中,沒有選擇去發(fā)散的擴充技能數(shù)量,而是聚焦在 10 個常見家庭任務(wù)集合中,從而對應(yīng)每一項技能都有超過 1 萬 Clips 規(guī)模的數(shù)據(jù)覆蓋,這使得其不只是總體規(guī)模的最大,也是單個技能的行業(yè)最多

其次是質(zhì)量、模態(tài)的要求,這決定這些數(shù)據(jù)是否真正能被模型消化理解,而畫面的超大 FOV、清晰的畫質(zhì)是基礎(chǔ),保證可以全方位錄制到周圍的環(huán)境和人的操作細節(jié),簡智這次數(shù)據(jù)集合的像素達到 “1600*1296”“30fps” 的水平

在這之上軌跡的精度是數(shù)據(jù)質(zhì)量的關(guān)鍵,厘米級的軌跡精度對人來說可能足夠精細,但對于機器人來說則需要達到毫米級別,因此簡智這次開源數(shù)據(jù)對比行業(yè),一方面具備了大多數(shù)不具備的軌跡信息,同時通過高精度 IMU 硬件和云端重建與還原,進一步將軌跡提升到亞厘米級別。而在模態(tài)上,作為夾抓類的技能采集,夾抓的開合角度、位移也都在集合中包含。



而在技能方面,單手在實際場景中可以完成的任務(wù)優(yōu)先,因此難得是在數(shù)據(jù)集中,99.2% 都是 “雙手、長程任務(wù)”,這也讓它變得更落地—— 以第一批數(shù)據(jù)為例,平均 clips 長度為 1min37s。這意味著,它記錄的不是一張張靜態(tài)快照,而是從 “拿起散亂 T 恤” 到 “疊放整齊” 的完整過程,是動作邏輯與因果的連續(xù)學習。



最后則是在相同技能下,數(shù)據(jù)的場景、目標泛化上需要足夠豐富,人員的操作要足夠自然,而非單一場景的重復(fù)、動作僵硬重復(fù),這樣才能讓模型在真實的生活中,應(yīng)對家庭環(huán)境、目標類型千變?nèi)f化。簡智這批數(shù)據(jù)來自 3000 個真實的家庭規(guī)模采集,以疊衣服為例,不同的衣服種類、平鋪的位置等多重因素變量都包含在其中,彌補了傳統(tǒng) “數(shù)采工廠” 方案過于單一的問題。



為什么有底氣開源這么大批量數(shù)據(jù)?

在這些大規(guī)模、高質(zhì)量、泛化程度高數(shù)據(jù)的背后,其實一套完整的 “數(shù)據(jù)生產(chǎn)鏈條”,在這方面簡智也有自己的一套方法論,完成從采集設(shè)備到云端平臺,再到數(shù)據(jù)的二次迭代的閉環(huán),這也使得簡智在 2 個月時間內(nèi)就積累了近百萬小時規(guī)模的數(shù)據(jù)。



這其中,Gen DAS Gripper是能完成簡智規(guī)?;杉氖滓|點,它相比傳統(tǒng)的數(shù)據(jù)采集、UMI 等方案來看,可以更容易、快速地部署,不需要做任何的場地布置;同時全棧自研的 ISP 圖像處理、CMOS 傳感器,保證圖像高質(zhì)量、清晰。

同時可以做到基于車規(guī)級 IMU、雙手設(shè)備同步,實現(xiàn)雙手技能的高精度坐標對齊,異構(gòu)數(shù)據(jù)時間誤差小于 1ms

在設(shè)備端,具備超強壓縮能力:將數(shù)據(jù)體積壓縮至原大小的 2%,同時打通在線上傳通道,實現(xiàn)分鐘級快速上傳,大幅提升數(shù)據(jù)流轉(zhuǎn)效率。

Gen Matrix 則是中樞數(shù)據(jù)平臺,它將收集后數(shù)據(jù)進行高精準的軌跡還原、對齊、清洗處理:將眾多分散設(shè)備數(shù)據(jù)收集,超強軌跡還原、環(huán)境重建能力,軌跡真值誤差小于 1cm,并將異構(gòu)數(shù)據(jù)進行同步與清洗,保證數(shù)據(jù)質(zhì)量,并具備自動化標注、切片等進階能力,可以高并發(fā)處理海量數(shù)據(jù)源。這在具身行業(yè)也是領(lǐng)先的數(shù)據(jù)平臺基建。

Gen ADP(AI Data Pipeline)則是規(guī)?;⒆詣踊瘮?shù)據(jù)產(chǎn)線,它是將 DAS 的數(shù)據(jù)完成自動化的脈搏。它將標注、加工流程自動化,讓高質(zhì)量數(shù)據(jù)的產(chǎn)出像流水一樣持續(xù)、高速,2h 內(nèi)完成采集與處理全過程。目前據(jù)簡智公開信息,已經(jīng)完成百萬小時規(guī)模數(shù)據(jù)累計,并且每天以接近萬小時規(guī)模增長



開源是一件需要持續(xù)做、加速做的事情

具身智能的未來,建立在高質(zhì)量數(shù)據(jù)的基石之上。在今天來看,大家對于數(shù)據(jù)的格式、規(guī)范還尚不成熟,這大大的影響了模型方案的進步速度,因此開源數(shù)據(jù)持續(xù)、加速推進,能快速填補數(shù)據(jù)鴻溝、統(tǒng)一技術(shù)標準、降低研發(fā)門檻、推動生態(tài)協(xié)同與自主可控,最終加速具身智能從實驗室走向規(guī)模化落地。

10Kh RealOmni-Open DataSet的開放,不僅是一份海量數(shù)據(jù)資源,更是一種通過共享加速創(chuàng)新的可能性。簡智團隊后續(xù)將繼續(xù)加強數(shù)據(jù)基建建設(shè),推出更多行業(yè)有益的數(shù)據(jù)、服務(wù),形成 “數(shù)據(jù)共享 — 模型優(yōu)化 — 場景落地 — 數(shù)據(jù)反哺” 的正向循環(huán)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
馬杜羅家族500億美元遭凍結(jié),為何標榜中立的瑞士被多次“打臉”

馬杜羅家族500億美元遭凍結(jié),為何標榜中立的瑞士被多次“打臉”

微評社
2026-01-08 01:07:07
25歲哈蘭德快哭了 4失絕殺+離譜吐餅讓瓜帥仰天抱頭 近4輪進1點球

25歲哈蘭德快哭了 4失絕殺+離譜吐餅讓瓜帥仰天抱頭 近4輪進1點球

我愛英超
2026-01-08 08:21:24
16GB+1TB !新機官宣:1月15日,全新上市

16GB+1TB !新機官宣:1月15日,全新上市

科技堡壘
2026-01-08 12:14:38
夫妻性生活中的“小動作”技巧:讓妻子“爽”到骨子里的四個秘訣

夫妻性生活中的“小動作”技巧:讓妻子“爽”到骨子里的四個秘訣

精彩分享快樂
2025-12-04 13:26:44
票房從30億跌到9847萬,我感慨:這一張金字招牌算是砸了

票房從30億跌到9847萬,我感慨:這一張金字招牌算是砸了

韓馳
2026-01-03 17:11:42
2026年春節(jié),要暖到離譜?大年初一撞上七九,老輩人:60年頭回見

2026年春節(jié),要暖到離譜?大年初一撞上七九,老輩人:60年頭回見

叮當當科技
2026-01-07 13:58:49
容易“偷人”的女人,八成都有這3個特征!第三條扎心了

容易“偷人”的女人,八成都有這3個特征!第三條扎心了

風起見你
2026-01-02 12:19:55
岳云鵬宣布退出2026春晚,不再參加

岳云鵬宣布退出2026春晚,不再參加

觀察者海風
2026-01-07 17:11:33
林強涉案989億被抓!生活奢華超過中東富豪,妻子、父母也有責任

林強涉案989億被抓!生活奢華超過中東富豪,妻子、父母也有責任

細品名人
2025-12-31 07:34:46
遼寧一小伙認50歲女教師做干媽,每周去其家中補課,最后釀成悲劇

遼寧一小伙認50歲女教師做干媽,每周去其家中補課,最后釀成悲劇

紅豆講堂
2024-09-24 10:14:37
冬窗引援頻繁刮彩票!利物浦連簽三大天才中衛(wèi),高層到底意欲何為

冬窗引援頻繁刮彩票!利物浦連簽三大天才中衛(wèi),高層到底意欲何為

銳評利物浦
2026-01-08 23:53:17
忘恩負義,為蓋高樓將中國4萬烈士墓砸毀,卻對日本陵園保護有加

忘恩負義,為蓋高樓將中國4萬烈士墓砸毀,卻對日本陵園保護有加

超人強動物俱樂部
2025-12-13 13:36:03
遼寧農(nóng)商銀行董事長楊濟時擬提名為地級市市長候選人

遼寧農(nóng)商銀行董事長楊濟時擬提名為地級市市長候選人

界面新聞
2026-01-08 13:45:33
比中國衛(wèi)星猛3倍!腦機接口+商業(yè)航天,6大龍頭藏不住了

比中國衛(wèi)星猛3倍!腦機接口+商業(yè)航天,6大龍頭藏不住了

Thurman在昆明
2026-01-07 13:42:37
一碗雞蛋羹毒倒一家人?醫(yī)生警告:雞蛋盡量別這樣吃,比農(nóng)藥還毒

一碗雞蛋羹毒倒一家人?醫(yī)生警告:雞蛋盡量別這樣吃,比農(nóng)藥還毒

二大爺觀世界
2025-12-25 17:52:11
中方反制后,日本萌生大膽想法,西方媒體發(fā)出提醒,別忘了16年前

中方反制后,日本萌生大膽想法,西方媒體發(fā)出提醒,別忘了16年前

博覽歷史
2026-01-07 17:10:36
馬筱梅要回北京工作了,表示如果孩子真的提前出生,那就隨緣!

馬筱梅要回北京工作了,表示如果孩子真的提前出生,那就隨緣!

不太愛笑的小羊
2026-01-08 10:46:12
美國必勝?哈佛教授:不要高估中國,美國已經(jīng)控制了中國的命脈

美國必勝?哈佛教授:不要高估中國,美國已經(jīng)控制了中國的命脈

妙知
2025-07-29 16:31:23
她從一名賣菜女工官至副國級,78年接受隔離審查,晚年待遇如何?

她從一名賣菜女工官至副國級,78年接受隔離審查,晚年待遇如何?

大運河時空
2026-01-06 11:50:03
俄交通部確認美軍登船 稱與“馬里涅拉號”失去聯(lián)系

俄交通部確認美軍登船 稱與“馬里涅拉號”失去聯(lián)系

環(huán)球網(wǎng)資訊
2026-01-07 23:17:39
2026-01-09 06:23:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12080文章數(shù) 142532關(guān)注度
往期回顧 全部

科技要聞

智譜拿下“全球大模型第一股”,憑什么

頭條要聞

采用俄羅斯的防空系統(tǒng) 委內(nèi)瑞拉防空體系因何失效

頭條要聞

采用俄羅斯的防空系統(tǒng) 委內(nèi)瑞拉防空體系因何失效

體育要聞

世乒賽銀牌得主,說自己夢里都是孫穎莎

娛樂要聞

抗戰(zhàn)劇《馬背搖籃》首播,獲觀眾好評

財經(jīng)要聞

微軟CTO韋青:未來人類會花錢"戒手機"

汽車要聞

從量變到"智"變 吉利在CES打出了五張牌

態(tài)度原創(chuàng)

家居
手機
親子
旅游
藝術(shù)

家居要聞

理性主義 冷調(diào)自由居所

手機要聞

1699一加Turbo6首發(fā)測評丨 9000mAh 大電池165超高幀

親子要聞

家長注意了!這7件事別再孩子面前做!

旅游要聞

告別 “門票依賴”!石林的轉(zhuǎn)型之路,給全國老牌景區(qū)上了一課

藝術(shù)要聞

Sean Yoro:街頭藝術(shù)界的“沖浪高手”

無障礙瀏覽 進入關(guān)懷版