国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

零樣本 Sim-to-Real !實現(xiàn)五指靈巧手力控抓取與手內操作

0
分享至



實現(xiàn)具備人類水平的靈巧操作能力,是機器人學領域長期以來的核心挑戰(zhàn)之一。盡管多指靈巧手在硬件上具備了類似人類的潛力,但由于接觸豐富的物理特性和非理想的驅動機制,訓練能夠直接部署在真實硬件上的控制策略仍然非常困難。

ByteDance Seed 團隊最新的研究論文《Closing the Reality Gap: Zero-Shot Sim-to-Real Deployment for Dexterous Force-Based Grasping and Manipulation》 [1],針對這一關鍵問題提出了實用的強化學習(RL) 框架。

該研究的核心貢獻在于提出了一套完整的 Sim-to-Real 解決方案,通過結合高密度的觸覺反饋和基于電機電流估算的關節(jié)力矩感知,顯式地調節(jié)物理交互過程。該框架不僅解決了高分辨率觸覺仿真的計算瓶頸,還通過數(shù)據(jù)驅動的執(zhí)行器建模消除了對昂貴力矩傳感器的依賴,最終實現(xiàn)了在純仿真環(huán)境中訓練的策略。在仿真或訓練環(huán)境中完成訓練后,模型能夠在真實的五指靈巧手上實現(xiàn)零樣本(Zero-Shot) 部署,即無需額外的真實數(shù)據(jù)進行微調,便可直接在真實機器人上運行。



Figure 1 :融合觸覺感知與關節(jié)力矩的全狀態(tài)策略框架

一、三大核心技術:

打通從仿真到現(xiàn)實的感知與驅動鏈路

論文的核心問題在于如何克服仿真與現(xiàn)實之間在觸覺感知、接觸物理和執(zhí)行器動力學方面的巨大差異(Reality Gap),從而訓練出能夠進行力控抓取和靈巧操作的全狀態(tài)策略。

該研究構建了一個由三大核心技術組成的完整體系,實現(xiàn)了從仿真訓練到真實部署的無縫銜接。

1. 計算高效的觸覺仿真:高分辨率 + 高幀率,魚與熊掌兼得

高保真度的觸覺仿真是學習接觸豐富技能的長期障礙。傳統(tǒng)的有限元分析(FEM) 或軟體仿真計算成本過高,無法滿足強化學習對大規(guī)模并行和高幀率的需求。

該研究提出了一種基于距離場的快速觸覺仿真方法。通過并行正向運動學,計算密集的虛擬觸覺單元陣列與物體表面之間的距離。這種方法不僅能夠提供強化學習所需的高頻信號,還保留了關鍵的接觸信息(如接觸力大小和受力加權接觸中心)。這種設計在保證物理合理性的同時,極大地提升了仿真效率,使得策略能夠在仿真中充分探索復雜的接觸動力學。

Figure 2 :接觸點建模與材料屬性

通過對比仿真與真實世界中的接觸數(shù)據(jù)(如下圖所示),可以發(fā)現(xiàn)兩者在接觸點分布和接觸力大小上表現(xiàn)出高度的一致性,證明了該觸覺仿真方法的高保真度。

2. 電流-力矩校準:無需力矩傳感器,也能精準力控

大多數(shù)商用靈巧手采用連桿或者腱繩等傳動結構,缺乏關節(jié)級的力矩傳感器,只能提供電機電流測量值。仿真中的理想力矩控制與真實電機的非理想特性之間存在巨大的現(xiàn)實鴻溝。

為了解決這一問題,研究團隊引入了電流-力矩校準機制。通過在準靜態(tài)條件下擬合電機電流與接觸力、仿真力矩與接觸力之間的線性關系,建立了一個可靠的「電流到力矩」映射。這種數(shù)據(jù)驅動的校準方法,使得策略在真實部署時,能夠將讀取到的歸一化電流信號作為「關節(jié)力矩」輸入,從而在無需物理力矩傳感器的情況下,實現(xiàn)了對交互力的顯式感知和控制。



Figure 3 :真實世界電流-力與仿真力矩-力的校準與對齊

3. 執(zhí)行器動力學建模與隨機化:顯著提高 Sim-to-Real 魯棒性

真實電機存在諸多非理想特性,如齒輪間隙(Backlash)、力矩-速度飽和(Torque-Speed Saturation) 以及摩擦力等。如果仿真中忽略這些特性,訓練出的策略在真實硬件上往往會表現(xiàn)出脆弱性。

該研究在仿真中顯式地對這些執(zhí)行器動力學進行了建模,并對關鍵參數(shù)(如堵轉力矩、空載速度、齒輪間隙閾值等) 進行了廣泛的域隨機化(Domain Randomization)。這種策略迫使控制策略適應各種硬件缺陷和公差變化,顯著提高了 Sim-to-Real 轉移的魯棒性。

二、全狀態(tài)策略與創(chuàng)新訓練范式:

實現(xiàn)力控自適應抓取與手內物體旋轉

基于上述 Sim-to-Real 框架,研究團隊成功訓練并部署了兩種關鍵的靈巧操作技能:力控自適應抓取(Force-Adaptive Grasping) 和手內物體旋轉(In-Hand Object Reorientation)。

1. 倒置「接物」訓練范式:提升樣本效率與魯棒性

傳統(tǒng)的桌面抓取訓練范式往往面臨樣本效率低、獎勵工程復雜以及容易產生「獎勵黑客」(Reward Hacking) 行為等問題。為此,研究團隊提出了一種創(chuàng)新的倒置「接物」(Inverted Catching) 訓練設置。

在這種設置下,靈巧手手心向上固定,物體從上方隨機掉落。這種利用重力自然將物體引入工作空間的方法,極大地簡化了探索過程,使策略能夠專注于學習手指協(xié)調和接觸后的力調節(jié)。同時,這種動態(tài)接物過程鼓勵形成包絡式、多點接觸的抓取姿態(tài),自然抑制了不穩(wěn)定的邊緣抓取策略,促使策略學習到更接近人類偏好的穩(wěn)定抓取方式。

2. 力自適應抓取:精準的力矩與接觸力控制

在力自適應抓取任務中,策略需要根據(jù)用戶輸入的力指令(Force Command),動態(tài)調節(jié)各個手指的抓取力。

研究表明,結合接觸力懲罰(R-force) 和關節(jié)力矩懲罰(R-torque) 的復合獎勵函數(shù)是實現(xiàn)穩(wěn)健力控的關鍵。僅懲罰接觸力會導致關節(jié)力矩不足,抓取不穩(wěn);僅懲罰關節(jié)力矩則無法有效將力傳遞到指尖。兩者的結合使得策略能夠同時協(xié)調關節(jié)驅動和指尖接觸,實現(xiàn)與指令高度線性相關的精準力控。



Figure 4 :不同獎勵設置下,關節(jié)力矩和接觸力隨力指令的變化

3. 手內物體旋轉:觸覺與本體感覺的深度融合

手內旋轉任務要求策略通過協(xié)調的手指步態(tài)(Finger Gaits),在保持穩(wěn)定接觸的同時,將物體繞指定軸旋轉。

消融實驗(Ablation Study) 深刻揭示了不同感知模態(tài)的重要性。結果顯示,包含受力加權接觸中心、接觸力和 6D 姿態(tài)表示的完整觀測配置取得了最佳性能(平均連續(xù)成功 25.1 次)。移除任何一種觸覺信息(接觸中心或接觸力) 都會導致性能顯著下降,而完全沒有觸覺反饋的基線策略幾乎無法完成任務(平均成功 1.1 次)。這充分證明了高分辨率觸覺反饋在復雜手內操作中的不可替代性。



Figure 5 :真實世界與仿真環(huán)境中的手內操作任務可視化結果

三、星動紀元五指靈巧手星動 XHAND1 :

DexManip 零樣本部署的硬件核心支撐

DexManip 框架之所以能夠實現(xiàn)驚艷的零樣本(Zero-Shot) 部署,除了算法層面的創(chuàng)新,更離不開底層硬件——星動紀元自研國內首創(chuàng)全直驅五指靈巧手——星動 XHAND1的強大支撐。該框架與 XHAND1 的硬件特性形成了完美的「軟硬協(xié)同」,在實際應用場景中展現(xiàn)出不可替代的落地優(yōu)勢。



Figure 6 :星動 XHAND1 靈巧手

1. 270° 環(huán)繞指端高分辨率觸覺陣列:捕捉精細接觸,破解手內操作感知瓶頸

DexManip 論文的消融實驗明確指出,高分辨率的觸覺反饋(接觸中心與接觸力) 是實現(xiàn)手內物體旋轉等復雜操作的決定性因素。星動 XHAND1 在每個手指端配備了270° 環(huán)繞的高分辨率觸覺陣列傳感器(單指 > 100 個觸覺點)。相比于傳統(tǒng)的壓阻類平板型傳感器,這種全包絡的曲面陣列能夠無死角地捕捉物體在指尖滾動、滑動時的微小接觸變化。結合高精度的力覺精度和三維力觸覺感知能力,星動 XHAND1 為 DexManip 策略提供了極其豐富且精準的觀測輸入,使其在處理不規(guī)則物體或執(zhí)行精細的「指尖步態(tài)(Finger Gaits)」時游刃有余。

2. 高精度 URDF 與觸覺仿真模型的無縫對接:精準對接仿真,縮小現(xiàn)實鴻溝

DexManip 框架的核心突破在于其計算高效的基于距離場的觸覺仿真。這一算法的成功高度依賴于仿真模型與真實物理世界的一致性。星動 XHAND1 官方提供了極高精度的 URDF 模型,不僅精確描述了運動學連桿和動力學參數(shù),還完美映射了真實傳感器的空間分布。這種「數(shù)字孿生」級別的模型支持,使得 DexManip 在仿真中計算的虛擬觸覺單元(Virtual Tactile Cells) 能夠與真實星動 XHAND1 的傳感器陣列實現(xiàn) 1:1 的精準對齊,從而大幅降低了 Sim-to-Real 的現(xiàn)實鴻溝,確保了純仿真訓練策略在真實硬件上的「開箱即用」。

3. 全直驅架構與電流-力矩校準的完美契合:實現(xiàn)精準力控,響應更靈敏

在力自適應抓取任務中,DexManip 提出通過「電流-力矩校準」來替代昂貴的物理力矩傳感器。星動 XHAND1 采用的全直驅(Direct-Drive) 電機架構為這一算法提供了最理想的硬件基礎。全直驅設計從根本上消除了傳統(tǒng)減速器帶來的巨大摩擦、遲滯和非線性干擾,使得電機的相電流與輸出力矩之間保持著極高的線性相關性。這不僅讓 DexManip 的電流-力矩校準過程更加精確可靠,還賦予了靈巧手極高的力控帶寬和超靈敏的動態(tài)響應能力,使其能夠根據(jù) 10% 、50% 、100% 等不同指令,瞬間且精準地調節(jié)抓取力度,安全地操作薯片、毛絨玩具等易碎或柔性物體。

Figure 7 :對訓練中未見過的不規(guī)則形狀物體進行力自適應抓取

這一成果標志著靈巧操作技術在克服 Sim-to-Real 鴻溝方面取得了關鍵突破。通過提供一套無需昂貴力矩傳感器和高計算成本觸覺仿真的實用方案,該研究大幅降低了基于力的靈巧操作研究的門檻,為多指靈巧手在柔性制造、服務機器人等真實復雜場景中的廣泛應用鋪平了道路。

參考文獻

[1] ByteDance Seed. Closing the Reality Gap: Zero-Shot Sim-to-Real Deployment for Dexterous Force-Based Grasping and Manipulation. 2025.

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中國突破禁令的方式簡單粗暴!日媒曾狂言:沒了日本,中國不行

中國突破禁令的方式簡單粗暴!日媒曾狂言:沒了日本,中國不行

周哥一影視
2026-03-26 18:01:24
40分鐘連挨4輪導彈!以色列遭盟友背叛?中方:支持巴勒斯坦建國

40分鐘連挨4輪導彈!以色列遭盟友背叛?中方:支持巴勒斯坦建國

Ck的蜜糖
2026-03-26 09:34:08
廣州樓市迅雷不及掩耳,廣州天河區(qū)房價從3.7萬變成3.6萬

廣州樓市迅雷不及掩耳,廣州天河區(qū)房價從3.7萬變成3.6萬

有事問彭叔
2026-03-26 23:46:12
倒計時,1500萬還是50萬?王俊杰的選擇,牽動CBA未來

倒計時,1500萬還是50萬?王俊杰的選擇,牽動CBA未來

李絙在北漂
2026-03-26 08:28:04
日本不再歡迎中國人?3月起日本簽證“一刀切”,華人進退兩難!

日本不再歡迎中國人?3月起日本簽證“一刀切”,華人進退兩難!

老嫅尾聲體育解說
2026-03-25 19:47:24
突發(fā)傳聞:封鎖霍爾木茲的伊朗關鍵人物被擊斃

突發(fā)傳聞:封鎖霍爾木茲的伊朗關鍵人物被擊斃

桂系007
2026-03-26 16:19:32
馬筱梅帶娃,滿手首飾,奶瓶亂放,與大S差得不是一星半點

馬筱梅帶娃,滿手首飾,奶瓶亂放,與大S差得不是一星半點

科普100克克
2026-03-18 13:04:12
這曾經是多少男人心中女神,她竟然這么蒼老,真是歲月不饒人呀

這曾經是多少男人心中女神,她竟然這么蒼老,真是歲月不饒人呀

東方不敗然多多
2026-03-27 00:11:10
致敬父親,麥卡利斯特曬寸頭照:有其父必有其子

致敬父親,麥卡利斯特曬寸頭照:有其父必有其子

懂球帝
2026-03-26 16:51:21
15家民營醫(yī)院注銷、停業(yè)(附名單)

15家民營醫(yī)院注銷、停業(yè)(附名單)

賽柏藍
2026-03-26 20:14:07
Google Messages破100億下載:蘋果遲到1年

Google Messages破100億下載:蘋果遲到1年

爬蟲飼養(yǎng)員
2026-03-26 12:21:15
俄教授給自己注射350萬年前細菌,尋求長生,10多年后怎樣了?

俄教授給自己注射350萬年前細菌,尋求長生,10多年后怎樣了?

火星一號
2026-03-23 00:49:24
太冤了!巴基斯坦好心斡旋,結果就這 么被美國和以色列 算  計了

太冤了!巴基斯坦好心斡旋,結果就這 么被美國和以色列 算 計了

愛吃醋的貓咪
2026-03-26 22:18:21
國際賽看點拉滿!中國男足對決庫拉索

國際賽看點拉滿!中國男足對決庫拉索

閑日記
2026-03-27 01:30:03
【2026.3.26】爆姐的飯后爆料:生命不止,爆料不息!

【2026.3.26】爆姐的飯后爆料:生命不止,爆料不息!

娛樂真爆姐
2026-03-26 23:33:09
人不會無緣無故患糖尿??!研究發(fā)現(xiàn):得糖尿病的人,離不開這5點

人不會無緣無故患糖尿病!研究發(fā)現(xiàn):得糖尿病的人,離不開這5點

醫(yī)學原創(chuàng)故事會
2026-02-21 23:54:05
張雪峰離世后,妻子真實身份曝光:歷史博士、高校副教授,40天閃婚

張雪峰離世后,妻子真實身份曝光:歷史博士、高校副教授,40天閃婚

畫夕
2026-03-26 20:44:59
山東“老頭樂”公司起訴小米汽車,當事企業(yè)稱已和解

山東“老頭樂”公司起訴小米汽車,當事企業(yè)稱已和解

界面新聞
2026-03-26 16:30:03
日媒曝光強闖我駐日使館不法之徒照片;案發(fā)前行動軌跡公布:乘坐新干線到達東京,在網吧過夜,現(xiàn)場發(fā)現(xiàn)的刀具,其稱是在車站附近購買

日媒曝光強闖我駐日使館不法之徒照片;案發(fā)前行動軌跡公布:乘坐新干線到達東京,在網吧過夜,現(xiàn)場發(fā)現(xiàn)的刀具,其稱是在車站附近購買

大風新聞
2026-03-26 12:13:02
51歲孔令輝:為生活奔波,與劉國梁9年未見面,一個電話讓他落淚

51歲孔令輝:為生活奔波,與劉國梁9年未見面,一個電話讓他落淚

夢史
2026-03-25 11:33:08
2026-03-27 03:20:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12608文章數(shù) 142594關注度
往期回顧 全部

科技要聞

美團發(fā)布外賣大戰(zhàn)后成績單:虧損超200億

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

時尚
本地
游戲
手機
軍事航空

400萬人愛過的女孩,被黃謠網暴180天后

本地新聞

救命,這只醬板鴨已經在我手機復仇了一萬遍

PS1大IP游戲藏私貨!成人手繪與盜版馬里奧ROM塞滿

手機要聞

1499 iQOO Z11系列發(fā)布丨9020mAh電池 165Hz高刷

軍事要聞

擔心特朗普突然停戰(zhàn) 以總理下令48小時盡力摧毀伊設施

無障礙瀏覽 進入關懷版