国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

ICLR 2026|新版「圖靈測試」:當(dāng)VLA走進(jìn)生物實(shí)驗(yàn)室

0
分享至



現(xiàn)有 VLA 模型的研究和基準(zhǔn)測試多局限于家庭場景(如整理餐桌、折疊衣物),缺乏對專業(yè)科學(xué)場景(尤其是生物實(shí)驗(yàn)室)的適配。生物實(shí)驗(yàn)室具有實(shí)驗(yàn)流程結(jié)構(gòu)化、操作精度要求高、多模態(tài)交互復(fù)雜(透明容器、數(shù)字界面)等特點(diǎn),是評估 VLA 模型精準(zhǔn)操作、視覺推理和指令遵循能力的理想場景之一。



近期,來自香港大學(xué)MMLAB 羅平老師團(tuán)隊(duì)和上海交大穆堯老師團(tuán)隊(duì)的工作——Autobio 正式被 ICLR 2026 接收,并獲得了 8-8-6-6 的同行評議分?jǐn)?shù)。AutoBio 是一個面向數(shù)字化生物實(shí)驗(yàn)室的機(jī)器人仿真系統(tǒng)與基準(zhǔn)測試平臺。我們通過這篇工作,嘗試系統(tǒng)性回答一個關(guān)鍵問題:

當(dāng)前主流的視覺 - 語言 - 動作(Vision-Language-Action, VLA)模型,是否已經(jīng)具備在真實(shí)生物實(shí)驗(yàn)室中執(zhí)行實(shí)驗(yàn)流程的能力?



  • 論文標(biāo)題:AutoBio: A Simulation and Benchmark for Robotic Automation in Digital Biology Laboratory
  • 論文鏈接:https://openreview.net/forum?id=UUE6HEtjhu
  • 論文代碼:https://github.com/autobio-bench/AutoBio
  • https://huggingface.co/autobio-bench

一.研究背景:為何生物實(shí)驗(yàn)室構(gòu)成關(guān)鍵挑戰(zhàn)

與日常操作環(huán)境相比,生物實(shí)驗(yàn)室在機(jī)器人自動化層面呈現(xiàn)出一組高度耦合的挑戰(zhàn):

首先,實(shí)驗(yàn)操作通常具有長時(shí)序和強(qiáng)約束特征。即便單步動作相對簡單,其組合往往構(gòu)成對順序一致性和狀態(tài)依賴高度敏感的完整實(shí)驗(yàn)流程。

其次,實(shí)驗(yàn)器材大多數(shù)為交互式,廣泛采用螺紋、卡扣、分檔旋鈕等精細(xì)機(jī)械結(jié)構(gòu),對位姿控制和軌跡規(guī)劃提出遠(yuǎn)高于常規(guī)操作的要求。

此外,液體樣本與透明容器的普遍存在,對視覺感知提出了更大的挑戰(zhàn),而這類場景在現(xiàn)有仿真與評測體系中長期被簡化或忽略。

上述因素共同導(dǎo)致:即便在家庭或工業(yè)場景中表現(xiàn)良好的模型,也可能在實(shí)驗(yàn)室任務(wù)中迅速失效。這一現(xiàn)象表明,現(xiàn)有基準(zhǔn)并不足以反映模型在科研場景下的真實(shí)能力邊界。



二.AutoBio 的核心設(shè)計(jì)思想





如上圖,AutoBio 并非簡單復(fù)刻實(shí)驗(yàn)室環(huán)境,而是從實(shí)驗(yàn)流程本身出發(fā),提出一種以生物實(shí)驗(yàn)語義為中心的建模與評測范式。

我們將復(fù)雜實(shí)驗(yàn)操作抽象為一組生物實(shí)驗(yàn)原語(biological primitives),例如樣本轉(zhuǎn)移、混合反應(yīng)、條件調(diào)控、分離與保存等。這些原語進(jìn)一步映射為可執(zhí)行的機(jī)器人運(yùn)動與控制模塊,并在統(tǒng)一的仿真環(huán)境中進(jìn)行組合。

在系統(tǒng)層面,AutoBio 由三部分構(gòu)成:

  • 面向真實(shí)實(shí)驗(yàn)室的高保真仿真系統(tǒng);
  • 覆蓋多難度等級的標(biāo)準(zhǔn)化實(shí)驗(yàn)任務(wù)基準(zhǔn);
  • 與 VLA 模型直接兼容的數(shù)據(jù)生成、訓(xùn)練與評測接口。

這一設(shè)計(jì)使 AutoBio 能夠在保持實(shí)驗(yàn)語義一致性的前提下,對不同模型進(jìn)行可復(fù)現(xiàn)、可對比的系統(tǒng)評估。

三.一個真正 “像實(shí)驗(yàn)室” 的仿真系統(tǒng)

為了讓機(jī)器人面對的環(huán)境盡可能接近真實(shí)實(shí)驗(yàn)室,AutoBio 在仿真層面進(jìn)行了多項(xiàng)針對性擴(kuò)展:

1. 實(shí)驗(yàn)儀器的數(shù)字化建模

為確保實(shí)驗(yàn)操作的真實(shí)性,AutoBio 引入了一套從真實(shí)儀器到仿真資產(chǎn)的系統(tǒng)化建模流程。通過多視角視頻采集與 3D Gaussian Splatting 重建,我們獲得高保真的幾何與外觀表示,并結(jié)合 CAD 建模與結(jié)構(gòu)標(biāo)注,生成可用于物理仿真的數(shù)字儀器模型。

該流程兼顧了視覺真實(shí)性與物理可交互性,避免了傳統(tǒng)手工建模在復(fù)雜結(jié)構(gòu)與真實(shí)比例上的偏差。



2. 實(shí)驗(yàn)室專用物理機(jī)制

標(biāo)準(zhǔn)物理引擎往往難以直接覆蓋實(shí)驗(yàn)室中常見的交互模式。為此,AutoBio 針對生物實(shí)驗(yàn)高頻操作擴(kuò)展了一系列物理機(jī)制,包括但不限于:

  • 基于螺紋結(jié)構(gòu)的旋擰與自鎖建模;
  • 具有離散阻尼特性的分檔旋鈕;
  • 偏心機(jī)構(gòu)驅(qū)動的周期性振蕩;
  • 面向液體樣本的準(zhǔn)靜態(tài)液面建模。

這些機(jī)制使仿真環(huán)境能夠更準(zhǔn)確地反映實(shí)驗(yàn)操作中的關(guān)鍵物理約束,從而避免模型在評測中依賴不現(xiàn)實(shí)的 “捷徑策略”。



3. 面向視覺模型的渲染與界面支持

考慮到 VLA 模型高度依賴視覺輸入,AutoBio 在渲染層面引入了基于物理的渲染(PBR)管線,以提升透明材料、液體以及儀器表面的視覺真實(shí)性。

同時(shí),系統(tǒng)支持儀器數(shù)字界面的動態(tài)渲染,使機(jī)器人能夠通過視覺信號讀取參數(shù)、識別狀態(tài)變化并執(zhí)行相應(yīng)操作。這一能力對于涉及人機(jī)界面的實(shí)驗(yàn)任務(wù)尤為關(guān)鍵。



四、AutoBio Benchmark:從實(shí)驗(yàn)流程到評測任務(wù)

基于上述仿真能力,AutoBio 構(gòu)建了一個包含 16 個任務(wù)的評測基準(zhǔn),覆蓋三個難度等級:

  • 簡單任務(wù):單步或低精度操作,如打開或關(guān)閉儀器蓋;
  • 中等任務(wù):需要一定精度和語言理解能力,如擰開離心管、樣本轉(zhuǎn)移;
  • 困難任務(wù):涉及多模態(tài)推理,如讀取屏幕參數(shù)并精確調(diào)節(jié)實(shí)驗(yàn)設(shè)備。



每個任務(wù)均支持自動化專家軌跡生成、隨機(jī)化初始條件以及統(tǒng)一的成功判定機(jī)制,使不同模型能夠在一致條件下進(jìn)行公平比較。

五、當(dāng)前模型的能力邊界

我們系統(tǒng)評測了多種主流開源 VLA 模型。實(shí)驗(yàn)結(jié)果如下圖:



  • 在簡單任務(wù)上,模型已表現(xiàn)出較高成功率;
  • 當(dāng)任務(wù)涉及高精度裝配、液體判斷或屏幕讀數(shù)時(shí),成功率顯著下降;
  • 失敗往往源于細(xì)節(jié)誤差的持續(xù)累積,而非對任務(wù)的完全誤解。

這一結(jié)果揭示出當(dāng)前模型在高精度操作、細(xì)粒度視覺推理以及長期實(shí)驗(yàn)流程建模方面仍存在顯著不足,也進(jìn)一步驗(yàn)證了 AutoBio 在刻畫真實(shí)科研場景挑戰(zhàn)方面的必要性。

六、總結(jié)

AutoBio 提供了一個面向生物實(shí)驗(yàn)室的統(tǒng)一仿真與評測框架,使研究者能夠系統(tǒng)性分析機(jī)器人在真實(shí)科研場景中的能力與局限。

我們的目標(biāo)并非給出最終解決方案,而是通過清晰的問題定義和可復(fù)現(xiàn)的評測體系,為通用機(jī)器人走向科研自動化提供一個堅(jiān)實(shí)的起點(diǎn)。

隨著模型架構(gòu)、訓(xùn)練范式與跨模態(tài)推理能力的持續(xù)發(fā)展,我們希望 AutoBio 能夠成為連接機(jī)器人學(xué)習(xí)與生命科學(xué)自動化的重要基礎(chǔ)設(shè)施。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
日本教室的鐘表,一天24小時(shí)?

日本教室的鐘表,一天24小時(shí)?

日本物語
2026-02-28 20:34:30
廣東“要大發(fā)”了,這3個地方被國家選中,即將騰飛!有你家鄉(xiāng)嗎

廣東“要大發(fā)”了,這3個地方被國家選中,即將騰飛!有你家鄉(xiāng)嗎

瓜哥的動物日記
2026-03-02 00:52:45
神宮寺奈緒的哭戲:一滴眼淚,如何將作品抬升到不屬于它的高度

神宮寺奈緒的哭戲:一滴眼淚,如何將作品抬升到不屬于它的高度

春天不是讀書天
2026-03-01 22:22:17
陳盈駿:我覺得蠻可惜的,大家為了這兩場比賽準(zhǔn)備得非常多

陳盈駿:我覺得蠻可惜的,大家為了這兩場比賽準(zhǔn)備得非常多

懂球帝
2026-03-01 19:12:04
黃金,是真正可以壓箱底的資產(chǎn),任何人都不用懷疑。

黃金,是真正可以壓箱底的資產(chǎn),任何人都不用懷疑。

流蘇晚晴
2026-02-23 12:17:47
當(dāng)“世界樞紐”按下暫停鍵,迪拜爆炸前后的24小時(shí)

當(dāng)“世界樞紐”按下暫停鍵,迪拜爆炸前后的24小時(shí)

城市進(jìn)化論
2026-03-01 23:51:12
中國選手周意、孫發(fā)京抵達(dá)阿聯(lián)酋參賽,該比賽目前已暫停

中國選手周意、孫發(fā)京抵達(dá)阿聯(lián)酋參賽,該比賽目前已暫停

懂球帝
2026-03-01 22:02:33
曼聯(lián)2-1逆轉(zhuǎn)十人水晶宮!11輪不敗升英超第3 B費(fèi)傳射 謝什科3連殺

曼聯(lián)2-1逆轉(zhuǎn)十人水晶宮!11輪不敗升英超第3 B費(fèi)傳射 謝什科3連殺

我愛英超
2026-03-02 00:01:06
1961年,周恩來看著節(jié)目單臉色大變,提起筆就把那個重頭戲給劃了

1961年,周恩來看著節(jié)目單臉色大變,提起筆就把那個重頭戲給劃了

鶴羽說個事
2026-03-01 18:39:56
汪小菲和張?zhí)m解除母子關(guān)系!馬筱梅在旁煽風(fēng)點(diǎn)火,大S的話沒說錯

汪小菲和張?zhí)m解除母子關(guān)系!馬筱梅在旁煽風(fēng)點(diǎn)火,大S的話沒說錯

山谷里的怒吼
2026-03-02 00:20:27
王石不裝了,頭套也不戴了,直接光頭,不敢喝酒,只喝茶!坐C位

王石不裝了,頭套也不戴了,直接光頭,不敢喝酒,只喝茶!坐C位

小娛樂悠悠
2026-02-28 10:51:54
外媒:美“福特”號航母離開希臘駛往以色列

外媒:美“福特”號航母離開希臘駛往以色列

參考消息
2026-02-27 10:29:04
3月3日元宵節(jié),牢記:1不留,2不洗,3不穿,4不空!馬年大吉

3月3日元宵節(jié),牢記:1不留,2不洗,3不穿,4不空!馬年大吉

阿龍美食記
2026-03-01 16:17:49
程序員高廣輝猝死后續(xù)!他早逝有原因,父親一直不贊成他的婚姻

程序員高廣輝猝死后續(xù)!他早逝有原因,父親一直不贊成他的婚姻

細(xì)品名人
2026-02-03 07:48:27
壓力太大!中國籃協(xié)主席在更衣室哭了 郭士強(qiáng)擁抱安慰 球員拍肩膀

壓力太大!中國籃協(xié)主席在更衣室哭了 郭士強(qiáng)擁抱安慰 球員拍肩膀

念洲
2026-03-02 07:37:47
國家安全部:NFC可能成為信息泄露乃至危害國家安全的渠道

國家安全部:NFC可能成為信息泄露乃至危害國家安全的渠道

上觀新聞
2026-02-02 07:09:04
油價(jià)暴漲!全國加油站3月2日最新95/92號汽油與0號柴油價(jià)格曝光

油價(jià)暴漲!全國加油站3月2日最新95/92號汽油與0號柴油價(jià)格曝光

藍(lán)色海邊
2026-03-02 10:49:26
伊朗稱襲擊致美軍傷亡560人

伊朗稱襲擊致美軍傷亡560人

財(cái)聯(lián)社
2026-03-02 00:54:12
哈登復(fù)出狂轟22+9+8,還創(chuàng)3大神跡,騎士險(xiǎn)勝籃網(wǎng)!虎將驚艷

哈登復(fù)出狂轟22+9+8,還創(chuàng)3大神跡,騎士險(xiǎn)勝籃網(wǎng)!虎將驚艷

一將籃球
2026-03-02 11:50:04
迻譯 | 哈梅內(nèi)伊人生最后的外訪:一個伊朗高官的平壤回憶

迻譯 | 哈梅內(nèi)伊人生最后的外訪:一個伊朗高官的平壤回憶

雜鈔與拾零
2026-03-01 20:26:34
2026-03-02 13:07:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12385文章數(shù) 142574關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個深刻教訓(xùn)

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個深刻教訓(xùn)

體育要聞

卡里克主場5連勝!隊(duì)史第2人通過最大考驗(yàn)

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財(cái)經(jīng)要聞

中東局勢影響如何?十大券商策略來了

汽車要聞

預(yù)售11.28萬起 狐全新阿爾法S5標(biāo)配寧德時(shí)代

態(tài)度原創(chuàng)

手機(jī)
藝術(shù)
數(shù)碼
本地
公開課

手機(jī)要聞

安卓小平板性能王!全新聯(lián)想拯救者Y700官宣搭載驍龍8E5 跑分破453萬

藝術(shù)要聞

2025北京青年美術(shù)作品展 | 油畫作品選刊

數(shù)碼要聞

軍規(guī)可靠:聯(lián)想發(fā)布ThinkTab X11強(qiáng)固型Android平板電腦

本地新聞

津南好·四時(shí)總相宜

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版