国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

李飛飛&李曼玲「具身智能」新作:AI的具身認知遠不及人類,連GPT-5都不行!

0
分享至


來源:學術頭條

李飛飛&李曼玲團隊又出「具身智能」新作——基準測試 ENACT,旨在解決視覺-語言模型(VLM)具身認知涌現程度難以量化的問題。


據論文描述,通過將具身認知評估轉化為視覺問答(VQA)形式的自我中心交互世界建模任務,ENACT 揭示了 GPT-5、GLM-4.5V 等前沿模型與人類之間的能力差距,且差距隨交互時長增加而擴大。


李曼玲現為美國西北大學計算機科學系助理教授,其在斯坦福大學任博士后研究員的導師為李飛飛和吳佳?。ㄋ固垢4髮W助理教授)。

1.研究背景


具身認知理論強調,智能來源于與世界的交互,而不是從被動觀察中獲得。當前 VLM 主要以“去具身化”的方式訓練,但它們已經展現出一定的智能潛力,那該如何評估這些模型在多大程度上呈現出具身認知呢?


2.研究方法

ENACT 把世界建模構建在部分可觀測馬爾可夫決策過程(POMDP)之上,將任務形式化為在智能體執(zhí)行動作的條件下,自我中心視覺序列如何隨時間演化,即:讓模型專注理解在自己的作用下第一人稱視覺中的世界會如何變化。


ENACT 聚焦兩個任務:

1?? 正向世界建模:給定動作,對被打亂的觀察序列進行重新排序。
2?? 逆向世界建模:給定觀察,對被打亂的動作序列進行重新排序。

這些任務體量不大,但想答對需要模型具備具身認知的核心能力,包括識別環(huán)境可供性、理解動作與結果的因果關系等。在部分可觀測環(huán)境中,也考驗模型的互動推理和長時記憶。


3.實驗結果

研究人員用任務準確率(序列完全正確)與對偶準確率(相鄰對是否正確)對模型的表現進行評估。



結果表明,ENACT 對當前 VLM 非常有挑戰(zhàn)性,模型表現遠落后于人類( )。

此外,當前 VLM 在逆向任務上的表現始終優(yōu)于正向任務,并呈現出“類人偏見”,例如偏好右手動作、在攝像機內參或視角偏離人類視覺時性能下降。


研究人員指出,ENACT 提供了可擴展且具有洞察力的工具,為實現更真實具身性的人工智能指明方向。

但實驗仍存在一些局限性,如任務設計不全面;評估成本高,消融實驗只覆蓋部分模型和數據等。

閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”

https://wx.zsxq.com/group/454854145828


未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯(lián)網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
豐田汽車重大轉折!

豐田汽車重大轉折!

電動知家
2025-12-26 14:44:13
長春某雷燒烤后續(xù):門頭不見了,老板娘車里痛哭,后悔求原諒

長春某雷燒烤后續(xù):門頭不見了,老板娘車里痛哭,后悔求原諒

觀察鑒娛
2025-12-27 09:36:09
殲-36:當我消失在雷達里,世界才開始害怕,5.2馬赫的沉默

殲-36:當我消失在雷達里,世界才開始害怕,5.2馬赫的沉默

正直小墨
2025-12-26 21:51:07
“AA取消,我沒錢治病,趕緊賣陪嫁房”兒媳:滾!我和你兒離婚了

“AA取消,我沒錢治病,趕緊賣陪嫁房”兒媳:滾!我和你兒離婚了

清水家庭故事
2025-12-26 16:38:51
年僅27歲!冬青奧冠軍英年早逝,曾因疫苗引發(fā)心肌炎休戰(zhàn)2年

年僅27歲!冬青奧冠軍英年早逝,曾因疫苗引發(fā)心肌炎休戰(zhàn)2年

全景體育V
2025-12-26 21:19:23
佩林卡與詹姆斯的博弈正式拉開帷幕!賽季中達成交易已成定局

佩林卡與詹姆斯的博弈正式拉開帷幕!賽季中達成交易已成定局

籃球看比賽
2025-12-27 12:04:49
高盛:中國房地產市場現狀

高盛:中國房地產市場現狀

譚談投研
2025-12-24 18:58:11
多國損失高達百億,聯(lián)合要求中國廢除禁令,溫鐵軍:輪不到你發(fā)言

多國損失高達百億,聯(lián)合要求中國廢除禁令,溫鐵軍:輪不到你發(fā)言

趣文說娛
2025-12-27 13:46:33
萊萬:巴薩曾要求我不要再進球,以避免支付給拜仁額外的獎金!

萊萬:巴薩曾要求我不要再進球,以避免支付給拜仁額外的獎金!

籃球看比賽
2025-12-27 12:20:08
尿是黃色!金子也是黃色!德國男子為了提煉黃金,煮了五千升尿液

尿是黃色!金子也是黃色!德國男子為了提煉黃金,煮了五千升尿液

扶蘇聊歷史
2025-12-25 16:18:51
李詠妻子哈文在美國過圣誕!吃全聚德烤鴨,調侃自己過成了中國年

李詠妻子哈文在美國過圣誕!吃全聚德烤鴨,調侃自己過成了中國年

娛樂圈圈圓
2025-12-27 10:37:31
舍甫琴科炮轟前老板阿布:他賣切爾西的錢得給烏克蘭 我跟他不熟

舍甫琴科炮轟前老板阿布:他賣切爾西的錢得給烏克蘭 我跟他不熟

風過鄉(xiāng)
2025-12-27 16:51:49
突然關停,人去樓空!上海家長崩潰:幾萬元要不回,還要請假帶娃

突然關停,人去樓空!上海家長崩潰:幾萬元要不回,還要請假帶娃

新民晚報
2025-12-27 15:09:34
擺爛!曼聯(lián)24歲懶王獻戰(zhàn)犯表演:7數據掛零 場上蠕動+跑都不想跑

擺爛!曼聯(lián)24歲懶王獻戰(zhàn)犯表演:7數據掛零 場上蠕動+跑都不想跑

風過鄉(xiāng)
2025-12-27 06:44:54
德云社高層大洗牌!1人上桌,1人換桌,1人下桌,王惠位列其中

德云社高層大洗牌!1人上桌,1人換桌,1人下桌,王惠位列其中

小小李娛
2025-12-26 19:40:39
注意!慢病卡26年將停用,報銷迎巨變,這幾點沒弄好影響看病拿錢

注意!慢病卡26年將停用,報銷迎巨變,這幾點沒弄好影響看病拿錢

行者聊官
2025-12-27 09:06:18
佛山禪城南海“換帥”,均由區(qū)長接任區(qū)委書記

佛山禪城南?!皳Q帥”,均由區(qū)長接任區(qū)委書記

21世紀經濟報道
2025-12-27 16:44:05
指導老師回應“溫醫(yī)大本科生連發(fā)40多篇SCI論文”:他能力的確很突出,目前的輿論對學生不公平

指導老師回應“溫醫(yī)大本科生連發(fā)40多篇SCI論文”:他能力的確很突出,目前的輿論對學生不公平

大象新聞
2025-12-27 10:45:03
馬琳擔任總教練,肖戰(zhàn)是副總教,孫遜是男隊教練,女隊教練有懸念

馬琳擔任總教練,肖戰(zhàn)是副總教,孫遜是男隊教練,女隊教練有懸念

子水體娛
2025-12-26 23:48:13
打虎!郭學益被查

打虎!郭學益被查

觀察者網
2025-12-27 11:20:07
2025-12-27 18:24:49
人工智能學家 incentive-icons
人工智能學家
人工智能領域權威媒體
4423文章數 37357關注度
往期回顧 全部

科技要聞

小米也漲價了!業(yè)界稱終端再不漲明年必虧

頭條要聞

男子戒毒后隨領導出差被警察帶走驗尿 回家后工作沒了

頭條要聞

男子戒毒后隨領導出差被警察帶走驗尿 回家后工作沒了

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

張昊唯逃稅涉黃風波落幕:法院認定朋友造謠

財經要聞

注意,開始拉物價了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

旅游
藝術
家居
公開課
軍事航空

旅游要聞

云南維西:高山峽谷間現云海晨景

藝術要聞

砸50億!廣東驚現“全球最大爛尾醫(yī)院”,連窗框都沒裝完

家居要聞

格調時尚 智慧品質居所

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

英法德三國領導人通話 重申對烏支持

無障礙瀏覽 進入關懷版