国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

初探空間智能尺度效應:商湯開源SenseNova-SI-1.3,八大空間智能榜單綜合評分登頂

0
分享至


商湯科技正式開源空間智能模型日日新SenseNova-SI-1.3,在空間測量、視角轉(zhuǎn)換、綜合推理等核心任務中展現(xiàn)出顯著提升,另外對比之前的版本增強了回答簡答題的能力。在集成多項權(quán)威空間智能榜單的綜合評測平臺EASI上,SenseNova-SI-1.3綜合性能超越Gemini-3-Pro,均分斬獲EASI-8(八個權(quán)威空間智能榜單的混合評測)標準第一,在多個高難度空間任務(尤其是視角轉(zhuǎn)換)中表現(xiàn)優(yōu)異。


刁鉆考題驗證:SenseNova-SI-1.3精準突破空間智能核心難點

EASI-8包含一系列專門考察空間理解能力的高難度測試題,讓Gemini-3-Pro等模型都頻頻踩坑。那么SenseNova-SI-1.3表現(xiàn)如何呢?(下列問題在測試模型時使用的原題為英文,為便于讀者理解翻譯為中文)。


題目要求統(tǒng)計兩張照片中建筑模型的總數(shù)量,核心難點是理解兩張圖的對應關(guān)系,以此避免遮擋漏數(shù)和重復多數(shù)。圖2視角下顯現(xiàn)出圖 1 中被遮擋的深灰色建筑,且部分模型在兩圖中重復出現(xiàn)。Gemini-3-Pro未完全去重,誤數(shù)為 6 個;SenseNova-SI-1.3則給出 “4 個”的準確答案。


題目給出兩張書房局部照片,已知 iMac 位于房間北部,詢問學生寫作業(yè)區(qū)域的方位。需先理解兩張圖片屬于同一空間,再通過視覺線索拼接場景。Gemini-3-Pro誤判學習區(qū)在西側(cè);SenseNova-SI-1.3精準定位 “西北角”,完全符合空間邏輯。


題目要求以 “未戴眼鏡男士的自身視角” 判斷身旁戴眼鏡男士的方位,考察 “參照系轉(zhuǎn)換” 能力,模型很容易以“觀察者視角”來判斷方向。Gemini-3-Pro就誤選了 “右邊”;SenseNova-SI-1.3則能正確給出 “左邊” 的正確答案。


題目給出粉色瓶子前、后、左、右 4 張照片,詢問圖 4 角度下瓶子左邊物體。這道題需整合多視角線索重構(gòu)房間全局布局,再切換至目標視角判斷方位 —— 第 4 張照片中瓶子左側(cè)完全處于視覺盲區(qū),僅能通過前 3 張圖中的窗戶、床、衣柜等線索還原空間關(guān)系。Gemini-3-Pro誤選 “窗戶和藍色窗簾”,SenseNova-SI-1.3精準鎖定正確答案 “衣柜和門”。


以雙層巴士與公交站的場景為題,需避免陷入“英國巴士靠左行駛,因此靠站的是左側(cè)”的常識陷阱,而是通過實際的視覺畫面判斷方位。Gemini-3-Pro誤判 “左側(cè)” 為答案;而 SenseNova-SI-1.3 則準確理解 “右側(cè)” 為正確答案。

空間智能是極其獨特的多模態(tài)能力


Core Knowledge Deficits in Multi-Modal Language Models (2025)發(fā)現(xiàn)視角轉(zhuǎn)換任務與其它多模態(tài)任務的相關(guān)性(紅框內(nèi))呈藍色,即代表相關(guān)性較低

一篇2025年發(fā)表于機器學習頂會ICML的論文《Core Knowledge Deficits in Multi-Modal Language Models》揭示了一個有趣的發(fā)現(xiàn):視角轉(zhuǎn)換(Perspective)和所有傳統(tǒng)多模態(tài)模型的能力的相關(guān)性均異常得低,這代表主流算法路徑可能不是空間智能的形成的有效路徑,這也解釋了為什么領(lǐng)先的多模態(tài)大模型在空間智能相關(guān)的任務上表現(xiàn)不佳。


Core Knowledge Deficits in Multi-Modal Language Models (2025)發(fā)現(xiàn)增大模型尺寸對提升視角轉(zhuǎn)換任務效果不佳

這篇論文也發(fā)現(xiàn),空間智能似乎存在反尺度效應的現(xiàn)象:更大的模型并不能更好地解決空間智能任務。另外,在EASI的官方報告中也可以找到相似的描述,指出視角轉(zhuǎn)換任務(Perspective-taking)依然是最具挑戰(zhàn)的基礎(chǔ)能力之一。

空間智能需要全新的學習范式。

從3D世界數(shù)據(jù)匱乏到空間智能的尺度效應


空間智能的核心——視角轉(zhuǎn)換任務被拆解成了三個關(guān)鍵步驟:建立跨視角關(guān)聯(lián)、理解視角移動、想象視角變換,并圍繞著解決這三個基礎(chǔ)能力構(gòu)造大量訓練數(shù)據(jù)

學術(shù)界現(xiàn)有數(shù)據(jù)集多著重于目標識別與場景理解,模型往往停留在圖像模式匹配階段,難以形成穩(wěn)定的空間理解能力。基于這一洞察,想要解決空間智能尤其是視角轉(zhuǎn)換任務,簡單擴充相關(guān)數(shù)據(jù)規(guī)模是不夠的。為了解決這一根本問題,我們將視角轉(zhuǎn)換看作從二維視覺信息邁向三維空間關(guān)系理解的關(guān)鍵橋梁,并將其拆解為遞進的能力階段,由易到難、難度遞增的三個任務層級(建立跨視角關(guān)聯(lián)、理解視角移動、想象視角變換),并構(gòu)造大量且層次分明的訓練數(shù)據(jù),使模型建立完備的空間理解能力。

同時,在數(shù)據(jù)規(guī)模持續(xù)擴大的過程中,SenseNova-SI團隊挖掘并重組多視角學術(shù)數(shù)據(jù)資源,將許多過去未被充分利用的標注轉(zhuǎn)化為視角轉(zhuǎn)換訓練數(shù)據(jù)。例如,多目關(guān)聯(lián)數(shù)據(jù)集 MessyTable提供了高物體復雜度場景,其中跨視角物體一致性信息與精確的相機位姿標注,可用于訓練物體對應與相機運動推理能力;而部分室內(nèi)場景掃描數(shù)據(jù)如CA-1M中包含物體自身朝向標注的樣本,則被用于補充模型進行視角轉(zhuǎn)換與想象所需的稀缺數(shù)據(jù)。這種跨數(shù)據(jù)源的重組與再利用,使積累大量豐富而系統(tǒng)的空間理解數(shù)據(jù)成為可能。


空間智能的尺度效應:SenseNova-SI在視角轉(zhuǎn)換任務上超越GPT-5

大規(guī)模高質(zhì)量的空間智能數(shù)據(jù)在SenseNova-SI團隊的手中最終驗證了空間智能的尺度效應:SenseNova-SI的8B參數(shù)基模型最終超越了強閉源模型如GPT-5,而2B參數(shù)的小模型也表現(xiàn)不俗,在相同數(shù)據(jù)規(guī)模下,甚至超越了紐約大學的Cambrian-S和字節(jié)的VST兩個7B參數(shù)的模型。


只在Ego-Exo4D上訓練第一/第三人稱視角匹配的模型可以大幅提升(+90.4%)在MMSI的2D迷宮導航問題上的表現(xiàn)

更有趣的是,團隊在研究中似乎發(fā)現(xiàn)了一些智能涌現(xiàn)的先兆:一些看起來毫無關(guān)聯(lián)的但也許細想之下有底層能力聯(lián)系的任務可以協(xié)同發(fā)展。另外,團隊也發(fā)現(xiàn)在視角轉(zhuǎn)換任務上訓練的模型也可以增強如心智重建(Mental Reconstruction)、綜合空間推理(Comprehensive Reasoning)等能力。

商湯引領(lǐng)空間智能普惠生態(tài)

SenseNova-SI-1.3模型的升級發(fā)布背后,是商湯科技始終致力于打破技術(shù)壁壘,讓頂尖空間智能技術(shù)惠及更多開發(fā)者與企業(yè)。對科研人員而言,SenseNova-SI-1.3通過在空間智能上驗證數(shù)據(jù)尺度效應提供了一個與現(xiàn)有基座模型完全兼容,但又長于空間智能的強力預訓練模型和基線(SenseNova-SI已被VSI-Bench, MMSI-Bench等權(quán)威榜單官方收錄),可以直接在其之上設計創(chuàng)新算法或者續(xù)訓,推動空間智能向人類水平邁進;對企業(yè)來說,可直接基于 SenseNova-SI-1.3快速落地應用,縮短研發(fā)周期、降低技術(shù)門檻;對普通用戶而言,未來將有更多搭載先進空間智能的產(chǎn)品走進生活 —— 從智能家電到自動駕駛,從工業(yè)機器人到教育設備,都將更懂 “空間邏輯”、更貼合實際需求。


SenseNova-SI在具身任務上的探索了空間智能的重要性開源地址

SenseNova-SI模型家族:https://huggingface.co/collections/sensenova/sensenova-si

SenseNova-SI開源代碼:https://github.com/OpenSenseNova/SenseNova-SI

Discord 社區(qū)邀請碼:https://discord.gg/WBzH62bk

SenseNova-SI入群碼:

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
沖上熱搜!中秋請3天假堪比春節(jié),13天超長假期!最實用拼假攻略已備好

沖上熱搜!中秋請3天假堪比春節(jié),13天超長假期!最實用拼假攻略已備好

上觀新聞
2026-02-25 14:08:57
韓“蛇蝎美人”在汽車旅館誘殺男子致2死1傷,首個受害者系男友,曾詢問AI如何殺人;案發(fā)后漲粉50倍,評論區(qū)被“顏值即正義”刷屏

韓“蛇蝎美人”在汽車旅館誘殺男子致2死1傷,首個受害者系男友,曾詢問AI如何殺人;案發(fā)后漲粉50倍,評論區(qū)被“顏值即正義”刷屏

大風新聞
2026-02-25 16:49:05
聞泰科技稱正積極處置安世控制權(quán)事件,中國區(qū)業(yè)務較為穩(wěn)健

聞泰科技稱正積極處置安世控制權(quán)事件,中國區(qū)業(yè)務較為穩(wěn)健

21世紀經(jīng)濟報道
2026-02-25 20:18:11
宇樹機器人去年只賣了5500多臺,普通家庭基本沒有買的

宇樹機器人去年只賣了5500多臺,普通家庭基本沒有買的

爆角追蹤
2026-02-25 10:08:50
含淚告別賽場!43歲了,已經(jīng)是個傳奇!

含淚告別賽場!43歲了,已經(jīng)是個傳奇!

德譯洋洋
2026-02-25 12:20:33
微信出新功能,網(wǎng)友:簡直是社恐福音

微信出新功能,網(wǎng)友:簡直是社恐福音

南方都市報
2026-02-25 16:59:07
秦皇島發(fā)生當街殺人惡性事件,疑因情感糾紛,撞停車輛后鈍器錘頭

秦皇島發(fā)生當街殺人惡性事件,疑因情感糾紛,撞停車輛后鈍器錘頭

爆角追蹤
2026-02-25 19:24:37
吵架將孩子扔河里后續(xù):原因曝光,夫妻身份被扒,娃狀態(tài)讓人擔憂

吵架將孩子扔河里后續(xù):原因曝光,夫妻身份被扒,娃狀態(tài)讓人擔憂

社會日日鮮
2026-02-24 09:37:52
紫牛頭條 | 全家出游老人服務區(qū)內(nèi)被狗撲咬骨折,犬主付千元后駕車離開,警方已立案

紫牛頭條 | 全家出游老人服務區(qū)內(nèi)被狗撲咬骨折,犬主付千元后駕車離開,警方已立案

揚子晚報
2026-02-24 23:56:16
黃曉明戀情曝光!與美女穿情侶裝并同游,女方年齡被扒疑似小22歲

黃曉明戀情曝光!與美女穿情侶裝并同游,女方年齡被扒疑似小22歲

萌神木木
2026-02-25 16:55:16
近百萬元存款被悄悄轉(zhuǎn)走!上海獨居老太毫無察覺,還說“我有兩套房,你可以搬來同住”

近百萬元存款被悄悄轉(zhuǎn)走!上海獨居老太毫無察覺,還說“我有兩套房,你可以搬來同住”

瀟湘晨報
2026-02-25 16:39:13
全網(wǎng)好奇,谷愛凌嘴里咬的東西是啥?

全網(wǎng)好奇,谷愛凌嘴里咬的東西是啥?

有意思報告
2026-02-25 12:25:30
同家族近20人在路上祭祖遇車禍,致2死多傷后又遇理賠難,多方回應

同家族近20人在路上祭祖遇車禍,致2死多傷后又遇理賠難,多方回應

大風新聞
2026-02-25 17:00:14
特朗普對華態(tài)度 180 度轉(zhuǎn)變,美媒:想贏中國只有一條路可選

特朗普對華態(tài)度 180 度轉(zhuǎn)變,美媒:想贏中國只有一條路可選

議紀史
2026-02-24 18:45:06
貝加爾湖事故中溺亡的7名國人,很大可能連賠償都拿不到

貝加爾湖事故中溺亡的7名國人,很大可能連賠償都拿不到

律法刑道
2026-02-25 12:16:48
巴拿馬總統(tǒng)慌了,他猛然發(fā)現(xiàn):強吞中國18億資產(chǎn),竟是自尋死路

巴拿馬總統(tǒng)慌了,他猛然發(fā)現(xiàn):強吞中國18億資產(chǎn),竟是自尋死路

東極妙嚴
2026-02-25 16:40:08
2450元降至118元!春節(jié)假期過后,有潮汕酒店價格大降95%

2450元降至118元!春節(jié)假期過后,有潮汕酒店價格大降95%

第一財經(jīng)資訊
2026-02-24 20:41:17
全國統(tǒng)一執(zhí)行!3月1日起,公職人員戴上緊箍咒,老百姓迎來大便利

全國統(tǒng)一執(zhí)行!3月1日起,公職人員戴上緊箍咒,老百姓迎來大便利

墨蘭史書
2026-02-24 22:41:18
男子花5600元套中汽車:老板當場翻臉,要30萬押金,被扒底朝天

男子花5600元套中汽車:老板當場翻臉,要30萬押金,被扒底朝天

奇思妙想草葉君
2026-02-24 20:42:14
中到大雨局部暴雨!廣東天氣即將“大變臉”

中到大雨局部暴雨!廣東天氣即將“大變臉”

深圳晚報
2026-02-25 08:12:15
2026-02-25 20:59:00
獵云網(wǎng)
獵云網(wǎng)
聚焦科技創(chuàng)業(yè)創(chuàng)新,鉆研產(chǎn)業(yè)趨勢,用心服務創(chuàng)業(yè)者。
58534文章數(shù) 327117關(guān)注度
往期回顧 全部

科技要聞

“機器人只跳舞,沒什么用”

頭條要聞

近百萬元存款被送快遞小伙悄悄轉(zhuǎn)走 獨居老太毫無察覺

頭條要聞

近百萬元存款被送快遞小伙悄悄轉(zhuǎn)走 獨居老太毫無察覺

體育要聞

曝雄鹿計劃今夏追小卡 字母哥渴望與其并肩作戰(zhàn)

娛樂要聞

黃曉明新戀情!與小22歲美女同游新加坡

財經(jīng)要聞

上海樓市放大招,地產(chǎn)預期別太大

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

本地
數(shù)碼
時尚
游戲
公開課

本地新聞

津南好·四時總相宜

數(shù)碼要聞

全能移動創(chuàng)作工作站,華碩ProArt 創(chuàng)13 GoPro聯(lián)名版 今日開售

“復古甜心”穿搭突然大火!春天穿時髦又減齡

這才是游戲頂流?雷軍給《鵝鴨殺》角色發(fā)紅包

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版