国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

國產(chǎn)開源模型卷贏Gemini 3 Pro、GPT-5.2,最強(qiáng)多模態(tài)推理大模型易主?

0
分享至


智東西
作者 程茜
編輯 云鵬

智東西1月30日?qǐng)?bào)道,1月29日,商湯正式開源多模態(tài)自主推理模型SenseNova-MARS-8B和SenseNova-MARS-32B。該系列模型在多模態(tài)搜索與推理的核心基準(zhǔn)測(cè)試中性能超越Gemini 3 Pro、GPT-5.2。

商湯指出,SenseNova-MARS是首個(gè)支持動(dòng)態(tài)視覺推理和圖文搜索深度融合的Agentic VLM模型。

該框架能夠在多輪推理過程中主動(dòng)運(yùn)用圖像搜索、文本搜索和圖像裁剪工具,如通過放大、裁剪圖片尋找細(xì)節(jié),然后調(diào)用文本、圖片搜索工具查詢背景信息,且這一過程無需人工干預(yù)。

在MMSearch、HR-MMSearch、FVQA、InfoSeek、SimpleVQA、LiveVQA等基準(zhǔn)測(cè)試中,SenseNova-MARS取得開源模型中的SOTA成績。


商湯日日新SenseNova-MARS模型、代碼、數(shù)據(jù)集全開源。


GitHub地址:

https://github.com/OpenSenseNova/SenseNova-MARS

一、自動(dòng)放大圖片看細(xì)節(jié),調(diào)用外部工具進(jìn)行文字、圖片搜索

盡管視覺語言模型(VLM)能夠通過智能推理解決復(fù)雜任務(wù),但其主要局限于面向文本的思維鏈或孤立的工具調(diào)用。尤其是在需要協(xié)調(diào)外部工具(例如搜索和圖像裁剪)的知識(shí)密集型和視覺復(fù)雜場(chǎng)景中,它們無法展現(xiàn)出人類所需的熟練程度,無法將動(dòng)態(tài)工具操作與連續(xù)推理無縫銜接。

基于此,商湯研究團(tuán)隊(duì)推出了SenseNova-MARS。SenseNova-MARS能在生活和工作的場(chǎng)景,解決需要“多步驟推理+多工具協(xié)作”的問題,如可以通過裁剪放大圖片的細(xì)節(jié)、進(jìn)行圖像搜索、進(jìn)行文本搜索。

下方模型需要完成識(shí)別賽車服微小Logo、查詢公司成立年份、匹配車手出生年月、計(jì)算差值的復(fù)雜任務(wù),SenseNova-MARS可自主調(diào)用圖像裁剪、文本/圖像搜索工具,無需人工干預(yù)完成解答。


其還能從產(chǎn)品和行業(yè)峰會(huì)的照片中,如根據(jù)下面的汽車圖片識(shí)別出汽車品牌的標(biāo)志、確認(rèn)車型,然后結(jié)合文本和圖像搜索給出答案。


SenseNova-MARS能從賽事照片中識(shí)別畫面中的Logo、人物等信息,追溯比賽或人員背景信息,快速補(bǔ)充重要細(xì)節(jié)。


該模型還能處理超長步驟的多模態(tài)推理,和超過三種工具調(diào)用,自動(dòng)裁剪分析細(xì)節(jié)、搜索相關(guān)研究數(shù)據(jù),快速驗(yàn)證假設(shè),得出關(guān)鍵判斷。例如根據(jù)下方圖片,其能快速抓取精準(zhǔn)信息,包括公司成立年份、人物出生年月等。


二、搜索能力超Gemini-3-Pro、GPT-5.2,跨任務(wù)調(diào)用工具強(qiáng)過Qwen3-VL-8B

為了全面評(píng)估智能視覺學(xué)習(xí)模型(VLM)在復(fù)雜視覺任務(wù)上的性能,研究團(tuán)隊(duì)引入了HR-MMSearch基準(zhǔn)測(cè)試。

作為評(píng)估VLM智能體細(xì)粒度感知和搜索推理能力的基準(zhǔn)測(cè)試。該數(shù)據(jù)集包含305張4K分辨率的圖像,這些圖像來自8個(gè)不同的、具有高影響力的領(lǐng)域,涵蓋體育、休閑文化以及科學(xué)技術(shù)等。


▲HR-MMSearch測(cè)試集的數(shù)據(jù)包含情況

實(shí)驗(yàn)表明,SenseNova-MARS在開源搜索和細(xì)粒度圖像理解基準(zhǔn)測(cè)試中均表現(xiàn)較優(yōu)。在面向搜索的基準(zhǔn)測(cè)試中,SenseNova-MARS-32B在MMSearch和HR-MMSearch上的得分分別為74.3和54.4,超越了Gemini-3-Pro和GPT-5.2等專有模型。

在知識(shí)密集型MMSearch基準(zhǔn)測(cè)試中,SenseNova-MARS主要依賴圖像和文本搜索工具來獲取外部信息,對(duì)基于裁剪的感知依賴性極低。相比之下,在既需要高分辨率感知,也需要復(fù)雜的推理的HR-MMSearch測(cè)試中,SenseNova-MARS展現(xiàn)出更為均衡的工具使用,表明其能夠有效地整合局部視覺線索和外部知識(shí)。

與Qwen3-VL-8B相比,SenseNova-MARS-8B通過動(dòng)態(tài)地為每種任務(wù)場(chǎng)景選擇最有效的工具,展現(xiàn)出更強(qiáng)的跨任務(wù)適應(yīng)性。


▲SenseNova-MARS-8B的自適應(yīng)工具使用行為

SenseNova-MARS-32B在六項(xiàng)基準(zhǔn)測(cè)試中與其他模型的整體性能對(duì)比顯示,MMSearch、HR-MMSearch和FVQA等搜索導(dǎo)向型基準(zhǔn)測(cè)試中,該模型超越了Gemini-3-Pro和GPT-5.2等專有模型。


面向視覺理解,在V Bench和HR-Bench等高分辨率感知基準(zhǔn)測(cè)試中,SenseNova-MARS-32B性能優(yōu)于Qwen3-VL-235B-A22B等模型。


三、系統(tǒng)框架+強(qiáng)化學(xué)習(xí),采用雙階段流水線并行訓(xùn)練策略

SenseNova-MARS基于Qwen2.5-VL-7B-Instruct,采用兩階段流水線進(jìn)行訓(xùn)練,先進(jìn)行系統(tǒng)框架訓(xùn)練(SFT),再進(jìn)行強(qiáng)化學(xué)習(xí)(RL)訓(xùn)練。

第一階段,其針對(duì)跨模態(tài)搜索推理訓(xùn)練數(shù)據(jù)稀缺的痛點(diǎn),的提出了基于多模智能體的自動(dòng)化數(shù)據(jù)合成引擎,采用細(xì)粒度視覺錨點(diǎn)與多跳深度關(guān)聯(lián)檢索的機(jī)制,動(dòng)態(tài)挖掘并關(guān)聯(lián)跨網(wǎng)頁實(shí)體的邏輯,自動(dòng)化構(gòu)建高復(fù)雜度的多跳推理鏈路,同時(shí)引入閉環(huán)自洽性校驗(yàn)來去除幻覺數(shù)據(jù),構(gòu)造出具備嚴(yán)密邏輯鏈條與高知識(shí)密度的多跳搜索問答數(shù)據(jù)。

其篩選的高難度案例中,每個(gè)案例都標(biāo)注了“該用什么工具、步驟是什么”,讓AI先學(xué)會(huì)基本的解題邏輯,確保AI一開始就接觸真實(shí)復(fù)雜場(chǎng)景。

第二階段訓(xùn)練采用強(qiáng)化學(xué)習(xí),AI每做對(duì)一次決策,比如選對(duì)工具、步驟合理就會(huì)獲得獎(jiǎng)勵(lì),做錯(cuò)了就調(diào)整策略。

此外,為了避免AI“學(xué)偏”,研究團(tuán)隊(duì)還引入了BN-GSPO算法,讓模型在處理簡單題和復(fù)雜題時(shí)都能保持穩(wěn)定進(jìn)步,不會(huì)出現(xiàn)“偏科”。


這種基于雙階段歸一化的機(jī)制可以平滑動(dòng)態(tài)工具調(diào)用返回分布多樣性帶來的優(yōu)化波動(dòng)并確保學(xué)習(xí)信號(hào)分布的一致性,從而解決跨模態(tài)多步多工具智能體訓(xùn)練過程中的收斂性難題。

經(jīng)過這樣的訓(xùn)練,AI不僅學(xué)會(huì)了用工具,還能知道在什么情況下應(yīng)該使用哪些工具,以及如何將不同工具的結(jié)果有機(jī)結(jié)合起來。

結(jié)語:多模態(tài)AI能自主解題,或加速產(chǎn)業(yè)端AI應(yīng)用

商湯提出了新型的多模態(tài)智能推理與搜索模型,該模型能夠在多輪推理過程中主動(dòng)運(yùn)用圖像搜索、文本搜索和圖像裁剪工具,提升了AI從被動(dòng)響應(yīng)指令到主動(dòng)規(guī)劃步驟、調(diào)用工具解決復(fù)雜問題的能力。

聚焦到真實(shí)的業(yè)務(wù)場(chǎng)景,在工業(yè)質(zhì)檢、金融風(fēng)控、傳媒內(nèi)容分析、賽事數(shù)據(jù)挖掘、科研輔助等領(lǐng)域,模型此前受限于看不清細(xì)節(jié)、不會(huì)查背景、無法處理復(fù)雜多步驟任務(wù)的落地痛點(diǎn)。SenseNova-MARS無需人工干預(yù)的閉環(huán)解題能力,或大幅提升產(chǎn)業(yè)端的AI應(yīng)用效率。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美媒:特朗普對(duì)不能“一擊致命”解決伊朗問題很失望

美媒:特朗普對(duì)不能“一擊致命”解決伊朗問題很失望

參考消息
2026-02-24 22:48:04
比電子布還猛!光纖價(jià)格飆漲80%   這7大寡頭迎戴維斯雙擊

比電子布還猛!光纖價(jià)格飆漲80% 這7大寡頭迎戴維斯雙擊

元芳說投資
2026-02-26 06:00:08
山東省泰安市政協(xié)原副主席倪慶賓被“雙開”

山東省泰安市政協(xié)原副主席倪慶賓被“雙開”

界面新聞
2026-02-25 10:34:47
華南五虎全軍覆沒!從叱咤風(fēng)云到集體沉淪,一場(chǎng)跨越二十年的地產(chǎn)大敗局

華南五虎全軍覆沒!從叱咤風(fēng)云到集體沉淪,一場(chǎng)跨越二十年的地產(chǎn)大敗局

阿離家居
2026-02-24 15:32:27
一場(chǎng)2-2,讓歐洲豪門驚險(xiǎn)晉級(jí),恩里克創(chuàng)歷史,目標(biāo)直指歐冠冠軍

一場(chǎng)2-2,讓歐洲豪門驚險(xiǎn)晉級(jí),恩里克創(chuàng)歷史,目標(biāo)直指歐冠冠軍

足球狗說
2026-02-26 06:14:37
三星S26系列發(fā)布 搭載全球首款硬件級(jí)防窺屏 6999元起

三星S26系列發(fā)布 搭載全球首款硬件級(jí)防窺屏 6999元起

CNMO科技
2026-02-26 03:14:05
23歲女港警在警署內(nèi)身亡,懷疑系開槍自殺

23歲女港警在警署內(nèi)身亡,懷疑系開槍自殺

南方都市報(bào)
2026-02-25 11:22:39
深夜,美股科技巨頭全線飄紅,油價(jià)直線跳水,比特幣飆升5%,美政府被曝正醞釀?wù)魇招玛P(guān)稅

深夜,美股科技巨頭全線飄紅,油價(jià)直線跳水,比特幣飆升5%,美政府被曝正醞釀?wù)魇招玛P(guān)稅

都市快報(bào)橙柿互動(dòng)
2026-02-26 00:15:00
春節(jié)假期“冀A攻占娘子關(guān)”話題熱度飆升,不少河北人跨省來山西放炮,當(dāng)?shù)卣?目前已進(jìn)入森林防火期,對(duì)燃放煙花的管控將更嚴(yán)格

春節(jié)假期“冀A攻占娘子關(guān)”話題熱度飆升,不少河北人跨省來山西放炮,當(dāng)?shù)卣?目前已進(jìn)入森林防火期,對(duì)燃放煙花的管控將更嚴(yán)格

極目新聞
2026-02-25 20:00:30
全球庫存5.6天!這個(gè)賽道,即將大爆發(fā)?!

全球庫存5.6天!這個(gè)賽道,即將大爆發(fā)?!

米筐投資
2026-02-25 07:07:39
吳夢(mèng)潔27分,趙勇現(xiàn)場(chǎng)觀賽,天津女排五局輸球,北京隊(duì)吃到紅牌

吳夢(mèng)潔27分,趙勇現(xiàn)場(chǎng)觀賽,天津女排五局輸球,北京隊(duì)吃到紅牌

跑者排球視角
2026-02-25 22:51:47
熱播短劇被指出現(xiàn)男演員揩油女演員鏡頭,目前爭(zhēng)議鏡頭已刪除,劇方尚未回應(yīng)

熱播短劇被指出現(xiàn)男演員揩油女演員鏡頭,目前爭(zhēng)議鏡頭已刪除,劇方尚未回應(yīng)

瀟湘晨報(bào)
2026-02-25 17:55:25
韓“蛇蝎美人”旅館誘殺男子致2死1傷,被捕后漲粉50倍,曾用AI精密策劃殺人步驟

韓“蛇蝎美人”旅館誘殺男子致2死1傷,被捕后漲粉50倍,曾用AI精密策劃殺人步驟

紅星新聞
2026-02-25 13:23:34
楊紫真的已經(jīng)瘦到天賦上限了,這也太牛了…

楊紫真的已經(jīng)瘦到天賦上限了,這也太牛了…

手工制作阿殲
2026-02-22 13:25:34
5-7!點(diǎn)球+紅牌,尤文圖斯歐冠慘遭淘汰,意甲球隊(duì)只剩獨(dú)苗

5-7!點(diǎn)球+紅牌,尤文圖斯歐冠慘遭淘汰,意甲球隊(duì)只剩獨(dú)苗

足球狗說
2026-02-26 06:37:15
愛潑斯坦專機(jī)腐爛曝光:嬰兒油混著霉斑,這張大床曾藏多少罪惡?

愛潑斯坦專機(jī)腐爛曝光:嬰兒油混著霉斑,這張大床曾藏多少罪惡?

眼界看視野
2026-02-25 20:55:30
老伴手術(shù)急需25萬,老漢拿紀(jì)念鈔去銀行兌錢,銀行的做法讓老人愣住

老伴手術(shù)急需25萬,老漢拿紀(jì)念鈔去銀行兌錢,銀行的做法讓老人愣住

懸案解密檔案
2025-09-22 11:05:28
你經(jīng)歷過哪些殺人誅心的事?網(wǎng)友:所以沒有婆婆拆散不了的家

你經(jīng)歷過哪些殺人誅心的事?網(wǎng)友:所以沒有婆婆拆散不了的家

帶你感受人間冷暖
2026-02-11 10:54:58
2026第一波大裁員來了,注意這5個(gè)危險(xiǎn)行業(yè)

2026第一波大裁員來了,注意這5個(gè)危險(xiǎn)行業(yè)

愛看劇的阿峰
2026-02-25 04:59:54
起風(fēng)了!賴清德對(duì)大陸的稱呼變了,鄭麗文表態(tài)驚人,柯建銘落幕了

起風(fēng)了!賴清德對(duì)大陸的稱呼變了,鄭麗文表態(tài)驚人,柯建銘落幕了

諦聽骨語本尊
2026-02-25 19:30:14
2026-02-26 07:32:49
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。
11255文章數(shù) 116980關(guān)注度
往期回顧 全部

科技要聞

“機(jī)器人只跳舞,沒什么用”

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

體育要聞

勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

娛樂要聞

黃曉明新戀情!與小22歲美女同游新加坡

財(cái)經(jīng)要聞

上海樓市放大招,地產(chǎn)預(yù)期別太大

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

游戲
數(shù)碼
親子
教育
旅游

《如龍極3》中文配音訪談:中文配音與本地化并非易事

數(shù)碼要聞

三星發(fā)布 Galaxy Buds 4 與 Buds 4 Pro 耳機(jī)產(chǎn)品

親子要聞

產(chǎn)后性生活冷淡?找回“高潮”,是修復(fù)夫妻關(guān)系的第一步

教育要聞

專業(yè)調(diào)劑不懂就虧大了!3招避免入坑

旅游要聞

赴日中國游客較去年銳減50%,泰國、韓國接住這波“紅利”

無障礙瀏覽 進(jìn)入關(guān)懷版