国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

TMM 2025 | 頂刊方案:DMSI 融合圖像 - 特征級掩碼,半監(jiān)督語義分割性能與魯棒性雙提升

0
分享至

在自動駕駛的視覺系統(tǒng)中,如何讓AI準確識別出街景中"卡車的窗戶"而不是誤判為"汽車"?在醫(yī)療影像分析時,怎樣讓模型僅憑部分圖像就能推斷出完整的病灶區(qū)域?今天要給大家介紹的這項研究,或許能給出完美答案。

來自國內(nèi)高校的研究團隊提出了一種名為DMSI(雙級掩碼語義推理)的全新框架,在半監(jiān)督語義分割任務(wù)中刷新了多項SOTA記錄。更厲害的是,它讓模型真正學(xué)會了"上下文推理"——就像人類看到半遮半掩的物體時,能根據(jù)周圍環(huán)境猜出全貌一樣。

論文信息 題目:Dual-Level Masked Semantic Inference for Semi-Supervised Semantic Segmentation 半監(jiān)督語義分割的雙層掩碼語義推理 作者:Qiankun Ma, Ziyao Zhang, Pengchong Qiao, Yu Wang, Rongrong Ji, Chang Liu, Jie Chen 為什么現(xiàn)有模型總是"犯糊涂"?

傳統(tǒng)的半監(jiān)督語義分割方法有個致命弱點:它們只關(guān)注單個像素的預(yù)測是否穩(wěn)定,卻忽略了像素之間的"鄰里關(guān)系"。

就像下面這個例子,普通模型會把卡車的窗戶誤判為汽車,因為它只看局部像素的顏色和紋理,沒意識到"窗戶"周圍都是"卡車"的部件。這種"只見樹木不見森林"的認知方式,在復(fù)雜場景中很容易出錯。


而人類在識別物體時,總會不自覺地利用上下文信息:看到車輪就想到汽車,看到枝葉就聯(lián)想到樹木。DMSI的核心創(chuàng)新,就是讓AI也具備這種"聯(lián)想推理"能力。

DMSI框架:讓模型學(xué)會"猜謎"的三大絕招

研究團隊提出的DMSI框架,用"掩碼后推理"的思路徹底改變了模型的學(xué)習(xí)方式。簡單說就是:故意遮住圖像的一部分,逼模型根據(jù)剩下的部分猜被遮住的內(nèi)容。整個框架就像一個嚴格的老師,通過不斷"出題考學(xué)生",讓模型逐漸學(xué)會利用上下文線索。

絕招一:雙級掩碼一致性正則化(DMCR)

這個機制就像給模型布置兩種難度的"填空題":

  • 圖像級掩碼 :直接在原圖上遮掉一塊,讓模型根據(jù)剩余像素猜被遮區(qū)域(類似我們玩的"看圖猜物")

  • 特征級掩碼 :在模型處理圖像的中間特征層遮掉一部分,迫使模型從高層語義中找線索

通過這兩種訓(xùn)練方式,模型既能學(xué)到顏色、紋理等低級特征,又能掌握物體關(guān)系等高級語義。實驗證明,這種雙管齊下的方法比單一掩碼方式性能提升1.5%。

絕招二:自適應(yīng)掩碼位置(AMP)——專挑"重點區(qū)域"考

普通的掩碼方法隨機遮圖,經(jīng)常把無關(guān)緊要的背景區(qū)域遮住,白費功夫。AMP則像個精明的老師,專挑"難點"考:

  1. 先把圖像分成若干個小補丁

  2. 計算每個補丁的"不確定性"(模型最容易認錯的區(qū)域)

  3. 優(yōu)先遮掉那些語義豐富的前景區(qū)域(比如汽車、行人)

從下面的對比可以看出,AMP會智能地避開天空、道路等簡單背景,專門針對卡車、公交車等難識別的物體進行掩碼訓(xùn)練。


絕招三:自適應(yīng)掩碼比例(AMR)——因材施教的智慧

就像老師不會給差生出太難的題,AMR會根據(jù)圖像的"難易程度"調(diào)整掩碼比例:

  • 對容易識別的圖像(模型預(yù)測準確度高):遮得多一點,逼模型挑戰(zhàn)極限

  • 對難識別的圖像(模型經(jīng)常出錯):遮得少一點,避免打擊學(xué)習(xí)積極性

隨著訓(xùn)練進展,當模型對某張圖的識別越來越準,AMR會自動提高掩碼比例,就像學(xué)生進步了,老師會增加作業(yè)難度一樣。


方法全貌:DMSI的工作流程

整個框架采用師生訓(xùn)練模式,通過四個關(guān)鍵步驟實現(xiàn)語義推理能力的培養(yǎng):

  1. 教師模型對原圖進行完整預(yù)測,生成高置信度的"參考答案"

  2. AdaMask根據(jù)圖像特點,智能生成掩碼位置和比例

  3. 學(xué)生模型分別對"掩碼圖像"和"掩碼特征"進行預(yù)測

  4. 通過損失函數(shù)讓學(xué)生的預(yù)測結(jié)果與教師的"參考答案"對齊

這種訓(xùn)練方式讓模型被迫養(yǎng)成"找上下文線索"的習(xí)慣,就像我們做填空題時會下意識地聯(lián)系前后文一樣。


實驗結(jié)果:刷新四大數(shù)據(jù)集SOTA

在多個權(quán)威數(shù)據(jù)集上,DMSI都展現(xiàn)出壓倒性優(yōu)勢:

  • PASCAL VOC 2012 :在僅用92張標注圖像的極端情況下,比之前最好的方法高出3.7%

  • Cityscapes :使用ResNet-101作為骨干網(wǎng)絡(luò)時,所有劃分協(xié)議下均領(lǐng)先2%左右

  • MS COCO :在這個包含81類物體的復(fù)雜數(shù)據(jù)集上,全面超越PseudoSeg和UniMatch

  • ADE20K :在150個類別的場景解析任務(wù)中,顯著優(yōu)于AEL等現(xiàn)有方法

特別值得注意的是,在標注數(shù)據(jù)越少的情況下,DMSI的優(yōu)勢越明顯,這意味著它能大幅降低對標注數(shù)據(jù)的依賴,在實際應(yīng)用中能節(jié)省大量標注成本。

為什么DMSI如此強大?

通過深入分析,研究團隊發(fā)現(xiàn)了DMSI性能飛躍的兩個關(guān)鍵原因:

1. 像素間的"信息交流"更頻繁

用互信息(MI)指標衡量發(fā)現(xiàn),DMSI模型中像素之間的信息交互明顯增強。同類像素(比如卡車的各個部件)之間的"默契度"更高,能互相提供識別線索。


2. 抗干擾能力顯著提升

在加入高斯噪聲、對抗性噪聲甚至隨機掩碼的情況下,DMSI的性能下降幅度遠小于傳統(tǒng)方法。這是因為它不是依賴單個像素的特征,而是綜合了周圍像素的上下文信息,就像多人作證比單人作證更可靠一樣。


實際應(yīng)用價值與局限

DMSI的創(chuàng)新思路不僅限于語義分割,還能應(yīng)用到更廣泛的領(lǐng)域:

  • 自動駕駛:在雨天、逆光等惡劣條件下,仍能通過上下文推理準確識別物體

  • 醫(yī)療影像:僅憑部分清晰區(qū)域就能推斷完整病灶,減少漏診誤診

  • 遙感圖像分析:在云層遮擋情況下,仍能識別地面目標

當然,這個方法也有局限性——由于需要進行兩次前向傳播,訓(xùn)練時間比傳統(tǒng)方法增加約15%。但考慮到性能的巨大提升,這點代價在大多數(shù)場景下是值得的。

結(jié)語:從"看見"到"理解"的跨越

DMSI的成功證明了一個重要觀點:計算機視覺不僅要讓模型"看見"像素,更要讓它"理解"場景中各元素的關(guān)系。這種從"語義理解"到"語義推理"的跨越,或許是AI視覺系統(tǒng)走向真正智能的關(guān)鍵一步。

未來,研究團隊計劃將這種上下文推理能力擴展到跨圖像場景,讓模型能從多張圖片中學(xué)習(xí)更復(fù)雜的語義關(guān)系。讓我們期待這個方向能帶來更多突破性進展!

文章來源:計算機書童。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
舒淇在節(jié)目里第一次承認,她和馮德倫為了要孩子已經(jīng)折騰了九年。

舒淇在節(jié)目里第一次承認,她和馮德倫為了要孩子已經(jīng)折騰了九年。

歲月有情1314
2025-11-29 15:40:25
還想買燃油車的要小心,2026年,燃油車市場必將發(fā)生幾大變化

還想買燃油車的要小心,2026年,燃油車市場必將發(fā)生幾大變化

李子櫥
2025-12-21 14:15:05
12月22日中央一套開播!78位實力派演員領(lǐng)銜,網(wǎng)友: 這劇收視要炸

12月22日中央一套開播!78位實力派演員領(lǐng)銜,網(wǎng)友: 這劇收視要炸

鄉(xiāng)野小珥
2025-12-20 14:01:37
活到90歲靠的從來不是基因!這“9個不”,做到一半就賺了

活到90歲靠的從來不是基因!這“9個不”,做到一半就賺了

貓大夫醫(yī)學(xué)科普
2025-09-27 06:56:23
普京喊話呂特:“為何執(zhí)意要跟我們打仗?”

普京喊話呂特:“為何執(zhí)意要跟我們打仗?”

參考消息
2025-12-20 21:25:31
“訂單去哪兒了?”當網(wǎng)約車集體怒吼,平臺第一次把底牌攤在桌上

“訂單去哪兒了?”當網(wǎng)約車集體怒吼,平臺第一次把底牌攤在桌上

侃故事的阿慶
2025-12-20 13:14:15
空砍36+4+3!我追不上老詹,哈登賽后無奈請求,泰倫盧也承認事實

空砍36+4+3!我追不上老詹,哈登賽后無奈請求,泰倫盧也承認事實

巴叔GO聊體育
2025-12-21 15:54:01
太陽女神去老公團隊抓小三

太陽女神去老公團隊抓小三

毒舌扒姨太
2025-12-21 22:15:22
特朗普放話炸平莫斯科,美俄核對峙升級!

特朗普放話炸平莫斯科,美俄核對峙升級!

回京歷史夢
2025-12-21 04:10:03
女子醉駕找人“擺平”被騙7萬后跳樓身亡,詐騙者獲刑 家屬起訴中間“介紹人”索賠23萬

女子醉駕找人“擺平”被騙7萬后跳樓身亡,詐騙者獲刑 家屬起訴中間“介紹人”索賠23萬

紅星新聞
2025-12-21 13:39:17
上海富豪為癡傻兒子娶妻,農(nóng)村女孩主動上門,可是新婚當晚卻傻眼了

上海富豪為癡傻兒子娶妻,農(nóng)村女孩主動上門,可是新婚當晚卻傻眼了

五元講堂
2025-03-25 21:28:36
北斗、GPS信號受精準干擾壓制!導(dǎo)航集體失靈事件原因公布!

北斗、GPS信號受精準干擾壓制!導(dǎo)航集體失靈事件原因公布!

荊楚寰宇文樞
2025-12-20 22:07:33
“彈劾賴清德”網(wǎng)絡(luò)連署結(jié)果驚人,藍白有重要決定,鄭麗文被打臉

“彈劾賴清德”網(wǎng)絡(luò)連署結(jié)果驚人,藍白有重要決定,鄭麗文被打臉

聞識
2025-12-21 13:36:51
中東,突發(fā)!以軍總參謀長:以色列正經(jīng)歷“最長最復(fù)雜的戰(zhàn)爭”

中東,突發(fā)!以軍總參謀長:以色列正經(jīng)歷“最長最復(fù)雜的戰(zhàn)爭”

證券時報e公司
2025-12-21 22:33:41
德韓上位,中國出局,越南建高鐵為了避開中國,不惜拿國運做賭注

德韓上位,中國出局,越南建高鐵為了避開中國,不惜拿國運做賭注

博覽歷史
2025-12-21 12:40:30
皇馬2-0十人塞維利亞!距巴薩1分 姆巴佩點射+年度59球平C羅紀錄

皇馬2-0十人塞維利亞!距巴薩1分 姆巴佩點射+年度59球平C羅紀錄

我愛英超
2025-12-21 06:06:19
對付俄羅斯,高市早苗已有妙招?動手前,她先對中國提了一個要求

對付俄羅斯,高市早苗已有妙招?動手前,她先對中國提了一個要求

博覽歷史
2025-12-20 17:47:03
又老又丑,連普通話都說不好,為何能讓千億富豪對她情有獨鐘?

又老又丑,連普通話都說不好,為何能讓千億富豪對她情有獨鐘?

素衣讀史
2025-12-20 16:26:36
南海撞機王偉成功跳傘,咋10萬人都找不到他?直到20多年后才明白

南海撞機王偉成功跳傘,咋10萬人都找不到他?直到20多年后才明白

鶴羽說個事
2025-12-12 14:31:49
前國腳戴琳還清欠球迷的欠款,球迷家屬:多轉(zhuǎn)了5000元,想退回,對方未發(fā)送賬號

前國腳戴琳還清欠球迷的欠款,球迷家屬:多轉(zhuǎn)了5000元,想退回,對方未發(fā)送賬號

紅星新聞
2025-12-21 14:43:14
2025-12-21 23:07:00
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識,交流思想
5273文章數(shù) 64595關(guān)注度
往期回顧 全部

科技要聞

生態(tài)適配已超95% 鴻蒙下一關(guān):十萬個應(yīng)用

頭條要聞

美國外交系統(tǒng)現(xiàn)重大調(diào)整 約有24名駐外大使被要求離任

頭條要聞

美國外交系統(tǒng)現(xiàn)重大調(diào)整 約有24名駐外大使被要求離任

體育要聞

勇士火箭贏球:王牌之外的答案?

娛樂要聞

星光大賞太尷尬!搶話擋鏡頭,場地還小

財經(jīng)要聞

老房子“強制體檢”,政府出手了

汽車要聞

-30℃,標致508L&凡爾賽C5 X冰雪"大考"

態(tài)度原創(chuàng)

教育
本地
游戲
家居
數(shù)碼

教育要聞

遇到油鹽不進的孩子,該怎么辦?

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風骨

冠以戰(zhàn)神之名的坦克,能否制霸戰(zhàn)場?坦克世界2.1.1版本ARES將至

家居要聞

高端私宅 理想隱居圣地

數(shù)碼要聞

Intel顯卡沖擊高端:竟然要直接上32GB顯存!

無障礙瀏覽 進入關(guān)懷版