国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

ICCV 2025 | SIC:可解釋神經(jīng)網(wǎng)絡(luò)最新突破,慕尼黑工業(yè)提出基于B-CoS變換的可解釋圖像分類方法

0
分享至

在現(xiàn)代深度學(xué)習(xí)領(lǐng)域,模型能夠在高精度和可解釋性之間取得平衡,在實際場景部署時至關(guān)重要,尤其是在醫(yī)療、金融等高風(fēng)險領(lǐng)域應(yīng)用中。盡管傳統(tǒng)深度學(xué)習(xí)模型能夠提供極高的準(zhǔn)確性,但由于其“黑箱”特性使得模型的決策過程不透明,最終得到的預(yù)測結(jié)果難以理解。本文介紹一篇來自慕尼黑工業(yè)大學(xué)醫(yī)學(xué)成像人工智能實驗室的最新工作SIC,SIC已被計算機(jī)視覺頂級會議ICCV 2025錄用。本文提出一種基于相似性的解釋方法SIC,通過提供其決策過程的局部和全局解釋來提高模型的綜合能力和可信度。實驗結(jié)果表明,SIC不僅實現(xiàn)了與最先進(jìn)的黑盒模型和固有可解釋模型相當(dāng)?shù)臏?zhǔn)確率,還可以同時提供可視化的解釋結(jié)果,使得預(yù)測結(jié)果更易于理解。


論文題目: SIC: Similarity-Based Interpretable Image Classification with Neural Networks 文章鏈接: https://arxiv.org/abs/2501.17328v2 代碼倉庫: https://github.com/ai-med/SIC
一、介紹

近年來,深度學(xué)習(xí)在高風(fēng)險領(lǐng)域的應(yīng)用逐漸增多,但由于模型的“黑箱”特性,決策過程往往缺乏透明度,這使得模型在出現(xiàn)錯誤時難以追蹤和糾正。為了解決這個問題,可解釋人工智能(explainable AI,XAI)方法應(yīng)運(yùn)而生。

現(xiàn)有的可解釋方法通常提供兩種類型的解釋:局部解釋全局解釋,并且可以評估其信賴度,以驗證這些解釋是否忠實于模型。

  • 局部解釋(Local Explanation):模型能夠針對單個樣本提供的具體預(yù)測決策的解釋,揭示模型如何做出特定決策;

  • 全局解釋(Global Explanation):模型能夠提供關(guān)于整個模型行為的解釋,描述每個特征如何影響所有實例的預(yù)測。

  • 信賴度(Faithful):表示解釋是否能夠滿足一些已知的可解釋性準(zhǔn)則,例如完整性、敏感性、線性等。

下表對比了本文提出的SIC方法與其他可解釋性模型在不同解釋維度上的表現(xiàn)。


從上表中可以看出,本文SIC方法在所有三個方面(局部解釋、全局解釋和信賴度)都能夠提供很好的支持,這使得它相比其他方法具有更強(qiáng)的可解釋性和透明度。

二、方法

SIC模型的核心思想是通過基于相似性的分類機(jī)制,結(jié)合B-Cos變換生成可解釋性強(qiáng)的局部和全局解釋。首先,輸入圖像通過特征提取器生成潛在特征向量,然后計算該特征向量與訓(xùn)練集中支持向量之間的相似度,從而得到各類別的預(yù)測分?jǐn)?shù)。上圖展示了SIC模型的工作流程。


接著,利用B-Cos變換簡化前向傳播過程,生成一個統(tǒng)一的權(quán)重矩陣,用于計算每個輸入特征對最終決策的貢獻(xiàn),進(jìn)而提供清晰的決策過程解釋。

2.1 基于相似性的分類機(jī)制

與傳統(tǒng)的分類方法不同,SIC依賴于從訓(xùn)練集中提取的類代表性支持向量來進(jìn)行分類。支持向量 是從每個類別的訓(xùn)練樣本中選擇的,它們代表了該類別的典型特征。具體的支持向量提取過程如下:

1. 支持向量提取:在訓(xùn)練過程中,對于每個類別 ,SIC隨機(jī)選 個支持向量。每個支持向量 是通過特征提取器 從訓(xùn)練圖像中提取的特征向量,公式為:


其中, 是屬于類別 的訓(xùn)練圖像, 表示該圖像的標(biāo)簽。

2. 支持向量聚類:SIC通過對每個類別的特征向量進(jìn)行聚類來進(jìn)一步提取具有代表性的支持向量。具體而言,SIC使用k-means算法對每個類別的特征向量進(jìn)行聚類,選取聚類中心作為最終的支持向量。

3. 分類:一旦支持向量被選取并聚類,SIC就會計算輸入圖像特征向量與支持向量之間的相似度。分類決策通過計算相似性得分,并將其加權(quán)求和,生成類別logits ,然后通過Softmax函數(shù)將logit轉(zhuǎn)化為最終的類別概率。

2.2 B-Cos變換

B-Cos變換是SIC方法中的一個關(guān)鍵技術(shù),主要目的是通過強(qiáng)制輸入特征和權(quán)重之間對齊,簡化神經(jīng)網(wǎng)絡(luò)的計算過程,從而使得模型的決策更加透明和可解釋。對于輸入特征向量 和網(wǎng)絡(luò)中的權(quán)重向量 ,B-Cos變換的數(shù)學(xué)公式如下:


其中, 是歸一化后的權(quán)重, 是輸入特征與權(quán)重的余弦相似度,sgn是符號函數(shù)。在該公式中,參數(shù) 來控制該相似度的放大或縮小,從而生成一個更符合解釋性的線性變換。符號函數(shù) 根據(jù)余弦相似度的符號(正負(fù))來決定特征的方向性。這個步驟確保了輸入特征和權(quán)重之間的方向一致性。

在神經(jīng)網(wǎng)絡(luò)的每一層,B-Cos變換通過對權(quán)重和輸入的對齊,使得模型的解釋變得更加直觀。具體來說,這個變換為每個輸入特征提供了一個貢獻(xiàn)度,并且這些貢獻(xiàn)度可以通過余弦相似度來追溯到輸入特征和權(quán)重之間的關(guān)系。每一層通過以下矩陣形式來計算:


其中, 代表網(wǎng)絡(luò)輸出,經(jīng)過每一層的變換矩陣 處理輸入數(shù)據(jù) ,其中每一層的變換依賴于該層的輸入。通過層與層之間的矩陣乘積,最終生成網(wǎng)絡(luò)的輸出 。該過程可以通過綜合的變換矩陣 表示,簡化為一個輸入特征與權(quán)重之間的線性關(guān)系,增強(qiáng)了神經(jīng)網(wǎng)絡(luò)的可解釋性。

三、實驗

本文在三個任務(wù)上進(jìn)行了評估驗證,分別是Pascal VOC的多標(biāo)簽圖像分類Stanford Dogs的細(xì)粒度圖像分類RSNA數(shù)據(jù)集的病理預(yù)測任務(wù)。由于醫(yī)學(xué)影像通常包含復(fù)雜的病變特征,并且這些特征可能在不同的病例中表現(xiàn)出很大的差異,因此,RSNA數(shù)據(jù)集的病理預(yù)測具有一定的挑戰(zhàn)性。此外,本文還使用了FunnyBirds框架對SIC的解釋性進(jìn)行評估。

3.1 定量實驗

下表展示了本文SIC模型和其他不同模型在Pascal VOC、Stanford DogsRSNA數(shù)據(jù)集上對比的結(jié)果。


在Pascal VOC數(shù)據(jù)集上,SIC在ResNet50架構(gòu)上取得了97.00%的準(zhǔn)確率,優(yōu)于B-Cos[1]和ProtoPNet[2]。盡管SIC在Stanford Dogs數(shù)據(jù)集上的表現(xiàn)稍有下降,但在Pascal VOC和RSNA上的表現(xiàn)證明了它在提供高準(zhǔn)確度方面的優(yōu)勢,尤其在醫(yī)學(xué)影像分析PSNR中。

3.2 定性實驗

下圖展示了 SIC 模型在處理不同類別時如何根據(jù)支持樣本和貢獻(xiàn)圖來解釋其決策過程。


第一個例子展示了模型正確分類圖像中貓的例子。藍(lán)色的支持證據(jù)條表明模型的預(yù)測是正確的。并且模型是依賴于三個支持樣本(Support Samples 21, 22, 23)中的貓眼睛特征來進(jìn)行決策。貢獻(xiàn)圖也顯示出模型在預(yù)測時主要關(guān)注了貓眼睛的位置。這既體現(xiàn)了模型如何通過支持樣本和貢獻(xiàn)圖提供局部解釋,又展示了如何通過支持樣本的依賴來進(jìn)行全局解釋。但在某些情況下,模型可能會受到輸入圖像中某些特征的干擾,導(dǎo)致錯誤預(yù)測,如第三個例子中誤識花為盆栽植物??傊?,SIC 模型不僅能提供高準(zhǔn)確度的分類,還能為其決策過程提供透明的可解釋性,幫助分析和理解其行為。

3.3 可解釋性評估

此外,為了驗證 SIC 模型的可解釋性,本文還在FunnyBirds框架下進(jìn)行了驗證,實驗結(jié)果如下圖所示。其中,A表示準(zhǔn)確率,BI表示背景獨立性,Com.表示完整性,是CSDC、PC、DC和D的平均值,Cor.表示正確性,Con.表示對比性。


如上圖所示,雖然SIC其在某些指標(biāo)上與ProtoPNet和B-Cos相當(dāng),但其在準(zhǔn)確性、背景獨立性、正確性和對比性等方面的綜合表現(xiàn)更為優(yōu)異,證明了其在多任務(wù)中的優(yōu)勢。尤其是在處理背景噪聲和提供高質(zhì)量可解釋性方面,SIC顯示出了強(qiáng)大的優(yōu)勢和魯棒性。

四、總結(jié)

本文介紹了一種新穎的可解釋圖像分類方法SIC,該方法通過基于相似性的分類機(jī)制和B-Cos變換,在確保高精度的同時顯著提高了模型的可解釋性。SIC通過支持向量學(xué)習(xí)和相似性計算,提供透明的決策過程和詳細(xì)的局部與全局解釋,解決了傳統(tǒng)深度學(xué)習(xí)中的“黑箱”問題。實驗結(jié)果表明,SIC在多個數(shù)據(jù)集上表現(xiàn)出色,尤其在醫(yī)學(xué)影像等高風(fēng)險領(lǐng)域,展現(xiàn)了優(yōu)異的可解釋性和準(zhǔn)確性,提出了新的深度學(xué)習(xí)模型透明性和可操作性的方法。

參考

[1] Moritz Bohle, Mario Fritz, and Bernt Schiele. B-cos networks: Alignment is all we need for interpretability. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR), pages10329–10338, 2022.

[2] Chaofan Chen, Oscar Li, Daniel Tao, Alina Barnett, Cynthia Rudin, and Jonathan K Su. This looks like that: deep learning for interpretable image recognition. Advances in neural information processing systems, 32, 2019.

llustration From IconScout By IconScout Store

-The End-

本周上新!

掃碼觀看!

“AI技術(shù)流”原創(chuàng)投稿計劃

TechBeat是由將門創(chuàng)投建立的AI學(xué)習(xí)社區(qū)(www.techbeat.net)。社區(qū)上線700+期talk視頻,3000+篇技術(shù)干貨文章,方向覆蓋CV/NLP/ML/Robotis等;每月定期舉辦頂會及其他線上交流活動,不定期舉辦技術(shù)人線下聚會交流活動。我們正在努力成為AI人才喜愛的高質(zhì)量、知識型交流平臺,希望為AI人才打造更專業(yè)的服務(wù)和體驗,加速并陪伴其成長。

投稿內(nèi)容

// 最新技術(shù)解讀/系統(tǒng)性知識分享 //

// 前沿資訊解說/心得經(jīng)歷講述 //

投稿須知

稿件需要為原創(chuàng)文章,并標(biāo)明作者信息。

我們會選擇部分在深度技術(shù)解析及科研心得方向,對用戶啟發(fā)更大的文章,做原創(chuàng)性內(nèi)容獎勵

投稿方式

發(fā)送郵件到

michellechang@thejiangmen.com

或添加工作人員微信(michelle333_)投稿,溝通投稿詳情

關(guān)于我“門”

將門是一家以專注于數(shù)智核心科技領(lǐng)域新型創(chuàng)投機(jī)構(gòu),也是北京市標(biāo)桿型孵化器。 公司致力于通過連接技術(shù)與商業(yè),發(fā)掘和培育具有全球影響力的科技創(chuàng)新企業(yè),推動企業(yè)創(chuàng)新發(fā)展與產(chǎn)業(yè)升級。

將門成立于2015年底,創(chuàng)始團(tuán)隊由微軟創(chuàng)投在中國的創(chuàng)始團(tuán)隊原班人馬構(gòu)建而成,曾為微軟優(yōu)選和深度孵化了126家創(chuàng)新的技術(shù)型創(chuàng)業(yè)公司。

如果您是技術(shù)領(lǐng)域的初創(chuàng)企業(yè),不僅想獲得投資,還希望獲得一系列持續(xù)性、有價值的投后服務(wù),歡迎發(fā)送或者推薦項目給我“門”:

bp@thejiangmen.com


點擊右上角,把文章分享到朋友圈

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
雨雪又要來了,鄭州暖氣會延期嗎?官方回應(yīng)

雨雪又要來了,鄭州暖氣會延期嗎?官方回應(yīng)

大象新聞
2026-03-12 21:25:02
假貨率高達(dá)70%!不銹鋼餐具造假黑幕,消費者被坑慘,家長要警惕

假貨率高達(dá)70%!不銹鋼餐具造假黑幕,消費者被坑慘,家長要警惕

趣文說娛
2026-03-10 16:47:22
綠聯(lián)NAS私有云與MiniMax深度合作,首發(fā)開箱即用的OpenClaw龍蝦

綠聯(lián)NAS私有云與MiniMax深度合作,首發(fā)開箱即用的OpenClaw龍蝦

IT之家
2026-03-13 15:06:15
江西一女子稱姐姐誤將價值150萬元黃金當(dāng)垃圾扔掉,全家人連夜翻10噸垃圾找回!當(dāng)?shù)鼗貞?yīng):確有此事

江西一女子稱姐姐誤將價值150萬元黃金當(dāng)垃圾扔掉,全家人連夜翻10噸垃圾找回!當(dāng)?shù)鼗貞?yīng):確有此事

深圳晚報
2026-03-13 15:02:37
請注意:以色列已開始派大量無人機(jī)在伊朗超低空狙殺和攻擊

請注意:以色列已開始派大量無人機(jī)在伊朗超低空狙殺和攻擊

邵旭峰域
2026-03-13 15:25:35
姑姑借我15萬買車從不提還,我張口要時她卻說:別總想占親戚便宜

姑姑借我15萬買車從不提還,我張口要時她卻說:別總想占親戚便宜

楓紅染山徑
2026-03-13 11:40:44
初春和仲春野釣鯽魚的4條規(guī)律

初春和仲春野釣鯽魚的4條規(guī)律

釣魚技巧和知識
2026-03-12 09:41:53
“12人吃燒烤花78元”,為拼兒子連生10胎,家長買燒烤都沒人敢吃

“12人吃燒烤花78元”,為拼兒子連生10胎,家長買燒烤都沒人敢吃

妍妍教育日記
2026-03-12 22:38:02
輸比利時采訪!楊舒予韓旭直指檢驗學(xué)習(xí),李月汝不滿防守與自責(zé)!

輸比利時采訪!楊舒予韓旭直指檢驗學(xué)習(xí),李月汝不滿防守與自責(zé)!

籃球資訊達(dá)人
2026-03-12 23:31:49
78年我值夜班,偷偷放走個發(fā)高燒的女囚,32年后她開紅旗車來報恩

78年我值夜班,偷偷放走個發(fā)高燒的女囚,32年后她開紅旗車來報恩

奶茶麥子
2026-03-11 22:09:03
開戰(zhàn)來首次!美國損失慘重

開戰(zhàn)來首次!美國損失慘重

亞太觀瀾
2026-03-12 20:50:06
華為養(yǎng)了十年的狼,帶著一群崽子把家偷了

華為養(yǎng)了十年的狼,帶著一群崽子把家偷了

老鷹哥
2026-03-13 11:31:52
喬冠華后人現(xiàn)狀:兒子子承父業(yè),女兒成軍醫(yī),繼女名字家喻戶曉

喬冠華后人現(xiàn)狀:兒子子承父業(yè),女兒成軍醫(yī),繼女名字家喻戶曉

林雁飛
2026-02-14 18:52:26
男子大鬧上海地鐵,在車廂內(nèi)放火!人被刑拘身份曝光,恐難受懲罰

男子大鬧上海地鐵,在車廂內(nèi)放火!人被刑拘身份曝光,恐難受懲罰

青梅侃史啊
2026-03-12 19:34:22
楊瀚森狂轟16+13+2,又創(chuàng)生涯新高!登陸NBA持續(xù)進(jìn)化,開拓者欣慰

楊瀚森狂轟16+13+2,又創(chuàng)生涯新高!登陸NBA持續(xù)進(jìn)化,開拓者欣慰

小火箭愛體育
2026-03-13 13:05:12
樓市大局已定:不出意外的話,2026年起中國房價或迎來3大變化

樓市大局已定:不出意外的話,2026年起中國房價或迎來3大變化

現(xiàn)代小青青慕慕
2026-03-12 11:13:37
WTT重慶冠軍賽-孫穎莎3-0完勝好姐妹 晉級女單八強(qiáng) 下輪迎來隊內(nèi)PK

WTT重慶冠軍賽-孫穎莎3-0完勝好姐妹 晉級女單八強(qiáng) 下輪迎來隊內(nèi)PK

云隱南山
2026-03-13 15:34:29
新加坡急了,外長幾乎是拍著桌子,讓中國“尊重”馬六甲的地位。

新加坡急了,外長幾乎是拍著桌子,讓中國“尊重”馬六甲的地位。

南權(quán)先生
2026-01-26 15:41:26
五糧液首款光瓶酒上市,100%純糧定價399,樹立市場“新標(biāo)桿”

五糧液首款光瓶酒上市,100%純糧定價399,樹立市場“新標(biāo)桿”

影像渭南
2026-03-13 12:05:06
會如何?川普說沒啥可打了但會繼續(xù)、以攻擊伊全境稱直到實現(xiàn)目標(biāo)

會如何?川普說沒啥可打了但會繼續(xù)、以攻擊伊全境稱直到實現(xiàn)目標(biāo)

邵旭峰域
2026-03-12 15:00:07
2026-03-13 16:16:49
將門創(chuàng)投 incentive-icons
將門創(chuàng)投
加速及投資技術(shù)驅(qū)動型初創(chuàng)企業(yè)
2310文章數(shù) 596關(guān)注度
往期回顧 全部

科技要聞

《后廠村AI派》:帶你玩轉(zhuǎn)OpenClaw龍蝦

頭條要聞

民主黨連勝 特朗普鐵粉退場讓"最保守"選區(qū)現(xiàn)兩黨決選

頭條要聞

民主黨連勝 特朗普鐵粉退場讓"最保守"選區(qū)現(xiàn)兩黨決選

體育要聞

叕戰(zhàn)奧運(yùn),張雨霏要做回“小將”

娛樂要聞

小S復(fù)工錄制 感謝賈永婕陪大S走到最后

財經(jīng)要聞

"短劇"苦抄襲

汽車要聞

本田汽車全年業(yè)績由盈轉(zhuǎn)虧 高管們降薪3個月以擔(dān)責(zé)

態(tài)度原創(chuàng)

藝術(shù)
游戲
本地
親子
時尚

藝術(shù)要聞

吳冠中:歷代畫竹大都缺乏厚度與深度

穿越迷霧,經(jīng)典再現(xiàn):《SILENT HILL 2》全球累積500萬銷量!

本地新聞

坐標(biāo)北京,過敏季反向遷徒

親子要聞

孩子大了,不好騙了

直播|| 最近超愛的兩只包,好用到天天背

無障礙瀏覽 進(jìn)入關(guān)懷版