国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

TIP 2025 | 語義交互 + 動態(tài)融合雙 buff!AU-Net 讓多模態(tài)配準(zhǔn)融合更精準(zhǔn)高效

0
分享至

文章來源:計算機(jī)書童。

在計算機(jī)視覺領(lǐng)域,多模態(tài)圖像配準(zhǔn)與融合技術(shù)一直是研究熱點(diǎn)。無論是安防監(jiān)控、醫(yī)療影像還是遙感探測,如何將可見光、紅外等不同模態(tài)的圖像精準(zhǔn)對齊并有效融合,始終是提升場景理解能力的關(guān)鍵。近期,一篇題為《AU-Net: Adaptive Unified Network for Joint Multi-Modal Image Registration and Fusion》的論文提出了全新解決方案,讓我們一起來揭開這項創(chuàng)新研究的神秘面紗。

論文信息 題目:AU-Net: Adaptive Unified Network for Joint Multi-Modal Image Registration and Fusion 自適應(yīng)統(tǒng)一網(wǎng)絡(luò):用于聯(lián)合多模態(tài)圖像配準(zhǔn)與融合 作者:Ming Lu, Min Jiang, Xuefeng Tao, Jun Kong 源碼:https://github.com/luming1314/AU-Net 傳統(tǒng)方法的瓶頸:為何1+1≠2?

長期以來,聯(lián)合多模態(tài)圖像配準(zhǔn)與融合(JMIRF)領(lǐng)域存在兩大痛點(diǎn):

  • 效率低下 :傳統(tǒng)方法多采用"先配準(zhǔn)后融合"的級聯(lián)模式,兩個模塊獨(dú)立訓(xùn)練、依次執(zhí)行,運(yùn)行時間簡單疊加,未充分挖掘結(jié)構(gòu)共享潛力

  • 協(xié)同不足 :即使是最新研究,也僅實現(xiàn)像素級聯(lián)合訓(xùn)練(PLJT),本質(zhì)仍是模塊的簡單組合,無法實現(xiàn)配準(zhǔn)與融合的深度協(xié)同增強(qiáng)

如圖1所示,現(xiàn)有方法存在明顯局限:
圖1:(a)單獨(dú)訓(xùn)練模式 (b)像素級聯(lián)合訓(xùn)練模式 (c)本文提出的特征級聯(lián)合訓(xùn)練模式

核心創(chuàng)新:特征級聯(lián)合訓(xùn)練(FLJT)范式

論文提出的特征級聯(lián)合訓(xùn)練(FLJT) 徹底打破傳統(tǒng)框架,通過三個維度實現(xiàn)突破:

  1. 統(tǒng)一網(wǎng)絡(luò)架構(gòu) :將配準(zhǔn)與融合模塊深度整合,共享特征提取結(jié)構(gòu),避免冗余計算

  2. 分層語義交互 :在多尺度特征層面實現(xiàn)配準(zhǔn)與融合的雙向反饋,跨層傳遞語義信息

  3. 動態(tài)協(xié)同學(xué)習(xí) :通過對稱結(jié)構(gòu)設(shè)計,使配準(zhǔn)精度提升與融合質(zhì)量優(yōu)化形成正向循環(huán)

AU-Net總體框架:四模塊協(xié)同工作

AU-Net的整體架構(gòu)如圖2所示,采用對稱設(shè)計實現(xiàn)雙向處理流程:
圖2:AU-Net整體框架圖,包含四大核心模塊

1. 共享特征提取模塊

基于倒置金字塔結(jié)構(gòu)設(shè)計(圖3),通過四個子模塊層實現(xiàn)多尺度特征提?。?img src="https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F1108%2Fda819f92j00t5eqyk004nd200ta00dxg00ta00dx.jpg&thumbnail=660x2147483647&quality=80&type=jpg"/>
圖3:共享特征提取模塊的層級結(jié)構(gòu)

  • layer-0:采用權(quán)重不共享設(shè)計,提取全尺度模態(tài)自適應(yīng)特征

  • layer-1至layer-3:權(quán)重共享的下采樣子模塊,生成1/2、1/4、1/8尺度特征

  • 創(chuàng)新點(diǎn):通過單次特征提取同時服務(wù)于配準(zhǔn)和融合任務(wù),大幅提升效率

2. 配準(zhǔn)模塊

采用多尺度特征級配準(zhǔn)策略,通過三個子配準(zhǔn)單元實現(xiàn)分層優(yōu)化(圖4):
圖4:單個子配準(zhǔn)模塊的工作流程

  • 核心機(jī)制:先通過上一層變形場進(jìn)行粗配準(zhǔn),再計算局部相關(guān)體積實現(xiàn)精細(xì)調(diào)整

  • 優(yōu)勢:相比傳統(tǒng)像素級配準(zhǔn),特征級配準(zhǔn)更魯棒,能捕捉語義層面的對應(yīng)關(guān)系

  • 處理流程:從最粗尺度(1/8)到全尺度(1x)逐步優(yōu)化變形場,實現(xiàn)漸進(jìn)式對齊

3. 融合模塊

創(chuàng)新設(shè)計多模態(tài)尺度感知動態(tài)卷積(MSDConv),實現(xiàn)自適應(yīng)特征融合(圖5、6):圖5:子融合模塊的特征聚合流程


圖6:多模態(tài)尺度感知動態(tài)卷積的注意力機(jī)制

  • 動態(tài)卷積特性:根據(jù)輸入特征動態(tài)調(diào)整卷積核權(quán)重,實現(xiàn)模態(tài)和尺度雙維度自適應(yīng)

  • 注意力機(jī)制:通過四個維度(空間、輸入通道、輸出通道、內(nèi)核數(shù)量)的注意力標(biāo)量優(yōu)化特征聚合

  • 融合策略:采用逐元素最大操作實現(xiàn)多尺度特征的漸進(jìn)式融合

4. 圖像到圖像轉(zhuǎn)換模塊

基于去噪擴(kuò)散概率模型(DDPMs)實現(xiàn)雙向跨模態(tài)轉(zhuǎn)換(圖7):
圖7:基于DDPMs的圖像轉(zhuǎn)換流程

  • 雙向轉(zhuǎn)換:同時支持紅外→可見光和可見光→紅外轉(zhuǎn)換,提供額外監(jiān)督信號

  • 創(chuàng)新設(shè)計:采用"緩存方案"規(guī)避DDPMs迭代計算的高開銷,訓(xùn)練時緩存轉(zhuǎn)換結(jié)果,推理時移除轉(zhuǎn)換模塊

  • 核心價值:減少模態(tài)分布差距,使單模態(tài)評估指標(biāo)可用于跨模態(tài)配準(zhǔn)訓(xùn)練

實驗驗證:全面超越SOTA方法 配準(zhǔn)性能評估

在NirScene和RoadScene數(shù)據(jù)集上的定性結(jié)果(圖8)顯示:
圖8:不同方法的配準(zhǔn)結(jié)果對比(紅色/黃色框為關(guān)鍵區(qū)域)

AU-Net在復(fù)雜場景中表現(xiàn)出更優(yōu)的對齊精度,尤其在局部細(xì)節(jié)區(qū)域(如行人頭部、建筑物邊緣)有效避免了偽影和不自然變形。定量評估中,在MSE、MAE、NCC等五項指標(biāo)中均排名第一,充分驗證了特征級聯(lián)合訓(xùn)練的優(yōu)勢。

融合性能評估

聯(lián)合配準(zhǔn)與融合的定性結(jié)果(圖9)表明:
圖9:不同方法的融合結(jié)果對比

AU-Net生成的融合圖像具有三個顯著優(yōu)勢:

  1. 完全消除視差導(dǎo)致的重疊偽影

  2. 更好保留多模態(tài)圖像的互補(bǔ)信息(如天空對比度、細(xì)節(jié)紋理)

  3. 有效抑制對齊區(qū)域的不自然變形

定量評估中,AU-Net在空間頻率(SF)、平均梯度(AG)等七項指標(biāo)中表現(xiàn)卓越,尤其在未訓(xùn)練的RoadScene數(shù)據(jù)集上仍保持優(yōu)異性能,證明了模型的強(qiáng)泛化能力。

總結(jié)與展望

AU-Net通過特征級聯(lián)合訓(xùn)練范式,實現(xiàn)了多模態(tài)圖像配準(zhǔn)與融合的深度統(tǒng)一,其創(chuàng)新點(diǎn)可概括為:

  • 首次提出FLJT范式,打破傳統(tǒng)級聯(lián)模式的局限

  • 動態(tài)融合模塊實現(xiàn)跨模態(tài)、跨尺度的自適應(yīng)特征聚合

  • 雙向擴(kuò)散轉(zhuǎn)換機(jī)制有效縮小模態(tài)差距,提供額外監(jiān)督

這項研究不僅為多模態(tài)圖像處理提供了新范式,其特征共享和動態(tài)適應(yīng)的設(shè)計思想,也為其他聯(lián)合任務(wù)(如分割與檢測、重建與增強(qiáng))提供了重要借鑒。未來,隨著模態(tài)種類的增加和應(yīng)用場景的拓展,AU-Net的設(shè)計理念有望在更廣泛的計算機(jī)視覺任務(wù)中發(fā)揮價值。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
1.2億次圍觀!伊萬卡攜娃截胡姆巴佩,卡塔爾包廂引爆流量核爆

1.2億次圍觀!伊萬卡攜娃截胡姆巴佩,卡塔爾包廂引爆流量核爆

羅氏八卦
2025-12-21 08:06:32
《阿凡達(dá)3》北美票房慘敗,僅收獲2.57億,預(yù)計將虧損近20億

《阿凡達(dá)3》北美票房慘敗,僅收獲2.57億,預(yù)計將虧損近20億

影視高原說
2025-12-21 09:53:41
我外交部突然發(fā)出警告,如果外媒消息屬實,中日事態(tài)將會相當(dāng)嚴(yán)重

我外交部突然發(fā)出警告,如果外媒消息屬實,中日事態(tài)將會相當(dāng)嚴(yán)重

混沌錄
2025-12-21 23:33:07
南博前院長"賣慘"不到12小時,雙重身份被扒,網(wǎng)友:左手倒右手?

南博前院長"賣慘"不到12小時,雙重身份被扒,網(wǎng)友:左手倒右手?

烈史
2025-12-21 18:47:04
官方通報:聯(lián)合調(diào)查組,已進(jìn)駐!

官方通報:聯(lián)合調(diào)查組,已進(jìn)駐!

南國今報
2025-12-20 21:35:36
當(dāng)美國海軍突襲中國貨船時,外界普遍認(rèn)為北京只能默默承受損失。

當(dāng)美國海軍突襲中國貨船時,外界普遍認(rèn)為北京只能默默承受損失。

安安說
2025-12-21 14:41:07
山西逆轉(zhuǎn)送天津4連?。毫滞ブt16+7+8助攻超胡明軒 詹姆斯25+13+8

山西逆轉(zhuǎn)送天津4連?。毫滞ブt16+7+8助攻超胡明軒 詹姆斯25+13+8

醉臥浮生
2025-12-21 21:44:41
鄭麗文訪問大陸,國民黨副主席曝重大消息,蔣孝嚴(yán)已來到大陸

鄭麗文訪問大陸,國民黨副主席曝重大消息,蔣孝嚴(yán)已來到大陸

娛樂的宅急便
2025-12-21 13:42:45
“妻兒三人被發(fā)小殺害案”后天開庭,家屬:兇手曾稱要結(jié)娃娃親,作案后假裝毫不知情,開庭當(dāng)天是亡妻30歲生日

“妻兒三人被發(fā)小殺害案”后天開庭,家屬:兇手曾稱要結(jié)娃娃親,作案后假裝毫不知情,開庭當(dāng)天是亡妻30歲生日

極目新聞
2025-12-21 20:18:19
當(dāng)年斥巨資拍攝的10大爛片,每一部都是電影界的奇恥大辱

當(dāng)年斥巨資拍攝的10大爛片,每一部都是電影界的奇恥大辱

小微看電影
2025-12-19 09:35:41
俄羅斯人想不明白:為什么強(qiáng)大的中國,幾千年都不要西伯利亞?

俄羅斯人想不明白:為什么強(qiáng)大的中國,幾千年都不要西伯利亞?

蜉蝣說
2025-12-21 23:26:46
原子彈炸后百年內(nèi)寸草不生,今廣島卻住滿了人,說好的百年絕地呢?

原子彈炸后百年內(nèi)寸草不生,今廣島卻住滿了人,說好的百年絕地呢?

歷史回憶室
2025-12-20 11:14:14
難得打出一場攻守兼?zhèn)涞谋憩F(xiàn),快船鋒線新援的狀態(tài)正在不斷復(fù)蘇?

難得打出一場攻守兼?zhèn)涞谋憩F(xiàn),快船鋒線新援的狀態(tài)正在不斷復(fù)蘇?

稻谷與小麥
2025-12-22 00:23:32
7輪0球!1億鋒霸又啞火,西甲陷入進(jìn)球荒,射手榜被姆巴佩甩開

7輪0球!1億鋒霸又啞火,西甲陷入進(jìn)球荒,射手榜被姆巴佩甩開

足球狗說
2025-12-21 23:00:21
工信部發(fā)話:老百姓要什么,就造什么樣的電動車

工信部發(fā)話:老百姓要什么,就造什么樣的電動車

老特有話說
2025-12-20 22:13:36
周琦一家近照,大6歲妻子身材好,兒子也愛籃球,29歲身家過億

周琦一家近照,大6歲妻子身材好,兒子也愛籃球,29歲身家過億

籃球看比賽
2025-12-21 13:07:53
一私人影院存在異性陪侍服務(wù) 西安警方通報

一私人影院存在異性陪侍服務(wù) 西安警方通報

新京報
2025-12-21 18:45:37
南方黑芝麻糊成分含量最多的竟然不是黑芝麻?配料表引爭議,最新回應(yīng)

南方黑芝麻糊成分含量最多的竟然不是黑芝麻?配料表引爭議,最新回應(yīng)

極目新聞
2025-12-20 14:28:37
老舅:崔國明賠光70萬,李小珍遺憾離世,才懂收養(yǎng)郭小雪是錯誤的

老舅:崔國明賠光70萬,李小珍遺憾離世,才懂收養(yǎng)郭小雪是錯誤的

白公子探劇
2025-12-21 23:59:44
雖然哈薩克斯坦要向日本出口能源和稀土,但是卻不能使用中歐班列

雖然哈薩克斯坦要向日本出口能源和稀土,但是卻不能使用中歐班列

梁獼愛玩車
2025-12-20 20:56:46
2025-12-22 00:43:00
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識,交流思想
5273文章數(shù) 64595關(guān)注度
往期回顧 全部

科技要聞

生態(tài)適配已超95% 鴻蒙下一關(guān):十萬個應(yīng)用

頭條要聞

必勝客牛排口感奇怪遭質(zhì)疑"到底用的什么肉" 官方介入

頭條要聞

必勝客牛排口感奇怪遭質(zhì)疑"到底用的什么肉" 官方介入

體育要聞

勇士火箭贏球:王牌之外的答案?

娛樂要聞

星光大賞太尷尬!搶話擋鏡頭,場地還小

財經(jīng)要聞

老房子“強(qiáng)制體檢”,政府出手了

汽車要聞

-30℃,標(biāo)致508L&凡爾賽C5 X冰雪"大考"

態(tài)度原創(chuàng)

健康
教育
親子
旅游
軍事航空

這些新療法,讓化療不再那么痛苦

教育要聞

英國畢業(yè)生收入最高的大學(xué)top3!

親子要聞

睡前說三句廢話對孩子情商發(fā)育有好處

旅游要聞

新年簽收一份蘭花香,你的風(fēng)雅旅途已到站!

軍事要聞

石破茂:擁核絕不會給日本帶來正面影響

無障礙瀏覽 進(jìn)入關(guān)懷版