国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

北大等提出MaskDCPT:通用圖像修復(fù)預(yù)訓(xùn)練新范式,PSNR提升3.77dB

0
分享至

文章來源:我愛計算機(jī)視覺(ID:aicvml)

朋友們,今天想跟大家聊一篇圖像修復(fù)領(lǐng)域的有意思的新工作。如今,我們對圖片質(zhì)量的要求越來越高,但拍攝過程中總免不了各種意外,比如模糊、噪點、光線不足等等。傳統(tǒng)的圖像修復(fù)模型往往是“??漆t(yī)生”,一個模型對應(yīng)一種問題。但我們更想要一個“全科醫(yī)生”,一個模型搞定所有圖像退化問題,這就是所謂的“通用圖像修復(fù)”。

最近,來自 北京大學(xué)、JIUTIAN Research 和國防科大 的研究者們就提出了一個名為 MaskDCPT 的通用圖像修復(fù)預(yù)訓(xùn)練方法。這個名字拆開看就是 Masked Degradation Classification Pre-Training(掩碼退化分類預(yù)訓(xùn)練),思路可以說非常巧妙。它不直接一上來就修復(fù)圖像,而是先學(xué)會“診斷”圖像壞掉的類型。

簡單來說,這個方法通過一個統(tǒng)一的框架,讓模型在預(yù)訓(xùn)練階段就見多識廣,不僅學(xué)會重建高質(zhì)量圖像,還學(xué)會了識別輸入圖像的“病癥”(即退化類型)。這種“診斷+治療”的模式,讓模型在面對各種復(fù)雜的、甚至是沒見過的圖像退化問題時,表現(xiàn)得異常出色。



  • 論文標(biāo)題 : Universal Image Restoration Pre-training via Masked Degradation Classification

  • 論文地址 : https://arxiv.org/abs/2510.13282

  • 代碼倉庫 : https://github.com/MILab-PKU/MaskDCPT

從官方給出的效果圖就能看到,無論是“五項全能”的綜合修復(fù)任務(wù),還是真實的現(xiàn)實世界場景,MaskDCPT 預(yù)訓(xùn)練過的模型在保真度和感知質(zhì)量上都達(dá)到了頂尖水平。

研究背景與動機(jī)

通用圖像修復(fù)的目標(biāo)是用一個模型解決多種多樣的圖像退化問題,比如去噪、去模糊、去雨、低光增強(qiáng)等等。之前的預(yù)訓(xùn)練方法,很多是借鑒自然語言處理領(lǐng)域的成功經(jīng)驗,比如掩碼自編碼器(MAE),在圖像上做類似“完形填空”的任務(wù)來學(xué)習(xí)特征。

但這些方法有個問題:它們大多只關(guān)注圖像內(nèi)容本身的重建,而忽略了一個非常重要的信息——圖像究竟是“怎么壞的”。不同類型的退化(比如高斯噪聲和JPEG壓縮),其底層特征和修復(fù)方式是截然不同的。如果模型能提前知道退化類型,無疑會對修復(fù)工作大有裨益。

作者們認(rèn)為,退化信息和圖像內(nèi)容信息在修復(fù)任務(wù)中是互補(bǔ)的。因此,他們想設(shè)計一種新的預(yù)訓(xùn)練范式,能同時利用這兩種信息,從而學(xué)習(xí)到更通用、更強(qiáng)大的圖像修復(fù)能力。

MaskDCPT:掩碼退化分類預(yù)訓(xùn)練

為了實現(xiàn)這個目標(biāo),研究者們設(shè)計了 MaskDCPT 框架。這個框架的整體流程相當(dāng)清晰直觀。


它的核心思想可以概括為以下幾步:

  1. 輸入與掩碼 :輸入一張低質(zhì)量(退化)的圖像,并像做“完形填空”一樣,在圖像上隨機(jī)遮掉一部分小塊(patch-level masking)。

  2. 編碼器提取特征 :一個修復(fù)骨干網(wǎng)絡(luò)(比如 CNN 或 Transformer)作為編碼器,負(fù)責(zé)從被遮擋的低質(zhì)量圖像中提取特征。

  3. 雙解碼器設(shè)計 :接下來是關(guān)鍵,模型有兩個“頭”(解碼器),分頭行動:

    • 重建解碼器 :它的任務(wù)是利用編碼器提煉的特征,把被遮擋的圖像“腦補(bǔ)”完整,重建出對應(yīng)的高質(zhì)量、無損的圖像。這是一個圖像重建任務(wù)。

    • 分類解碼器 :它的任務(wù)同樣是基于那些特征,但目標(biāo)不是重建圖像,而是判斷輸入的低質(zhì)量圖像到底屬于哪一種退化類型(比如是模糊了,還是加了噪點)。這是一個分類任務(wù)。

通過這種方式,MaskDCPT 將退化類型作為一種“極弱監(jiān)督”信號,巧妙地融入到預(yù)訓(xùn)練中。模型為了同時完成好“重建”和“分類”這兩個任務(wù),就必須學(xué)習(xí)到一種既懂圖像內(nèi)容、又懂退化信息的廣義特征表示。CV君覺得,這種設(shè)計有點像讓模型“知其然,亦知其所以然”,不僅要會修,還要知道修的是什么毛病,思路非常贊。

作者還通過實驗發(fā)現(xiàn),退化分類的準(zhǔn)確率和圖像修復(fù)的性能是正相關(guān)的,這印證了他們最初的猜想。同時,合適的掩碼率(mask ratio)也很重要,太低了模型學(xué)不到上下文,太高了又會丟失關(guān)鍵信息。


上圖展示了分類準(zhǔn)確率與訓(xùn)練迭代次數(shù)、圖像掩碼率的關(guān)系,可以看到隨著訓(xùn)練進(jìn)行,分類準(zhǔn)確率穩(wěn)步提升,并且在75%的掩碼率附近達(dá)到最佳。

UIR-2.5M:一個全新的大規(guī)模修復(fù)數(shù)據(jù)集

光有好的方法還不夠,還需要足夠多、足夠好的數(shù)據(jù)來“喂養(yǎng)”模型。為此,作者們還貢獻(xiàn)了一個大規(guī)模的通用圖像修復(fù)數(shù)據(jù)集——UIR-2.5M。


這個數(shù)據(jù)集有多“壕”呢?它包含了 250萬 個圖像對,涵蓋了 19種 不同的退化類型和超過 200個 退化等級,而且同時包含了合成數(shù)據(jù)和真實的現(xiàn)實世界數(shù)據(jù)。這為訓(xùn)練更魯棒、更通用的修復(fù)模型提供了堅實的基礎(chǔ)。

實驗效果:性能顯著提升

MaskDCPT 的效果到底如何?實驗結(jié)果給出了答案:非常驚艷。

全能型修復(fù)任務(wù)(All-in-One Restoration)

在包含去雨、去雪、去模糊、去噪和去霧的“五項全能”修復(fù)任務(wù)上,使用 MaskDCPT 預(yù)訓(xùn)練的模型,無論是基于 CNN 還是 Transformer 架構(gòu),性能都得到了巨大提升。


從上表中可以看到,與那些需要專門為“全能”任務(wù)設(shè)計的復(fù)雜模型相比,僅僅是用了 MaskDCPT 預(yù)訓(xùn)練的經(jīng)典模型(如 Uformer),就在 PSNR/SSIM 等指標(biāo)上輕松超越了它們。PSNR 指標(biāo)平均至少提升了 3.77 dB,這是一個非常顯著的進(jìn)步。


視覺效果對比也同樣證明了其優(yōu)越性,修復(fù)后的圖像細(xì)節(jié)更清晰,偽影更少。

真實世界與未見過的退化場景

更具挑戰(zhàn)性的是在真實世界和“域外”(Out-of-Domain)場景中的表現(xiàn)。


在6種真實世界的退化任務(wù)上,MaskDCPT 預(yù)訓(xùn)練的模型在感知指標(biāo) PIQE 上相比基線降低了 34.8%,這意味著修復(fù)后的圖像在人眼看起來更自然、質(zhì)量更高。


上圖的視覺對比非常直觀,經(jīng)過 MaskDCPT 預(yù)訓(xùn)練的模型能夠更好地處理真實復(fù)雜的低光和模糊問題。

當(dāng)面對訓(xùn)練時從未見過的高強(qiáng)度噪聲(σ = 75的高斯噪聲)時,MaskDCPT 展現(xiàn)了強(qiáng)大的泛化能力。


可以看到,只有經(jīng)過 MaskDCPT 預(yù)訓(xùn)練的模型能夠有效去除強(qiáng)噪聲,同時不產(chǎn)生多余的奇怪紋理。

混合退化場景

在更復(fù)雜的混合退化場景(比如低光+模糊)中,MaskDCPT 同樣表現(xiàn)出色。



無論是定量指標(biāo)還是視覺效果,都證明了該方法在處理復(fù)雜光照和結(jié)構(gòu)問題上的能力。

消融實驗

作者還進(jìn)行了一系列消融實驗,驗證了方法設(shè)計的合理性。例如,他們比較了不同的掩碼策略和掩碼率,證明了 patch-level 的掩碼和75%的掩碼率是最佳選擇。



同時,他們也驗證了退化分類這個任務(wù)的重要性,證明了它確實能幫助模型提升修復(fù)性能。


總結(jié)

總的來說,MaskDCPT 這個工作直觀、有效,通過一個巧妙的雙任務(wù)設(shè)計,為通用圖像修復(fù)的預(yù)訓(xùn)練提供了一個全新的、更強(qiáng)大的范式。作者不僅提出了新方法,還貢獻(xiàn)了寶貴的數(shù)據(jù)集和開源代碼,可以說是非常扎實和全面的工作了。

大家對這個“先診斷、后修復(fù)”的思路怎么看?歡迎在評論區(qū)留下你的看法!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中央安全生產(chǎn)考核巡查組在廣東發(fā)現(xiàn):一幼兒園存多處嚴(yán)重風(fēng)險隱患,鐵柵欄封窗、消防栓不出水

中央安全生產(chǎn)考核巡查組在廣東發(fā)現(xiàn):一幼兒園存多處嚴(yán)重風(fēng)險隱患,鐵柵欄封窗、消防栓不出水

紅星新聞
2025-12-18 19:56:24
周末打虎!江西省政協(xié)副主席尹建業(yè)任上落馬,長期在云南任職

周末打虎!江西省政協(xié)副主席尹建業(yè)任上落馬,長期在云南任職

界面新聞
2025-12-21 16:53:19
號稱鋼鐵女神!短發(fā)天花板,太驚艷了吧

號稱鋼鐵女神!短發(fā)天花板,太驚艷了吧

伊人河畔
2025-12-21 21:37:50
61歲許亞軍穿紅衣配牛仔褲現(xiàn)身北京,祁廳長這狀態(tài)吃了防腐劑嗎?

61歲許亞軍穿紅衣配牛仔褲現(xiàn)身北京,祁廳長這狀態(tài)吃了防腐劑嗎?

娛樂領(lǐng)航家
2025-12-21 18:00:06
黃阿火,任福耀科技大學(xué)黨委書記

黃阿火,任福耀科技大學(xué)黨委書記

極目新聞
2025-12-21 12:25:19
深圳“日入過萬”烤雞少年塌房了!獨(dú)家配方居然是用了“肉寶王”

深圳“日入過萬”烤雞少年塌房了!獨(dú)家配方居然是用了“肉寶王”

火山詩話
2025-12-20 10:25:37
這是有史以來最大的市場泡沫嗎?

這是有史以來最大的市場泡沫嗎?

常滌非觀點
2025-12-21 07:16:04
韓紅直呼“太離譜”,三甲醫(yī)生連番追問!5月齡小洛熙手術(shù)后離世仍需更多真相……

韓紅直呼“太離譜”,三甲醫(yī)生連番追問!5月齡小洛熙手術(shù)后離世仍需更多真相……

新民周刊
2025-12-21 14:48:33
布朗41+6三分賽季新高廣廈力克上海 胡金秋18分王哲林12+9

布朗41+6三分賽季新高廣廈力克上海 胡金秋18分王哲林12+9

醉臥浮生
2025-12-21 21:23:53
倪萍被官方徹查,代言坑老品牌8年撈金上億,央視一姐晚節(jié)盡毀

倪萍被官方徹查,代言坑老品牌8年撈金上億,央視一姐晚節(jié)盡毀

一盅情懷
2025-12-20 17:57:26
回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

就一點
2025-11-22 10:36:39
圣誕抓馬升級,貝克漢姆夫婦和大兒子布魯克林決裂取關(guān)!外婆和奶奶無辜受傷

圣誕抓馬升級,貝克漢姆夫婦和大兒子布魯克林決裂取關(guān)!外婆和奶奶無辜受傷

英國那些事兒
2025-12-21 23:19:22
克林頓與愛潑斯坦案受害者共浴照片披露

克林頓與愛潑斯坦案受害者共浴照片披露

揚(yáng)子晚報
2025-12-20 11:50:57
騎車下班路被堵 成都“較真哥”9天舉報92次違停

騎車下班路被堵 成都“較真哥”9天舉報92次違停

封面新聞
2025-12-19 16:09:10
北斗、GPS同時被干擾!栗正杰:殺敵一千自損八千

北斗、GPS同時被干擾!栗正杰:殺敵一千自損八千

看看新聞Knews
2025-12-21 20:41:10
沒有回旋余地,中國下令直接收回,17萬日本人淚奔,高市闖禍了!

沒有回旋余地,中國下令直接收回,17萬日本人淚奔,高市闖禍了!

影孖看世界
2025-12-21 11:49:21
霍思燕攜愛犬參加國際比賽獲得全場總冠軍,杜江自豪發(fā)文

霍思燕攜愛犬參加國際比賽獲得全場總冠軍,杜江自豪發(fā)文

鋭娛之樂
2025-12-21 08:37:03
攜程被大量用戶卸載!注銷按鈕點擊超300萬次,平臺暫未發(fā)布道歉

攜程被大量用戶卸載!注銷按鈕點擊超300萬次,平臺暫未發(fā)布道歉

火山詩話
2025-12-21 06:24:06
除了戰(zhàn)敗認(rèn)輸,已經(jīng)無路可走?洪森軍隊遭重創(chuàng):柬埔寨或爆發(fā)內(nèi)亂

除了戰(zhàn)敗認(rèn)輸,已經(jīng)無路可走?洪森軍隊遭重創(chuàng):柬埔寨或爆發(fā)內(nèi)亂

策前論
2025-12-20 23:12:53
臉都不要了,但還是低估了他們的無恥

臉都不要了,但還是低估了他們的無恥

胖胖說他不胖
2025-12-21 11:00:20
2025-12-22 02:52:49
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識,交流思想
5273文章數(shù) 64595關(guān)注度
往期回顧 全部

科技要聞

生態(tài)適配已超95% 鴻蒙下一關(guān):十萬個應(yīng)用

頭條要聞

洛熙爸爸看1000遍法醫(yī)視頻找女兒 發(fā)解剖臺畫面被禁播

頭條要聞

洛熙爸爸看1000遍法醫(yī)視頻找女兒 發(fā)解剖臺畫面被禁播

體育要聞

勇士火箭贏球:王牌之外的答案?

娛樂要聞

星光大賞太尷尬!搶話擋鏡頭,場地還小

財經(jīng)要聞

老房子“強(qiáng)制體檢”,政府出手了

汽車要聞

-30℃,標(biāo)致508L&凡爾賽C5 X冰雪"大考"

態(tài)度原創(chuàng)

家居
數(shù)碼
旅游
公開課
軍事航空

家居要聞

高端私宅 理想隱居圣地

數(shù)碼要聞

Linux 6.19修復(fù)希捷2TB機(jī)械硬盤導(dǎo)致SATA總線掉線問題

旅游要聞

萬物皆可愛

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

石破茂:擁核絕不會給日本帶來正面影響

無障礙瀏覽 進(jìn)入關(guān)懷版