国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

反直覺!擴(kuò)散模型「跨界」復(fù)原: 只用臥室模型,竟能復(fù)原人臉

0
分享至



自擴(kuò)散模型提出以來,它不僅在圖像、視頻和音頻生成方面取得了優(yōu)異效果,也正逐漸成為解決圖像復(fù)原、超分辨率、去模糊等逆問題的重要工具。

這個領(lǐng)域長期以來普遍認(rèn)為,作為先驗的擴(kuò)散模型必須足夠強(qiáng),且其訓(xùn)練圖像分布需要與目標(biāo)圖像分布高度匹配。因此,經(jīng)典算法通常會采用在目標(biāo)領(lǐng)域上充分訓(xùn)練的擴(kuò)散模型來進(jìn)行圖像恢復(fù),否則恢復(fù)質(zhì)量往往會明顯下降。

然而,近期來自羅格斯大學(xué)、杜克大學(xué)和密歇根大學(xué)的一項最新研究表明,即使是「弱」擴(kuò)散先驗和完全不匹配的數(shù)據(jù)分布,也可以實現(xiàn)高質(zhì)量圖像重建。

這篇題為《Weak Diffusion Priors Can Still Achieve Strong Inverse-Problem Performance》的工作不僅展示了這種反直覺的實驗現(xiàn)象,還首次從理論和實驗層面解釋了這種「弱先驗依然有效」的機(jī)制。



  • 論文地址:https://arxiv.org/abs/2601.22443

一個反直覺的實驗:臥室擴(kuò)散模型重構(gòu)人臉



僅使用 3 步 DDIM 擴(kuò)散模型作為先驗進(jìn)行圖像重建:匹配先驗(上)與不匹配先驗(下)的對比。在底部左圖(或底部右圖)中,可以看到在臥室圖像(或人臉圖像)上訓(xùn)練的擴(kuò)散模型依然能夠重建人臉圖像(或臥室圖像)。從左到右展示的是優(yōu)化迭代過程中不同階段的中間重建結(jié)果。「Reference」列表示干凈的真實圖像,「Measurement」列表示帶噪聲的觀測圖像。

首先展示一組很有沖擊力的實驗。如上圖左下所示,在優(yōu)化初始噪聲(initial noise optimization)的框架下,使用只在 LSUN-bedroom 數(shù)據(jù)集上訓(xùn)練的 3 步 DDIM 擴(kuò)散模型可以重構(gòu) CelebA-HQ 數(shù)據(jù)集中的人臉圖像。

擴(kuò)散模型在初始階段只能生成模糊的臥室圖像,但隨著優(yōu)化不斷推進(jìn),原本只能生成臥室圖像的模型逐漸擺脫了低質(zhì)量結(jié)果和「臥室結(jié)構(gòu)」偏好,最終恢復(fù)出清晰且高質(zhì)量的人臉圖像。

同樣的,用只能生成人臉的擴(kuò)散模型,也可以有效重建臥室圖像??梢詮南旅娴膭訄D看到這個「臥室變臉」的過程。



這個現(xiàn)象在 X 上也引發(fā)了討論。有網(wǎng)友感嘆道:「一個只用臥室圖片訓(xùn)練的擴(kuò)散模型竟然能生成人臉,真的太嚇人了!」



這些現(xiàn)象進(jìn)一步引導(dǎo)團(tuán)隊思考這樣一個問題:在擴(kuò)散先驗較弱且訓(xùn)練分布與目標(biāo)分布不匹配的情況下,圖像復(fù)原成功的機(jī)制究竟是什么?

現(xiàn)實問題:強(qiáng)先驗并不總是存在

這樣的問題并不只是來自一些看起來「反直覺」的實驗結(jié)果,更有明確的實際背景。在實際應(yīng)用中,并不總是有一個高質(zhì)量和數(shù)據(jù)匹配的先驗?zāi)P停?/p>

  • 內(nèi)存和計算限制使得擴(kuò)散模型步數(shù)被截斷;
  • 醫(yī)學(xué)成像、遙感成像、科學(xué)成像等場景中,目標(biāo)數(shù)據(jù)往往稀缺且分布特殊,很難專門訓(xùn)練一個完全匹配的生成模型。

這項研究旨在回答三個問題:

  • When(何時有效):弱 / 不匹配先驗在什么條件下仍能實現(xiàn)高質(zhì)量重建?
  • Why(內(nèi)在機(jī)制):這種超越分布的魯棒性源自何處?
  • Limitations(失效邊界):這種能力在何時會達(dá)到極限?

核心結(jié)論:重建常是觀測主導(dǎo)的

當(dāng)觀測數(shù)據(jù)本身提供足夠充足的信息時,重建過程將由觀測驅(qū)動(observation-dominant)而非先驗驅(qū)動。因此,模型對先驗的強(qiáng)弱和匹配度表現(xiàn)出顯著的不敏感性。

簡單來說,當(dāng)觀測數(shù)據(jù)維度高、強(qiáng)可辨識性、有效像素數(shù)量多時,后驗分布會集中到真實解附近,即便先驗較弱,也不會顯著影響最終結(jié)果。

這一觀點與傳統(tǒng)「先驗決定一切」的觀點形成鮮明對比。

多任務(wù)實驗全面驗證

團(tuán)隊在圖像復(fù)原(inpainting)、高斯去模糊(Gaussian debluring)、超分辨率(super-resolution)、非線性去模糊(nonlinear debluring)等經(jīng)典圖像逆問題上進(jìn)行了大量的實驗,采用的擴(kuò)散模型和數(shù)據(jù)集包括 LSUN-bedroom、LSUN-church 和 CelebA-HQ。

實驗結(jié)果顯示:

  • 在優(yōu)化初始噪聲的框架下,僅使用 3 步 DDIM 的弱先驗擴(kuò)散模型在 PSNR、SSIM、LPIPS 等各項指標(biāo)上超過使用 1000 步模型的 baseline 方法;
  • 即使模型訓(xùn)練數(shù)據(jù)領(lǐng)域與圖像重建目標(biāo)領(lǐng)域完全不一樣,性能的下降也非常有限,甚至能夠超越領(lǐng)域一致和使用 1000 步模型的 baseline 方法。



跨數(shù)據(jù)領(lǐng)域的圖像修復(fù)與超分辨率結(jié)果對比?!窶odel」表示擴(kuò)散模型的訓(xùn)練數(shù)據(jù)來源(即先驗的源領(lǐng)域),「CelebA」「Bedroom」「Church」表示被重建圖像的目標(biāo)領(lǐng)域。需要說明的是,baseline 方法 DPS 始終采用與目標(biāo)數(shù)據(jù)一致的領(lǐng)域內(nèi)模型。

理論突破:從貝葉斯后驗集中 (Posterior Concentration) 解釋現(xiàn)象

為了理解這種現(xiàn)象,團(tuán)隊從貝葉斯視角出發(fā),基于高斯混合模型建立了一個高維逆問題的分析框架,在滿足一定的假設(shè)條件時:

  • 后驗分布會以維度的指數(shù)級速度集中在最匹配的重建圖像附近;
  • 當(dāng)觀測數(shù)據(jù)維度足夠高、包含信息足夠充分時(例如觀測到的像素、邊緣、紋理多),即使非常不同的先驗分布,都會得到相似的重建圖像。

另外,團(tuán)隊在 LSUN-bedroom、LSUN-church 和 CelabA-HQ 等數(shù)據(jù)集上進(jìn)行了數(shù)據(jù)模擬,證明了上述理論分析的假設(shè)在實際數(shù)據(jù)和問題中的有效性。

弱先驗?zāi)P偷氖н吔?/p>

值得注意的是,弱先驗并非萬能,團(tuán)隊系統(tǒng)分析了其失敗場景。在觀測圖像信息不充分時,例如大面積連續(xù)遮擋(box inpainting)和極端超分辨率(16x super-resolution)這些低信息量任務(wù)中,重建圖像將重新變得由先驗主導(dǎo)(prior-dominant),在這種情況下強(qiáng)先驗依然重要。

例如下圖最后一列,使用人臉模型重建的教堂圖像會出現(xiàn)明顯的人臉特征。



上半部分:60% x 60% 連續(xù)遮擋;下半部分:16 倍超分辨率。

結(jié)論

團(tuán)隊系統(tǒng)地研究了弱先驗擴(kuò)散模型在逆問題中的應(yīng)用,從實驗和理論上證明了其有效性,并展示了其典型的失敗模式,指出了清晰的應(yīng)用邊界,避免誤用。

這項工作為社區(qū)帶來的啟示可能遠(yuǎn)超算法本身:

  • 在觀測數(shù)據(jù)信息充分的情況下,弱先驗比傳統(tǒng)認(rèn)知中更有效。當(dāng)使用者沒有一個非常匹配的強(qiáng)先驗時,可以使用弱先驗進(jìn)行圖像重建;
  • 在未來的研究中,研究者或?qū)⒏嗟仃P(guān)注弱先驗,特別是少步數(shù)擴(kuò)散模型先驗的相關(guān)算法,同時考慮將初始噪聲優(yōu)化和傳統(tǒng)算法結(jié)合。

作者介紹

本文共同第一作者為羅格斯大學(xué)計算機(jī)系博士生賈婧、統(tǒng)計系博士生袁偉。

其他作者包括杜克大學(xué)劉思繁、密歇根大學(xué)申荔月、羅格斯大學(xué)王冠揚。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
德國人日常三餐曝光!6個習(xí)慣讓人不去醫(yī)院,國人看完沉默了?

德國人日常三餐曝光!6個習(xí)慣讓人不去醫(yī)院,國人看完沉默了?

路醫(yī)生健康科普
2026-03-04 12:30:03
被問爆了!小龍蝦用什么電腦裝?選哪個模型省錢?這篇“養(yǎng)蝦”保姆級教程請收好

被問爆了!小龍蝦用什么電腦裝?選哪個模型省錢?這篇“養(yǎng)蝦”保姆級教程請收好

AI范兒
2026-03-06 20:54:35
中國2000多個縣城的生存現(xiàn)狀:除了性生活就是打麻將!

中國2000多個縣城的生存現(xiàn)狀:除了性生活就是打麻將!

談史論天地
2026-03-03 18:02:29
伊朗發(fā)視頻嘲諷:500萬美元導(dǎo)彈摧毀10美元假直升機(jī) 這就是所謂的“精準(zhǔn)勝利”

伊朗發(fā)視頻嘲諷:500萬美元導(dǎo)彈摧毀10美元假直升機(jī) 這就是所謂的“精準(zhǔn)勝利”

閃電新聞
2026-03-07 14:00:07
再恩愛也沒用!上海38歲陳成去世,煙酒不沾,死因曝光,妻兒悲痛

再恩愛也沒用!上海38歲陳成去世,煙酒不沾,死因曝光,妻兒悲痛

八斗小先生
2026-03-09 15:16:02
10 億人熱議!高速免費改 5000 公里被否,官方釋放 3 大信號

10 億人熱議!高速免費改 5000 公里被否,官方釋放 3 大信號

小影的娛樂
2026-03-09 00:11:38
A股:緊急提醒2.5億股民!從今天起,或許牛市歷史總是驚人的相似

A股:緊急提醒2.5億股民!從今天起,或許牛市歷史總是驚人的相似

另子維愛讀史
2026-03-09 19:23:59
總投資達(dá)88億!四川最大高鐵站即將建成!似類鳥巢建筑

總投資達(dá)88億!四川最大高鐵站即將建成!似類鳥巢建筑

金哥說新能源車
2026-03-09 19:59:02
王菲春晚唱完沒回北京,直接去了劉嘉玲家;別人曬合照她素顏蹺腿

王菲春晚唱完沒回北京,直接去了劉嘉玲家;別人曬合照她素顏蹺腿

阿廢冷眼觀察所
2026-03-09 06:11:58
2018年女足國腳張歐影病逝美國,臨終丈夫為其換7號球衣

2018年女足國腳張歐影病逝美國,臨終丈夫為其換7號球衣

王糬自駕
2026-02-27 12:37:13
事關(guān)1.6億老年網(wǎng)民!港區(qū)全國人大代表冼漢迪:支持子女綁定父母賬號,風(fēng)險轉(zhuǎn)賬可及時鎖定

事關(guān)1.6億老年網(wǎng)民!港區(qū)全國人大代表冼漢迪:支持子女綁定父母賬號,風(fēng)險轉(zhuǎn)賬可及時鎖定

時代周報
2026-03-08 20:39:14
手機(jī)有沒有被監(jiān)聽?看一眼頂部狀態(tài)欄就清楚

手機(jī)有沒有被監(jiān)聽?看一眼頂部狀態(tài)欄就清楚

小柱解說游戲
2026-03-08 05:10:17
三航母齊聚中東,霸權(quán)崩盤的兇兆!

三航母齊聚中東,霸權(quán)崩盤的兇兆!

漢唐智庫
2026-03-09 12:17:04
中俄聯(lián)手封殺美國的新計劃,伊朗最期待一幕出現(xiàn),特朗普坐不住了

中俄聯(lián)手封殺美國的新計劃,伊朗最期待一幕出現(xiàn),特朗普坐不住了

兵說
2026-03-08 23:45:05
導(dǎo)彈突然變準(zhǔn)了,美軍雷達(dá)全啞火,這到底咋回事?

導(dǎo)彈突然變準(zhǔn)了,美軍雷達(dá)全啞火,這到底咋回事?

念得小柔
2026-03-09 00:10:46
日本軍工重大調(diào)整,武器出口將不再受限

日本軍工重大調(diào)整,武器出口將不再受限

史政先鋒
2026-03-09 19:56:23
搞砸伊朗,特朗普或?qū)⑵嗝绹淖詈笠唤z國運

搞砸伊朗,特朗普或?qū)⑵嗝绹淖詈笠唤z國運

云石
2026-03-08 22:22:09
普京祝賀伊朗新任最高領(lǐng)袖

普京祝賀伊朗新任最高領(lǐng)袖

財聯(lián)社
2026-03-09 18:14:08
來俊臣的酷刑有多狠?曾有女犯哀求:只要不上刑,殺全族都行

來俊臣的酷刑有多狠?曾有女犯哀求:只要不上刑,殺全族都行

銘記歷史呀
2026-03-09 15:28:19
總進(jìn)球數(shù)占優(yōu),烏茲別克斯坦女足壓過菲律賓率先出線

總進(jìn)球數(shù)占優(yōu),烏茲別克斯坦女足壓過菲律賓率先出線

懂球帝
2026-03-09 19:54:04
2026-03-09 23:27:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12451文章數(shù) 142579關(guān)注度
往期回顧 全部

科技要聞

OpenClaw更新,"養(yǎng)蝦"再也不會犯健忘癥了

頭條要聞

美以伊鏖戰(zhàn)之際 一些地區(qū)玩家難抑沖動進(jìn)入"格斗"模式

頭條要聞

美以伊鏖戰(zhàn)之際 一些地區(qū)玩家難抑沖動進(jìn)入"格斗"模式

體育要聞

36連勝終結(jié)!大魔王也是可以戰(zhàn)勝的

娛樂要聞

薛之謙老婆懷二胎,現(xiàn)身產(chǎn)檢心情愉快

財經(jīng)要聞

油價破100美元年內(nèi)漲80% 全球市場劇震

汽車要聞

對標(biāo)奔馳小號G級 路虎小型衛(wèi)士最新消息曝光

態(tài)度原創(chuàng)

時尚
藝術(shù)
親子
本地
公開課

真正的獨立女性,從不在深夜委屈自己

藝術(shù)要聞

吳冠中畫長江,氣勢磅礴

親子要聞

孩子身邊有這樣的人,請遠(yuǎn)離,請警惕!

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版