国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI對抗遷移性評估的「撥亂反正」:那些年效果虛高的攻防算法們

0
分享至



本文第一作者 / 通訊作者趙正宇來自西安交通大學(xué),共同第一作者張焓韡、李仞玨分別來自德國薩爾大學(xué)、中科工業(yè)人工智能研究院。其他合作者分別來自法國馬賽中央理工、法國 INRIA 國家信息與自動化研究所、德國 CISPA 亥姆霍茲信息安全中心、清華大學(xué)、武漢大學(xué)、西安交通大學(xué)。

對抗樣本(adversarial examples)的遷移性(transferability)—— 在某個模型上生成的對抗樣本能夠同樣誤導(dǎo)其他未知模型 —— 被認為是威脅現(xiàn)實黑盒深度學(xué)習(xí)系統(tǒng)安全的核心因素。盡管現(xiàn)有研究已提出復(fù)雜多樣的遷移攻擊方法,卻仍缺乏系統(tǒng)且公平的方法對比分析:(1)針對攻擊遷移性,未采用公平超參設(shè)置的同類攻擊對比分析;(2)針對攻擊隱蔽性,缺乏多樣指標(biāo)。

為了解決上述問題,本文依據(jù)通用機器學(xué)習(xí)全周期階段,將遷移攻擊方法系統(tǒng)性劃分為五大類,并首次針對 23 種代表性攻擊與 11 種代表性防御方法(包括針對遷移的防御與現(xiàn)實世界的視覺系統(tǒng) API),在 ImageNet 數(shù)據(jù)集上開展對抗遷移性綜合評估,并通過大規(guī)模用戶實驗評估對抗隱蔽性。

本文證實上述評估缺陷確實導(dǎo)致了理解盲區(qū)甚至誤導(dǎo)性結(jié)論,而解決這些缺陷后帶來一系列新見解,例如:(1)早期攻擊方法 DI 性能反而超越所有后續(xù)同類攻擊;(2) 原本聲稱白盒防御方法 DiffPure 卻極易被(黑盒)遷移方法攻破;(3)幾乎所有攻擊方法在提升遷移性的同時,實則犧牲了(通過多樣化指標(biāo)量化的)攻擊隱蔽性。



  • 論文題目:Revisiting Transferable Adversarial Images: Systemization, Evaluation, and New Insights
  • 接收期刊:TPAMI 2025
  • 預(yù)印本鏈接:https://arxiv.org/abs/2310.11850
  • 代碼鏈接:https://github.com/ZhengyuZhao/TransferAttackEval

研究現(xiàn)狀

對抗樣本的遷移性是研究深度學(xué)習(xí)系統(tǒng)魯棒性的重要課題。在真實世界中,攻擊者往往無法訪問目標(biāo)模型的內(nèi)部參數(shù)或訓(xùn)練集(黑盒情形)。攻擊在一個 / 一類模型上生成后能否在另一個未知模型上保持效力(即攻擊遷移性),直接決定了攻擊的實際威脅水平與防御的有效性。

當(dāng)前相關(guān)研究存在兩個長期被忽略但是影響深遠的問題:

  • 攻擊遷移性(transferability)評估缺乏系統(tǒng)的一對一比較與公平的超參數(shù)設(shè)定:不同方法常在不同或不對等的超參數(shù)下對比,導(dǎo)致結(jié)論不可比或誤導(dǎo)性強。
  • 攻擊隱蔽性(stealthiness)幾乎沒有被系統(tǒng)評估: 許多工作只報告 Lp 約束下的成功率,而忽略了視覺 / 感知質(zhì)量和攻擊可溯源特性的差異;也就是說,攻擊「看上去」是否真實不可察覺并未被充分衡量。

這種不嚴(yán)格的比較與不完整的度量導(dǎo)致使得某些方法被高估或低估,進而誤導(dǎo)防御設(shè)計與研究方向。



創(chuàng)新發(fā)現(xiàn)


依托前文所建立的評估框架,我們得以從實驗結(jié)果中更清晰地分析對抗魯棒性的內(nèi)在因素。以下部分將概述主要發(fā)現(xiàn)與啟發(fā)性結(jié)論:

1.在公平的超參數(shù)設(shè)定下,早期方法 DI 竟優(yōu)于后續(xù)眾多所謂改進方法:許多后來被認為更強的遷移攻擊,實則得益于更有利的實驗設(shè)定。一旦把超參數(shù)公平化,DI 類的早期方法便會遙遙領(lǐng)先。因此,我們需要公平對比來避免誤導(dǎo)性結(jié)論。這不僅關(guān)系到學(xué)術(shù)層面的研究,更關(guān)系到實際系統(tǒng)對抗威脅的判斷與防御優(yōu)先級的設(shè)定。

2.擴散(diffusion)類防御方法依賴 “虛假安全感”:基于擴散原理進行去噪的防御方法雖然聲稱在白盒或某些自適應(yīng)攻擊下表現(xiàn)很強,但黑盒(遷移)攻擊反而可以很大程度上繞過這些防御。因此,此類防御方法只是由于評估不完善帶來的 “虛假安全感”

3.相同 Lp 約束下,不同攻擊在隱蔽性上有巨大差異,且隱蔽性與遷移性之間呈負相關(guān):即便所有攻擊都受同一 Lp 限制,在視覺感知度量(PSNR/SSIM/LPIPS 等)上依然差距很大。因此,除了常用 Lp 約束外,需要同時報告遷移性與多維度隱蔽性指標(biāo),以便合理權(quán)衡攻擊遷移性與隱蔽性。

具體評估建議與攻防設(shè)計參考如下:



評估框架與結(jié)果


本文依據(jù)通用機器學(xué)習(xí)全周期階段,將遷移攻擊方法系統(tǒng)性劃分為五大類,如下圖所示:



本文涉及了 23 種代表性攻擊與 11 種代表性防御方法,如下表所示:





針對攻擊遷移性,本文從兩個維度入手修正與完善現(xiàn)有評估基準(zhǔn):(1)引入完整的遷移攻擊方法分類,并進行公平的類內(nèi)(intra-category)比較;(2)從 “攻擊溯源(attack traceback)” 角度設(shè)計隱蔽性評估。更具體地說,本文拋棄了將不同類攻擊方法直接對比的傳統(tǒng)策略,而是對同類攻擊進行一對一、超參數(shù)公平化的對比實驗:統(tǒng)一攻擊強度約束(相同 Lp 限制)、統(tǒng)一優(yōu)化 / 迭代預(yù)算,并在同一組目標(biāo)模型 / 防御上逐項比較。



針對攻擊隱蔽性,本工作不再僅依靠單一 Lp 值來進行衡量,而是引入多樣化的感知質(zhì)量指標(biāo)(例如常用的 PSNR/SSIM/LPIPS 等)并結(jié)合更細粒度的隱蔽性特征。另外,本文創(chuàng)新性地引入 “攻擊溯源” 視角,分析攻擊是如何產(chǎn)生可見 / 可追溯的擾動(例如是否集中于圖像某些高頻區(qū)域、是否具有結(jié)構(gòu)化模式、擾動是否容易被現(xiàn)有檢測器或去噪機制識別)。









未來展望

我們呼吁研究界在對比任何(攻防)方法時務(wù)必采用一對一、超參數(shù)合理的公平設(shè)計;報告遷移性時同時報告多種感知 / 隱蔽性指標(biāo)(不僅是 Lp),并分析攻擊的可追溯性特征;在評估防御有效性時,必須納入可遷移黑盒攻擊的考驗,尤其是對擴散 / 去噪類防御要采用更全面的測試;公開代碼、超參數(shù)與評估腳本,以便社區(qū)復(fù)現(xiàn)與累積真實進展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
金正恩一句話讓全球震驚,韓國顫抖,中方第二天就出面發(fā)聲

金正恩一句話讓全球震驚,韓國顫抖,中方第二天就出面發(fā)聲

青煙小先生
2026-03-02 10:19:13
瓜帥崩潰?英超最新奪冠概率:阿森納83.3%,曼城16.6%,有15隊0%

瓜帥崩潰?英超最新奪冠概率:阿森納83.3%,曼城16.6%,有15隊0%

風(fēng)過鄉(xiāng)
2026-03-02 20:17:54
美專家急喊中國停手,自己壟斷技術(shù)60年卻不讓中國碰

美專家急喊中國停手,自己壟斷技術(shù)60年卻不讓中國碰

書寫傳奇
2026-03-02 23:28:24
沒人敢明說的真相:法拍拍不掉的房子,正在悄悄轉(zhuǎn)嫁成本

沒人敢明說的真相:法拍拍不掉的房子,正在悄悄轉(zhuǎn)嫁成本

言叔財經(jīng)視角
2026-03-01 22:50:30
社死:日本19歲少年偷了陽臺上的性感丁字褲,被捕后警方告知丁字褲主人是男的……

社死:日本19歲少年偷了陽臺上的性感丁字褲,被捕后警方告知丁字褲主人是男的……

日本物語
2026-03-02 20:35:15
家里有多少錢,才算有錢人?銀行行長:3個條件,達到其一就是!

家里有多少錢,才算有錢人?銀行行長:3個條件,達到其一就是!

生活新鮮市
2026-03-02 19:23:03
賴昌星妻子曾明娜現(xiàn)狀:獨居3000平老宅,生活如世外桃源

賴昌星妻子曾明娜現(xiàn)狀:獨居3000平老宅,生活如世外桃源

大眼妹妹
2026-03-03 04:02:37
2026元宵遇罕見紅月!老祖宗傳下4大禁忌,別不當(dāng)回事!

2026元宵遇罕見紅月!老祖宗傳下4大禁忌,別不當(dāng)回事!

老特有話說
2026-02-27 16:55:35
6死傷!湖南小區(qū)突發(fā)爆炸:駭人畫面流出,原因披露,目擊者發(fā)聲

6死傷!湖南小區(qū)突發(fā)爆炸:駭人畫面流出,原因披露,目擊者發(fā)聲

博士觀察
2026-03-02 10:16:19
重拳出擊?中方主動罕見“出招”:向全球釋放4大重要信號了

重拳出擊?中方主動罕見“出招”:向全球釋放4大重要信號了

瘋狂小菠蘿
2026-03-02 22:22:21
安徽一對母女嫁親父子倆:正面照曝光,詳細經(jīng)過披露,一細節(jié)尷尬

安徽一對母女嫁親父子倆:正面照曝光,詳細經(jīng)過披露,一細節(jié)尷尬

博士觀察
2026-03-02 15:59:31
西甲前瞻|皇馬1-2赫塔菲:殘陣出擊,恐遭滑鐵盧

西甲前瞻|皇馬1-2赫塔菲:殘陣出擊,恐遭滑鐵盧

體育世界
2026-03-02 17:53:33
陳紫函婚后十年翻紅,曾三年無戲拍,十二次試管嘗試

陳紫函婚后十年翻紅,曾三年無戲拍,十二次試管嘗試

暖心萌阿菇?jīng)?/span>
2026-03-02 02:33:39
49歲林心如斷崖式衰老,當(dāng)年的紫薇格格也老了,臉變長 抬頭紋好多

49歲林心如斷崖式衰老,當(dāng)年的紫薇格格也老了,臉變長 抬頭紋好多

陳意小可愛
2026-03-01 00:49:59
續(xù)航1036km!比亞迪新車官宣:3月5日,正式亮相

續(xù)航1036km!比亞迪新車官宣:3月5日,正式亮相

高科技愛好者
2026-03-02 23:13:22
美軍公布傷亡情況

美軍公布傷亡情況

環(huán)球時報國際
2026-03-02 00:10:13
凌晨2點浦東機場!4個女孩差點飛泰國,再晚2分鐘怕是救不回來了

凌晨2點浦東機場!4個女孩差點飛泰國,再晚2分鐘怕是救不回來了

生活魔術(shù)專家
2026-03-02 16:22:28
莫迪殺紅了眼!吞了中企幾百億,又派人來偷火,中國不能坐以待斃

莫迪殺紅了眼!吞了中企幾百億,又派人來偷火,中國不能坐以待斃

梁訊
2026-02-28 15:40:12
起泡膠、捏捏樂、水晶泥等網(wǎng)紅玩具 經(jīng)檢測:部分捏捏樂甲醛超標(biāo)33倍

起泡膠、捏捏樂、水晶泥等網(wǎng)紅玩具 經(jīng)檢測:部分捏捏樂甲醛超標(biāo)33倍

閃電新聞
2026-03-02 11:03:00
“想要我簽名嗎” 梅西霸氣失2追4后嘲諷對手主帥 后者曾捂嘴挑釁

“想要我簽名嗎” 梅西霸氣失2追4后嘲諷對手主帥 后者曾捂嘴挑釁

風(fēng)過鄉(xiāng)
2026-03-02 13:02:31
2026-03-03 05:20:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12395文章數(shù) 142575關(guān)注度
往期回顧 全部

科技要聞

蘋果中國官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

特朗普:對伊朗打擊或持續(xù)4至5周 已擊沉其10艘艦艇

頭條要聞

特朗普:對伊朗打擊或持續(xù)4至5周 已擊沉其10艘艦艇

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經(jīng)要聞

油價飆升 美伊沖突將如何攪動全球經(jīng)濟

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

游戲
教育
旅游
家居
公開課

外媒給《寶可夢》新作60分:不夠有趣的縫合怪

教育要聞

3月13日截止!山東綜評云平臺填寫教程!有視頻!

旅游要聞

熱度飆升!非遺、冰雪…禹州元宵“文旅大餐”承包圓滿佳節(jié)!

家居要聞

萬物互聯(lián) 享科技福祉

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版