国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

打臉整個(gè)AI圈!清華用“笨辦法”解決世界難題,專(zhuān)家直呼想不到

0
分享至

打臉整個(gè)AI圈!清華用“笨辦法”解決世界難題,專(zhuān)家直呼想不到

最近AI圈被一份報(bào)告炸開(kāi)了鍋。

斯坦福大學(xué)最新研究顯示,2025年以來(lái),針對(duì)多模態(tài)AI的視覺(jué)攻擊案例暴漲300%,其中67%的黑客把惡意指令藏進(jìn)圖片里,讓AI在毫無(wú)察覺(jué)的情況下輸出違規(guī)內(nèi)容。

就在全球?yàn)锳I安全頭疼的當(dāng)下,清華大學(xué)人工智能學(xué)院在AAAI 2025頂會(huì)上扔出了一枚“深水炸彈”——DAVSP技術(shù)。

這項(xiàng)研究猶如給AI裝上了“防毒軟件”,在幾乎不損傷模型智商的前提下,將惡意攻擊的識(shí)別率提升到90%以上。今天咱們就來(lái)扒一扒,這項(xiàng)技術(shù)到底牛在哪里。

說(shuō)實(shí)話(huà),現(xiàn)在的AI安全防護(hù)簡(jiǎn)直像是在打地鼠。你剛堵住文本漏洞,黑客就轉(zhuǎn)戰(zhàn)圖片領(lǐng)域。

比如有攻擊者把“如何制作炸彈”的指令藏進(jìn)一張貓咪圖片的像素里,AI在看到這幅人畜無(wú)害的圖片時(shí),竟然乖乖輸出詳細(xì)的操作指南。

當(dāng)前主流的防護(hù)手段有兩種路子,但都漏洞百出:

一種是文本安全提示,就是在用戶(hù)問(wèn)題前加一句“請(qǐng)遵守倫理規(guī)范”。這招對(duì)純文本還好使,但面對(duì)藏在圖片里的惡意指令,簡(jiǎn)直形同虛設(shè)。



另一種是視覺(jué)安全擾動(dòng),相當(dāng)于給圖片加上一層“馬賽克”噪聲。但這方法有個(gè)致命傷——安全性和實(shí)用性成了死對(duì)頭。就好比為了防病毒,直接把電腦鍵盤(pán)鎖死,結(jié)果正常功能也癱瘓了。

有個(gè)數(shù)據(jù)很能說(shuō)明問(wèn)題:2025年9月,伯克利的研究人員發(fā)現(xiàn),使用當(dāng)前最先進(jìn)的ESIII防護(hù)技術(shù)后,模型在MME評(píng)測(cè)基準(zhǔn)上的得分從1818分暴跌到1403分。

這相當(dāng)于讓一個(gè)清華學(xué)霸突然變成及格線徘徊的學(xué)渣。

更諷刺的是,即便付出如此代價(jià),面對(duì)FigStep基準(zhǔn)的惡意圖片時(shí),仍有30%的漏洞率。



問(wèn)題的根源在于,傳統(tǒng)方法只是治標(biāo)不治本。模型學(xué)會(huì)的不是真正識(shí)別危險(xiǎn),而是機(jī)械模仿“拒絕話(huà)術(shù)”。

這就好比小孩背會(huì)了“不能給陌生人開(kāi)門(mén)”,卻不理解為什么不能開(kāi)。于是經(jīng)常出現(xiàn)AI先禮貌地說(shuō)“抱歉不能幫忙”,轉(zhuǎn)頭就詳細(xì)講解如何實(shí)施網(wǎng)絡(luò)攻擊的荒誕場(chǎng)面。

面對(duì)這個(gè)行業(yè)難題,清華大學(xué)人工智能學(xué)院的李佳助理教授團(tuán)隊(duì)另辟蹊徑,提出了DAVSP(深度對(duì)齊視覺(jué)安全提示)技術(shù)。

這項(xiàng)研究之所以能獲得AAAI 2025的最高評(píng)分,關(guān)鍵在于它同時(shí)解決了“防不住”和“變笨了”兩大痛點(diǎn)。

第一招:視覺(jué)安全提示(VSP)——給圖片加個(gè)“智能邊框”。

想象一下,給每張圖片裝上一個(gè)智能門(mén)禁系統(tǒng)。傳統(tǒng)方法是在整張圖片上撒胡椒面似的加噪聲,而清華團(tuán)隊(duì)獨(dú)辟蹊徑,只在圖片外圍加一圈可訓(xùn)練的邊框。這個(gè)設(shè)計(jì)暗藏玄機(jī):

實(shí)驗(yàn)數(shù)據(jù)很有說(shuō)服力:使用VSP后,模型在MME良性任務(wù)上的表現(xiàn)與未加防護(hù)時(shí)基本持平,而在FigStep惡意攻擊測(cè)試中,識(shí)別率飆升至94.5%。



這相當(dāng)于既給AI穿上了防彈衣,又沒(méi)影響它跑步速度。

第二招:深度對(duì)齊(DA)——從“機(jī)械背誦”到“真正理解”。

如果說(shuō)VSP是給AI配了副好眼鏡,那深度對(duì)齊就是教會(huì)AI用腦子思考。研究團(tuán)隊(duì)有個(gè)驚人發(fā)現(xiàn):AI內(nèi)部其實(shí)自帶“危險(xiǎn)嗅覺(jué)”。

就像老刑警能憑直覺(jué)識(shí)別嫌疑人,AI處理惡意內(nèi)容和正常內(nèi)容時(shí),神經(jīng)元的激活模式確實(shí)存在差異。團(tuán)隊(duì)通過(guò)比較海量樣本,在AI大腦中定位出了“危險(xiǎn)感知區(qū)”。



具體操作分兩步走:

這就好比教孩子不是簡(jiǎn)單背誦“不能碰電源”,而是讓他理解觸電的后果。經(jīng)過(guò)這種深度訓(xùn)練的AI,看到危險(xiǎn)圖片時(shí)是真的“心里一激靈”,而不是機(jī)械地說(shuō)“我不能幫忙”。

DAVSP在實(shí)戰(zhàn)中的表現(xiàn)堪稱(chēng)驚艷。在MultiGuard、FigStep等多個(gè)權(quán)威測(cè)試中,其惡意攻擊識(shí)別率比現(xiàn)有最好技術(shù)高出26個(gè)百分點(diǎn)。

更難得的是,它對(duì)正常任務(wù)的影響微乎其微,在圖像描述、視覺(jué)問(wèn)答等測(cè)試中,性能波動(dòng)控制在1%以?xún)?nèi)。

最讓人驚喜的是它的泛化能力。一個(gè)在LLaVA模型上訓(xùn)練的安全邊框,直接移植到InstruCTBLIP模型上,仍然保持85%以上的防護(hù)效果。

這意味著未來(lái)可能開(kāi)發(fā)出通用安全模塊,像手機(jī)殺毒軟件一樣方便安裝。

當(dāng)然,技術(shù)還有進(jìn)化空間。比如在復(fù)雜圖像遮擋情況下的穩(wěn)定性,以及對(duì)新型攻擊手法的適應(yīng)性等,團(tuán)隊(duì)已經(jīng)在GitHub開(kāi)源代碼,邀請(qǐng)全球開(kāi)發(fā)者共同完善。



DAVSP技術(shù)的突破,給整個(gè)AI安全領(lǐng)域帶來(lái)了新思路。它證明了安全與性能不是非此即彼的選擇題。

就像汽車(chē)安全裝置不是簡(jiǎn)單限速,而是通過(guò)安全帶、氣囊等智能防護(hù),在保障安全的同時(shí)不影響駕駛體驗(yàn)。

隨著AI融入醫(yī)療、駕駛、金融等關(guān)鍵領(lǐng)域,這種“深度安全”理念顯得尤為重要。試想,如果醫(yī)療AI因?yàn)榘踩雷o(hù)而看錯(cuò)CT片子,或者自動(dòng)駕駛AI因過(guò)度防護(hù)而反應(yīng)遲鈍,后果都將不堪設(shè)想。

AI安全進(jìn)化史,就是從“打補(bǔ)丁”到“建免疫系統(tǒng)”的升級(jí)。清華DAVSP技術(shù)的價(jià)值,不僅在于解決了當(dāng)前的多模態(tài)安全難題,更開(kāi)創(chuàng)了“深度對(duì)齊”的安全新范式。



當(dāng)AI不僅能識(shí)別危險(xiǎn),更能理解危險(xiǎn)背后的邏輯,我們才能真正信任這些智能助手。

未來(lái),如果這項(xiàng)技術(shù)推廣到語(yǔ)音、視頻等更多場(chǎng)景,或許能從根本上構(gòu)建AI的安全防線。畢竟,讓機(jī)器真正懂得善惡底線,比單純追求更聰明更重要。



這項(xiàng)研究就像給AI世界裝上了“智慧大腦”,讓技術(shù)在快速發(fā)展的同時(shí),始終走在安全的軌道上。

聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
杭州靈隱寺,為何要保留“一代妖僧”的雕像?看到千萬(wàn)不要亂拜

杭州靈隱寺,為何要保留“一代妖僧”的雕像?看到千萬(wàn)不要亂拜

收藏大視界
2026-02-28 23:03:27
特朗普稱(chēng)同意與伊朗新領(lǐng)導(dǎo)層對(duì)話(huà)

特朗普稱(chēng)同意與伊朗新領(lǐng)導(dǎo)層對(duì)話(huà)

每日經(jīng)濟(jì)新聞
2026-03-02 08:17:27
特朗普怎么都沒(méi)想到,哈梅內(nèi)伊生前最后一項(xiàng)安排,讓美以進(jìn)退兩難

特朗普怎么都沒(méi)想到,哈梅內(nèi)伊生前最后一項(xiàng)安排,讓美以進(jìn)退兩難

藍(lán)色海邊
2026-03-03 00:27:07
國(guó)際原子能機(jī)構(gòu)總干事表示未發(fā)現(xiàn)伊朗核武制造計(jì)劃

國(guó)際原子能機(jī)構(gòu)總干事表示未發(fā)現(xiàn)伊朗核武制造計(jì)劃

財(cái)聯(lián)社
2026-03-03 00:37:09
救命,國(guó)產(chǎn)爛片又刷新下限了

救命,國(guó)產(chǎn)爛片又刷新下限了

喵喵娛樂(lè)團(tuán)
2026-02-28 16:41:47
凌晨浦東機(jī)場(chǎng):四女孩險(xiǎn)飛泰國(guó),兩分鐘之差險(xiǎn)釀悲劇

凌晨浦東機(jī)場(chǎng):四女孩險(xiǎn)飛泰國(guó),兩分鐘之差險(xiǎn)釀悲劇

劉拕?wù)f體壇
2026-03-02 09:03:39
2月車(chē)市,再給新能源汽車(chē)潑一大盆冷水,涼透了

2月車(chē)市,再給新能源汽車(chē)潑一大盆冷水,涼透了

互聯(lián)網(wǎng).亂侃秀
2026-03-02 10:06:29
華國(guó)鋒擔(dān)任中央主席時(shí),中央先后任命了15位開(kāi)國(guó)將帥輔佐他

華國(guó)鋒擔(dān)任中央主席時(shí),中央先后任命了15位開(kāi)國(guó)將帥輔佐他

雍親王府
2026-03-02 15:55:03
欠中國(guó)的錢(qián),委內(nèi)瑞拉不還了?美財(cái)長(zhǎng):中國(guó)已無(wú)法繼續(xù)獲得委石油

欠中國(guó)的錢(qián),委內(nèi)瑞拉不還了?美財(cái)長(zhǎng):中國(guó)已無(wú)法繼續(xù)獲得委石油

萌城少年強(qiáng)
2026-01-22 12:47:40
伊朗戰(zhàn)事升級(jí),對(duì)中國(guó)5大產(chǎn)業(yè)影響深遠(yuǎn),普通人別只看熱鬧

伊朗戰(zhàn)事升級(jí),對(duì)中國(guó)5大產(chǎn)業(yè)影響深遠(yuǎn),普通人別只看熱鬧

觸摸史跡
2026-03-02 21:14:00
向美國(guó)捐8億被罵叛徒!無(wú)錫唐氏21代掌門(mén):我的錢(qián)只認(rèn)文明歸屬

向美國(guó)捐8億被罵叛徒!無(wú)錫唐氏21代掌門(mén):我的錢(qián)只認(rèn)文明歸屬

談史論天地
2026-02-10 08:16:24
白忙活了?特朗普萬(wàn)萬(wàn)沒(méi)想到,哈梅內(nèi)伊殉職后,伊朗軍隊(duì)沒(méi)人叛逃

白忙活了?特朗普萬(wàn)萬(wàn)沒(méi)想到,哈梅內(nèi)伊殉職后,伊朗軍隊(duì)沒(méi)人叛逃

楠楠自語(yǔ)
2026-03-02 22:31:05
這個(gè)死磕王楚欽的裁判,決賽就沒(méi)讓她上場(chǎng)

這個(gè)死磕王楚欽的裁判,決賽就沒(méi)讓她上場(chǎng)

楊仔述
2026-03-02 11:13:02
人可以狠心到什么程度?看網(wǎng)友講述,發(fā)現(xiàn)我真做不到這般絕

人可以狠心到什么程度?看網(wǎng)友講述,發(fā)現(xiàn)我真做不到這般絕

侃神評(píng)故事
2026-02-27 07:40:03
回顧:女碩士被丈夫用拖鞋拍死,生前求饒2小時(shí):我懷著你的弟弟

回顧:女碩士被丈夫用拖鞋拍死,生前求饒2小時(shí):我懷著你的弟弟

談史論天地
2026-03-02 13:11:55
法國(guó)和浙江同為6000萬(wàn)人口,2025年法國(guó)創(chuàng)3萬(wàn)億美元GDP,浙江呢?

法國(guó)和浙江同為6000萬(wàn)人口,2025年法國(guó)創(chuàng)3萬(wàn)億美元GDP,浙江呢?

八斗小先生
2026-02-28 18:56:17
歷史性轉(zhuǎn)折!黎巴嫩正式清場(chǎng)真主黨,中東格局一夜改寫(xiě)

歷史性轉(zhuǎn)折!黎巴嫩正式清場(chǎng)真主黨,中東格局一夜改寫(xiě)

老馬拉車(chē)莫少裝
2026-03-02 23:27:10
550億美元砸進(jìn)炮火:一場(chǎng)工業(yè)體系的極限對(duì)沖

550億美元砸進(jìn)炮火:一場(chǎng)工業(yè)體系的極限對(duì)沖

七分日記
2026-02-26 23:01:48
真香預(yù)警 低價(jià)MacBook性?xún)r(jià)比無(wú)敵!降維打擊Windows、等等黨最終歸宿

真香預(yù)警 低價(jià)MacBook性?xún)r(jià)比無(wú)敵!降維打擊Windows、等等黨最終歸宿

快科技
2026-03-02 10:50:12
內(nèi)賈德遇害細(xì)節(jié)公布,家中遭毒手,本人和保鏢雙雙殞命?

內(nèi)賈德遇害細(xì)節(jié)公布,家中遭毒手,本人和保鏢雙雙殞命?

小影的娛樂(lè)
2026-03-03 00:46:39
2026-03-03 01:56:49
春序娛樂(lè)
春序娛樂(lè)
感恩歷史里的人與事。
4576文章數(shù) 738關(guān)注度
往期回顧 全部

科技要聞

蘋(píng)果中國(guó)官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

中國(guó)留學(xué)生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

頭條要聞

中國(guó)留學(xué)生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對(duì)手主帥

娛樂(lè)要聞

李亞鵬與哥哥和解 只有一條真心話(huà)短信

財(cái)經(jīng)要聞

油價(jià)飆升 美伊沖突將如何攪動(dòng)全球經(jīng)濟(jì)

汽車(chē)要聞

國(guó)民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

健康
親子
數(shù)碼
教育
公開(kāi)課

轉(zhuǎn)頭就暈的耳石癥,能開(kāi)車(chē)上班嗎?

親子要聞

45歲這年,我這個(gè)二胎媽媽決定做一件“瘋狂”的事

數(shù)碼要聞

高通MWC 2026發(fā)布多項(xiàng)通信技術(shù),定檔2029年開(kāi)啟6G商用

教育要聞

特別猛,但在留學(xué)生心中存在感很低的英國(guó)大學(xué)!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版