国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

打臉整個AI圈!清華用“笨辦法”解決世界難題,專家直呼想不到

0
分享至

打臉整個AI圈!清華用“笨辦法”解決世界難題,專家直呼想不到

最近AI圈被一份報告炸開了鍋。

斯坦福大學最新研究顯示,2025年以來,針對多模態(tài)AI的視覺攻擊案例暴漲300%,其中67%的黑客把惡意指令藏進圖片里,讓AI在毫無察覺的情況下輸出違規(guī)內(nèi)容。

就在全球為AI安全頭疼的當下,清華大學人工智能學院在AAAI 2025頂會上扔出了一枚“深水炸彈”——DAVSP技術(shù)。

這項研究猶如給AI裝上了“防毒軟件”,在幾乎不損傷模型智商的前提下,將惡意攻擊的識別率提升到90%以上。今天咱們就來扒一扒,這項技術(shù)到底牛在哪里。

說實話,現(xiàn)在的AI安全防護簡直像是在打地鼠。你剛堵住文本漏洞,黑客就轉(zhuǎn)戰(zhàn)圖片領(lǐng)域。

比如有攻擊者把“如何制作炸彈”的指令藏進一張貓咪圖片的像素里,AI在看到這幅人畜無害的圖片時,竟然乖乖輸出詳細的操作指南。

當前主流的防護手段有兩種路子,但都漏洞百出:

一種是文本安全提示,就是在用戶問題前加一句“請遵守倫理規(guī)范”。這招對純文本還好使,但面對藏在圖片里的惡意指令,簡直形同虛設(shè)。



另一種是視覺安全擾動,相當于給圖片加上一層“馬賽克”噪聲。但這方法有個致命傷——安全性和實用性成了死對頭。就好比為了防病毒,直接把電腦鍵盤鎖死,結(jié)果正常功能也癱瘓了。

有個數(shù)據(jù)很能說明問題:2025年9月,伯克利的研究人員發(fā)現(xiàn),使用當前最先進的ESIII防護技術(shù)后,模型在MME評測基準上的得分從1818分暴跌到1403分。

這相當于讓一個清華學霸突然變成及格線徘徊的學渣。

更諷刺的是,即便付出如此代價,面對FigStep基準的惡意圖片時,仍有30%的漏洞率。



問題的根源在于,傳統(tǒng)方法只是治標不治本。模型學會的不是真正識別危險,而是機械模仿“拒絕話術(shù)”。

這就好比小孩背會了“不能給陌生人開門”,卻不理解為什么不能開。于是經(jīng)常出現(xiàn)AI先禮貌地說“抱歉不能幫忙”,轉(zhuǎn)頭就詳細講解如何實施網(wǎng)絡(luò)攻擊的荒誕場面。

面對這個行業(yè)難題,清華大學人工智能學院的李佳助理教授團隊另辟蹊徑,提出了DAVSP(深度對齊視覺安全提示)技術(shù)。

這項研究之所以能獲得AAAI 2025的最高評分,關(guān)鍵在于它同時解決了“防不住”和“變笨了”兩大痛點。

第一招:視覺安全提示(VSP)——給圖片加個“智能邊框”。

想象一下,給每張圖片裝上一個智能門禁系統(tǒng)。傳統(tǒng)方法是在整張圖片上撒胡椒面似的加噪聲,而清華團隊獨辟蹊徑,只在圖片外圍加一圈可訓練的邊框。這個設(shè)計暗藏玄機:

實驗數(shù)據(jù)很有說服力:使用VSP后,模型在MME良性任務(wù)上的表現(xiàn)與未加防護時基本持平,而在FigStep惡意攻擊測試中,識別率飆升至94.5%。



這相當于既給AI穿上了防彈衣,又沒影響它跑步速度。

第二招:深度對齊(DA)——從“機械背誦”到“真正理解”。

如果說VSP是給AI配了副好眼鏡,那深度對齊就是教會AI用腦子思考。研究團隊有個驚人發(fā)現(xiàn):AI內(nèi)部其實自帶“危險嗅覺”。

就像老刑警能憑直覺識別嫌疑人,AI處理惡意內(nèi)容和正常內(nèi)容時,神經(jīng)元的激活模式確實存在差異。團隊通過比較海量樣本,在AI大腦中定位出了“危險感知區(qū)”。



具體操作分兩步走:

這就好比教孩子不是簡單背誦“不能碰電源”,而是讓他理解觸電的后果。經(jīng)過這種深度訓練的AI,看到危險圖片時是真的“心里一激靈”,而不是機械地說“我不能幫忙”。

DAVSP在實戰(zhàn)中的表現(xiàn)堪稱驚艷。在MultiGuard、FigStep等多個權(quán)威測試中,其惡意攻擊識別率比現(xiàn)有最好技術(shù)高出26個百分點。

更難得的是,它對正常任務(wù)的影響微乎其微,在圖像描述、視覺問答等測試中,性能波動控制在1%以內(nèi)。

最讓人驚喜的是它的泛化能力。一個在LLaVA模型上訓練的安全邊框,直接移植到InstruCTBLIP模型上,仍然保持85%以上的防護效果。

這意味著未來可能開發(fā)出通用安全模塊,像手機殺毒軟件一樣方便安裝。

當然,技術(shù)還有進化空間。比如在復雜圖像遮擋情況下的穩(wěn)定性,以及對新型攻擊手法的適應(yīng)性等,團隊已經(jīng)在GitHub開源代碼,邀請全球開發(fā)者共同完善。



DAVSP技術(shù)的突破,給整個AI安全領(lǐng)域帶來了新思路。它證明了安全與性能不是非此即彼的選擇題。

就像汽車安全裝置不是簡單限速,而是通過安全帶、氣囊等智能防護,在保障安全的同時不影響駕駛體驗。

隨著AI融入醫(yī)療、駕駛、金融等關(guān)鍵領(lǐng)域,這種“深度安全”理念顯得尤為重要。試想,如果醫(yī)療AI因為安全防護而看錯CT片子,或者自動駕駛AI因過度防護而反應(yīng)遲鈍,后果都將不堪設(shè)想。

AI安全進化史,就是從“打補丁”到“建免疫系統(tǒng)”的升級。清華DAVSP技術(shù)的價值,不僅在于解決了當前的多模態(tài)安全難題,更開創(chuàng)了“深度對齊”的安全新范式。



當AI不僅能識別危險,更能理解危險背后的邏輯,我們才能真正信任這些智能助手。

未來,如果這項技術(shù)推廣到語音、視頻等更多場景,或許能從根本上構(gòu)建AI的安全防線。畢竟,讓機器真正懂得善惡底線,比單純追求更聰明更重要。



這項研究就像給AI世界裝上了“智慧大腦”,讓技術(shù)在快速發(fā)展的同時,始終走在安全的軌道上。

聲明:個人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
徐湖平是誰的斯蒂龐克男孩

徐湖平是誰的斯蒂龐克男孩

此地無言
2025-12-24 15:12:07
中國怪現(xiàn)象:大部分的爸爸,都是身著廉價衣服,過著疲憊的生活..

中國怪現(xiàn)象:大部分的爸爸,都是身著廉價衣服,過著疲憊的生活..

詩詞中國
2025-11-20 21:21:55
小麥身價下跌,德轉(zhuǎn):僅靠穩(wěn)定發(fā)揮不足以維持高身價,且已29歲

小麥身價下跌,德轉(zhuǎn):僅靠穩(wěn)定發(fā)揮不足以維持高身價,且已29歲

懂球帝
2025-12-23 21:58:18
用力過猛!51歲林志玲打扮“日系”現(xiàn)身上海,網(wǎng)友:又老又年輕

用力過猛!51歲林志玲打扮“日系”現(xiàn)身上海,網(wǎng)友:又老又年輕

東方不敗然多多
2025-12-22 01:36:36
74歲狄波拉為男友人慶祝生日,兩人肢體接觸親密,看起來關(guān)系真好

74歲狄波拉為男友人慶祝生日,兩人肢體接觸親密,看起來關(guān)系真好

探長影視解說
2025-12-24 16:14:28
天冷了要養(yǎng)骨!少吃白菜蘿卜,多吃這8樣,腿腳有勁,精氣十足!

天冷了要養(yǎng)骨!少吃白菜蘿卜,多吃這8樣,腿腳有勁,精氣十足!

美食店主
2025-12-22 00:27:55
曾醫(yī)生號源秒空:是給網(wǎng)上那些滿嘴仁義道德的人一記響亮耳光

曾醫(yī)生號源秒空:是給網(wǎng)上那些滿嘴仁義道德的人一記響亮耳光

詩意世界
2025-12-22 11:28:27
我國將迎來前所未有的人口死亡高峰!專家:三個因素驅(qū)動所致

我國將迎來前所未有的人口死亡高峰!專家:三個因素驅(qū)動所致

壹知眠羊
2025-08-23 07:20:55
章子怡再封后!第17屆澳門國際電影節(jié)獎項出爐

章子怡再封后!第17屆澳門國際電影節(jié)獎項出爐

動物奇奇怪怪
2025-12-24 14:15:05
特朗普,突發(fā)!黃金、白銀大跳水!降息,突變!

特朗普,突發(fā)!黃金、白銀大跳水!降息,突變!

證券時報e公司
2025-12-23 23:25:39
不比郭艾倫強!MVP后衛(wèi)場均僅10分,帶隊1勝4負,主教練無奈背鍋

不比郭艾倫強!MVP后衛(wèi)場均僅10分,帶隊1勝4負,主教練無奈背鍋

體壇大事記
2025-12-24 16:15:59
千萬不要過度體檢?醫(yī)生再三強調(diào):55歲后,5種體檢能不做就不做

千萬不要過度體檢?醫(yī)生再三強調(diào):55歲后,5種體檢能不做就不做

小胡軍事愛好
2025-12-18 20:18:05
視察安慶期間,毛主席了解到陳獨秀兒子陳松年在窯廠當苦工、處境困窘,當即批示:“要給予照顧”

視察安慶期間,毛主席了解到陳獨秀兒子陳松年在窯廠當苦工、處境困窘,當即批示:“要給予照顧”

源溯歷史
2025-12-20 16:22:13
“治港敗類”曾蔭權(quán):治理香港7年,為何卻在卸任后,獲刑20個月

“治港敗類”曾蔭權(quán):治理香港7年,為何卻在卸任后,獲刑20個月

卷史
2025-09-15 11:50:59
外國夫妻在貴陽黔靈山將雙胞胎托付保安,引發(fā)熱議

外國夫妻在貴陽黔靈山將雙胞胎托付保安,引發(fā)熱議

眼界看視野
2025-12-23 22:37:33
一球制勝沖468萬元獎金!澳網(wǎng)官方:鄭欽文將參加“一分大滿貫”

一球制勝沖468萬元獎金!澳網(wǎng)官方:鄭欽文將參加“一分大滿貫”

全景體育V
2025-12-24 09:54:17
阿夫迪亞:疲憊是肯定存在的,但是沒人會在意我有多累

阿夫迪亞:疲憊是肯定存在的,但是沒人會在意我有多累

懂球帝
2025-12-24 16:19:19
麥卡前女友:被麥卡甩掉后一個月,他和我朋友好了還帶著我的狗

麥卡前女友:被麥卡甩掉后一個月,他和我朋友好了還帶著我的狗

懂球帝
2025-12-24 11:25:02
勇士!倫納德!6換1交易方案曝光,太炸裂了

勇士!倫納德!6換1交易方案曝光,太炸裂了

章民解說體育
2025-12-24 07:06:36
孩子父親真相大白僅1月后,奚美娟低調(diào)露面,手足無措,落寞呆坐

孩子父親真相大白僅1月后,奚美娟低調(diào)露面,手足無措,落寞呆坐

削桐作琴
2025-12-24 12:24:46
2025-12-24 17:08:49
春序娛樂
春序娛樂
感恩歷史里的人與事。
4566文章數(shù) 738關(guān)注度
往期回顧 全部

科技要聞

馬斯克沒想到的"中國速度"!2026值得期待

頭條要聞

遼寧省三名廳官被開除黨籍 一人被指未經(jīng)批準出入國境

頭條要聞

遼寧省三名廳官被開除黨籍 一人被指未經(jīng)批準出入國境

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

曝闞清子女兒早產(chǎn)但沒保住

財經(jīng)要聞

假冒的“晴王”葡萄,還在賣

汽車要聞

“運動版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

家居
親子
手機
房產(chǎn)
旅游

家居要聞

法式大平層 智能家居添彩

親子要聞

媽媽對你的愛,永遠拿得出手

手機要聞

小米17 Ultra徠卡版外觀細節(jié)揭曉:自帶可樂標+大師變焦環(huán)

房產(chǎn)要聞

硬核!央企??谝痪€江景頂流紅盤,上演超預(yù)期交付!

旅游要聞

瞰中國·冰雪冬韻|內(nèi)蒙古:雪落南山 天地皚皚

無障礙瀏覽 進入關(guān)懷版