国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenAI承認Atlas瀏覽器提示詞注入攻擊難以根治

0
分享至

IT之家 12 月 23 日消息,盡管 OpenAI 正致力于強化其 Atlas 人工智能瀏覽器的網(wǎng)絡(luò)攻擊防御能力,但該公司承認,提示詞注入攻擊 —— 一種通過操縱人工智能智能體、使其執(zhí)行隱藏在網(wǎng)頁或電子郵件中的惡意指令的攻擊手段 —— 帶來的風(fēng)險短期內(nèi)無法消除。這也引發(fā)了人們對人工智能智能體在開放網(wǎng)絡(luò)環(huán)境下能否安全運行的質(zhì)疑。


OpenAI 在當?shù)貢r間周一發(fā)布的一篇博客文章中詳細闡述了該公司為增強 Atlas 的防御能力、抵御持續(xù)攻擊所采取的措施,并寫道:“提示詞注入攻擊就像網(wǎng)絡(luò)上的詐騙和社會工程學(xué)攻擊一樣,幾乎不可能被完全‘攻克’?!痹摴咎钩校珻hatGPT Atlas 的“智能體模式”“擴大了安全威脅面”。

據(jù)IT之家了解,OpenAI 于今年 10 月推出了 ChatGPT Atlas 瀏覽器,隨后安全研究人員迅速發(fā)布了相關(guān)演示,證明只需在谷歌文檔中輸入寥寥數(shù)語,就能改變底層瀏覽器的行為。就在同一天,瀏覽器廠商 Brave 也發(fā)布博客指出,間接提示詞注入攻擊是所有人工智能驅(qū)動型瀏覽器面臨的系統(tǒng)性挑戰(zhàn),Perplexity 公司的 Comet 瀏覽器也未能幸免。

意識到提示詞注入攻擊威脅將長期存在的并非只有 OpenAI 一家。英國國家網(wǎng)絡(luò)安全中心本月早些時候發(fā)出警告,稱針對生成式人工智能應(yīng)用的提示詞注入攻擊“或許永遠無法被完全緩解”,這使得各類網(wǎng)站都面臨數(shù)據(jù)泄露的風(fēng)險。這家英國政府機構(gòu)建議網(wǎng)絡(luò)安全從業(yè)者,應(yīng)著力降低提示詞注入攻擊的風(fēng)險及影響,而非寄希望于將這類攻擊“徹底阻止”。

就 OpenAI 而言,該公司表示:“我們將提示詞注入視為一項長期的人工智能安全挑戰(zhàn),未來需要持續(xù)強化防御措施。”

那么,面對這項永無止境的任務(wù),OpenAI 給出了怎樣的解決方案?答案是建立一套主動式快速響應(yīng)機制。該公司稱,這套機制已初顯成效,能夠在新型攻擊手段被用于“實戰(zhàn)攻擊”前,提前在內(nèi)部發(fā)現(xiàn)這些攻擊策略。

這一思路其實與 Anthropic、谷歌等競爭對手的主張并無本質(zhì)區(qū)別:要應(yīng)對提示詞注入攻擊的持續(xù)威脅,必須構(gòu)建多層防御體系,并持續(xù)開展壓力測試。例如,谷歌近期的研究重點就聚焦于智能體系統(tǒng)的架構(gòu)層面與策略層面管控。

不過,OpenAI 采取了一種與眾不同的策略 —— 開發(fā)“基于大語言模型的自動化攻擊程序”。本質(zhì)上,這是一款由 OpenAI 借助強化學(xué)習(xí)技術(shù)訓(xùn)練而成的機器人,其作用是模擬黑客行為,尋找向人工智能智能體植入惡意指令的途徑。

這款機器人可以先在模擬環(huán)境中測試攻擊手段,再投入實際應(yīng)用。模擬環(huán)境能夠還原目標人工智能在遭遇攻擊時的思維過程與可能采取的行動。隨后,機器人可分析目標的反應(yīng),調(diào)整攻擊方式,并反復(fù)進行測試。這種能夠洞悉目標人工智能內(nèi)部推理邏輯的優(yōu)勢,是外部攻擊者所不具備的。因此從理論上講,OpenAI 的這款機器人發(fā)現(xiàn)系統(tǒng)漏洞的速度,要快于現(xiàn)實中的黑客。

這是人工智能安全測試領(lǐng)域的一種常用方法:打造一個智能體,讓它找出系統(tǒng)的極端漏洞場景,并在模擬環(huán)境中開展快速測試。

OpenAI 在博客中寫道:“我們通過強化學(xué)習(xí)訓(xùn)練的攻擊程序,能夠誘導(dǎo)目標智能體執(zhí)行復(fù)雜且需要多步驟推進的有害任務(wù)流程,這些流程的操作步驟可達數(shù)十步甚至數(shù)百步。此外,我們還發(fā)現(xiàn)了一些全新的攻擊策略,這些策略既未出現(xiàn)在我們的人工紅隊測試中,也沒有相關(guān)外部報告提及。”


在一份演示案例中(上圖為部分截圖),OpenAI 展示了其自動化攻擊程序如何將一封惡意電子郵件植入用戶收件箱。當人工智能智能體后續(xù)掃描收件箱時,它執(zhí)行了郵件中隱藏的惡意指令,發(fā)送了一封辭職信,而非按要求撰寫休假自動回復(fù)郵件。不過 OpenAI 稱,在完成安全更新后,“智能體模式”已能成功檢測到提示詞注入攻擊的企圖,并向用戶發(fā)出告警。

該公司表示,盡管要實現(xiàn)對提示詞注入攻擊的萬無一失防御難度極大,但仍在依靠大規(guī)模測試與更快速的補丁更新周期,力爭在相關(guān)攻擊手段出現(xiàn)在現(xiàn)實世界之前,完成系統(tǒng)防御加固。

針對 Atlas 的安全更新是否已顯著降低攻擊成功率這一問題,OpenAI 發(fā)言人拒絕透露具體數(shù)據(jù),但表示該公司早在 Atlas 瀏覽器發(fā)布前,就已與第三方機構(gòu)合作,共同強化其針對提示詞注入攻擊的防御能力。

網(wǎng)絡(luò)安全公司 Wiz 的首席安全研究員拉米?麥卡錫指出,強化學(xué)習(xí)技術(shù)確實能實現(xiàn)對攻擊者行為的持續(xù)自適應(yīng)防御,但這只是解決方案的一部分。

麥卡錫在接受科技媒體 TechCrunch 采訪時表示:“衡量人工智能系統(tǒng)風(fēng)險的一個有效方法,是計算其自主性與訪問權(quán)限的乘積。”

他進一步解釋道:“智能體瀏覽器恰恰處于這一風(fēng)險模型中的高挑戰(zhàn)區(qū)域:它們擁有中等程度的自主性,同時又具備極高的系統(tǒng)訪問權(quán)限。當前許多安全建議,其實都反映了這種利弊權(quán)衡。比如限制登錄狀態(tài)下的訪問權(quán)限,主要是為了減少暴露面;而要求對各類確認請求進行人工審核,則是為了約束智能體的自主操作權(quán)限?!?/p>

這兩點也被列入 OpenAI 向用戶提供的風(fēng)險降低建議中。該公司發(fā)言人還表示,Atlas 瀏覽器經(jīng)過訓(xùn)練,在發(fā)送郵件或執(zhí)行支付操作前,都會向用戶發(fā)起確認請求。OpenAI 同時建議用戶,應(yīng)向智能體下達具體明確的指令,而非直接授予其收件箱訪問權(quán)限,簡單告知其“自行采取必要措施”。

OpenAI 指出:“即便已部署安全防護措施,過高的自主操作權(quán)限也會讓隱藏的惡意內(nèi)容更容易對智能體產(chǎn)生影響?!?/p>

盡管 OpenAI 聲稱,保護 Atlas 用戶免受提示詞注入攻擊是公司的首要任務(wù),但麥卡錫仍對這類高風(fēng)險瀏覽器的投入產(chǎn)出比持懷疑態(tài)度。

他在接受 TechCrunch 采訪時表示:“對于大多數(shù)日常使用場景而言,智能體瀏覽器目前帶來的價值,尚不足以匹配其當前的風(fēng)險水平。由于它們能夠訪問電子郵件、支付信息等敏感數(shù)據(jù),因此風(fēng)險系數(shù)極高 —— 但與此同時,也正是這種高訪問權(quán)限賦予了它們強大的功能。這種利弊平衡狀態(tài)未來或?qū)⒅鸩礁纳?,但就目前而言,其中的取舍?quán)衡依然十分顯著。”

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
蘿莉島的骯臟超乎想象,克林頓喜歡年輕女孩,科學(xué)家霍金竟也去過

蘿莉島的骯臟超乎想象,克林頓喜歡年輕女孩,科學(xué)家霍金竟也去過

小熊侃史
2025-12-21 07:05:12
特朗普表示:扣押的委內(nèi)瑞拉油輪和油輪上石油都將歸美國所有!

特朗普表示:扣押的委內(nèi)瑞拉油輪和油輪上石油都將歸美國所有!

AI商業(yè)論
2025-12-23 10:40:02
新任公安局長探訪民情,在自家飯店吃飯被“所長小舅子”掀了桌子

新任公安局長探訪民情,在自家飯店吃飯被“所長小舅子”掀了桌子

卡西莫多的故事
2025-12-19 11:15:00
“邪修大法”做家務(wù)就是快!一分錢不花,家里就窗明幾凈~

“邪修大法”做家務(wù)就是快!一分錢不花,家里就窗明幾凈~

裝修秀
2025-12-19 11:30:03
羅晉帶母親去大孤山祈福,女星任素汐陪同,與唐嫣的婚姻引發(fā)猜測

羅晉帶母親去大孤山祈福,女星任素汐陪同,與唐嫣的婚姻引發(fā)猜測

蘇子Vlog一
2025-12-20 16:02:30
中方已經(jīng)盡力,柬軍兵敗如山倒,泰國有高人指點,最怕俄羅斯出兵

中方已經(jīng)盡力,柬軍兵敗如山倒,泰國有高人指點,最怕俄羅斯出兵

樂趣紀史
2025-12-23 16:03:10
宗馥莉與“宗氏三兄妹”相關(guān)案件今日再開庭

宗馥莉與“宗氏三兄妹”相關(guān)案件今日再開庭

新浪財經(jīng)
2025-12-23 12:02:33
光盤可恥?中國家長在新西蘭被老師約談:你兒子把飯吃的太干凈!

光盤可恥?中國家長在新西蘭被老師約談:你兒子把飯吃的太干凈!

知曉科普
2025-12-22 11:01:30
北京多所公園接收“九三閱兵”觀禮座椅,成市民休閑“打卡點”

北京多所公園接收“九三閱兵”觀禮座椅,成市民休閑“打卡點”

娛樂帝皇丸
2025-12-23 08:56:49
釋永信被女徒弟爆料,凌晨4點去他房間,拿到皈依證就算師徒關(guān)系

釋永信被女徒弟爆料,凌晨4點去他房間,拿到皈依證就算師徒關(guān)系

漢史趣聞
2025-07-30 09:57:38
資深游戲制作人文斯?贊佩拉因車禍離世

資深游戲制作人文斯?贊佩拉因車禍離世

IT之家
2025-12-23 08:21:09
臺灣回歸后,第一任省長由誰擔(dān)任合適?這四人是否在候選人名單中

臺灣回歸后,第一任省長由誰擔(dān)任合適?這四人是否在候選人名單中

談古論今歷史有道
2025-12-22 15:20:03
俄體操冠軍卡巴耶娃:與普京傳17年緋聞,三孩生父成謎

俄體操冠軍卡巴耶娃:與普京傳17年緋聞,三孩生父成謎

孫縭北漂拍客
2025-12-20 19:16:21
陜西女老師事件持續(xù)升溫,知情者披露:抽煙穿吊帶,私生活混亂!

陜西女老師事件持續(xù)升溫,知情者披露:抽煙穿吊帶,私生活混亂!

丁丁鯉史紀
2025-12-23 15:25:38
順豐跟抖音分手,張一鳴天塌了!

順豐跟抖音分手,張一鳴天塌了!

品牌頭版
2025-12-22 17:04:12
銀行人勸告:家里有老人存款的,務(wù)必加上第二存款人!越早越安心

銀行人勸告:家里有老人存款的,務(wù)必加上第二存款人!越早越安心

小白鴿財經(jīng)
2025-12-17 07:05:02
最新消息!樊振東將在波爾家里過圣誕節(jié),大概率缺席乒超總決賽

最新消息!樊振東將在波爾家里過圣誕節(jié),大概率缺席乒超總決賽

鳳幻洋
2025-12-23 15:53:27
爸把18套房全給私生子,宣讀遺囑時媽竟在笑,半年后我才知真相

爸把18套房全給私生子,宣讀遺囑時媽竟在笑,半年后我才知真相

溫情郵局
2025-12-08 11:29:02
丟人丟大了!火箭加時惜敗西部倒數(shù)第一,一戰(zhàn)徹底認清三個事實!

丟人丟大了!火箭加時惜敗西部倒數(shù)第一,一戰(zhàn)徹底認清三個事實!

田先生籃球
2025-12-22 16:34:23
扛不住了!高詩巖被狂噴至關(guān)閉評論區(qū) 最后一攻“自殺”備受質(zhì)疑

扛不住了!高詩巖被狂噴至關(guān)閉評論區(qū) 最后一攻“自殺”備受質(zhì)疑

胖子噴球
2025-12-23 10:19:42
2025-12-23 16:51:00
IT之家
IT之家
愛科技,愛這里 - 前沿科技人氣平臺
321102文章數(shù) 606838關(guān)注度
往期回顧 全部

科技要聞

慘烈90分鐘!快手驚魂:遭遇最強黑產(chǎn)攻擊

頭條要聞

媒體:對一度沒國際賽可踢的國足 "亞國聯(lián)"是雪中送炭

頭條要聞

媒體:對一度沒國際賽可踢的國足 "亞國聯(lián)"是雪中送炭

體育要聞

楊瀚森連續(xù)5場DNP!開拓者遭活塞雙殺

娛樂要聞

阿信發(fā)聲報平安,曬演唱會向F3索吻畫面

財經(jīng)要聞

祥源系百億產(chǎn)品爆雷 浙金中心18人被拘

汽車要聞

四款新車集中發(fā)布 星途正式走進3.0時代

態(tài)度原創(chuàng)

游戲
親子
本地
健康
軍事航空

《神界》系列老牌配音演員盛贊新作預(yù)告 暗示期待回歸

親子要聞

莎莎這孩子是真的懂事。腳扭傷之后

本地新聞

云游安徽|宣城何以動人心,百年塔影一城徽韻

這些新療法,讓化療不再那么痛苦

軍事要聞

中方回應(yīng)烏克蘭或?qū)⒅撇弥袊?/h3>

無障礙瀏覽 進入關(guān)懷版