国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

筑牢人工智能安全屏障:以創(chuàng)新實(shí)踐賦能大模型健康發(fā)展

0
分享至

近期,開源AI智能體OpenClaw引發(fā)的“養(yǎng)龍蝦”熱潮在社交平臺(tái)上迅速傳播,在展示出人工智能潛力的同時(shí),也引發(fā)了業(yè)界對(duì)于大模型安全問題的廣泛關(guān)注。隨著大模型能力持續(xù)增強(qiáng),其在復(fù)雜交互中的安全邊界問題逐漸顯現(xiàn)。在此背景下,以深知對(duì)話風(fēng)控模型(以下簡(jiǎn)稱“對(duì)話風(fēng)控模型”)為代表的一批創(chuàng)新成果,正以更貼近實(shí)際應(yīng)用的方式回應(yīng)這些挑戰(zhàn)。

大模型浪潮下的安全挑戰(zhàn)

伴隨大模型技術(shù)的快速普及與應(yīng)用,越來(lái)越多的企事業(yè)單位積極投身于大模型私有化部署,以期在智能化浪潮中搶占先機(jī),提升核心競(jìng)爭(zhēng)力。然而,技術(shù)躍遷的背后,由大模型技術(shù)引發(fā)的安全風(fēng)險(xiǎn)問題亦日益凸顯。

面對(duì)大模型及相關(guān)應(yīng)用帶來(lái)的新型安全挑戰(zhàn),相關(guān)風(fēng)險(xiǎn)問題已在業(yè)內(nèi)引發(fā)廣泛關(guān)注。多方公開信息顯示,部分開源AI智能體在默認(rèn)或不當(dāng)配置情況下存在較高安全風(fēng)險(xiǎn),容易遭受網(wǎng)絡(luò)攻擊并導(dǎo)致敏感信息泄露。同時(shí),在私有化部署場(chǎng)景中,一些服務(wù)器長(zhǎng)期暴露在公網(wǎng)環(huán)境中,模型本身也可能存在被攻擊的隱患,整體安全狀況仍有待進(jìn)一步完善。從實(shí)際應(yīng)用情況來(lái)看,大模型安全問題已不再局限于傳統(tǒng)系統(tǒng)層面的漏洞,而是進(jìn)一步延伸至大模型自身以及大模型應(yīng)用層面的安全,包括提示詞注入、惡意誘導(dǎo)、隱蔽表達(dá)、敏感信息套取等,對(duì)現(xiàn)有安全機(jī)制提出了新的要求。

一種面向?qū)嶋H應(yīng)用的安全實(shí)踐

彩智科技創(chuàng)始人、中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)杰出會(huì)員徐劍軍帶領(lǐng)團(tuán)隊(duì)提出“對(duì)話風(fēng)控模型”,以解決大模型在嚴(yán)肅場(chǎng)景中的“幻覺”問題。他說:“幻覺是一個(gè)表面現(xiàn)象,根本原因就是知識(shí)工程和大模型都有各自的邊界。”


徐劍軍介紹可信知識(shí)模型

據(jù)悉,“對(duì)話風(fēng)控模型”采用組件化插入模式,可與原有基座大模型深度協(xié)同配合,相當(dāng)于在基座大模型、應(yīng)用智能體等大模型應(yīng)用前端,增設(shè)了一道專業(yè)的安全“防火墻”。用戶所有訴求均先經(jīng)過對(duì)話風(fēng)控模型,由該模型基于自然語(yǔ)言上下文理解,對(duì)潛在風(fēng)險(xiǎn)進(jìn)行快速識(shí)別,并可識(shí)別變體拼寫、諧音代稱等隱蔽表達(dá)形式,同時(shí)可針對(duì)風(fēng)險(xiǎn)問題提供安全代答服務(wù)。


對(duì)話風(fēng)控模型工作流程示意圖

該對(duì)話風(fēng)控模型主要由風(fēng)險(xiǎn)研判模型和安全代答模型構(gòu)成。其中,風(fēng)險(xiǎn)研判模型負(fù)責(zé)完成對(duì)輸入的風(fēng)險(xiǎn)識(shí)別與分類,實(shí)現(xiàn)風(fēng)險(xiǎn)的主動(dòng)發(fā)現(xiàn)、實(shí)時(shí)預(yù)警。安全代答模型則負(fù)責(zé)對(duì)識(shí)別出的重點(diǎn)關(guān)注類和隱藏條件預(yù)警類問題進(jìn)行回應(yīng),按照“事實(shí)澄清-政策引用-正向引導(dǎo)”的三段式原則進(jìn)行回應(yīng),兼顧風(fēng)險(xiǎn)防控與服務(wù)體驗(yàn)。對(duì)于部分存在安全風(fēng)險(xiǎn)的提問,模型并非簡(jiǎn)單拒答,而是根據(jù)風(fēng)險(xiǎn)研判結(jié)果,靈活觸發(fā)安全代答模式或攔截機(jī)制。當(dāng)啟動(dòng)安全代答模式時(shí),模型將依托權(quán)威文件構(gòu)建的動(dòng)態(tài)更新知識(shí)庫(kù)提供回應(yīng),回復(fù)內(nèi)容均可溯源至官方權(quán)威文件。

共筑AI安全防線,推動(dòng)人工智能行穩(wěn)致遠(yuǎn)

構(gòu)建面向人工智能時(shí)代的安全防護(hù)能力,是當(dāng)前大模型應(yīng)用過程中需要持續(xù)關(guān)注的重要問題之一。

從行業(yè)發(fā)展來(lái)看,對(duì)話風(fēng)控模型所體現(xiàn)的,是一種外部化、低耦合的安全防護(hù)思路。通過技術(shù)解耦和API服務(wù)方式,研發(fā)團(tuán)隊(duì)可以將更多精力放在模型性能提升和核心業(yè)務(wù)打磨上,減少安全模塊與業(yè)務(wù)邏輯相互牽制帶來(lái)的開發(fā)壓力。這種路徑有助于降低大模型研發(fā)與應(yīng)用的綜合成本,也為專用領(lǐng)域大模型的安全落地提供了新的實(shí)踐參考。(作者:徐妍迪)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
當(dāng)年張柏芝抱著lucas后面居然是大s,到現(xiàn)在才發(fā)現(xiàn),真美好

當(dāng)年張柏芝抱著lucas后面居然是大s,到現(xiàn)在才發(fā)現(xiàn),真美好

TVB的四小花
2026-04-21 00:03:30
法國(guó)掠奪中國(guó)的十大代表文物(附高清大圖),未來(lái)能否歸還?

法國(guó)掠奪中國(guó)的十大代表文物(附高清大圖),未來(lái)能否歸還?

文史道
2026-04-17 15:33:28
世錦賽戰(zhàn)報(bào):六冠王7-10出局,16強(qiáng)決出7席中國(guó)3席!中國(guó)冠軍1-8

世錦賽戰(zhàn)報(bào):六冠王7-10出局,16強(qiáng)決出7席中國(guó)3席!中國(guó)冠軍1-8

求球不落諦
2026-04-21 00:55:34
國(guó)產(chǎn)大模型集體轉(zhuǎn)身

國(guó)產(chǎn)大模型集體轉(zhuǎn)身

智遠(yuǎn)同學(xué)
2026-04-20 08:38:12
日艦闖臺(tái)海三日,高市辭職,岸田接棒,052D抵近奄美大島

日艦闖臺(tái)海三日,高市辭職,岸田接棒,052D抵近奄美大島

自己撐起一片天
2026-04-21 03:42:58
鄭麗文回應(yīng)“大陸武統(tǒng)”,作出滿分回答,還給民進(jìn)黨指了一條明路

鄭麗文回應(yīng)“大陸武統(tǒng)”,作出滿分回答,還給民進(jìn)黨指了一條明路

頭條爆料007
2026-04-19 20:27:52
絕不談判!永久關(guān)閉豁免窗口!中國(guó)打響光刻機(jī)反擊戰(zhàn)

絕不談判!永久關(guān)閉豁免窗口!中國(guó)打響光刻機(jī)反擊戰(zhàn)

阿七說史
2026-04-20 15:10:26
周薪25萬(wàn)鎊!31歲功勛確認(rèn)自由身告別曼城 效力10年助隊(duì)奪19冠

周薪25萬(wàn)鎊!31歲功勛確認(rèn)自由身告別曼城 效力10年助隊(duì)奪19冠

我愛英超
2026-04-21 06:22:01
炸了!克洛普給皇馬下死命令:花 3 億簽 5 人,點(diǎn)名替換庫(kù)爾圖瓦

炸了!克洛普給皇馬下死命令:花 3 億簽 5 人,點(diǎn)名替換庫(kù)爾圖瓦

奶蓋熊本熊
2026-04-21 04:52:43
硬剛美國(guó)撕破附庸標(biāo)簽!韓國(guó)一步大膽出手,全世界都看明白了

硬剛美國(guó)撕破附庸標(biāo)簽!韓國(guó)一步大膽出手,全世界都看明白了

阿七說史
2026-04-20 05:15:03
原雷神山院長(zhǎng)落馬,其“權(quán)色交易”的背后,坑害了多少女醫(yī)護(hù)家庭

原雷神山院長(zhǎng)落馬,其“權(quán)色交易”的背后,坑害了多少女醫(yī)護(hù)家庭

長(zhǎng)安一孤客
2026-04-20 18:58:28
連續(xù)炮擊輪機(jī)艙,美軍扣押伊朗貨船!正在打仗的美軍吃不飽飯了?

連續(xù)炮擊輪機(jī)艙,美軍扣押伊朗貨船!正在打仗的美軍吃不飽飯了?

鷹眼Defence
2026-04-20 16:02:26
官方通報(bào)小學(xué)生拒借車遭群毆:9人被處理

官方通報(bào)小學(xué)生拒借車遭群毆:9人被處理

界面新聞
2026-04-20 20:26:56
去臺(tái)灣玩了七天回來(lái),說實(shí)在的,普通人來(lái)臺(tái)灣還真有點(diǎn)不適應(yīng)

去臺(tái)灣玩了七天回來(lái),說實(shí)在的,普通人來(lái)臺(tái)灣還真有點(diǎn)不適應(yīng)

復(fù)轉(zhuǎn)這些年
2026-04-20 18:03:08
4月21日精選熱點(diǎn):光纖價(jià)格暴漲650%  這3家處于底部龍頭要起爆

4月21日精選熱點(diǎn):光纖價(jià)格暴漲650% 這3家處于底部龍頭要起爆

元芳說投資
2026-04-20 21:31:20
中國(guó)高校只剩7年窗口期 學(xué)生數(shù)量斷崖式塌方后一半高校都得死

中國(guó)高校只剩7年窗口期 學(xué)生數(shù)量斷崖式塌方后一半高校都得死

六子吃涼粉
2026-04-20 19:10:49
英超太殘酷了:隨著西漢姆聯(lián)0-0,25-26賽季第一支降級(jí)球隊(duì)誕生

英超太殘酷了:隨著西漢姆聯(lián)0-0,25-26賽季第一支降級(jí)球隊(duì)誕生

側(cè)身凌空斬
2026-04-21 05:02:42
連關(guān)2店,中國(guó)內(nèi)地已不到10家!網(wǎng)友:曾花過40萬(wàn),現(xiàn)在真覺得浪費(fèi)錢

連關(guān)2店,中國(guó)內(nèi)地已不到10家!網(wǎng)友:曾花過40萬(wàn),現(xiàn)在真覺得浪費(fèi)錢

南方都市報(bào)
2026-04-20 07:37:25
住了33年的房屋要被強(qiáng)拆還地,臺(tái)灣婦人叫囂:我是大日本帝國(guó)臣民

住了33年的房屋要被強(qiáng)拆還地,臺(tái)灣婦人叫囂:我是大日本帝國(guó)臣民

金牛傳聲
2026-04-19 12:27:48
特朗普:如未能達(dá)成協(xié)議“幾無(wú)可能”再延長(zhǎng)?;?>
    </a>
        <h3>
      <a href=界面新聞
2026-04-20 23:21:47
2026-04-21 07:20:49
東方財(cái)經(jīng) incentive-icons
東方財(cái)經(jīng)
眼界決定境界
1327文章數(shù) 3596關(guān)注度
往期回顧 全部

科技要聞

重磅官宣:庫(kù)克卸任,特努斯接任蘋果CEO

頭條要聞

19歲女孩挪用自家1700萬(wàn)當(dāng)"榜一大姐" 親爹帶女兒自首

頭條要聞

19歲女孩挪用自家1700萬(wàn)當(dāng)"榜一大姐" 親爹帶女兒自首

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財(cái)經(jīng)要聞

利潤(rùn)暴跌7成,字節(jié)到底在做什么

汽車要聞

把天門山搬進(jìn)廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

健康
手機(jī)
旅游
公開課
軍事航空

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

手機(jī)要聞

華為Pura X Max發(fā)布:搭載麒麟9030 Pro芯片,起售價(jià)10999元

旅游要聞

以“Fun”為名,深圳布吉將發(fā)布全域旅游品牌IP

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普:美艦向伊朗貨船開火炸出個(gè)洞

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版