国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Bengio領(lǐng)銜2026年國(guó)際AI安全報(bào)告:迎接風(fēng)險(xiǎn)與機(jī)遇博弈的治理挑戰(zhàn)

0
分享至


2026年2月,由圖靈獎(jiǎng)得主約書亞·本吉奧(Yoshua Bengio)教授領(lǐng)銜、來自30多個(gè)國(guó)家和國(guó)際組織(包括歐盟、OECD、聯(lián)合國(guó))的100余位專家共同編撰的《2026年國(guó)際AI安全報(bào)告》(International AI Safety Report 2026)正式發(fā)布 。這是繼2025年首份報(bào)告后的又一總結(jié)性質(zhì)的著作。在AI技術(shù)發(fā)展日新月異的今天,這份報(bào)告為我們揭示了哪些硬核趨勢(shì)?相比去年,我們的處境是更安全了,還是面臨著更復(fù)雜的變局?


01

跨越一年:2026與2025版的深度“復(fù)盤”與對(duì)比

在深入解讀核心觀點(diǎn)前,我們先來看看2026年版報(bào)告在視角和內(nèi)容上發(fā)生了哪些關(guān)鍵演變。


范圍收窄:聚焦“新興風(fēng)險(xiǎn)”

相比2025年報(bào)告涵蓋偏見、環(huán)境影響、隱私和版權(quán)等廣泛議題,2026年版顯著收窄了研究范圍,將核心聚焦于“新興風(fēng)險(xiǎn)”(Emerging Risks)。這意味著全球?qū)<医M認(rèn)為,目前最迫切的威脅來自于通用AI能力“前沿”的濫用和網(wǎng)絡(luò)安全風(fēng)險(xiǎn)。


預(yù)測(cè)升級(jí):引入OECD的情境化建模

第一版報(bào)告更多是對(duì)現(xiàn)狀的總結(jié),而今年,報(bào)告與OECD及預(yù)測(cè)研究機(jī)構(gòu)合作,首次呈現(xiàn)了更加具體的情境預(yù)測(cè)和路徑分析。通過對(duì)計(jì)算能力(compute)、算法效率(algorithmic efficiency)和數(shù)據(jù)規(guī)模三大驅(qū)動(dòng)因素建模,報(bào)告為政策制定者提供了直至2030年AI能力發(fā)展的四種可能走向。

他們分別是:

(1)進(jìn)展停滯:受算力、數(shù)據(jù)或投資瓶頸限制,AI能力基本保持不變。

(2)進(jìn)展放緩:邊際收益遞減,僅在受控環(huán)境下(如工廠、實(shí)驗(yàn)室)有較慢進(jìn)展。

(3)持續(xù)進(jìn)展:保持當(dāng)前快速發(fā)展速度,AI成為“專家級(jí)協(xié)作者”。

(4)加速發(fā)展:AI開始參與AI本身的研發(fā),形成正反饋閉環(huán),達(dá)到或超過人類認(rèn)知水平。


風(fēng)險(xiǎn)實(shí)證:強(qiáng)調(diào)“現(xiàn)實(shí)證據(jù)”

如果說2025年我們還在討論AI可能帶來的網(wǎng)絡(luò)威脅,那么2026年的報(bào)告則指出:證據(jù)已經(jīng)確鑿 。過去一年中,AI在發(fā)現(xiàn)軟件漏洞和編寫攻擊代碼方面的能力大幅提升,國(guó)家級(jí)攻擊組織利用AI進(jìn)行網(wǎng)絡(luò)行動(dòng)的案例已被頻繁記錄。

02

2026報(bào)告核心觀點(diǎn)解讀:AI正變得“聰明且危險(xiǎn)”

在這份長(zhǎng)達(dá)百頁(yè)的報(bào)告中,我們提煉出以下幾個(gè)維度的核心洞察:

能力“參差不齊地”進(jìn)化 (Jagged Capabilities)

目前的AI呈現(xiàn)出一種“不穩(wěn)定的智能性”:它能解決奧數(shù)金牌難度的數(shù)學(xué)題,卻可能在數(shù)圖片里有幾個(gè)蘋果這種簡(jiǎn)單任務(wù)上翻車。報(bào)告指出,領(lǐng)先系統(tǒng)在化學(xué)、法律等本科考試中得分超過90%,在奧數(shù)競(jìng)賽中達(dá)到金牌水平。但是其空間推理能力極差,且容易受到“幻覺”困擾,無法在沒有人類干預(yù)的情況下獨(dú)立執(zhí)行多進(jìn)程項(xiàng)目,這種"強(qiáng)復(fù)雜任務(wù)、弱簡(jiǎn)單任務(wù)"的能力分布,反映了當(dāng)前AI系統(tǒng)的基本局限。


“推理系統(tǒng)”(Reasoning Systems)與“推理成本”的崛起

報(bào)告強(qiáng)調(diào),性能提升不再僅依賴于模型規(guī)模的增加,更多來自于“后訓(xùn)練技術(shù)”和“推理時(shí)擴(kuò)展”(Inference-time Scaling)?!巴评硐到y(tǒng)”能夠在最終答案前生產(chǎn)中間推理步驟,即“思維鏈”(Chain of thought)。2025年,Google的Gemini Deep Think和OpenAI的實(shí)驗(yàn)?zāi)P驮诮Y(jié)構(gòu)化測(cè)試環(huán)境下解決了奧數(shù)金牌難度的問題。這種"推理時(shí)擴(kuò)展"技術(shù)意味著:模型性能不僅取決于訓(xùn)練時(shí)的投入,還可在部署后通過分配更多計(jì)算資源來提升。當(dāng)然,這種“深思熟慮”也會(huì)消耗更多算力,顯著提高“推理成本”。



AI智能體(AI Agent)的崛起

AI智能體(AI Agent)被定義為能夠在較少人工監(jiān)督的情況下能夠自主追求目標(biāo)并執(zhí)行任務(wù)的AI系統(tǒng)。其發(fā)展十分迅速,目前已經(jīng)可以完成人類程序員約30分鐘任務(wù)的軟件工程任務(wù)(成功率80%),而且能處理的任務(wù)復(fù)雜度每7個(gè)月翻一番,已經(jīng)被廣泛應(yīng)用于軟件工程、研究、機(jī)器人控制、客戶服務(wù)等領(lǐng)域。但也正因其有高度自主性,進(jìn)一步帶來了額外的風(fēng)險(xiǎn),使得人類更難在故障造成傷害前提前進(jìn)行干預(yù),對(duì)于相關(guān)風(fēng)險(xiǎn)管控能力的要求進(jìn)一步提升。

AI新型風(fēng)險(xiǎn)涌現(xiàn)

報(bào)告將通用AI新型風(fēng)險(xiǎn)劃分為三類:惡意使用風(fēng)險(xiǎn)、故障風(fēng)險(xiǎn)和系統(tǒng)性風(fēng)險(xiǎn)。

其中“惡意”使用的三個(gè)重災(zāi)區(qū)是網(wǎng)絡(luò)攻擊、生物與化學(xué)風(fēng)險(xiǎn)和對(duì)人類信念的影響與操縱。網(wǎng)絡(luò)攻擊方面,AI代理在網(wǎng)絡(luò)安全競(jìng)賽中已能自主識(shí)別77%的軟件漏洞,進(jìn)入前5%的水平。由AI所發(fā)起的網(wǎng)絡(luò)攻擊成了目前網(wǎng)絡(luò)安全方面需要重點(diǎn)關(guān)注的對(duì)象。


生物與化學(xué)方面, 通用AI系統(tǒng)可提供關(guān)于生物和化學(xué)武器開發(fā)的信息,頂尖模型在指導(dǎo)病毒實(shí)驗(yàn)規(guī)程方面的表現(xiàn)已超過94%的領(lǐng)域?qū)<?,多家公司已因無法排除其協(xié)助開發(fā)生物武器的可能性而對(duì)2025年后的新模型實(shí)施了嚴(yán)格管控,或是選擇發(fā)布帶有額外安全措施的新模型。

對(duì)人類信念的影響與操縱方面,目前報(bào)告指出,AI生成的說服性內(nèi)容在改變?nèi)祟愋拍罘矫嬉巡粊営谏踔羶?yōu)于普通人類專家。實(shí)驗(yàn)表明,在5分鐘對(duì)話后,參與者將GPT-4o生成的文本誤認(rèn)為人類編寫的比例達(dá)77%;聽眾在80%的情況下將AI語音克隆誤認(rèn)為真實(shí)說話者。

除了惡意風(fēng)險(xiǎn)和固有的故障風(fēng)險(xiǎn)(幻覺、失控等)之外,AI也面臨著系統(tǒng)性風(fēng)險(xiǎn)的影響。一是勞動(dòng)力市場(chǎng)中,AI可能自動(dòng)化廣泛的認(rèn)知任務(wù),尤其是可能替代部分早期知識(shí)性工作(如寫作),但目前對(duì)總體就業(yè)的影響尚不確定;二是對(duì)人類自主性的分層,如AI伴侶應(yīng)用可能會(huì)造成人類的心理依賴,導(dǎo)致相信自動(dòng)化偏見或是批判性思維削弱等問題。


03

深度解讀:我們?cè)撊绾巫跃龋?/strong>

風(fēng)險(xiǎn)管理的核心矛盾在于:技術(shù)不可控與制度跟不上。AI的新能力往往突然涌現(xiàn),模型內(nèi)部機(jī)制卻仍是黑箱,部署前的測(cè)試結(jié)果也難以預(yù)測(cè)實(shí)際風(fēng)險(xiǎn)。更棘手的是,開發(fā)商有動(dòng)力隱瞞關(guān)鍵信息,開發(fā)速度又倒逼團(tuán)隊(duì)犧牲安全換取進(jìn)度。

政策制定者往往面臨“證據(jù)困境”(evidence dilemma):過早采取行動(dòng)可能導(dǎo)致無效甚至有害的干預(yù)措施,但是收集和評(píng)估其對(duì)社會(huì)的影響所需的證據(jù)需要時(shí)間,又可能使社會(huì)面臨潛在風(fēng)險(xiǎn)影響。面對(duì)這種不確定性,報(bào)告提出了“深度防御”(Defence-in-depth)策略。報(bào)告強(qiáng)調(diào),沒有任何單一的防火墻是完美的,必須在多個(gè)層面共同筑起防線,例如事前靠威脅建模和能力評(píng)估設(shè)定危險(xiǎn)閾值;事中用分類器、護(hù)欄、RLHF等技術(shù)手段攔截風(fēng)險(xiǎn);事后通過事件報(bào)告和行業(yè)共享彌補(bǔ)漏洞。但這些措施都有明顯短板——復(fù)雜攻擊能繞過防護(hù),開源模型的保障措施更易被拆除,一旦發(fā)布便無法召回。

沒有萬全之策,但可以通過建設(shè)社會(huì)韌性——在技術(shù)快速演進(jìn)中構(gòu)建適應(yīng)性治理框架,并通過基礎(chǔ)設(shè)施強(qiáng)化、公眾教育及國(guó)際合作建設(shè)社會(huì)韌性,以應(yīng)對(duì)不可避免的沖擊。


04

結(jié)語

通用AI不僅是生產(chǎn)力工具,更是重塑社會(huì)契約的深層力量。正如Bengio教授在序言中所說,我們正在經(jīng)歷這一時(shí)代最重大的技術(shù)轉(zhuǎn)型。理解風(fēng)險(xiǎn),是為了更安全地?fù)肀Х睒s。


數(shù)據(jù)來源International AI Safety Report 2026,International AI Safety Report 2025

來源|全球人工智能創(chuàng)新治理中心

作者 | 劉前昊、袁露銘

排版 | 蒲云濤

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
原來她是孫千媽媽,全國(guó)開70家店,舅舅更不一般,難怪女兒這么紅

原來她是孫千媽媽,全國(guó)開70家店,舅舅更不一般,難怪女兒這么紅

觀察鑒娛
2026-03-11 08:39:06
2026年最好命的5個(gè)生肖,都有不錯(cuò)的財(cái)運(yùn)!尤其是最后一個(gè)!

2026年最好命的5個(gè)生肖,都有不錯(cuò)的財(cái)運(yùn)!尤其是最后一個(gè)!

千秋文化
2025-11-27 19:49:17
沒想到!兩會(huì)還沒結(jié)束,劉國(guó)梁突然官宣新布局,王勵(lì)勤早有暗示

沒想到!兩會(huì)還沒結(jié)束,劉國(guó)梁突然官宣新布局,王勵(lì)勤早有暗示

楓塵余往逝
2026-03-12 19:49:55
對(duì)陣TOP10五連敗!斯瓦泰克戰(zhàn)滿三盤出局,無緣印第安維爾斯四強(qiáng)

對(duì)陣TOP10五連?。∷雇咛┛藨?zhàn)滿三盤出局,無緣印第安維爾斯四強(qiáng)

全景體育V
2026-03-13 08:41:07
武漢男子做核磁共振被遺忘6小時(shí),同濟(jì)醫(yī)院稱深感自責(zé),放射科:已整改,可正常預(yù)約

武漢男子做核磁共振被遺忘6小時(shí),同濟(jì)醫(yī)院稱深感自責(zé),放射科:已整改,可正常預(yù)約

瀟湘晨報(bào)
2026-03-13 11:54:21
回顧探花大神:害人害己,多位女主被親戚認(rèn)出當(dāng)場(chǎng)“社死”

回顧探花大神:害人害己,多位女主被親戚認(rèn)出當(dāng)場(chǎng)“社死”

就一點(diǎn)
2025-10-09 12:19:42
騰訊回應(yīng)OpenClaw之父Peter的“抄襲”指責(zé):希望繼續(xù)支持生態(tài)

騰訊回應(yīng)OpenClaw之父Peter的“抄襲”指責(zé):希望繼續(xù)支持生態(tài)

財(cái)聯(lián)社
2026-03-12 15:54:05
中國(guó)女足VS中國(guó)臺(tái)北:442最強(qiáng)出擊,王牌雙核心領(lǐng)銜,邵子欽沖鋒

中國(guó)女足VS中國(guó)臺(tái)北:442最強(qiáng)出擊,王牌雙核心領(lǐng)銜,邵子欽沖鋒

零度眼看球
2026-03-13 07:28:29
向佐踢主持人后續(xù)!百克力回應(yīng),確實(shí)有不爽,曝對(duì)方私下真實(shí)人品

向佐踢主持人后續(xù)!百克力回應(yīng),確實(shí)有不爽,曝對(duì)方私下真實(shí)人品

草莓解說體育
2026-03-13 12:20:53
杭州男子失戀游湖南,遇苗族婚宴隨禮1000入席,離場(chǎng)卻被伴娘攔下

杭州男子失戀游湖南,遇苗族婚宴隨禮1000入席,離場(chǎng)卻被伴娘攔下

蘭姐說故事
2025-06-09 10:00:07
淺析:美國(guó)陸軍全面列裝M111進(jìn)攻手榴彈 側(cè)重城鎮(zhèn)作戰(zhàn)特殊需求

淺析:美國(guó)陸軍全面列裝M111進(jìn)攻手榴彈 側(cè)重城鎮(zhèn)作戰(zhàn)特殊需求

hawk26講武堂
2026-03-12 11:48:37
成龍安排好身后事才2個(gè)月,翁靜晶再曝大瓜,沒給他留一絲體面

成龍安排好身后事才2個(gè)月,翁靜晶再曝大瓜,沒給他留一絲體面

星星沒有你亮
2026-02-28 20:40:21
不是累,是蠢!英超本輪歐戰(zhàn)崩塌,真相只有一個(gè)

不是累,是蠢!英超本輪歐戰(zhàn)崩塌,真相只有一個(gè)

體壇周報(bào)
2026-03-13 12:58:12
中方接到了通知,特朗普修改訪華規(guī)格,他要帶領(lǐng)美國(guó)對(duì)華彎道超車

中方接到了通知,特朗普修改訪華規(guī)格,他要帶領(lǐng)美國(guó)對(duì)華彎道超車

社會(huì)日日鮮
2026-03-13 03:21:57
狂賺5300萬!博德閃耀歐冠獎(jiǎng)金即將反超全隊(duì)身價(jià)!

狂賺5300萬!博德閃耀歐冠獎(jiǎng)金即將反超全隊(duì)身價(jià)!

籃球看比賽
2026-03-13 12:21:13
兩會(huì)閉幕!這4個(gè)建議將敲定,涉及養(yǎng)老教育工作,百姓生活將大變

兩會(huì)閉幕!這4個(gè)建議將敲定,涉及養(yǎng)老教育工作,百姓生活將大變

魚語昱雨軒
2026-03-12 15:46:48
兄弟們!三木環(huán)奈親自認(rèn)證!那個(gè)帶酒窩的“核彈級(jí)”少女要來了!

兄弟們!三木環(huán)奈親自認(rèn)證!那個(gè)帶酒窩的“核彈級(jí)”少女要來了!

碧波萬覽
2026-03-12 21:55:14
特朗普20天后訪華,不游覽城市不帶商團(tuán),只為一件大事

特朗普20天后訪華,不游覽城市不帶商團(tuán),只為一件大事

阿萔影視評(píng)論
2026-03-12 18:43:31
馬來西亞交通部:若中東戰(zhàn)爭(zhēng)大幅推高燃油成本,航空公司可能需要暫停部分航班

馬來西亞交通部:若中東戰(zhàn)爭(zhēng)大幅推高燃油成本,航空公司可能需要暫停部分航班

瀟湘晨報(bào)
2026-03-13 10:29:08
山東高中生被老師談話,15分鐘后離奇死亡,尸檢結(jié)果讓家人崩潰

山東高中生被老師談話,15分鐘后離奇死亡,尸檢結(jié)果讓家人崩潰

碎碎紀(jì)實(shí)
2026-03-06 18:59:33
2026-03-13 13:20:49
復(fù)旦發(fā)展研究院 incentive-icons
復(fù)旦發(fā)展研究院
高端高校智庫(kù)
3731文章數(shù) 1719關(guān)注度
往期回顧 全部

科技要聞

龍蝦熱卷到AI硬件 “無腦”硬件或被淘汰

頭條要聞

兩伊朗高官被疑是"內(nèi)鬼" 其中一人多次在襲擊中"幸存"

頭條要聞

兩伊朗高官被疑是"內(nèi)鬼" 其中一人多次在襲擊中"幸存"

體育要聞

叕戰(zhàn)奧運(yùn),張雨霏要做回“小將”

娛樂要聞

小S復(fù)工錄制 感謝賈永婕陪大S走到最后

財(cái)經(jīng)要聞

"短劇"苦抄襲

汽車要聞

本田汽車全年業(yè)績(jī)由盈轉(zhuǎn)虧 高管們降薪3個(gè)月以擔(dān)責(zé)

態(tài)度原創(chuàng)

游戲
藝術(shù)
數(shù)碼
本地
公開課

《深巖銀河:幸存者》DLC于4月發(fā)布 新職業(yè)粉碎者

藝術(shù)要聞

吳冠中:歷代畫竹大都缺乏厚度與深度

數(shù)碼要聞

當(dāng)年讓A卡的天塌了!黃仁勛慶祝GeForce 3顯卡發(fā)布25周年:它開啟了GPU的一切

本地新聞

坐標(biāo)北京,過敏季反向遷徒

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版