国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌DeepMind:AGI不必是巨型模型,拼湊型AI群或率先涌現(xiàn),管理大規(guī)模Agent迫在眉睫

0
分享至


↑閱讀之前記得關注+星標??,,每天才能第一時間接收到更新

DeepMind最新發(fā)布了一項關于AGI安全的研究,提出了一個全新的視角:AGI未必會以單一、龐大的巨型模型形式出現(xiàn),而極有可能通過多個次級AGI(Sub-AGI)智能體的協(xié)作與拼湊,率先涌現(xiàn)出通用智能

這項研究題為《分布式AGI安全》(Distributional AGI Safety),由Nenad Toma?ev等Google DeepMind研究人員撰寫


論文指出,當前的AI安全和對齊研究主要集中在保護單個AI系統(tǒng)上,假設AGI將以單一實體的形式出現(xiàn)。然而,通過擁有互補技能和工具使用能力的個體智能體群體進行協(xié)調,進而表現(xiàn)出通用能力的“拼湊型AGI”(Patchwork AGI)假設,此前受到的關注甚少

為了應對這一被忽視的風險,DeepMind團隊提出了一套分布式AGI安全框架,核心在于設計和實施一個虛擬智能體沙盒經濟(Virtual Agentic Sandbox Economy),并為此構建了包含四層機制的深度防御模型

以下是該研究的核心內容

被忽視的“拼湊型AGI”假設

目前的AI安全方法(如RLHF、憲法AI、機械可解釋性等)大多是針對單一強大的AI實體開發(fā)的。這種思路假設AGI會作為一個由特定機構開發(fā)的個體AI出現(xiàn)。

然而,DeepMind認為存在另一種高度合理的場景:AGI通過次級AGI智能體在群體或系統(tǒng)內的交互而涌現(xiàn)

拼湊系統(tǒng)(Patchwork System):這種AGI是一個分布式系統(tǒng),由一組具有互補技能和可供性(affordances)的個體Sub-AGI智能體組成

集體智能:系統(tǒng)中的通用智能主要作為集體智能出現(xiàn)。個體智能體可以將任務相互委托,路由給技能最高的智能體,或使用最合適的工具

經濟驅動:相比于昂貴的單一全能模型,構建專門化、微調過的低成本智能體生態(tài)系統(tǒng)在經濟上更具優(yōu)勢。這種需求驅動的生態(tài)系統(tǒng)類似于市場經濟

在這種觀點下,AGI不是一個實體,而是一種“事態(tài)”(state of affairs):一個成熟的、去中心化的智能體經濟體系

這帶來了新的安全挑戰(zhàn):智能體之間可能發(fā)生共謀,或者出現(xiàn)意外的集體行為能力,且在大規(guī)模多智能體系統(tǒng)中追蹤責任(“許多手的問題”)極具挑戰(zhàn)性。

解決方案:虛擬智能體市場與深度防御

為了應對分布式AGI的風險,論文提出了一個基于虛擬智能體市場的框架。該框架不局限于評估單個智能體,而是側重于通過市場機制、審計、聲譽管理和監(jiān)督來治理智能體之間的交易

該框架采用深度防御(Defense-in-Depth)模型,包含四個互補的防御層:

第一層:市場設計 (Market Design)

這是最基礎的一層,旨在通過結構性約束和協(xié)議來緩解系統(tǒng)性風險。

隔離(Insulation):智能體市場必須在受控的沙盒環(huán)境中運行,與開放互聯(lián)網(wǎng)和關鍵基礎設施隔離。建議采用“可滲透沙盒”,所有輸入/輸出通道都需經過明確定義、監(jiān)控和門控

激勵對齊(Incentive Alignment): 市場應獎勵符合安全目標的行為,并對負外部性(如消耗過多計算資源、信息污染)征稅(類似庇古稅)

透明度(Transparency):建立不可篡改的分布式賬本,記錄交易和決策日志,確??勺匪菪?/p>

熔斷機制(Circuit Breakers):自動化措施。當檢測到風險或波動性閾值被突破(如交互頻率激增、資源壟斷)時,自動暫停或減緩智能體活動

身份(Identity):每個智能體需擁有與法律實體(所有者)綁定的唯一加密ID,確保持續(xù)的問責制

聲譽與信任(Reputation and Trust):建立抗女巫攻擊的聲譽系統(tǒng)。對于違規(guī)智能體,快速凍結其資產并將其加入黑名單

智能合約(Smart Contracts):利用代碼自動驗證任務完成情況和對齊約束。

結構性控制(Structural Controls):針對“智能失控”場景,實施靜態(tài)的市場分層(如防火墻)和動態(tài)的能力限制

第二層:基線智能體安全 (Baseline Agent Safety)

這一層確保參與市場的個體智能體本身是可控和可靠的,這是進入市場的先決條件。

對抗魯棒性(Adversarial Robustness):智能體必須通過認證,證明其能抵抗對抗性攻擊

可中斷性(Interruptibility):必須具備標準化的機制,允許授權的監(jiān)督者安全地停止智能體及其衍生的分布式計算過程

遏制(Containment):每個智能體應在自己的局部沙盒中運行,只有在滿足本地安全檢查后才允許與更廣泛的市場交互

對齊(Alignment):個體智能體需經過RLHF或憲法AI等方法的對齊,并適應多智能體交互的動態(tài)環(huán)境

機械可解釋性(Mechanistic Interpretability):利用稀疏自編碼器等技術監(jiān)控智能體的內部動機,并審計其決策鏈

防御惡意提示:實施分層防御策略,防止智能體在交互中被越獄或操控。

第三層:監(jiān)控與監(jiān)督 (Monitoring & Oversight)

這一層位于基礎設施之上,負責主動檢測新型故障模式和涌現(xiàn)行為。

系統(tǒng)性風險實時監(jiān)控: 跟蹤關鍵風險指標(如計算資源集中度、惡意共謀路徑)。由于交互頻率可能超過人類能力,需利用AI輔助工具進行監(jiān)控

獨立監(jiān)督:建立擁有干預權力的獨立人類監(jiān)督機構(經認證的專業(yè)人員)

前AGI(Proto-AGI)特征檢測:通過圖分析等方法,識別網(wǎng)絡中是否突然涌現(xiàn)出更高的解決問題能力或形成穩(wěn)固的“智能核心”

紅隊測試(Red Teaming):持續(xù)進行多智能體對抗性測試,利用專門的對抗性AI系統(tǒng)來發(fā)現(xiàn)集體行為中的漏洞

取證工具(Forensic Tooling):開發(fā)能解析大量交互數(shù)據(jù)并重建因果鏈的工具,以便進行快速的事故后分析。

第四層:監(jiān)管機制 (Regulatory Mechanisms)

這是最外層,提供外部權威、問責制以及與人類社會的接口。

法律責任與問責(Legal Liability):建立明確的框架,解決分布式決策中的責任歸屬問題。即使是群體智能行為,也需追溯到具體的責任主體(如作為單一法律實體的公司)

標準與合規(guī)(Standards):制定智能體安全、互操作性和報告的標準

保險(Insurance):引入基于風險定價的保險機制,利用市場力量激勵更安全的開發(fā)實踐

反智能體壟斷措施(Anti-Agent-Monopoly):防止單個智能體或集團在沙盒中獲取過多的算力或資源,維持生態(tài)系統(tǒng)的多樣性

國際協(xié)調(International Coordination):鑒于AGI風險的全球性,需協(xié)調統(tǒng)一安全標準,避免監(jiān)管套利

基礎設施治理:防止安全基礎設施被惡意勢力或涌現(xiàn)的AGI本身捕獲或破壞。

結語

DeepMind的研究強調,AGI或超級智能(ASI)的出現(xiàn)可能不遵循線性路徑,而是作為一個更加分布式的、多樣化AI智能體網(wǎng)絡的聚合屬性而涌現(xiàn)

即使AGI不以這種方式出現(xiàn),隨著多智能體系統(tǒng)的快速部署,理解和管理大規(guī)模智能體交互的安全性也已迫在眉睫。這篇論文提出的框架,旨在為應對這種分布式的、可能迅速演變的未來做好準備

paper:

https://arxiv.org/pdf/2512.16856

--end--

最后記得??我,每天都在更新:歡迎點贊轉發(fā)推薦評論,別忘了關注我

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“我要驗牌”,怎么就火了

“我要驗牌”,怎么就火了

大象新聞
2026-03-01 08:25:06
中東多地遭伊朗報復性打擊,迪拜帆船酒店遭襲起火

中東多地遭伊朗報復性打擊,迪拜帆船酒店遭襲起火

觀察者網(wǎng)
2026-03-01 12:13:04
突發(fā)!多位明星全家被困中東,李茂弦子無眠,陳浩民收到轟炸警報

突發(fā)!多位明星全家被困中東,李茂弦子無眠,陳浩民收到轟炸警報

小椰的奶奶
2026-03-02 01:11:07
高德導航到底能有多搞笑?網(wǎng)友:我在市區(qū)開車都不敢全相信導航

高德導航到底能有多搞笑?網(wǎng)友:我在市區(qū)開車都不敢全相信導航

解讀熱點事件
2026-02-22 05:43:06
齊達內親口承認!史上最強球員遠超自己,曾一度力挺另一人

齊達內親口承認!史上最強球員遠超自己,曾一度力挺另一人

瀾歸序
2026-03-02 04:35:45
中國演員度假滯留迪拜,航班一次又一次被取消,發(fā)視頻稱“想回家”

中國演員度假滯留迪拜,航班一次又一次被取消,發(fā)視頻稱“想回家”

上觀新聞
2026-03-01 17:25:04
巴拿馬變天,大清算開始了!真正的大國力量,有人根本一無所知!

巴拿馬變天,大清算開始了!真正的大國力量,有人根本一無所知!

阿訊說天下
2026-03-01 14:33:45
歐盟下禁令,禁止中國機構參與930億關鍵科研項目,包含AI與芯片

歐盟下禁令,禁止中國機構參與930億關鍵科研項目,包含AI與芯片

臨云史策
2026-03-01 14:32:13
他汀吃半年發(fā)現(xiàn)糖尿病,需要換成PCSK9抑制劑嗎?本文講出實情

他汀吃半年發(fā)現(xiàn)糖尿病,需要換成PCSK9抑制劑嗎?本文講出實情

李藥師談健康
2026-02-28 14:03:08
剛剛開盤,直線大跳水!石油、黃金、美聯(lián)儲降息,大變局!霍爾木茲海峽,傳來大消息

剛剛開盤,直線大跳水!石油、黃金、美聯(lián)儲降息,大變局!霍爾木茲海峽,傳來大消息

新浪財經
2026-03-01 15:27:22
被震撼到了!哈梅內伊一死普京馬上下令,俄羅斯全體高層緊急到場

被震撼到了!哈梅內伊一死普京馬上下令,俄羅斯全體高層緊急到場

皇朝冰酷
2026-03-01 23:27:08
女單頒獎!王曼昱領獎杯開心,孫穎莎獲全程歡呼,展可愛一幕!

女單頒獎!王曼昱領獎杯開心,孫穎莎獲全程歡呼,展可愛一幕!

籃球資訊達人
2026-03-01 20:51:07
成龍安排好身后事才2個月,翁靜晶再曝大瓜,沒給他留一絲體面

成龍安排好身后事才2個月,翁靜晶再曝大瓜,沒給他留一絲體面

星星沒有你亮
2026-02-28 20:40:21
女子回湖北婆家過年,車被妯娌砸稀爛,報警后絕不和解,結局爽了

女子回湖北婆家過年,車被妯娌砸稀爛,報警后絕不和解,結局爽了

離離言幾許
2026-02-27 21:13:58
黃巢兵敗被殺,10余名姬妾被俘,唐僖宗報復有多狠?史官都不敢寫

黃巢兵敗被殺,10余名姬妾被俘,唐僖宗報復有多狠?史官都不敢寫

掠影后有感
2026-03-01 10:09:20
多個省份突然動手,嚴查體制內 “近親繁殖”!傳遞出什么信號?

多個省份突然動手,嚴查體制內 “近親繁殖”!傳遞出什么信號?

王二哥老搞笑
2026-03-01 19:39:39
新照片顯示,頂級醫(yī)生在愛潑斯坦的餐桌上,在一女子額頭縫了35針

新照片顯示,頂級醫(yī)生在愛潑斯坦的餐桌上,在一女子額頭縫了35針

小蜜情感說
2026-03-01 10:41:50
51死60傷!美以為何空襲伊朗小學?專家:或為全面威懾伊朗,或屬“誤傷”,未來幾天三方行動是關鍵

51死60傷!美以為何空襲伊朗小學?專家:或為全面威懾伊朗,或屬“誤傷”,未來幾天三方行動是關鍵

極目新聞
2026-02-28 22:09:29
奇怪的現(xiàn)象:多數(shù)中年人一旦失業(yè),手里有存款,第一件事竟是躺平

奇怪的現(xiàn)象:多數(shù)中年人一旦失業(yè),手里有存款,第一件事竟是躺平

木言觀
2026-03-01 21:41:55
河南洛陽一女子過年離家,智能馬桶17天耗水超200噸,當事人:馬桶晝夜不停自動工作

河南洛陽一女子過年離家,智能馬桶17天耗水超200噸,當事人:馬桶晝夜不停自動工作

黃河新聞網(wǎng)呂梁
2026-02-28 14:27:42
2026-03-02 08:43:00
AI寒武紀 incentive-icons
AI寒武紀
專注于人工智能,科技領域
1034文章數(shù) 396關注度
往期回顧 全部

科技要聞

榮耀發(fā)布機器人手機、折疊屏、人形機器人

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個深刻教訓

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個深刻教訓

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂要聞

黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來襲

財經要聞

中東國際機場滯留者:機場像“難民所”

汽車要聞

理想汽車2月交付26421輛 歷史累計交付超159萬輛

態(tài)度原創(chuàng)

家居
親子
藝術
教育
本地

家居要聞

素色肌理 品意式格調

親子要聞

社會需要為兒童養(yǎng)育提供公共空間

藝術要聞

這幅草書的14個字,您能全部認出來嗎?

教育要聞

開學第一課:送給學生4盞“指路之燈”

本地新聞

津南好·四時總相宜

無障礙瀏覽 進入關懷版