国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

社會(huì)模擬邁入可控、可量化時(shí)代:為AI Agent加上「認(rèn)知滑條」

0
分享至



用大模型做社會(huì)模擬,你能保證換個(gè)模型, Agent 還會(huì)做出一樣的決策嗎?在 LLM-based 社會(huì)模擬中,研究者通常用一段自然語(yǔ)言描述來(lái)定義 Agent 的行為,例如「John Lin 是一個(gè)社區(qū)藥店老板,他熱心助人……」。這種基于人設(shè)的 Agent 定義方式已被廣泛采用,幾乎成為社會(huì)模擬領(lǐng)域的標(biāo)準(zhǔn)范式。然而:這些描述究竟是在「定義 Agent 」,還是只是提供了一種松散且無(wú)法穩(wěn)定復(fù)現(xiàn)的行為暗示?

UCSD 團(tuán)隊(duì)在 CHI 2026 Best Paper 論文CoBRA (眼鏡蛇)中提出了一套可量化、可驗(yàn)證、可復(fù)現(xiàn)的 Agent 控制框架。它將經(jīng)典社會(huì)科學(xué)實(shí)驗(yàn)轉(zhuǎn)化為可復(fù)用的校準(zhǔn)環(huán)境,使 Agent 行為可被測(cè)量、反饋與收斂,建立類(lèi)似實(shí)驗(yàn)科學(xué)的變量控制機(jī)制,并在輸入、激活與參數(shù)空間實(shí)現(xiàn)定量化控制。

CoBRA 標(biāo)志著AI 社會(huì)模擬從經(jīng)驗(yàn)式敘述走向可控、可復(fù)現(xiàn)的實(shí)驗(yàn)科學(xué)范式。


視頻鏈接:https://mp.weixin.qq.com/s/FJULL6lcvqIFE4NaCEOx7w

  • 論文標(biāo)題:CoBRA: Programming Cognitive Bias in Social Agents Using Classic Social Science Experiments
  • 論文鏈接:https://arxiv.org/abs/2509.13588
  • 代碼鏈接:https://github.com/AISmithLab/CoBRA
  • 項(xiàng)目主頁(yè):https://cobra.clawder.ai

自然語(yǔ)言人設(shè)的可控性困境

研究者首先做了一組先導(dǎo)實(shí)驗(yàn)。他們用經(jīng)典社會(huì)科學(xué)實(shí)驗(yàn)——亞洲疾病問(wèn)題——來(lái)測(cè)試 Agent 的框架效應(yīng)。這是行為決策研究中的經(jīng)典范式:當(dāng)同一個(gè)結(jié)果被描述為「 200 人被救活」或「 400 人將死亡」時(shí),人類(lèi)會(huì)系統(tǒng)性地改變決策偏好。

他們?cè)O(shè)計(jì)了三種 Agent 人設(shè)——經(jīng)濟(jì)學(xué)家、普通人和空白(無(wú)描述)——并在 Mistral 7B 、 Gemma2 9B 、 GPT-4o Mini 、 DeepSeek-v3 四個(gè)模型上進(jìn)行了測(cè)試。

結(jié)果令人反思:

  • 同一描述,不同模型,行為完全不同。結(jié)果顯示所有條件下跨模型行為差異顯著。例如, Mistral 7B 的回答嚴(yán)重偏向正面框架,而 Gemma2 9B 的回答接近中性。
  • 隱式描述無(wú)法可靠地產(chǎn)生預(yù)期行為。社會(huì)科學(xué)研究表明,經(jīng)濟(jì)學(xué)專(zhuān)家往往比普通人更不容易受到框架效應(yīng)的影響。但四個(gè)模型中,只有 GPT-4o 的結(jié)果勉強(qiáng)符合這一預(yù)期; DeepSeek 中經(jīng)濟(jì)學(xué)家反而比普通人更容易受影響; Mistral 三種人設(shè)幾乎沒(méi)有區(qū)別。

一句話總結(jié):用自然語(yǔ)言給 Agent 寫(xiě)人設(shè),在科學(xué)意義上是不可控的、不可復(fù)現(xiàn)的。

CoBRA:用經(jīng)典實(shí)驗(yàn)為 Agent 行為「標(biāo)定刻度」



圖:CoBRA 工作流

CoBRA 的核心思路出奇地優(yōu)雅:把經(jīng)過(guò)幾十年驗(yàn)證的經(jīng)典社會(huì)科學(xué)實(shí)驗(yàn)當(dāng)作 Agent 的「考試」,測(cè)完再調(diào),調(diào)到達(dá)標(biāo)。

例如,我們希望精確指定一個(gè) Agent 受到「框架效應(yīng)」這種認(rèn)知偏差的影響程度,就可以讓它參加經(jīng)典的「亞洲疾病問(wèn)題」等實(shí)驗(yàn),測(cè)量其決策差異,將這種差異量化為偏差指數(shù),并根據(jù)目標(biāo)水平調(diào)節(jié)控制系數(shù),再次測(cè)量,直至其偏差程度達(dá)到預(yù)設(shè)值。

CoBRA 以「認(rèn)知偏差」作為試點(diǎn)。認(rèn)知偏差不同于抽象的價(jià)值觀或道德判斷,它具有明確的實(shí)驗(yàn)定義、可計(jì)算的行為指標(biāo)以及可驗(yàn)證的干預(yù)路徑,因此更適合作為構(gòu)建可量化調(diào)節(jié)的工程起點(diǎn)。

具體來(lái)說(shuō), CoBRA 包含兩個(gè)核心組件:

1. 認(rèn)知偏差指數(shù)——量化 Agent 的偏差程度

CoBRA 的認(rèn)知偏差指數(shù)建立在經(jīng)典社會(huì)科學(xué)實(shí)驗(yàn)范式之上,系統(tǒng)性地覆蓋四類(lèi)具有代表性的認(rèn)知偏差(權(quán)威效應(yīng)、從眾效應(yīng)、確認(rèn)偏差與框架效應(yīng)),每類(lèi)偏差均對(duì)應(yīng)兩種經(jīng)典實(shí)驗(yàn)范式,用于交叉校準(zhǔn)與驗(yàn)證。 Agent 在這些實(shí)驗(yàn)中的表現(xiàn)被量化為一個(gè) 0-4 的連續(xù)分?jǐn)?shù)。同一偏差類(lèi)型的兩個(gè)范式相互驗(yàn)證——在一個(gè)范式上校準(zhǔn)的控制系數(shù),在另一個(gè)范式上也應(yīng)產(chǎn)生一致的效果。

2. 行為調(diào)節(jié)引擎——從三個(gè)層次調(diào)控 Agent

行為調(diào)節(jié)引擎覆蓋 LLM 的三個(gè)基本干預(yù)空間:

輸入空間(Prompt Numerical Control):用數(shù)值化指令(如「你的權(quán)威偏差程度是 65% 」)替代模糊的定性描述,無(wú)需訓(xùn)練。該方法適用于所有模型。

激活空間(Representation Engineering):通過(guò)三組對(duì)比樣本(偏差正例 / 中性 / 反例),提取出干凈的偏差方向向量,并與安全拒絕信號(hào)分離,在推理時(shí)注入隱藏狀態(tài)。注入方式有兩種: Linear Control 像是均勻放大或減弱偏差強(qiáng)度,表達(dá)范圍更廣; Projection Control 則根據(jù)當(dāng)前語(yǔ)境自適應(yīng)調(diào)節(jié),控制曲線更平滑穩(wěn)定。該方法適用于開(kāi)源模型。

參數(shù)空間(Fine-tuning with Task Vectors):分別訓(xùn)練一個(gè)「有偏差」和「無(wú)偏差」的 LoRA ,然后用 task vector 差值作為控制信號(hào),通過(guò)控制系數(shù)精確調(diào)節(jié)。

每種方法都通過(guò)一個(gè)控制系數(shù)與認(rèn)知偏差指數(shù)形成閉環(huán): CoBRA 自動(dòng)掃描控制系數(shù),測(cè)量 Agent 在實(shí)驗(yàn)中的表現(xiàn),直到達(dá)到目標(biāo)指數(shù)。

跨模型一致性與魯棒性驗(yàn)證

論文在多類(lèi)開(kāi)源與閉源系統(tǒng)上開(kāi)展系統(tǒng)評(píng)測(cè),驗(yàn)證了 CoBRA 的跨模型、跨推理模式與跨場(chǎng)景穩(wěn)定性:其顯著降低行為方差,在 0.1–1.0 溫度區(qū)間內(nèi)保持統(tǒng)計(jì)等價(jià),并在不同推理模式下呈現(xiàn)高度一致的控制曲線。

在此基礎(chǔ)上,作者進(jìn)一步從單調(diào)性、平滑度、表達(dá)范圍與泛化性四個(gè)維度系統(tǒng)評(píng)估其可控性。結(jié)果顯示,激活空間的控制在單調(diào)性與平滑度上表現(xiàn)最佳,輸入空間控制則提供更大的表達(dá)范圍。同時(shí),控制系數(shù)可在不同實(shí)驗(yàn)范式間遷移,并在不同人設(shè)設(shè)定下保持高度一致,展現(xiàn)出良好的泛化能力。

開(kāi)放任務(wù)驗(yàn)證

論文進(jìn)一步模擬了經(jīng)典的情緒傳染場(chǎng)景,以展示 CoBRA 的實(shí)際應(yīng)用價(jià)值。在實(shí)驗(yàn)中, Agent 瀏覽包含不同比例負(fù)面帖子的社交媒體信息流,隨后生成新的內(nèi)容。研究者通過(guò)分析其生成文本的情緒變化,衡量情緒傳染的強(qiáng)度。

基線方法僅通過(guò)自然語(yǔ)言描述調(diào)節(jié)偏差強(qiáng)度,結(jié)果顯示不同偏差等級(jí)的 Agent 情緒傳染曲線幾乎完全重疊,難以有效區(qū)分。相比之下, CoBRA 呈現(xiàn)出清晰的劑量——響應(yīng)關(guān)系:從眾效應(yīng)認(rèn)知偏差指數(shù)越高, Agent 表現(xiàn)出的情緒傳染程度也越強(qiáng),不同等級(jí)之間具有明確且穩(wěn)定的區(qū)分度。

該情緒傳染實(shí)驗(yàn)基于開(kāi)放式任務(wù),體現(xiàn)出 CoBRA 明確的實(shí)際應(yīng)用價(jià)值。

從「像那么回事」到「可控和可復(fù)現(xiàn)」

這項(xiàng)工作的意義,可以概括為從「看起來(lái)像那么回事」到「可控、可復(fù)現(xiàn)的科學(xué)研究」的跨越。過(guò)去的 LLM 社會(huì)模擬依賴(lài)自然語(yǔ)言人設(shè)來(lái)塑造行為,直觀卻缺乏穩(wěn)定的控制結(jié)構(gòu)。 CoBRA 將經(jīng)典社會(huì)科學(xué)實(shí)驗(yàn)轉(zhuǎn)化為可復(fù)用的校準(zhǔn)環(huán)境,使 Agent 行為能夠被持續(xù)測(cè)量與調(diào)節(jié),從而建立起類(lèi)似實(shí)驗(yàn)科學(xué)的變量控制機(jī)制。

CoBRA 讓 Agent 擁有清晰的刻度與調(diào)節(jié)旋鈕。當(dāng) Agent 行為可以被標(biāo)定和收斂,社會(huì)模擬也就真正進(jìn)入了可復(fù)現(xiàn)的工程階段。

作者信息

劉萱:加州大學(xué)圣地亞哥分校(UCSD)博士生, 2025 年本科畢業(yè)于香港理工大學(xué)。研究方向聚焦人工智能與人機(jī)交互,關(guān)注 AI 系統(tǒng)的類(lèi)人認(rèn)知與社會(huì)智能機(jī)制,構(gòu)建面向科學(xué)研究的 AI 工具,以及其隱私與安全問(wèn)題。個(gè)人主頁(yè):https://xuanl17.github.io/

商昊暘:獨(dú)立學(xué)者, 2025 年本科畢業(yè)于上海交通大學(xué),將于 2026 年秋季加入英屬哥倫比亞大學(xué)(UBC)深造。

金浩?。?/strong>加州大學(xué)圣地亞哥分校(UCSD)助理教授,博士畢業(yè)于卡內(nèi)基梅隆大學(xué)人機(jī)交互研究所(CMU HCII),本科就讀于華中科技大學(xué)。研究方向涵蓋人機(jī)交互、隱私與安全及人本系統(tǒng)設(shè)計(jì)。個(gè)人主頁(yè):https://www.haojianj.in/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
56歲虞美人集團(tuán)董事長(zhǎng)與26歲男友大婚:陪嫁5000萬(wàn),男方身份被扒

56歲虞美人集團(tuán)董事長(zhǎng)與26歲男友大婚:陪嫁5000萬(wàn),男方身份被扒

老貓觀點(diǎn)
2026-03-19 08:35:09
辣目洋子回應(yīng)參加浪姐后變瘦:身體上是疲憊的,心靈上是非常開(kāi)心

辣目洋子回應(yīng)參加浪姐后變瘦:身體上是疲憊的,心靈上是非常開(kāi)心

韓小娛
2026-03-29 10:59:45
“晚打不如早打,小打不如大打,打一個(gè),不如拉日本一起打”。

“晚打不如早打,小打不如大打,打一個(gè),不如拉日本一起打”。

安安說(shuō)
2026-03-14 18:50:59
華人男子在美軍基地埋“致命炸彈”后逃回國(guó)!姐姐被抓、母親將被遣返

華人男子在美軍基地埋“致命炸彈”后逃回國(guó)!姐姐被抓、母親將被遣返

華人生活網(wǎng)
2026-03-28 01:51:37
秦皇島阿那亞現(xiàn)罕見(jiàn)“帶狀”海市蜃樓,拍攝者:像積木搭成的火車(chē),還有船只在浮動(dòng)

秦皇島阿那亞現(xiàn)罕見(jiàn)“帶狀”海市蜃樓,拍攝者:像積木搭成的火車(chē),還有船只在浮動(dòng)

極目新聞
2026-03-29 12:15:15
降格外交沒(méi)換來(lái)談判,反而被拒之門(mén)外,中方到底在等什么?

降格外交沒(méi)換來(lái)談判,反而被拒之門(mén)外,中方到底在等什么?

呼呼歷史論
2026-03-29 14:53:28
左所長(zhǎng)被刑拘!“打一針就好”背后的真相,讓人不寒而栗

左所長(zhǎng)被刑拘!“打一針就好”背后的真相,讓人不寒而栗

一杯咖啡語(yǔ)
2026-03-29 19:35:20
心梗去世的名人越來(lái)越多?醫(yī)生再次強(qiáng)調(diào):寧可打打牌 也別做這些事

心梗去世的名人越來(lái)越多?醫(yī)生再次強(qiáng)調(diào):寧可打打牌 也別做這些事

健身狂人
2026-03-29 10:07:37
復(fù)活成功!收到26億救命錢(qián),1470億債務(wù)清零,他比許家印還好命

復(fù)活成功!收到26億救命錢(qián),1470億債務(wù)清零,他比許家印還好命

小舟談歷史
2026-03-28 01:23:21
業(yè)余!27歲女足國(guó)門(mén)屢失誤連丟4球 12天內(nèi)從亞洲杯到亞冠連場(chǎng)夢(mèng)游

業(yè)余!27歲女足國(guó)門(mén)屢失誤連丟4球 12天內(nèi)從亞洲杯到亞冠連場(chǎng)夢(mèng)游

我愛(ài)英超
2026-03-29 21:29:50
傍富婆、和劉亦菲談戀愛(ài)、學(xué)歷造假,于適的私生活謠言有多離譜

傍富婆、和劉亦菲談戀愛(ài)、學(xué)歷造假,于適的私生活謠言有多離譜

老吳教育課堂
2026-03-30 00:45:28
最危險(xiǎn)的變量:波蘭會(huì)跨過(guò)那條紅線嗎?

最危險(xiǎn)的變量:波蘭會(huì)跨過(guò)那條紅線嗎?

民間平淡生活
2026-03-28 18:23:42
同學(xué)在我家白吃白住6年,當(dāng)官了卻裝不認(rèn)識(shí)我,我落魄時(shí)他出現(xiàn)了

同學(xué)在我家白吃白住6年,當(dāng)官了卻裝不認(rèn)識(shí)我,我落魄時(shí)他出現(xiàn)了

醉愛(ài)講故事
2025-03-26 21:05:03
比外敵更可怕的,是我們自身的愚昧

比外敵更可怕的,是我們自身的愚昧

濤哥銳評(píng)
2026-03-28 19:43:53
蒙古政壇徹底亂了!新任總理發(fā)動(dòng)高層清算,對(duì)改革派睚眥必報(bào)

蒙古政壇徹底亂了!新任總理發(fā)動(dòng)高層清算,對(duì)改革派睚眥必報(bào)

似水流年忘我
2026-03-21 04:08:54
“一小時(shí)午睡”錯(cuò)了?醫(yī)生忠告:過(guò)了70歲,午睡要盡量做到這3點(diǎn)

“一小時(shí)午睡”錯(cuò)了?醫(yī)生忠告:過(guò)了70歲,午睡要盡量做到這3點(diǎn)

讀懂世界歷史
2026-03-04 10:12:47
為什么女人總和你談結(jié)婚條件

為什么女人總和你談結(jié)婚條件

賴(lài)煥慶
2026-03-06 06:15:04
日本輿論要求日本政府向中方道歉

日本輿論要求日本政府向中方道歉

澎湃新聞
2026-03-28 22:00:07
上海三鋒線陣容太強(qiáng)了!劉禮嘉奇兵,李弘權(quán)精準(zhǔn),張鎮(zhèn)麟制霸攻守

上海三鋒線陣容太強(qiáng)了!劉禮嘉奇兵,李弘權(quán)精準(zhǔn),張鎮(zhèn)麟制霸攻守

籃球資訊達(dá)人
2026-03-29 23:55:28
接陌生電話不要先出聲

接陌生電話不要先出聲

大象新聞
2026-03-29 07:29:10
2026-03-30 02:24:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專(zhuān)業(yè)的人工智能媒體
12620文章數(shù) 142599關(guān)注度
往期回顧 全部

科技要聞

馬斯克承認(rèn)xAI"建錯(cuò)了",11位創(chuàng)始人均離職

頭條要聞

伊朗議長(zhǎng):美航母遭受巨大損失 我們絕不接受屈辱

頭條要聞

伊朗議長(zhǎng):美航母遭受巨大損失 我們絕不接受屈辱

體育要聞

絕殺衛(wèi)冕冠軍后,他單手指天把勝利獻(xiàn)給父親

娛樂(lè)要聞

汪峰定律再現(xiàn)!李榮浩喊話單依純侵權(quán)

財(cái)經(jīng)要聞

Kimi、Minimax 們的算力荒

汽車(chē)要聞

嵐圖泰山X8配置曝光 四激光雷達(dá)/華為新一代座艙

態(tài)度原創(chuàng)

數(shù)碼
手機(jī)
教育
公開(kāi)課
軍事航空

數(shù)碼要聞

內(nèi)存條價(jià)格被曝出現(xiàn)斷崖式下跌,一天跌去百元

手機(jī)要聞

驍龍8 Elite Gen6系列規(guī)格大揭秘:LPDDR6、Adreno 850,都來(lái)了!

教育要聞

建議給家長(zhǎng)放春秋假,否則的話,學(xué)生放春秋假就失去意義

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美兩棲攻擊艦載3500名增援到達(dá)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版