国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

PNAS | 不確定環(huán)境下,社會(huì)學(xué)習(xí)如何決定集體決策的命運(yùn)?揭秘社會(huì)學(xué)習(xí)算法的效率-靈活性權(quán)衡

0
分享至

PsyBrain 腦心前沿 | 公眾號(hào) PSY-Brain_Frontier

一鍵關(guān)注,點(diǎn)亮星標(biāo) ??

不錯(cuò)過(guò)每日前沿資訊

認(rèn)知神經(jīng)科學(xué)前沿文獻(xiàn)分享


基本信息

Title:How social learning enhances—or undermines—efficiency and flexibility in collective decision-making under uncertainty

發(fā)表時(shí)間:2025.11.24

發(fā)表期刊:PNAS

影響因子:9.1

獲取原文:

  1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本



研究背景

在信息爆炸的現(xiàn)代社會(huì),“隨大流” 往往被視為一種生存智慧。從蜜蜂尋找花蜜,到我們?cè)陔娚唐脚_(tái)根據(jù)銷量下單,亦或是投資者追逐熱門(mén)股票,社會(huì)學(xué)習(xí)(Social Learning) 讓個(gè)體能夠通過(guò)觀察他人來(lái)規(guī)避高昂的“試錯(cuò)成本”。通常我們認(rèn)為,群體智慧(Collective Intelligence)優(yōu)于個(gè)人決策,因?yàn)槿后w能夠過(guò)濾噪音,匯聚最優(yōu)解。


然而,群體的力量并非總是正向的。歷史和現(xiàn)實(shí)反復(fù)證明,社會(huì)學(xué)習(xí)也可能導(dǎo)致災(zāi)難性的“羊群效應(yīng)”:由于盲目跟風(fēng),群體可能在環(huán)境發(fā)生劇變時(shí)集體陷入錯(cuò)誤的路徑,甚至引發(fā)金融泡沫破裂或網(wǎng)絡(luò)謠言的病毒式傳播。

這就引出了一個(gè)經(jīng)典的科學(xué)難題:為什么社會(huì)學(xué)習(xí)有時(shí)能產(chǎn)生精準(zhǔn)的群體智慧,有時(shí)卻會(huì)導(dǎo)致集體的愚蠢?

既往的認(rèn)知神經(jīng)科學(xué)研究提出了兩種截然不同的社會(huì)學(xué)習(xí)算法假設(shè):一種認(rèn)為我們不僅模仿行為,還會(huì)內(nèi)化他人的偏好(價(jià)值重塑);另一種認(rèn)為我們只是在行為上從眾,但內(nèi)心保留獨(dú)立判斷(決策偏倚)。但這兩種機(jī)制在群體層面究竟如何互動(dòng)?特別是在環(huán)境充滿不確定性且快速變化(Volatility)的當(dāng)下,哪種策略更具適應(yīng)性?這不僅是進(jìn)化心理學(xué)的核心議題,更是理解人類社會(huì)動(dòng)態(tài)及設(shè)計(jì)未來(lái)AI群體的關(guān)鍵線索。


研究核心總結(jié)

2025年11月24日發(fā)表于 PNAS 的該項(xiàng)研究,通過(guò)計(jì)算建模進(jìn)化博弈論模擬,深刻揭示了不同社會(huì)學(xué)習(xí)算法在集體決策中的權(quán)衡(Trade-off)機(jī)制。


Fig. 1. Overview of the agent-based simulations.

核心發(fā)現(xiàn)一:兩種社會(huì)學(xué)習(xí)算法的計(jì)算本質(zhì)差異

研究者在強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)框架下,對(duì)比了兩種核心算法

  1. 價(jià)值重塑(Value Shaping, VS):觀察者將他人的選擇視為一種“偽獎(jiǎng)賞”(Pseudo-reward),直接更新自己對(duì)該選項(xiàng)的價(jià)值評(píng)估(Q-value)。即“別人選它,說(shuō)明它真的好”。

  2. 決策偏倚(Decision Biasing, DB):社會(huì)信息僅影響當(dāng)下的選擇概率(Action Probability),而不改變個(gè)體內(nèi)部對(duì)選項(xiàng)的價(jià)值評(píng)估。即“雖然我跟風(fēng)選它,但我對(duì)它的價(jià)值評(píng)價(jià)仍基于我自己的真實(shí)體驗(yàn)”。


Fig. 2. Pair-level performance of the DB and VS algorithms under complete and selective information sharing.

核心發(fā)現(xiàn)二:效率與靈活性的零和博弈

通過(guò)非靜態(tài)多臂老虎機(jī)任務(wù)(Non-stationary Multi-armed Bandit Task)模擬,研究發(fā)現(xiàn):

  • VS算法是“雙刃劍”:在環(huán)境穩(wěn)定的初期,VS策略能極快地促成群體共識(shí),實(shí)現(xiàn)極高的決策效率(Efficiency)。然而,一旦環(huán)境發(fā)生逆轉(zhuǎn)(原先最優(yōu)的選項(xiàng)變差),VS群體極易陷入“信息級(jí)聯(lián)”的陷阱。由于社會(huì)信號(hào)不斷強(qiáng)化過(guò)時(shí)的選項(xiàng)價(jià)值,即便真實(shí)獎(jiǎng)勵(lì)已經(jīng)消失,群體仍會(huì)固執(zhí)地堅(jiān)持錯(cuò)誤選擇,表現(xiàn)出極差的靈活性(Flexibility)。這種僵化現(xiàn)象在群體規(guī)模大、從眾傾向(Majority Bias)強(qiáng)的情況下尤為嚴(yán)重。

  • DB算法具備魯棒性:相比之下,DB群體雖然在穩(wěn)定期達(dá)成共識(shí)的速度較慢,但由于其內(nèi)部?jī)r(jià)值評(píng)估未受社會(huì)信號(hào)“污染”,一旦環(huán)境改變,它們能敏銳地通過(guò)自身的獎(jiǎng)勵(lì)預(yù)測(cè)誤差(RPE)發(fā)現(xiàn)變化,從而快速掉頭。


Fig. 3

核心發(fā)現(xiàn)三:進(jìn)化穩(wěn)定策略與羅杰斯悖論的破解

該研究最精彩的部分在于進(jìn)化動(dòng)力學(xué)分析。根據(jù)文化進(jìn)化理論中的“羅杰斯悖論”(Rogers' Paradox),如果社會(huì)學(xué)習(xí)者只是單純“竊取”個(gè)體學(xué)習(xí)者的信息,最終群體的平均適應(yīng)度不會(huì)超過(guò)純個(gè)體學(xué)習(xí)者。

但本研究發(fā)現(xiàn),VS和DB的混合共存是進(jìn)化的穩(wěn)定終局(ESS)。

  • DB 智能體充當(dāng)了“生產(chǎn)者”(Producer)的角色,它們對(duì)環(huán)境變化敏感,能夠提供高質(zhì)量的一手信息。

  • VS 智能體則充當(dāng)“搜尋者”(Scrounger),它們利用DB產(chǎn)生的信息快速擴(kuò)大優(yōu)勢(shì)。

  • 這種“生產(chǎn)者-搜尋者”的動(dòng)態(tài)平衡,使得混合群體能夠在保持一定效率的同時(shí),維持對(duì)環(huán)境變化的適應(yīng)能力。


Fig. 4

理論與應(yīng)用意義

這項(xiàng)工作并未停留在模擬層面,它為理解人類社會(huì)的錯(cuò)誤信念固著(Belief Persistence)提供了計(jì)算層面的解釋:為什么陰謀論或錯(cuò)誤信息難以根除?可能是因?yàn)槿祟惔竽X更傾向于采用VS策略,將社會(huì)認(rèn)同直接轉(zhuǎn)化為內(nèi)在價(jià)值。

此外,該研究對(duì)人機(jī)混合智能系統(tǒng)的設(shè)計(jì)具有重要啟示:在一個(gè)由人類(傾向于VS)組成的系統(tǒng)中,為了防止集體走向僵化,引入少量采用DB算法(只跟風(fēng)行為但不改變價(jià)值觀)的AI代理或“特立獨(dú)行者”,可能是維持系統(tǒng)韌性、打破信息繭房的關(guān)鍵。


Abstract

Balancing efficiency and flexibility in collective decision-making is increasingly critical in modern societies characterized by rapid sociocultural and technological change. Recent research in cognitive neuroscience has proposed two contrasting computational algorithms for social learning: value shaping (VS) and decision biasing (DB). VS posits that others’ choices serve as “pseudo-rewards” that directly shape an observer’s valuations, leading them to prefer popular options even in the absence of outcome feedback. In contrast, DB confines the influence of social information to behavior—observers may imitate popular actions, but they update their valuations solely through personal experience. Although both algorithms facilitate individual adaptation under uncertainty, their interactive dynamics and group-level consequences remain largely unexplored. To address this gap, we developed computational models of VS and DB within a reinforcement learning framework and conducted agent-based simulations to examine collective performance in uncertain and dynamically changing environments. The results reveal a trade-off: VS enables rapid convergence and high efficiency in stable contexts, whereas DB promotes greater adaptability under environmental volatility. These differences are amplified in larger groups, particularly under strong majority influence. Importantly, evolutionary analyses indicate that both learning types can coexist stably, allowing their complementary strengths to enhance group performance. Together, our findings provide a computational and evolutionary account of how social learning can both enhance and impair collective intelligence—and suggest design principles for fostering resilient collective decision systems in human and AI societies facing rapid change.


請(qǐng)打分

這篇?jiǎng)倓偟巧?strong>PNAS的研究,是否實(shí)至名歸?我們邀請(qǐng)您作為“云審稿人”,一同品鑒。精讀全文后,歡迎在匿名投票中打分,并在評(píng)論區(qū)分享您的深度見(jiàn)解。

前沿交流|歡迎加入認(rèn)知神經(jīng)科學(xué)前沿交流群!


核心圖表、方法細(xì)節(jié)、統(tǒng)計(jì)結(jié)果與討論見(jiàn)原文及其拓展數(shù)據(jù)。

分享人:飯哥

審核:PsyBrain 腦心前沿編輯部

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
拜登之子稱烏克蘭腐敗“令人震驚”,民調(diào)顯示近四成民眾認(rèn)為澤連斯基是“腐敗參與者”

拜登之子稱烏克蘭腐敗“令人震驚”,民調(diào)顯示近四成民眾認(rèn)為澤連斯基是“腐敗參與者”

紅星新聞
2025-12-26 16:47:20
涉嫌嚴(yán)重違紀(jì)違法,郭學(xué)益被查

涉嫌嚴(yán)重違紀(jì)違法,郭學(xué)益被查

都市快報(bào)橙柿互動(dòng)
2025-12-27 10:59:33
尿是黃色!金子也是黃色!德國(guó)男子為了提煉黃金,煮了五千升尿液

尿是黃色!金子也是黃色!德國(guó)男子為了提煉黃金,煮了五千升尿液

扶蘇聊歷史
2025-12-25 16:18:51
劉德華、郭富城告訴你:西服不成套穿,褲子短一截,到老也不油膩

劉德華、郭富城告訴你:西服不成套穿,褲子短一截,到老也不油膩

飄逸語(yǔ)人
2025-12-25 22:16:54
女性的私處哪種形態(tài)更好?女性陰部的形狀類型有哪些?不妨來(lái)了解

女性的私處哪種形態(tài)更好?女性陰部的形狀類型有哪些?不妨來(lái)了解

醫(yī)者榮耀
2025-12-25 12:05:06
闊腿褲已經(jīng)下崗了,今年流行的是“瑜伽褲”,百搭顯瘦還時(shí)髦

闊腿褲已經(jīng)下崗了,今年流行的是“瑜伽褲”,百搭顯瘦還時(shí)髦

朝史暮夕
2025-12-25 10:38:23
42歲蒼井空,官宣復(fù)出!

42歲蒼井空,官宣復(fù)出!

東京在線
2025-12-26 22:20:16
你聽(tīng)過(guò)最勁爆的瓜是啥?網(wǎng)友:被大八歲的補(bǔ)習(xí)班老師表白了

你聽(tīng)過(guò)最勁爆的瓜是啥?網(wǎng)友:被大八歲的補(bǔ)習(xí)班老師表白了

帶你感受人間冷暖
2025-11-26 00:10:06
意外!上港簽下新鵬城28歲前鋒,上賽季23場(chǎng)2球1助攻,球迷不理解

意外!上港簽下新鵬城28歲前鋒,上賽季23場(chǎng)2球1助攻,球迷不理解

羅掌柜體育
2025-12-27 10:19:57
47歲蘭帕德快禿成光頭!率隊(duì)8分領(lǐng)跑英冠:破44年魔咒 主場(chǎng)8連斬

47歲蘭帕德快禿成光頭!率隊(duì)8分領(lǐng)跑英冠:破44年魔咒 主場(chǎng)8連斬

風(fēng)過(guò)鄉(xiāng)
2025-12-27 10:12:42
霍啟剛郭晶晶帶娃買(mǎi)蜜雪冰城!奶茶先給爺爺喝,這家風(fēng)才是真豪門(mén)

霍啟剛郭晶晶帶娃買(mǎi)蜜雪冰城!奶茶先給爺爺喝,這家風(fēng)才是真豪門(mén)

大眼瞄世界
2025-12-26 23:54:38
火箭隊(duì)又傷1人!雙前鋒剛復(fù)出,22+9+7內(nèi)線再傷,對(duì)陣騎士或缺陣

火箭隊(duì)又傷1人!雙前鋒剛復(fù)出,22+9+7內(nèi)線再傷,對(duì)陣騎士或缺陣

熊哥愛(ài)籃球
2025-12-27 11:27:35
臺(tái)北市長(zhǎng)發(fā)出警告:停止對(duì)大陸的挑釁!“中國(guó)臺(tái)灣省”才是正途!

臺(tái)北市長(zhǎng)發(fā)出警告:停止對(duì)大陸的挑釁!“中國(guó)臺(tái)灣省”才是正途!

小lu侃侃而談
2025-12-26 19:22:55
甜甜圈被人保釋出獄了,開(kāi)始瘋狂污蔑美國(guó)高層

甜甜圈被人保釋出獄了,開(kāi)始瘋狂污蔑美國(guó)高層

遠(yuǎn)方青木
2025-12-25 23:47:28
慘敗之后!全隊(duì)心態(tài)崩了!湖人最快速度交易

慘敗之后!全隊(duì)心態(tài)崩了!湖人最快速度交易

籃球教學(xué)論壇
2025-12-26 19:34:39
1-0,47歲蘭帕德神了:率領(lǐng)掀翻斯旺西,4輪不敗,狂攬51分排名第一

1-0,47歲蘭帕德神了:率領(lǐng)掀翻斯旺西,4輪不敗,狂攬51分排名第一

側(cè)身凌空斬
2025-12-27 00:51:09
萬(wàn)科資不抵債

萬(wàn)科資不抵債

地產(chǎn)微資訊
2025-12-27 09:07:18
《老舅》收官,演技大洗牌:郭京飛9.6分倒數(shù),第一當(dāng)之無(wú)愧

《老舅》收官,演技大洗牌:郭京飛9.6分倒數(shù),第一當(dāng)之無(wú)愧

白面書(shū)誏
2025-12-26 16:04:00
法國(guó)、德國(guó)、英國(guó)、加拿大、丹麥、西班牙、意大利、荷蘭、挪威等14國(guó)發(fā)表聯(lián)合聲明

法國(guó)、德國(guó)、英國(guó)、加拿大、丹麥、西班牙、意大利、荷蘭、挪威等14國(guó)發(fā)表聯(lián)合聲明

每日經(jīng)濟(jì)新聞
2025-12-25 07:29:06
清朝滅亡后,格格們都嫁給了誰(shuí)?好幾位大明星,其實(shí)都是皇室后裔

清朝滅亡后,格格們都嫁給了誰(shuí)?好幾位大明星,其實(shí)都是皇室后裔

小豫講故事
2025-12-27 06:00:06
2025-12-27 11:56:49
PsyBrain腦心前沿
PsyBrain腦心前沿
追蹤腦科學(xué)新動(dòng)態(tài),聚焦認(rèn)知與神經(jīng)新研究
79文章數(shù) 6關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

賈國(guó)龍首次回應(yīng)西貝風(fēng)波 稱自己連續(xù)40天靠安眠藥入睡

頭條要聞

賈國(guó)龍首次回應(yīng)西貝風(fēng)波 稱自己連續(xù)40天靠安眠藥入睡

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂(lè)要聞

劉宇寧:我的價(jià)值不需要靠番位來(lái)證明

財(cái)經(jīng)要聞

注意,開(kāi)始拉物價(jià)了!

汽車要聞

好音響比大屏更重要?車企開(kāi)始“聽(tīng)”用戶的

態(tài)度原創(chuàng)

家居
房產(chǎn)
旅游
手機(jī)
游戲

家居要聞

格調(diào)時(shí)尚 智慧品質(zhì)居所

房產(chǎn)要聞

炸裂,三亞360億超級(jí)清單發(fā)布,又一批重大配套要來(lái)了!

旅游要聞

山西省啟動(dòng)達(dá)人共創(chuàng)計(jì)劃助力文旅發(fā)展

手機(jī)要聞

iPhone Fold再次被確認(rèn):依舊有折痕,吸引力或銳減!

魔獸世界:60級(jí)黑龍巢穴強(qiáng)到離譜的極品,你當(dāng)年最愛(ài)哪一款?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版