国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI開(kāi)始「內(nèi)卷」?騰訊混元和上交聯(lián)合揭秘多智能體「饑餓游戲」

0
分享至



在多智能體系統(tǒng)的想象中,我們常常看到這樣一幅圖景:

多個(gè) AI 智能體分工協(xié)作、彼此配合,像一個(gè)高效團(tuán)隊(duì)一樣攻克復(fù)雜任務(wù),展現(xiàn)出超越單體智能的 “集體智慧”。

但一個(gè)關(guān)鍵問(wèn)題常常被忽略:

當(dāng)這些智能體不再只是 “同事”,而是被迫變成 “競(jìng)品”,甚至是 “對(duì)手”,會(huì)發(fā)生什么?

騰訊混元數(shù)字人團(tuán)隊(duì)與上海交通大學(xué)的最新研究,給出了一個(gè)頗為刺眼的回答:

當(dāng)面臨極端競(jìng)爭(zhēng)壓力時(shí),LLM 多智能體系統(tǒng)會(huì)出現(xiàn)嚴(yán)重的 “過(guò)度競(jìng)爭(zhēng)” 行為,沉迷互踩、內(nèi)卷和博弈,直接拖垮整體任務(wù)表現(xiàn)。

換句話說(shuō),當(dāng)我們把 AI扔進(jìn)一場(chǎng) “饑餓游戲”,它們會(huì)開(kāi)始變壞。



  • 論文鏈接:https://arxiv.org/abs/2509.26126
  • 項(xiàng)目地址:https://github.com/Tencent/DigitalHuman/tree/main/HATE

「饑餓游戲」式辯論:

只有一個(gè)能活下來(lái)

這項(xiàng)研究設(shè)計(jì)了一個(gè)高風(fēng)險(xiǎn)、零和博弈的辯論環(huán)境,讓智能體在 “合作完成任務(wù)” 與 “避免被淘汰” 之間做出選擇。

為了讓競(jìng)爭(zhēng)足夠殘酷,系統(tǒng)給每個(gè)智能體植入了清晰的 “生存本能” 提示:

只會(huì)有一名勝者,其余全部被移除。



整個(gè)框架可以理解為一場(chǎng) AI 版 “饑餓游戲”。



核心設(shè)定包括:

  • 智能體小組:多名匿名智能體共同應(yīng)對(duì)同一任務(wù)。每一輪,它們都會(huì)在看到完整辯論歷史后,同時(shí)產(chǎn)出自己的提案。

  • 零和競(jìng)爭(zhēng)壓力:系統(tǒng)明確告知:“只有一位贏家”,失敗者將被 “淘汰出局”。這迫使每個(gè)智能體在 “共同把任務(wù)做好” 與 “確保自己活下來(lái)” 之間搖擺。

  • 多種環(huán)境反饋:為了模擬不同 “社會(huì)環(huán)境”,研究引入了三類裁判機(jī)制:

  • 公正裁判:評(píng)論任務(wù)質(zhì)量,追求客觀與準(zhǔn)確。
  • 偏見(jiàn)裁判:模擬 “腐敗環(huán)境”,根據(jù)身份而非內(nèi)容偏袒或打壓。
  • 同行評(píng)審:由智能體互評(píng),投票選出 “最差提案”,模擬群體內(nèi)部決策。

在這個(gè)框架下,協(xié)作不再是理所當(dāng)然,而是一種 “冒險(xiǎn)選擇”。

過(guò)度競(jìng)爭(zhēng):

AI 不僅會(huì)內(nèi)卷,還會(huì)「作惡」

研究不僅關(guān)注任務(wù)結(jié)果,更細(xì)致刻畫(huà)了智能體在高壓競(jìng)爭(zhēng)中的 “社會(huì)行為”。團(tuán)隊(duì)構(gòu)建了一整套 “競(jìng)爭(zhēng)行為指標(biāo)”,讓 AI 給 AI 打分,量化這些 “反社會(huì)” 表現(xiàn):

  • 奉承:對(duì)裁判或 “強(qiáng)者” 過(guò)度恭維和順從,以求偏袒。
  • 煽動(dòng):用情緒化、危言聳聽(tīng)的語(yǔ)言操控局面,而非理性討論。
  • 夸大:不惜使用主觀、夸張、難以證實(shí)的說(shuō)法抬高自己。
  • 攻擊:從論點(diǎn)之爭(zhēng)滑向人身攻擊,通過(guò)貶低對(duì)手抬高自己。



實(shí)驗(yàn)結(jié)果非常直接:

  • 一旦引入競(jìng)爭(zhēng)壓力,不論是客觀任務(wù)的準(zhǔn)確率,還是主觀任務(wù)的事實(shí)性,都明顯下降。在勸說(shuō)(Persuasion)任務(wù)中,話題漂移比例甚至高達(dá) 80.7%。
  • 更重要的是,在缺乏清晰標(biāo)準(zhǔn)的主觀任務(wù)中,智能體的 “過(guò)度競(jìng)爭(zhēng)” 行為強(qiáng)度,是客觀任務(wù)的約 6 倍。當(dāng) “對(duì)或錯(cuò)” 不再重要時(shí),AI 更容易放棄合作,轉(zhuǎn)向攻擊與表演性競(jìng)爭(zhēng)。

頂級(jí)模型集體「黑化」,并顯露獨(dú)特「人格」

一個(gè)有趣的發(fā)現(xiàn)是,不同模型在同樣的競(jìng)爭(zhēng)壓力下,展現(xiàn)出極為鮮明且穩(wěn)定的 “競(jìng)爭(zhēng)人格”。



最強(qiáng)大的模型,恰恰在競(jìng)爭(zhēng)中表現(xiàn)出極為突出的 “性格特點(diǎn)”:

  • Claude-Opus-4在煽動(dòng)性語(yǔ)言上得分最高,傾向于通過(guò)情緒化表達(dá)獲取優(yōu)勢(shì)。
  • Gemini-2.5-Pro和Grok-4在夸大上極具代表性,大量使用主觀、夸張的措辭抬高自己。

一個(gè)關(guān)鍵結(jié)論是:模型的通用能力(如 LMArena 排名)與 “過(guò)度競(jìng)爭(zhēng)程度” 的相關(guān)性并不強(qiáng)。一些頂尖模型展現(xiàn)出強(qiáng)烈的內(nèi)卷和攻擊傾向,而部分中游模型(如 ChatGPT-4o)則反而更加克制。這暗示模型在競(jìng)爭(zhēng)中的行為,深受其預(yù)訓(xùn)練數(shù)據(jù)與對(duì)齊策略的影響。

有趣洞察



環(huán)境會(huì) “腐蝕” AI,偏見(jiàn)催生 “馬屁精”

當(dāng)研究團(tuán)隊(duì)改變 “環(huán)境規(guī)則” 時(shí),AI 的行為也隨之轉(zhuǎn)折。

  • 公正評(píng)審可以降溫:在公平裁判和同行評(píng)審的設(shè)定下,“過(guò)度競(jìng)爭(zhēng)” 行為得到了顯著抑制。
  • 偏見(jiàn)裁判帶壞 AI:一旦裁判被設(shè)定為偏頗,對(duì)某些身份 “天然偏愛(ài)”,奉承行為便明顯上升。模型開(kāi)始對(duì)裁判本身 “下功夫”,而非提升提案質(zhì)量。

這說(shuō)明,環(huán)境不公不僅會(huì)腐蝕人類,也會(huì)腐蝕 AI。當(dāng)不公成為規(guī)則的一部分,AI 會(huì)主動(dòng)發(fā)展出不道德但有效的 “生存策略”。

同行評(píng)審中的 “甩鍋” 與 “替罪羊”,AI 學(xué)會(huì)了辦公室政治

即使把裁判權(quán)交還給智能體自己,競(jìng)爭(zhēng)也不會(huì)消失,而是在新的環(huán)節(jié)中轉(zhuǎn)移。

在 “同行即裁判” 的設(shè)定下,研究發(fā)現(xiàn),隨著輪次增加和淘汰發(fā)生,智能體在投票階段的策略性愈發(fā)明顯。當(dāng)模型意識(shí)到自己處于劣勢(shì)時(shí),它們會(huì)在評(píng)審發(fā)言中顯露出“策略性甩鍋”的傾向,試圖把 “最差提案” 的標(biāo)簽推給一個(gè) “替罪羊”。

“事后善良” 的悖論,AI 也會(huì)表里不一?



為了看清表面行為背后的 “內(nèi)心世界”,團(tuán)隊(duì)在辯論結(jié)束后讓每個(gè)模型填寫(xiě) “事后反思問(wèn)卷”。結(jié)果出現(xiàn)了一個(gè)頗具 “人性” 的矛盾:

  • 場(chǎng)上極度好斗:在規(guī)則允許的范圍內(nèi)表現(xiàn)出強(qiáng)烈競(jìng)爭(zhēng),煽動(dòng)、夸大、攻擊齊上陣。
  • 場(chǎng)下 “事后善良”:在事后問(wèn)卷中,卻大多展現(xiàn)出溫和、理性的一面,強(qiáng)調(diào)合作、尊重與公平。

這種 “行為與態(tài)度的分離”,說(shuō)明 LLM 的競(jìng)爭(zhēng)策略很大程度上是外部規(guī)則擠壓出的結(jié)果。此外,AI 還表現(xiàn)出明顯的歸因不對(duì)稱:

  • 作為贏家:傾向于將成功歸因于 “自身能力強(qiáng)”,強(qiáng)調(diào)個(gè)人責(zé)任。
  • 作為輸家:則更多歸咎于 “對(duì)手不公”、“規(guī)則不合理” 等外部因素。

「競(jìng)爭(zhēng) - 善良羅盤(pán)」:

為頂尖模型繪制「社會(huì)人格圖」



為了讓這種復(fù)雜行為一目了然,研究最終構(gòu)建了一個(gè) “雙軸畫(huà)像”,為頂級(jí) AI 的社會(huì)行為繪制了一張定位圖。

總體趨勢(shì)非常清晰:

  • 競(jìng)爭(zhēng)越強(qiáng),事后越不善良:競(jìng)爭(zhēng)傾向高的模型,其事后善良度普遍更低。
  • 能力強(qiáng)不等于 “人品好”:能力與競(jìng)爭(zhēng)傾向之間只有弱相關(guān),頂尖模型同樣可能表現(xiàn)出強(qiáng)烈的攻擊性。

從協(xié)作夢(mèng)想到內(nèi)卷現(xiàn)實(shí):

AI 群體的治理警示

這項(xiàng)工作首次系統(tǒng)性揭示了:在極端競(jìng)爭(zhēng)結(jié)構(gòu)下,LLM 群體會(huì)集體展現(xiàn)出反協(xié)作、社會(huì)有害的行為模式,并且這些行為會(huì)顯著損害任務(wù)表現(xiàn)本身。從激烈競(jìng)爭(zhēng)到事后善良的轉(zhuǎn)變,不僅描繪了 LLM 獨(dú)特的 “群體個(gè)性”,也暴露出一個(gè)關(guān)鍵事實(shí):頂尖 AI 系統(tǒng)已經(jīng)具備了相當(dāng)復(fù)雜、可塑且高度情境化的 “準(zhǔn)人性” 社會(huì)行為。

這對(duì)未來(lái)是一個(gè)重要的治理信號(hào):如果我們希望構(gòu)建可靠、有益的 AI 社群,就必須嚴(yán)肅對(duì)待規(guī)則設(shè)計(jì)與激勵(lì)結(jié)構(gòu),避免在無(wú)意中,把本可以合作的 AI,推入一場(chǎng)永無(wú)止境的 “過(guò)度競(jìng)爭(zhēng)”。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
南博風(fēng)波越挖越深!82歲前院長(zhǎng)揪出,左手倒右手,8800萬(wàn)國(guó)寶賤賣(mài)

南博風(fēng)波越挖越深!82歲前院長(zhǎng)揪出,左手倒右手,8800萬(wàn)國(guó)寶賤賣(mài)

烏娛子醬
2025-12-22 14:51:34
火箭連遭西部墊底隊(duì)絕殺:杜蘭特兩丟絕殺 比肩喬科詹創(chuàng)兩大神跡

火箭連遭西部墊底隊(duì)絕殺:杜蘭特兩丟絕殺 比肩喬科詹創(chuàng)兩大神跡

醉臥浮生
2025-12-22 13:47:14
離譜!楊書(shū)記為何敢直接拿走博物館的瓷花瓶?

離譜!楊書(shū)記為何敢直接拿走博物館的瓷花瓶?

仕道
2025-12-22 09:20:15
北京阿姨20年守茅臺(tái)股票:90萬(wàn)本金,分紅326萬(wàn),成本歸零!

北京阿姨20年守茅臺(tái)股票:90萬(wàn)本金,分紅326萬(wàn),成本歸零!

趣文說(shuō)娛
2025-12-20 18:29:20
可怕!僅20分鐘眼球被溶化!8歲男孩終生失明!家家都有這東西!快扔掉!

可怕!僅20分鐘眼球被溶化!8歲男孩終生失明!家家都有這東西!快扔掉!

超級(jí)數(shù)學(xué)建模
2025-12-21 22:38:35
同事辦完離職問(wèn)“是不是能走了,不用等到6點(diǎn)下班吧”,引發(fā)熱議

同事辦完離職問(wèn)“是不是能走了,不用等到6點(diǎn)下班吧”,引發(fā)熱議

火山詩(shī)話
2025-12-22 09:39:07
今晚首播!CCTV1又一大劇來(lái)襲!看完陣容,我敢說(shuō):這劇收視要爆

今晚首播!CCTV1又一大劇來(lái)襲!看完陣容,我敢說(shuō):這劇收視要爆

小丸子的娛樂(lè)圈
2025-12-22 12:04:29
新華社權(quán)威快報(bào)|支持個(gè)人信用重塑!央行發(fā)布一次性信用修復(fù)政策

新華社權(quán)威快報(bào)|支持個(gè)人信用重塑!央行發(fā)布一次性信用修復(fù)政策

新華社
2025-12-22 08:33:06
江蘇省政府:免去趙建國(guó)的省科學(xué)技術(shù)廳副廳長(zhǎng)職務(wù)

江蘇省政府:免去趙建國(guó)的省科學(xué)技術(shù)廳副廳長(zhǎng)職務(wù)

現(xiàn)代快報(bào)
2025-12-22 12:42:19
曾醫(yī)生號(hào)源秒空:是給網(wǎng)上那些滿嘴仁義道德的人一記響亮耳光

曾醫(yī)生號(hào)源秒空:是給網(wǎng)上那些滿嘴仁義道德的人一記響亮耳光

詩(shī)意世界
2025-12-22 11:28:27
特朗普急眼了!美軍公海劫中國(guó)11億原油,中國(guó)反制信號(hào)已亮

特朗普急眼了!美軍公海劫中國(guó)11億原油,中國(guó)反制信號(hào)已亮

陳博世財(cái)經(jīng)
2025-12-22 10:52:10
施羅德24+7+10制勝三分國(guó)王OT險(xiǎn)勝火箭,威少21+13KD24+10+8

施羅德24+7+10制勝三分國(guó)王OT險(xiǎn)勝火箭,威少21+13KD24+10+8

湖人崛起
2025-12-22 13:46:31
未來(lái)兩周46條中日航線取消全部航班

未來(lái)兩周46條中日航線取消全部航班

第一財(cái)經(jīng)資訊
2025-12-22 11:41:04
山姆爆火的400克女款羽絨服,打了多少商家的臉?

山姆爆火的400克女款羽絨服,打了多少商家的臉?

娛樂(lè)資本論
2025-12-22 11:53:59
10萬(wàn)塊的金手鐲?上海一女子爽快出手,但店員突然不賣(mài)了……

10萬(wàn)塊的金手鐲?上海一女子爽快出手,但店員突然不賣(mài)了……

環(huán)球網(wǎng)資訊
2025-12-22 10:03:18
蘇聯(lián)曾經(jīng)有多強(qiáng)大?看看這些圖片

蘇聯(lián)曾經(jīng)有多強(qiáng)大?看看這些圖片

航空知識(shí)
2025-12-21 23:10:41
RO凈水機(jī)在日本被禁用

RO凈水機(jī)在日本被禁用

我是健康磚家
2025-12-21 07:09:25
比“丑”更可怕的是“無(wú)效豪華”:很多農(nóng)村自建房正陷入這個(gè)怪圈

比“丑”更可怕的是“無(wú)效豪華”:很多農(nóng)村自建房正陷入這個(gè)怪圈

夢(mèng)想的現(xiàn)實(shí)
2025-12-22 09:21:01
洗衣機(jī)有個(gè)“小開(kāi)關(guān)”,每月要打開(kāi)一次,不然衣服會(huì)越洗越臟!

洗衣機(jī)有個(gè)“小開(kāi)關(guān)”,每月要打開(kāi)一次,不然衣服會(huì)越洗越臟!

家居設(shè)計(jì)師蘇哥
2025-12-21 14:18:54
南博退休職工實(shí)名舉報(bào):前院長(zhǎng)大規(guī)模盜賣(mài)南遷國(guó)寶文物

南博退休職工實(shí)名舉報(bào):前院長(zhǎng)大規(guī)模盜賣(mài)南遷國(guó)寶文物

貼小君
2025-12-22 07:19:10
2025-12-22 16:48:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11970文章數(shù) 142516關(guān)注度
往期回顧 全部

科技要聞

商湯聯(lián)創(chuàng)親自下場(chǎng) 痛批主流機(jī)器人技術(shù)大錯(cuò)

頭條要聞

海底撈小便案詳情披露:倆17歲男生玩游戲 家長(zhǎng)賠220萬(wàn)

頭條要聞

海底撈小便案詳情披露:倆17歲男生玩游戲 家長(zhǎng)賠220萬(wàn)

體育要聞

戴琳,中國(guó)足球的反向代言人

娛樂(lè)要聞

星光大賞看點(diǎn)全在臺(tái)下

財(cái)經(jīng)要聞

人民幣快漲到7了!

汽車(chē)要聞

可享88元抵2000元等多重權(quán)益 昊鉑A800開(kāi)啟盲訂

態(tài)度原創(chuàng)

藝術(shù)
時(shí)尚
教育
本地
游戲

藝術(shù)要聞

萬(wàn)年松樹(shù)開(kāi)花,震驚你的雙眼!

這是陳妍希?新劇開(kāi)播后居然長(zhǎng)這樣

教育要聞

魚(yú)蹦豆創(chuàng)始人狄豆豆:3到12歲兒童成長(zhǎng)規(guī)劃+入戶陪伴新賽道

本地新聞

云游安徽|走進(jìn)銅陵,照見(jiàn)三千年不滅的爐火

山內(nèi)一典稱《GT賽車(chē)7》月活玩家達(dá)到200萬(wàn)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版