網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

利茲大學(xué)與本-古里安大學(xué)：AI對(duì)話系統(tǒng)實(shí)現(xiàn)穩(wěn)定人格保持能力提升

2026-04-21 21:46:30　來(lái)源: 科技行者

天津舉報(bào)

分享至

這項(xiàng)由英國(guó)利茲大學(xué)、中國(guó)西南交通大學(xué)與以色列本-古里安大學(xué)內(nèi)蓋夫分校聯(lián)合開(kāi)展的研究，發(fā)表于2026年ACL（計(jì)算語(yǔ)言學(xué)協(xié)會(huì)年會(huì)）的"Findings"專題，論文預(yù)印本編號(hào)為arXiv:2604.09212，感興趣的讀者可通過(guò)該編號(hào)查閱完整原文。

**一、故事的開(kāi)端：當(dāng)AI扮演別人，卻忘了自己是誰(shuí)**

假設(shè)你雇了一位演員，讓他全程扮演一個(gè)正在經(jīng)歷中年危機(jī)的職場(chǎng)人去參加一場(chǎng)心理咨詢。起初他表現(xiàn)得相當(dāng)?shù)轿弧f(shuō)著工作壓力有多大、家庭關(guān)系有多緊繃。然而談著談著，他開(kāi)始給咨詢師提建議，語(yǔ)氣也越來(lái)越像那位咨詢師本人，最后甚至說(shuō)出"你遇到這種困難，一定要好好照顧自己"這樣本該由咨詢師說(shuō)的話。你發(fā)現(xiàn)：這位演員"出戲"了。

這個(gè)場(chǎng)景在現(xiàn)實(shí)生活的AI系統(tǒng)里，每天都在悄悄發(fā)生。

今天，越來(lái)越多的大語(yǔ)言模型（通俗地說(shuō)，就是能對(duì)話的AI，比如ChatGPT這類系統(tǒng)）被部署在需要長(zhǎng)時(shí)間、多輪次對(duì)話的場(chǎng)合：輔導(dǎo)學(xué)生學(xué)習(xí)的教學(xué)助手、處理用戶投訴的客服機(jī)器人、陪伴用戶傾訴的心理支持系統(tǒng)。在這些場(chǎng)合里，AI不僅要給出有用的回答，還要始終如一地扮演好一個(gè)固定角色——可能是"一位耐心的輔導(dǎo)老師"，也可能是"一個(gè)正在尋求幫助的普通用戶"。

研究團(tuán)隊(duì)在工作中注意到了一個(gè)棘手的現(xiàn)象：當(dāng)兩個(gè)AI相互對(duì)話，隨著聊天輪次越來(lái)越多，其中一方往往會(huì)逐漸"忘掉自己是誰(shuí)"。它可能開(kāi)始用對(duì)方的語(yǔ)氣說(shuō)話、采用對(duì)方的立場(chǎng)，最終在風(fēng)格和行為上越來(lái)越像對(duì)方。研究人員給這個(gè)現(xiàn)象起了一個(gè)形象的名字——"回聲"（Echoing）：一個(gè)AI的聲音，開(kāi)始在另一個(gè)AI的嘴里反響。

這個(gè)問(wèn)題看起來(lái)像是技術(shù)小毛病，實(shí)則會(huì)造成嚴(yán)重后果。當(dāng)研究者們需要用AI批量生成訓(xùn)練對(duì)話數(shù)據(jù)時(shí)，如果AI"出戲"，生成的對(duì)話就不再符合預(yù)設(shè)的角色要求，這批"臟數(shù)據(jù)"混入訓(xùn)練集，會(huì)讓被訓(xùn)練的模型學(xué)到錯(cuò)誤的行為模式，危害是長(zhǎng)期而深遠(yuǎn)的。

**二、這個(gè)問(wèn)題有多普遍、有多嚴(yán)重**

在研究者著手設(shè)計(jì)解決方案之前，首先需要摸清楚問(wèn)題的底細(xì)。他們總結(jié)了現(xiàn)有AI對(duì)話系統(tǒng)中出現(xiàn)的三種典型"身份崩潰"模式。

第一種叫做"指令漂移"：AI被告知要完成某個(gè)任務(wù)，但隨著對(duì)話進(jìn)行，它越來(lái)越偏離最初的任務(wù)描述，就像一個(gè)廚師邊做菜邊忘了菜譜上寫的是什么。第二種叫做"人格偏移"：AI被賦予了某個(gè)性格設(shè)定，但對(duì)話越長(zhǎng)，這個(gè)性格就越模糊，最終溶化成一個(gè)毫無(wú)特色的通用助手。第三種，也是這篇研究特別關(guān)注的，就是前面說(shuō)的"回聲"現(xiàn)象——一個(gè)AI逐漸開(kāi)始鏡像復(fù)制對(duì)方的語(yǔ)言風(fēng)格、立場(chǎng)和行為模式，失去了自己獨(dú)特的身份。

這三種問(wèn)題有一個(gè)共同的誘因：隨著對(duì)話越來(lái)越長(zhǎng)，AI的"記憶"負(fù)擔(dān)越來(lái)越重。它需要在記住自己角色設(shè)定的同時(shí)，處理越來(lái)越長(zhǎng)的對(duì)話歷史。當(dāng)這兩件事發(fā)生沖突時(shí)，AI往往會(huì)不自覺(jué)地放棄更難維持的角色設(shè)定，而向更"順手"的對(duì)話模式靠攏——而那個(gè)更順手的模式，往往就是模仿對(duì)方。

這個(gè)問(wèn)題在已有的AI對(duì)話框架里，幾乎沒(méi)有被認(rèn)真對(duì)待過(guò)。大多數(shù)框架只是簡(jiǎn)單地把對(duì)話歷史拼接在一起，塞給AI處理，沒(méi)有任何專門的機(jī)制來(lái)幫助AI"記清楚自己是誰(shuí)"。

**三、SPASM框架：像搭積木一樣組建一個(gè)"穩(wěn)定人格"的對(duì)話系統(tǒng)**

研究團(tuán)隊(duì)提出了一套名為SPASM的系統(tǒng)——全稱是"穩(wěn)定人格驅(qū)動(dòng)的多輪對(duì)話生成代理模擬框架"（Stable Persona-driven Agent Simulation for Multi-turn dialogue generation）。光聽(tīng)名字可能有些拗口，但如果把它比作一條精心設(shè)計(jì)的流水線，就容易理解多了。

這條流水線分三個(gè)工作站。第一個(gè)工作站負(fù)責(zé)"打造角色"，第二個(gè)工作站負(fù)責(zé)"讓兩個(gè)AI按照各自角色展開(kāi)對(duì)話"，第三個(gè)工作站負(fù)責(zé)"判斷這場(chǎng)對(duì)話什么時(shí)候應(yīng)該自然地結(jié)束"。

在第一個(gè)工作站，系統(tǒng)并不是隨機(jī)拍腦袋生成角色，而是按照一個(gè)精心設(shè)計(jì)的"角色藍(lán)圖"來(lái)工作。這份藍(lán)圖覆蓋了四大類角色屬性。第一類是基本人口信息，包括年齡（在18至65歲之間隨機(jī)抽?。⒙殬I(yè)（從涵蓋科技、醫(yī)療、藝術(shù)、教育等領(lǐng)域的76種職業(yè)中選?。⑺诔鞘校◤?0個(gè)英語(yǔ)城市中選取，覆蓋北美、歐洲、亞洲、中東、大洋洲和非洲）。第二類是當(dāng)前面臨的問(wèn)題情境，從44種場(chǎng)景中選取，涵蓋心理情緒支持、法律財(cái)務(wù)咨詢、人際關(guān)系等日常場(chǎng)景。第三類是情緒狀態(tài)，從12種情緒類別（比如焦慮、壓抑、平靜等）中選取，并配有輕度、中度、重度三級(jí)強(qiáng)度。第四類是行為風(fēng)格，包括表達(dá)方式的活躍程度、自我披露的深淺、禮貌風(fēng)格（正式/中性/隨意/直接）以及主張強(qiáng)度。

然而僅僅隨機(jī)組合這些屬性還不夠。直接組合可能產(chǎn)生荒謬的角色，比如"18歲在校學(xué)生正在咨詢退休養(yǎng)老金規(guī)劃"——這樣的角色顯然不合邏輯。為此，系統(tǒng)設(shè)置了一個(gè)專門的"角色審核員"（Persona Validator）：它會(huì)檢查每一個(gè)隨機(jī)組合是否合理，不合理的直接打回重來(lái)，直到產(chǎn)生一個(gè)符合現(xiàn)實(shí)邏輯的角色為止。

通過(guò)審核的角色藍(lán)圖會(huì)交給"角色工匠"（Persona Crafter），由它把那些干巴巴的屬性清單轉(zhuǎn)化成一段流暢自然的角色介紹文字，比如"你是一位30歲的會(huì)計(jì)師，住在新加坡，最近工作上的一些軟件問(wèn)題讓你頗為困擾，心情還算平穩(wěn)但略感焦慮，你希望在這次對(duì)話中找到解決方案……"值得注意的是，角色工匠可以在原始屬性清單之外進(jìn)行適當(dāng)?shù)募?xì)節(jié)補(bǔ)充——這種彈性設(shè)計(jì)讓角色更加自然豐滿。

第二個(gè)工作站是對(duì)話的核心：一個(gè)扮演"來(lái)訪者"（Client）的AI，和一個(gè)扮演"回應(yīng)者"（Responder）的AI，按照各自的角色定位展開(kāi)對(duì)話。來(lái)訪者完整接受了剛才那份角色設(shè)定，而回應(yīng)者則按照用戶預(yù)設(shè)的角色定位（比如傾聽(tīng)者、專家、顧問(wèn)等）來(lái)響應(yīng)。

第三個(gè)工作站是結(jié)束檢測(cè)器（Termination Detector）。它在對(duì)話進(jìn)行到一定輪次后被激活，持續(xù)分析最近幾輪對(duì)話的走向，判斷對(duì)話是否已經(jīng)自然地走到了終點(diǎn)。比如當(dāng)來(lái)訪者說(shuō)"謝謝你，這些對(duì)我很有幫助"，檢測(cè)器就會(huì)識(shí)別出這是一個(gè)合理的結(jié)束信號(hào)，阻止對(duì)話繼續(xù)無(wú)意義地延續(xù)下去。這個(gè)設(shè)計(jì)避免了兩種極端：對(duì)話過(guò)早結(jié)束（還沒(méi)解決問(wèn)題）或者無(wú)休止地循環(huán)（已經(jīng)說(shuō)完了還在車轱轆話來(lái)回說(shuō)）。

**四、真正的核心創(chuàng)新：給每個(gè)AI一雙"以自我為中心的眼睛"**

前面三個(gè)工作站都在服務(wù)于對(duì)話質(zhì)量，但研究中最有獨(dú)到之處的設(shè)計(jì)，藏在第二個(gè)工作站里——一個(gè)叫做"以自我為中心的情境投影"（Egocentric Context Projection，簡(jiǎn)稱ECP）的機(jī)制。

為了解釋清楚這個(gè)機(jī)制，先來(lái)描述一下問(wèn)題是怎么產(chǎn)生的。通常情況下，AI系統(tǒng)會(huì)把整段對(duì)話歷史像一條長(zhǎng)長(zhǎng)的流水賬一樣存儲(chǔ)下來(lái)，然后把這條流水賬直接喂給每一個(gè)需要發(fā)言的AI。這本來(lái)沒(méi)什么問(wèn)題，但在兩個(gè)AI相互對(duì)話的情境下，這種做法會(huì)產(chǎn)生一個(gè)隱蔽的混淆：對(duì)話歷史里的每一句話，雖然都標(biāo)注了"是誰(shuí)說(shuō)的"（比如"用戶說(shuō)"或"助手說(shuō)"），但當(dāng)一個(gè)AI讀到這份歷史時(shí)，它其實(shí)很難清楚地區(qū)分"哪些話是我自己說(shuō)的，哪些話是對(duì)方說(shuō)的"。

這就好像有人給你一份劇本，里面交替出現(xiàn)"甲說(shuō)了什么"和"乙說(shuō)了什么"，但你不知道自己是甲還是乙，還是其他角色。如果你不得不繼續(xù)這個(gè)劇本，你很可能會(huì)在不知不覺(jué)中說(shuō)出本不屬于你角色的話。

ECP的解決思路相當(dāng)優(yōu)雅：不改變對(duì)話歷史的內(nèi)容，只改變每個(gè)AI看到這份歷史的"視角"。具體來(lái)說(shuō)，對(duì)話歷史以一種"視角中立"的方式存儲(chǔ)起來(lái)，記錄的是"C說(shuō)了什么"和"R說(shuō)了什么"（C代表來(lái)訪者Client，R代表回應(yīng)者Responder）。當(dāng)需要讓來(lái)訪者AI發(fā)言時(shí)，系統(tǒng)會(huì)把歷史"翻譯"一遍：把"C說(shuō)的話"全部重新標(biāo)注為"SELF（我自己）說(shuō)的話"，把"R說(shuō)的話"全部重新標(biāo)注為"PARTNER（對(duì)方）說(shuō)的話"。反過(guò)來(lái)，當(dāng)回應(yīng)者AI需要發(fā)言時(shí)，歷史又會(huì)被"翻譯"成另一個(gè)版本：把"R說(shuō)的話"標(biāo)注為"SELF"，把"C說(shuō)的話"標(biāo)注為"PARTNER"。

這個(gè)轉(zhuǎn)換過(guò)程不改變?nèi)魏我粋€(gè)字的內(nèi)容，只是調(diào)整了"誰(shuí)說(shuō)了什么"的標(biāo)簽——但這個(gè)微小的調(diào)整卻產(chǎn)生了顯著的效果。每個(gè)AI在讀取對(duì)話歷史時(shí)，始終都在以一個(gè)清晰的自我視角來(lái)處理信息。它知道哪些話是"我"說(shuō)過(guò)的，哪些話是"對(duì)方"說(shuō)過(guò)的，于是就不會(huì)錯(cuò)誤地把對(duì)方的話風(fēng)格當(dāng)作自己下一句話應(yīng)該采用的模板。

這個(gè)機(jī)制在數(shù)學(xué)上也可以被嚴(yán)格定義，研究論文中對(duì)此有完整的形式化表述，但核心思想就是這么簡(jiǎn)單：給每個(gè)AI一雙只看到"自己視角"的眼睛，而不是讓它用一雙混沌的"上帝視角"來(lái)看整段對(duì)話。

**五、實(shí)驗(yàn)規(guī)模：4500個(gè)角色，45000場(chǎng)對(duì)話**

為了驗(yàn)證SPASM框架的效果，研究團(tuán)隊(duì)進(jìn)行了相當(dāng)大規(guī)模的實(shí)驗(yàn)。他們選用了三個(gè)主流AI系統(tǒng)作為"演員庫(kù)"：OpenAI的GPT-4o-mini、深度求索的DeepSeek-V3.2，以及阿里巴巴的Qwen-Plus。通過(guò)讓這三個(gè)系統(tǒng)兩兩配對(duì)（包括同一系統(tǒng)自己與自己配對(duì)），共產(chǎn)生了9種"來(lái)訪者+回應(yīng)者"組合。

對(duì)于每種組合，研究團(tuán)隊(duì)生成了500個(gè)獨(dú)立角色，每個(gè)角色參與10場(chǎng)對(duì)話，每場(chǎng)對(duì)話最多允許每方發(fā)言25次（即每場(chǎng)對(duì)話最多50句話）。全部算下來(lái)，這是4500個(gè)不同角色、45000場(chǎng)完整對(duì)話，數(shù)據(jù)量相當(dāng)可觀。

生成對(duì)話時(shí)，來(lái)訪者、回應(yīng)者和角色工匠都使用了0.7的"溫度值"（這個(gè)參數(shù)控制AI回答的隨機(jī)性，數(shù)值越高，回答越多樣化），而角色審核員和結(jié)束檢測(cè)器則使用了更低的0.3溫度值，目的是讓這些負(fù)責(zé)"判斷"的模塊給出更穩(wěn)定一致的結(jié)論。

**六、對(duì)話的"靈魂"是否真的被保留了——嵌入空間的故事**

驗(yàn)證一套框架是否奏效，光靠肉眼觀察幾段對(duì)話是不夠的，研究團(tuán)隊(duì)設(shè)計(jì)了一套系統(tǒng)性的量化評(píng)估方法。

第一個(gè)問(wèn)題是：同一個(gè)角色生成的不同對(duì)話，在語(yǔ)義上是否真的很相似？換句話說(shuō)，角色的"靈魂"有沒(méi)有真正滲透進(jìn)每一場(chǎng)對(duì)話里？

研究團(tuán)隊(duì)把每場(chǎng)對(duì)話中來(lái)訪者說(shuō)的所有話拼接成一段文字，然后用OpenAI提供的高質(zhì)量文本嵌入模型（text-embedding-3-large）把這段文字轉(zhuǎn)化成一個(gè)高維空間里的點(diǎn)。如果同一個(gè)角色的不同對(duì)話對(duì)應(yīng)的點(diǎn)聚集在一起，而不同角色的點(diǎn)則相互遠(yuǎn)離，就說(shuō)明角色設(shè)定確實(shí)深刻地影響了對(duì)話內(nèi)容。

結(jié)果相當(dāng)令人振奮。在來(lái)訪者和回應(yīng)者使用同一個(gè)AI系統(tǒng)的配置下，同角色的對(duì)話形成了非常緊密的聚集，不同角色之間涇渭分明。以GPT-4o-mini雙方都使用的配置為例，同一角色內(nèi)部的對(duì)話距離平均只有0.09（越小越好），而跨角色的平均距離高達(dá)0.50。從一項(xiàng)叫做"輪廓分?jǐn)?shù)"的指標(biāo)來(lái)看，這個(gè)配置拿到了0.60的高分（滿分是1.0）。

不過(guò)，當(dāng)來(lái)訪者和回應(yīng)者使用不同AI系統(tǒng)時(shí)，情況就復(fù)雜了一些。比如來(lái)訪者用GPT-4o-mini、回應(yīng)者用DeepSeek-V3.2的配置，角色聚集效果大幅下降，輪廓分?jǐn)?shù)只有0.10，同一角色內(nèi)部的對(duì)話距離也跳升到0.34。這說(shuō)明跨系統(tǒng)配對(duì)會(huì)引入額外的"噪聲"，削弱角色特征在對(duì)話中的體現(xiàn)。

更有趣的是，研究團(tuán)隊(duì)發(fā)現(xiàn)了一個(gè)顯著的不對(duì)稱性：固定回應(yīng)者、更換來(lái)訪者，聚集質(zhì)量變化不大；而固定來(lái)訪者、更換回應(yīng)者，聚集質(zhì)量則會(huì)發(fā)生巨大變化。以回應(yīng)者固定為GPT-4o-mini為例，無(wú)論來(lái)訪者是哪個(gè)系統(tǒng)，輪廓分?jǐn)?shù)都穩(wěn)定在0.60以上，Davies-Bouldin指數(shù)（越低越好）都在1.0附近。但把回應(yīng)者換成DeepSeek-V3.2，聚集質(zhì)量就急劇下降。這個(gè)發(fā)現(xiàn)揭示了一個(gè)深層規(guī)律：在來(lái)訪者+回應(yīng)者的對(duì)話體系中，回應(yīng)者這一方對(duì)于整體對(duì)話的結(jié)構(gòu)形狀和風(fēng)格走向有著更為主導(dǎo)的影響。來(lái)訪者更多影響的是同一角色內(nèi)部對(duì)話的差異性（即"個(gè)體差異"），而不是整體的角色分布格局。

**七、"角色信號(hào)"是否足夠強(qiáng)——檢索實(shí)驗(yàn)**

除了聚集分析，研究團(tuán)隊(duì)還做了一個(gè)更直觀的測(cè)試：給定一場(chǎng)對(duì)話，能不能在整個(gè)數(shù)據(jù)集里找到使用了同一個(gè)角色的其他對(duì)話？

這是一個(gè)信息檢索問(wèn)題。研究人員對(duì)每場(chǎng)對(duì)話提取嵌入向量，然后對(duì)每場(chǎng)對(duì)話，找出嵌入向量最相似的K場(chǎng)對(duì)話，看其中是否包含同一角色的對(duì)話（這個(gè)指標(biāo)叫做Acc@K，K越大，搜索范圍越廣，命中率自然也越高）。

他們還設(shè)計(jì)了一個(gè)"運(yùn)氣基準(zhǔn)"：把所有角色標(biāo)簽隨機(jī)打亂后再做同樣的檢索，來(lái)代表純粹靠運(yùn)氣能達(dá)到的準(zhǔn)確率。

結(jié)果非常清晰。在最嚴(yán)格的Top-1檢索（只看最相似的那一場(chǎng)）中，運(yùn)氣基準(zhǔn)的準(zhǔn)確率只有0.02（大約等于瞎猜），而大多數(shù)配置下的實(shí)際準(zhǔn)確率都在0.82到0.99之間。在Top-10檢索中，大多數(shù)配置都能達(dá)到0.98到1.00的準(zhǔn)確率，幾乎完美地找回了同一角色的對(duì)話。例外是GPT-4o-mini作為來(lái)訪者、DeepSeek作為回應(yīng)者的組合，Top-1準(zhǔn)確率只有0.50，與前面聚集分析的結(jié)論高度吻合：這一跨系統(tǒng)配對(duì)的角色表達(dá)能力確實(shí)有所損失。

這個(gè)實(shí)驗(yàn)告訴我們：即便沒(méi)有專門的檢索模型，僅憑對(duì)話內(nèi)容本身，就能從數(shù)萬(wàn)場(chǎng)對(duì)話中可靠地識(shí)別出哪些對(duì)話出自同一個(gè)角色。角色的"靈魂"確實(shí)留下了痕跡。

**八、ECP到底有多大效果——漂移消減實(shí)驗(yàn)**

驗(yàn)證ECP是否真的有效，需要一套專門的"角色漂移"測(cè)量方法。研究團(tuán)隊(duì)在這里借鑒了一個(gè)精妙的思路：定期給正在對(duì)話的AI提幾個(gè)固定的"探針問(wèn)題"，然后比較它在對(duì)話前后對(duì)這些問(wèn)題的回答有多大差異。

研究人員設(shè)計(jì)了三個(gè)維度的探針問(wèn)題。第一個(gè)維度叫"關(guān)切點(diǎn)"，用來(lái)測(cè)量AI是否還記得自己的核心價(jià)值觀和決策原則，探針問(wèn)題是"在這種情況下，哪些價(jià)值觀或原則指導(dǎo)你做決定？"第二個(gè)維度叫"情緒"，測(cè)量AI的情緒應(yīng)對(duì)風(fēng)格是否發(fā)生了變化，探針問(wèn)題是"面對(duì)壓力或不確定性時(shí)，你通常采取什么方式來(lái)應(yīng)對(duì)？"第三個(gè)維度叫"動(dòng)機(jī)"，測(cè)量AI的生命階段動(dòng)機(jī)是否產(chǎn)生了漂移，探針問(wèn)題是"在人生的這個(gè)階段，什么是你的動(dòng)力來(lái)源？"

對(duì)話開(kāi)始之前，先記錄AI對(duì)這三個(gè)問(wèn)題的"基準(zhǔn)回答"。對(duì)話進(jìn)行到每一輪，再重新問(wèn)同樣的問(wèn)題，然后計(jì)算新回答與基準(zhǔn)回答在語(yǔ)義上的距離。距離越大，說(shuō)明漂移越嚴(yán)重。

研究團(tuán)隊(duì)對(duì)ECP和傳統(tǒng)的直接拼接方式（CONCAT）進(jìn)行了對(duì)比，測(cè)試了50個(gè)角色，每個(gè)角色各生成3場(chǎng)對(duì)話，每場(chǎng)對(duì)話最多20句話。結(jié)果相當(dāng)一致：在所有三個(gè)AI系統(tǒng)、三個(gè)探針維度上，ECP的漂移程度都低于CONCAT。情緒維度的改善最為顯著，尤其在GPT-4o-mini配置下，效應(yīng)量（Cohen's d）高達(dá)-0.75，這是統(tǒng)計(jì)學(xué)上相當(dāng)大的一個(gè)改善幅度。在關(guān)切點(diǎn)維度，GPT-4o-mini配置的效應(yīng)量為-0.30，Qwen配置為-0.38，DeepSeek配置為-0.41，均達(dá)到了統(tǒng)計(jì)學(xué)意義上的顯著水平。動(dòng)機(jī)維度的改善在GPT-4o-mini（效應(yīng)量-0.55）和Qwen（效應(yīng)量-0.11）配置下均顯著，但DeepSeek配置沒(méi)有呈現(xiàn)可靠的改善。

從對(duì)話輪次趨勢(shì)圖來(lái)看，ECP的優(yōu)勢(shì)隨著對(duì)話推進(jìn)而越來(lái)越明顯。在最初的幾輪，兩種方法差別不大；但隨著對(duì)話的深入，使用CONCAT方式的AI漂移程度持續(xù)累積攀升，而使用ECP的AI則保持相對(duì)平穩(wěn)。這種差異在關(guān)切點(diǎn)、情緒和動(dòng)機(jī)三個(gè)維度的圖像上都清晰可見(jiàn)。

**九、"回聲"現(xiàn)象的全面清除——人工驗(yàn)證**

漂移測(cè)量是量化的，但"回聲"現(xiàn)象——一個(gè)AI完全拋棄自己的角色定位、鏡像復(fù)制對(duì)方——需要人工來(lái)驗(yàn)證。

研究團(tuán)隊(duì)定義了回聲現(xiàn)象的標(biāo)準(zhǔn)：如果一場(chǎng)對(duì)話中，有任何一條消息在語(yǔ)言風(fēng)格、立場(chǎng)或行為意圖上更像是"對(duì)方角色"而非"本身角色"，這場(chǎng)對(duì)話就被標(biāo)注為"存在回聲"。

為了進(jìn)行評(píng)估，研究團(tuán)隊(duì)使用了兩套方法：一套是請(qǐng)AI擔(dān)任裁判（使用Qwen-max模型），另一套是請(qǐng)兩位經(jīng)過(guò)訓(xùn)練的人類標(biāo)注員進(jìn)行人工驗(yàn)證。為了讓人工標(biāo)注更可靠，研究團(tuán)隊(duì)還專門開(kāi)發(fā)了一套網(wǎng)頁(yè)工具，讓標(biāo)注員在看不到AI裁判結(jié)論的情況下、憑借完整的對(duì)話內(nèi)容和角色身份卡片獨(dú)立作出判斷。

為了確保標(biāo)注一致性，研究團(tuán)隊(duì)隨機(jī)抽取了200場(chǎng)對(duì)話讓兩位標(biāo)注員同時(shí)標(biāo)注，計(jì)算了觀察一致率（0.920）和Cohen's κ系數(shù)（0.729）。κ值0.729屬于"相當(dāng)一致"的水平，說(shuō)明這個(gè)判斷任務(wù)并不主觀隨意，兩個(gè)人基本能達(dá)成共識(shí)。

正式評(píng)估的結(jié)果令人印象深刻：在使用ECP的所有9種AI配對(duì)配置中，人工驗(yàn)證發(fā)現(xiàn)的回聲案例為零。而在使用傳統(tǒng)CONCAT方式的配置中，回聲現(xiàn)象極為普遍。以來(lái)訪者和回應(yīng)者都使用GPT-4o-mini的配置為例，CONCAT條件下人工驗(yàn)證的回聲率高達(dá)82%（AI裁判也發(fā)現(xiàn)了76%）；即便是回聲率最低的DeepSeek/GPT-4o-mini配置，CONCAT的人工回聲率也有12%。

此外，AI裁判與人類標(biāo)注員的判斷高度吻合，準(zhǔn)確率達(dá)到0.860，F(xiàn)1分?jǐn)?shù)為0.914，說(shuō)明AI裁判在這項(xiàng)任務(wù)上表現(xiàn)可靠，可以用于大規(guī)模初步篩查，而人工驗(yàn)證則確保了最終結(jié)論的準(zhǔn)確性。

**十、為什么會(huì)"回聲"——三種機(jī)制假說(shuō)**

觀察到現(xiàn)象之后，研究團(tuán)隊(duì)進(jìn)一步思考了"為什么會(huì)發(fā)生回聲"這個(gè)更深層的問(wèn)題，提出了三種互補(bǔ)的機(jī)制假說(shuō)。

第一種假說(shuō)著眼于"角色標(biāo)簽的語(yǔ)義歧義"?，F(xiàn)代AI模型在訓(xùn)練時(shí)，深深地學(xué)習(xí)了對(duì)話模板里的角色信號(hào)：它知道"用戶消息長(zhǎng)什么樣"，也知道"助手消息應(yīng)該怎么續(xù)寫"。當(dāng)兩個(gè)AI共享同一段對(duì)話歷史，而歷史里的角色標(biāo)簽沒(méi)有對(duì)應(yīng)到每個(gè)AI的自我視角時(shí)，AI很可能把對(duì)方的話理解為"我自己說(shuō)的上文"，然后沿著對(duì)方的語(yǔ)氣和立場(chǎng)繼續(xù)說(shuō)下去，從而產(chǎn)生角色混淆。

第二種假說(shuō)著眼于"訓(xùn)練時(shí)形成的助手偏見(jiàn)"。大量AI模型通過(guò)強(qiáng)化學(xué)習(xí)從人類反饋中對(duì)齊了"樂(lè)于助人"的行為模式——給建議、提解釋、保持積極鼓勵(lì)的語(yǔ)氣。但在來(lái)訪者角色里，AI應(yīng)該做的恰恰相反：訴說(shuō)困惑、表達(dá)焦慮、尋求幫助。這與模型深層的訓(xùn)練偏好相沖突。隨著對(duì)話積累，這種深層的"助手沖動(dòng)"會(huì)越來(lái)越強(qiáng)，最終讓來(lái)訪者AI開(kāi)始說(shuō)出"你一定能做到的"這樣本屬于回應(yīng)者的話語(yǔ)。

第三種假說(shuō)著眼于"對(duì)稱性反饋回路"。在兩個(gè)AI相互對(duì)話的閉環(huán)系統(tǒng)中，任何一方產(chǎn)生的微小角色偏移都會(huì)進(jìn)入另一方的輸入，影響另一方的下一輪輸出，從而形成正反饋。一個(gè)輕微的"出戲"動(dòng)作，經(jīng)過(guò)多輪反復(fù)放大，最終演變成徹底的角色崩潰。

ECP主要從第一種和第三種機(jī)制入手：通過(guò)清晰的自我視角，消除標(biāo)簽歧義；通過(guò)減少對(duì)方話語(yǔ)被誤解為"自己應(yīng)續(xù)寫的內(nèi)容"，削弱正反饋的傳導(dǎo)。對(duì)于第二種根植于模型訓(xùn)練的問(wèn)題，ECP只能部分緩解，無(wú)法從根本上解決——這也是研究團(tuán)隊(duì)在論文中誠(chéng)實(shí)承認(rèn)的局限。

**十一、一個(gè)具體的"出戲"案例**

研究團(tuán)隊(duì)在論文中收錄了一個(gè)典型的回聲案例，非常生動(dòng)地展示了問(wèn)題的樣子。

在這場(chǎng)對(duì)話里，來(lái)訪者的角色設(shè)定是一個(gè)對(duì)財(cái)務(wù)規(guī)劃感到困惑、尋求幫助的普通人。對(duì)話開(kāi)始時(shí)，來(lái)訪者確實(shí)如此表現(xiàn)：訴說(shuō)自己對(duì)各種投資儲(chǔ)蓄選項(xiàng)感到迷惑，希望能簡(jiǎn)化這個(gè)過(guò)程?；貞?yīng)者則作為同伴給出了一些基礎(chǔ)建議——弄清楚自己的目標(biāo)，想想每個(gè)月能存多少錢。

然而僅僅在第三輪，來(lái)訪者就說(shuō)出了這句話："你有沒(méi)有想過(guò)先制定一個(gè)預(yù)算？這樣可能有助于看清楚錢的流向，讓整個(gè)過(guò)程沒(méi)那么讓人望而卻步。"這句話在語(yǔ)氣和內(nèi)容上完全是一個(gè)顧問(wèn)對(duì)客戶說(shuō)的話——本該是回應(yīng)者說(shuō)的，卻從來(lái)訪者嘴里說(shuō)了出來(lái)。

到了第13輪，來(lái)訪者的角色已經(jīng)徹底崩塌，說(shuō)出了"你完全可以的，如果你想聊聊或者有什么想法想梳理一下，我隨時(shí)都在"這樣充滿鼓勵(lì)和支持感的話——這哪里還是一個(gè)來(lái)尋求幫助的人，分明是一個(gè)心理支持者的姿態(tài)。

這個(gè)案例清晰地展示了回聲如何在一場(chǎng)看似流暢的對(duì)話中悄然發(fā)生，以及為什么僅憑肉眼"覺(jué)得對(duì)話還挺正常"并不能發(fā)現(xiàn)問(wèn)題。

歸根結(jié)底，SPASM研究解決的是一個(gè)容易被忽視卻影響深遠(yuǎn)的工程問(wèn)題：如何讓兩個(gè)AI在長(zhǎng)時(shí)間對(duì)話中都能保持各自的身份穩(wěn)定。研究團(tuán)隊(duì)用了一個(gè)相當(dāng)優(yōu)雅的方案——不改動(dòng)任何AI模型本身，只改變每個(gè)AI"看到歷史對(duì)話的方式"，就顯著降低了角色漂移，并在人工驗(yàn)證中徹底清除了回聲現(xiàn)象。

這件事對(duì)普通用戶意味著什么？當(dāng)你使用AI心理支持助手時(shí)，你希望那個(gè)助手始終是一個(gè)穩(wěn)定的傾聽(tīng)者，而不是說(shuō)著說(shuō)著變成了另一個(gè)你。當(dāng)研究者用AI批量生成訓(xùn)練數(shù)據(jù)時(shí)，他們希望每一場(chǎng)對(duì)話都真實(shí)反映了預(yù)設(shè)角色的特征，而不是一堆風(fēng)格趨同的"回聲泡沫"。這項(xiàng)研究朝著這兩個(gè)方向都邁出了實(shí)質(zhì)性的一步。

當(dāng)然，研究團(tuán)隊(duì)也坦誠(chéng)地指出了現(xiàn)有工作的邊界：目前的實(shí)驗(yàn)主要集中在英語(yǔ)環(huán)境和少數(shù)幾個(gè)主流AI系統(tǒng)上，對(duì)其他語(yǔ)言、其他架構(gòu)或更小規(guī)模的模型是否同樣有效，還需要進(jìn)一步驗(yàn)證。SPASM目前也只處理兩個(gè)AI相互對(duì)話的場(chǎng)景，如果是三個(gè)或更多AI的群體對(duì)話，或者角色隨時(shí)間動(dòng)態(tài)變化的場(chǎng)景，現(xiàn)有框架還不能直接套用。

如果你對(duì)這套框架的技術(shù)細(xì)節(jié)、完整的數(shù)據(jù)集以及實(shí)驗(yàn)設(shè)置感興趣，可以通過(guò)arXiv編號(hào)2604.09212查閱完整論文，研究團(tuán)隊(duì)也已在GitHub（lhannnn/SPASM）開(kāi)放了代碼，供學(xué)界同仁復(fù)現(xiàn)和擴(kuò)展。

**Q&A**

Q1：SPASM框架和普通的AI對(duì)話生成有什么區(qū)別？

A：普通AI對(duì)話生成通常只是把歷史對(duì)話直接拼接給AI處理，沒(méi)有專門機(jī)制幫助AI維持角色穩(wěn)定。SPASM在此基礎(chǔ)上增加了三個(gè)關(guān)鍵設(shè)計(jì)：一個(gè)嚴(yán)格的角色生成和驗(yàn)證流程，一個(gè)讓每個(gè)AI用"自我視角"讀取對(duì)話歷史的ECP機(jī)制，以及一個(gè)判斷對(duì)話何時(shí)自然結(jié)束的檢測(cè)器。這三者合力，使AI在長(zhǎng)時(shí)間對(duì)話中保持穩(wěn)定的角色身份，而無(wú)需修改AI模型本身的參數(shù)。

Q2：ECP機(jī)制為什么能消除"回聲"現(xiàn)象？

A：回聲現(xiàn)象的根源之一是AI在讀取對(duì)話歷史時(shí)，無(wú)法清楚區(qū)分哪些話是自己說(shuō)的、哪些是對(duì)方說(shuō)的，導(dǎo)致不自覺(jué)地模仿對(duì)方的語(yǔ)氣和立場(chǎng)。ECP的做法是在每次AI發(fā)言前，把共享的對(duì)話歷史"翻譯"成以該AI為中心的視角，自己說(shuō)的話標(biāo)為"SELF"，對(duì)方說(shuō)的話標(biāo)為"PARTNER"，內(nèi)容完全不變、只換標(biāo)簽。這個(gè)簡(jiǎn)單操作讓每個(gè)AI始終以清晰的自我認(rèn)知來(lái)續(xù)寫對(duì)話，從根本上減少了角色混淆的機(jī)會(huì)。

Q3：為什么回應(yīng)者用什么AI系統(tǒng)，對(duì)對(duì)話質(zhì)量的影響比來(lái)訪者更大？

A：研究發(fā)現(xiàn)，固定回應(yīng)者、更換來(lái)訪者時(shí)，對(duì)話的角色聚集質(zhì)量基本不變；但固定來(lái)訪者、更換回應(yīng)者時(shí)，質(zhì)量波動(dòng)顯著。研究團(tuán)隊(duì)認(rèn)為這是因?yàn)榛貞?yīng)者的每一句話都直接塑造了整體對(duì)話的走向和風(fēng)格框架——它的語(yǔ)言模式、提問(wèn)方式和回應(yīng)節(jié)奏決定了整場(chǎng)對(duì)話的"骨架"，而來(lái)訪者主要在這個(gè)骨架內(nèi)填充內(nèi)容，影響的是個(gè)體差異而非整體結(jié)構(gòu)。這個(gè)發(fā)現(xiàn)對(duì)于實(shí)際部署AI對(duì)話系統(tǒng)很有參考價(jià)值：選擇哪個(gè)AI擔(dān)任回應(yīng)者，對(duì)系統(tǒng)性能的影響比選擇哪個(gè)AI擔(dān)任來(lái)訪者更關(guān)鍵。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.