国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

利茲大學(xué)與本-古里安大學(xué):AI對(duì)話系統(tǒng)實(shí)現(xiàn)穩(wěn)定人格保持能力提升

0
分享至


這項(xiàng)由英國(guó)利茲大學(xué)、中國(guó)西南交通大學(xué)與以色列本-古里安大學(xué)內(nèi)蓋夫分校聯(lián)合開(kāi)展的研究,發(fā)表于2026年ACL(計(jì)算語(yǔ)言學(xué)協(xié)會(huì)年會(huì))的"Findings"專題,論文預(yù)印本編號(hào)為arXiv:2604.09212,感興趣的讀者可通過(guò)該編號(hào)查閱完整原文。

**一、故事的開(kāi)端:當(dāng)AI扮演別人,卻忘了自己是誰(shuí)**

假設(shè)你雇了一位演員,讓他全程扮演一個(gè)正在經(jīng)歷中年危機(jī)的職場(chǎng)人去參加一場(chǎng)心理咨詢。起初他表現(xiàn)得相當(dāng)?shù)轿弧f(shuō)著工作壓力有多大、家庭關(guān)系有多緊繃。然而談著談著,他開(kāi)始給咨詢師提建議,語(yǔ)氣也越來(lái)越像那位咨詢師本人,最后甚至說(shuō)出"你遇到這種困難,一定要好好照顧自己"這樣本該由咨詢師說(shuō)的話。你發(fā)現(xiàn):這位演員"出戲"了。

這個(gè)場(chǎng)景在現(xiàn)實(shí)生活的AI系統(tǒng)里,每天都在悄悄發(fā)生。

今天,越來(lái)越多的大語(yǔ)言模型(通俗地說(shuō),就是能對(duì)話的AI,比如ChatGPT這類系統(tǒng))被部署在需要長(zhǎng)時(shí)間、多輪次對(duì)話的場(chǎng)合:輔導(dǎo)學(xué)生學(xué)習(xí)的教學(xué)助手、處理用戶投訴的客服機(jī)器人、陪伴用戶傾訴的心理支持系統(tǒng)。在這些場(chǎng)合里,AI不僅要給出有用的回答,還要始終如一地扮演好一個(gè)固定角色——可能是"一位耐心的輔導(dǎo)老師",也可能是"一個(gè)正在尋求幫助的普通用戶"。

研究團(tuán)隊(duì)在工作中注意到了一個(gè)棘手的現(xiàn)象:當(dāng)兩個(gè)AI相互對(duì)話,隨著聊天輪次越來(lái)越多,其中一方往往會(huì)逐漸"忘掉自己是誰(shuí)"。它可能開(kāi)始用對(duì)方的語(yǔ)氣說(shuō)話、采用對(duì)方的立場(chǎng),最終在風(fēng)格和行為上越來(lái)越像對(duì)方。研究人員給這個(gè)現(xiàn)象起了一個(gè)形象的名字——"回聲"(Echoing):一個(gè)AI的聲音,開(kāi)始在另一個(gè)AI的嘴里反響。

這個(gè)問(wèn)題看起來(lái)像是技術(shù)小毛病,實(shí)則會(huì)造成嚴(yán)重后果。當(dāng)研究者們需要用AI批量生成訓(xùn)練對(duì)話數(shù)據(jù)時(shí),如果AI"出戲",生成的對(duì)話就不再符合預(yù)設(shè)的角色要求,這批"臟數(shù)據(jù)"混入訓(xùn)練集,會(huì)讓被訓(xùn)練的模型學(xué)到錯(cuò)誤的行為模式,危害是長(zhǎng)期而深遠(yuǎn)的。

**二、這個(gè)問(wèn)題有多普遍、有多嚴(yán)重**

在研究者著手設(shè)計(jì)解決方案之前,首先需要摸清楚問(wèn)題的底細(xì)。他們總結(jié)了現(xiàn)有AI對(duì)話系統(tǒng)中出現(xiàn)的三種典型"身份崩潰"模式。

第一種叫做"指令漂移":AI被告知要完成某個(gè)任務(wù),但隨著對(duì)話進(jìn)行,它越來(lái)越偏離最初的任務(wù)描述,就像一個(gè)廚師邊做菜邊忘了菜譜上寫的是什么。第二種叫做"人格偏移":AI被賦予了某個(gè)性格設(shè)定,但對(duì)話越長(zhǎng),這個(gè)性格就越模糊,最終溶化成一個(gè)毫無(wú)特色的通用助手。第三種,也是這篇研究特別關(guān)注的,就是前面說(shuō)的"回聲"現(xiàn)象——一個(gè)AI逐漸開(kāi)始鏡像復(fù)制對(duì)方的語(yǔ)言風(fēng)格、立場(chǎng)和行為模式,失去了自己獨(dú)特的身份。

這三種問(wèn)題有一個(gè)共同的誘因:隨著對(duì)話越來(lái)越長(zhǎng),AI的"記憶"負(fù)擔(dān)越來(lái)越重。它需要在記住自己角色設(shè)定的同時(shí),處理越來(lái)越長(zhǎng)的對(duì)話歷史。當(dāng)這兩件事發(fā)生沖突時(shí),AI往往會(huì)不自覺(jué)地放棄更難維持的角色設(shè)定,而向更"順手"的對(duì)話模式靠攏——而那個(gè)更順手的模式,往往就是模仿對(duì)方。

這個(gè)問(wèn)題在已有的AI對(duì)話框架里,幾乎沒(méi)有被認(rèn)真對(duì)待過(guò)。大多數(shù)框架只是簡(jiǎn)單地把對(duì)話歷史拼接在一起,塞給AI處理,沒(méi)有任何專門的機(jī)制來(lái)幫助AI"記清楚自己是誰(shuí)"。

**三、SPASM框架:像搭積木一樣組建一個(gè)"穩(wěn)定人格"的對(duì)話系統(tǒng)**

研究團(tuán)隊(duì)提出了一套名為SPASM的系統(tǒng)——全稱是"穩(wěn)定人格驅(qū)動(dòng)的多輪對(duì)話生成代理模擬框架"(Stable Persona-driven Agent Simulation for Multi-turn dialogue generation)。光聽(tīng)名字可能有些拗口,但如果把它比作一條精心設(shè)計(jì)的流水線,就容易理解多了。

這條流水線分三個(gè)工作站。第一個(gè)工作站負(fù)責(zé)"打造角色",第二個(gè)工作站負(fù)責(zé)"讓兩個(gè)AI按照各自角色展開(kāi)對(duì)話",第三個(gè)工作站負(fù)責(zé)"判斷這場(chǎng)對(duì)話什么時(shí)候應(yīng)該自然地結(jié)束"。

在第一個(gè)工作站,系統(tǒng)并不是隨機(jī)拍腦袋生成角色,而是按照一個(gè)精心設(shè)計(jì)的"角色藍(lán)圖"來(lái)工作。這份藍(lán)圖覆蓋了四大類角色屬性。第一類是基本人口信息,包括年齡(在18至65歲之間隨機(jī)抽?。⒙殬I(yè)(從涵蓋科技、醫(yī)療、藝術(shù)、教育等領(lǐng)域的76種職業(yè)中選?。⑺诔鞘校◤?0個(gè)英語(yǔ)城市中選取,覆蓋北美、歐洲、亞洲、中東、大洋洲和非洲)。第二類是當(dāng)前面臨的問(wèn)題情境,從44種場(chǎng)景中選取,涵蓋心理情緒支持、法律財(cái)務(wù)咨詢、人際關(guān)系等日常場(chǎng)景。第三類是情緒狀態(tài),從12種情緒類別(比如焦慮、壓抑、平靜等)中選取,并配有輕度、中度、重度三級(jí)強(qiáng)度。第四類是行為風(fēng)格,包括表達(dá)方式的活躍程度、自我披露的深淺、禮貌風(fēng)格(正式/中性/隨意/直接)以及主張強(qiáng)度。

然而僅僅隨機(jī)組合這些屬性還不夠。直接組合可能產(chǎn)生荒謬的角色,比如"18歲在校學(xué)生正在咨詢退休養(yǎng)老金規(guī)劃"——這樣的角色顯然不合邏輯。為此,系統(tǒng)設(shè)置了一個(gè)專門的"角色審核員"(Persona Validator):它會(huì)檢查每一個(gè)隨機(jī)組合是否合理,不合理的直接打回重來(lái),直到產(chǎn)生一個(gè)符合現(xiàn)實(shí)邏輯的角色為止。

通過(guò)審核的角色藍(lán)圖會(huì)交給"角色工匠"(Persona Crafter),由它把那些干巴巴的屬性清單轉(zhuǎn)化成一段流暢自然的角色介紹文字,比如"你是一位30歲的會(huì)計(jì)師,住在新加坡,最近工作上的一些軟件問(wèn)題讓你頗為困擾,心情還算平穩(wěn)但略感焦慮,你希望在這次對(duì)話中找到解決方案……"值得注意的是,角色工匠可以在原始屬性清單之外進(jìn)行適當(dāng)?shù)募?xì)節(jié)補(bǔ)充——這種彈性設(shè)計(jì)讓角色更加自然豐滿。

第二個(gè)工作站是對(duì)話的核心:一個(gè)扮演"來(lái)訪者"(Client)的AI,和一個(gè)扮演"回應(yīng)者"(Responder)的AI,按照各自的角色定位展開(kāi)對(duì)話。來(lái)訪者完整接受了剛才那份角色設(shè)定,而回應(yīng)者則按照用戶預(yù)設(shè)的角色定位(比如傾聽(tīng)者、專家、顧問(wèn)等)來(lái)響應(yīng)。

第三個(gè)工作站是結(jié)束檢測(cè)器(Termination Detector)。它在對(duì)話進(jìn)行到一定輪次后被激活,持續(xù)分析最近幾輪對(duì)話的走向,判斷對(duì)話是否已經(jīng)自然地走到了終點(diǎn)。比如當(dāng)來(lái)訪者說(shuō)"謝謝你,這些對(duì)我很有幫助",檢測(cè)器就會(huì)識(shí)別出這是一個(gè)合理的結(jié)束信號(hào),阻止對(duì)話繼續(xù)無(wú)意義地延續(xù)下去。這個(gè)設(shè)計(jì)避免了兩種極端:對(duì)話過(guò)早結(jié)束(還沒(méi)解決問(wèn)題)或者無(wú)休止地循環(huán)(已經(jīng)說(shuō)完了還在車轱轆話來(lái)回說(shuō))。

**四、真正的核心創(chuàng)新:給每個(gè)AI一雙"以自我為中心的眼睛"**

前面三個(gè)工作站都在服務(wù)于對(duì)話質(zhì)量,但研究中最有獨(dú)到之處的設(shè)計(jì),藏在第二個(gè)工作站里——一個(gè)叫做"以自我為中心的情境投影"(Egocentric Context Projection,簡(jiǎn)稱ECP)的機(jī)制。

為了解釋清楚這個(gè)機(jī)制,先來(lái)描述一下問(wèn)題是怎么產(chǎn)生的。通常情況下,AI系統(tǒng)會(huì)把整段對(duì)話歷史像一條長(zhǎng)長(zhǎng)的流水賬一樣存儲(chǔ)下來(lái),然后把這條流水賬直接喂給每一個(gè)需要發(fā)言的AI。這本來(lái)沒(méi)什么問(wèn)題,但在兩個(gè)AI相互對(duì)話的情境下,這種做法會(huì)產(chǎn)生一個(gè)隱蔽的混淆:對(duì)話歷史里的每一句話,雖然都標(biāo)注了"是誰(shuí)說(shuō)的"(比如"用戶說(shuō)"或"助手說(shuō)"),但當(dāng)一個(gè)AI讀到這份歷史時(shí),它其實(shí)很難清楚地區(qū)分"哪些話是我自己說(shuō)的,哪些話是對(duì)方說(shuō)的"。

這就好像有人給你一份劇本,里面交替出現(xiàn)"甲說(shuō)了什么"和"乙說(shuō)了什么",但你不知道自己是甲還是乙,還是其他角色。如果你不得不繼續(xù)這個(gè)劇本,你很可能會(huì)在不知不覺(jué)中說(shuō)出本不屬于你角色的話。

ECP的解決思路相當(dāng)優(yōu)雅:不改變對(duì)話歷史的內(nèi)容,只改變每個(gè)AI看到這份歷史的"視角"。具體來(lái)說(shuō),對(duì)話歷史以一種"視角中立"的方式存儲(chǔ)起來(lái),記錄的是"C說(shuō)了什么"和"R說(shuō)了什么"(C代表來(lái)訪者Client,R代表回應(yīng)者Responder)。當(dāng)需要讓來(lái)訪者AI發(fā)言時(shí),系統(tǒng)會(huì)把歷史"翻譯"一遍:把"C說(shuō)的話"全部重新標(biāo)注為"SELF(我自己)說(shuō)的話",把"R說(shuō)的話"全部重新標(biāo)注為"PARTNER(對(duì)方)說(shuō)的話"。反過(guò)來(lái),當(dāng)回應(yīng)者AI需要發(fā)言時(shí),歷史又會(huì)被"翻譯"成另一個(gè)版本:把"R說(shuō)的話"標(biāo)注為"SELF",把"C說(shuō)的話"標(biāo)注為"PARTNER"。

這個(gè)轉(zhuǎn)換過(guò)程不改變?nèi)魏我粋€(gè)字的內(nèi)容,只是調(diào)整了"誰(shuí)說(shuō)了什么"的標(biāo)簽——但這個(gè)微小的調(diào)整卻產(chǎn)生了顯著的效果。每個(gè)AI在讀取對(duì)話歷史時(shí),始終都在以一個(gè)清晰的自我視角來(lái)處理信息。它知道哪些話是"我"說(shuō)過(guò)的,哪些話是"對(duì)方"說(shuō)過(guò)的,于是就不會(huì)錯(cuò)誤地把對(duì)方的話風(fēng)格當(dāng)作自己下一句話應(yīng)該采用的模板。

這個(gè)機(jī)制在數(shù)學(xué)上也可以被嚴(yán)格定義,研究論文中對(duì)此有完整的形式化表述,但核心思想就是這么簡(jiǎn)單:給每個(gè)AI一雙只看到"自己視角"的眼睛,而不是讓它用一雙混沌的"上帝視角"來(lái)看整段對(duì)話。

**五、實(shí)驗(yàn)規(guī)模:4500個(gè)角色,45000場(chǎng)對(duì)話**

為了驗(yàn)證SPASM框架的效果,研究團(tuán)隊(duì)進(jìn)行了相當(dāng)大規(guī)模的實(shí)驗(yàn)。他們選用了三個(gè)主流AI系統(tǒng)作為"演員庫(kù)":OpenAI的GPT-4o-mini、深度求索的DeepSeek-V3.2,以及阿里巴巴的Qwen-Plus。通過(guò)讓這三個(gè)系統(tǒng)兩兩配對(duì)(包括同一系統(tǒng)自己與自己配對(duì)),共產(chǎn)生了9種"來(lái)訪者+回應(yīng)者"組合。

對(duì)于每種組合,研究團(tuán)隊(duì)生成了500個(gè)獨(dú)立角色,每個(gè)角色參與10場(chǎng)對(duì)話,每場(chǎng)對(duì)話最多允許每方發(fā)言25次(即每場(chǎng)對(duì)話最多50句話)。全部算下來(lái),這是4500個(gè)不同角色、45000場(chǎng)完整對(duì)話,數(shù)據(jù)量相當(dāng)可觀。

生成對(duì)話時(shí),來(lái)訪者、回應(yīng)者和角色工匠都使用了0.7的"溫度值"(這個(gè)參數(shù)控制AI回答的隨機(jī)性,數(shù)值越高,回答越多樣化),而角色審核員和結(jié)束檢測(cè)器則使用了更低的0.3溫度值,目的是讓這些負(fù)責(zé)"判斷"的模塊給出更穩(wěn)定一致的結(jié)論。

**六、對(duì)話的"靈魂"是否真的被保留了——嵌入空間的故事**

驗(yàn)證一套框架是否奏效,光靠肉眼觀察幾段對(duì)話是不夠的,研究團(tuán)隊(duì)設(shè)計(jì)了一套系統(tǒng)性的量化評(píng)估方法。

第一個(gè)問(wèn)題是:同一個(gè)角色生成的不同對(duì)話,在語(yǔ)義上是否真的很相似?換句話說(shuō),角色的"靈魂"有沒(méi)有真正滲透進(jìn)每一場(chǎng)對(duì)話里?

研究團(tuán)隊(duì)把每場(chǎng)對(duì)話中來(lái)訪者說(shuō)的所有話拼接成一段文字,然后用OpenAI提供的高質(zhì)量文本嵌入模型(text-embedding-3-large)把這段文字轉(zhuǎn)化成一個(gè)高維空間里的點(diǎn)。如果同一個(gè)角色的不同對(duì)話對(duì)應(yīng)的點(diǎn)聚集在一起,而不同角色的點(diǎn)則相互遠(yuǎn)離,就說(shuō)明角色設(shè)定確實(shí)深刻地影響了對(duì)話內(nèi)容。

結(jié)果相當(dāng)令人振奮。在來(lái)訪者和回應(yīng)者使用同一個(gè)AI系統(tǒng)的配置下,同角色的對(duì)話形成了非常緊密的聚集,不同角色之間涇渭分明。以GPT-4o-mini雙方都使用的配置為例,同一角色內(nèi)部的對(duì)話距離平均只有0.09(越小越好),而跨角色的平均距離高達(dá)0.50。從一項(xiàng)叫做"輪廓分?jǐn)?shù)"的指標(biāo)來(lái)看,這個(gè)配置拿到了0.60的高分(滿分是1.0)。

不過(guò),當(dāng)來(lái)訪者和回應(yīng)者使用不同AI系統(tǒng)時(shí),情況就復(fù)雜了一些。比如來(lái)訪者用GPT-4o-mini、回應(yīng)者用DeepSeek-V3.2的配置,角色聚集效果大幅下降,輪廓分?jǐn)?shù)只有0.10,同一角色內(nèi)部的對(duì)話距離也跳升到0.34。這說(shuō)明跨系統(tǒng)配對(duì)會(huì)引入額外的"噪聲",削弱角色特征在對(duì)話中的體現(xiàn)。

更有趣的是,研究團(tuán)隊(duì)發(fā)現(xiàn)了一個(gè)顯著的不對(duì)稱性:固定回應(yīng)者、更換來(lái)訪者,聚集質(zhì)量變化不大;而固定來(lái)訪者、更換回應(yīng)者,聚集質(zhì)量則會(huì)發(fā)生巨大變化。以回應(yīng)者固定為GPT-4o-mini為例,無(wú)論來(lái)訪者是哪個(gè)系統(tǒng),輪廓分?jǐn)?shù)都穩(wěn)定在0.60以上,Davies-Bouldin指數(shù)(越低越好)都在1.0附近。但把回應(yīng)者換成DeepSeek-V3.2,聚集質(zhì)量就急劇下降。這個(gè)發(fā)現(xiàn)揭示了一個(gè)深層規(guī)律:在來(lái)訪者+回應(yīng)者的對(duì)話體系中,回應(yīng)者這一方對(duì)于整體對(duì)話的結(jié)構(gòu)形狀和風(fēng)格走向有著更為主導(dǎo)的影響。來(lái)訪者更多影響的是同一角色內(nèi)部對(duì)話的差異性(即"個(gè)體差異"),而不是整體的角色分布格局。

**七、"角色信號(hào)"是否足夠強(qiáng)——檢索實(shí)驗(yàn)**

除了聚集分析,研究團(tuán)隊(duì)還做了一個(gè)更直觀的測(cè)試:給定一場(chǎng)對(duì)話,能不能在整個(gè)數(shù)據(jù)集里找到使用了同一個(gè)角色的其他對(duì)話?

這是一個(gè)信息檢索問(wèn)題。研究人員對(duì)每場(chǎng)對(duì)話提取嵌入向量,然后對(duì)每場(chǎng)對(duì)話,找出嵌入向量最相似的K場(chǎng)對(duì)話,看其中是否包含同一角色的對(duì)話(這個(gè)指標(biāo)叫做Acc@K,K越大,搜索范圍越廣,命中率自然也越高)。

他們還設(shè)計(jì)了一個(gè)"運(yùn)氣基準(zhǔn)":把所有角色標(biāo)簽隨機(jī)打亂后再做同樣的檢索,來(lái)代表純粹靠運(yùn)氣能達(dá)到的準(zhǔn)確率。

結(jié)果非常清晰。在最嚴(yán)格的Top-1檢索(只看最相似的那一場(chǎng))中,運(yùn)氣基準(zhǔn)的準(zhǔn)確率只有0.02(大約等于瞎猜),而大多數(shù)配置下的實(shí)際準(zhǔn)確率都在0.82到0.99之間。在Top-10檢索中,大多數(shù)配置都能達(dá)到0.98到1.00的準(zhǔn)確率,幾乎完美地找回了同一角色的對(duì)話。例外是GPT-4o-mini作為來(lái)訪者、DeepSeek作為回應(yīng)者的組合,Top-1準(zhǔn)確率只有0.50,與前面聚集分析的結(jié)論高度吻合:這一跨系統(tǒng)配對(duì)的角色表達(dá)能力確實(shí)有所損失。

這個(gè)實(shí)驗(yàn)告訴我們:即便沒(méi)有專門的檢索模型,僅憑對(duì)話內(nèi)容本身,就能從數(shù)萬(wàn)場(chǎng)對(duì)話中可靠地識(shí)別出哪些對(duì)話出自同一個(gè)角色。角色的"靈魂"確實(shí)留下了痕跡。

**八、ECP到底有多大效果——漂移消減實(shí)驗(yàn)**

驗(yàn)證ECP是否真的有效,需要一套專門的"角色漂移"測(cè)量方法。研究團(tuán)隊(duì)在這里借鑒了一個(gè)精妙的思路:定期給正在對(duì)話的AI提幾個(gè)固定的"探針問(wèn)題",然后比較它在對(duì)話前后對(duì)這些問(wèn)題的回答有多大差異。

研究人員設(shè)計(jì)了三個(gè)維度的探針問(wèn)題。第一個(gè)維度叫"關(guān)切點(diǎn)",用來(lái)測(cè)量AI是否還記得自己的核心價(jià)值觀和決策原則,探針問(wèn)題是"在這種情況下,哪些價(jià)值觀或原則指導(dǎo)你做決定?"第二個(gè)維度叫"情緒",測(cè)量AI的情緒應(yīng)對(duì)風(fēng)格是否發(fā)生了變化,探針問(wèn)題是"面對(duì)壓力或不確定性時(shí),你通常采取什么方式來(lái)應(yīng)對(duì)?"第三個(gè)維度叫"動(dòng)機(jī)",測(cè)量AI的生命階段動(dòng)機(jī)是否產(chǎn)生了漂移,探針問(wèn)題是"在人生的這個(gè)階段,什么是你的動(dòng)力來(lái)源?"

對(duì)話開(kāi)始之前,先記錄AI對(duì)這三個(gè)問(wèn)題的"基準(zhǔn)回答"。對(duì)話進(jìn)行到每一輪,再重新問(wèn)同樣的問(wèn)題,然后計(jì)算新回答與基準(zhǔn)回答在語(yǔ)義上的距離。距離越大,說(shuō)明漂移越嚴(yán)重。

研究團(tuán)隊(duì)對(duì)ECP和傳統(tǒng)的直接拼接方式(CONCAT)進(jìn)行了對(duì)比,測(cè)試了50個(gè)角色,每個(gè)角色各生成3場(chǎng)對(duì)話,每場(chǎng)對(duì)話最多20句話。結(jié)果相當(dāng)一致:在所有三個(gè)AI系統(tǒng)、三個(gè)探針維度上,ECP的漂移程度都低于CONCAT。情緒維度的改善最為顯著,尤其在GPT-4o-mini配置下,效應(yīng)量(Cohen's d)高達(dá)-0.75,這是統(tǒng)計(jì)學(xué)上相當(dāng)大的一個(gè)改善幅度。在關(guān)切點(diǎn)維度,GPT-4o-mini配置的效應(yīng)量為-0.30,Qwen配置為-0.38,DeepSeek配置為-0.41,均達(dá)到了統(tǒng)計(jì)學(xué)意義上的顯著水平。動(dòng)機(jī)維度的改善在GPT-4o-mini(效應(yīng)量-0.55)和Qwen(效應(yīng)量-0.11)配置下均顯著,但DeepSeek配置沒(méi)有呈現(xiàn)可靠的改善。

從對(duì)話輪次趨勢(shì)圖來(lái)看,ECP的優(yōu)勢(shì)隨著對(duì)話推進(jìn)而越來(lái)越明顯。在最初的幾輪,兩種方法差別不大;但隨著對(duì)話的深入,使用CONCAT方式的AI漂移程度持續(xù)累積攀升,而使用ECP的AI則保持相對(duì)平穩(wěn)。這種差異在關(guān)切點(diǎn)、情緒和動(dòng)機(jī)三個(gè)維度的圖像上都清晰可見(jiàn)。

**九、"回聲"現(xiàn)象的全面清除——人工驗(yàn)證**

漂移測(cè)量是量化的,但"回聲"現(xiàn)象——一個(gè)AI完全拋棄自己的角色定位、鏡像復(fù)制對(duì)方——需要人工來(lái)驗(yàn)證。

研究團(tuán)隊(duì)定義了回聲現(xiàn)象的標(biāo)準(zhǔn):如果一場(chǎng)對(duì)話中,有任何一條消息在語(yǔ)言風(fēng)格、立場(chǎng)或行為意圖上更像是"對(duì)方角色"而非"本身角色",這場(chǎng)對(duì)話就被標(biāo)注為"存在回聲"。

為了進(jìn)行評(píng)估,研究團(tuán)隊(duì)使用了兩套方法:一套是請(qǐng)AI擔(dān)任裁判(使用Qwen-max模型),另一套是請(qǐng)兩位經(jīng)過(guò)訓(xùn)練的人類標(biāo)注員進(jìn)行人工驗(yàn)證。為了讓人工標(biāo)注更可靠,研究團(tuán)隊(duì)還專門開(kāi)發(fā)了一套網(wǎng)頁(yè)工具,讓標(biāo)注員在看不到AI裁判結(jié)論的情況下、憑借完整的對(duì)話內(nèi)容和角色身份卡片獨(dú)立作出判斷。

為了確保標(biāo)注一致性,研究團(tuán)隊(duì)隨機(jī)抽取了200場(chǎng)對(duì)話讓兩位標(biāo)注員同時(shí)標(biāo)注,計(jì)算了觀察一致率(0.920)和Cohen's κ系數(shù)(0.729)。κ值0.729屬于"相當(dāng)一致"的水平,說(shuō)明這個(gè)判斷任務(wù)并不主觀隨意,兩個(gè)人基本能達(dá)成共識(shí)。

正式評(píng)估的結(jié)果令人印象深刻:在使用ECP的所有9種AI配對(duì)配置中,人工驗(yàn)證發(fā)現(xiàn)的回聲案例為零。而在使用傳統(tǒng)CONCAT方式的配置中,回聲現(xiàn)象極為普遍。以來(lái)訪者和回應(yīng)者都使用GPT-4o-mini的配置為例,CONCAT條件下人工驗(yàn)證的回聲率高達(dá)82%(AI裁判也發(fā)現(xiàn)了76%);即便是回聲率最低的DeepSeek/GPT-4o-mini配置,CONCAT的人工回聲率也有12%。

此外,AI裁判與人類標(biāo)注員的判斷高度吻合,準(zhǔn)確率達(dá)到0.860,F(xiàn)1分?jǐn)?shù)為0.914,說(shuō)明AI裁判在這項(xiàng)任務(wù)上表現(xiàn)可靠,可以用于大規(guī)模初步篩查,而人工驗(yàn)證則確保了最終結(jié)論的準(zhǔn)確性。

**十、為什么會(huì)"回聲"——三種機(jī)制假說(shuō)**

觀察到現(xiàn)象之后,研究團(tuán)隊(duì)進(jìn)一步思考了"為什么會(huì)發(fā)生回聲"這個(gè)更深層的問(wèn)題,提出了三種互補(bǔ)的機(jī)制假說(shuō)。

第一種假說(shuō)著眼于"角色標(biāo)簽的語(yǔ)義歧義"?,F(xiàn)代AI模型在訓(xùn)練時(shí),深深地學(xué)習(xí)了對(duì)話模板里的角色信號(hào):它知道"用戶消息長(zhǎng)什么樣",也知道"助手消息應(yīng)該怎么續(xù)寫"。當(dāng)兩個(gè)AI共享同一段對(duì)話歷史,而歷史里的角色標(biāo)簽沒(méi)有對(duì)應(yīng)到每個(gè)AI的自我視角時(shí),AI很可能把對(duì)方的話理解為"我自己說(shuō)的上文",然后沿著對(duì)方的語(yǔ)氣和立場(chǎng)繼續(xù)說(shuō)下去,從而產(chǎn)生角色混淆。

第二種假說(shuō)著眼于"訓(xùn)練時(shí)形成的助手偏見(jiàn)"。大量AI模型通過(guò)強(qiáng)化學(xué)習(xí)從人類反饋中對(duì)齊了"樂(lè)于助人"的行為模式——給建議、提解釋、保持積極鼓勵(lì)的語(yǔ)氣。但在來(lái)訪者角色里,AI應(yīng)該做的恰恰相反:訴說(shuō)困惑、表達(dá)焦慮、尋求幫助。這與模型深層的訓(xùn)練偏好相沖突。隨著對(duì)話積累,這種深層的"助手沖動(dòng)"會(huì)越來(lái)越強(qiáng),最終讓來(lái)訪者AI開(kāi)始說(shuō)出"你一定能做到的"這樣本屬于回應(yīng)者的話語(yǔ)。

第三種假說(shuō)著眼于"對(duì)稱性反饋回路"。在兩個(gè)AI相互對(duì)話的閉環(huán)系統(tǒng)中,任何一方產(chǎn)生的微小角色偏移都會(huì)進(jìn)入另一方的輸入,影響另一方的下一輪輸出,從而形成正反饋。一個(gè)輕微的"出戲"動(dòng)作,經(jīng)過(guò)多輪反復(fù)放大,最終演變成徹底的角色崩潰。

ECP主要從第一種和第三種機(jī)制入手:通過(guò)清晰的自我視角,消除標(biāo)簽歧義;通過(guò)減少對(duì)方話語(yǔ)被誤解為"自己應(yīng)續(xù)寫的內(nèi)容",削弱正反饋的傳導(dǎo)。對(duì)于第二種根植于模型訓(xùn)練的問(wèn)題,ECP只能部分緩解,無(wú)法從根本上解決——這也是研究團(tuán)隊(duì)在論文中誠(chéng)實(shí)承認(rèn)的局限。

**十一、一個(gè)具體的"出戲"案例**

研究團(tuán)隊(duì)在論文中收錄了一個(gè)典型的回聲案例,非常生動(dòng)地展示了問(wèn)題的樣子。

在這場(chǎng)對(duì)話里,來(lái)訪者的角色設(shè)定是一個(gè)對(duì)財(cái)務(wù)規(guī)劃感到困惑、尋求幫助的普通人。對(duì)話開(kāi)始時(shí),來(lái)訪者確實(shí)如此表現(xiàn):訴說(shuō)自己對(duì)各種投資儲(chǔ)蓄選項(xiàng)感到迷惑,希望能簡(jiǎn)化這個(gè)過(guò)程?;貞?yīng)者則作為同伴給出了一些基礎(chǔ)建議——弄清楚自己的目標(biāo),想想每個(gè)月能存多少錢。

然而僅僅在第三輪,來(lái)訪者就說(shuō)出了這句話:"你有沒(méi)有想過(guò)先制定一個(gè)預(yù)算?這樣可能有助于看清楚錢的流向,讓整個(gè)過(guò)程沒(méi)那么讓人望而卻步。"這句話在語(yǔ)氣和內(nèi)容上完全是一個(gè)顧問(wèn)對(duì)客戶說(shuō)的話——本該是回應(yīng)者說(shuō)的,卻從來(lái)訪者嘴里說(shuō)了出來(lái)。

到了第13輪,來(lái)訪者的角色已經(jīng)徹底崩塌,說(shuō)出了"你完全可以的,如果你想聊聊或者有什么想法想梳理一下,我隨時(shí)都在"這樣充滿鼓勵(lì)和支持感的話——這哪里還是一個(gè)來(lái)尋求幫助的人,分明是一個(gè)心理支持者的姿態(tài)。

這個(gè)案例清晰地展示了回聲如何在一場(chǎng)看似流暢的對(duì)話中悄然發(fā)生,以及為什么僅憑肉眼"覺(jué)得對(duì)話還挺正常"并不能發(fā)現(xiàn)問(wèn)題。

歸根結(jié)底,SPASM研究解決的是一個(gè)容易被忽視卻影響深遠(yuǎn)的工程問(wèn)題:如何讓兩個(gè)AI在長(zhǎng)時(shí)間對(duì)話中都能保持各自的身份穩(wěn)定。研究團(tuán)隊(duì)用了一個(gè)相當(dāng)優(yōu)雅的方案——不改動(dòng)任何AI模型本身,只改變每個(gè)AI"看到歷史對(duì)話的方式",就顯著降低了角色漂移,并在人工驗(yàn)證中徹底清除了回聲現(xiàn)象。

這件事對(duì)普通用戶意味著什么?當(dāng)你使用AI心理支持助手時(shí),你希望那個(gè)助手始終是一個(gè)穩(wěn)定的傾聽(tīng)者,而不是說(shuō)著說(shuō)著變成了另一個(gè)你。當(dāng)研究者用AI批量生成訓(xùn)練數(shù)據(jù)時(shí),他們希望每一場(chǎng)對(duì)話都真實(shí)反映了預(yù)設(shè)角色的特征,而不是一堆風(fēng)格趨同的"回聲泡沫"。這項(xiàng)研究朝著這兩個(gè)方向都邁出了實(shí)質(zhì)性的一步。

當(dāng)然,研究團(tuán)隊(duì)也坦誠(chéng)地指出了現(xiàn)有工作的邊界:目前的實(shí)驗(yàn)主要集中在英語(yǔ)環(huán)境和少數(shù)幾個(gè)主流AI系統(tǒng)上,對(duì)其他語(yǔ)言、其他架構(gòu)或更小規(guī)模的模型是否同樣有效,還需要進(jìn)一步驗(yàn)證。SPASM目前也只處理兩個(gè)AI相互對(duì)話的場(chǎng)景,如果是三個(gè)或更多AI的群體對(duì)話,或者角色隨時(shí)間動(dòng)態(tài)變化的場(chǎng)景,現(xiàn)有框架還不能直接套用。

如果你對(duì)這套框架的技術(shù)細(xì)節(jié)、完整的數(shù)據(jù)集以及實(shí)驗(yàn)設(shè)置感興趣,可以通過(guò)arXiv編號(hào)2604.09212查閱完整論文,研究團(tuán)隊(duì)也已在GitHub(lhannnn/SPASM)開(kāi)放了代碼,供學(xué)界同仁復(fù)現(xiàn)和擴(kuò)展。

**Q&A**

Q1:SPASM框架和普通的AI對(duì)話生成有什么區(qū)別?

A:普通AI對(duì)話生成通常只是把歷史對(duì)話直接拼接給AI處理,沒(méi)有專門機(jī)制幫助AI維持角色穩(wěn)定。SPASM在此基礎(chǔ)上增加了三個(gè)關(guān)鍵設(shè)計(jì):一個(gè)嚴(yán)格的角色生成和驗(yàn)證流程,一個(gè)讓每個(gè)AI用"自我視角"讀取對(duì)話歷史的ECP機(jī)制,以及一個(gè)判斷對(duì)話何時(shí)自然結(jié)束的檢測(cè)器。這三者合力,使AI在長(zhǎng)時(shí)間對(duì)話中保持穩(wěn)定的角色身份,而無(wú)需修改AI模型本身的參數(shù)。

Q2:ECP機(jī)制為什么能消除"回聲"現(xiàn)象?

A:回聲現(xiàn)象的根源之一是AI在讀取對(duì)話歷史時(shí),無(wú)法清楚區(qū)分哪些話是自己說(shuō)的、哪些是對(duì)方說(shuō)的,導(dǎo)致不自覺(jué)地模仿對(duì)方的語(yǔ)氣和立場(chǎng)。ECP的做法是在每次AI發(fā)言前,把共享的對(duì)話歷史"翻譯"成以該AI為中心的視角,自己說(shuō)的話標(biāo)為"SELF",對(duì)方說(shuō)的話標(biāo)為"PARTNER",內(nèi)容完全不變、只換標(biāo)簽。這個(gè)簡(jiǎn)單操作讓每個(gè)AI始終以清晰的自我認(rèn)知來(lái)續(xù)寫對(duì)話,從根本上減少了角色混淆的機(jī)會(huì)。

Q3:為什么回應(yīng)者用什么AI系統(tǒng),對(duì)對(duì)話質(zhì)量的影響比來(lái)訪者更大?

A:研究發(fā)現(xiàn),固定回應(yīng)者、更換來(lái)訪者時(shí),對(duì)話的角色聚集質(zhì)量基本不變;但固定來(lái)訪者、更換回應(yīng)者時(shí),質(zhì)量波動(dòng)顯著。研究團(tuán)隊(duì)認(rèn)為這是因?yàn)榛貞?yīng)者的每一句話都直接塑造了整體對(duì)話的走向和風(fēng)格框架——它的語(yǔ)言模式、提問(wèn)方式和回應(yīng)節(jié)奏決定了整場(chǎng)對(duì)話的"骨架",而來(lái)訪者主要在這個(gè)骨架內(nèi)填充內(nèi)容,影響的是個(gè)體差異而非整體結(jié)構(gòu)。這個(gè)發(fā)現(xiàn)對(duì)于實(shí)際部署AI對(duì)話系統(tǒng)很有參考價(jià)值:選擇哪個(gè)AI擔(dān)任回應(yīng)者,對(duì)系統(tǒng)性能的影響比選擇哪個(gè)AI擔(dān)任來(lái)訪者更關(guān)鍵。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
看到如今的伊朗,才懂左宗棠當(dāng)年多偉大!沒(méi)有他,西北或無(wú)險(xiǎn)可守

看到如今的伊朗,才懂左宗棠當(dāng)年多偉大!沒(méi)有他,西北或無(wú)險(xiǎn)可守

賤議你讀史
2026-04-17 01:48:21
降壓藥飯前吃還是飯后吃?再三提醒:牢記3個(gè)原則,否則等于白吃

降壓藥飯前吃還是飯后吃?再三提醒:牢記3個(gè)原則,否則等于白吃

DrX說(shuō)
2026-04-22 14:55:06
乘聯(lián)分會(huì):4月1-19日全國(guó)乘用車市場(chǎng)零售62.7萬(wàn)輛 同比下降26%

乘聯(lián)分會(huì):4月1-19日全國(guó)乘用車市場(chǎng)零售62.7萬(wàn)輛 同比下降26%

財(cái)聯(lián)社
2026-04-22 16:38:09
中國(guó)鐵礦石談判大獲全勝!“鎖喉”必和必拓:不降價(jià)?那就別賣了

中國(guó)鐵礦石談判大獲全勝!“鎖喉”必和必拓:不降價(jià)?那就別賣了

動(dòng)漫里的童話
2026-04-22 05:35:55
4月22日俄烏:兩個(gè)意義非凡的軍事行動(dòng)

4月22日俄烏:兩個(gè)意義非凡的軍事行動(dòng)

山河路口
2026-04-22 18:15:08
安徽省交通控股集團(tuán)有限公司黨委委員盛明宏接受審查調(diào)查

安徽省交通控股集團(tuán)有限公司黨委委員盛明宏接受審查調(diào)查

界面新聞
2026-04-22 17:07:51
4月21日俄烏最新:俄羅斯創(chuàng)造的神話

4月21日俄烏最新:俄羅斯創(chuàng)造的神話

西樓飲月
2026-04-21 20:24:18
五連敗切爾西徹底崩盤!主帥放豪言:6年合同在手,絕不下課!

五連敗切爾西徹底崩盤!主帥放豪言:6年合同在手,絕不下課!

田先生籃球
2026-04-22 06:57:15
連虧5年,越虧越多!知名超市學(xué)胖東來(lái)效果不佳,去年關(guān)店414家,巨虧9.57億元,最新市值僅35億元

連虧5年,越虧越多!知名超市學(xué)胖東來(lái)效果不佳,去年關(guān)店414家,巨虧9.57億元,最新市值僅35億元

每日經(jīng)濟(jì)新聞
2026-04-22 18:31:06
36億罰單背后,30名被開(kāi)除員工的代價(jià)

36億罰單背后,30名被開(kāi)除員工的代價(jià)

慕容律師
2026-04-21 22:31:56
穆鐵柱的最后一天:在家中蹬自行車健身,突然兩眼一黑癱倒在地

穆鐵柱的最后一天:在家中蹬自行車健身,突然兩眼一黑癱倒在地

大運(yùn)河時(shí)空
2026-04-21 16:30:03
曾經(jīng)那些真實(shí)的特供,超出普通人的想象…

曾經(jīng)那些真實(shí)的特供,超出普通人的想象…

深度報(bào)
2026-04-21 22:56:47
火箭丟了G2后,烏度卡全方位甩鍋,杜蘭特主動(dòng)攬責(zé),申京自我反思

火箭丟了G2后,烏度卡全方位甩鍋,杜蘭特主動(dòng)攬責(zé),申京自我反思

萌蘭聊個(gè)球
2026-04-22 17:47:03
2032奧運(yùn)主辦地確定,結(jié)果吃驚全球,奧運(yùn)格局將重塑

2032奧運(yùn)主辦地確定,結(jié)果吃驚全球,奧運(yùn)格局將重塑

天馬幸福的人生
2026-04-22 06:41:59
NBA官方:亞歷山大當(dāng)選年度最佳關(guān)鍵球員 多項(xiàng)關(guān)鍵數(shù)據(jù)聯(lián)盟第一

NBA官方:亞歷山大當(dāng)選年度最佳關(guān)鍵球員 多項(xiàng)關(guān)鍵數(shù)據(jù)聯(lián)盟第一

羅說(shuō)NBA
2026-04-22 06:18:26
炸翻全球軍界!沙特怒砸120億買斷中國(guó)神裝,美軍徹底被踢出局

炸翻全球軍界!沙特怒砸120億買斷中國(guó)神裝,美軍徹底被踢出局

風(fēng)信子的花
2026-04-21 14:31:44
男子買彩票中了5340萬(wàn) 偷偷轉(zhuǎn)給別的女人2100萬(wàn) 前妻起訴返還 法院判了

男子買彩票中了5340萬(wàn) 偷偷轉(zhuǎn)給別的女人2100萬(wàn) 前妻起訴返還 法院判了

閃電新聞
2026-04-21 10:35:14
當(dāng)年張柏芝抱著lucas后面居然是大s,到現(xiàn)在才發(fā)現(xiàn),真美呀

當(dāng)年張柏芝抱著lucas后面居然是大s,到現(xiàn)在才發(fā)現(xiàn),真美呀

可樂(lè)談情感
2026-04-22 00:14:41
解決掉提問(wèn)的人,問(wèn)題就解決了?北師大“神操作”火了

解決掉提問(wèn)的人,問(wèn)題就解決了?北師大“神操作”火了

虔青
2026-04-20 14:07:53
有錢真能改變?nèi)说纳顔峥淳W(wǎng)友講述父親有錢沒(méi)錢真實(shí)現(xiàn)狀,驚呆了

有錢真能改變?nèi)说纳顔峥淳W(wǎng)友講述父親有錢沒(méi)錢真實(shí)現(xiàn)狀,驚呆了

侃神評(píng)故事
2026-04-22 11:15:03
2026-04-22 19:40:49
科技行者 incentive-icons
科技行者
科技正在如何變革商業(yè)世界
8088文章數(shù) 562關(guān)注度
往期回顧 全部

科技要聞

對(duì)話梅濤:沒(méi)有視頻底座,具身智能走不遠(yuǎn)

頭條要聞

朝鮮發(fā)聲痛批日本 要求日本向中國(guó)道歉

頭條要聞

朝鮮發(fā)聲痛批日本 要求日本向中國(guó)道歉

體育要聞

網(wǎng)易傳媒再度簽約法國(guó)隊(duì)和阿根廷隊(duì)

娛樂(lè)要聞

復(fù)婚無(wú)望!baby黃曉明陪小海綿零交流

財(cái)經(jīng)要聞

伊朗拒絕出席 特朗普宣布延長(zhǎng)?;鹌谙?/h3>

汽車要聞

純電續(xù)航301km+激光雷達(dá) 宋Pro DM-i飛馳版9.99萬(wàn)起

態(tài)度原創(chuàng)

健康
本地
房產(chǎn)
公開(kāi)課
軍事航空

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

本地新聞

春色滿城關(guān)不住|白鵑梅浪漫盛放,吳山藏了一片四月雪

房產(chǎn)要聞

官宣!今年9月起,廣州中小學(xué)“重點(diǎn)班”將成歷史!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普宣布延長(zhǎng)?;?伊朗表態(tài)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版