国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI用3年時(shí)光,來了解你!首個(gè)AI Clone長期記憶基準(zhǔn)

0
分享至


新智元報(bào)道

編輯:LRST

【新智元導(dǎo)讀】現(xiàn)有AI記憶評測存在局限,如數(shù)據(jù)源單一、忽視變化本質(zhì)、注入成本高等。CloneMem通過層次化生成框架構(gòu)建合成人生,設(shè)計(jì)貼近真實(shí)場景的評測任務(wù),涵蓋多種問題類型。實(shí)驗(yàn)發(fā)現(xiàn)簡單方法在檢索上更有效,復(fù)雜系統(tǒng)會丟失關(guān)鍵細(xì)節(jié),記憶系統(tǒng)應(yīng)保留細(xì)節(jié)和時(shí)間脈絡(luò),還原而非壓縮信息,以更好地理解人。

AI數(shù)字分身正在從科幻走向現(xiàn)實(shí)幫你回郵件、管理日程,甚至可以直接替你和別人coffee chat。

但問題是:AI如何深度了解并與你保持同步

不僅要「知道」你叫什么,住在哪里,喜歡聽什么音樂,喜歡吃什么,更要「持續(xù)了解」:這幾年你經(jīng)歷了什么、你的想法是如何一步步轉(zhuǎn)變的、為什么去年你想要跳槽,但今年卻想要留下。

這些,才真正定義了你是誰。

針對這一問題,開源學(xué)術(shù)社區(qū)QuantaAlpha聯(lián)合國內(nèi)外知名高校團(tuán)隊(duì)提出了CloneMem——首個(gè)專門評估AI Clone長期記憶能力的基準(zhǔn)測試,并提供了中英文雙語版本。


論文鏈接:https://arxiv.org/pdf/2601.07023

代碼數(shù)據(jù):https://github.com/AvatarMemory/CloneMemBench


AI Clone 應(yīng)用場景示意圖

人生的關(guān)鍵變化

往往不發(fā)生在聊天框里

現(xiàn)有AI記憶評測主要考察模型能否記住用戶與AI之間說過的話。但這套評測范式存在三個(gè)根本局限:

數(shù)據(jù)源單一。

僅依賴用戶與AI的對話記錄,而這些記錄往往只反映了生活中的某些片段。更關(guān)鍵的是,對話內(nèi)容高度依賴用戶主動表達(dá),本身就已經(jīng)經(jīng)過個(gè)人的二次敘述,很難還原一個(gè)人真實(shí)而連續(xù)的生活軌跡。

忽視「變化」的本質(zhì)。

現(xiàn)有基準(zhǔn)關(guān)注的是「AI 能否記住某個(gè)事實(shí)」,而非「AI 能否理解這個(gè)人是怎么一步步變成現(xiàn)在這樣的」——經(jīng)歷如何塑造情緒,情緒如何影響觀點(diǎn),觀點(diǎn)又如何左右選擇。

注入成本高。

想讓AI了解你,你得不斷主動和它聊。但誰有時(shí)間每天給AI寫日記?這種機(jī)制難以長期維持。


CloneMem與現(xiàn)有記憶評測基準(zhǔn)對比

數(shù)據(jù)怎么造?

層次化生成一個(gè)合成人生

真實(shí)用戶數(shù)據(jù)涉及隱私,研究團(tuán)隊(duì)設(shè)計(jì)了一套層次化生成框架:

宏觀層面,基于大五人格初始化人物設(shè)定,構(gòu)建職業(yè)、家庭、情緒、價(jià)值觀等長期人生弧線;中觀層面,將每個(gè)重大事件拆分為多個(gè)階段,維護(hù)內(nèi)部狀態(tài)快照(能量、壓力、情緒、關(guān)注焦點(diǎn)),狀態(tài)在階段間傳遞以保證連貫性;微觀層面,為每個(gè)階段生成具體事件,并同步產(chǎn)出日記、帖子、消息等多種媒介內(nèi)容。

這種自頂向下的設(shè)計(jì)確保了經(jīng)歷、情緒、觀點(diǎn)在長時(shí)間跨度上保持一致。


CloneMem 完整的數(shù)據(jù)構(gòu)建流程

面向真實(shí)交互場景的評測任務(wù)設(shè)計(jì)

CloneMem設(shè)計(jì)了一系列貼近真實(shí)使用場景的評測任務(wù)。所有問題都從「與AI Clone聊天的朋友」視角出發(fā),而不是系統(tǒng)自問自答。

提問者像現(xiàn)實(shí)中的熟人一樣,會在不同時(shí)間點(diǎn)向AI Clone詢問你的近況和想法。

更關(guān)鍵的是,這些問題不是集中在某一個(gè)時(shí)間段,而是貫穿在你完整的人生時(shí)間線上,這也就意味著模型需要在橫跨數(shù)年的日記、社交媒體、聊天記錄和郵件等多源記錄里,找到關(guān)鍵信息,并理解經(jīng)歷如何影響情緒,情緒如何塑造觀點(diǎn),觀點(diǎn)又如何推動選擇,才能做出正確的判斷。


CloneMem評測任務(wù)示例

CloneMem設(shè)計(jì)了7種問題類型,涵蓋了事實(shí)回憶、規(guī)律識別、變化對比、長期軌跡理解、因果推理、反事實(shí)推理,以及無法回答的情況。

而考慮到在真實(shí)場景下的開放式問答難度不低,CloneMem也為每道簡答題設(shè)計(jì)了對應(yīng)的選擇題版本,用來降低難度。

實(shí)驗(yàn)發(fā)現(xiàn)

簡單方法反超,復(fù)雜系統(tǒng)壓縮掉關(guān)鍵細(xì)節(jié)

研究團(tuán)隊(duì)從檢索能力、記憶有效性和回答一致性等多個(gè)維度,對Flat Retriever、A-MEM和Mem0三種記憶系統(tǒng)進(jìn)行了評估,結(jié)果卻有些出人意料。

在檢索層面,簡單方法反而更有效

在多數(shù)指標(biāo)上,最簡單的Flat Retriever表現(xiàn)最好。原因是抽象和總結(jié)雖然有助于搜索,但會損失細(xì)節(jié)保真度。而AI Clone任務(wù)高度依賴時(shí)間順序、原始表述、事件間的細(xì)微關(guān)聯(lián),而這些信息往往在摘要的過程中被壓縮掉了。


不同記憶系統(tǒng)的 QA 性能與記憶效用對比(Oracle 為使用真實(shí)上下文的上界)

在表征層面,記憶系統(tǒng)只記事件,而不記狀態(tài)

以老沈?yàn)槔,他正在?jīng)歷中年危機(jī),連續(xù)兩周在凌晨瀏覽招聘網(wǎng)站,搜索各種崗位信息。記憶系統(tǒng)非常誠實(shí)的記下了這些行為,但無法表征他還在猶豫,一份簡歷都沒投出去的狀態(tài)。

因此當(dāng)被問到老沈有沒有看重的公司時(shí),模型面對一堆求職相關(guān)的行為記錄,自然會腦補(bǔ)出老沈看重了幾家公司,然而實(shí)際上,他什么都沒有決定。

在生成層面,模型容易被敘事慣性所帶偏

即使檢索到了正確的信息,模型仍然傾向于套用高概率敘事模板,而并沒有依據(jù)事實(shí)證據(jù)。比如當(dāng)問老沈?yàn)槭裁丛敢庀蚱拮映ㄩ_心扉,正確答案是他意識到長期強(qiáng)撐正在傷害家庭,模型卻回答女兒的一幅畫觸動了他,這聽起來很合理,但證據(jù)完全對不上。

對記憶系統(tǒng)設(shè)計(jì)的啟示

CloneMem的實(shí)驗(yàn)結(jié)果指向一個(gè)核心問題:當(dāng)前的記憶系統(tǒng)把記住當(dāng)成了目標(biāo),但AI Clone真正需要的是還原。

這意味著記憶系統(tǒng)不能只做信息壓縮,而要保留原始表述和時(shí)間脈絡(luò);不能只記發(fā)生了什么事,還要能表征一個(gè)人正在經(jīng)歷什么階段;不能總是給出答案,而要在證據(jù)不足時(shí)學(xué)會說不知道。

換句話說,AI Clone的記憶不應(yīng)該是一個(gè)越壓越小的知識庫,而應(yīng)該是一個(gè)保留完整證據(jù)鏈的底座,因?yàn)槔斫庖粋(gè)人,靠的不是摘要,而是細(xì)節(jié)。

QuantaAlpha

QuantaAlpha成立于2025年4月,由來自國內(nèi)外知名院校的老師和學(xué)生組成,使命是探索智能的「量子」,引領(lǐng)智能體研究的「阿爾法」前沿,從CodeAgent到自進(jìn)化智能,再到金融與跨領(lǐng)域?qū)S弥悄荏w,致力于重塑人工智能的邊界。

2026年,研究團(tuán)隊(duì)將在CodeAgent、DeepResearch、Agent Memory、Agentic Reasoning/Agentic RL、自進(jìn)化與協(xié)同學(xué)習(xí)等方向持續(xù)產(chǎn)出高質(zhì)量研究成果,歡迎對我們方向感興趣的同學(xué)加入我們!


團(tuán)隊(duì)主頁:https://quantaalpha.github.io/

參考資料:

https://arxiv.org/pdf/2601.07023


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
紅薯立大功,醫(yī)生提醒:紅薯或?qū)@5種慢性病有好處,可常吃

紅薯立大功,醫(yī)生提醒:紅薯或?qū)@5種慢性病有好處,可常吃

健康之光
2026-01-21 12:50:02
重慶石柱縣委常委、縣政府常務(wù)副縣長冉啟明接受審查調(diào)查

重慶石柱縣委常委、縣政府常務(wù)副縣長冉啟明接受審查調(diào)查

界面新聞
2026-01-21 19:04:55
汪順代言舒膚佳只穿底褲.王楚欽代舒膚佳還戴圍巾裹的真嚴(yán)實(shí)!

汪順代言舒膚佳只穿底褲.王楚欽代舒膚佳還戴圍巾裹的真嚴(yán)實(shí)!

去山野間追風(fēng)
2026-01-21 13:24:15
華子38+8森林狼遭爵士大逆轉(zhuǎn) 喬治43分生涯新高弩機(jī)三雙

華子38+8森林狼遭爵士大逆轉(zhuǎn) 喬治43分生涯新高弩機(jī)三雙

醉臥浮生
2026-01-21 12:33:50
妻子照顧癱瘓公公13年,丈夫提離婚公公同意,可走出大門丈夫懵了

妻子照顧癱瘓公公13年,丈夫提離婚公公同意,可走出大門丈夫懵了

蘭姐說故事
2026-01-15 20:30:04
海馬斯運(yùn)輸黃了!長榮退單,咱海警的警告果然管用!

海馬斯運(yùn)輸黃了!長榮退單,咱海警的警告果然管用!

達(dá)文西看世界
2026-01-20 14:44:00
男足U23進(jìn)決賽!韓媒直呼瘋狂,李昊征服日媒,全平臺贊安東尼奧

男足U23進(jìn)決賽!韓媒直呼瘋狂,李昊征服日媒,全平臺贊安東尼奧

籃球資訊達(dá)人
2026-01-21 02:12:56
宗慶后母親去世,享年101歲,晚年瘦了太多,住大房子裝修豪華!

宗慶后母親去世,享年101歲,晚年瘦了太多,住大房子裝修豪華!

古希臘掌管松餅的神
2026-01-20 18:24:34
6-3!澳網(wǎng)最新戰(zhàn)報(bào):張之臻商竣程首盤大逆轉(zhuǎn),連贏5局沖第2輪!

6-3!澳網(wǎng)最新戰(zhàn)報(bào):張之臻商竣程首盤大逆轉(zhuǎn),連贏5局沖第2輪!

劉姚堯的文字城堡
2026-01-21 12:21:07
博主抱怨60歲的爸媽執(zhí)著于找一份工作,網(wǎng)友:我嫌棄50歲爸媽躺平

博主抱怨60歲的爸媽執(zhí)著于找一份工作,網(wǎng)友:我嫌棄50歲爸媽躺平

夜深愛雜談
2026-01-21 19:52:00
愛喝酒只是冰山一角,梁小龍去世后關(guān)門弟子曝壞習(xí)慣,都是催命符

愛喝酒只是冰山一角,梁小龍去世后關(guān)門弟子曝壞習(xí)慣,都是催命符

翰飛觀事
2026-01-19 19:26:49
剛剛,南師附中2025高考成績曝光!全國第一、全省第一!

剛剛,南師附中2025高考成績曝光!全國第一、全省第一!

南京擇校
2026-01-21 17:07:49
合資價(jià)格屠夫!全新東風(fēng)日產(chǎn)SUV NX8將于第一季度上市

合資價(jià)格屠夫!全新東風(fēng)日產(chǎn)SUV NX8將于第一季度上市

快科技
2026-01-21 17:02:14
21號收評:三大指數(shù)沖高回落,所有人都注意,大盤后市或?qū)⑦@樣走

21號收評:三大指數(shù)沖高回落,所有人都注意,大盤后市或?qū)⑦@樣走

春江財(cái)富
2026-01-21 15:26:21
中國終止越南核電站合作,十年投入成泡影,日本計(jì)劃落空

中國終止越南核電站合作,十年投入成泡影,日本計(jì)劃落空

聚焦真實(shí)瞬間
2026-01-21 08:04:16
中共中央批準(zhǔn),開除高以忱黨籍

中共中央批準(zhǔn),開除高以忱黨籍

新京報(bào)
2026-01-20 11:50:33
廣汽埃安N60實(shí)車亮相,全新純電SUV,軸距2775mm,配備激光雷達(dá)

廣汽埃安N60實(shí)車亮相,全新純電SUV,軸距2775mm,配備激光雷達(dá)

紅濤說車
2026-01-20 18:49:13
安徽反腐快訊:7人被查!一地兩名村干部同日被開除黨籍

安徽反腐快訊:7人被查!一地兩名村干部同日被開除黨籍

鳳凰網(wǎng)安徽
2026-01-21 18:24:03
包鋼板材廠爆炸事故造成10人死亡

包鋼板材廠爆炸事故造成10人死亡

新華社
2026-01-21 20:16:29
魯比奧輕飄飄一句話,斷了日本后路?高市決定:要對中國豁出去

魯比奧輕飄飄一句話,斷了日本后路?高市決定:要對中國豁出去

通文知史
2026-01-20 18:40:03
2026-01-21 20:51:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時(shí)代
14380文章數(shù) 66521關(guān)注度
往期回顧 全部

科技要聞

給機(jī)器人做仿真訓(xùn)練 這家創(chuàng)企年?duì)I收破億

頭條要聞

風(fēng)波中的西貝股權(quán)發(fā)生變化 新榮記張勇對賈國龍伸援手

頭條要聞

風(fēng)波中的西貝股權(quán)發(fā)生變化 新榮記張勇對賈國龍伸援手

體育要聞

只會防守反擊?不好意思,我們要踢決賽了

娛樂要聞

首位捐款的明星 苗圃現(xiàn)身嫣然醫(yī)院捐款

財(cái)經(jīng)要聞

丹麥打響第一槍 歐洲用資本保衛(wèi)格陵蘭島

汽車要聞

2026款上汽大眾朗逸正式上市 售價(jià)12.09萬起

態(tài)度原創(chuàng)

旅游
數(shù)碼
本地
親子
公開課

旅游要聞

免票!超值套票!伏羲山冰雪節(jié)全線優(yōu)惠上線!

數(shù)碼要聞

JBL琉璃扣耳夾耳機(jī)獲得PChome2025卓越創(chuàng)新美學(xué)設(shè)計(jì)獎

本地新聞

云游遼寧|漫步千年小城晨昏,“康”復(fù)好心情

親子要聞

奶奶想蒸饅頭小孫子不同意?7條狗3個(gè)窩排成排,狗媽媽挨個(gè)檢查

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版