国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

北大林宙辰團隊:從最優(yōu)傳輸角度訓(xùn)練時序預(yù)測模型 丨ICLR 2026

0
分享至


DistDF:從點對點誤差轉(zhuǎn)向聯(lián)合分布對齊,重構(gòu)時間序列預(yù)測的損失函數(shù)。

作者丨鄭佳美

編輯丨岑 峰

在時間序列預(yù)測研究中,一個耐人尋味的現(xiàn)象長期存在:

一方面,模型結(jié)構(gòu)不斷演進,從循環(huán)網(wǎng)絡(luò)到 Transformer,再到頻域與混合結(jié)構(gòu);另一方面,幾乎所有方法在訓(xùn)練階段依賴同一類損失函數(shù),即以均方誤差(MSE)為代表的點對點誤差。

這使得時間序列預(yù)測在方法論層面呈現(xiàn)出一種隱性的停滯,即研究重心持續(xù)向模型表達能力傾斜,而對損失函數(shù)所隱含的統(tǒng)計假設(shè)缺乏系統(tǒng)反思。

點對點誤差的核心假設(shè)在于,標(biāo)簽序列中的各時間步可被視為給定歷史條件下相互獨立的預(yù)測對象。然而,這一假設(shè)與時間序列數(shù)據(jù)的生成機制之間始終存在偏差。

真實世界中的時間序列由隨機過程演化而來,不同時間點之間存在顯著的相關(guān)關(guān)系。將多步預(yù)測問題拆解為一組獨立的回歸任務(wù),不可避免地為損失函數(shù)引入了結(jié)構(gòu)性偏差,使模型難以學(xué)習(xí)標(biāo)簽序列的整體形態(tài)、相關(guān)結(jié)構(gòu)以及條件依賴關(guān)系。

針對這一問題,北京大學(xué)林宙辰團隊深入剖析了此類結(jié)構(gòu)性偏差的成因。在此基礎(chǔ)上,團隊提出了 DistDF:一種通過聯(lián)合分布對齊訓(xùn)練預(yù)測模型的損失函數(shù)。DistDF 的提出不僅為時間序列預(yù)測提供了一種新的損失函數(shù)設(shè)計思路,也在更一般的意義上,對序列建模中“應(yīng)當(dāng)優(yōu)化什么”這一長期被忽視的問題給出了新的回答。


論文地址:https://arxiv.org/pdf/2510.24574v1

01


當(dāng)獨立性假設(shè)被實驗證偽之后

當(dāng)前時間序列預(yù)測領(lǐng)域的主流方法普遍采用逐時間點的均方誤差(MSE)作為損失函數(shù):

隱式地做了獨立性假設(shè):在給定歷史序列的條件下,標(biāo)簽序列各時間點的觀測相互獨立。然而,真實時間序列存在顯著的標(biāo)簽自相關(guān):標(biāo)簽序列各時間點的觀測往往存在顯著的相關(guān)性。因此,的獨立性假設(shè)與時間序列數(shù)據(jù)的生成機制相悖,導(dǎo)致其作為損失函數(shù)是有偏的(具體見定理1)。

[定理1]考慮單變量標(biāo)簽序列 ,其條件自相關(guān)矩陣為 ,則標(biāo)簽序列的實用負對數(shù)似然可表示為: 。顯然,僅當(dāng)是單位陣,即標(biāo)簽自相關(guān)不存在時,才有。

研究團隊通過實證分析驗證了這一矛盾:在給定歷史序列的條件下,標(biāo)簽序列仍呈現(xiàn)顯著的條件相關(guān)結(jié)構(gòu),從而在實證意義上證偽了獨立性假設(shè)。實驗進一步表明,即使采用頻域變換或主成分分解等標(biāo)簽變換方法,變換后的標(biāo)簽序列依然存在殘余相關(guān)性;因此,在變換后的標(biāo)簽應(yīng)用均方誤差作為損失函數(shù)仍會導(dǎo)致結(jié)構(gòu)性偏差。


02


DistDF:基于分布對齊的時間序列損失函數(shù)

為規(guī)避傳統(tǒng)方法中的獨立性假設(shè),DistDF 提出直接對齊預(yù)測序列的條件分布與真實標(biāo)簽的條件分布 。直觀上,該目標(biāo)可通過最小化兩個條件分布間的距離 來實現(xiàn)。

然而,直接將其作為損失函數(shù)面臨嚴重的樣本稀缺問題。對于給定的歷史序列 ,時間序列數(shù)據(jù)集通常僅包含唯一的標(biāo)簽序列 ,模型也僅產(chǎn)生單一預(yù)測 。這種“單樣本”情形導(dǎo)致直接估計條件分布距離 在統(tǒng)計上不可靠。

為解決這一難題,我們利用概率恒等式 。因為邊緣分布 是共享的,若聯(lián)合分布對齊,則條件分布必然對齊。基于此,我們將條件分布匹配問題轉(zhuǎn)化為聯(lián)合分布匹配問題。

進一步結(jié)合最優(yōu)傳輸理論,本文證明了聯(lián)合分布的 Wasserstein 距離構(gòu)成了條件分布 Wasserstein 距離期望的上界:

因此,通過最小化歷史-預(yù)測聯(lián)合分布 與歷史-標(biāo)簽聯(lián)合分布 之間的 Wasserstein 距離,可有效實現(xiàn)條件分布對齊,進一步實現(xiàn)預(yù)測模型的無偏訓(xùn)練。同時,這一轉(zhuǎn)換允許利用整個數(shù)據(jù)集的樣本來估計聯(lián)合分布距離,顯著提升了分布距離估計的可靠性。

DistDF 的實現(xiàn)流程如下:

首先,構(gòu)造聯(lián)合序列: 和 ;

接著,計算兩個聯(lián)合序列之間的Wasserstein距離: ,

最后,與 MSE 損失加權(quán)融合:

DistDF 作為模型無關(guān)的損失函數(shù),可適配各類預(yù)測模型架構(gòu)。

03


在大量實驗中,一致驗證優(yōu)勢

論文首先將DistDF與現(xiàn)有損失函數(shù)進行了比較,包括通過標(biāo)簽變換削弱標(biāo)簽相關(guān)性的 FreDF 和 Time-o1。結(jié)果表明,這些方法雖然減少了似然估計的偏差并提升了性能,但殘差偏差仍然存在,因此性能仍有改進空間。而DistDF通過最小化條件分布之間的距離,實現(xiàn)了預(yù)測模型的無偏訓(xùn)練,取得了最佳的預(yù)測性能。


其次,論文通過消融實驗對兩個關(guān)鍵因素進行了驗證;分別考察在DF的基礎(chǔ)上,僅對齊均值、僅對齊協(xié)方差以及同時對齊二者的情形。結(jié)果表明,兩種因素單獨對齊時均能帶來性能提升,而二者同時對齊時效果最為顯著。


接著,論文也對模型輸出的預(yù)測序列進行了可視化分析。結(jié)果表明,采用 DistDF 訓(xùn)練的模型能夠較好地跟隨序列中的突發(fā)變化,使得預(yù)測序列在整體形態(tài)上更加接近真實數(shù)據(jù)。這進一步表明,DistDF 的作用不僅體現(xiàn)在降低數(shù)值誤差上,更重要的是在訓(xùn)練過程中引導(dǎo)模型學(xué)習(xí)到了真實未來時間序列的整體分布形態(tài)。


最后,論文對DistDF與不同預(yù)測模型的兼容性進行了驗證。結(jié)果表明,無論模型本身的復(fù)雜度和建模方式如何,引入 DistDF 訓(xùn)練策略后,模型預(yù)測性能幾乎都能夠獲得進一步提升。這一結(jié)果表明,DistDF 的作用并非彌補模型結(jié)構(gòu)本身的不足,而是提供了更好的訓(xùn)練信號。


04


「多任務(wù)學(xué)習(xí)」需要分布對齊

整體來看,這項研究重新審視了多任務(wù)學(xué)習(xí)場景中的損失函數(shù)設(shè)計。研究團隊強調(diào):多任務(wù)學(xué)習(xí)的核心目標(biāo)不應(yīng)局限于對 T個標(biāo)簽的逐點建模,而應(yīng)轉(zhuǎn)向?qū)σ粋€在任務(wù)維度上具有內(nèi)在相關(guān)結(jié)構(gòu)的隨機過程進行整體建模。

在這一視角下,傳統(tǒng)損失函數(shù)(如MSE)隱含了“給定輸入條件下各任務(wù)標(biāo)簽相互獨立”的假設(shè),從而將一個高維、相關(guān)的隨機過程建模任務(wù)退化為一組彼此獨立的標(biāo)量回歸任務(wù)。因該假設(shè)忽略標(biāo)簽序列的內(nèi)生結(jié)構(gòu),這些損失函數(shù)往往是有偏的。

DistDF 通過將預(yù)測序列與真標(biāo)簽建模為概率分布,實現(xiàn)對任務(wù)維度上相關(guān)結(jié)構(gòu)的整體建模。通過優(yōu)化基于分布對齊的損失函數(shù),模型能夠顯式學(xué)習(xí)標(biāo)簽序列的整體形態(tài)、相關(guān)結(jié)構(gòu)以及條件依賴關(guān)系。

進一步看,該研究揭示的問題具有廣泛的普適性。只要學(xué)習(xí)任務(wù)的輸出構(gòu)成具有顯著相關(guān)性的序列(如語音、圖像、文本或用戶行為),若仍沿用基于獨立性假設(shè)的損失函數(shù)(如 MSE),則必然會引入結(jié)構(gòu)性偏差。因此,DistDF 所倡導(dǎo)的聯(lián)合分布對齊思想,不僅適用于時間序列預(yù)測,也同樣適用于語音合成、軌跡預(yù)測等任務(wù)。它并非針對時間序列任務(wù)的特定技巧,而是為多任務(wù)學(xué)習(xí)問題提供了一種更為通用的損失函數(shù)構(gòu)造范式。

05


作者信息

論文第一作者王浩,現(xiàn)為浙江大學(xué)控制學(xué)院博士研究生,研究方向聚焦于因果推斷、多任務(wù)學(xué)習(xí)技術(shù)及其在大語言模型中的應(yīng)用。2022 年- 2023 年,他曾在螞蟻金服、微軟亞洲研究院科研實習(xí),從事推薦系統(tǒng)理論研究。2025 年起,他在小紅書參加 RedStar 實習(xí)項目,進行大語言模型、可信獎勵模型領(lǐng)域的研究工作。


論文通訊作者林宙辰,現(xiàn)任北京大學(xué)智能學(xué)院、通用人工智能全國重點實驗室教授。他的研究領(lǐng)域包括機器學(xué)習(xí)和數(shù)值優(yōu)化。他已發(fā)表論文360余篇,谷歌學(xué)術(shù)引用超過42,000次。他是IAPR、IEEE、AAIA、CCF和CSIG會士,多次擔(dān)任CVPR、NeurIPS、ICML等會議的Senior Area Chair,現(xiàn)任ICML Board Member。


參考鏈接:https://zhouchenlin.github.io/

本工作得到了北京市科學(xué)技術(shù)委員會、中關(guān)村科技園區(qū)管理委員會的大力支持,在此深表感謝。

未經(jīng)「AI科技評論」授權(quán),嚴禁以任何方式在網(wǎng)頁、論壇、社區(qū)進行轉(zhuǎn)載!

公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時需標(biāo)注來源并插入本公眾號名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
2年慢老5個月!哈佛大學(xué)臨床證實:每天一片復(fù)合維生素,可顯著延緩衰老

2年慢老5個月!哈佛大學(xué)臨床證實:每天一片復(fù)合維生素,可顯著延緩衰老

醫(yī)諾維
2026-03-10 17:00:45
以色列特種兵深夜突襲慘敗,伊朗系成功伏擊,遠火轟擊F-35維修廠

以色列特種兵深夜突襲慘敗,伊朗系成功伏擊,遠火轟擊F-35維修廠

軍機Talk
2026-03-07 16:42:12
3-0脆??!上海豪華陣容現(xiàn)原形,遇強崩盤+教練死磕一套陣容太致命

3-0脆??!上海豪華陣容現(xiàn)原形,遇強崩盤+教練死磕一套陣容太致命

金毛愛女排
2026-03-10 21:13:30
兩會數(shù)說中國|一組數(shù)據(jù)看糧食安全“壓艙石”更堅實

兩會數(shù)說中國|一組數(shù)據(jù)看糧食安全“壓艙石”更堅實

新華社
2026-03-10 00:43:07
郭晶晶12歲女兒霍中妍火出圈!正臉照太驚艷,鵝蛋臉高鼻梁大眼睛

郭晶晶12歲女兒霍中妍火出圈!正臉照太驚艷,鵝蛋臉高鼻梁大眼睛

觀魚聽雨
2026-03-10 16:15:05
大消息!廣東,剛剛發(fā)布

大消息!廣東,剛剛發(fā)布

中國基金報
2026-03-10 19:47:05
《逐玉》注水風(fēng)波升級!315評論區(qū)淪陷,網(wǎng)友呼吁徹查造假亂象

《逐玉》注水風(fēng)波升級!315評論區(qū)淪陷,網(wǎng)友呼吁徹查造假亂象

萌神木木
2026-03-10 17:48:02
再漲20元,2026年-2030年養(yǎng)老金調(diào)整方向定了,超1.8億人受益

再漲20元,2026年-2030年養(yǎng)老金調(diào)整方向定了,超1.8億人受益

財話連篇
2026-03-09 23:17:37
1930年,37歲白崇禧和副官未婚妻生下長子,妻子直接殺了過來

1930年,37歲白崇禧和副官未婚妻生下長子,妻子直接殺了過來

史之銘
2026-03-10 17:55:32
場均22分又如何?走到哪都管不住下半身,這輩子都進不了國家隊了

場均22分又如何?走到哪都管不住下半身,這輩子都進不了國家隊了

弄月公子
2026-03-10 16:50:24
2026年醫(yī)保巨變,掛號少做這一步,每年幾千塊醫(yī)保全白交

2026年醫(yī)保巨變,掛號少做這一步,每年幾千塊醫(yī)保全白交

老特有話說
2026-03-10 15:30:08
大批量上市!“春季第一鮮”降價六成,清明節(jié)前最肥美→

大批量上市!“春季第一鮮”降價六成,清明節(jié)前最肥美→

上海嘉定
2026-03-10 07:36:36
騰訊QClaw官網(wǎng)上線:可一鍵部署“龍蝦”,兼容QQ、微信

騰訊QClaw官網(wǎng)上線:可一鍵部署“龍蝦”,兼容QQ、微信

PChome電腦之家
2026-03-09 14:37:39
男友父母1000萬全款買房,女友加名被拒退婚,網(wǎng)友:算盤打得太響

男友父母1000萬全款買房,女友加名被拒退婚,網(wǎng)友:算盤打得太響

川渝視覺
2026-03-10 21:05:58
最高院:民間借貸沒有借條只有轉(zhuǎn)賬記錄,能否證明存在借貸關(guān)系?

最高院:民間借貸沒有借條只有轉(zhuǎn)賬記錄,能否證明存在借貸關(guān)系?

周軍律師聊案子
2026-03-10 08:43:14
不敢回家!上海一業(yè)主實名舉報小區(qū)違建,自己和家人信息被泄露;被舉報人:你當(dāng)天投訴,10分鐘后我就知道了

不敢回家!上海一業(yè)主實名舉報小區(qū)違建,自己和家人信息被泄露;被舉報人:你當(dāng)天投訴,10分鐘后我就知道了

海峽網(wǎng)
2026-03-10 12:30:13
4月1號起,銀行存款10萬以上50萬以下的,這個消息一定要知道

4月1號起,銀行存款10萬以上50萬以下的,這個消息一定要知道

另子維愛讀史
2026-03-10 23:10:33
毛主席:晚年重用了這3個人物,從此徹底改寫了中國未來命運

毛主席:晚年重用了這3個人物,從此徹底改寫了中國未來命運

優(yōu)趣紀(jì)史記
2026-03-10 11:15:34
阿爾茨海默病者逐漸增多,醫(yī)生提醒:55歲后,盡量改掉6個壞習(xí)慣

阿爾茨海默病者逐漸增多,醫(yī)生提醒:55歲后,盡量改掉6個壞習(xí)慣

39健康網(wǎng)
2026-02-17 18:31:37
中概股集體高開,黃金白銀大漲!美防長稱將對伊朗發(fā)起“最高強度”打擊

中概股集體高開,黃金白銀大漲!美防長稱將對伊朗發(fā)起“最高強度”打擊

證券時報e公司
2026-03-10 22:30:27
2026-03-11 02:43:00
AI科技評論 incentive-icons
AI科技評論
點評學(xué)術(shù),服務(wù)AI
7111文章數(shù) 20739關(guān)注度
往期回顧 全部

科技要聞

全民"養(yǎng)蝦"背后:大廠集體下場瘋狂賣Token

頭條要聞

伊朗新最高領(lǐng)袖在襲擊中受傷未公開發(fā)表講話 官方回應(yīng)

頭條要聞

伊朗新最高領(lǐng)袖在襲擊中受傷未公開發(fā)表講話 官方回應(yīng)

體育要聞

加蘭沒那么差,但鱸魚會用嗎?

娛樂要聞

《逐玉》注水風(fēng)波升級!315評論區(qū)淪陷

財經(jīng)要聞

“龍蝦補貼”密集出爐 最高1000萬!

汽車要聞

MG4有SUV衍生 上汽乘用車多款新車規(guī)劃曝光

態(tài)度原創(chuàng)

時尚
家居
教育
房產(chǎn)
本地

看來看去這些才是適合普通人的穿搭!不花哨、不繁瑣,提氣質(zhì)

家居要聞

自然肌理 溫度質(zhì)感婚房

教育要聞

南京十三中發(fā)來邀請函!

房產(chǎn)要聞

信號!千億巨頭入局,三亞開啟新一輪大征拆!

本地新聞

云游中國|候鳥高顏值亮相!沉浸式打卡青海濕地

無障礙瀏覽 進入關(guān)懷版