国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

調(diào)整訓(xùn)練數(shù)據(jù)出場順序大模型就能變聰明!無需擴大模型/數(shù)據(jù)規(guī)模

0
分享至

DELT團隊 投稿
量子位 | 公眾號 QbitAI

模型訓(xùn)練重點在于數(shù)據(jù)的數(shù)量與質(zhì)量?其實還有一個關(guān)鍵因素——

數(shù)據(jù)的出場順序。

對此,微軟亞洲研究院提出了一種全新的文本數(shù)據(jù)組織范式DELT(Data Efficacy in LM Training),通過引入數(shù)據(jù)排序策略,充分挖掘訓(xùn)練數(shù)據(jù)潛力,在不同模型尺寸與規(guī)模下都達到了良好性能。



數(shù)據(jù)效率與效能提升

該方法用優(yōu)化訓(xùn)練數(shù)據(jù)的組織方式來讓語言模型學(xué)得更好,還不用增加數(shù)據(jù)量或擴大模型規(guī)模

來看看是怎么做到的。

訓(xùn)練樣本的組織順序很關(guān)鍵

首先,我們先來理清幾個概念。

在語言模型訓(xùn)練中,數(shù)據(jù)使用效率至關(guān)重要?,F(xiàn)有研究多關(guān)注于數(shù)據(jù)效率(Data Efficiency),即如何通過數(shù)據(jù)選擇提升模型訓(xùn)練效率并保持優(yōu)異性能。

然而,數(shù)據(jù)效能(Data Efficacy),即如何通過數(shù)據(jù)組織增強模型訓(xùn)練表現(xiàn),卻常常被忽視。

以烹飪?yōu)槔?,?shù)據(jù)效率就像在市場挑選新鮮、合適的食材,而數(shù)據(jù)效能則像名廚把握投放調(diào)料的時機與分寸,讓菜品發(fā)揮出最佳風(fēng)味。

數(shù)據(jù)組織的重要性

為了避免過擬合,當(dāng)前的大語言模型往往在海量數(shù)據(jù)上進行訓(xùn)練,并且訓(xùn)練的次數(shù)非常有限,甚至僅進行一次完整的訓(xùn)練周期(epoch=1),這與早期模型依賴多次迭代訓(xùn)練(epoch>>1)截然不同。

這些變化讓數(shù)據(jù)呈現(xiàn)的先后順序?qū)Y(jié)果影響巨大

早期的AI模型類似于讓學(xué)生多次反復(fù)翻閱同一本書,在多輪學(xué)習(xí)中慢慢補齊細節(jié);而現(xiàn)在更像只給一遍通讀,不再反復(fù)回看。

這就對閱讀順序提出了極高要求,必須精心規(guī)劃學(xué)習(xí)材料出現(xiàn)的先后和結(jié)構(gòu)。因此,訓(xùn)練樣本的組織順序顯得尤為關(guān)鍵。然而,關(guān)于這一點的研究卻很少。

基于此觀察,微軟亞洲研究院最新提出的文本數(shù)據(jù)組織范式DELT,通過引入數(shù)據(jù)排序策略,充分挖掘訓(xùn)練數(shù)據(jù)潛力,實現(xiàn)了數(shù)據(jù)的高效利用與效能提升。



DELT范式不但通過數(shù)據(jù)選擇提升效率,選取高質(zhì)量數(shù)據(jù),加快訓(xùn)練速度;

而且通過數(shù)據(jù)排序提升效能,在預(yù)訓(xùn)練和后訓(xùn)練階段都顯著提升了模型性能,且適用于通用、數(shù)學(xué)和代碼等多領(lǐng)域任務(wù)。

給模型按部就班安排訓(xùn)練課程
數(shù)據(jù)訓(xùn)練效能定義Data Efficacy

研究首先定義了數(shù)據(jù)訓(xùn)練效能(Data Efficacy),是指通過優(yōu)化訓(xùn)練數(shù)據(jù)的組織方式來最大化語言模型的性能表現(xiàn),而無需改變數(shù)據(jù)內(nèi)容或模型架構(gòu)。

與以往關(guān)注的“數(shù)據(jù)訓(xùn)練效率” (Data Efficiency) 側(cè)重數(shù)據(jù)篩選的研究目的不同,數(shù)據(jù)效能強調(diào)對訓(xùn)練數(shù)據(jù)的評分和排序,以充分挖掘數(shù)據(jù)的潛在價值。

數(shù)據(jù)順序在語言模型訓(xùn)練中的潛力尚未被充分挖掘, 數(shù)據(jù)效能旨在通過合理的數(shù)據(jù)組織方式,使模型在有限的訓(xùn)練數(shù)據(jù)和資源下實現(xiàn)更高的性能和泛化能力,成為提升語言模型性能的一種新興方法。

數(shù)據(jù)組織范式DELT介紹



DELT范式架構(gòu)

DELT(DataEfficacy inLMTraining)是一種創(chuàng)新的文本數(shù)據(jù)組織范式。

它集成了數(shù)據(jù)評分(Data Scoring)、數(shù)據(jù)選擇(Data Selection) 和數(shù)據(jù)排序(Data Ordering) 三大核心組件。

數(shù)據(jù)評分根據(jù)特定的屬性為每個樣本賦予分?jǐn)?shù),如:難度、質(zhì)量、多樣性等。

數(shù)據(jù)選擇通過評分篩選出最優(yōu)子集(如:top-k、按閾值篩選等),然后數(shù)據(jù)排序根據(jù)評分重新組織所選擇數(shù)據(jù)的呈現(xiàn)順序(如:基于課程學(xué)習(xí)的分?jǐn)?shù)從低到高排列)。 為了兼顧數(shù)據(jù)處理效率,DELT范式的數(shù)據(jù)選擇和數(shù)據(jù)排序共用數(shù)據(jù)評分的結(jié)果。

因此,數(shù)據(jù)評分的規(guī)則設(shè)置非常重要。于是,研究還提出了Learning-Quality Score(LQS)方法。



LQS打分方式

該數(shù)據(jù)評分方式結(jié)合了質(zhì)量可學(xué)習(xí)性兩個關(guān)鍵指標(biāo),不但可以篩選出低質(zhì)量數(shù)據(jù),而且也能捕捉數(shù)據(jù)在不同階段的訓(xùn)練價值,進一步提供了可靠的數(shù)據(jù)排列順序。

為了進一步提升數(shù)據(jù)效能,團隊還提出了一種全新的折疊排序方法Folding Ordering(FO)。

基于課程學(xué)習(xí)的排序(即,按分?jǐn)?shù)升序排序)可能導(dǎo)致模型遺忘和數(shù)據(jù)內(nèi)部分布偏差。

折疊排序策略通過多層“折疊”,將數(shù)據(jù)按分?jǐn)?shù)分層并多次采樣,無重復(fù)且均衡分布。



Folding排序方式

相比隨機打亂或單一排序,它既保留難度排序優(yōu)勢,又避免模型過度遺忘或依賴特定數(shù)據(jù),提升了魯棒性和泛化能力。

與傳統(tǒng)隨機排序方法相比,DELT范式不僅通過減小數(shù)據(jù)規(guī)模提升了訓(xùn)練效率;而且在不同模型尺寸和數(shù)據(jù)規(guī)模下,在各種評測集上都顯著提升了模型性能。



不同數(shù)據(jù)規(guī)模和模型尺寸下的結(jié)果

DELT給Data-centric AI領(lǐng)域帶來了全新思路。

看來,類比于人類教學(xué)實踐,講究個性化與按部就班地安排學(xué)習(xí)內(nèi)容,AI訓(xùn)練也需要類似的學(xué)習(xí)方法。

論文鏈接:https://arxiv.org/abs/2506.21545
代碼鏈接:https://github.com/microsoft/DELT

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“恨國女”許可馨:移民美國,已結(jié)婚,丈夫大量照片曝光遭質(zhì)疑

“恨國女”許可馨:移民美國,已結(jié)婚,丈夫大量照片曝光遭質(zhì)疑

小熊侃史
2025-12-20 10:53:55
2億人在喊:自己交100%的錢,只能拿40%?靈活就業(yè)社保該動真格了

2億人在喊:自己交100%的錢,只能拿40%?靈活就業(yè)社保該動真格了

老特有話說
2025-12-19 21:22:11
外交部長和國防部長如果通報被免職,意味著什么?

外交部長和國防部長如果通報被免職,意味著什么?

李昕言溫度空間
2025-12-20 19:00:33
一涉腐干部被查扣各類人民幣479捆,法院掛拍萬余張舊版2元面值人民幣,起拍價20余萬元

一涉腐干部被查扣各類人民幣479捆,法院掛拍萬余張舊版2元面值人民幣,起拍價20余萬元

極目新聞
2025-12-19 20:58:00
成都私人影院被曝涉“有償陪侍” 記者探訪:涉事門店已暫停經(jīng)營,警方介入調(diào)查

成都私人影院被曝涉“有償陪侍” 記者探訪:涉事門店已暫停經(jīng)營,警方介入調(diào)查

封面新聞
2025-12-20 19:21:27
南博驚天丑聞被扒!90年代的保管員監(jiān)守自盜19件藏品,被依法處決

南博驚天丑聞被扒!90年代的保管員監(jiān)守自盜19件藏品,被依法處決

火山詩話
2025-12-20 16:02:06
要解開南京博物院捐贈之謎,建議先查清這神秘的兩個人

要解開南京博物院捐贈之謎,建議先查清這神秘的兩個人

李老逵亂擺龍門陣
2025-12-20 10:54:00
必勝客被查!

必勝客被查!

魯中晨報
2025-12-20 17:49:04
北京阿姨20年守茅臺股票:90萬本金,分紅326萬,成本歸零!

北京阿姨20年守茅臺股票:90萬本金,分紅326萬,成本歸零!

趣文說娛
2025-12-20 18:29:20
泰方點名調(diào)查柬“生命研究中心”,湘雅醫(yī)院火速撇清:從未合作

泰方點名調(diào)查柬“生命研究中心”,湘雅醫(yī)院火速撇清:從未合作

胡嚴(yán)亂語
2025-12-20 16:13:32
突發(fā)!左膝半月板撕裂+缺陣4-5周,完犢子了,這還咋交易?

突發(fā)!左膝半月板撕裂+缺陣4-5周,完犢子了,這還咋交易?

球童無忌
2025-12-20 13:27:27
克林頓罕見強硬發(fā)聲:這不是烏克蘭的戰(zhàn)爭,而是美國的戰(zhàn)爭!

克林頓罕見強硬發(fā)聲:這不是烏克蘭的戰(zhàn)爭,而是美國的戰(zhàn)爭!

老馬拉車莫少裝
2025-12-20 14:50:21
【獨家】小米給全國汽車經(jīng)銷商發(fā)超一億元“紅包”

【獨家】小米給全國汽車經(jīng)銷商發(fā)超一億元“紅包”

界面新聞
2025-12-20 12:27:14
重慶交通大學(xué)原副校長張尚毅被“雙開”:違規(guī)占用學(xué)校公房歸個人使用

重慶交通大學(xué)原副校長張尚毅被“雙開”:違規(guī)占用學(xué)校公房歸個人使用

界面新聞
2025-12-20 20:08:38
電信董事長估計要失眠了,惹誰不好,偏偏惹了最叛逆的羅永浩!

電信董事長估計要失眠了,惹誰不好,偏偏惹了最叛逆的羅永浩!

荊楚寰宇文樞
2025-12-19 23:04:03
終于官宣!老年證將全面作廢,以后坐公交逛公園就用它

終于官宣!老年證將全面作廢,以后坐公交逛公園就用它

陳博世財經(jīng)
2025-12-20 14:27:24
抖音每年三千萬中標(biāo),咪咕5年16億報價被拒絕,CBA這波操作太魔幻

抖音每年三千萬中標(biāo),咪咕5年16億報價被拒絕,CBA這波操作太魔幻

姜大叔侃球
2025-12-20 12:18:17
73歲普京罕見回應(yīng)感情生活,承認正在戀愛中!信息量很大......

73歲普京罕見回應(yīng)感情生活,承認正在戀愛中!信息量很大......

新民周刊
2025-12-20 17:10:52
濟南一對母女黃河岸邊失聯(lián)超40天,搜索范圍擴大至黃河入???,丈夫:妻子性格大大咧咧,失聯(lián)前無異常

濟南一對母女黃河岸邊失聯(lián)超40天,搜索范圍擴大至黃河入???,丈夫:妻子性格大大咧咧,失聯(lián)前無異常

極目新聞
2025-12-20 11:55:28
實探廣州玩具城:李嘉誠15億投資,如今荒涼像“鬼城”

實探廣州玩具城:李嘉誠15億投資,如今荒涼像“鬼城”

樓市滅霸
2025-12-19 19:11:22
2025-12-20 20:48:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11884文章數(shù) 176340關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

司機稱轎車剎車失靈狂奔490公里 網(wǎng)友質(zhì)疑"自導(dǎo)自演"

頭條要聞

司機稱轎車剎車失靈狂奔490公里 網(wǎng)友質(zhì)疑"自導(dǎo)自演"

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂要聞

2026央視跨年晚會陣容曝光,豪華陣仗

財經(jīng)要聞

求解“地方財政困難”

汽車要聞

嵐圖推進L3量產(chǎn)測試 已完成11萬公里實際道路驗證

態(tài)度原創(chuàng)

親子
教育
藝術(shù)
數(shù)碼
家居

親子要聞

帶媽媽和三寶來吃中餐自助,艾莉拿起包子就是造,香到心坎里了!

教育要聞

今年難度小于去年!不過剛走出考場,這件事千萬不要做!

藝術(shù)要聞

Licio Passon:當(dāng)代意大利畫家

數(shù)碼要聞

盧偉冰今晚直播:小米17 Ultra超前劇透 不怕“泄密”

家居要聞

高端私宅 理想隱居圣地

無障礙瀏覽 進入關(guān)懷版