国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

金魚損失隨機剔除token,讓AI不再死記硬背

0
分享至

henry 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

訓(xùn)練大模型時,有時讓它“記性差一點”,反而更聰明!

大語言模型如果不加約束,很容易把訓(xùn)練數(shù)據(jù)原封不動地復(fù)刻出來。為解決這個問題,來自馬里蘭大學(xué)、圖賓根大學(xué)和馬普所的研究團隊提出了一個新方法——金魚損失(Goldfish Loss)



顧名思義,金魚損失就是讓模型像金魚一樣,不去死記每一個細節(jié),而是在損失函數(shù)計算時隨機剔除一小部分token。

由此,模型不再逐字記住訓(xùn)練集內(nèi)容,但仍能學(xué)會語言規(guī)律。

實驗顯示,LLaMA-2在使用金魚損失后:

  • 記憶化內(nèi)容顯著減少:模型不再復(fù)現(xiàn)訓(xùn)練數(shù)據(jù)
  • 下游任務(wù)性能幾乎不受影響:仍然能流暢生成文本

用網(wǎng)友的精辟評論概括就是:dropout,但損失函數(shù)!



在梯度計算中隨機屏蔽部分token

金魚損失的核心理念非常簡單,就是在模型訓(xùn)練過程中隨機剔除一部分訓(xùn)練文本中的tokens,使其不參與損失計算。

這樣一來,當(dāng)模型在推理階段遇到這些位置時,就只能“猜測”,而不是逐字逐句復(fù)現(xiàn)訓(xùn)練數(shù)據(jù)的完整序列。

此外,為了保證被剔除token的一致性,研究人員設(shè)計了一種基于哈希(hashing)的掩碼策略。



那么,這和同樣是防止模型背會的正則化方法有什么不同呢?

Dropout這樣的正則化方法為例,它通過在訓(xùn)練時“加噪聲”來防止模型過度依賴某些參數(shù),從而提高模型舉一反三的能力。

但這樣做的問題在于:如果只是隨機丟token,那么,每次看到同一段落時,丟掉的地方不一樣,模型累計幾次就能拼湊出完整段落。

所以,說到底,模型還是靠死記硬背,記住了答案。

相比之下,金魚損失則用哈希掩碼確保每次遇到同一段落,掩蓋位置都一樣,這就從根本上阻止了模型復(fù)現(xiàn)完整訓(xùn)練文本。

接下來,我們來看金魚損失具體是怎么做的。

在傳統(tǒng)的next-token prediction中,模型以序列中的下一個真實token作為目標,輸出預(yù)測分布,并基于該分布計算交叉熵損失。



在金魚損失下,模型雖然也在前向傳播中預(yù)測序列里下一個 token。但在計算損失時,會以一定的概率將某些位置的token從損失計算里“抹掉”。

也就是說,有些真實的下一個token不會作為目標來訓(xùn)練。



在這里,研究人員采用了簡單的靜態(tài)掩碼(static mask),剔除每序列中的第4個token。

更進一步,為了確保模型不會從其他地方學(xué)到被掩碼的數(shù)據(jù)(例如不同的文檔會在不同的網(wǎng)頁中反復(fù)出現(xiàn)),研究團隊還提出了一種局部化哈希掩碼(localized hashed mask),使得當(dāng)相同的前h個token出現(xiàn)時,掩蓋模式是相同的(可重復(fù))。

實驗測試與結(jié)果

為了驗證金魚損失確實能防止記憶化,研究團隊設(shè)計了兩種實驗場景:

一種是極端場景,通過對少量樣本進行多個訓(xùn)練周期(即重復(fù))來強烈促使記憶化;

另一種是標準場景,模擬現(xiàn)實模型訓(xùn)練中使用的批次處理方式 。

同時,為了評估模型的記憶化程度,研究采用了以下指標:

  • RougeL得分:該指標衡量最長公共(非連續(xù))子序列的長度 。得分為1.0表示完美記憶 。
  • 精確匹配率(Exact Match):該指標衡量正確預(yù)測的序列占真實序列的百分比.

實驗表明,在極端場景下,標準訓(xùn)練導(dǎo)致模型逐字記憶了100篇文章中的84篇,而金魚損失沒有記憶任何文章



(注:實驗讓LLaMA-2-7B在《哈利·波特》第一章或100篇維基百科文檔上進一步訓(xùn)練了100個epoch)

此外,在標準訓(xùn)練場景下,金魚損失也明顯減少了模型逐字復(fù)現(xiàn)訓(xùn)練語料庫中目標序列的情況。



但這里可能有個直覺式的反應(yīng)——如果讓模型“隨機漏學(xué)”一些token,它的能力會不會也隨之降低呢?

對此,研究人員進行了測試:研究表明,金魚損失模型、標準損失模型和對照模型之間的總體性能沒有系統(tǒng)性差異。



需要注意的是,金魚損失的核心在于忽略部分token的梯度計算。因此,為了學(xué)到足夠的語言模式,模型必須通過更多數(shù)據(jù)來補償這些空缺,這可能導(dǎo)致計算效率的下降。

[1]https://arxiv.org/pdf/2406.10209

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
汪小菲又上臺灣新聞!個人言行上升到“挑釁”的高度!日子不好過

汪小菲又上臺灣新聞!個人言行上升到“挑釁”的高度!日子不好過

小娛樂悠悠
2026-02-22 12:29:04
3:1,立陶宛要與中國對抗到底!

3:1,立陶宛要與中國對抗到底!

達文西看世界
2026-02-23 20:08:02
吳亦凡二審維持原判13年,只能繼續(xù)當(dāng)班長,網(wǎng)友神評論笑死人

吳亦凡二審維持原判13年,只能繼續(xù)當(dāng)班長,網(wǎng)友神評論笑死人

呱呱請你吃瓜
2026-02-02 19:51:43
A股開門紅!要戳破了!歷史會重演?

A股開門紅!要戳破了!歷史會重演?

龍行天下虎
2026-02-25 00:04:37
原來20塊就能解決的小問題,我竟忍了好幾年!

原來20塊就能解決的小問題,我竟忍了好幾年!

小熊侃史
2026-02-21 11:14:24
特斯拉新車現(xiàn)身官網(wǎng),內(nèi)飾終于升級!

特斯拉新車現(xiàn)身官網(wǎng),內(nèi)飾終于升級!

花果科技
2026-02-24 13:23:09
美媒:中國首艘09V型核動力攻擊潛艇現(xiàn)身渤海,搭載全新X型尾舵

美媒:中國首艘09V型核動力攻擊潛艇現(xiàn)身渤海,搭載全新X型尾舵

百科密碼
2026-02-23 16:23:49
61歲男子,堅持餓肚子不吃晚飯,6個月之后,血糖和體重情況如何

61歲男子,堅持餓肚子不吃晚飯,6個月之后,血糖和體重情況如何

蜉蝣說
2026-02-03 15:04:01
國軍中將被俘后桀驁不馴,見陳賡后卻立正鞠躬,尊稱“陳大哥”

國軍中將被俘后桀驁不馴,見陳賡后卻立正鞠躬,尊稱“陳大哥”

犟種美食
2026-02-25 01:48:34
馬筱梅說出玥兒箖箖不能回北京上學(xué)原因,表示老三會在北京上學(xué)

馬筱梅說出玥兒箖箖不能回北京上學(xué)原因,表示老三會在北京上學(xué)

到此為止的印象
2025-12-31 03:40:43
程瀟:這姐一直都是,洶涌澎湃的

程瀟:這姐一直都是,洶涌澎湃的

手工制作阿殲
2026-02-06 11:10:47
全新寶馬X5豎腎格柵引戰(zhàn) 投票能左右設(shè)計師想法嗎?

全新寶馬X5豎腎格柵引戰(zhàn) 投票能左右設(shè)計師想法嗎?

自主汽車
2026-02-24 22:36:48
藍月的傳承:瓜迪奧拉如果離開,他會是曼城新的“接班人”么

藍月的傳承:瓜迪奧拉如果離開,他會是曼城新的“接班人”么

里芃芃體育
2026-02-24 05:00:03
皇馬赫伊森辱華僅微博道歉?全球裝死撕裂二十年中國球迷信仰

皇馬赫伊森辱華僅微博道歉?全球裝死撕裂二十年中國球迷信仰

落夜足球
2026-02-24 23:09:12
監(jiān)控拍下催淚一幕:初一院子擠滿43人,初五只剩奶奶獨自目送

監(jiān)控拍下催淚一幕:初一院子擠滿43人,初五只剩奶奶獨自目送

朗威談星座
2026-02-25 01:51:50
17歲媽祖女孩口碑反轉(zhuǎn)!被扒曾帶貨,說不巡游又反悔,家人蠻橫!

17歲媽祖女孩口碑反轉(zhuǎn)!被扒曾帶貨,說不巡游又反悔,家人蠻橫!

古希臘掌管松餅的神
2026-02-24 16:40:56
荷蘭沒回頭路了!中國子公司宣布:正式換國內(nèi)供應(yīng)商,不再合作!

荷蘭沒回頭路了!中國子公司宣布:正式換國內(nèi)供應(yīng)商,不再合作!

通鑒史智
2026-02-24 14:19:15
駐日武官王慶簡:為日本潛伏20年出賣軍事機密,卻因一動作暴露身份

駐日武官王慶簡:為日本潛伏20年出賣軍事機密,卻因一動作暴露身份

睡前講故事
2026-02-03 20:55:43
王楚然一臉懵不像演的!春晚這幕太真實,全網(wǎng)笑瘋

王楚然一臉懵不像演的!春晚這幕太真實,全網(wǎng)笑瘋

觀察鑒娛
2026-02-18 17:56:43
新年第一刀!三甲院長、博導(dǎo)被雙開,“保姆式腐敗”撕開遮羞布

新年第一刀!三甲院長、博導(dǎo)被雙開,“保姆式腐敗”撕開遮羞布

醫(yī)脈圈
2026-02-23 20:04:18
2026-02-25 03:08:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12196文章數(shù) 176392關(guān)注度
往期回顧 全部

科技要聞

宇樹科技發(fā)布四足機器人Unitree As2

頭條要聞

男子摟住繼女強吻動作親密 當(dāng)?shù)貗D聯(lián)介入

頭條要聞

男子摟住繼女強吻動作親密 當(dāng)?shù)貗D聯(lián)介入

體育要聞

蘇翊鳴總結(jié)米蘭征程:我仍是那個熱愛單板滑雪的少年

娛樂要聞

汪小菲官宣三胎出生:承諾會照顧好3個孩子

財經(jīng)要聞

縣城消費「限時繁榮」了十天

汽車要聞

入門即滿配 威蘭達AIR版上市 13.78萬元起

態(tài)度原創(chuàng)

健康
家居
親子
旅游
教育

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

家居要聞

本真棲居 愛暖伴流年

親子要聞

如果你們生在清朝,可能都是特權(quán)階級了

旅游要聞

避寒+冰雪雙爆!5.96億人出游,解鎖新春新玩法

教育要聞

馬馬馬上上岸!!!TTS《大吉大利復(fù)試手冊》+復(fù)試班:紙質(zhì)筆記與1v1模擬面試堂堂上線!!

無障礙瀏覽 進入關(guān)懷版