国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

活久見,時代少年團(tuán)給大模型上了一課

0
分享至



機(jī)器之心編輯部

大模型「不認(rèn)識馬嘉祺」的原因,被 MiniMax 研究透了。

現(xiàn)在大家日常都在用 AI 大模型,要說 AI 的 bug,那雖然算不上層出不窮,但每一個都相當(dāng)奇葩,令人哭笑不得。

比如,DeepSeek V3.1 會在毫無預(yù)兆的地方塞一個「極」字,連英文輸出也逃不過,「極」變身「extreme」,在代碼里、試卷里、報告里神出鬼沒,被網(wǎng)友戲稱「極你太美 bug」。

GPT-5 系列迷上了哥布林 —— 不管你在聊相機(jī)還是寫財務(wù)報告,它都能不動聲色地在比喻里塞進(jìn)一只「哥布林」,OpenAI 工程師不得不在系統(tǒng)提示詞里手動寫下禁令:「永遠(yuǎn)不要談?wù)摳绮剂、小精靈、浣熊、巨魔、食人魔、鴿子……」。

豆包則在搜索清末民初大總統(tǒng)黎元洪時,給出了喜劇演員范偉的惡搞劇照 —— 因為當(dāng)年那張圖流傳太廣,互聯(lián)網(wǎng)上的玩梗內(nèi)容徹底壓過了真實歷史照片,AI 認(rèn)為范偉就是黎元洪。







多張圖,左右滑動查看

上面這些案例,大多可以歸結(jié)為臟數(shù)據(jù)污染、獎勵信號偏差、信息混淆之類的原因,屬于你能理解的錯誤。

但接下來要說的這個 bug 要更耐人尋味一些,它指向的是大模型深層的一個結(jié)構(gòu)問題。

AI 說不出他的名字

故事的起點,是時代少年團(tuán)隊長馬嘉祺。



圖源:小紅書

是的,你可能還記得,面對這位 2002 年出生的優(yōu)質(zhì)青年演員和新生代歌手,MiniMax-M2.5 就是無法說出他的名字。

然而有趣的是,并不是說模型完全不知道馬嘉祺是誰 —— 它知道但就是說不出。其具體表現(xiàn)為當(dāng)你問 AI「時代少年團(tuán)的隊長叫什么名字」,MiniMax-M2.5 模型支支吾吾,就是說不出來,甚至還會生編硬造一些人名,比如馬嘉軒、馬絲祺。

但如果你問它「時代少年團(tuán)是什么團(tuán)體?隊長有哪些經(jīng)歷?」它卻能給出正確又有條理的回答,包括出道時間、團(tuán)體角色、代表綜藝…… 唯獨回避了「馬嘉祺」這個名字本身。

就好像「馬嘉祺」這三個字符的組合被屏蔽了一樣,始終出不來。



實際上,人類自己有時候也會遇到這種情況,甚至還有個專門的心理學(xué)術(shù)語來描述:舌尖現(xiàn)象(tip-of-the-tongue phenomenon)。即知道某個詞,就是說不出口。



圖源:維基百科

只是沒想到,千億參數(shù)的大語言模型,也會精準(zhǔn)地復(fù)刻這種現(xiàn)象。

MiniMax M2.7 上線后,這個問題已經(jīng)被修復(fù),我們當(dāng)時還專門體驗報道過,參閱《剛剛,MiniMax 直接讓龍蝦學(xué)會自我進(jìn)化,也認(rèn)識「馬嘉祺」了》。但「馬嘉祺 bug」背后的機(jī)制,一直沒有被完整地揭開過。

直到昨天,MiniMax 工程團(tuán)隊發(fā)布了一篇詳細(xì)的內(nèi)部排查報告,把這個同時驚動了 AI 行業(yè)與娛樂圈的問題從頭到尾梳理了一遍。他們也「因禍得!,成了第一個搞清楚 AI 「理解≠生成」,提出可用修復(fù)方向的團(tuán)隊。



簡單來說,MiniMax 首先確認(rèn)他們的 M2.5 模型確實是認(rèn)識馬嘉祺的,而無法輸出其名字的原因是大模型在監(jiān)督微調(diào)(SFT)階段有一個隱蔽但讓人頭大的問題。

驗牌:不是 AI 不知道,是說不出來

首先是界定這個現(xiàn)象,MiniMax M2 系列模型在一些場景下無法正常輸出「馬嘉祺」。但從模型回答來看,它仍然掌握與之關(guān)聯(lián)的知識,例如能回答其所屬團(tuán)體、身份等信息。這意味著問題不在知識缺失,而更像是生成階段某個 token 無法被穩(wěn)定采樣出來。

在內(nèi)部復(fù)現(xiàn)后,MiniMax 發(fā)現(xiàn)這不是?個孤立的 case?除了「馬嘉祺」之外,還有一些其他低頻詞匯(如「王鶴」等)也存在類似現(xiàn)象。

壞了,必須趕緊排查解決。

那么是 Tokenizer(分詞器)切錯了嗎?

起初,很多人(包括社區(qū)開發(fā)者)猜測是預(yù)訓(xùn)練和推理時的切詞邏輯不一致導(dǎo)致的。工程師順著這個思路做了驗證:牌沒有問題!讣戊鳌勾_實是被合成為了一個獨立的 Token(ID=190467)。



檢查預(yù)訓(xùn)練模型的向量分布,發(fā)現(xiàn)它處于正常范圍。更有力證據(jù)的是,給這個 Token 尋找「語義近鄰」,模型能精準(zhǔn)召回「千璽」、「亞軒」等高度相關(guān)的中文人名 。這證明模型在預(yù)訓(xùn)練階段是完美掌握這個詞的。

使用早期的 Base 模型進(jìn)行 few-shot 引導(dǎo),模型能順利輸出「馬嘉祺」。但換成經(jīng)過 SFT 的后訓(xùn)練模型,卻依然回避這個詞。

Q: TFBOYS 的隊長是誰? A: TFBOYS 的隊長是王俊凱。 Q: 飛兒樂團(tuán)的主唱叫什么? A: 飛兒樂團(tuán)的主唱叫詹雯婷(Faye)。 Q: 時代少年團(tuán)的隊長是誰? A

結(jié)論有了:Tokenizer 沒問題,問題出在后訓(xùn)練(SFT)階段。工程師進(jìn)一步調(diào)查了后訓(xùn)練的數(shù)據(jù)分布,統(tǒng)計發(fā)現(xiàn),SFT 語料中包含「嘉祺」的樣本總共不足 5 條。

全網(wǎng)馬嘉祺的信息當(dāng)然不至于這么稀少,模型內(nèi)部發(fā)生了什么?檢查發(fā)現(xiàn),輸入端(vocab embedding)幾乎沒變,但是直接控制模型最終生成的輸出端(Im_head)卻發(fā)生了顯著偏移。

原因:竟是個「小語種」問題

既然 SFT 后模型仍然能理解問題,Transformer 中間層的大范圍語義能力退化就不是最可能的主因。文檔的排查重點轉(zhuǎn)向模型首尾兩端:輸入側(cè) vocab embedding 和輸出側(cè) lm_head。

這兩個部分是干什么用的?在大模型里,輸入層 Embedding 負(fù)責(zé)把人類語言翻譯成機(jī)器能懂的向量,而輸出層 lm_head 負(fù)責(zé)接收 AI 生成的抽象意圖,然后在幾十萬 token 組成的字庫里給每一個詞塊打分(計算概率),分?jǐn)?shù)最高的那個詞,就是 AI 吐出來的下一個字。

排查的結(jié)果很明顯:vocab embedding 幾乎不變,lm_head 變化顯著。

背后的原因不難理解,SFT 數(shù)據(jù)中「嘉祺」既然是個低頻出現(xiàn)的 token,embedding 層自然很難收到有效梯度更新,因此輸入側(cè)向量保持穩(wěn)定是合理的。但 lm_head 是模型把隱藏狀態(tài)映射回詞表概率的出口,它直接決定一個 token 能不能被生成出來。

工程師們發(fā)現(xiàn),「嘉祺」對應(yīng)的 lm_head 向量在 SFT 前后余弦相似度大幅下降,變化幅度在整個詞表中排名靠前。



更直觀的證據(jù)來自 lm_head 最近鄰結(jié)構(gòu)。預(yù)訓(xùn)練階段,「嘉祺」附近主要是中文人名,如「亞軒」「祺」「肖戰(zhàn)」「子怡」「霆鋒」「杰倫」等。SFT 之后,它的鄰域被大量特殊 token、tool call 標(biāo)記、文件編輯標(biāo)記和編碼噪聲污染,例如 、

等。

這說明輸出空間里的局部結(jié)構(gòu)被擠壓了:原本屬于人名 token 的位置,開始和大量無關(guān) token 混在一起

這也解釋了為什么模型會出現(xiàn)懂但說不出的狀態(tài)。模型內(nèi)部仍然可能形成了正確的語義意圖,但在最終輸出時,「嘉祺」這個 token 的 lm_head 方向已經(jīng)漂移,導(dǎo)致它的生成概率被壓低,或者被空間鄰近的錯誤 token 替代。

這種問題主要影響哪些詞匯?MiniMax 進(jìn)一步統(tǒng)計了 SFT 前后 lm_head 變化最大的 token 類別。除了 special tokens、LaTeX 標(biāo)記、網(wǎng)頁元數(shù)據(jù)、中文 SEO 垃圾詞之外,一個特別顯眼的類別是日文口語和網(wǎng)頁模板表達(dá),占比超過 40%。

這讓團(tuán)隊把稀疏 token 遺忘與「小語種混雜」聯(lián)系到了一起:如果 SFT 數(shù)據(jù)中某些語言 token 覆蓋不足,它們的 lm_head 表征就會漂移,既可能在該生成時生成不出來,也可能在不該出現(xiàn)時與其他語言 token 混淆。

修復(fù):答案默念 500 遍

找到根因之后,修復(fù)方案反而出奇地簡單直接:提高后訓(xùn)練階段的詞表覆蓋度。

MiniMax 的方法是:構(gòu)造一份「全詞表覆蓋合成數(shù)據(jù)」。把詞表里的 200064 個 token 隨機(jī)分批,每批約 8000 個,構(gòu)造一條對話樣本 ——query 是打亂后的詞列表加上「請重復(fù)以上內(nèi)容」的指令,answer 是原樣復(fù)制。如此循環(huán),總共只生成了約 500 條合成數(shù)據(jù),占總 SFT 數(shù)據(jù)量約 1%,確保每個 token 至少作為生成目標(biāo)出現(xiàn) 20 次。

這個設(shè)計就是在給每個 token 一個生成頻率的下限,像是在 SFT 階段給整個詞表做一次「保底校準(zhǔn)」:即便某些 token 在真實對話數(shù)據(jù)中極少出現(xiàn),也不會完全失去作為輸出目標(biāo)的訓(xùn)練信號。

效果如何呢?數(shù)據(jù)是最好的回答:

實驗對比中,日語對話混入俄語字符的概率,從 M2.7 的 47% 直接降至 1%。馬嘉祺可以被正常說出!笩o痛人流」、「據(jù)介紹」、「地稅」這些此前會被悄悄替換為錯誤 token 的詞組,全部恢復(fù)正常輸出。

更有說服力的是 lm_head cosine similarity 的定量結(jié)果。



500 條數(shù)據(jù),修好了 20 萬個詞的「生成能力遺忘」問題。

發(fā)現(xiàn):后訓(xùn)練數(shù)據(jù),太關(guān)鍵了

至此,一個出圈的八卦話題在工程的角度被解決了。

大模型的 tokenizer 通常來自大規(guī)模預(yù)訓(xùn)練語料,詞表里會包含大量長尾 token。預(yù)訓(xùn)練階段,這些 token 可能都被 AI 反復(fù)看過。但進(jìn)入后訓(xùn)練階段后,數(shù)據(jù)分布發(fā)生了劇烈變化,對話數(shù)據(jù)更干凈、更任務(wù)化,也更偏向常見表達(dá)。

結(jié)果就是,一些在預(yù)訓(xùn)練中學(xué)得不錯的 token,在后訓(xùn)練中長期沒有作為生成目標(biāo)出現(xiàn),最終在 lm_head 中發(fā)生方向漂移。

所以說,后訓(xùn)練數(shù)據(jù)的質(zhì)量不能光看任務(wù)類型、領(lǐng)域覆蓋和指令質(zhì)量,還要看更底層的 token。過去我們常說 SFT 會帶來災(zāi)難性遺忘,通常指的是能力或知識層面的退化,但「馬嘉祺」問題展示的是更細(xì)粒度的遺忘:模型沒有忘掉概念,卻忘掉了如何把某個 token 說出來。

當(dāng)然,上面的修復(fù)策略均作用于后訓(xùn)練階段,本質(zhì)上屬于事后補(bǔ)救措施。那么這個問題能根治嗎?

MiniMax 認(rèn)為,工程角度上后續(xù)可探索的方向包括混入少量預(yù)訓(xùn)練數(shù)據(jù)、針對低頻 token 定向合成樣本、建立 token 覆蓋度監(jiān)控機(jī)制,甚至通過詞表裁剪與繼續(xù)預(yù)訓(xùn)練重新對齊 embedding 空間。

但無論采用哪種方案,核心啟示都是一致的:不認(rèn)識「馬嘉祺」并不是一個孤立 bug,后訓(xùn)練不是簡單地把模型調(diào)得更會聊天,它也會重新塑造詞表輸出空間,只要后訓(xùn)練數(shù)據(jù)覆蓋不均勻,長尾 token 就可能在沉默中退化。

結(jié)語

提筆忘字,張嘴忘詞不是只有 MiniMax 才會發(fā)生的 bug,它很早就已經(jīng)出現(xiàn),只是最近才被 AI 圈外的人關(guān)注。

其實這個現(xiàn)象有一個名稱叫「Glitch Token」,不認(rèn)識馬嘉祺事件火了之前,人們在 ChatGPT、Qwen 上也發(fā)現(xiàn)過類似的問題,并對此進(jìn)行了一系列研究。在名人效應(yīng)的催更下,問題到了今天似乎可以說是告于段落。

不過仔細(xì)一想,這個稍微有些搞笑的 bug,也讓我們意外看到了 AI 大模型和人類的一點共同之處。

就像我們經(jīng)常一句話已經(jīng)到了嘴邊,卻發(fā)現(xiàn)怎么也想不起來要說什么。大模型的腦內(nèi)檢索也并非絕對精確,在漫長的記憶里不斷挑選時,某些細(xì)節(jié)偏差可能會被異常放大,某些路徑會突然坍縮,最終給你呈現(xiàn)出一點詭異的答案。

大模型的「理解」與「生成」本就是解耦的兩套參數(shù),它們在不同的訓(xùn)練階段以不同的方式更新,一旦后訓(xùn)練數(shù)據(jù)分布出現(xiàn)偏差,兩端就可能出現(xiàn)裂縫。

好消息是:裂縫被發(fā)現(xiàn)了,而且被仔細(xì)地記錄和修復(fù)了。這一次,是從一位追星粉絲的疑問出發(fā)的。

下一次,不知道會是誰先發(fā)現(xiàn)?

參考內(nèi)容:

https://www.zhihu.com/question/2017049686331127666/answer/2036149386116342692

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
長得太美被導(dǎo)演占為己有,25歲生下3個孩子,如今個個都給她爭光

長得太美被導(dǎo)演占為己有,25歲生下3個孩子,如今個個都給她爭光

真的八卦小學(xué)弟
2026-05-08 17:10:05
我們?yōu)榱藞A明園憋屈了一百多年,一鏟子挖出地下的降維打擊,真正的硬骨頭全在泥里

我們?yōu)榱藞A明園憋屈了一百多年,一鏟子挖出地下的降維打擊,真正的硬骨頭全在泥里

馬蹄燙嘴說美食
2026-05-09 04:34:47
為什么發(fā)達(dá)國家對中國都不友好?

為什么發(fā)達(dá)國家對中國都不友好?

新浪財經(jīng)
2026-05-04 07:26:54
特朗普心腹到訪北京,開口就要中國采購波音,王毅外長這次沒慣著

特朗普心腹到訪北京,開口就要中國采購波音,王毅外長這次沒慣著

一個有靈魂的作者
2026-05-08 17:01:13
中國永不破產(chǎn)的15家央企:一鐵、兩核、三航、四油、五電

中國永不破產(chǎn)的15家央企:一鐵、兩核、三航、四油、五電

蜉蝣說
2026-05-08 16:54:18
3.6萬公里外,兩瓦功率:中國科學(xué)家捅破了大氣層的“天花板”

3.6萬公里外,兩瓦功率:中國科學(xué)家捅破了大氣層的“天花板”

科學(xué)火箭叔
2026-04-04 20:50:06
眼紅!南寧一教師月薪14044元的截圖引熱議,網(wǎng)友:副高五級吧

眼紅!南寧一教師月薪14044元的截圖引熱議,網(wǎng)友:副高五級吧

火山詩話
2026-05-06 07:43:22
再爆冷!雨果0-3,法國隊大勝,5月10日凌晨王楚欽領(lǐng)銜戰(zhàn)勒布倫兄弟

再爆冷!雨果0-3,法國隊大勝,5月10日凌晨王楚欽領(lǐng)銜戰(zhàn)勒布倫兄弟

林子說事
2026-05-09 11:32:49
你發(fā)現(xiàn)了沒?在一個公司里但凡下屬和領(lǐng)導(dǎo)發(fā)生過一次正面沖突,不管誰對誰錯,但兩人的關(guān)系絕對不可能再像以前一樣

你發(fā)現(xiàn)了沒?在一個公司里但凡下屬和領(lǐng)導(dǎo)發(fā)生過一次正面沖突,不管誰對誰錯,但兩人的關(guān)系絕對不可能再像以前一樣

勵職派
2026-04-29 19:45:13
這就是烈士江姐的真實的樣貌,并非演員扮演,貨真價實的罕見照片

這就是烈士江姐的真實的樣貌,并非演員扮演,貨真價實的罕見照片

浩渺青史
2026-05-04 00:50:25
美媒終于意識到中國根本不期待特朗普訪華,早已不再仰視美國!

美媒終于意識到中國根本不期待特朗普訪華,早已不再仰視美國!

阿龍聊軍事
2026-05-09 11:34:16
“4只皮皮蝦1035元”店主事發(fā)次日病逝,年僅43歲;家人稱其有基礎(chǔ)病,事發(fā)前已腦出血,店鋪收到多起威脅電話,不打算繼續(xù)開業(yè)

“4只皮皮蝦1035元”店主事發(fā)次日病逝,年僅43歲;家人稱其有基礎(chǔ)病,事發(fā)前已腦出血,店鋪收到多起威脅電話,不打算繼續(xù)開業(yè)

揚(yáng)子晚報
2026-05-08 12:46:41
大搞權(quán)色錢色交易、利用職權(quán)為親屬吸收存款提供幫助,江西省政協(xié)原副主席胡幼桃被公訴

大搞權(quán)色錢色交易、利用職權(quán)為親屬吸收存款提供幫助,江西省政協(xié)原副主席胡幼桃被公訴

都市快報橙柿互動
2026-05-09 10:31:44
副總師說梟龍Block3不是終極版本,但改進(jìn)潛力被發(fā)動機(jī)鎖死了

副總師說梟龍Block3不是終極版本,但改進(jìn)潛力被發(fā)動機(jī)鎖死了

起喜電影
2026-05-09 11:50:02
“天下第一人”河北彩花出道8周年,2026年夏季相約臺北!

“天下第一人”河北彩花出道8周年,2026年夏季相約臺北!

吃瓜黨二號頭目
2026-05-09 10:07:58
五一各地旅游收入排名,河南381億第二,北京沒進(jìn)前五,第一是誰

五一各地旅游收入排名,河南381億第二,北京沒進(jìn)前五,第一是誰

丁丁鯉史紀(jì)
2026-05-07 14:04:42
與李榮浩的討伐風(fēng)波才結(jié)束,單依純再破天花板,讓整個娛圈沉默了

與李榮浩的討伐風(fēng)波才結(jié)束,單依純再破天花板,讓整個娛圈沉默了

何揎室內(nèi)設(shè)計
2026-05-09 05:34:00
張志坤:關(guān)于解放臺灣實現(xiàn)國家統(tǒng)一的若干意見(近2萬字長文)

張志坤:關(guān)于解放臺灣實現(xiàn)國家統(tǒng)一的若干意見(近2萬字長文)

秦安戰(zhàn)略
2026-05-09 11:58:24
日本可能與中國開戰(zhàn)?日專家:與中國發(fā)生沖突,最長只能堅持一周

日本可能與中國開戰(zhàn)?日專家:與中國發(fā)生沖突,最長只能堅持一周

原諒你
2026-05-09 10:54:00
中國對遼寧艦做了什么?為何俄海軍司令剛一登艦,頓時臉色大變

中國對遼寧艦做了什么?為何俄海軍司令剛一登艦,頓時臉色大變

蜉蝣說
2026-05-08 16:49:36
2026-05-09 14:00:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12955文章數(shù) 142646關(guān)注度
往期回顧 全部

科技要聞

美國政府強(qiáng)力下場 蘋果英特爾達(dá)成代工協(xié)議

頭條要聞

牛彈琴:全世界十分意外 俄烏戰(zhàn)場突然傳來兩個好消息

頭條要聞

牛彈琴:全世界十分意外 俄烏戰(zhàn)場突然傳來兩個好消息

體育要聞

成立128年后,這支升班馬首奪頂級聯(lián)賽冠軍

娛樂要聞

張藝謀《印象劉三姐》全裸鏡頭引爭議

財經(jīng)要聞

Meta瘋狂擁抱人工智能:員工苦不堪言

汽車要聞

軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

態(tài)度原創(chuàng)

家居
數(shù)碼
藝術(shù)
房產(chǎn)
教育

家居要聞

菁英人居 全能豪宅

數(shù)碼要聞

國產(chǎn)電視稱霸中國市場!三星、索尼等外資品牌合并份額不足3%

藝術(shù)要聞

齊白石 紫藤蜜蜂

房產(chǎn)要聞

豪擲6.8億拿地!何猷君大手筆投資三亞!

教育要聞

語法第6課-把句子套進(jìn)另一個句子里,變身“大名詞”

無障礙瀏覽 進(jìn)入關(guān)懷版