国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

你的輸入,LLM一字未忘:Transformer被證明“幾乎處處可逆”

0
分享至

  

  來源:PaperWeekly

  人們一直以為,大模型的隱藏狀態(tài)是抽象的“語(yǔ)義壓縮”。但這篇論文發(fā)現(xiàn),Transformer 并沒有丟掉任何輸入信息——它能憑隱藏狀態(tài)精確反演出你說的每一個(gè)字。

  我們一直以為,語(yǔ)言模型的隱藏狀態(tài)是對(duì)輸入的一種“壓縮”或“抽象”。在這層抽象里,模型似乎丟掉了表面信息,只保留“語(yǔ)義精華”——這就是我們所說的“理解”。

  但這篇論文顛覆了這個(gè)想法。作者發(fā)現(xiàn),在標(biāo)準(zhǔn)的 Transformer 結(jié)構(gòu)下,模型的最后一 token 隱狀態(tài)幾乎必然能唯一確定輸入序列。

  換句話說,只要你知道這個(gè)隱藏狀態(tài),就能反推出原文。而且,這個(gè)性質(zhì)不僅在隨機(jī)初始化時(shí)成立,在整個(gè)訓(xùn)練過程中也不會(huì)被破壞。

  更令人震撼的是,他們沒有停留在數(shù)學(xué)證明,而是進(jìn)一步提出了一個(gè)實(shí)際算法——SipIt(Sequential Inverse Prompt via Iterative Updates)。它不需要任何外部模型訓(xùn)練,僅憑 Transformer 的隱藏狀態(tài),就能把輸入一個(gè) token 一個(gè) token 地完整還原。

  

  ▲圖1.Prompt 到 Latent Space 的單射映射:可視化 Transformer 將輸入映射到隱空間,并通過 SIPIT 完整反演。

  

  論文標(biāo)題:

  Language Models are Injective and Hence Invertible

  論文鏈接:

  https://www.arxiv.org/pdf/2510.15511

  

  研究背景:為什么單射性如此重要?

  在 Transformer 的每一層里,我們都能看到“似乎會(huì)丟信息”的環(huán)節(jié):LayerNorm 會(huì)重標(biāo)尺度,殘差連接可能抵消特征,注意力層還會(huì)把多個(gè) token 混合成一個(gè)上下文表示。這些操作看起來都不利于可逆性。

  然而作者從另一個(gè)角度切入——解析性(real-analyticity)。他們將 Transformer 視為從離散序列到連續(xù)表示的解析映射:

  

  這里 是輸入 token 序列, 是模型參數(shù), 是最后一 token 的隱藏狀態(tài)。

  作者進(jìn)一步形式化地指出,這個(gè)映射幾乎處處是單射的:

  

  也就是說,不同輸入序列映射到相同隱藏狀態(tài)的概率為零。解析函數(shù)的零點(diǎn)集要么處處為零,要么測(cè)度為零。這意味著,只要存在一個(gè)參數(shù)配置讓兩個(gè)不同輸入產(chǎn)生不同輸出,幾乎所有參數(shù)下都不會(huì)“撞車”。

  于是作者定義了一個(gè)碰撞檢測(cè)函數(shù):

  

  只要存在某個(gè) 讓 ,那就意味著“不同輸入映射成相同隱藏態(tài)”的概率為零。

  

  ▲圖2.零測(cè)集的可視化直覺:零點(diǎn)集合只形成細(xì)線(measure zero),說明碰撞幾乎不可能發(fā)生。

  他們進(jìn)一步證明:即使經(jīng)過有限步梯度下降,這種性質(zhì)仍然保持。因?yàn)閰?shù)更新:

  

  本身也是解析函數(shù),其雅可比行列式非零,不會(huì)把空間“壓塌”。更嚴(yán)格地,他們給出了如下結(jié)論:

  也就是說,在有限步梯度下降(步長(zhǎng) )后,模型依然保持輸入到隱藏空間映射的單射性。

  這表明,Transformer 的可逆性是整個(gè)訓(xùn)練過程的結(jié)構(gòu)性特征,而非偶然現(xiàn)象。

  

  方法:SipIt如何“倒放”Transformer?

  有了理論基礎(chǔ),作者提出了一個(gè)問題:

  如果隱藏狀態(tài)真的能唯一對(duì)應(yīng)輸入,我們能否直接把原文還原回來?

  他們的答案是——可以。

  核心思路

  作者定義了函數(shù) ,其中 表示前綴序列。也就是說,每個(gè)位置的隱藏狀態(tài)由前綴和當(dāng)前 token 唯一決定。

  因此,已知隱藏狀態(tài) ,我們可以遍歷詞表 ,尋找唯一滿足 的 token。只要找到這個(gè) token,就能確定當(dāng)前位置的輸入。

  

  ▲圖3.SIPIT 反演偽代碼:逐位反演輸入的迭代流程,僅依賴隱藏狀態(tài)即可完成重建。

  SipIt 基于這個(gè)原則逐位反演輸入:從第一個(gè) token 開始,對(duì)候選詞按策略遍歷,當(dāng)匹配的隱藏狀態(tài)落入允許的 ε 鄰域(ε-ball)時(shí)即接受,并進(jìn)入下一位。

  作者在文中指出:“在實(shí)踐中,我們接受那些觀測(cè)隱藏狀態(tài)位于預(yù)測(cè)值 ε 球鄰域內(nèi)的匹配結(jié)果?!?這種基于容差的檢查方式保證了算法在有限步內(nèi)收斂并找到唯一匹配。

  當(dāng)所有位置都驗(yàn)證完畢,SipIt 即可還原出完整輸入 。理論上時(shí)間復(fù)雜度為線性,最壞情況下也不超過 步,即保持線性時(shí)間復(fù)雜度(linear-time bound)。

  SipIt 把“單射性”從一個(gè)理論命題變成可操作事實(shí)——能否被 SipIt 完整反演,就是模型是否真正保留信息的實(shí)證檢測(cè)。

  

  實(shí)驗(yàn)結(jié)果:模型真的沒丟信息嗎?

  作者在 GPT-2 Small、Gemma-3、Llama-3.1、Mistral-7B、Phi-4-mini 等多種架構(gòu)上做了驗(yàn)證。他們?yōu)槊總€(gè)模型計(jì)算不同輸入的最后一 token 表示之間的最小 距離。

  結(jié)果顯示,所有最小距離都遠(yuǎn)高于 ,說明幾乎不存在碰撞。

  

  ▲圖4.不同層間的最小距離始終高于閾值,未出現(xiàn)重疊。

  

  ▲表1.不同模型的距離分布均明顯高于碰撞閾值

  極限窮舉測(cè)試:仍未出現(xiàn)碰撞

  為避免采樣偏差,作者挑出最相似的 10 對(duì)前綴,并窮舉詞表的所有接續(xù)組合——相當(dāng)于檢索上千億條輸入。即便在這個(gè)極端測(cè)試下,隱藏狀態(tài)的最小距離依然大于 0。

  

  ▲圖5. 在極限應(yīng)激測(cè)試下,所有最小距離仍遠(yuǎn)高于零

  他們還觀察了距離隨序列長(zhǎng)度變化的趨勢(shì):短句在前幾層迅速拉開間距,長(zhǎng)句則趨于穩(wěn)定。

  

  ▲圖6.短序列距離上升更快,長(zhǎng)序列趨于穩(wěn)定

  反演實(shí)驗(yàn):SipIt 的可行性驗(yàn)證

  在 GPT-2 Small 上,作者選取 100 條提示序列,僅使用隱藏狀態(tài)進(jìn)行反演。SipIt 實(shí)現(xiàn)了 100 % token-level 精確恢復(fù),反演耗時(shí)與序列長(zhǎng)度線性增長(zhǎng)。

  

  ▲表2. SipIt 在保持 100% 精度的同時(shí)速度領(lǐng)先百倍

  

  ▲圖7.反演耗時(shí)隨層深度緩慢上升,整體呈線性增長(zhǎng)

  

  總結(jié)

  這項(xiàng)研究并未改動(dòng)模型結(jié)構(gòu),卻動(dòng)搖了我們對(duì)“隱藏表示”的長(zhǎng)期假設(shè)。Transformer 的最后一 token 隱藏狀態(tài)在解析意義上幾乎處處可逆:不同輸入有不同表示,訓(xùn)練過程不會(huì)破壞這種區(qū)分性。

  SipIt 把理論轉(zhuǎn)化為工具——在不訓(xùn)練任何外部網(wǎng)絡(luò)的前提下,僅憑隱藏狀態(tài)就能線性時(shí)間重建原文。

  從科研角度,這為解釋 LLM 內(nèi)部表征提供了堅(jiān)實(shí)起點(diǎn);從工程角度,這提醒我們:緩存隱藏狀態(tài)等價(jià)于緩存用戶輸入,隱私治理必須覆蓋這一層;從方法論角度,它展示了一種范式——先證明結(jié)構(gòu),再把結(jié)構(gòu)做成算法。

  也許我們需要重新定義“理解”與“記憶”的界限。 至少?gòu)倪@篇論文的結(jié)果看——LLM 沒有忘記你說過的每一個(gè)字。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
真主黨表演“復(fù)仇”,以色列10分鐘將高層一鍋端

真主黨表演“復(fù)仇”,以色列10分鐘將高層一鍋端

難得君
2026-03-02 18:52:53
海瀾之家被“全軍拉黑”!中標(biāo)后拒簽合同,200億撐不起一單軍需

海瀾之家被“全軍拉黑”!中標(biāo)后拒簽合同,200億撐不起一單軍需

新浪財(cái)經(jīng)
2026-03-02 16:03:13
科威特“一戰(zhàn)封神”:擊落3架F-15!美軍司令部已承認(rèn)損失

科威特“一戰(zhàn)封神”:擊落3架F-15!美軍司令部已承認(rèn)損失

戰(zhàn)風(fēng)
2026-03-02 20:13:20
伊朗生死關(guān)頭,一個(gè)關(guān)鍵人物走向前臺(tái)……

伊朗生死關(guān)頭,一個(gè)關(guān)鍵人物走向前臺(tái)……

補(bǔ)壹刀
2026-03-02 16:08:19
8小時(shí)撤離德黑蘭,沈陽(yáng)男子講述離開伊朗細(xì)節(jié):當(dāng)?shù)貙?duì)中國(guó)人友好,3次盤問都順利放行

8小時(shí)撤離德黑蘭,沈陽(yáng)男子講述離開伊朗細(xì)節(jié):當(dāng)?shù)貙?duì)中國(guó)人友好,3次盤問都順利放行

瀟湘晨報(bào)
2026-03-02 19:49:19
民政部門正式公布:2026年3月30日起全國(guó)統(tǒng)一執(zhí)行,老墳有新規(guī)定

民政部門正式公布:2026年3月30日起全國(guó)統(tǒng)一執(zhí)行,老墳有新規(guī)定

南方健哥
2026-03-02 12:42:15
現(xiàn)實(shí)教訓(xùn)!重慶女子離婚無家可歸,抱娃跪求前任接盤,被連趕3次

現(xiàn)實(shí)教訓(xùn)!重慶女子離婚無家可歸,抱娃跪求前任接盤,被連趕3次

今朝牛馬
2026-03-02 21:27:47
再見,崔龍海!

再見,崔龍海!

IN朝鮮
2026-03-02 15:47:57
哈梅內(nèi)伊身亡現(xiàn)場(chǎng)照片曝光

哈梅內(nèi)伊身亡現(xiàn)場(chǎng)照片曝光

名人茍或
2026-03-02 10:37:43
明日元宵節(jié),“打死”都不能吃的6種食物,正月十五別犯忌諱

明日元宵節(jié),“打死”都不能吃的6種食物,正月十五別犯忌諱

阿天愛旅行
2026-03-03 01:06:22
剛剛,全線暴跌!緊急救市!

剛剛,全線暴跌!緊急救市!

中國(guó)基金報(bào)
2026-03-02 17:11:34
加水加糖加廢料,椰子水系統(tǒng)性摻假翻車!網(wǎng)友:真夠歹毒……

加水加糖加廢料,椰子水系統(tǒng)性摻假翻車!網(wǎng)友:真夠歹毒……

柴狗夫斯基
2026-03-02 10:46:05
川普活成自己最討厭的人,昔日數(shù)次預(yù)言?shī)W巴馬打伊朗:為挽回顏面與支持率

川普活成自己最討厭的人,昔日數(shù)次預(yù)言?shī)W巴馬打伊朗:為挽回顏面與支持率

不掉線電波
2026-03-02 11:07:35
央媽定調(diào)!4大板塊爆發(fā),超1.9萬(wàn)億資金托舉牛市

央媽定調(diào)!4大板塊爆發(fā),超1.9萬(wàn)億資金托舉牛市

慧眼看世界哈哈
2026-03-03 00:29:41
“斬首”行動(dòng)細(xì)節(jié)揭秘:美以戰(zhàn)機(jī)同地起飛,直撲哈梅內(nèi)伊

“斬首”行動(dòng)細(xì)節(jié)揭秘:美以戰(zhàn)機(jī)同地起飛,直撲哈梅內(nèi)伊

中國(guó)新聞周刊
2026-03-02 10:32:04
內(nèi)賈德沒有死,秘書公布遇襲細(xì)節(jié)

內(nèi)賈德沒有死,秘書公布遇襲細(xì)節(jié)

世家寶
2026-03-02 14:06:27
“研王爺來了”,復(fù)旦考生開出神級(jí)分?jǐn)?shù),網(wǎng)友:導(dǎo)師見你都得鎖門

“研王爺來了”,復(fù)旦考生開出神級(jí)分?jǐn)?shù),網(wǎng)友:導(dǎo)師見你都得鎖門

妍妍教育日記
2026-03-02 18:11:23
人沒本事,一看就知:沒本事的人,每到春節(jié),就會(huì)有3個(gè)通病

人沒本事,一看就知:沒本事的人,每到春節(jié),就會(huì)有3個(gè)通病

聚焦最新動(dòng)態(tài)
2026-02-28 09:53:49
伊朗貨幣一夜貶值97%,對(duì)普通人來說這否是時(shí)代的塵埃落在肩上?

伊朗貨幣一夜貶值97%,對(duì)普通人來說這否是時(shí)代的塵埃落在肩上?

聞號(hào)說經(jīng)濟(jì)
2026-03-02 17:08:38
首都機(jī)場(chǎng)漢服上崗驚艷全網(wǎng):這才是中國(guó)國(guó)門該有的模樣

首都機(jī)場(chǎng)漢服上崗驚艷全網(wǎng):這才是中國(guó)國(guó)門該有的模樣

魔都姐姐雜談
2026-03-02 15:36:47
2026-03-03 04:12:49
人工智能學(xué)家 incentive-icons
人工智能學(xué)家
人工智能領(lǐng)域權(quán)威媒體
4555文章數(shù) 37413關(guān)注度
往期回顧 全部

科技要聞

蘋果中國(guó)官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

特朗普:對(duì)伊朗打擊或持續(xù)4至5周 已擊沉其10艘艦艇

頭條要聞

特朗普:對(duì)伊朗打擊或持續(xù)4至5周 已擊沉其10艘艦艇

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對(duì)手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財(cái)經(jīng)要聞

油價(jià)飆升 美伊沖突將如何攪動(dòng)全球經(jīng)濟(jì)

汽車要聞

國(guó)民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

時(shí)尚
旅游
教育
房產(chǎn)
軍事航空

今年春天一定要擁有的4件衣服,太好看了!

旅游要聞

熱度飆升!非遺、冰雪…禹州元宵“文旅大餐”承包圓滿佳節(jié)!

教育要聞

3月13日截止!山東綜評(píng)云平臺(tái)填寫教程!有視頻!

房產(chǎn)要聞

方案突然曝光!??诒睅煷蟾叫?,又有書包大盤殺出!

軍事要聞

美國(guó)中央司令部透露對(duì)伊朗動(dòng)武全部武器裝備清單

無障礙瀏覽 進(jìn)入關(guān)懷版