国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

你的輸入,LLM一字未忘:Transformer被證明“幾乎處處可逆”

0
分享至

  

  來源:PaperWeekly

  人們一直以為,大模型的隱藏狀態(tài)是抽象的“語義壓縮”。但這篇論文發(fā)現(xiàn),Transformer 并沒有丟掉任何輸入信息——它能憑隱藏狀態(tài)精確反演出你說的每一個字。

  我們一直以為,語言模型的隱藏狀態(tài)是對輸入的一種“壓縮”或“抽象”。在這層抽象里,模型似乎丟掉了表面信息,只保留“語義精華”——這就是我們所說的“理解”。

  但這篇論文顛覆了這個想法。作者發(fā)現(xiàn),在標準的 Transformer 結構下,模型的最后一 token 隱狀態(tài)幾乎必然能唯一確定輸入序列。

  換句話說,只要你知道這個隱藏狀態(tài),就能反推出原文。而且,這個性質(zhì)不僅在隨機初始化時成立,在整個訓練過程中也不會被破壞。

  更令人震撼的是,他們沒有停留在數(shù)學證明,而是進一步提出了一個實際算法——SipIt(Sequential Inverse Prompt via Iterative Updates)。它不需要任何外部模型訓練,僅憑 Transformer 的隱藏狀態(tài),就能把輸入一個 token 一個 token 地完整還原。

  

  ▲圖1.Prompt 到 Latent Space 的單射映射:可視化 Transformer 將輸入映射到隱空間,并通過 SIPIT 完整反演。

  

  論文標題:

  Language Models are Injective and Hence Invertible

  論文鏈接:

  https://www.arxiv.org/pdf/2510.15511

  

  研究背景:為什么單射性如此重要?

  在 Transformer 的每一層里,我們都能看到“似乎會丟信息”的環(huán)節(jié):LayerNorm 會重標尺度,殘差連接可能抵消特征,注意力層還會把多個 token 混合成一個上下文表示。這些操作看起來都不利于可逆性。

  然而作者從另一個角度切入——解析性(real-analyticity)。他們將 Transformer 視為從離散序列到連續(xù)表示的解析映射:

  

  這里 是輸入 token 序列, 是模型參數(shù), 是最后一 token 的隱藏狀態(tài)。

  作者進一步形式化地指出,這個映射幾乎處處是單射的:

  

  也就是說,不同輸入序列映射到相同隱藏狀態(tài)的概率為零。解析函數(shù)的零點集要么處處為零,要么測度為零。這意味著,只要存在一個參數(shù)配置讓兩個不同輸入產(chǎn)生不同輸出,幾乎所有參數(shù)下都不會“撞車”。

  于是作者定義了一個碰撞檢測函數(shù):

  

  只要存在某個 讓 ,那就意味著“不同輸入映射成相同隱藏態(tài)”的概率為零。

  

  ▲圖2.零測集的可視化直覺:零點集合只形成細線(measure zero),說明碰撞幾乎不可能發(fā)生。

  他們進一步證明:即使經(jīng)過有限步梯度下降,這種性質(zhì)仍然保持。因為參數(shù)更新:

  

  本身也是解析函數(shù),其雅可比行列式非零,不會把空間“壓塌”。更嚴格地,他們給出了如下結論:

  也就是說,在有限步梯度下降(步長 )后,模型依然保持輸入到隱藏空間映射的單射性。

  這表明,Transformer 的可逆性是整個訓練過程的結構性特征,而非偶然現(xiàn)象。

  

  方法:SipIt如何“倒放”Transformer?

  有了理論基礎,作者提出了一個問題:

  如果隱藏狀態(tài)真的能唯一對應輸入,我們能否直接把原文還原回來?

  他們的答案是——可以。

  核心思路

  作者定義了函數(shù) ,其中 表示前綴序列。也就是說,每個位置的隱藏狀態(tài)由前綴和當前 token 唯一決定。

  因此,已知隱藏狀態(tài) ,我們可以遍歷詞表 ,尋找唯一滿足 的 token。只要找到這個 token,就能確定當前位置的輸入。

  

  ▲圖3.SIPIT 反演偽代碼:逐位反演輸入的迭代流程,僅依賴隱藏狀態(tài)即可完成重建。

  SipIt 基于這個原則逐位反演輸入:從第一個 token 開始,對候選詞按策略遍歷,當匹配的隱藏狀態(tài)落入允許的 ε 鄰域(ε-ball)時即接受,并進入下一位。

  作者在文中指出:“在實踐中,我們接受那些觀測隱藏狀態(tài)位于預測值 ε 球鄰域內(nèi)的匹配結果?!?這種基于容差的檢查方式保證了算法在有限步內(nèi)收斂并找到唯一匹配。

  當所有位置都驗證完畢,SipIt 即可還原出完整輸入 。理論上時間復雜度為線性,最壞情況下也不超過 步,即保持線性時間復雜度(linear-time bound)。

  SipIt 把“單射性”從一個理論命題變成可操作事實——能否被 SipIt 完整反演,就是模型是否真正保留信息的實證檢測。

  

  實驗結果:模型真的沒丟信息嗎?

  作者在 GPT-2 Small、Gemma-3、Llama-3.1、Mistral-7B、Phi-4-mini 等多種架構上做了驗證。他們?yōu)槊總€模型計算不同輸入的最后一 token 表示之間的最小 距離。

  結果顯示,所有最小距離都遠高于 ,說明幾乎不存在碰撞。

  

  ▲圖4.不同層間的最小距離始終高于閾值,未出現(xiàn)重疊。

  

  ▲表1.不同模型的距離分布均明顯高于碰撞閾值

  極限窮舉測試:仍未出現(xiàn)碰撞

  為避免采樣偏差,作者挑出最相似的 10 對前綴,并窮舉詞表的所有接續(xù)組合——相當于檢索上千億條輸入。即便在這個極端測試下,隱藏狀態(tài)的最小距離依然大于 0。

  

  ▲圖5. 在極限應激測試下,所有最小距離仍遠高于零

  他們還觀察了距離隨序列長度變化的趨勢:短句在前幾層迅速拉開間距,長句則趨于穩(wěn)定。

  

  ▲圖6.短序列距離上升更快,長序列趨于穩(wěn)定

  反演實驗:SipIt 的可行性驗證

  在 GPT-2 Small 上,作者選取 100 條提示序列,僅使用隱藏狀態(tài)進行反演。SipIt 實現(xiàn)了 100 % token-level 精確恢復,反演耗時與序列長度線性增長。

  

  ▲表2. SipIt 在保持 100% 精度的同時速度領先百倍

  

  ▲圖7.反演耗時隨層深度緩慢上升,整體呈線性增長

  

  總結

  這項研究并未改動模型結構,卻動搖了我們對“隱藏表示”的長期假設。Transformer 的最后一 token 隱藏狀態(tài)在解析意義上幾乎處處可逆:不同輸入有不同表示,訓練過程不會破壞這種區(qū)分性。

  SipIt 把理論轉(zhuǎn)化為工具——在不訓練任何外部網(wǎng)絡的前提下,僅憑隱藏狀態(tài)就能線性時間重建原文。

  從科研角度,這為解釋 LLM 內(nèi)部表征提供了堅實起點;從工程角度,這提醒我們:緩存隱藏狀態(tài)等價于緩存用戶輸入,隱私治理必須覆蓋這一層;從方法論角度,它展示了一種范式——先證明結構,再把結構做成算法。

  也許我們需要重新定義“理解”與“記憶”的界限。 至少從這篇論文的結果看——LLM 沒有忘記你說過的每一個字。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
許世友當面怒問李德生:你有啥可驕傲的?李德生:等你這把火燒完

許世友當面怒問李德生:你有啥可驕傲的?李德生:等你這把火燒完

何咯說
2025-12-26 19:25:01
糖尿病患者總在半夜2、3點醒來,一般暗示這5個并發(fā)癥,需注意

糖尿病患者總在半夜2、3點醒來,一般暗示這5個并發(fā)癥,需注意

看世界的人
2025-12-27 17:35:08
大批人開始返鄉(xiāng)!有人判斷,不出5年,農(nóng)村會開始越來越熱鬧

大批人開始返鄉(xiāng)!有人判斷,不出5年,農(nóng)村會開始越來越熱鬧

小談食刻美食
2025-12-26 16:45:23
據(jù)說全球僅20例!巴西一女子在同一晚與2名男子發(fā)生了關系

據(jù)說全球僅20例!巴西一女子在同一晚與2名男子發(fā)生了關系

忠于法紀
2025-12-04 11:25:07
調(diào)查發(fā)現(xiàn):老人過了72歲后,基本都有這7個現(xiàn)狀,要學會接受

調(diào)查發(fā)現(xiàn):老人過了72歲后,基本都有這7個現(xiàn)狀,要學會接受

王二哥老搞笑
2025-12-27 06:49:03
黃日華:一生一個郭靖便足矣,他卻演了6個別人無法超越的角色

黃日華:一生一個郭靖便足矣,他卻演了6個別人無法超越的角色

芳芳歷史燴
2025-12-27 13:12:38
突發(fā)!某車企兩高層被秘密帶走調(diào)查!

突發(fā)!某車企兩高層被秘密帶走調(diào)查!

電動知家
2025-12-27 10:25:08
太絕了!這水果蒸完,喉嚨里的痰“嘩嘩”化,全家人都愛喝!

太絕了!這水果蒸完,喉嚨里的痰“嘩嘩”化,全家人都愛喝!

江江食研社
2025-12-16 08:30:06
庫里獲提名!MVP榜TOP10更新:約基奇轟56+16+15領跑火箭申京入選

庫里獲提名!MVP榜TOP10更新:約基奇轟56+16+15領跑火箭申京入選

鍋子籃球
2025-12-27 12:40:41
船蛆:這個奇怪的動物群體,它們到底如何吃下木頭、泥沙和石頭?

船蛆:這個奇怪的動物群體,它們到底如何吃下木頭、泥沙和石頭?

怪羅
2025-12-26 23:55:53
男子發(fā)現(xiàn)女兒非親生,多部門調(diào)解讓他放棄追責!評論區(qū)一言難盡!

男子發(fā)現(xiàn)女兒非親生,多部門調(diào)解讓他放棄追責!評論區(qū)一言難盡!

你食不食油餅
2025-12-25 20:35:40
山西省退休人員超335萬人,平均養(yǎng)老金多少?繳費30年能領多少?

山西省退休人員超335萬人,平均養(yǎng)老金多少?繳費30年能領多少?

云鵬敘事
2025-12-27 05:30:02
沒想到!白蘿卜配山楂,才2天時間,解決了大煩惱,真是高手!

沒想到!白蘿卜配山楂,才2天時間,解決了大煩惱,真是高手!

江江食研社
2025-12-20 07:30:07
痛心!安徽“半掛西施”王迪去世,有三臺X6000,出事前剛換輪胎

痛心!安徽“半掛西施”王迪去世,有三臺X6000,出事前剛換輪胎

鋭娛之樂
2025-12-27 20:43:12
成功了!彈劾提案通過,賴清德或?qū)⑾屡_,兩岸統(tǒng)一最佳窗口出現(xiàn)?

成功了!彈劾提案通過,賴清德或?qū)⑾屡_,兩岸統(tǒng)一最佳窗口出現(xiàn)?

博覽歷史
2025-12-26 19:07:23
藏不住了 徐湖平2位“貴人”浮出水面多情人 龐家曝發(fā)票造假鐵證

藏不住了 徐湖平2位“貴人”浮出水面多情人 龐家曝發(fā)票造假鐵證

阿纂看事
2025-12-27 09:39:21
普京公開表示戀愛!卡巴耶娃再成焦點,俄“第一夫人”浮出水面?

普京公開表示戀愛!卡巴耶娃再成焦點,俄“第一夫人”浮出水面?

手工制作阿殲
2025-12-27 14:26:23
69歲趙本山:每天2包煙,頓頓8兩酒,跟生前的楊少華如出一轍

69歲趙本山:每天2包煙,頓頓8兩酒,跟生前的楊少華如出一轍

豐譚筆錄
2025-12-16 10:55:06
張梓琳帶女兒過節(jié)一臉孕相,胖妹臉型完美,這美貌馬賽克都擋不住

張梓琳帶女兒過節(jié)一臉孕相,胖妹臉型完美,這美貌馬賽克都擋不住

八怪娛
2025-12-26 16:00:33
隨著利雅得新月3-2,沙特聯(lián)最新積分榜出爐:C羅率隊僅1分優(yōu)勢領跑

隨著利雅得新月3-2,沙特聯(lián)最新積分榜出爐:C羅率隊僅1分優(yōu)勢領跑

側身凌空斬
2025-12-27 06:48:06
2025-12-27 22:15:00
人工智能學家 incentive-icons
人工智能學家
人工智能領域權威媒體
4423文章數(shù) 37357關注度
往期回顧 全部

科技要聞

小米也漲價了!業(yè)界稱終端再不漲明年必虧

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

張昊唯逃稅涉黃風波落幕:法院認定朋友造謠

財經(jīng)要聞

注意,開始拉物價了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

本地
旅游
藝術
親子
公開課

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

旅游要聞

喜迎2026跨年樂享會:文旅康養(yǎng)共生 奏響時代華章

藝術要聞

日本建筑大師出手,為臺灣孩子打造知識地標!

親子要聞

寶藍爸爸扮演“廚師”開了一家披薩店,太好玩了,快來看看吧!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版