国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

所有大模型,都學物理學:北大物理系一篇研究,震撼了AI圈

0
分享至



編輯|+0、澤南、Panda

LLM 智能體很贊,正在成為一種解決復雜難題的強大范式。

不過,這種成功目前更多還停留在「經(jīng)驗主義」的工程實踐層面 —— 我們知道它好用,但往往不知道它在宏觀上為何如此運作。那么,我們是否能找到一個理論框架,像物理學描述自然界那樣,去理解和統(tǒng)一智能體的宏觀動力學(macroscopic dynamics)?

為了解開這個黑盒,近日,北京大學物理學院、高能物理研究中心以及北京計算科學研究中心聯(lián)合發(fā)力,跨界借用了物理學中經(jīng)典的最小作用量原理(least action principle)。他們提出了一種新穎的方法,成功估計了嵌入在智能體中的 LLM 隱秘的生成方向性(directionality),揭示了 AI 生成過程背后可能存在的「物理定律」。



  1. 論文標題:Detailed balance in large language model-driven agents
  2. 論文地址:https://arxiv.org/pdf/2512.10047

簡單來說,他們通過實驗測量了 LLM 生成狀態(tài)之間的轉移概率?;诖耍麄冊诮y(tǒng)計上發(fā)現(xiàn)了 LLM 生成轉移中的細致平衡 (detailed balance) 現(xiàn)象。

這表明:LLM 的生成可能不是通過一般性地學習規(guī)則集和策略來實現(xiàn)的,而是通過隱式地學習一類潛在的勢函數(shù) (potential functions),這些勢函數(shù)可能超越了不同的 LLM 架構和提示詞模板。

該團隊表示:「據(jù)我們所知,這是首次在不依賴特定模型細節(jié)的情況下,發(fā)現(xiàn) LLM 生成動力學中的宏觀物理定律?!?/p>

什么意思呢?通俗來說,該團隊發(fā)現(xiàn) AI 的思考并不是「死記硬背」,而是像水往低處流一樣遵循「物理本能」。

是的,LLM 智能體在解決問題時,其行為模式并不像很多人以為的那樣僅僅是在匹配規(guī)則或隨機嘗試,而是隱約看到了一張無形的地形圖(勢函數(shù))。在這個地形圖中,錯誤的答案就像是高地,而正確的答案則是谷底。智能體的每一次推理和生成,實際上都是在最小作用量原理的驅動下,自然而然地向著勢能更低、質量更好的狀態(tài)流動。

這意味著,AI 能夠解決復雜問題,是因為它在海量參數(shù)中內(nèi)化出了一種全局的「直覺」,這也是科學家首次在 AI 生成過程中發(fā)現(xiàn)了不依賴于特定模型的宏觀物理定律。

這一發(fā)現(xiàn)將 AI 研究從「煉丹術」提升到了可量化的「物理科學」高度。通過驗證物理學中的「細致平衡」現(xiàn)象,該團隊證實了 AI 的思維跳躍并非無跡可尋,而是像熱力學平衡系統(tǒng)一樣有著嚴格的數(shù)學比例。

這讓我們可以用物理指標來給不同的大模型畫像;比如,研究發(fā)現(xiàn):

  1. Claude-4 像個急于交卷的優(yōu)等生,傾向于快速收斂到某個答案(勢井),但也容易固執(zhí)己見;
  2. GPT-5 Nano 則像個探險家,雖然收斂慢,但更愿意在狀態(tài)空間中多走走,探索未知的可能性。

這一理論框架讓我們可以用科學測量的手段去預測和控制 AI 的行為,而不再僅僅依賴盲目的工程試錯??雌饋?,也正如谷歌前些天的一篇論文展現(xiàn)的那樣(參閱報道《谷歌發(fā)布智能體 Scaling Law:180 組實驗打破傳統(tǒng)煉金術》),AI 智能體的研究不再只是簡單的工程實踐,而是正在提升為建立在有效測量基礎上的、可預測且可量化的科學。

下面具體來看看這個北大團隊究竟發(fā)現(xiàn)了什么。

理論

為了嚴謹?shù)乇硎鲞@一問題,該團隊研究的是一個核心由一個或多個 LLM 組成的智能體。

該智能體將其當前狀態(tài) f 作為輸入,通過一系列確定性的步驟對狀態(tài)進行組織和評估,從而生成一個相關的提示詞。隨后,該提示詞被輸入到一個或多個 LLM 中,其結構化的輸出經(jīng)解析后得到一個新的狀態(tài) g。該狀態(tài)是研究 LLM 動力學的最小單位。

這種生成過程可以被視為狀態(tài)空間 中的一個馬爾可夫轉移過程,其轉移核為 P (g|f),保留了 LLM 生成的多樣性和適應性。狀態(tài)由智能體在每個時間步保留的完整信息定義,這應當包含智能體執(zhí)行連續(xù)推理或類比過程所需的所有信息。在本文中,智能體僅包含 LLM 的單個生成步驟,記 (g←f)=P (g|f) 為智能體通過 LLM 生成從包含狀態(tài) f 的模板轉移到包含狀態(tài) g 的輸出的概率。

圖 1 為示意圖。



基于 LLM 的智能體的特征在于,其狀態(tài)轉移并非完全隨機,而是表現(xiàn)出某種結構化的偏好。

具體而言,智能體傾向于從當前狀態(tài) f 轉移到從智能體視角來看「更好」的狀態(tài) g。

為了捕捉這一現(xiàn)象,假設存在一個潛在的勢函數(shù) V_:→?,它為每個狀態(tài)分配一個標量值,以反映其「質量」。由于特定的勢函數(shù)通常難以直接計算,研究者提出了一種有效估計該勢函數(shù)的方法。

給定一個全局勢函數(shù) V,研究者將智能體的給定轉移 (g←f) 對勢函數(shù)的違背定義為 K (V (f)?V (g)),其中 K (x) 是一個凸函數(shù),用于描述從狀態(tài) f 到狀態(tài) g 的轉移在多大程度上違背了勢函數(shù) V 的排序。為了量化智能體行為與勢函數(shù)之間的整體不匹配度,研究者以轉移核 (g←f) 為權重,將作用量 定義為全局平均違背:



其中 Df,Dg 是狀態(tài)空間上的測度。在本文中,研究者選擇 K (x)=exp (-βx/2) 作為描述給定狀態(tài)轉移 f 到 g 違背標量函數(shù) V 排序程度的凸函數(shù)。作用量 S 或 βV (f) 的分布形狀可以代表該狀態(tài)空間 C 內(nèi)智能體的全局認知能力。

研究者提出,若要利用勢函數(shù)量化 LLM 的行為,可以尋找一個使智能體轉移與勢函數(shù)之間的整體不匹配度最小化的勢函數(shù)。因此,描述給定狀態(tài)空間中基于 LLM 的智能體 最合適的勢函數(shù) V_ ,是那個能使作用量 S 最小化的函數(shù)。

這意味著作用量滿足關于勢函數(shù) V_ 的變分原理:



該變分條件等價于 V_ 滿足以下平衡條件:



這對所有 f∈C 成立,其中 K'(x)=dK/dx。

具體而言,如果對于所有轉移 (g←f)>0,,均有 V (f)≥V (g) 成立,則表明智能體的狀態(tài)轉移是完全有序的,在此情況下,V 充當李雅普諾夫函數(shù)。

值得注意的是,如果 描述的是一個平衡系統(tǒng)的轉移,其狀態(tài)轉移滿足細致平衡條件,即對于所有狀態(tài)對 (f,g),下式成立:



其中 π(f) 表示系統(tǒng)在狀態(tài) f 處的平衡分布,而 P (g|f) 表示轉移核。在這種情況下,存在一個勢函數(shù) V 可以明確地將細致平衡表示為:



代入 (3) 式,可以驗證該勢函數(shù) V=V_ 滿足最小作用量原理。這表明對于平衡系統(tǒng),如果存在細致平衡條件,則可以通過最小作用量原理估計其潛在的勢函數(shù)。在一般情況下,最小作用量僅僅是在尋求勢函數(shù)的最有序排列,從而最小化智能體狀態(tài)轉移對該排列的違背。

研究者指出,基于 LLM 的智能體在其 LLM 生成的狀態(tài)空間中,往往表現(xiàn)得像一個平衡系統(tǒng),該狀態(tài)空間相較于 LLM 完整的生成序列是粗?;?。這一現(xiàn)象的存在表明 LLM 生成動力學中存在一種不依賴于具體模型和任務細節(jié)的普遍宏觀規(guī)律。這表明,盡管看似無關,但在不同的 LLM 生成過程之間存在潛在的聯(lián)系,使我們能夠通過勢函數(shù) V_ 描述 LLM 生成中的全局有序性,從而為 LLM 的內(nèi)部動力學提供解釋。

結論與展望

在本文中,研究者提出了一種基于最小作用量原理的框架,旨在描述和分析基于 LLM 的智能體在其 LLM 生成的狀態(tài)空間中的生成動力學。

通過在多個不同模型和任務上的實驗驗證,研究者發(fā)現(xiàn)這些智能體的狀態(tài)轉移在很大程度上滿足細致平衡條件,這表明它們的生成動力學表現(xiàn)出類似于平衡系統(tǒng)的特征。研究者進一步通過最小作用量原理估計了底層的勢函數(shù),并揭示了其在捕捉 LLM 生成動力學內(nèi)在方向性方面的重要作用。

研究者對發(fā)現(xiàn) LLM 生成動力學中的宏觀規(guī)律進行了初步探索。

該團隊也展望了未來:「未來的工作可以進一步擴展這一框架,并探索利用更多來自平衡及近平衡系統(tǒng)的工具,以理解和優(yōu)化 LLM 的生成過程。例如,研究偏離平衡的程度可能有助于我們理解模型的過擬合水平,因為過擬合的模型可能會學習更多局部的策略集,而不是由勢函數(shù)支配的全局生成模式。此外,基于勢函數(shù)的優(yōu)化方法也可能為提高 LLM 任務相關生成的質量和多樣性提供新思路,例如根據(jù)不同的安全性和探索需求調整不同幅度的作用量。」

更多技術細節(jié)請參閱原論文。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
裁掉奎因?廣東隊欲簽下“NBA場均16分之人”,遼寧山西出手哄搶

裁掉奎因?廣東隊欲簽下“NBA場均16分之人”,遼寧山西出手哄搶

緋雨兒
2025-12-19 11:30:11
哈佛大學驚人發(fā)現(xiàn):世界上最健康長壽的運動,竟然簡單到一學就會

哈佛大學驚人發(fā)現(xiàn):世界上最健康長壽的運動,竟然簡單到一學就會

原來仙女不講理
2025-12-17 17:16:38
美方指責中國所謂“對日本施加經(jīng)濟和軍事壓力”,中方駁斥

美方指責中國所謂“對日本施加經(jīng)濟和軍事壓力”,中方駁斥

中國基金報
2025-12-19 16:17:50
回國后我才敢說:越南是我去過的所有國家中,最被低估的

回國后我才敢說:越南是我去過的所有國家中,最被低估的

李健政觀察
2025-12-18 09:49:21
迷人的大腿:生命的等高線

迷人的大腿:生命的等高線

疾跑的小蝸牛
2025-12-19 07:25:05
消失1年,王子異自稱得抑郁癥,目前還未完全康復,復工是需要錢

消失1年,王子異自稱得抑郁癥,目前還未完全康復,復工是需要錢

失寵的小野豬
2025-12-19 10:26:08
最低-12℃!陜西今夜到明早有雨雪暴雪,出行注意→

最低-12℃!陜西今夜到明早有雨雪暴雪,出行注意→

91.6陜西交通廣播
2025-12-19 15:41:44
攜程與柬埔寨合作惹眾怒,利潤率高得嚇人

攜程與柬埔寨合作惹眾怒,利潤率高得嚇人

上峰視點
2025-12-18 11:41:46
局氣!歐文送獨行俠每人一輛高爾夫球車,價值9000美金弗拉格樂開花

局氣!歐文送獨行俠每人一輛高爾夫球車,價值9000美金弗拉格樂開花

818體育
2025-12-18 20:51:28
南京博物院受捐文物驚現(xiàn)拍賣場:監(jiān)守自盜還是有苦難言

南京博物院受捐文物驚現(xiàn)拍賣場:監(jiān)守自盜還是有苦難言

銀河敘事
2025-12-17 19:24:04
剛從沐曦爆賺200億的葛衛(wèi)東又出手了!

剛從沐曦爆賺200億的葛衛(wèi)東又出手了!

商業(yè)與生活
2025-12-19 11:43:38
天皇親自出山,日本對中國的反擊正式開始,高市早苗憋出了一妙計

天皇親自出山,日本對中國的反擊正式開始,高市早苗憋出了一妙計

王姐懶人家常菜
2025-12-19 15:43:00
國內(nèi)退休群體現(xiàn)狀被揭示:大部分退休人員,或將面臨2大的難題

國內(nèi)退休群體現(xiàn)狀被揭示:大部分退休人員,或將面臨2大的難題

陳博世財經(jīng)
2025-12-19 10:11:44
102歲醫(yī)生分享活到100歲的7個長壽習慣:原來這么簡單!

102歲醫(yī)生分享活到100歲的7個長壽習慣:原來這么簡單!

原來仙女不講理
2025-12-18 20:07:00
突然,跳水!剛剛,日本兩大重磅來襲!

突然,跳水!剛剛,日本兩大重磅來襲!

券商中國
2025-12-19 11:49:11
國產(chǎn)奔馳GLE要來了!前臉大改,軸距加長,能比寶馬X5更好賣?

國產(chǎn)奔馳GLE要來了!前臉大改,軸距加長,能比寶馬X5更好賣?

優(yōu)視汽車
2025-12-19 14:08:02
僅26歲帥哥睡夢中離世,開奔馳家境好,媽媽含淚:8點發(fā)現(xiàn)人沒了

僅26歲帥哥睡夢中離世,開奔馳家境好,媽媽含淚:8點發(fā)現(xiàn)人沒了

鋭娛之樂
2025-12-19 08:16:38
南京博物院,邪性!

南京博物院,邪性!

新動察
2025-12-18 15:01:05
CBA最差教練!球隊開賽3連敗,有好球員不用,球迷:快下課

CBA最差教練!球隊開賽3連敗,有好球員不用,球迷:快下課

籃球專區(qū)
2025-12-18 23:19:32
77年我把公社會計肚子搞大,她被調回省再沒消息,我以為緣分盡了

77年我把公社會計肚子搞大,她被調回省再沒消息,我以為緣分盡了

蕭竹輕語
2025-12-11 18:42:00
2025-12-19 16:56:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11957文章數(shù) 142513關注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

美批準對臺逾111億美元軍售 國防部回應

頭條要聞

美批準對臺逾111億美元軍售 國防部回應

體育要聞

“惡龍”埃托奧,正在毀滅喀麥隆足球

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔心的事還是發(fā)生

財經(jīng)要聞

非法集資911億!"金融大鱷"終審被判無期

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

藝術
健康
數(shù)碼
教育
軍事航空

藝術要聞

諸樂三的寫意花鳥

這些新療法,讓化療不再那么痛苦

數(shù)碼要聞

Intel代工迎來契機!14A制程拿下NVIDIA、AMD訂單

教育要聞

中考數(shù)學壓軸題,不少人交白卷,很難嗎?

軍事要聞

媒體:美方官宣史上對臺單筆最大軍售 野心藏不住了

無障礙瀏覽 進入關懷版