国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

物理化學(xué)年鑒:最大口徑變分原理——一種非平衡態(tài)的普適性理論

0
分享至


導(dǎo)語

長(zhǎng)期以來,統(tǒng)計(jì)物理中的變分原理為平衡態(tài)體系提供了堅(jiān)實(shí)的理論基礎(chǔ),但非平衡態(tài)體系始終缺乏一個(gè)同等普適且自洽的理論框架。隨著研究對(duì)象從宏觀熱學(xué)系統(tǒng)拓展至少顆粒、生物與信息系統(tǒng),傳統(tǒng)假設(shè)逐漸失效。本文系統(tǒng)綜述最大口徑原理這一基于路徑熵最大化的非平衡統(tǒng)計(jì)方法,闡明其理論基礎(chǔ)、數(shù)學(xué)形式與操作流程,并通過擴(kuò)散、電流分配及基因電路等實(shí)例,展示其在復(fù)雜少顆粒動(dòng)力學(xué)建模中的獨(dú)特優(yōu)勢(shì)與廣泛應(yīng)用前景。

關(guān)鍵詞:非平衡統(tǒng)計(jì)物理、最大口徑原理(Maximum Caliber)、路徑熵(Path Entropy)、少顆粒體系、動(dòng)力學(xué)變分原理

Kingshuk Ghosh等丨作者

張博文丨譯者

趙思怡丨審校


論文題目:The Maximum Caliber Variational Principle for Nonequilibria 論文鏈接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9827727/ 發(fā)表時(shí)間:2020年2月19日 論文來源:Annual Review of Physical Chemistry

摘要

自1865 年克勞修斯(Clausius)與 1877 年玻爾茲曼(Boltzmann)的開創(chuàng)性工作開始,熵及其最大化的原理便成為了從微觀性質(zhì)推導(dǎo)宏觀物質(zhì)平衡態(tài)的理論基石。然而,盡管相關(guān)研究已開展頗豐,科學(xué)界至今仍未建立一個(gè)同樣令人滿意的、適用于非平衡態(tài)體系的普適變分原理。直到 1980 年,E.T. Jaynes Shore與Johnson的研究為該領(lǐng)域開辟了新的方向。本文在此綜述最大口徑原理(Maximum Caliber)——一種類似最大熵原理,能夠在給定動(dòng)力學(xué)約束的條件下推斷路徑上的流分布的方法。該方法正為復(fù)雜體系的研究提供全新視角,尤其適用于少粒子復(fù)雜系統(tǒng),例如基因電路、蛋白質(zhì)構(gòu)象的反應(yīng)坐標(biāo)、網(wǎng)絡(luò)流量、鳥群集群行為、細(xì)胞遷移以及神經(jīng)元放電等。

非平衡統(tǒng)計(jì)物理學(xué)最近的研究方向

非平衡態(tài)物理(Nonequilibrium Physics, NEP)的研究核心是流—— 通常為物質(zhì)流、熱流或電流。傳統(tǒng)模型多聚焦于宏觀尺度:在此尺度下,分子或粒子的數(shù)量足夠龐大,其分布可被表示為空間 x 與時(shí)間 t 的連續(xù)可微函數(shù)(如密度或濃度c(x,t) )且其漲落效應(yīng)可忽略不計(jì)。典型的宏觀流模型包括納維 - 斯托克斯流體力學(xué)方程、歐姆電流定律、基于菲克定律(Fick’s law)的粒子梯度流,以及基于傅里葉定律的熱流。

有趣的是,當(dāng)前正有三大因素推動(dòng)該領(lǐng)域發(fā)展產(chǎn)生新的研究成果:

a. 非平衡態(tài)物理的研究范圍已突破傳統(tǒng)熱學(xué)材料的范疇拓展至多個(gè)領(lǐng)域,包括以下互聯(lián)網(wǎng)中的信息流 (1)、城市間的人口流動(dòng) (2)、股票市場(chǎng)中的資產(chǎn)流 (3)、鳥群的集群行為 (4)、科學(xué)論文的引用流 (5)、細(xì)胞網(wǎng)絡(luò)內(nèi)生化分子與蛋白質(zhì)的運(yùn)輸及信號(hào)傳導(dǎo)、細(xì)胞內(nèi)基因與蛋白質(zhì)的進(jìn)化動(dòng)力學(xué) (6?9)、大腦中的神經(jīng)信號(hào) (10)、生物的進(jìn)化與發(fā)育過程等其他諸多應(yīng)用場(chǎng)景。這些體系均不涉及過去的傳統(tǒng)非平衡態(tài)物理的核心研究對(duì)象 —— 熱力學(xué)浴、物理功或粒子碰撞。

b. 得益于單粒子與少粒子實(shí)驗(yàn)技術(shù)的出現(xiàn),科研人員對(duì)微觀尺度的研究興趣日益濃厚,此類研究正好屬于非平衡態(tài)統(tǒng)計(jì)物理的研究范疇,系統(tǒng)的漲落效應(yīng)、速率分布與路徑分布是該類研究的核心關(guān)鍵因素:

漲落效應(yīng):少數(shù)粒子體系中,微觀狀態(tài)的隨機(jī)波動(dòng)不可忽略;

速率分布:同一反應(yīng)中,不同粒子的反應(yīng)速率并非均一,而是呈現(xiàn)一定的分布;

路徑分布:微觀粒子的動(dòng)態(tài)過程并非只有一條固定路徑,而是存在多種可能的路徑,且不同路徑具有不同的概率。

c. 科學(xué)界仍在持續(xù)探索一種普適變分原理作為非平衡態(tài)統(tǒng)計(jì)物理理論基石,就像熱力學(xué)第二定律與玻爾茲曼分布作為理論基石支撐著平衡態(tài)物質(zhì)統(tǒng)計(jì)物理。


圖1 非平衡態(tài)物理領(lǐng)域的發(fā)展歷程簡(jiǎn)要時(shí)間表,最上行為發(fā)明者,中間行為非平衡過程與對(duì)應(yīng)模型,最下行為平衡態(tài)。藍(lán)色描述的是研究和承認(rèn)的原理。

圖 1 描述了非平衡態(tài)物理領(lǐng)域的簡(jiǎn)明發(fā)展歷程。19 世紀(jì)中葉,一系列唯象模型相繼建立,包括牛頓粘性流體模型、菲克粒子流定律、傅里葉熱流定律與歐姆電流定律。工業(yè)革命推動(dòng)了人們對(duì)蒸汽機(jī)中功與熱的理解??藙谛匏褂?1865 年左右發(fā)現(xiàn),平衡態(tài)的預(yù)測(cè)可基于一個(gè)物理量的最大化趨勢(shì)——他將該物理量命名為熵,其定義為 :


此后,熱力學(xué)第二定律這一變分原理應(yīng)運(yùn)而生。不久之后,氣體動(dòng)理論、統(tǒng)計(jì)熱力學(xué)與玻爾茲曼 - 吉布斯分布定律相繼被提出。這些理論極大地增強(qiáng)了熱力學(xué)第二定律的解釋力與豐富度,具體體現(xiàn)在兩個(gè)方面:(a) 建立了通過分子與材料的微觀性質(zhì)解釋宏觀平衡態(tài)的模型;(b) 將我們對(duì)熱力學(xué)第二定律中熵最大化的理解,建立在微觀態(tài)的概率分布之上。然而,這些原理存在一個(gè)關(guān)鍵局限——它們僅適用于平衡態(tài)或近平衡態(tài)體系。

科學(xué)界始終在探索適用于非平衡態(tài)的變分原理。研究要回答的核心問題是能量耗散率 (dU/dt) 或熵產(chǎn)生率 (dS/dt) 是否存在極大值或極小值的趨勢(shì)。相關(guān)研究實(shí)例包括 Onsager的最小能量耗散原理 (11)、Prigogine的最小熵產(chǎn)生原理 (12) 與最大熵產(chǎn)生原理 (13)。然而,這些候選原理始終未能完全令人滿意。其局限性在于:它們僅適用于近平衡態(tài)體系,需要引入局部平衡或與熱浴弱耦合等假設(shè);且主要應(yīng)用于宏觀尺度,通常是預(yù)設(shè)而非預(yù)測(cè)唯象關(guān)系。建立普適非平衡態(tài)統(tǒng)計(jì)物理變分原理的一個(gè)主要障礙是,目前尚未發(fā)現(xiàn)一個(gè)能夠與平衡態(tài)中的 (具有同等核心地位的實(shí)驗(yàn)關(guān)系)。

如今,關(guān)于流的模型已十分豐富,包括擴(kuò)散方程、朗之萬方程、主方程、隨機(jī)游走、玻爾茲曼輸運(yùn)理論等。那么,我們?yōu)楹芜€需要一個(gè)底層的變分原理?原因其實(shí)很簡(jiǎn)單,當(dāng)前的模型均依賴一定的簡(jiǎn)化假設(shè)而非普適的底層原理。例如,粒子或時(shí)間步的獨(dú)立性、近平衡態(tài)、線性力-流關(guān)系、高斯噪聲、大粒子數(shù),或聚焦于熱浴與粒子碰撞。對(duì)于更具挑戰(zhàn)性的非線性少粒子復(fù)雜動(dòng)力學(xué)傳統(tǒng)簡(jiǎn)化假設(shè)不再成立),以及熱物理之外的應(yīng)用場(chǎng)景,我們需要一個(gè)普適變分原理作為研究的指導(dǎo)框架。本文綜述的證據(jù)表明,最大口徑原理或許正是這樣一種原理。

最大熵與玻爾茲曼分布:

熱力學(xué)第二定律的微觀基礎(chǔ)

在討論非平衡態(tài)前,我們先回顧最大熵原理與玻爾茲曼分布。玻爾茲曼提出的著名公式 S = k\ln W 揭示了一個(gè)核心結(jié)論:克勞修斯提出的宏觀熱力學(xué)原理,其本質(zhì)源于系統(tǒng)可能的微觀排布方式的數(shù)量 W 。這一公式同時(shí)確立了玻爾茲曼指數(shù)分布定律是熱力學(xué)第二定律變分原理的微觀表現(xiàn)形式。更具體地描述,對(duì)于任意離散選項(xiàng) i=1,2,3,… 上的概率分布 {pi}=p1,p2,p3,…,我們可以定義該分布的數(shù)學(xué)熵(mathematical entropy)為:


該物理量可對(duì)任意概率分布進(jìn)行計(jì)算,但需要注意的是,這種數(shù)學(xué)熵 Smath 與克勞修斯提出的物理熵physical entropy)SClausius 并非同一概念。同時(shí),Smath也不是我們構(gòu)建物理平衡態(tài)理論模型所需的熵;對(duì)于平衡態(tài)模型,我們需要的是態(tài)熵 Sstate ,其定義如下:

首先,將概率分布 pi 限定為系統(tǒng)微觀態(tài)上的分布;其次,我們認(rèn)為:只有能使熵達(dá)到最大值的唯一特定分布 所對(duì)應(yīng)的熵,即滿足:


這個(gè)關(guān)系的熵才與熱力學(xué)第二定律對(duì)平衡態(tài)物理行為的預(yù)測(cè)相關(guān)。式(2)中,kB為玻爾茲曼常量。需要強(qiáng)調(diào)的是,kB是針對(duì)某一特定分布Sstate定義的,而非任意數(shù)學(xué)分布。對(duì)于正則系綜(即系統(tǒng)與一個(gè)熱浴相接觸,熱浴可固定系統(tǒng)的平均能量),其預(yù)測(cè)過程為:在平均能量約束下,對(duì)概率分布 pi 最大化數(shù)學(xué)熵Smath,即


其中,Ei為微觀態(tài) i 的能量,〈E〉為系統(tǒng)的平均能量。同時(shí),概率分布需滿足歸一化條件:,

此時(shí)上述約束優(yōu)化問題的解即為吉布斯-玻爾茲曼分布(Gibbs–Boltzmann distribution)


其中,為滿足上述所有約束條件的微觀態(tài)概率。式(4)中,T 為系統(tǒng)的溫度。該分布是平衡態(tài)統(tǒng)計(jì)物理的核心,可用于預(yù)測(cè)模型中所有微觀態(tài) i=1,2,3,… 的平衡態(tài)布居數(shù)。

對(duì)熵的不同含義缺乏嚴(yán)謹(jǐn)區(qū)分,是造成相關(guān)概念混淆的主要原因:

  • SClausius 僅能預(yù)測(cè)宏觀平衡態(tài)熱力學(xué)行為,例如:熱量?jī)A向于從高溫物體流向低溫物體、粒子傾向于向低濃度區(qū)域擴(kuò)散、材料內(nèi)部的密度趨于均勻等。它無法提供任何關(guān)于微觀尺度或分布函數(shù)的信息。

  • Sstate 是我們基于平衡態(tài)的微觀物理模型計(jì)算得到的物理量。為了將平衡態(tài)模型與對(duì)應(yīng)的宏觀實(shí)驗(yàn)結(jié)果相關(guān)聯(lián),我們通常采用等效關(guān)系:Sstate = SClausius。

區(qū)別于與上述介紹的熱力學(xué)相關(guān)的熵,在下文中,我們將介紹另一種與動(dòng)力學(xué)過程相關(guān)的熵,即路徑熵( Path EntropySpath。

最大口徑原理:適用于動(dòng)力學(xué)過程的變分原理

E.T. Jaynes四十年前在Annual Review of Physical Chemistry中首次提出了最大口徑原理(14)。本文將綜述該原理作為非平衡態(tài)普適原理的當(dāng)前研究現(xiàn)狀,及其部分應(yīng)用。與其他非平衡態(tài)變分原理相比,最大口徑原理的獨(dú)特之處體現(xiàn)在四個(gè)方面:

  1. 其理論基礎(chǔ)為粒子的軌跡,而非宏觀的濃度;

  2. 其優(yōu)化目標(biāo)為路徑熵的最大化,而非態(tài)熵的最大化;

  3. 基于實(shí)驗(yàn)數(shù)據(jù)約束推導(dǎo)微觀模型時(shí),其存在的邏輯矛盾與混淆更少;

  4. 其具有概率論的公理化基礎(chǔ) (15)。


圖2 路徑熵用于量化不同通路間的流量分布均勻性。線條粗細(xì)代表流量密度,即通路的出現(xiàn)概率。

以下是該原理的簡(jiǎn)要概述:最大口徑原理之于動(dòng)力學(xué),正如最大熵原理之于平衡態(tài)。最大熵原理關(guān)注的是微觀態(tài)的概率分布,而最大口徑原理關(guān)注的是系統(tǒng)演化的路徑或軌跡的概率分布。設(shè) {Γ} 為系統(tǒng)在時(shí)間演化過程中所有可能的軌跡集合。 Γ 可描述多種類型的動(dòng)力學(xué)過程:例如,考慮系統(tǒng)從初始時(shí)刻 Ti 的初態(tài)演化至終末時(shí)刻 Tf 的終態(tài)的軌跡(見圖2),或處于穩(wěn)態(tài)的系統(tǒng)的演化軌跡。對(duì)于前者,單條軌跡可表示 ,即系統(tǒng)在時(shí)間點(diǎn) Ti 至 Tf 之間可能經(jīng)歷的所有狀態(tài)序列。其他類型的軌跡將在下文討論。設(shè) PΓ 為定義在軌跡系綜 {Γ} 上的概率分布。

設(shè) J(Γ) 為定義在軌跡空間上的泛函。J 的具體例子包括:流所攜帶的質(zhì)量/熱通量、沿軌跡的平均耗散量,或沿軌跡的平均能量。若我們希望在約束平均泛函值固定的前提下,推斷軌跡空間上的概率分布 PΓ,則該約束條件可表示為:


在這里以及本文的后續(xù)部分中,我們將統(tǒng)一使用大寫字母 P 表示軌跡上的概率分布,而使用小寫字母 p 表示通用概率;當(dāng)使用小寫 p 時(shí),我們會(huì)明確說明其具體含義。

需要注意的是,滿足上述約束條件的概率分布 PΓ 可能有無限多種。與平衡態(tài)的情況類似,我們?cè)诖艘膊捎渺刈畲蠡牟呗?,但此時(shí)的優(yōu)化對(duì)象是所有可能的軌跡,而非狀態(tài)。對(duì)應(yīng)的路徑熵定義為:


我們的優(yōu)化目標(biāo)為:在式(5)的平均泛函約束與概率歸一化約束下,最大化上述路徑熵(見圖2)。其中,qΓ 為軌跡空間上的參考分布或先驗(yàn)分布。

該約束最大化問題可通過引入拉格朗日乘子來求解。我們定義一個(gè)無約束優(yōu)化函數(shù),將其稱為口徑(Caliber),記為 C


在式(7)中, γ 是用于將系綜平均 〈J〉 固定為給定值的拉格朗日乘子,而 α 是用于保證概率分布?xì)w一化的拉格朗日乘子。對(duì)口徑 C 關(guān)于 PΓ 求最大值后,我們得到最優(yōu)軌跡分布:


其中,


是對(duì)所有軌跡的權(quán)重求和,稱為動(dòng)力學(xué)配分函數(shù)(dynamic partition function)。其在動(dòng)力學(xué)中的作用與平衡態(tài)統(tǒng)計(jì)物理中的配分函數(shù)完全對(duì)應(yīng)。

最大口徑原理的一個(gè)核心結(jié)論是:可測(cè)量的平均速率類物理量與模型的動(dòng)力學(xué)配分函數(shù)之間存在明確的解析關(guān)系。該關(guān)系可表示為:


在實(shí)際應(yīng)用中,最大口徑原理數(shù)學(xué)框架的操作流程如下:

  1. 明確與當(dāng)前研究問題相關(guān)的軌跡類型;

  2. 基于相關(guān)的實(shí)驗(yàn)約束條件,構(gòu)建軌跡空間上的概率分布(式9)。每條軌跡的概率由其包含的所有演化步驟的統(tǒng)計(jì)權(quán)重決定;

  3. 利用式9,可進(jìn)行與平衡態(tài)統(tǒng)計(jì)物理類似的理論預(yù)測(cè)。例如,將所有軌跡的權(quán)重求和得到動(dòng)力學(xué)配分函數(shù) Qd;

  4. 利用式11,可計(jì)算出與給定的平均泛函值〈J〉 及其他可能的約束條件相一致的所有統(tǒng)計(jì)權(quán)重與軌跡概率。

為了進(jìn)一步闡釋其數(shù)學(xué)框架與應(yīng)用方法,我們將在下文給出最大口徑原理的若干具體應(yīng)用實(shí)例。

最大口徑原理提供新的研究視角

兩態(tài)動(dòng)力學(xué):基于平均速率預(yù)測(cè)通路分布


圖3 采用最大口徑方法結(jié)合馬爾可夫模型表征 A ? B 兩態(tài)動(dòng)力學(xué)。

(a) 不同的軌跡由不同的勢(shì)能面表示。最大口徑方法對(duì)所有軌跡進(jìn)行枚舉,其權(quán)重為初始未知的路徑權(quán)重。

(b) 實(shí)驗(yàn)測(cè)得的平均量(例如粒子滯留于態(tài) A 的平均次數(shù) ?Naa?)可用于確定這些路徑權(quán)重,進(jìn)而獲得所有通路的相對(duì)概率。

(c) 基于平均值預(yù)測(cè)的方差與實(shí)驗(yàn)結(jié)果高度吻合。

考慮一個(gè)可在兩個(gè)勢(shì)阱 A 與 B 之間跳躍的單膠體粒子(見圖3)。Phillips 及其團(tuán)隊(duì)通過雙激光光鑷構(gòu)建這一兩態(tài)體系,并開展了相關(guān)實(shí)驗(yàn)研究(16)。圖3展示了作者在不同光鑷條件下觀測(cè)到的粒子軌跡實(shí)例。本研究采用最大口徑原理結(jié)合兩態(tài)馬爾可夫模型對(duì)該體系的動(dòng)力學(xué)行為進(jìn)行建模。圖中枚舉了所有可能的粒子通路,并標(biāo)注了各通路對(duì)應(yīng)的統(tǒng)計(jì)權(quán)重。單個(gè)時(shí)間步長(zhǎng)內(nèi)的統(tǒng)計(jì)權(quán)重定義如下:上跳(A→B)的權(quán)重為 u,滯留于態(tài)A的權(quán)重為 a,滯留于態(tài) B 的權(quán)重為 b,下跳(B→A)的權(quán)重為 d。上述四個(gè)權(quán)重中僅有兩個(gè)是獨(dú)立的,原因在于:從任意初始態(tài)出發(fā)的所有躍遷路徑的權(quán)重之和必須為1,且到達(dá)任意終態(tài)的所有躍遷路徑的權(quán)重之和也必須為1。

最大口徑方法的核心流程為:首先從實(shí)驗(yàn)軌跡中提取兩個(gè)獨(dú)立的權(quán)重參數(shù)(例如 u 與 d),隨后將其代入圖3所示的最大口徑公式中。在這兩個(gè)獨(dú)立參數(shù)確定后,即可獲得完整的通路概率分布。例如,最大口徑方法能夠基于平均速率預(yù)測(cè)速率分布的方差,且該理論預(yù)測(cè)的方差值與實(shí)驗(yàn)測(cè)定結(jié)果高度吻合。

這一馬爾可夫動(dòng)力學(xué)與最大口徑方法相結(jié)合的研究框架,已被進(jìn)一步應(yīng)用于單分子三態(tài)循環(huán)體系(A ? B ? C ? A)的研究中(17)。研究結(jié)果表明:平自選速率的提升會(huì)使噪聲以更快的速度衰減。此外,該研究還證實(shí):基于軌跡的建模方法能夠捕捉所有可能的粒子軌跡,而非僅局限于平衡態(tài)附近的軌跡,因此其適用范圍可拓展至遠(yuǎn)離平衡態(tài)的體系。

基于超越菲克定律平均形式的變分原理推導(dǎo)唯象定律


圖4 擴(kuò)散方程建模將濃度 c(x,t) 視為連續(xù)且可微的物理量 —— 例如,菲克定律的表達(dá)式即為 ?J?=?D?x?c。

本小節(jié)將通過一個(gè)簡(jiǎn)單的微觀模型,從最大口徑這一變分原理出發(fā)推導(dǎo)菲克擴(kuò)散定律(),以闡釋最大口徑方法的核心思想。非平衡態(tài)物理(NEP)中的傳統(tǒng)擴(kuò)散方程模型通常假設(shè):體系中的粒子數(shù)量足夠多,因此其密度或濃度可被表示為連續(xù)且可微的函數(shù)(見圖4)。


圖5 顯微鏡載玻片上膠體顆粒的微觀尺度擴(kuò)散行為(18)。

(a) 用于測(cè)量少量膠體微球自由擴(kuò)散過程、以量化其漲落的微流控裝置。

(b) 用于追蹤微球隨時(shí)間運(yùn)動(dòng)軌跡的視頻快照。

(c) 利用該裝置測(cè)得的三條典型濃度分布曲線。

這些分布曲線表明,本實(shí)驗(yàn)所測(cè)量的此類少顆粒體系的擴(kuò)散流存在顯著漲落。而菲克定律這類唯象理論僅能描述大顆粒數(shù)體系的平均行為,無法解釋本文所觀測(cè)到的漲落現(xiàn)象。

然而,近年來的膠體實(shí)驗(yàn)已開始探索小數(shù)量粒子體系的擴(kuò)散行為(見圖5)。小數(shù)量粒子擴(kuò)散具有諸多值得關(guān)注的特性(例如通量分布的寬度〈J2〉),這些特性對(duì)于模型構(gòu)建具有重要意義。利用最大口徑方法的軌跡分析框架,結(jié)合本研究中提出的狗-跳蚤模型(將不同的空間位點(diǎn)視為“狗”,將位于這些位點(diǎn)上的粒子視為可在“狗”之間跳躍的“跳蚤”),可便捷地計(jì)算出這些特性。


圖6 (a) 濃度梯度 c(x),標(biāo)注了相鄰的兩個(gè)統(tǒng)計(jì)區(qū)間 i 與 i+1,直觀顯示兩區(qū)間內(nèi)的粒子數(shù) N 存在差異。

(b) 一條可能的粒子運(yùn)動(dòng)軌跡,其中各步均標(biāo)注了對(duì)應(yīng)的統(tǒng)計(jì)權(quán)重。

圖6a展示了沿空間坐標(biāo) x 分布的濃度梯度 c(x) 。在位置 x i 處存在 N i 個(gè)粒子。在狗-跳蚤模型的表述中(18), N i 代表位于空間位點(diǎn) x i 處的“狗”身上的“跳蚤”數(shù)量。在一個(gè)時(shí)間間隔 Δ t 內(nèi),有 r 只“跳蚤”從該“狗”身上向右跳躍,另有 ? 只“跳蚤”向左跳躍。本研究設(shè)定兩個(gè)約束條件:平均向右跳躍的跳蚤數(shù)為 ?r? ,平均向左跳躍的跳蚤數(shù)為 ??? 。那么,在單次觀測(cè)中恰好出現(xiàn) r 次右跳與 ? 次左跳的概率 P i 是多少?

我們通過在已知平均速率的約束下最大化路徑熵來計(jì)算概率 P i ,并采用拉格朗日乘子 λ r 與 λ ? 來引入這些約束條件,最終得到:


其中,我們通過定義 σ= exp ?(λ) 對(duì)公式進(jìn)行了簡(jiǎn)化;而 Q i 為動(dòng)力學(xué)配分函數(shù),其表達(dá)式為:


式中,簡(jiǎn)并度 ,該表達(dá)式的推導(dǎo)基于粒子跳躍行為相互獨(dú)立的假設(shè)。向右的平均通量 ?r? 可表示為:


類似地,相鄰的下一個(gè)空間列(包含 N i+1 個(gè)粒子)向左的平均通量為:


接下來,我們假設(shè)左右跳躍具有對(duì)稱性(即體系無漂移運(yùn)動(dòng)),此時(shí)可得 λ r = λ ? 。我們定義 ,則凈向右通量可表示為:


我們將該粒子數(shù)差值轉(zhuǎn)換為通量(即單位時(shí)間、單位面積內(nèi)跳躍的粒子數(shù)),并利用濃度替代粒子數(shù): Δ N=?A Δ c Δ x 。其中, A Δ x 為包含這些粒子的體積;負(fù)號(hào)的含義為:我們定義的正方向是從位點(diǎn) i 到位點(diǎn) i+1 ,而濃度梯度 Δ c= c i+1 ? c i 的定義方向恰好相反。代入后可得:


公式(16)即為適用于兩個(gè)相鄰粒子平面的菲克擴(kuò)散定律。根據(jù)該模型,我們可得到擴(kuò)散系數(shù)的表達(dá)式 。這一模型揭示了粒子的平均流動(dòng)與濃度差成正比的根本原因:高濃度區(qū)域具有更多的粒子流動(dòng)通路。


圖7 基于狗 - 蚤模型,利用最大口徑原理推導(dǎo)得到的簡(jiǎn)單擴(kuò)散理論,成功預(yù)測(cè)了少顆粒體系的實(shí)驗(yàn)結(jié)果(19)。該理論的核心結(jié)論包含以下五點(diǎn):

1. 它從變分原理出發(fā),推導(dǎo)出了菲克第一定律,即 ?J?=?D ? x ? c ;

2. 它證明了菲克定律在少顆粒極限下依然成立;

3. 它能正確預(yù)測(cè)完整的速率分布;

4. 它計(jì)算了一個(gè)類似麥克斯韋妖的物理量 ——反向流(wrong-way flows)的占比(由 ?badactor 定量描述),結(jié)果表明,隨著凈通量的增大,該反向流占比會(huì)變得可以忽略;

5. 它能準(zhǔn)確給出通量漲落關(guān)系。

盡管存在多種推導(dǎo)菲克定律的方法,但本研究采用的最大口徑方法具有以下三個(gè)核心優(yōu)勢(shì):

(a) 該方法基于一個(gè)普適的底層變分原理推導(dǎo)菲克定律,具有更強(qiáng)的理論普適性;

(b) 該方法不僅能得到平均通量 ?J? (公式16),還能給出完整的速率分布 P i (見圖7);

(c) 最大口徑方法的教學(xué)直觀性強(qiáng),易于理解和推廣。

基爾霍夫電流定律的推導(dǎo):含兩個(gè)電阻的節(jié)點(diǎn)處電流如何分配?


圖8 最大口徑原理可推導(dǎo)出基爾霍夫電流定律 —— 即節(jié)點(diǎn)處的電流分配比例,與各支路的流動(dòng)電阻成反比。

基爾霍夫電流關(guān)系指出:粒子流或流體在節(jié)點(diǎn)處的分配比例,與節(jié)點(diǎn)下游各支路的電阻成反比。本文總結(jié)了Jaynes的相關(guān)論證(14):最大口徑原理可正確推導(dǎo)出這一規(guī)律,而一個(gè)假想的最小熵產(chǎn)生率原理則無法實(shí)現(xiàn)。盡管基爾霍夫原理適用于任意類型的流動(dòng),但為簡(jiǎn)化分析,我們?cè)趫D8中以兩個(gè)并聯(lián)電阻 R l (左電阻)與 R r 右電阻)為例進(jìn)行說明。

根據(jù)歐姆定律,通過電阻的電流可表示為 i= V 0/ R ,其中 V 0 為外加電壓, R 為電阻值。我們假設(shè)兩個(gè)電阻分別與溫度為 T l 和 T r 的熱浴相連。由此引出核心問題:當(dāng)兩個(gè)電阻并聯(lián)時(shí),總電流 I= I l + I r 。如何在左支路(流經(jīng) R l 的電流 I l )與右支路(流經(jīng) R r 的電流 I r ) 之間分配?

在最小熵產(chǎn)生原理的框架下,電流的分配比例由熱熵產(chǎn)生率的極值條件決定:即對(duì)電流在兩條支路中的分配方式求熵產(chǎn)生率 的極值。我們將熵產(chǎn)生率寫作:


其中, J l 與 J r 分別為左、右兩個(gè)電阻上的熱流速率。

式(17)中,電阻的耗散項(xiàng)采用了經(jīng)典形式:力×通量(即 V 0 ×I )。同時(shí),我們也引入了歐姆定律的關(guān)系: V=IR 。在總電流約束 I= I l + I r 下,對(duì) I l 和 I r 求 的最小值,可得到:


這一結(jié)果顯然是錯(cuò)誤的。原因在于:對(duì)于外加電壓為 V 0 的電阻,其電流大小僅由電阻值 R 決定;溫度 T 本不應(yīng)出現(xiàn)在該表達(dá)式中。當(dāng)然,電阻值本身可能與溫度相關(guān)(即 R=R(T) ),但對(duì)于基爾霍夫定律而言,唯一的決定因素是電阻的實(shí)際取值,而非溫度本身。

接下來,我們采用與前文相同的方法,將狗-跳蚤模型與最大口徑原理相結(jié)合,推導(dǎo)正確的電流分配規(guī)律。假設(shè)存在 N 個(gè)電子(對(duì)應(yīng)模型中的“跳蚤”),在一個(gè)給定的時(shí)間間隔 Δ t 內(nèi),有 ? 個(gè)電子可以躍遷至左支路, r 個(gè)電子可以躍遷至右支路。我們將 ? 與 r 作為兩個(gè)約束條件引入模型——這兩個(gè)約束本質(zhì)上對(duì)應(yīng)于兩條支路的固有屬性。通過引入兩個(gè)拉格朗日乘子 λ l 和 λ r 來體現(xiàn)這些約束,口徑可表示為:

其中, P j 代表某一微觀軌跡的概率,該微觀軌跡由 ? 與 r 的一種特定分配方式定義(歸一化條件 ∑ P j =1 ) 已被隱含假設(shè))。對(duì)口徑進(jìn)行最大化,可得到微觀軌跡的概率分布: P j ∝ exp ? (? λ l ?? λ r r) 。

隨后,我們將微觀軌跡的概率分布轉(zhuǎn)化為宏觀軌跡的概率分布 P M (?,r) ——宏觀軌跡僅由 ? 與 r 的取值定義。這一轉(zhuǎn)化過程中會(huì)引入一個(gè)組合因子: 。利用該組合因子,我們可以得到 P M (?,r) 服從多項(xiàng)分布,并進(jìn)一步推導(dǎo)出: ???=N P l , ?r?=N P r 。其中,左、右支路的躍遷概率分別為:


由此,我們可以得到一個(gè)關(guān)鍵關(guān)系:


下面我們將這一模型結(jié)果與歐姆定律建立聯(lián)系,從而推導(dǎo)出基爾霍夫電流定律:

1. 歐姆定律中的電流是宏觀統(tǒng)計(jì)平均值,因此在本模型中,支路電流的比值滿足 i l / i r =??? / ?r? ;

2. 模型中的固有屬性(躍遷概率的比值)與歐姆定律中的電阻值相對(duì)應(yīng),即 P l / P r = R r / R l 。

結(jié)合以上兩點(diǎn),我們即可推導(dǎo)出基爾霍夫電流定律——平均流量的分配比例與支路電阻的比值成反比。

這一推導(dǎo)過程具有兩層重要意義:

第一,最大口徑原理僅通過約束條件即可完成推導(dǎo),不會(huì)像最小熵產(chǎn)生原理那樣,錯(cuò)誤地引入溫度等無關(guān)因素;

第二,與僅適用于平均通量的基爾霍夫定律不同,最大口徑原理與狗-跳蚤模型的結(jié)合,還能給出節(jié)點(diǎn)處流量的完整速率分布。

最大口徑原理對(duì)少顆粒復(fù)雜系統(tǒng)與基因電路的建模

化學(xué)反應(yīng)、生化網(wǎng)絡(luò)及基因電路通常并非簡(jiǎn)單的線性系統(tǒng);它們可能包含非線性元件、負(fù)反饋或正反饋環(huán)路、振蕩器、開關(guān)、門控及類邏輯元件。這些系統(tǒng)的底層作用細(xì)節(jié)往往是未知的。此外,此類系統(tǒng)的建模挑戰(zhàn)還會(huì)因數(shù)據(jù)的高噪聲特性而進(jìn)一步加劇——這是基因表達(dá)過程中涉及的粒子數(shù)量極少所導(dǎo)致的固有問題。更重要的是,實(shí)驗(yàn)通常僅能測(cè)量少數(shù)帶熒光標(biāo)記的蛋白質(zhì)的動(dòng)力學(xué)行為,而其背后的基因表達(dá)過程可能由多個(gè)調(diào)控因子共同驅(qū)動(dòng)。因此,僅通過實(shí)驗(yàn)數(shù)據(jù)往往無法推導(dǎo)出所有底層相互作用及其速率常數(shù)。那么,我們能否換一種思路:構(gòu)建一個(gè)與實(shí)驗(yàn)數(shù)據(jù)自洽的有效動(dòng)力學(xué)模型,并利用該模型進(jìn)行可靠預(yù)測(cè)?

最大口徑原理是構(gòu)建此類模型的理想工具——它能夠基于有限的信息(如少數(shù)物種的實(shí)驗(yàn)數(shù)據(jù)),建立少顆粒系統(tǒng)的有效模型。最大口徑原理所構(gòu)建的模型具有最少的參數(shù)數(shù)量,同時(shí)這些參數(shù)能夠直接從實(shí)驗(yàn)數(shù)據(jù)中最大化地確定。下文將通過三個(gè)實(shí)例,展示最大口徑原理如何捕捉少顆?;螂娐返膹?fù)雜動(dòng)力學(xué)行為。在基因電路中,蛋白質(zhì)由DNA轉(zhuǎn)錄翻譯生成,同時(shí)這些蛋白質(zhì)又可以結(jié)合到DNA上,調(diào)控自身或其他蛋白質(zhì)的合成速率。

單基因電路中自激活行為的建模


圖9 最大口徑原理可預(yù)測(cè)自激活基因電路的動(dòng)力學(xué)行為。(a) 基因α負(fù)責(zé)合成蛋白質(zhì) A。當(dāng) A 蛋白的二聚體A2結(jié)合至啟動(dòng)子區(qū)域時(shí),A 蛋白的合成速率會(huì)顯著加快(20)。需注意,負(fù)反饋電路可采用完全相同的方法進(jìn)行建模;區(qū)別僅在于:本圖中被稱為啟動(dòng)子的淺藍(lán)色區(qū)域?qū)⒈惶鎿Q為阻遏物結(jié)合區(qū)域,且阻遏作用的效果是減慢而非加快 A 蛋白的合成。(b) 實(shí)驗(yàn)測(cè)得的具有隨機(jī)性的開關(guān)型時(shí)間軌跡。(c) 以該軌跡為輸入,最大口徑原理可預(yù)測(cè)出 A 蛋白在正常合成狀態(tài)(速率g)與加速合成狀態(tài)(速率g?)下的合成速率,以及其降解速率d。

圖9展示了單基因調(diào)控電路中自激活行為的實(shí)現(xiàn)機(jī)制(20-22)?;?α 負(fù)責(zé)合成A型蛋白質(zhì)(A蛋白),該蛋白質(zhì)以降解速率 d 發(fā)生降解。基因 α 的DNA序列兩側(cè)帶有啟動(dòng)子區(qū)域。當(dāng)兩個(gè)A蛋白分子形成二聚體 A 2 并結(jié)合到該啟動(dòng)子區(qū)域時(shí),基因 α 合成A蛋白的速率將顯著高于基礎(chǔ)水平。

實(shí)驗(yàn)數(shù)據(jù)的表現(xiàn)形式為:?jiǎn)挝粫r(shí)間內(nèi)A蛋白分子數(shù)量 N A (t) 隨時(shí)間變化的、具有噪聲的開關(guān)型時(shí)間軌跡(見圖9b)。僅通過這些數(shù)據(jù),我們無法推導(dǎo)出所有的微觀速率參數(shù)。因此,在對(duì)該電路進(jìn)行建模時(shí),我們的目標(biāo)是:從完整的隨機(jī)時(shí)間軌跡中(而非僅對(duì)軌跡進(jìn)行平均)提取最大量的信息,以構(gòu)建一個(gè)有效模型。我們利用該隨機(jī)時(shí)間軌跡,來推斷三個(gè)核心參數(shù):蛋白質(zhì)的基礎(chǔ)合成速率 g 、降解速率 d ,以及啟動(dòng)子被激活時(shí)的有效加速合成速率 g ? 。我們通常無法先驗(yàn)地知道這些速率常數(shù)、 A 2 與啟動(dòng)子的結(jié)合親和力,或其他類似的機(jī)制性變量。其他建模方法可能會(huì)明確引入這些變量,但這通常需要增加額外的參數(shù),而這些參數(shù)的取值往往缺乏實(shí)驗(yàn)依據(jù)。

最大口徑原理能夠直接從隨機(jī)實(shí)驗(yàn)數(shù)據(jù)中提取出這三個(gè)核心物理量(20, 22)。此外,最大口徑原理還能預(yù)測(cè)一個(gè)有效反饋參數(shù) K ,該參數(shù)用于量化蛋白質(zhì)與其自身啟動(dòng)子之間的耦合強(qiáng)度。該模型還能自然地產(chǎn)生雙峰分布——這是模型能夠成功描述開關(guān)行為的必要條件。更進(jìn)一步,最大口徑模型還能為我們提供深刻的洞見:如何通過調(diào)節(jié)反饋參數(shù)來改變這些分布特征(20, 22)。

下面我們具體說明最大口徑原理如何應(yīng)用于這個(gè)簡(jiǎn)單的基因電路。我們將口徑定義為:


其中, ? α 為合成狀態(tài)變量,其取值為0到某個(gè)預(yù)設(shè)最大值 M 之間的整數(shù); ? A 為降解狀態(tài)變量,用于描述在一個(gè)時(shí)間間隔結(jié)束時(shí),仍未降解的、先前已存在的蛋白質(zhì)分子的數(shù)量。這兩個(gè)約束條件對(duì)應(yīng)的拉格朗日乘子分別為 b α 和 b A ; 定義為觀測(cè)到一組特定的 ? α 與 ? A 組合的概率。

因此,式(21)中的第一項(xiàng)為路徑熵;第二項(xiàng)和第三項(xiàng)分別為對(duì)平均合成速率與平均降解速率施加的約束;最后一項(xiàng)通過拉格朗日乘子 K A 對(duì) ? α ? A 的平均值施加約束,其物理意義是強(qiáng)制實(shí)現(xiàn)蛋白質(zhì)分子數(shù)量 N A 與A蛋白合成速率之間的正相關(guān)關(guān)系。這是捕捉反饋本質(zhì)所必須施加的、兩個(gè)變量之間耦合的最低階項(xiàng)。

基于該口徑的定義,我們可以得到對(duì)應(yīng)的口徑最大化的路徑概率分布:


其中,歸一化常數(shù) Q d 的表達(dá)式為:


實(shí)驗(yàn)觀測(cè)到的軌跡的似然函數(shù) L 可以用路徑概率 來表示。通過最大化該似然函數(shù),我們可以確定四個(gè)關(guān)鍵參數(shù): M 、 b α 、 b A 與 K A 。在確定這些拉格朗日乘子之后,我們可以進(jìn)一步利用它們來推斷電路的不同速率常數(shù)、反饋參數(shù)及其他特征(20)。這些參數(shù)均無法通過實(shí)驗(yàn)直接測(cè)量。定義反饋參數(shù)為蛋白質(zhì)合成狀態(tài)變量 ? α 與當(dāng)前存在的蛋白質(zhì)狀態(tài)變量 ? A 之間的皮爾遜相關(guān)系數(shù)。該反饋參數(shù)的取值是一個(gè)有效度量,用于描述A蛋白的存在對(duì)其自身合成速率的影響程度。在分子水平上,該度量可能會(huì)受到多種變量的影響,其中包括二聚體蛋白分子與啟動(dòng)子位點(diǎn)的結(jié)合常數(shù)。

基因雙穩(wěn)態(tài)開關(guān)電路


圖10 最大口徑原理(Max Cal)可給出雙穩(wěn)態(tài)開關(guān)基因電路中的速率分布。(a) 基因α合成蛋白質(zhì) A,基因β合成蛋白質(zhì) B。蛋白質(zhì) A 的結(jié)合會(huì)阻遏 B 的合成,蛋白質(zhì) B 的結(jié)合則會(huì)阻遏 A 的合成。(b) 該調(diào)控模式的最終效應(yīng)為雙穩(wěn)態(tài)(贏家通吃):當(dāng) A 或 B 任意一種蛋白質(zhì)的含量出現(xiàn)少量過剩時(shí),其豐度會(huì)進(jìn)一步提升,最終完全主導(dǎo)整個(gè)體系。圖中為實(shí)驗(yàn)測(cè)得的隨機(jī)時(shí)間軌跡。圖 b 下半部分經(jīng)授權(quán)改編自參考文獻(xiàn) 22。(c) 無需其他任何先驗(yàn)信息,Max Cal 僅以兩種蛋白質(zhì)的隨機(jī)時(shí)間軌跡為輸入,即可推斷出不同的速率參數(shù)(基礎(chǔ)合成速率g、阻遏態(tài)合成速率g?、降解速率d等)

圖10展示了一個(gè)基因雙穩(wěn)態(tài)開關(guān)電路,該電路最初由Gardner等人設(shè)計(jì)(23)?;?α 以速率 g ? 合成A蛋白,基因 β 以速率 g ? 合成B蛋白。每個(gè)基因的DNA序列兩側(cè)均帶有阻遏物結(jié)合區(qū)域。當(dāng)一個(gè)B蛋白分子結(jié)合到基因 α 的阻遏物區(qū)域時(shí),會(huì)減緩A蛋白的合成速率;同理,當(dāng)A蛋白結(jié)合到基因 β 的阻遏物區(qū)域時(shí),也會(huì)減緩B蛋白的合成速率。

對(duì)于該電路,實(shí)驗(yàn)數(shù)據(jù)為兩種蛋白質(zhì)的分子數(shù)量 N A (t) 與 N B (t) 隨時(shí)間變化的時(shí)間軌跡(見圖10b)。最大口徑模型能夠產(chǎn)生交替輸出的行為——這是雙穩(wěn)態(tài)的標(biāo)志性特征:當(dāng)A蛋白的分子數(shù)量開始超過B蛋白時(shí),系統(tǒng)會(huì)進(jìn)入“贏家通吃”的狀態(tài),A蛋白成為主導(dǎo);反之,當(dāng)B蛋白的數(shù)量占優(yōu)時(shí),系統(tǒng)也會(huì)切換到B蛋白主導(dǎo)的狀態(tài)。

值得注意的是,最大口徑原理僅需利用原始的輸入數(shù)據(jù),就能準(zhǔn)確預(yù)測(cè)出蛋白質(zhì)在基礎(chǔ)狀態(tài)和阻遏狀態(tài)下的合成速率、降解速率,以及A蛋白與B蛋白之間的相關(guān)關(guān)系(22, 24)。

阻滯振蕩器——一種振蕩型基因電路


圖11 最大口徑原理可描述阻遏振蕩器基因電路的少顆粒動(dòng)力學(xué)行為。(a) 基因α、β、γ分別合成蛋白質(zhì) A、B、C。蛋白質(zhì) A 的結(jié)合會(huì)阻遏 B 的合成,蛋白質(zhì) B 的結(jié)合會(huì)阻遏 C 的合成,蛋白質(zhì) C 的結(jié)合則會(huì)阻遏 A 的合成。(b) 該調(diào)控模式產(chǎn)生的效應(yīng)為振蕩型時(shí)間軌跡。實(shí)驗(yàn)中常規(guī)測(cè)得的 A、B、C 三種蛋白質(zhì)的豐度分布,其包含的信息要少于隨機(jī)時(shí)間軌跡。(c) 無需其他任何先驗(yàn)信息,Max Cal 僅以三種蛋白質(zhì)的隨機(jī)時(shí)間軌跡為輸入,即可推斷出不同的速率參數(shù)(基礎(chǔ)合成速率g、阻遏態(tài)合成速率g?、降解速率d)及反饋強(qiáng)度K。圖 c 經(jīng)授權(quán)改編自參考文獻(xiàn) 26。

圖11展示了由Elowitz與Leibler設(shè)計(jì)的阻遏振蕩器基因電路(25)。如圖c所示,這是一個(gè)由三種蛋白質(zhì)構(gòu)成的環(huán)形電路:A、B和C?;?α 合成A蛋白,基因 β 合成B蛋白,基因 γ 合成C蛋白。三種蛋白質(zhì)的基礎(chǔ)合成速率均為 g 。A蛋白能夠結(jié)合到B基因的啟動(dòng)子區(qū)域,從而減緩B蛋白的合成速率;同理,B蛋白能夠減緩C蛋白的合成速率,而C蛋白又能夠減緩A蛋白的合成速率。蛋白質(zhì)在阻滯狀態(tài)下的合成速率為 g ? ,該速率遠(yuǎn)低于基礎(chǔ)合成速率 g 。三種蛋白質(zhì)的降解速率相同,均為 d 。

實(shí)驗(yàn)的原始數(shù)據(jù)為每種蛋白質(zhì)的分子數(shù)量隨時(shí)間變化的軌跡(見圖11b)。與前文的建模方法相同,我們通過最大化觀測(cè)到的帶噪聲振蕩軌跡的似然函數(shù),來推斷底層的有效速率常數(shù): g 、 g ? 與 d 。這一過程充分挖掘了隱藏在動(dòng)力學(xué)數(shù)據(jù)中的全部信息(見圖11)。通過該方法推斷出的底層參數(shù),與用于生成模擬數(shù)據(jù)的原始模型的參數(shù)具有很好的一致性(26)。最大口徑原理還能預(yù)測(cè)有效反饋強(qiáng)度 K 。

當(dāng)詳細(xì)模型未知時(shí),最大口徑原理是建模的優(yōu)選方法


圖12 基因網(wǎng)絡(luò)的傳統(tǒng)動(dòng)力學(xué)模型。(a) 質(zhì)量作用模型(MA):通過任意非線性函數(shù) f 描述平均行為(?A?),以實(shí)現(xiàn)對(duì)反饋的建模(kd 為降解速率)。(b) 質(zhì)量作用 - 隨機(jī)噪聲耦合模型(MA + 隨機(jī)噪聲):在質(zhì)量作用方程的基礎(chǔ)上引入隨機(jī)噪聲,得到朗之萬型方程。(c) 化學(xué)主方程模型(CME):基于躍遷概率 W 描述概率分布 P 的時(shí)間演化;而躍遷概率的確定,需要引入一組輔助物種 {Y},這類物種在實(shí)驗(yàn)中通常無法觀測(cè)。(d) 化學(xué)主方程 - 質(zhì)量作用耦合模型(CME + MA):一種粗粒化模型,其核心是將質(zhì)量作用模型中使用的唯象函數(shù) f 替代躍遷概率 W,以此描述概率的時(shí)間演化。

傳統(tǒng)建模方法在處理少顆粒動(dòng)力學(xué)與復(fù)雜系統(tǒng)時(shí)存在固有限制(圖 12)。質(zhì)量作用模型(Mass-Action Model, MA)僅能描述質(zhì)量作用效應(yīng)(即宏觀尺度的體相平均動(dòng)力學(xué)),無法刻畫動(dòng)力學(xué)漲落或速率分布。質(zhì)量作用 - 噪聲耦合模型(MA + Noise Models)試圖彌補(bǔ)這一缺陷:其通過預(yù)設(shè)的分布形式引入時(shí)間漲落,朗之萬方程便是典型代表(27)。然而,這類模型所預(yù)設(shè)的漲落分布并非在所有場(chǎng)景下都成立。例如,此類噪聲模型僅適用于動(dòng)力學(xué)行為服從簡(jiǎn)單單峰分布的系統(tǒng),無法處理雙穩(wěn)態(tài)開關(guān)電路中存在的雙峰分布問題。此外,該類模型通常通過引入非線性函數(shù) f 來描述復(fù)雜動(dòng)力學(xué)過程 —— 如希爾形式的函數(shù) 。這類函數(shù)往往是人為特設(shè)的,其形式無法通過獨(dú)立實(shí)驗(yàn)驗(yàn)證,且需要引入多個(gè)可調(diào)參數(shù)。

化學(xué)主方程模型(Chemical Master Equation, CME)(28)能夠明確且恰當(dāng)?shù)孛枋鰟?dòng)力學(xué)漲落。但構(gòu)建化學(xué)主方程模型的前提是,研究人員必須掌握系統(tǒng)完整的反應(yīng)網(wǎng)絡(luò)細(xì)節(jié) —— 即明確多物種體系下的所有反應(yīng)狀態(tài),以及狀態(tài)之間的躍遷關(guān)系(對(duì)應(yīng)圖 12 中的 Y)。然而,這類多物種反應(yīng)的細(xì)節(jié)往往無法通過實(shí)驗(yàn)進(jìn)行驗(yàn)證。這就導(dǎo)致化學(xué)主方程模型存在兩個(gè)關(guān)鍵問題:其一,模型包含的參數(shù)數(shù)量過多;其二,模型的相空間規(guī)模過于龐大。即便是雙穩(wěn)態(tài)開關(guān)電路或阻遏振蕩器這類相對(duì)簡(jiǎn)單的系統(tǒng),其相空間的計(jì)算量也可能達(dá)到難以處理的程度。盡管有限狀態(tài)投影法(Finite State Projection, FSP)(29)能夠在一定程度上壓縮相空間的規(guī)模,但多物種體系帶來的組合爆炸問題仍然是一個(gè)巨大的挑戰(zhàn)。化學(xué)主方程 - 質(zhì)量作用耦合模型(CME + MA Models)(30)雖然能夠描述系統(tǒng)的漲落行為,但同樣需要引入類似希爾函數(shù) fHill 的非線性函數(shù),且模型中的參數(shù)往往無法反映系統(tǒng)的真實(shí)底層作用機(jī)制。

當(dāng)關(guān)于底層電路的可用信息極其有限時(shí),最大口徑原理便是建模的優(yōu)選方法。它為推導(dǎo)觀測(cè)軌跡的概率分布提供了一套嚴(yán)謹(jǐn)?shù)睦碚摽蚣?—— 即便是針對(duì)復(fù)雜動(dòng)力學(xué)系統(tǒng),也無需對(duì)非線性函數(shù)的形式作出常規(guī)的預(yù)設(shè)。得益于其自上而下的建模本質(zhì),該方法能夠?qū)⑾嗫臻g的規(guī)模控制在最小限度,從而解決了化學(xué)主方程面臨的計(jì)算難題;同時(shí),它又避免了化學(xué)主方程 - 質(zhì)量作用耦合模型中人為特設(shè)的假設(shè)。最大口徑原理會(huì)充分利用軌跡中包含的全部信息,而非僅對(duì)軌跡進(jìn)行平均化處理 —— 即便是在實(shí)驗(yàn)無法精確測(cè)量目標(biāo)物理量的情況下,這一優(yōu)勢(shì)依然存在。因此,將最大口徑原理與用于參數(shù)求解的最大似然法相結(jié)合,能夠妥善處理以熒光信號(hào)形式呈現(xiàn)的實(shí)驗(yàn)數(shù)據(jù),而無需直接獲得分子數(shù)量的精確值 —— 這正是實(shí)驗(yàn)中最常見的情況。通過引入熒光強(qiáng)度 - 分子數(shù)量轉(zhuǎn)換的分布函數(shù) ,最大口徑原理可以直接構(gòu)建原始熒光軌跡的觀測(cè)似然函數(shù)。借助這一方法,該原理能夠?qū)晤w粒熒光信號(hào)的固有不確定性與少顆粒體系的本征漲落(由電路自身的結(jié)構(gòu)特征決定)分離開來,并基于此構(gòu)建電路的細(xì)節(jié)模型。已有研究證實(shí),將最大口徑原理、最大似然參數(shù)估計(jì)法與熒光 - 分子數(shù)轉(zhuǎn)換模型相結(jié)合的建模框架,在多種不同的基因電路中均取得了成功的應(yīng)用(20, 22, 26)。

在此,我們針對(duì)分子動(dòng)力學(xué)建模的相關(guān)問題,提出一個(gè)具有普適性的觀點(diǎn)。動(dòng)力學(xué)教材中所描述的反應(yīng)機(jī)制,通常是指在反應(yīng)物轉(zhuǎn)化為產(chǎn)物的主導(dǎo)反應(yīng)路徑上,可能存在的中間步驟。這類機(jī)制的研究對(duì)象是平均化的主導(dǎo)反應(yīng)路徑,因?yàn)橄嚓P(guān)實(shí)驗(yàn)通常是在包含大量分子的燒杯中進(jìn)行的。而本文旨在解決一個(gè)截然不同的挑戰(zhàn):即如何利用路徑分布所提供的額外信息(以隨機(jī)時(shí)間軌跡的形式呈現(xiàn)),而非僅依賴平均化的結(jié)果,來研究少顆粒動(dòng)力學(xué)系統(tǒng)中的反應(yīng)機(jī)制。對(duì)于少顆粒流動(dòng)系統(tǒng)而言,反應(yīng)路徑的分布本身也能提供豐富的機(jī)制性信息(即前文所述的拉格朗日乘子相關(guān)物理量)。但需要強(qiáng)調(diào)的是,最大口徑原理與中間態(tài)建模并非相互排斥。我們可以輕松地對(duì)上述最大口徑模型進(jìn)行擴(kuò)展,引入任何描述中間態(tài)所需的額外變量;這些變量的加入,將為中間態(tài)附近的反應(yīng)路徑分布提供更為深入的洞見。換言之,只要有相應(yīng)的實(shí)驗(yàn)數(shù)據(jù)支持,最大口徑原理始終可以納入更多的信息。而在缺乏數(shù)據(jù)的情況下,該方法會(huì)在避免引入不必要假設(shè)的同時(shí),構(gòu)建出一個(gè)最小且自洽的有效模型。

最大口徑原理可以進(jìn)行單細(xì)胞數(shù)據(jù)驅(qū)動(dòng)的網(wǎng)絡(luò)參數(shù)的分布推斷

細(xì)胞內(nèi)部存在由速率系數(shù) k 構(gòu)成的生化網(wǎng)絡(luò),這些速率系數(shù)在時(shí)間尺度上近似保持恒定(31)。生化物種的豐度 x(k,t) 隨時(shí)間的漲落服從泊松少顆粒統(tǒng)計(jì)規(guī)律 ,這類漲落被稱為內(nèi)源噪聲(intrinsic noise)。該內(nèi)源變異性的強(qiáng)度與物種平均豐度 N 成反比(標(biāo)度關(guān)系為 ∝1 / N ),其中 N 為某物種的典型平均分子數(shù)。

另一種變異性被稱為外源噪聲(extrinsic noise)(32),其產(chǎn)生的原因是:速率參數(shù) k 本身會(huì)在不同細(xì)胞之間存在差異。這種變異性會(huì)導(dǎo)致我們?cè)诓煌?xì)胞中觀測(cè)到彼此不同的隨機(jī)時(shí)間軌跡。那么,我們能否推斷出包含外源噪聲影響的物種豐度軌跡的分布 P(Γ) —— 即描述豐度 x(k,t) 整體分布的模型?

這一問題面臨的核心挑戰(zhàn)在于:流式細(xì)胞術(shù)、免疫熒光染色(33)及單細(xì)胞 RNA 測(cè)序(34)等實(shí)驗(yàn)技術(shù),無法直接獲取單個(gè)細(xì)胞內(nèi)部的隨機(jī)時(shí)間軌跡。這些技術(shù)僅能在某一特定的時(shí)間快照下,提供由細(xì)胞間差異所導(dǎo)致的生化物種豐度分布。最大口徑原理能夠基于此類時(shí)間快照數(shù)據(jù),實(shí)現(xiàn)對(duì)外源變異性的定量分析(35)。Dixit 及其團(tuán)隊(duì)近期開發(fā)了一種新方法(35, 36),可從單細(xì)胞快照數(shù)據(jù)中直接推斷出參數(shù)的分布 P(k) 。此外,最大口徑原理還能進(jìn)一步推斷出細(xì)胞群體中物種豐度軌跡的分布 P(Γ) 。

最大口徑原理可實(shí)現(xiàn)網(wǎng)絡(luò)上輸運(yùn)動(dòng)力學(xué)的估計(jì)


圖14 最大口徑原理可快速實(shí)現(xiàn)網(wǎng)絡(luò)輸運(yùn)流量的估計(jì)。若已知在網(wǎng)絡(luò)中流動(dòng)的可移動(dòng)單元的定態(tài)布居數(shù),最大口徑方程(式 25)便能給出完整的躍遷速率矩陣 —— 該矩陣即為使路徑熵最大化的唯一解。

我們考慮如下具體問題:某一生物分子存在多種不同的亞穩(wěn)態(tài)構(gòu)象。我們希望計(jì)算得到完整的躍遷速率矩陣,其中包含任意兩個(gè)構(gòu)象態(tài) a 與 b 之間的所有躍遷速率 k ab 。當(dāng)采用分子動(dòng)力學(xué)模擬方法解決這一問題時(shí),計(jì)算過程往往既緩慢又具有極大挑戰(zhàn)性——其根源在于,構(gòu)象躍遷屬于稀有事件,涉及高自由能的中間態(tài),而這類中間態(tài)在模擬中難以被充分采樣。然而,最大口徑原理提供了一種快速的解決方案:只需輸入易于快速獲取的有限信息,即可對(duì)該速率矩陣進(jìn)行近似估計(jì)。若計(jì)算機(jī)模擬能夠在構(gòu)象空間中進(jìn)行充分搜索,以識(shí)別并采樣得到各亞穩(wěn)態(tài)的布居數(shù) p a ;且我們已知一個(gè)或兩個(gè)全局速率量(例如,整體躍遷過程的發(fā)生速率),那么最大口徑原理便可預(yù)測(cè)出使路徑熵最大化的躍遷速率矩陣(圖13)。

具體而言,對(duì)于一個(gè)包含 N 個(gè)狀態(tài) {a,b,…} 的馬爾可夫系統(tǒng),其路徑熵可由定態(tài)分布 {pa} 與躍遷概率 {kab} 明確表示。此時(shí)路徑熵的可以表示為(37):


在有限的速率信息約束下,最大口徑原理通過最大化式(24)中的路徑熵函數(shù),實(shí)現(xiàn)對(duì)躍遷概率矩陣的估計(jì)。

此處的有限信息可包含以下幾類:

a .完整的定態(tài)分布 p a (例如,參見文獻(xiàn)38, 39);

b. 定態(tài)的平均值 E=∑ p a E a ;

c. 動(dòng)力學(xué)物理量的路徑系綜平均值。

根據(jù)所施加約束條件的不同,該熵最大化問題可通過解析或半解析的方式求解。具體而言,Dixit 等人(40)證明,最大口徑原理所得到的躍遷速率 r ab 可表示為:


其中, γ 為拉格朗日乘子,其作用是強(qiáng)制動(dòng)力學(xué)平均值 J 滿足預(yù)設(shè)的約束值。

最大口徑原理所構(gòu)建的馬爾可夫過程,已在多個(gè)研究領(lǐng)域得到成功應(yīng)用,包括:生物分子動(dòng)力學(xué)的解析(37–46)、生化反應(yīng)網(wǎng)絡(luò)的建模(47)、決策理論(48)以及機(jī)器學(xué)習(xí)(49)。在此,我們將選取其中兩個(gè)應(yīng)用實(shí)例,進(jìn)行詳細(xì)的闡述。

基于分子模擬的構(gòu)象變化動(dòng)力學(xué)估計(jì)

蛋白質(zhì)分子的分子模擬常被用于獲取構(gòu)象變化的速率與路徑,因?yàn)檫@些過程往往是決定生物機(jī)制的關(guān)鍵。如前所述,這類模擬面臨的核心挑戰(zhàn)在于:分子動(dòng)力學(xué)模擬對(duì)稀有動(dòng)力學(xué)躍遷(高自由能態(tài))的識(shí)別與采樣能力,遠(yuǎn)弱于其對(duì)穩(wěn)定態(tài)與亞穩(wěn)態(tài)的識(shí)別和探索能力。而最大口徑方程(式25)為解決這一問題提供了一種實(shí)用、簡(jiǎn)便且高效的方案——若已知穩(wěn)定態(tài)與亞穩(wěn)態(tài)的布居數(shù),且掌握一個(gè)或兩個(gè)全局平均速率量,即可通過該方程估計(jì)出這些構(gòu)象態(tài)之間的所有躍遷速率(見圖13)。已有研究以一個(gè)七殘基丙氨酸肽為模型系統(tǒng),驗(yàn)證了該公式的估計(jì)精度:該系統(tǒng)的完整速率矩陣已通過大量精確計(jì)算獲得,而最大口徑理論的預(yù)測(cè)結(jié)果與之一致(40)。

式25也被成功應(yīng)用于更大、更復(fù)雜的蛋白質(zhì)構(gòu)象變化過程——即G蛋白偶聯(lián)受體(GPCR)在配體激活動(dòng)力學(xué)中發(fā)生的別構(gòu)躍遷(50)。應(yīng)用式25的一個(gè)主要問題在于:如何從無偏動(dòng)力學(xué)系綜中確定動(dòng)力學(xué)平均值 ?J? ,并進(jìn)而求解拉格朗日乘子 γ 。大多數(shù)用于確定平衡態(tài)能量景觀的計(jì)算采樣技術(shù),均采用有偏系綜,因此無法用于估計(jì)動(dòng)力學(xué)量。近期,Meral等人(50)提出了一種巧妙的解決方案。他們利用了以下關(guān)鍵事實(shí):在元?jiǎng)恿W(xué)模擬中,可通過集合變量坐標(biāo)(collective variable coordinate,CV),從有偏系綜中估計(jì)出無偏的動(dòng)力學(xué)平均值(51)?;诖耍麄?cè)隈R爾可夫態(tài)模型(Markov State Mode, MSM)中,同時(shí)實(shí)現(xiàn)了兩項(xiàng)關(guān)鍵任務(wù):估計(jì)平衡態(tài)分布,以及獲得多個(gè)物理量的無偏動(dòng)力學(xué)平均值。隨后,他們將這些結(jié)果代入式25,成功估計(jì)出了構(gòu)象躍遷速率。

分子模擬中反應(yīng)坐標(biāo)的確定


圖14 最大口徑原理可實(shí)現(xiàn)優(yōu)質(zhì)反應(yīng)坐標(biāo)(RC)的識(shí)別。復(fù)雜的勢(shì)能景觀(圖 a)可被投影至任意反應(yīng)坐標(biāo)上;ΔG代表自由能(圖 b、c)。最大口徑原理使我們能夠快速估計(jì)沿任意反應(yīng)坐標(biāo)的近似動(dòng)力學(xué),并識(shí)別出能實(shí)現(xiàn)時(shí)間尺度最大程度分離的反應(yīng)坐標(biāo)(圖 d、e)。在本簡(jiǎn)單實(shí)例中,反應(yīng)坐標(biāo) 1(RC1)是優(yōu)于反應(yīng)坐標(biāo) 2(RC2)的優(yōu)質(zhì)反應(yīng)坐標(biāo)。

生物分子變化的計(jì)算機(jī)模擬中,一個(gè)重要的挑戰(zhàn)是找到主導(dǎo)反應(yīng)坐標(biāo)。構(gòu)象空間具有高維性,模擬對(duì)其的采樣往往十分稀疏;即便已知一個(gè)優(yōu)質(zhì)的反應(yīng)坐標(biāo),若沒有足夠的采樣以獲得收斂的布居數(shù),也無法得到沿該坐標(biāo)的躍遷速率。近期,Tiwary及其團(tuán)隊(duì)(41, 42, 45)開發(fā)了一種巧妙的方法,利用最大口徑方程(式25)來確定反應(yīng)坐標(biāo)。他們采用元?jiǎng)恿W(xué)對(duì)目標(biāo)過程進(jìn)行模擬——該方法首先需要選擇一些與當(dāng)前研究問題相關(guān)的集體變量。其具體步驟如下:

第一步:估計(jì)沿任意一組集體變量線性組合的自由能剖面。

第二步:對(duì)于任意給定的反應(yīng)坐標(biāo)線性組合,利用最大口徑方程(式25),在網(wǎng)格上估計(jì)出近似的速率矩陣。

第三步:將使速率矩陣的能隙(譜隙)達(dá)到最大值的線性組合,選為最優(yōu)反應(yīng)坐標(biāo)(42)(見圖14)。

值得注意的是,對(duì)線性組合的優(yōu)化無需額外的模擬計(jì)算。這是因?yàn)?,元?jiǎng)恿W(xué)等增強(qiáng)采樣模擬技術(shù)具有一項(xiàng)關(guān)鍵優(yōu)勢(shì):若已知沿某一組線性組合的自由能剖面,即可直接估計(jì)出沿任意其他線性組合的自由能剖面(42)。

該方法所基于的核心原理如下:反應(yīng)坐標(biāo)通常描述的是大尺度運(yùn)動(dòng),其速率慢于小尺度運(yùn)動(dòng)(如側(cè)鏈旋轉(zhuǎn)、溶劑分子的微小位移等)。因此,具有清晰分離的慢運(yùn)動(dòng)過程的路徑,是優(yōu)質(zhì)反應(yīng)坐標(biāo)的理想候選。該方法已被擴(kuò)展至多維反應(yīng)坐標(biāo)的確定(45),并在多個(gè)實(shí)例中得到了成功應(yīng)用(43, 44)。

基于新數(shù)據(jù)的最大口徑原理:馬爾可夫模型的修正與更新


圖15 生長(zhǎng)因子激活通路的模型。受體的四個(gè)狀態(tài)(①~④)定義如下:① 細(xì)胞表面的無配體結(jié)合受體(綠色)可被配體(黃色)結(jié)合,進(jìn)入狀態(tài)②;隨后發(fā)生磷酸化,進(jìn)入狀態(tài)③。④ 所有狀態(tài)的受體均可被內(nèi)吞并降解,不同狀態(tài)下的內(nèi)吞降解速率存在差異。圖中箭頭代表躍遷速率;最大口徑原理預(yù)測(cè)的變化最顯著的躍遷速率 ,在圖 (a) 中以灰色標(biāo)注,在圖 (b) 中以粉色標(biāo)注。

我們考慮如下一個(gè)常見的實(shí)際問題:某模型網(wǎng)絡(luò)的所有微觀速率均已完成估計(jì)。但在后續(xù)研究中,可能會(huì)出現(xiàn)模型預(yù)測(cè)與實(shí)驗(yàn)數(shù)據(jù)不一致的情況——其原因可能是實(shí)驗(yàn)系統(tǒng)受到了擾動(dòng),或是初始的速率估計(jì)存在誤差。例如,在蛋白質(zhì)折疊模擬中,由于全原子力場(chǎng)的不精確性,計(jì)算得到的折疊速率可能與實(shí)驗(yàn)結(jié)果不符。采樣不足也可能導(dǎo)致此類誤差,這是生物分子模擬中一個(gè)眾所周知的問題(52)。那么,如何對(duì)原有的速率矩陣進(jìn)行修正呢?在大多數(shù)情況下,這個(gè)問題并沒有唯一的解。而最大口徑原理為我們提供了一種最優(yōu)方案:它可以對(duì)完整的微觀速率矩陣進(jìn)行修正,使模型與新的實(shí)驗(yàn)數(shù)據(jù)達(dá)成一致(47, 53)。

若原始的計(jì)算速率為 { q ab } ,則修正后的、與新數(shù)據(jù)自洽的速率可表示為 { k ab } 。這些修正速率的求解方式為:最大化如下的相對(duì)熵


再舉一個(gè)具體的實(shí)例(47):一種生長(zhǎng)因子膜受體蛋白會(huì)經(jīng)歷一個(gè)四態(tài)生化循環(huán),其狀態(tài)包括:未結(jié)合配體態(tài)、配體結(jié)合態(tài)、磷酸化激活態(tài)以及降解態(tài)(見圖15)。對(duì)于正常的野生型蛋白,這些狀態(tài)之間的躍遷速率是已知的。

而當(dāng)該受體發(fā)生某些突變時(shí)(例如,在某些癌癥中出現(xiàn)的突變(54)),會(huì)導(dǎo)致激活態(tài)的布居數(shù) p act 出現(xiàn)可觀測(cè)的增加。我們希望利用這一單一的觀測(cè)結(jié)果,來更新四態(tài)模型的預(yù)測(cè)布居數(shù)與躍遷速率。為實(shí)現(xiàn)這一目標(biāo),我們?cè)诩せ顟B(tài)布居數(shù)的新值作為約束條件下,最大化相對(duì)路徑熵。值得注意的是,盡管存在無窮多種更新速率矩陣以擬合該觀測(cè)數(shù)據(jù)的方式,但該方法的預(yù)測(cè)結(jié)果顯示:激活態(tài)布居數(shù)的增加,最有可能是通過降低受體的內(nèi)吞速率實(shí)現(xiàn)的(47)。這一結(jié)論與生長(zhǎng)因子信號(hào)通路中一個(gè)已被充分證實(shí)的異?,F(xiàn)象完全一致(54, 55)。

最大口徑原理的其他應(yīng)用

最大口徑原理已成功應(yīng)用于鳥類群集行為(56)、細(xì)胞遷移運(yùn)動(dòng)(57)及神經(jīng)元放電活動(dòng)(10, 58)等研究領(lǐng)域。針對(duì)鳥類群集行為,Cavagna 等人(56)構(gòu)建了一套最大口徑理論框架,該框架可實(shí)現(xiàn)對(duì)連續(xù)兩個(gè)時(shí)間步長(zhǎng)下觀測(cè)變量的關(guān)聯(lián)分析。在利用模擬數(shù)據(jù)進(jìn)行基準(zhǔn)測(cè)試時(shí),該模型的性能顯著優(yōu)于僅基于靜態(tài)信息構(gòu)建的模型。Tweedy 等人(57)則利用最大口徑原理,建立了基于細(xì)胞形態(tài)的細(xì)胞遷移運(yùn)動(dòng)模型。他們通過分析細(xì)胞形態(tài)軌跡的時(shí)間演化,推斷出對(duì)應(yīng)的拉格朗日乘子。研究表明,這些推斷得到的拉格朗日乘子能夠有效區(qū)分經(jīng)藥物處理的細(xì)胞與未處理的對(duì)照細(xì)胞,以及基因修飾細(xì)胞與未修飾的親本細(xì)胞。此外,最大口徑原理還被用于捕捉神經(jīng)元群體中復(fù)雜的臨界動(dòng)力學(xué)行為(10, 58)。當(dāng)視網(wǎng)膜神經(jīng)元暴露于自然圖像刺激時(shí),會(huì)表現(xiàn)出全或無的放電響應(yīng)。已有研究利用最大熵原理(59),證實(shí)了神經(jīng)元群體放電的統(tǒng)計(jì)特性中存在臨界行為。這些研究發(fā)現(xiàn),最大熵模型中被精細(xì)調(diào)節(jié)至臨界態(tài)的拉格朗日乘子,其對(duì)應(yīng)的物理模型為自旋玻璃模型。Mora 等人(10)將這些觀測(cè)結(jié)果擴(kuò)展至動(dòng)力學(xué)范疇:他們通過對(duì)跨時(shí)間的神經(jīng)元間關(guān)聯(lián)施加約束,構(gòu)建了神經(jīng)元群體行為的動(dòng)力學(xué)模型。研究結(jié)果表明,利用最大口徑原理納入神經(jīng)元放電的動(dòng)力學(xué)信息后,模型可預(yù)測(cè)出視網(wǎng)膜神經(jīng)元同樣處于動(dòng)力學(xué)臨界態(tài)。

最大口徑原理自然導(dǎo)出了非平衡物理學(xué)的經(jīng)典結(jié)果

為何馬爾可夫模型在非平衡物理中如此普遍?

馬爾可夫建模對(duì)廣泛的動(dòng)力學(xué)過程均具有良好的適用性。在一階馬爾可夫模型中,其核心假設(shè)為:僅需獲知某一給定狀態(tài)及其相鄰動(dòng)力學(xué)狀態(tài)(即緊鄰的前序與后續(xù)狀態(tài))的性質(zhì),即可對(duì)各狀態(tài)的布居數(shù)及狀態(tài)間的躍遷速率進(jìn)行充分近似。該模型忽略了任何更長(zhǎng)期的記憶效應(yīng)。那么,為何馬爾可夫模型在自然系統(tǒng)的建模中如此普遍且實(shí)用?最大口徑原理為此提供了一種合理的解釋。在各類建模方法中,最大口徑原理是最大程度的數(shù)據(jù)驅(qū)動(dòng)方法——其僅使用直接測(cè)量得到的可觀測(cè)量。此處的核心觀點(diǎn)在于:某一特定實(shí)驗(yàn)所能提供的數(shù)據(jù)性質(zhì),決定了能夠捕捉這些數(shù)據(jù)的最優(yōu)模型。例如,對(duì)于一個(gè)兩態(tài)過程 A?B ,若我們僅獲知四個(gè)物理量——從 A 到 B 、 A 到 A 、 B 到 B 及 B 到 A 的躍遷頻率——那么,使口徑最大化的模型類別即為一階馬爾可夫模型(60-63)。除非我們擁有更多的信息,否則引入更多參數(shù)的模型(例如高階馬爾可夫模型)均缺乏合理的依據(jù)。通過在上述給定約束集下最大化口徑,可直接推導(dǎo)出如下結(jié)論:連續(xù)兩個(gè)時(shí)間步長(zhǎng)內(nèi),兩狀態(tài)間的躍遷速率僅依賴于前一個(gè)時(shí)間步的狀態(tài)。當(dāng)數(shù)據(jù)涉及兩個(gè)以上的時(shí)間步(即系統(tǒng)存在記憶效應(yīng))時(shí),Lee與Pressé(62)給出了嚴(yán)格的數(shù)學(xué)描述。

近平衡統(tǒng)計(jì)物理的已知結(jié)論可由最大口徑原理推導(dǎo)

最大口徑原理可推導(dǎo)出近平衡統(tǒng)計(jì)物理中一系列著名的結(jié)論,這些結(jié)論建立了通量、流與熵產(chǎn)生之間的關(guān)聯(lián)。其中包括格林-久保關(guān)系(Green–Kubo relationship)、昂薩格倒易關(guān)系(Onsager’s reciprocal relationship) 以及普里戈金最小熵產(chǎn)生原理(Prigogine’s minimum entropy production principle)(64)。例如,繼Thomson關(guān)于電流與熱流耦合的實(shí)驗(yàn)之后,昂薩格考慮了兩種流的耦合問題——即兩種流(記為 a 與 b )在兩個(gè)熱庫之間的流動(dòng)。若通量 J a 與 J b 與驅(qū)動(dòng)力( λ a , λ b )呈線性關(guān)系,則其耦合形式可表示為:


昂薩格基于微觀理論提出了倒易關(guān)系的論證,即 L ab = L ba 。而利用最大口徑原理,該關(guān)系的推導(dǎo)過程可被極大簡(jiǎn)化。首先,若對(duì)于任意給定軌跡 Γ ,任意時(shí)刻的粒子通量為 j a ( Γ ,t) 與 j b ( Γ ,t) ,則最大口徑原理預(yù)測(cè)的軌跡分布為:


其中, Q d 為動(dòng)力學(xué)配分函數(shù), λ a (t) 與 λ b (t) 為拉格朗日乘子, p( Γ ) 為平衡態(tài)分布。由于最大口徑原理是一種基于配分函數(shù)的方法,我們可直接得到其一級(jí)與二級(jí)偏導(dǎo)數(shù):


與平衡態(tài)熱力學(xué)中的麥克斯韋關(guān)系(Maxwell relations)類似,此處得到的二級(jí)偏導(dǎo)數(shù)與求導(dǎo)順序無關(guān)。由此,昂薩格倒易關(guān)系可直接推導(dǎo)得出(推導(dǎo)細(xì)節(jié)參見參考文獻(xiàn)64)。

這些耦合關(guān)系的應(yīng)用范圍十分廣泛,不僅適用于熱電學(xué)或功與熱的轉(zhuǎn)換,還可用于描述:生化能量源如何驅(qū)動(dòng)化學(xué)反應(yīng)、分子馬達(dá)與離子泵的運(yùn)行;能量源如何提高生物分子鐘與校對(duì)機(jī)制的精度;以及光伏材料如何實(shí)現(xiàn)光與電流或熱的耦合。

本綜述的問題、批評(píng)、展望與局限性

本節(jié)將提供更廣闊的研究背景。但首先需要說明的是,受篇幅限制,我們無法對(duì)非平衡統(tǒng)計(jì)物理中其他重要、活躍且相關(guān)的研究方向進(jìn)行綜述,例如隨機(jī)熱力學(xué)(stochastic thermodynamics)(65)與大偏差理論(large-deviation theory)(66)。

最大口徑原理能否正確處理耗散過程?

最大口徑原理能否正確處理耗散過程?(67, 68)若 Γ 表示一條軌跡,且僅施加單一約束 ?J? ,則最大口徑原理預(yù)測(cè)的路徑布居數(shù)為:


但我們可以設(shè)想一個(gè)具體的實(shí)例:一個(gè)粒子在粘性流體中運(yùn)動(dòng)。其平均速度可通過兩種不同的方式實(shí)現(xiàn):在高粘度介質(zhì)中施加一個(gè)較大的力,或在低粘度介質(zhì)中施加一個(gè)較小的力。我們有理由認(rèn)為,這兩種情況下的路徑分布應(yīng)當(dāng)是不同的。然而,式(32)卻暗示這兩種路徑分布不存在差異。這是否意味著最大口徑原理的失效?答案是否定的。事實(shí)上,這兩種情況下的路徑分布確實(shí)是不同的。但對(duì)于此類耗散系統(tǒng),僅施加單一的 ?J? 約束是不充分的——在這類系統(tǒng)中,能量輸入與輸出的速率 同樣是至關(guān)重要的。對(duì)于這種情況,我們需要引入如下的分布形式(69):

正如在一個(gè)精確模型中所展示的那樣,這一額外的約束將導(dǎo)致正確的速率分布(69)。然而,需要注意的是,最大口徑原理本身并不會(huì)指定某一特定問題需要哪些約束。這是建模者需要做出的決策,其取決于該特定問題中哪些物理量是相關(guān)的。這一挑戰(zhàn)與平衡態(tài)熱力學(xué)中的情況類似:在體積與濃度同時(shí)發(fā)生變化的情況下,僅指定溫度是不充分的;此時(shí),還必須同時(shí)指定壓力與化學(xué)勢(shì)。

從數(shù)據(jù)中學(xué)習(xí)拉格朗日乘子的數(shù)值問題

將最大口徑原理應(yīng)用于含噪聲的生物數(shù)據(jù)時(shí),往往會(huì)面臨數(shù)值計(jì)算的挑戰(zhàn)。利用數(shù)據(jù)同時(shí)擬合多個(gè)拉格朗日乘子的計(jì)算成本可能極高(70, 71)。數(shù)據(jù)擬合過程可能需要同時(shí)求解 N 個(gè)非線性方程,而這些方程通常并非相互獨(dú)立。此外, ?J? 如何依賴于統(tǒng)計(jì)權(quán)重的解析表達(dá)式往往是不可得的。同時(shí),實(shí)驗(yàn)數(shù)據(jù)通常也會(huì)包含實(shí)驗(yàn)誤差。因此,從數(shù)據(jù)中獲取拉格朗日乘子的過程,可能需要對(duì)耦合的非線性方程組進(jìn)行隨機(jī)采樣。這導(dǎo)致我們有時(shí)無法將約束條件確定為精確的固定值,而只能將其表示為拉格朗日乘子的可能分布(35)。最大口徑原理應(yīng)用中的另一項(xiàng)挑戰(zhàn)在于狀態(tài)空間的確定。正如在基因網(wǎng)絡(luò)或生物分子的馬爾可夫模型中所展示的那樣,我們通常需要先驗(yàn)地指定一個(gè)狀態(tài)空間。而更復(fù)雜的模型則無需預(yù)先指定該空間(72, 73)。

最大口徑原理是一種推斷原理,還是一種物理原理?

綜上所述,最大口徑原理是一種通用的方法,用于在動(dòng)力學(xué)過程的模型中推斷速率與路徑的分布。給定一個(gè)模型,以及有限的數(shù)據(jù)集——例如幾個(gè)平均速率或其他任意矩——最大口徑原理可預(yù)測(cè)出與該模型、數(shù)據(jù)及概率論規(guī)則均自洽的分布。我們認(rèn)為,這一思想與平衡態(tài)統(tǒng)計(jì)力學(xué)推斷分布的方式在本質(zhì)上是完全相同的。我們將整個(gè)統(tǒng)計(jì)力學(xué)視為對(duì)物理模型進(jìn)行推理的過程。

一個(gè)相關(guān)的問題是:統(tǒng)計(jì)力學(xué)能否從力學(xué)中推導(dǎo)出來以及其是否比單純的推理更為深刻?我們的觀點(diǎn)是,在實(shí)際應(yīng)用中,這是無法實(shí)現(xiàn)的。雖然熱力學(xué)第一定律關(guān)乎能量與力學(xué),其建立在物理量的基礎(chǔ)之上;但熱力學(xué)第二定律則關(guān)乎布居數(shù)——因此,其本質(zhì)是關(guān)于推理或概率論的。我們無法從第一定律推導(dǎo)出第二定律。并非所有的物理規(guī)律都能僅從純粹的力學(xué)中推導(dǎo)出來。借用E.T. Jaynes的表述:玻爾茲曼的過人之處在于,他認(rèn)識(shí)到盡管氣體的行為在原則上可以通過追蹤所有彈子球式的碰撞過程來確定,但計(jì)算氣體性質(zhì)的唯一實(shí)用方法,是用統(tǒng)計(jì)描述來替代詳細(xì)的力學(xué)過程——這正是“統(tǒng)計(jì)力學(xué)”一詞的由來(74)。一旦我們接受了玻爾茲曼的這一智識(shí)飛躍,并采用熵的表達(dá)式 S=k ln ?W 或 S=?∑ p i ln ? p i ,我們就必然將熵的變化視為從數(shù)據(jù)中對(duì)模型進(jìn)行推理的任務(wù)。

盡管如此,物理推理與非物理推理之間仍存在差異。若我們僅獲知平均通量,最大口徑原理可以推斷出其分布,但無法提供更多的信息。然而,若我們?cè)谧畲罂趶皆碇惺褂玫哪P透呶锢硇裕覀儎t可以獲得更多的信息——例如,速率如何依賴于粒子的性質(zhì)或流網(wǎng)絡(luò)的結(jié)構(gòu)。此外,在哈密頓動(dòng)力學(xué)適用的情況下,其可以提供額外的機(jī)制性洞見,將力與流與底層分子的性質(zhì)關(guān)聯(lián)起來。而且,在各類不同的約束中,溫度在統(tǒng)計(jì)熱力學(xué)中占據(jù)著特殊的地位。熱平衡態(tài)具有一個(gè)動(dòng)力學(xué)所不具備的實(shí)驗(yàn)真值,即克勞修斯關(guān)系(Clausius relationship) S Clausius = q/ T = ?U?/ T ,該關(guān)系可通過平均能量確定熵。但克勞修斯關(guān)系僅在平衡態(tài)下成立,且還受到其他多種限制性條件的約束。目前,對(duì)于遠(yuǎn)離平衡的動(dòng)力學(xué)過程,我們尚不知曉其對(duì)應(yīng)的實(shí)驗(yàn)真值基礎(chǔ)。

最大口徑原理如何解決非平衡物理的關(guān)鍵難題?

在此,我們簡(jiǎn)要總結(jié)最大口徑原理如何解決非平衡物理中的典型挑戰(zhàn)與問題。

最大口徑原理作用于軌跡(路徑),而非狀態(tài)

最大口徑原理模型可以包含所有相關(guān)的路徑,包括那些遠(yuǎn)離平衡態(tài)的路徑。Shore與Johnson(15)提出了一個(gè)重要但未被充分重視的觀點(diǎn):函數(shù) ?∑ p i ln ? p i 具有兩個(gè)關(guān)鍵性質(zhì):

a. 它是唯一能保證概率論規(guī)則自洽性的函數(shù);

b. 它僅對(duì)使自身最大化的單一分布函數(shù) 具有有效的預(yù)測(cè)能力。

最大口徑原理中所引入的唯一路徑熵為: ? ,

其中 為使該熵最大化的路徑概率。我們無需考慮該分布的任何偏差;因此,它滿足Shore-Johnson關(guān)于自洽概率推理的判據(jù)(15, 63, 75)。

其適用范圍不限于近平衡態(tài)

最大口徑原理不需要以連續(xù)函數(shù)為起點(diǎn)——例如,狀態(tài)熵 S state =S(U,V,N) ,該熵是空間與時(shí)間的廣延變量的連續(xù)可微函數(shù),且僅通過克勞修斯關(guān)系在平衡態(tài)下被嚴(yán)格定義。為了保證這種光滑性,局域平衡假設(shè)是必然的推論。這一假設(shè)具有很強(qiáng)的限制性,它將研究范圍局限于那些僅發(fā)生微小步驟、并在過程中不斷達(dá)到平衡的過程(76)。

其適用于非熱學(xué)系統(tǒng)

最大口徑原理不僅限于熱學(xué)過程或溫度熱庫,因此,它可輕松應(yīng)用于廣泛的流動(dòng)問題。它對(duì)模型或數(shù)據(jù)的來源不做任何假設(shè)。其適用范圍不僅限于材料、分子、分子碰撞、哈密頓系統(tǒng)、劉維爾定理、熱庫或溫度。最大口徑原理具有更廣泛的普適性,可應(yīng)用于隨機(jī)動(dòng)力學(xué)系統(tǒng)、基因電路、網(wǎng)絡(luò)及其他各類系統(tǒng)。

最大口徑原理為非平衡物理的不同類別提供了合理化的依據(jù)

非平衡過程通常被劃分為若干廣泛的類別,例如:平衡態(tài)、近平衡弛豫過程(例如,由施加于反應(yīng)網(wǎng)絡(luò)的條件變化或從高濃度到低濃度的擴(kuò)散所導(dǎo)致的弛豫)、近平衡定態(tài)(通過電阻的恒定歐姆電流,或球體在粘性液體中的緩慢拖曳),或遠(yuǎn)離平衡態(tài)(驅(qū)動(dòng)球體在流體中產(chǎn)生湍流)。根據(jù)在最大口徑原理的構(gòu)建中哪些約束是相關(guān)的,這些分類可以被自然地定義。當(dāng)然,平衡態(tài)需要滿足細(xì)致平衡條件,且不施加任何額外的速率約束。近平衡過程是一類耗散過程,但其耗散與固定外力下的某一流率 ?J? 呈線性比例關(guān)系。例如,歐姆熱耗散與電壓×電流成正比;另一個(gè)例子是斯托克斯定律,即球體在粘性液體中的耗散與力×速度成正比。在這些情況下,近平衡態(tài)可僅通過指定相關(guān)的速率 ?J? 來定義——因?yàn)楹纳⑴c流的線性比例關(guān)系,無需施加額外的耗散約束。近平衡態(tài)具有以下一項(xiàng)或多項(xiàng)相應(yīng)的特征:(a)線性的力-流關(guān)系;(b)熵產(chǎn)生與耗散的對(duì)應(yīng)關(guān)系;(c)局域平衡假設(shè)的適用性;以及(d)格林-久保關(guān)系、昂薩格倒易關(guān)系與普里戈金最小熵產(chǎn)生原理的成立(64)。相比之下,遠(yuǎn)離平衡的過程可能需要額外的信息來同時(shí)描述其宏觀與微觀性質(zhì)——例如,用于描述超 ?J? 所指定耗散的額外耗散模型,或無法被解釋為熱力學(xué)強(qiáng)度量簡(jiǎn)單梯度的力約束。

總結(jié):最大口徑原理

是一種適用于動(dòng)力學(xué)與路徑的通用變分原理

最大口徑原理是一種通用原理,用于在給定有限數(shù)據(jù)的情況下,推斷動(dòng)力學(xué)模型中速率與路徑的分布。它可以推導(dǎo)出著名的近平衡態(tài)結(jié)論,并能區(qū)分近平衡態(tài)與遠(yuǎn)離平衡態(tài),同時(shí)其在遠(yuǎn)離平衡態(tài)的情況下依然有效。它克服了傳統(tǒng)非平衡物理所面臨的諸多問題。結(jié)合模型,它可以推導(dǎo)出唯象定律,例如菲克定律。它適用于少粒子復(fù)雜系統(tǒng),例如基因電路。其核心邏輯對(duì)于構(gòu)建數(shù)據(jù)所允許的最簡(jiǎn)模型具有顯著的優(yōu)勢(shì)。盡管其在所有情境下的普適性尚未被完全證明,但所有的跡象均表明,它是一種適用于非平衡態(tài)的通用原理。

參考文獻(xiàn)

  1. Broder A 2000. Graph structure in the web. Comput. Netw. 33:309–320

  2. Zipf GK 1949. Human Behavior and the Principle of Least Effort. Cambridge, MA: Addison-Wesley

  3. Marsili M, Maslov S, Zhang YC 1998. Dynamical optimization theory of a diversified portfolio. Phys. A Stat. Mech. Appl. 253:403–418

  4. Cavagna A, Queirós SD, Giardina I, Stefanini F, Viale M 2013. Diffusion of individual birds in starling flocks. Proc. R. Soc. B Biol. Sci. 280:20122484

  5. Peterson J, Dixit P, Dill KA 2013. A maximum entropy framework for nonexponential distributions. PNAS 110:20380–20385

  6. Zeldovich K, Chen P, Shakhnovich E 2007. Protein stability imposes limits on organism complexity and speed of molecular evolution. PNAS 104:16152–16157

  7. Zou T, Williams N, Ozkan S, Ghosh K 2014. Proteome folding kinetics is limited by protein halflife. PLOS ONE 9:e112701

  8. Dixit PD, Maslov S 2013. Evolutionary capacitance and control of protein stability in protein-protein interaction networks. PLOS Comput. Biol. 9:e1003023

  9. Dixit PD, Pang TY, Maslov S 2017. Recombination-driven genome evolution and stability of bacterial species. Genetics 207:281–295

  10. Mora T, Deny S, Marre O 2015. Dynamical criticality in the collective activity of a population of retinal neurons. Phys. Rev. Lett. 114:078105

  11. Onsager L 1931. Reciprocal relations in irreversible processes. Phys. Rev. 37:405

  12. Prigogine I, Kondepudi D 1998. Modern Thermodynamics: From Heat Engines to Dissipative Structures. New York: John Wiley

  13. Martyushev LM, Seleznev VD 2006. Maximum entropy production principle in physics, chemistry and biology. Phys. Rep. 426:1–45

  14. Jaynes ET 1980. The minimum entropy production principle. Annu. Rev. Phys. Chem. 31:579–601

  15. Shore J, Johnson R 1980. Axiomatic derivation of the principle of maximum entropy and the principle of minimum cross-entropy. IEEE Trans. Inf. Theory 26:26–37

  16. Wu D, Ghosh K, Inamdar M, Lee H, Fraser S et al. 2009. Trajectory approach to two-state kinetics of single particles on sculpted energy landscapes. Phys. Rev. Lett. 103:050603

  17. Pressé S, Ghosh K, Phillips R, Dill KA 2010. Dynamical fluctuations in biochemical reactions and cycles. Phys. Rev. E 82:031905

  18. Ghosh K, Dill K, Inamdar M, Seitaridou E, Phillips R 2006. Teaching the principles of statistical dynamics. Am. J. Phys. 74:123–133

  19. Seitaridou E, Inamdar M, Phillips R, Ghosh K, Dill K 2007. Measuring flux distributions for diffusion in the small-numbers limit. J. Phys. Chem. B 111:2288–2292

  20. Firman T, Balazsi G, Ghosh K 2017. Building predictive models of genetic circuits using the principle of maximum caliber. Biophys. J. 113:2121–2130

  21. Nevozhay D, Adams R, Itallie EV, Bennett M, Balázsi G 2012. Mapping the environmental fitness landscape of a synthetic gene circuit. PLOS Comput. Biol. 8:e1002480

  22. Firman T, Wedekind S, McMorrow TJ, Ghosh K 2018. Maximum caliber can characterize genetic switches with multiple hidden species. J. Phys. Chem. B 122:5666–5677

  23. Gardner T, Cantor C, Collins J 2000. Construction of a genetic toggle switch in Escherichia coli. Nature 403:339–342

  24. Pressé S, Ghosh K, Dill K 2011. Modeling stochastic dynamics in biochemical systems with feedback using maximum caliber. J. Phys. Chem. B 115:6202–6212

  25. Elowitz M, Leibler S 2000. A synthetic oscillatory network of transcriptional regulators. Nature 403:335–338

  26. Firman T, Amgalan A, Ghosh K 2019. Maximum caliber can build and infer models of oscillation in a three-gene feedback network. J. Phys. Chem. B 123:343–355

  27. Van Kampen NG 1992. Stochastic Processes in Physics and Chemistry (Vol. 1). Amsterdam: Elsevier

  28. Gillespie D 1992. A rigorous derivation of the chemical master equation. Phys. A Stat. Mech. Appl. 188:404–425

  29. Munsky B, Khammash M 2006. The finite state projection algorithm for the solution of the chemical master equation. J. Chem. Phys. 124:044104

  30. Frigola D, Casanellas L, Sancho J, Ibanes M 2012. Asymmetric stochastic switching driven by intrinsic molecular noise. PLOS ONE 7:e31407

  31. Llamosi A, Gonzalez-Vargas AM, Versari C, Cinquemani E, Ferrari-Trecate G et al. 2016. What population reveals about individual cell identity: single-cell parameter estimation of models of gene expression in yeast. PLOS Comput. Biol. 12:e1004706

  32. Raj A, van Oudenaarden A 2008. Nature, nurture, or chance: stochastic gene expression and its consequences. Cell 135:216–226

  33. Wu M, Singh AK 2012. Single-cell protein analysis. Curr. Opin. Biotechnol. 23:83–88

  34. Saliba AE, Westermann AJ, Gorski SA, Vogel J 2014. Single-cell RNA-seq: advances and future challenges. Nucleic Acids Res. 42:8845–8860

  35. Dixit PD, Lyashenko E, Niepel M, Vitkup D 2019. Maximum entropy framework for predictive inference of cell population heterogeneity and responses in signaling networks. Cell Syst. https://doi.org/10.1016/j.cels.2019.11.010 [Crossref] [Medline] [Web of Science]

  36. Dixit PD 2013. Quantifying extrinsic noise in gene expression using the maximum entropy framework. Biophys. J. 104:2743–2750

  37. Dixit PD, Dill KA 2014. Inferring microscopic kinetic rates from stationary state distributions. J. Chem. Theory Comput. 10:3002–3005

  38. Wan H, Zhou G, Voelz VA 2016. A maximum-caliber approach to predicting perturbed folding kinetics due to mutations. J. Chem. Theory Comput. 12:5768–5776

  39. Zhou G, Pantelopulos GA, Mukherjee S, Voelz VA 2017. Bridging microscopic and macroscopic mechanisms of p53-MDM2 binding with kinetic network models. Biophys. J. 113:785–793

  40. Dixit PD, Jain A, Stock G, Dill KA 2015. Inferring transition rates of networks from populations in continuous-time Markov processes. J. Chem. Theory Comput. 11:5464–5472

  41. Tiwary P, Berne B 2016. How wet should be the reaction coordinate for ligand unbinding?. J. Chem. Phys. 145:054113

  42. Tiwary P, Berne B 2016. Spectral gap optimization of order parameters for sampling complex molecular systems. PNAS 113:2839–2844

  43. Tiwary P 2017. Molecular determinants and bottlenecks in the dissociation dynamics of biotin–streptavidin. J. Phys. Chem. B 121:10841–10849

  44. Hovan L, Comitani F, Gervasio FL 2018. Defining an optimal metric for the path collective variables. J. Chem. Theory Comput. 15:25–32

  45. Smith Z, Pramanik D, Tsai ST, Tiwary P 2018. Multi-dimensional spectral gap optimization of order parameters (SGOOP) through conditional probability factorization. J. Chem. Phys. 149:234105

  46. Dixit PD, Dill KA 2019. Building Markov state models using optimal transport theory. J. Chem. Phys. 150:054105

  47. Dixit PD 2018. Communication: Introducing prescribed biases in out-of-equilibrium Markov models. J. Chem. Phys. 148:091101

  48. Dixit PD 2018. Entropy production rate as a criterion for inconsistency in decision theory. J. Stat. Mech. Theory Exp. 2018:053408

  49. Dixit PD 2019. Introducing user-prescribed constraints in Markov chains for nonlinear dimensionality reduction. Neural Comput. 31:980–997

  50. Meral D, Provasi D, Filizola M 2018. An efficient strategy to estimate thermodynamics and kinetics of G protein-coupled receptor activation using metadynamics and maximum caliber. J. Chem. Phys. 149:224101

  51. Tiwary P, Parrinello M 2014. A time-independent free energy estimator for metadynamics. J. Phys. Chem. B 119:736–742

  52. Sawle L, Ghosh K 2016. Convergence of molecular dynamics simulation of protein native states: feasibility versus self-consistency dilemma. J. Chem. Theory Comput. 12:861–869

  53. Dixit PD, Dill KA 2018. Caliber corrected Markov modeling (C2M2): correcting equilibrium Markov models. J. Chem. Theory Comput. 14:1111–1119

  54. Herbst RS 2004. Review of epidermal growth factor receptor biology. Int. J. Radiat. Oncol. Biol. Phys. 59:S21–S26

  55. Huang HJS, Nagane M, Klingbeil CK, Lin H, Nishikawa R et al. 1997. The enhanced tumorigenic activity of a mutant epidermal growth factor receptor common in human cancers is mediated by threshold levels of constitutive tyrosine phosphorylation and unattenuated signaling. J. Biol. Chem. 272:2927–2935

  56. Cavagna A, Giardina I, Ginelli F, Mora T, Piovanni D et al. 2014. Dynamical maximum entropy approach to flocking. Phys. Rev. E 89:042707

  57. Tweedy L, Witzel P, Heinrich D, Insall RH, Endres RG 2019. Screening by changes in stereotypical behavior during cell motility. Sci. Rep. 9:8784

  58. Vasquez JC, Marre O, Palacios AG, Berry MJ II, Cessac B 2012. Gibbs distribution analysis of temporal correlations structure in retina ganglion cells. J. Physiol. Paris 106:120–127

  59. Tka?ik G, Mora T, Marre O, Amodei D, Palmer SE et al. 2015. Thermodynamics and signatures of criticality in a network of neurons. PNAS 112:11508–11513

  60. Stock G, Ghosh K, Dill K 2008. Maximum caliber: a variational approach applied to two-state dynamics. J. Chem. Phys. 128:194102

  61. Ge H, Pressé S, Ghosh K, Dill K 2012. Markov processes follow from the principle of maximum caliber. J. Chem. Phys. 134:064108

  62. Lee J, Pressé S 2012. A derivation of the master equation from path entropy maximization. J. Chem. Phys. 137:074103

  63. Pressé S, Ghosh K, Lee J, Dill K 2013. Principle of maximum entropy and maximum caliber in statistical physics. Rev. Mod. Phys. 85:1115–1141

  64. Hazoglou MJ, Walther V, Dixit PD, Dill KA 2015. Communication: Maximum caliber is a general variational principle for nonequilibrium sta...

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
國(guó)企開始“軟裁員”:沒等來辭退書,卻等來了一把鈍刀子

國(guó)企開始“軟裁員”:沒等來辭退書,卻等來了一把鈍刀子

時(shí)尚的弄潮
2026-02-24 19:53:20
明日大年初十“石頭節(jié)”,提醒:1不搬,2不空,吃3樣,忌1事

明日大年初十“石頭節(jié)”,提醒:1不搬,2不空,吃3樣,忌1事

小談食刻美食
2026-02-25 21:03:46
紐卡斯?fàn)柭?lián)創(chuàng)隊(duì)史紀(jì)錄:強(qiáng)勢(shì)晉級(jí)歐冠16強(qiáng),英超六杰全員突圍

紐卡斯?fàn)柭?lián)創(chuàng)隊(duì)史紀(jì)錄:強(qiáng)勢(shì)晉級(jí)歐冠16強(qiáng),英超六杰全員突圍

星耀國(guó)際足壇
2026-02-25 23:18:26
3-10到13-11!國(guó)乒女雙超級(jí)大逆轉(zhuǎn),馬琳卻搓臉不敢看

3-10到13-11!國(guó)乒女雙超級(jí)大逆轉(zhuǎn),馬琳卻搓臉不敢看

曹老師評(píng)球
2026-02-25 14:36:16
致命陷阱!俄軍批量接收光纖地雷線圈 操作即爆炸已致人員傷亡

致命陷阱!俄軍批量接收光纖地雷線圈 操作即爆炸已致人員傷亡

老馬拉車莫少裝
2026-02-25 08:51:14
趙心童2周獎(jiǎng)金316萬!宴請(qǐng)6同胞 外媒擔(dān)憂:這7人未來20年誰能擋

趙心童2周獎(jiǎng)金316萬!宴請(qǐng)6同胞 外媒擔(dān)憂:這7人未來20年誰能擋

風(fēng)過鄉(xiāng)
2026-02-25 12:49:41
歐冠最后4席!英超缺席,皇馬核心受傷,穆里尼奧玩起大量心理戰(zhàn)

歐冠最后4席!英超缺席,皇馬核心受傷,穆里尼奧玩起大量心理戰(zhàn)

嗨皮看球
2026-02-25 16:38:35
中華人民共和國(guó)正式向全世界宣告兩件大事:

中華人民共和國(guó)正式向全世界宣告兩件大事:

百態(tài)人間
2026-02-05 15:32:53
俄對(duì)外情報(bào)局稱英國(guó)和法國(guó)正準(zhǔn)備向?yàn)蹩颂m轉(zhuǎn)讓核武器,外交部表態(tài)

俄對(duì)外情報(bào)局稱英國(guó)和法國(guó)正準(zhǔn)備向?yàn)蹩颂m轉(zhuǎn)讓核武器,外交部表態(tài)

環(huán)球網(wǎng)資訊
2026-02-25 15:31:00
伊朗外長(zhǎng):希望在最短時(shí)間內(nèi)與美國(guó)達(dá)成公平協(xié)議

伊朗外長(zhǎng):希望在最短時(shí)間內(nèi)與美國(guó)達(dá)成公平協(xié)議

每日經(jīng)濟(jì)新聞
2026-02-25 07:26:59
山西省教育廳公示:山西再建一所新大學(xué),校址位于忻州!

山西省教育廳公示:山西再建一所新大學(xué),校址位于忻州!

忻州生活網(wǎng)
2026-02-25 21:55:51
斷香火大潮來了!大批家庭,將倒在80、90后手里。

斷香火大潮來了!大批家庭,將倒在80、90后手里。

黑哥講現(xiàn)代史
2026-02-24 16:29:47
我發(fā)現(xiàn)老天爺很公平:?jiǎn)挝焕锬切┎粻?zhēng)不搶的老實(shí)人,真的吃虧是福

我發(fā)現(xiàn)老天爺很公平:?jiǎn)挝焕锬切┎粻?zhēng)不搶的老實(shí)人,真的吃虧是福

風(fēng)起見你
2026-02-23 19:09:41
剛剛!大信號(hào)!上海重磅樓市政策出臺(tái),全面放寬!

剛剛!大信號(hào)!上海重磅樓市政策出臺(tái),全面放寬!

華瑤說房
2026-02-25 13:43:56
離婚29年孫子全姓宋,巴圖不理他小兒子表現(xiàn)平平,65歲英達(dá)后悔了

離婚29年孫子全姓宋,巴圖不理他小兒子表現(xiàn)平平,65歲英達(dá)后悔了

攬星河的筆記
2026-02-25 19:48:32
醫(yī)生勸告:過了70歲,寧可打打麻將,也不要隨意去做這6件事

醫(yī)生勸告:過了70歲,寧可打打麻將,也不要隨意去做這6件事

健康之光
2026-02-25 18:50:04
你占過最大的便宜是啥?網(wǎng)友:我也是,撿漏一個(gè)老公

你占過最大的便宜是啥?網(wǎng)友:我也是,撿漏一個(gè)老公

帶你感受人間冷暖
2026-02-25 00:17:46
韓“蛇蝎美人”在汽車旅館誘殺男子致2死1傷,首個(gè)受害者系男友,曾詢問AI如何殺人;案發(fā)后漲粉50倍,評(píng)論區(qū)被“顏值即正義”刷屏

韓“蛇蝎美人”在汽車旅館誘殺男子致2死1傷,首個(gè)受害者系男友,曾詢問AI如何殺人;案發(fā)后漲粉50倍,評(píng)論區(qū)被“顏值即正義”刷屏

大風(fēng)新聞
2026-02-25 16:49:05
謝霆鋒經(jīng)紀(jì)人深夜高調(diào)發(fā)文!2月22日凌晨,霍汶希內(nèi)心激動(dòng)藏不住

謝霆鋒經(jīng)紀(jì)人深夜高調(diào)發(fā)文!2月22日凌晨,霍汶希內(nèi)心激動(dòng)藏不住

阿廢冷眼觀察所
2026-02-23 18:56:52
收費(fèi)標(biāo)準(zhǔn)確定!內(nèi)蒙古自治區(qū)發(fā)改委最新通知,涉及所有人!

收費(fèi)標(biāo)準(zhǔn)確定!內(nèi)蒙古自治區(qū)發(fā)改委最新通知,涉及所有人!

青城之窗
2026-02-25 12:17:36
2026-02-26 04:16:49
集智俱樂部 incentive-icons
集智俱樂部
科普人工智能相關(guān)知識(shí)技能
5674文章數(shù) 4664關(guān)注度
往期回顧 全部

科技要聞

“機(jī)器人只跳舞,沒什么用”

頭條要聞

夫妻晚5秒錯(cuò)過免費(fèi)高速付1700元:氣得我不得了

頭條要聞

夫妻晚5秒錯(cuò)過免費(fèi)高速付1700元:氣得我不得了

體育要聞

勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

娛樂要聞

黃曉明新戀情!與小22歲美女同游新加坡

財(cái)經(jīng)要聞

上海樓市放大招,地產(chǎn)預(yù)期別太大

汽車要聞

750km超長(zhǎng)續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
教育
本地
公開課

藝術(shù)要聞

這些作品太美了,仙氣飄飄,三位大咖不容錯(cuò)過!

房產(chǎn)要聞

海南樓市春節(jié)熱銷地圖曝光!三亞、陵水又殺瘋了!

教育要聞

2026馬年的中國(guó)境外留學(xué)市場(chǎng)會(huì)提速嗎?

本地新聞

津南好·四時(shí)總相宜

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版