国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

自然·方法:利用神經(jīng)最優(yōu)傳輸學(xué)習(xí)單細(xì)胞擾動(dòng)反應(yīng)

0
分享至


導(dǎo)語(yǔ)

理解和預(yù)測(cè)單細(xì)胞在化學(xué)、遺傳或機(jī)械擾動(dòng)下的分子響應(yīng)是生物學(xué)中的核心問(wèn)題。獲取單細(xì)胞測(cè)量數(shù)據(jù)通常需要破壞細(xì)胞,這使得學(xué)習(xí)異質(zhì)性擾動(dòng)響應(yīng)具有挑戰(zhàn)性。因?yàn)檠芯空邆儍H能觀察到擾動(dòng)或未擾動(dòng)細(xì)胞的未配對(duì)分布。在此,他們利用最優(yōu)傳輸理論和近期出現(xiàn)的輸入凸神經(jīng)架構(gòu),提出了CellOT框架:該框架通過(guò)映射這些未配對(duì)分布,實(shí)現(xiàn)對(duì)單個(gè)細(xì)胞在特定擾動(dòng)下響應(yīng)的學(xué)習(xí)。

關(guān)鍵詞:?jiǎn)渭?xì)胞擾動(dòng)響應(yīng),神經(jīng)最優(yōu)傳輸,輸入凸神經(jīng)網(wǎng)絡(luò),異質(zhì)性,泛化能力,單細(xì)胞 RNA 測(cè)序(single-cell RNA sequencing, scRNA-seq),多重蛋白質(zhì)成像

王璇丨作者

鄭鴻盛、趙思怡丨審校


論文題目:Learning single-cell perturbation responses using neural optimal transport 論文鏈接:https://www.nature.com/articles/s41592-023-01969-x 發(fā)表時(shí)間:2023 年 9 月 28 日 論文來(lái)源:Nature Methods

目錄

理論基礎(chǔ)與關(guān)鍵方法

CellOT模型與單細(xì)胞擾動(dòng)預(yù)測(cè)

通過(guò)最優(yōu)傳輸映射預(yù)測(cè)擾動(dòng)反應(yīng)

CellOT性能優(yōu)于現(xiàn)有最先進(jìn)方法

CellOT捕捉藥物反應(yīng)中的細(xì)胞間變異性

CellOT分離亞群特異性藥物效應(yīng)

CellOT精準(zhǔn)推斷未見(jiàn)過(guò)患者的細(xì)胞反應(yīng)

CellOT 可跨物種重建固有免疫反應(yīng)

CellOT將分化結(jié)果擴(kuò)展至低潛能細(xì)胞

從非時(shí)間分辨數(shù)據(jù)中表征單細(xì)胞擾動(dòng)反應(yīng)是生物學(xué)的一大挑戰(zhàn),但對(duì)預(yù)測(cè)細(xì)胞對(duì)環(huán)境壓力或藥物的反應(yīng)至關(guān)重要,尤其有助于理解腫瘤細(xì)胞逃避治療的機(jī)制。單細(xì)胞擾動(dòng)反應(yīng)高度異質(zhì),受基因/蛋白豐度、細(xì)胞狀態(tài)和微環(huán)境等因素影響,因此分析中必須納入多變量亞群結(jié)構(gòu),以準(zhǔn)確預(yù)測(cè)個(gè)體細(xì)胞的藥物反應(yīng)。

學(xué)習(xí)擾動(dòng)反應(yīng)的核心難題在于:細(xì)胞測(cè)量通常需要破壞性處理,無(wú)法獲取配對(duì)對(duì)照/擾動(dòng)單細(xì)胞數(shù)據(jù),只能獲得獨(dú)立的觀測(cè)集。匹配不同條件下的單細(xì)胞,同時(shí)考慮異質(zhì)性,是復(fù)雜的配對(duì)問(wèn)題。

本文提出CellOT,一種基于神經(jīng)最優(yōu)傳輸?shù)臄_動(dòng)模型,通過(guò)學(xué)習(xí)對(duì)照與擾動(dòng)細(xì)胞狀態(tài)的映射,直接預(yù)測(cè)單細(xì)胞擾動(dòng)反應(yīng),同時(shí)顯式考慮多重分子讀數(shù)中的亞群異質(zhì)性。CellOT假設(shè)擾動(dòng)逐步改變細(xì)胞特征(如基因表達(dá)或信號(hào)活性),利用最優(yōu)傳輸理論(OT)建模這些變化,并通過(guò)輸入凸神經(jīng)網(wǎng)絡(luò)參數(shù)化對(duì)偶勢(shì),實(shí)現(xiàn)高度可擴(kuò)展且穩(wěn)健的映射學(xué)習(xí),可推廣至未見(jiàn)過(guò)的樣本或患者。

CellOT在四個(gè)方面驗(yàn)證了有效性:(1)學(xué)習(xí)黑色素瘤細(xì)胞系中不同抗癌藥物的單細(xì)胞標(biāo)志物反應(yīng);(2)預(yù)測(cè)系統(tǒng)性紅斑狼瘡患者活檢樣本中的單細(xì)胞轉(zhuǎn)錄組反應(yīng),以及膠質(zhì)母細(xì)胞瘤患者的帕比司他治療結(jié)果;(3)推斷不同動(dòng)物物種對(duì)脂多糖(LPS)的反應(yīng);(4)建模造血過(guò)程中細(xì)胞命運(yùn)的轉(zhuǎn)錄組演變。此外,在多個(gè)任務(wù)上[12, 13]將CellOT與當(dāng)前最先進(jìn)的方法進(jìn)行了基準(zhǔn)測(cè)試。

理論基礎(chǔ)與關(guān)鍵方法

近年來(lái),高通量技術(shù)能夠在單細(xì)胞層面揭示細(xì)胞群體對(duì)各種擾動(dòng)的響應(yīng)規(guī)律,但這些數(shù)據(jù)通常不具備時(shí)間分辨性,且擾動(dòng)前后的數(shù)據(jù)未經(jīng)過(guò)對(duì)齊處理。因此,理解單細(xì)胞如何響應(yīng)擾動(dòng),需要依賴數(shù)學(xué)建模方法來(lái)刻畫(huà)對(duì)照組與擾動(dòng)組之間的映射關(guān)系。在這里,最優(yōu)傳輸(Optimal Transport, OT)提供了一個(gè)自然的框架。

最優(yōu)傳輸具有雙重作用。它既可以在分布之間引入一種數(shù)學(xué)性質(zhì)良好的距離度量,又能提供一種基于幾何的方法來(lái)實(shí)現(xiàn)兩個(gè)概率分布之間的耦合。設(shè)μ和ν為空間中的兩個(gè)測(cè)度。蒙日提出的最優(yōu)傳輸問(wèn)題定義為:


其中,對(duì)應(yīng)最小代價(jià)的映射T即為最優(yōu)傳輸映射。該公式是非凸的,求解難度較大。多年后,康托羅維奇[54]提出了一種松弛方法,允許進(jìn)行軟分配,其形式為:


式中多面體Γ(μ, ν)的定義為,它描述了μ和ν之間所有耦合(或聯(lián)合分布)的集合。因此,最優(yōu)傳輸計(jì)劃γ對(duì)應(yīng)于使整體傳輸代價(jià)最小的兩個(gè)概率分布之間的耦合?;谧顑?yōu)傳輸耦合γ,μ和ν之間的距離W(μ, ν)被稱為Wasserstein距離。計(jì)算式(2)中的最優(yōu)傳輸距離需要求解線性規(guī)劃問(wèn)題,由此產(chǎn)生的計(jì)算成本對(duì)于大規(guī)模機(jī)器學(xué)習(xí)任務(wù)而言過(guò)高。通過(guò)引入熵項(xiàng)對(duì)目標(biāo)函數(shù)(2)進(jìn)行正則化,能夠顯著提升優(yōu)化效率[55],同時(shí)保證目標(biāo)函數(shù)關(guān)于輸入的可微性,因此該方法常被用作機(jī)器學(xué)習(xí)中的損失函數(shù)。

式(2)為最優(yōu)傳輸?shù)脑紗?wèn)題形式??低辛_維奇同時(shí)提出了對(duì)應(yīng)的對(duì)偶問(wèn)題[54],該對(duì)偶問(wèn)題是一個(gè)帶約束的凹函數(shù)最大化問(wèn)題,定義如下:


其中容許勢(shì)函數(shù)集合Φc的定義為(定理1.3)。維拉尼的定理2.9[23]進(jìn)一步將關(guān)于函數(shù)對(duì)(g, f)的對(duì)偶問(wèn)題(3)簡(jiǎn)化為:


式中是空間中所有凸函數(shù)的集合,,為f的凸共軛函數(shù)。將測(cè)度μ映射到ν的最優(yōu)傳輸映射對(duì)應(yīng)于f的梯度,即T=?f??梢酝ㄟ^(guò)構(gòu)造最優(yōu)傳輸計(jì)劃。維拉尼的定理2.9證明了在空間中存在一個(gè)由下半連續(xù)的真共軛凸函數(shù)構(gòu)成的最優(yōu)函數(shù)對(duì)(f, f*),能夠使式(3)取得最小值。

輸入凸神經(jīng)網(wǎng)絡(luò)。像式(4)中的這樣的凸空間,可以通過(guò)對(duì)輸入具有凸性的神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)化表示。阿莫斯等人[22]提出的輸入凸神經(jīng)網(wǎng)絡(luò)(ICNN)就是一種這類參數(shù)化方法。輸入凸神經(jīng)網(wǎng)絡(luò)基于全連接前饋網(wǎng)絡(luò)構(gòu)建,通過(guò)對(duì)網(wǎng)絡(luò)參數(shù)施加約束來(lái)保證函數(shù)的凸性。一個(gè)參數(shù)為的輸入凸神經(jīng)網(wǎng)絡(luò)表示一個(gè)凸函數(shù)f(x ; θ),對(duì)于第i層(i=0… L-1),其定義為:

其中激活函數(shù)σi為凸且非遞減函數(shù),同時(shí)所有權(quán)重矩陣的元素都被約束為非負(fù)數(shù)。盡管存在這些約束,輸入凸神經(jīng)網(wǎng)絡(luò)仍能對(duì)一大類凸函數(shù)進(jìn)行參數(shù)化。陳等人[56]從理論上證明,定義在凸域上的任意凸函數(shù)都可以通過(guò)輸入凸神經(jīng)網(wǎng)絡(luò)在一致范數(shù)意義下進(jìn)行逼近。黃等人[57]進(jìn)一步將輸入凸神經(jīng)網(wǎng)絡(luò)從全連接前饋結(jié)構(gòu)擴(kuò)展到卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。此外,輸入凸神經(jīng)網(wǎng)絡(luò)還被用于對(duì)Wasserstei梯度流[58-60]和重心[61]進(jìn)行參數(shù)化。

CellOT模型與單細(xì)胞擾動(dòng)預(yù)測(cè)

近年來(lái)發(fā)展的高通量技術(shù)能夠在單細(xì)胞層面揭示細(xì)胞群體對(duì)各種擾動(dòng)的響應(yīng)規(guī)律。但這類數(shù)據(jù)通常不具備時(shí)間分辨性,且數(shù)據(jù)之間未經(jīng)過(guò)對(duì)齊處理。因此,擾動(dòng)前后生物樣本的快照無(wú)法提供單個(gè)細(xì)胞的軌跡信息。擾動(dòng)的形式包括施加影響細(xì)胞分子功能的藥物,或是改變細(xì)胞所處環(huán)境引發(fā)生物信號(hào)通路的變化,這些擾動(dòng)會(huì)通過(guò)多種方式影響細(xì)胞及其狀態(tài)。

下文將介紹研究者的方法,該方法通過(guò)學(xué)習(xí)對(duì)照組與擾動(dòng)組細(xì)胞狀態(tài)之間的映射關(guān)系,來(lái)揭示單細(xì)胞的擾動(dòng)響應(yīng)規(guī)律。設(shè)X為由測(cè)得的細(xì)胞特征所張成的生物數(shù)據(jù)空間,研究者將細(xì)胞對(duì)第k種擾動(dòng)的響應(yīng)視為在高維細(xì)胞狀態(tài)空間中的演化過(guò)程。

基于神經(jīng)最優(yōu)傳輸方法還原擾動(dòng)效應(yīng)。給定一個(gè)包含n個(gè)觀測(cè)樣本的數(shù)據(jù)集,其中樣本服從擾動(dòng)前的細(xì)胞分布。同時(shí)給定另一組獨(dú)立樣本,其中樣本,研究者的目標(biāo)是預(yù)測(cè)細(xì)胞在受到第k種擾動(dòng)后的分布。

細(xì)胞的擾動(dòng)響應(yīng)是一個(gè)動(dòng)態(tài)過(guò)程:施加擾動(dòng)k后,細(xì)胞狀態(tài)會(huì)隨時(shí)間演化,因此可以將其建模為細(xì)胞數(shù)據(jù)空間中的一個(gè)隨機(jī)過(guò)程。盡管單細(xì)胞響應(yīng)具有時(shí)間分辨的特性,但只能獲取擾動(dòng)前的細(xì)胞狀態(tài)分布ρc和施加擾動(dòng)k后的分布ρk。因此,需要在缺乏時(shí)間分辨的擾動(dòng)響應(yīng)數(shù)據(jù)的情況下,通過(guò)揭示ρc和ρk之間的映射T,來(lái)理解其背后的隨機(jī)過(guò)程?;谝延械纳飳W(xué)知識(shí),可以假設(shè)擾動(dòng)不會(huì)劇烈或完全改變細(xì)胞的基本生物學(xué)過(guò)程。因此,研究者們提出,可以利用最優(yōu)傳輸這一數(shù)學(xué)理論來(lái)建模單細(xì)胞概率分布在擾動(dòng)后的演化規(guī)律。

借鑒馬克瓦等人的研究思路[18],學(xué)習(xí)ρc和ρk之間的最優(yōu)傳輸映射T(見(jiàn)式(1))。與希賓格等人[17]使用現(xiàn)有求解器為每一對(duì)細(xì)胞樣本單獨(dú)計(jì)算耦合γ的方法不同,研究者們采用神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)一個(gè)參數(shù)化的最優(yōu)傳輸映射。該參數(shù)化最優(yōu)傳輸映射可作為穩(wěn)健的預(yù)測(cè)器,用于預(yù)測(cè)未見(jiàn)過(guò)的n'個(gè)樣本例如來(lái)自其他患者的樣本)在擾動(dòng)后的細(xì)胞分布變化。

最優(yōu)傳輸映射的參數(shù)化。為了提出一種高效的最優(yōu)傳輸映射學(xué)習(xí)策略,研究者們基于諾特[62]和布雷尼爾[63]的經(jīng)典研究成果展開(kāi),這些成果建立了最優(yōu)傳輸原始問(wèn)題(2)與對(duì)偶問(wèn)題(3)最優(yōu)解之間的聯(lián)系。由于凸共軛函數(shù)f*的計(jì)算難度極大,馬克瓦等人提出用另一個(gè)凸函數(shù)g來(lái)近似式(4)中的f*,進(jìn)而推導(dǎo)得到一個(gè)關(guān)于兩個(gè)凸函數(shù)的極大極小優(yōu)化公式(參考文獻(xiàn)18的定理3.3),其形式如下:


該方法的核心思想源于如下事實(shí):


可以發(fā)現(xiàn),對(duì)于任意函數(shù)g,均滿足,當(dāng)且僅當(dāng)g=f*時(shí)等號(hào)成立(參考文獻(xiàn)18的定理3.3)。為了學(xué)習(xí)得到最優(yōu)傳輸映射,也就是求解式(6)中的極小化問(wèn)題,馬克瓦等人[18]采用輸入凸神經(jīng)網(wǎng)絡(luò)[22]對(duì)兩個(gè)對(duì)偶變量g和f進(jìn)行參數(shù)化,得到的傳輸映射定義為g的梯度。研究者們通過(guò)交替進(jìn)行極大極小優(yōu)化來(lái)求解最優(yōu)傳輸映射T*,其優(yōu)化過(guò)程如下:


其中,θ和Φ分別為兩個(gè)輸入凸神經(jīng)網(wǎng)絡(luò)的參數(shù)。

基于CellOT預(yù)測(cè)擾動(dòng)效應(yīng)。上述框架能夠幫助研究者們建立對(duì)照組細(xì)胞與擾動(dòng)組細(xì)胞之間的映射關(guān)系,從而揭示細(xì)胞在受到擾動(dòng)k后的響應(yīng)軌跡。給定一組擾動(dòng)K,同時(shí)獲取對(duì)照組分布ρc以及每種擾動(dòng)k∈K對(duì)應(yīng)的擾動(dòng)后分布ρk的樣本,CellOT通過(guò)求解式(7)來(lái)學(xué)習(xí)最優(yōu)對(duì)偶勢(shì)函數(shù)對(duì)。在得到每種擾動(dòng)k對(duì)應(yīng)的凸勢(shì)函數(shù)參數(shù)化模型后,CellOT通過(guò)來(lái)預(yù)測(cè)對(duì)照組細(xì)胞在擾動(dòng)k下的狀態(tài)變化,預(yù)測(cè)得到的擾動(dòng)后樣本服從分布。因此,CellOT提供了一種通用方法,可用于預(yù)測(cè)單細(xì)胞層面的狀態(tài)軌跡,并揭示異質(zhì)性細(xì)胞亞群結(jié)構(gòu)在外部因素影響下的演化規(guī)律。

神經(jīng)最優(yōu)傳輸。除了本文采用的方法外,已有多項(xiàng)研究探索了基于輸入凸神經(jīng)網(wǎng)絡(luò)的方法,將其作為式(1)的一種快速且可擴(kuò)展的近似求解方案。塔格瓦伊等人[64]提出用輸入凸神經(jīng)網(wǎng)絡(luò)對(duì)f進(jìn)行參數(shù)化,通過(guò)分步求解f*來(lái)計(jì)算式(4),但該方法的計(jì)算成本極高。馬克瓦等人[18](即本文所采用的方法)對(duì)該工作進(jìn)行了擴(kuò)展,采用另一個(gè)輸入凸神經(jīng)網(wǎng)絡(luò)g來(lái)近似f*,將原問(wèn)題轉(zhuǎn)化為關(guān)于兩個(gè)輸入凸神經(jīng)網(wǎng)絡(luò)的極大極小優(yōu)化問(wèn)題(見(jiàn)式(7))。此外,黃等人[57]受最優(yōu)傳輸理論的啟發(fā),提出了一種基于輸入凸神經(jīng)網(wǎng)絡(luò)的歸一化流參數(shù)化新方法。關(guān)于當(dāng)前各類神經(jīng)最優(yōu)傳輸求解器的詳細(xì)對(duì)比,可參考科羅廷等人的研究[65]。

局限性。單細(xì)胞表達(dá)譜分析能夠精細(xì)刻畫(huà)單個(gè)細(xì)胞的分子狀態(tài),但這類檢測(cè)方法通常具有破壞性,無(wú)法實(shí)現(xiàn)細(xì)胞分子特性的連續(xù)時(shí)間監(jiān)測(cè)。目前已有多種方法被提出,旨在從群體數(shù)據(jù)中揭示單個(gè)細(xì)胞的動(dòng)態(tài)變化規(guī)律,但這些方法都面臨一個(gè)共同的挑戰(zhàn):細(xì)胞狀態(tài)的時(shí)序分布可能由多種不同的基因調(diào)控動(dòng)力學(xué)機(jī)制產(chǎn)生。由于該問(wèn)題本身的不確定性,研究者們需要對(duì)細(xì)胞的潛在動(dòng)力學(xué)過(guò)程做出一定的假設(shè)。

本研究的數(shù)學(xué)基礎(chǔ)源于一個(gè)生物學(xué)基本認(rèn)知,即擾動(dòng)會(huì)漸進(jìn)式地改變細(xì)胞的分子圖譜。該原理與最優(yōu)傳輸理論相契合,借鑒前人的研究工作[17],研究者們將其作為CellOT模型的自然理論基礎(chǔ)。然而,當(dāng)這一基本假設(shè)不成立,即擾動(dòng)對(duì)細(xì)胞群體造成了嚴(yán)重破壞,導(dǎo)致細(xì)胞狀態(tài)發(fā)生無(wú)法識(shí)別的改變時(shí),CellOT及其他同類方法的性能都會(huì)下降(詳見(jiàn)討論部分)。在這種情況下,需要更復(fù)雜的數(shù)學(xué)工具來(lái)進(jìn)行建模,但這類工具目前還無(wú)法擴(kuò)展到包含多個(gè)基因的場(chǎng)景[66]。因此,研究者們需要依賴高時(shí)間分辨率的實(shí)驗(yàn)數(shù)據(jù),來(lái)捕捉連續(xù)時(shí)間點(diǎn)之間細(xì)胞狀態(tài)的顯著變化[67]。

此外,如果細(xì)胞系統(tǒng)在兩個(gè)連續(xù)的觀測(cè)快照之間存在旋轉(zhuǎn)或振蕩等動(dòng)態(tài)過(guò)程,而這些過(guò)程未被檢測(cè)手段捕獲,那么基于最優(yōu)傳輸?shù)哪P鸵约捌渌F(xiàn)有工具[68]都無(wú)法還原這類復(fù)雜的動(dòng)力學(xué)過(guò)程。這在一定程度上是由于研究者們當(dāng)前選擇的代價(jià)函數(shù)為歐氏距離(見(jiàn)式(2)),該選擇是綜合理論約束和實(shí)際性能表現(xiàn)后確定的。探索其他類型的代價(jià)函數(shù)將作為研究者們未來(lái)的研究方向。

除此之外,當(dāng)前模型無(wú)法還原除細(xì)胞遷移外其他導(dǎo)致細(xì)胞分布隨時(shí)間變化的因素,例如細(xì)胞增殖和凋亡[67]。不過(guò),已有最新研究提出了對(duì)經(jīng)典神經(jīng)最優(yōu)傳輸框架的擴(kuò)展方案,能夠?qū)⒓?xì)胞的生死過(guò)程納入建模范疇[69]。

最后,當(dāng)前生物工程技術(shù)的發(fā)展正致力于突破破壞性細(xì)胞檢測(cè)技術(shù)的局限性。陳等人[70]提出了一種能夠保持細(xì)胞活性的轉(zhuǎn)錄組分析方法。溫雷布等人[46]通過(guò)條形碼技術(shù)在克隆層面建立細(xì)胞與其子代細(xì)胞之間的聯(lián)系,從而實(shí)現(xiàn)對(duì)細(xì)胞分化過(guò)程的追蹤。這些技術(shù)能夠提供單細(xì)胞的時(shí)間軌跡信息(盡管通量較低),即實(shí)現(xiàn)不同觀測(cè)快照之間的細(xì)胞對(duì)應(yīng)關(guān)系對(duì)齊。索姆納特等人[52]提出了一種與最優(yōu)傳輸理論相關(guān)的新型算法框架,能夠有效利用這類(部分)對(duì)齊的數(shù)據(jù)集[71,72]。

通過(guò)最優(yōu)傳輸映射預(yù)測(cè)擾動(dòng)反應(yīng)

小分子藥物可通過(guò)改變信號(hào)級(jí)聯(lián)等方式對(duì)細(xì)胞表型產(chǎn)生深遠(yuǎn)影響,這些影響大多取決于擾動(dòng)發(fā)生的背景。鑒于細(xì)胞群體和組織中單個(gè)細(xì)胞的異質(zhì)性,預(yù)測(cè)細(xì)胞反應(yīng)需理解背景塑造基因組活性及其對(duì)藥物反應(yīng)的規(guī)律。通過(guò)單細(xì)胞基因組學(xué)或多重成像技術(shù)測(cè)量的高維單細(xì)胞數(shù)據(jù)可提供這種背景信息,但僅能返回細(xì)胞群體的非配對(duì)或未對(duì)齊觀測(cè)數(shù)據(jù)。CellOT可利用此類非配對(duì)數(shù)據(jù),學(xué)習(xí)擾動(dòng)后的細(xì)胞狀態(tài)轉(zhuǎn)變。

形式上,將未擾動(dòng)的對(duì)照群體表示為ρc,由n個(gè)細(xì)胞xi(i=1,...,n)組成。在施加擾動(dòng)k后,未擾動(dòng)群體中每個(gè)細(xì)胞xi的多變量狀態(tài)發(fā)生變化,將其觀測(cè)為擾動(dòng)群體ρk(圖1a)。為理解擾動(dòng)的作用方式和效果,研究者通過(guò)參數(shù)化映射Tk(見(jiàn)圖1a,b)學(xué)習(xí)群體ρc和ρk之間的轉(zhuǎn)變和對(duì)齊,該映射解釋了每個(gè)細(xì)胞從未擾動(dòng)細(xì)胞群體ρc在接受干預(yù)k后轉(zhuǎn)變?yōu)槠鋽_動(dòng)狀態(tài)ρk的過(guò)程。盡管源自不同觀測(cè),映射Tk仍能為每個(gè)細(xì)胞xi確定擾動(dòng)群體中最可能對(duì)應(yīng)的細(xì)胞Tk(xi)(圖1c)。找到該映射不僅能建模擾動(dòng)后的單細(xì)胞軌跡,還能預(yù)測(cè)未見(jiàn)過(guò)的對(duì)照細(xì)胞的擾動(dòng)狀態(tài)。因此,可通過(guò)將學(xué)習(xí)到的映射Tk應(yīng)用于新的未擾動(dòng)群體ρc',預(yù)測(cè)擾動(dòng)k的結(jié)果(圖1d)。


圖1 | CellOT模型概述。a,單細(xì)胞分布在未處理的對(duì)照狀態(tài)(ρc)或多種擾動(dòng)狀態(tài)之一(ρk、ρl、ρm等)下進(jìn)行測(cè)量,這些分布位于所分析特征的高維空間中。b,對(duì)于擾動(dòng)k,旨在用函數(shù)Tk對(duì)其建模,該函數(shù)將ρc中的未處理細(xì)胞映射到ρk中的處理后對(duì)應(yīng)細(xì)胞。c,缺乏配對(duì)測(cè)量時(shí),研究者們假設(shè)擾動(dòng)在最小努力原則下將ρc轉(zhuǎn)化為ρk,具體而言,利用最優(yōu)傳輸理論學(xué)習(xí)Tk,將這種分布映射直接估計(jì)為最優(yōu)傳輸對(duì)偶勢(shì)的梯度?θ。d,為所有擾動(dòng)獨(dú)立學(xué)習(xí)最優(yōu)傳輸映射,由于這些映射完全參數(shù)化,例如,CellOT可在一組初始提供的樣本上訓(xùn)練,進(jìn)而對(duì)來(lái)自新的、未見(jiàn)過(guò)樣本的未處理細(xì)胞進(jìn)行預(yù)測(cè)。

研究者們尋求的對(duì)齊對(duì)照和擾動(dòng)群體的最優(yōu)映射Tk,應(yīng)能最好地描述施加擾動(dòng)k后每個(gè)細(xì)胞多變量特征的漸進(jìn)式變化。利用最優(yōu)傳輸[23, 24]恢復(fù)這些映射并揭示單細(xì)胞重編程軌跡,已被提出作為單細(xì)胞生物學(xué)領(lǐng)域的強(qiáng)有力建模假設(shè)[16, 17, 25-28]。最優(yōu)傳輸問(wèn)題返回分布ρc和ρk之間的對(duì)齊,對(duì)應(yīng)于對(duì)齊分子特征之間的最小總體成本,從而確定每個(gè)細(xì)胞在擾動(dòng)后的最可能狀態(tài)(圖1c)。學(xué)習(xí)Tk使其圖像對(duì)應(yīng)于ρk,且質(zhì)量根據(jù)最小努力原則從ρc轉(zhuǎn)移到ρk。由于直接參數(shù)化最優(yōu)傳輸映射Tk[20, 21, 29]不穩(wěn)定[18],通過(guò)輸入凸神經(jīng)網(wǎng)絡(luò)對(duì)最優(yōu)傳輸對(duì)偶問(wèn)題的凸勢(shì)f和g進(jìn)行參數(shù)化,并利用凸函數(shù)gk的梯度(?gk)[18]恢復(fù)最優(yōu)映射Tk。補(bǔ)充部分A.3詳細(xì)綜述了為單細(xì)胞生物學(xué)問(wèn)題提出的最優(yōu)傳輸方法,以及本文方法與先前方法的差異。

為全面評(píng)估CellOT的性能,研究者們將其與基于自動(dòng)編碼器的當(dāng)前最先進(jìn)方法[12, 13]進(jìn)行基準(zhǔn)測(cè)試,這些方法試圖通過(guò)操縱學(xué)習(xí)到的潛表征添加擾動(dòng)效果(補(bǔ)充部分A.1有綜述)。為進(jìn)一步驗(yàn)證最優(yōu)傳輸建模先驗(yàn)的假設(shè),研究者們將每個(gè)擾動(dòng)k的學(xué)習(xí)到的最優(yōu)傳輸映射nabla gk與簡(jiǎn)單的非基于最優(yōu)傳輸?shù)膶?duì)齊進(jìn)行比較。

CellOT性能優(yōu)于現(xiàn)有最先進(jìn)方法

研究者們應(yīng)用CellOT,利用包含兩種黑色素瘤細(xì)胞系(M130219和M130429)的蛋白質(zhì)組學(xué)數(shù)據(jù)集(通過(guò)迭代間接免疫熒光成像技術(shù)(4i)[5]分析)和單細(xì)胞RNA測(cè)序數(shù)據(jù)集[31](分別包含34種和9種不同治療方法),預(yù)測(cè)細(xì)胞群體對(duì)癌癥治療的反應(yīng)。數(shù)據(jù)集詳情見(jiàn)在線方法。研究者們將CellOT與兩種基于自動(dòng)編碼器的工具(scGEN和cAE[12])以及PopAlign(一種基于通過(guò)高斯密度混合近似的對(duì)照和處理空間亞群對(duì)齊的方法)進(jìn)行基準(zhǔn)測(cè)試。由于單細(xì)胞RNA測(cè)序數(shù)據(jù)的高維特性,研究者們?cè)谧詣?dòng)編碼器學(xué)習(xí)到的潛表征上應(yīng)用CellOT。兩種4i治療和兩種單細(xì)胞RNA測(cè)序治療的觀測(cè)與預(yù)測(cè)細(xì)胞群體的邊緣分布如圖2a,d所示,每種擾動(dòng)選擇兩個(gè)特征,完整邊緣分布集見(jiàn)補(bǔ)充圖1-4。自動(dòng)編碼器基線傾向于捕捉處理后細(xì)胞群體的均值,但在匹配擾動(dòng)群體的所有異質(zhì)性狀態(tài)(擾動(dòng)群體的高階矩)方面效果不佳,因此這些模型往往學(xué)習(xí)過(guò)度簡(jiǎn)化的擾動(dòng)效果,難以滿足理解異質(zhì)性而非平均細(xì)胞行為的需求。而CellOT能捕捉這些高階矩,實(shí)現(xiàn)準(zhǔn)確且細(xì)致的預(yù)測(cè)。

這可通過(guò)分布度量(如最大均值差異(MMD)[33])進(jìn)一步量化。較小的最大均值差異值意味著兩個(gè)分布的所有矩均匹配,因此能精細(xì)捕捉擾動(dòng)細(xì)胞的整個(gè)分布,而非僅局限于群體平均(在線方法有詳細(xì)說(shuō)明)。所選擾動(dòng)的預(yù)測(cè)群體與觀測(cè)群體之間的最大均值差異如圖2b,e所示。對(duì)于單細(xì)胞RNA測(cè)序數(shù)據(jù),最大均值差異評(píng)估使用前50個(gè)標(biāo)志物基因進(jìn)行,所選標(biāo)志物基因數(shù)量的影響分析見(jiàn)補(bǔ)充圖7。除自動(dòng)編碼器基線外,研究者們還納入簡(jiǎn)單的恒等基線(僅通過(guò)返回未處理狀態(tài)預(yù)測(cè)治療效果)以及理論下限(觀測(cè)值,由一組不同的觀測(cè)擾動(dòng)細(xì)胞組成,與真實(shí)預(yù)測(cè)的差異僅源于實(shí)驗(yàn)噪聲)。結(jié)果表明,CellOT可接近下限(觀測(cè)設(shè)置),而基線方法通常相比恒等設(shè)置無(wú)明顯改進(jìn)。


圖2 | CellOT在不同數(shù)據(jù)模態(tài)上優(yōu)于當(dāng)前最先進(jìn)方法。a–f,通過(guò)4i(a)和單細(xì)胞RNA測(cè)序(d)分析的細(xì)胞標(biāo)志物基因表達(dá)的邊緣分布(x軸)。觀測(cè)到的對(duì)照和處理狀態(tài)分別以淺藍(lán)色和深藍(lán)色顯示,CellOT預(yù)測(cè)結(jié)果以紅色顯示,基線預(yù)測(cè)結(jié)果(scGEN、cAE和PopAlign)以灰色顯示?;诜植季嚯x MMD(最大均值差異)以及觀測(cè)擾動(dòng)細(xì)胞與預(yù)測(cè)擾動(dòng)細(xì)胞之間的平均相關(guān)系數(shù)r2,對(duì)4i(b)和單細(xì)胞RNA測(cè)序(e)數(shù)據(jù)的模型進(jìn)行比較。誤差棒表示測(cè)試集十次自舉抽樣的標(biāo)準(zhǔn)差,虛線對(duì)應(yīng)恒等和觀測(cè)性能的中位數(shù)。4i(c)和單細(xì)胞RNA測(cè)序(f)數(shù)據(jù)的觀測(cè)處理細(xì)胞與各模型預(yù)測(cè)細(xì)胞的聯(lián)合UMAP嵌入。投影在聯(lián)合細(xì)胞集上計(jì)算,通過(guò)下采樣使觀測(cè)擾動(dòng)細(xì)胞(灰色)和預(yù)測(cè)擾動(dòng)細(xì)胞(藍(lán)色)數(shù)量相等。恒等映射用于比較處理細(xì)胞與未處理細(xì)胞。分析針對(duì)曲美替尼、伊馬替尼和加維諾司他三種藥物進(jìn)行,4i數(shù)據(jù)使用M130219和M130429細(xì)胞系生成(在線方法)。

所有35種4i療法和6種單細(xì)胞RNA測(cè)序療法的不同評(píng)估指標(biāo)總結(jié)于補(bǔ)充圖5和6。除最大均值差異外,研究者們還納入均值,用于測(cè)量所有特征上觀測(cè)與預(yù)測(cè)平均藥物效果之間的距離。最后,研究者們比較了所有特征上預(yù)測(cè)數(shù)據(jù)與觀測(cè)數(shù)據(jù)之間的總體平均相關(guān)系數(shù)r2(在線方法)。在所有治療中,CellOT在這兩項(xiàng)指標(biāo)上均優(yōu)于基線,通常高出一個(gè)數(shù)量級(jí)。研究者們認(rèn)為CellOT的出色性能源于其能夠通過(guò)最優(yōu)傳輸理論,學(xué)習(xí)明確考慮細(xì)胞群體數(shù)據(jù)幾何結(jié)構(gòu)的傳輸函數(shù)。這一假設(shè)得到以下觀察結(jié)果的支持:處理后和未處理群體之間的特征間相關(guān)結(jié)構(gòu)在很大程度上保持不變,這正是最優(yōu)傳輸方法的優(yōu)勢(shì)場(chǎng)景。詳情見(jiàn)擴(kuò)展數(shù)據(jù)圖1,擴(kuò)展數(shù)據(jù)圖2可視化了學(xué)習(xí)到的映射,進(jìn)一步證明了CellOT建模精細(xì)反應(yīng)的能力。

最后,研究者們利用全特征空間,對(duì)預(yù)測(cè)和觀測(cè)擾動(dòng)細(xì)胞的聯(lián)合集進(jìn)行了UMAP嵌入(UMAP)[34](圖2c,f)。結(jié)果顯示,CellOT推斷的擾動(dòng)細(xì)胞狀態(tài)與觀測(cè)到的擾動(dòng)細(xì)胞高度整合,而兩種基線均無(wú)法完整恢復(fù)擾動(dòng)分布,因此無(wú)法一致捕捉不同亞群的擾動(dòng)狀態(tài)。

CellOT捕捉藥物反應(yīng)中的細(xì)胞間變異性

捕捉同一樣本中不同細(xì)胞類型的不同擾動(dòng)反應(yīng)仍是一項(xiàng)具有挑戰(zhàn)性的計(jì)算任務(wù)。為降低任務(wù)復(fù)雜性,預(yù)測(cè)算法可在擾動(dòng)和未擾動(dòng)狀態(tài)下通過(guò)預(yù)定義的細(xì)胞類型標(biāo)簽進(jìn)行指導(dǎo)[32],或設(shè)置為近似平均藥物反應(yīng)[13]。但這些簡(jiǎn)化存在代價(jià):依賴于對(duì)現(xiàn)有相關(guān)細(xì)胞類型的先驗(yàn)知識(shí),假設(shè)細(xì)胞類型在擾動(dòng)前后具有相同特征,且同一細(xì)胞類型內(nèi)藥物反應(yīng)一致。在最壞情況下,這些局限性可能掩蓋真實(shí)且重要的藥物反應(yīng)異質(zhì)性,阻礙發(fā)現(xiàn)新的細(xì)胞類型或細(xì)胞狀態(tài)特異性擾動(dòng)反應(yīng)(補(bǔ)充圖13提供進(jìn)一步比較)。CellOT無(wú)這些局限性,能讓科學(xué)家以最適合解答其生物學(xué)問(wèn)題的粒度查詢預(yù)測(cè)的單細(xì)胞反應(yīng)。作為概念驗(yàn)證,研究者們將上述患者來(lái)源的黑色素瘤細(xì)胞系按等比例共培養(yǎng)(在線方法),并進(jìn)行定制藥物篩選——將細(xì)胞暴露于34種藥物中8小時(shí),通過(guò)4i技術(shù)測(cè)量單細(xì)胞藥物反應(yīng)。利用CellOT,研究者們?yōu)槊糠N藥物預(yù)測(cè)了一組共享對(duì)照(二甲基亞砜(DMSO)處理)細(xì)胞的擾動(dòng)細(xì)胞狀態(tài)(圖3a)。先前研究[7]表明,藥物處理后信號(hào)激酶的磷酸化水平與細(xì)胞狀態(tài)密切相關(guān)。為評(píng)估預(yù)測(cè)擾動(dòng)細(xì)胞與觀測(cè)擾動(dòng)細(xì)胞中這種關(guān)系是否保持一致,研究者們利用CellOT學(xué)習(xí)到的每種藥物的傳輸映射,分析了細(xì)胞外信號(hào)調(diào)節(jié)激酶(pERK)的磷酸化水平。使用750個(gè)預(yù)測(cè)擾動(dòng)細(xì)胞和750個(gè)觀測(cè)擾動(dòng)細(xì)胞,研究者們基于除pERK外的所有特征聯(lián)合計(jì)算了UMAP嵌入。圖3b顯示了分別標(biāo)注每個(gè)細(xì)胞相應(yīng)pERK水平的預(yù)測(cè)群體和觀測(cè)群體。結(jié)果發(fā)現(xiàn),兩種投影的空間組織幾乎完全一致,且在兩類細(xì)胞和所有藥物處理中,pERK水平的分布高度相似(擴(kuò)展數(shù)據(jù)圖3a,b和在線方法有進(jìn)一步分析)。

CellOT分離亞群特異性藥物效應(yīng)

通過(guò)計(jì)算預(yù)測(cè)擾動(dòng)細(xì)胞與未處理對(duì)照細(xì)胞之間的差異,CellOT可分離每種藥物的作用方式。所有細(xì)胞的UMAP嵌入(按處理方式著色)能清晰區(qū)分不同處理(圖3c和擴(kuò)展數(shù)據(jù)圖3e),CellOT能準(zhǔn)確學(xué)習(xí)所有這些差異(補(bǔ)充圖5)。而僅考慮平均擾動(dòng)效果時(shí),不存在這種明顯的處理嵌入(擴(kuò)展數(shù)據(jù)圖3d),這表明捕捉藥物反應(yīng)的細(xì)胞異質(zhì)性至關(guān)重要。

基于全特征集的萊頓聚類,研究者們將未擾動(dòng)對(duì)照細(xì)胞分為12種細(xì)胞狀態(tài)(圖3d、擴(kuò)展數(shù)據(jù)圖3g和在線方法)。細(xì)胞狀態(tài)1、5、6、9和12顯示出高M(jìn)elA水平且無(wú)SOX9,對(duì)應(yīng)黑色素細(xì)胞系M130429;而SOX9陽(yáng)性且MelA陰性的狀態(tài)2、3、4、7、8、10和11代表間充質(zhì)細(xì)胞系M130219(在線方法)??傮w而言,M130429細(xì)胞的測(cè)量信號(hào)激酶磷酸化水平高于M130219;大多數(shù)藥物處理后仍保留典型的細(xì)胞狀態(tài)空間組織,且同一細(xì)胞系的細(xì)胞狀態(tài)聚類在一起(擴(kuò)展數(shù)據(jù)圖3f)。

通過(guò)計(jì)算每種藥物的對(duì)照與處理狀態(tài)之間的差異(最優(yōu)傳輸成本),研究者們可進(jìn)一步表征藥物的作用強(qiáng)度。凋亡誘導(dǎo)劑(如星形孢菌素)、蛋白酶體抑制劑(如伊沙佐米和卡非佐米,或聯(lián)合治療卡非佐米+泊馬度胺+地塞米松)、微管穩(wěn)定劑(如紫杉醇)、c-Met抑制劑(如克唑替尼)以及多種酪氨酸激酶(如c-KIT和Bcr-Abl)的ATP競(jìng)爭(zhēng)劑(達(dá)沙替尼)顯示出高傳輸成本,因此在所有細(xì)胞狀態(tài)中均產(chǎn)生顯著的特征變化(圖3e)。其他藥物在8小時(shí)孵育期內(nèi)顯示出較弱的效果。研究者們發(fā)現(xiàn),除達(dá)沙替尼外,所有擾動(dòng)均在兩種細(xì)胞系的多種細(xì)胞狀態(tài)中增加了凋亡標(biāo)志物切割型半胱天冬酶3的水平(擴(kuò)展數(shù)據(jù)圖3k);達(dá)沙替尼僅在與M130429相關(guān)的細(xì)胞狀態(tài)5、6、9和12中誘導(dǎo)細(xì)胞死亡(圖3f)。

Smith等人[35]的先前研究報(bào)道,M130429細(xì)胞在MEK抑制劑(MEKi)和RAF抑制劑(RAFi)處理后代謝活性降低,而M130219細(xì)胞對(duì)這些抑制劑具有抗性。以pERK和pAKT作為相應(yīng)讀數(shù),比較兩種細(xì)胞系對(duì)曲美替尼(MEKi)和MLN2480(泛RAFi)在MEK和PI3K通路中的反應(yīng),結(jié)果發(fā)現(xiàn):MEKi敏感的M130429細(xì)胞下調(diào)pAKT和pERK,而MEKi抗性的M130219細(xì)胞僅下調(diào)pERK。一致地,MLN2480處理也產(chǎn)生了類似的差異藥物反應(yīng)(擴(kuò)展數(shù)據(jù)圖3i)。這表明MEK和PI3K通路的解偶聯(lián)可能賦予對(duì)MEK和Raf抑制劑的抗性,并構(gòu)成癌癥治療逃逸的適應(yīng)機(jī)制[36]。當(dāng)分析曲美替尼(MEKi)和達(dá)拉非尼(BRAFi)聯(lián)合處理后的pAKT和pERK水平時(shí),研究者們發(fā)現(xiàn)了更多通路串?dāng)_改變的支持證據(jù)。

針對(duì)兩種作用于MEK通路的藥物,研究者們觀察到兩種細(xì)胞系的pERK均降低,但在MEKi抗性細(xì)胞系M130219(患者預(yù)先暴露于MEKi期間獲得抗性)中發(fā)現(xiàn)pAKT水平升高(圖3f)。這一發(fā)現(xiàn)表明,M130219在MEKi治療期間獲得了補(bǔ)償性反饋機(jī)制——MEK通路的抑制(量化為pERK降低)會(huì)促進(jìn)PI3K通路的信號(hào)傳導(dǎo),可能通過(guò)激活上游受體激酶[37]實(shí)現(xiàn)。研究者們對(duì)兩種共培養(yǎng)的原代黑色素瘤細(xì)胞系在多種抗癌藥物處理下的研究結(jié)果表明,CellOT無(wú)需預(yù)定義細(xì)胞系標(biāo)簽,通過(guò)納入潛在的細(xì)胞間變異性,可準(zhǔn)確捕捉未擾動(dòng)細(xì)胞群體的表型異質(zhì)性,并預(yù)測(cè)多樣化的藥物反應(yīng)。


圖3 | CellOT助力癌癥藥物的多重單細(xì)胞表征。a,CellOT訓(xùn)練和預(yù)測(cè)設(shè)置。訓(xùn)練34個(gè)CellOT模型,每種藥物擾動(dòng)對(duì)應(yīng)一個(gè)模型,隨后每個(gè)模型用于從一組常見(jiàn)的未見(jiàn)過(guò)對(duì)照細(xì)胞中預(yù)測(cè)擾動(dòng)細(xì)胞。b,基于34種擾動(dòng)的同等數(shù)量預(yù)測(cè)細(xì)胞和測(cè)量細(xì)胞構(gòu)建的UMAP嵌入。點(diǎn)表示細(xì)胞,顏色表示測(cè)得的pERK強(qiáng)度。AU,任意單位。c,使用預(yù)測(cè)細(xì)胞的單細(xì)胞擾動(dòng)效果的UMAP嵌入。點(diǎn)對(duì)應(yīng)細(xì)胞,按藥物處理著色(擴(kuò)展數(shù)據(jù)圖3提供完整圖例,在線方法提供單細(xì)胞擾動(dòng)效果計(jì)算方法)。d,對(duì)照細(xì)胞中鑒定的細(xì)胞狀態(tài)(在線方法)。每列代表一種細(xì)胞狀態(tài),橫軸為基于與M130219和M130429細(xì)胞系關(guān)聯(lián)排序的細(xì)胞狀態(tài),縱軸為細(xì)胞特征(擴(kuò)展數(shù)據(jù)圖3提供完整特征集)。圓圈的大小和色調(diào)根據(jù)特征值縮放。e,每種細(xì)胞狀態(tài)的藥物處理傳輸成本(TC)聚類圖(主熱圖,藍(lán)-黃配色方案)、每種藥物所有狀態(tài)的傳輸成本總和(熱圖左側(cè)第一列,紫色)、每種藥物傳輸成本的變異系數(shù)(CV)(熱圖左側(cè)第二列,綠色)以及基于藥物細(xì)胞狀態(tài)傳輸成本層次聚類的樹(shù)狀圖。細(xì)胞狀態(tài)按d中的方式排序。f,細(xì)胞狀態(tài)特異性藥物反應(yīng)。(i)達(dá)沙替尼(上)。(ii)曲美替尼+達(dá)拉非尼(下)。c中UMAP嵌入的條件聚焦放大圖(左上);與左上相同但按細(xì)胞狀態(tài)分配著色(右上);列代表細(xì)胞狀態(tài)(cs),行顯示突出特征(下)。“cell-”代表平均細(xì)胞強(qiáng)度。圓圈根據(jù)藥物效果大小縮放,效果越強(qiáng)圓圈越大。負(fù)值以藍(lán)色色調(diào)編碼,正值以紅色色調(diào)編碼。

CellOT精準(zhǔn)推斷未見(jiàn)過(guò)患者的細(xì)胞反應(yīng)

CellOT學(xué)習(xí)到的治療前后分子狀態(tài)之間的映射,有助于更好地理解對(duì)特定藥物有反應(yīng)的細(xì)胞與無(wú)反應(yīng)細(xì)胞之間的差異。這對(duì)于推斷新患者的藥物反應(yīng)以及細(xì)胞間變異性高的場(chǎng)景至關(guān)重要。但要對(duì)未見(jiàn)過(guò)的患者進(jìn)行預(yù)測(cè),需證明學(xué)習(xí)到的映射T能連貫且穩(wěn)健地建模不同患者的擾動(dòng)反應(yīng),同時(shí)為每個(gè)患者預(yù)測(cè)個(gè)性化治療結(jié)果,而非僅提供群體平均結(jié)果。為測(cè)試CellOT在這種樣本外(o.o.s.)場(chǎng)景中的泛化能力,研究者們使用外周血單個(gè)核細(xì)胞液滴單細(xì)胞RNA測(cè)序數(shù)據(jù)集。Kang等人[38]表征了8名狼瘡患者對(duì)β干擾素(IFN-β)反應(yīng)的細(xì)胞類型特異性和個(gè)體間變異性——β干擾素是一種強(qiáng)效細(xì)胞因子,可誘導(dǎo)免疫細(xì)胞轉(zhuǎn)錄組的基因組規(guī)模變化。下文比較了CellOT和其他基線在獨(dú)立同分布(i.i.d.)場(chǎng)景(模型可見(jiàn)所有患者的細(xì)胞)和樣本外場(chǎng)景(模型不可見(jiàn)特定未參與訓(xùn)練患者的細(xì)胞)中的性能(圖4a)。

與先前分析一致,研究者們?cè)u(píng)估了CellOT捕捉不同標(biāo)志物基因從對(duì)照到β干擾素處理細(xì)胞的整體表達(dá)變化的準(zhǔn)確性,進(jìn)而評(píng)估預(yù)測(cè)的基因表達(dá)邊緣分布與處理群體的對(duì)齊程度(圖4b)。研究者們選擇CXCL11、CCL2和APOBEC3A基因,因?yàn)樗鼈兣c自身免疫性疾?。òㄏ到y(tǒng)性紅斑狼瘡)[39, 40]相關(guān),因此是狼瘡患者治療中潛在的治療靶點(diǎn),也可能適用于其他干擾素病[39-43]。這些選定基因從對(duì)照到擾動(dòng)群體的表達(dá)發(fā)生顯著變化,部分在擾動(dòng)后表現(xiàn)出雙峰基因表達(dá)譜。與CellOT不同,基線無(wú)法準(zhǔn)確預(yù)測(cè)這些基因的顯著轉(zhuǎn)錄組變化。受β干擾素處理強(qiáng)烈影響的其他基因的擴(kuò)展分析見(jiàn)補(bǔ)充圖9和10。

所有模型(包括CellOT)使用基于患者隊(duì)列訓(xùn)練的廣義擾動(dòng)模型TL,并以未見(jiàn)過(guò)患者的對(duì)照細(xì)胞為輸入,建模新患者的治療結(jié)果時(shí),性能幾乎無(wú)下降。通過(guò)最大均值差異度量比較預(yù)測(cè)群體與觀測(cè)值,這一點(diǎn)尤為明顯。圖4c顯示了將每位患者分別作為未參與訓(xùn)練集的匯總結(jié)果,其他評(píng)估指標(biāo)(包括特征均值)見(jiàn)補(bǔ)充圖8。在獨(dú)立同分布和樣本外場(chǎng)景中,CellOT均優(yōu)于先前的基線,且在泛化到未見(jiàn)過(guò)患者時(shí)性能下降更?。ㄑa(bǔ)充圖11有更多結(jié)果)。這些結(jié)果表明,學(xué)習(xí)到的最優(yōu)傳輸映射能正確建模所有患者中存在的細(xì)胞亞群結(jié)構(gòu)變化,因此樣本外性能穩(wěn)健。研究者們對(duì)包含7名患者的膠質(zhì)母細(xì)胞瘤隊(duì)列重復(fù)了相同評(píng)估[44];但由于隊(duì)列規(guī)模小且個(gè)體反應(yīng)差異大,CellOT和所有基線在該場(chǎng)景中的泛化均面臨困難,完整分析見(jiàn)擴(kuò)展數(shù)據(jù)圖6。

CellOT 可跨物種重建固有免疫反應(yīng)

固有免疫反應(yīng)是一種細(xì)胞內(nèi)在防御程序,反應(yīng)細(xì)胞間具有高度異質(zhì)性,因此是評(píng)估CellOT能力的理想任務(wù)。研究者們的分析基于Hagai等人[45]收集的數(shù)據(jù)集,該數(shù)據(jù)集研究了不同物種(包括豬、兔、小鼠和大鼠)單核吞噬細(xì)胞先天免疫程序的進(jìn)化。通過(guò)脂多糖(LPS)刺激這些原代骨髓來(lái)源細(xì)胞,下文測(cè)試了CellOT和基線在重建訓(xùn)練期間未接觸過(guò)的物種的先天免疫反應(yīng)方面的性能。研究者們將這種泛化任務(wù)稱為分布外(o.o.d.)任務(wù),因?yàn)榕c樣本外場(chǎng)景不同,不同物種的反應(yīng)預(yù)計(jì)存在顯著差異(圖4d)。未參與訓(xùn)練集由大鼠或小鼠來(lái)源的細(xì)胞組成,擴(kuò)展數(shù)據(jù)圖4a,b分析了跨物種相似性及選擇未參與訓(xùn)練集的原因。

事實(shí)上,在獨(dú)立同分布和分布外場(chǎng)景中,CellOT均能準(zhǔn)確重建小鼠和大鼠的先天免疫反應(yīng)。這一點(diǎn)不僅通過(guò)更精確捕捉脂多糖添加后顯示高差異表達(dá)的標(biāo)志物基因(如Nfkb1(NF-κB)、Oasl1(Oasl1)、Mmp12和Cxcl5)的平均表達(dá)水平得以體現(xiàn)(圖4e和擴(kuò)展數(shù)據(jù)圖4c,d),還通過(guò)分布外預(yù)測(cè)與未參與訓(xùn)練觀測(cè)值在所有基因上的平均相關(guān)系數(shù)r2得以驗(yàn)證(圖4f)。特別是,分析每種方法捕捉不同物種固有免疫反應(yīng)異質(zhì)性的能力時(shí),CellOT優(yōu)于基線,表現(xiàn)為較低的最大均值差異(圖4f)。最值得注意的是,研究者們的方法顯示出上述標(biāo)志物基因表達(dá)邊緣的高度對(duì)齊——這些基因在擾動(dòng)后表現(xiàn)出復(fù)雜的雙峰表達(dá)譜(圖4g)。

CellOT將分化結(jié)果擴(kuò)展至低潛能細(xì)胞

在發(fā)育過(guò)程中,干細(xì)胞和祖細(xì)胞經(jīng)歷一系列命運(yùn)決定層級(jí),其特征是細(xì)胞持續(xù)分化,不斷完善自身特性,直至達(dá)到功能終末狀態(tài)。通過(guò)追蹤初始細(xì)胞群體的分化過(guò)程,CellOT可恢復(fù)單個(gè)分子細(xì)胞命運(yùn)決定和發(fā)育軌跡。

Weinreb等人[46]通過(guò)追蹤廣泛類別的寡能和多能祖細(xì)胞亞群,并在第2、4和6天觀察樣本,分析了造血干細(xì)胞和祖細(xì)胞的命運(yùn)潛能(圖4h)。本文測(cè)試了CellOT和其他基線學(xué)習(xí)第2天觀測(cè)細(xì)胞向第4和6天(合并)觀測(cè)細(xì)胞分化過(guò)程的能力,以及在不同亞群間的泛化能力(分布外場(chǎng)景)。研究者們訓(xùn)練了兩個(gè)映射:映射To僅在寡能細(xì)胞上訓(xùn)練,Tm在多能細(xì)胞上訓(xùn)練。這些映射的獨(dú)立同分布版本在寡能和多能細(xì)胞上均進(jìn)行訓(xùn)練,因此每組獨(dú)立同分布和分布外映射在相同測(cè)試集上進(jìn)行評(píng)估。使用最大均值差異度量比較預(yù)測(cè)與觀測(cè)分化細(xì)胞狀態(tài)的分布距離,結(jié)果表明,在獨(dú)立同分布場(chǎng)景中,CellOT在寡能和多能子集上均優(yōu)于當(dāng)前最先進(jìn)方法(圖4i)。此外,盡管基線在兩種分布外場(chǎng)景中均表現(xiàn)不佳,但CellOT能在一個(gè)方向上泛化其預(yù)測(cè)(從多能細(xì)胞到寡能場(chǎng)景)。與寡能細(xì)胞不同,多能細(xì)胞具有更高的潛能,因此可能分化為更多細(xì)胞類型,因此研究者們預(yù)期Tm比在潛能較低的寡能細(xì)胞上訓(xùn)練的To更可能泛化。當(dāng)使用To預(yù)測(cè)多能細(xì)胞的發(fā)育擾動(dòng)時(shí),無(wú)法恢復(fù)分化細(xì)胞命運(yùn)。

研究者們進(jìn)一步比較了不同時(shí)間點(diǎn)和不同細(xì)胞類型的性能。圖4j顯示了使用映射Tm分別對(duì)第4天和第6天細(xì)胞建模多能細(xì)胞發(fā)育的準(zhǔn)確性。顯然,CellOT在預(yù)測(cè)短程發(fā)育動(dòng)態(tài)時(shí)比預(yù)測(cè)時(shí)間上更遠(yuǎn)的狀態(tài)時(shí)結(jié)果更好(擴(kuò)展數(shù)據(jù)圖5有更多結(jié)果)。這表明所有這些方法可能存在潛在局限性——難以在粗時(shí)間分辨率下恢復(fù)對(duì)齊。此外,盡管第4和6天的絕大多數(shù)細(xì)胞仍未分化(undiff),但部分細(xì)胞已分化為中性粒細(xì)胞(neut)、單核細(xì)胞(mono)、嗜堿性粒細(xì)胞(baso)、淋巴樣前體細(xì)胞(lymph)或樹(shù)突狀細(xì)胞(DCs)。正如預(yù)期,對(duì)于數(shù)據(jù)集中僅少量存在的細(xì)胞類型,CellOT的性能(以最大均值差異度量)有所下降(圖4k)。


圖4 | CellOT泛化到未見(jiàn)過(guò)的患者和細(xì)胞亞群。a–k,樣本外(a–c)和分布外(d–k)場(chǎng)景。a,8名狼瘡患者的細(xì)胞在未處理和β干擾素處理狀態(tài)下進(jìn)行測(cè)量。針對(duì)每個(gè)樣本,訓(xùn)練兩個(gè)模型:樣本外模型(基于所有其他樣本的細(xì)胞訓(xùn)練)和獨(dú)立同分布模型(額外使用未參與訓(xùn)練樣本的一半細(xì)胞訓(xùn)練,未顯示)。b,未參與訓(xùn)練樣本在獨(dú)立同分布(上)和樣本外(下)場(chǎng)景中的預(yù)測(cè)細(xì)胞邊緣分布。兩個(gè)模型的預(yù)測(cè)均在相同測(cè)試集上進(jìn)行(未用于訓(xùn)練兩個(gè)模型)。c,獨(dú)立同分布和樣本外場(chǎng)景中,所有未參與訓(xùn)練樣本的預(yù)測(cè)分布與觀測(cè)處理分布之間的最大均值差異分?jǐn)?shù)。箱線圖顯示中位數(shù)和四分位數(shù)。d,作為分布外任務(wù),訓(xùn)練CellOT和基線預(yù)測(cè)不同物種對(duì)脂多糖的反應(yīng),并以大鼠(或小鼠)作為未參與訓(xùn)練物種進(jìn)行測(cè)試。e,CellOT和scGEN對(duì)選定標(biāo)志物基因的獨(dú)立同分布和分布外預(yù)測(cè)的平均基因表達(dá)。f,CellOT和基線在分布外場(chǎng)景中r2相關(guān)特征均值和最大均值差異的性能比較。數(shù)據(jù)表示為測(cè)試集十次自舉抽樣的均值±標(biāo)準(zhǔn)差。g,以大鼠作為未參與訓(xùn)練物種訓(xùn)練時(shí),顯示雙峰表達(dá)譜的標(biāo)志物基因的分布外預(yù)測(cè)邊緣分布。h,多能和寡能亞群的細(xì)胞在第2、4和6天進(jìn)行測(cè)量。僅基于多能細(xì)胞(Tm)或寡能細(xì)胞(To)訓(xùn)練時(shí),應(yīng)用CellOT預(yù)測(cè)第2天細(xì)胞如何發(fā)育為第4和6天的合并集。然后應(yīng)用Tm預(yù)測(cè)分布外寡能細(xì)胞,應(yīng)用To預(yù)測(cè)分布外多能細(xì)胞。與樣本外場(chǎng)景類似,訓(xùn)練獨(dú)立同分布模型,包括未參與訓(xùn)練亞群的一半。i,所有模型在分布外和獨(dú)立同分布預(yù)測(cè)任務(wù)中(第4和6天聯(lián)合)的預(yù)測(cè)與(觀測(cè))發(fā)育分布之間的最大均值差異分?jǐn)?shù)。j,使用Tm時(shí),CellOT在每個(gè)場(chǎng)景中對(duì)不同細(xì)胞類型預(yù)測(cè)第4天和第6天狀態(tài)的性能。k,第4和6天每種細(xì)胞類型的細(xì)胞數(shù)量和百分比。

本文提出CellOT框架,該框架利用神經(jīng)最優(yōu)傳輸技術(shù),基于非配對(duì)的處理后與未處理細(xì)胞狀態(tài)建模單細(xì)胞擾動(dòng)反應(yīng)。通過(guò)從最優(yōu)傳輸視角充分建模問(wèn)題本質(zhì),CellOT能夠確定擾動(dòng)對(duì)細(xì)胞特性的影響,重建單細(xì)胞在擾動(dòng)后的最可能軌跡,進(jìn)而助力深入理解細(xì)胞命運(yùn)決定的驅(qū)動(dòng)因素及細(xì)胞逃逸機(jī)制。CellOT借鑒了最優(yōu)傳輸技術(shù)近年來(lái)在單細(xì)胞生物學(xué)中的應(yīng)用成果[16,17],引入了可應(yīng)用于未知新樣本的完全參數(shù)化傳輸映射。此前方法[19-21]依賴于原始最優(yōu)傳輸映射的無(wú)約束參數(shù)化,然而這類模型的無(wú)約束特性使穩(wěn)健優(yōu)化面臨挑戰(zhàn),導(dǎo)致性能下降[18]。與之不同,研究者們通過(guò)對(duì)偶最優(yōu)傳輸問(wèn)題學(xué)習(xí)未擾動(dòng)到擾動(dòng)細(xì)胞狀態(tài)的轉(zhuǎn)換,該問(wèn)題通過(guò)一對(duì)受凸性約束的神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)化[18]。這些約束構(gòu)成了重要的基于理論的歸納偏置,能夠促進(jìn)模型學(xué)習(xí),最終形成可靠且易于訓(xùn)練的框架——CellOT在多個(gè)問(wèn)題中均展現(xiàn)出穩(wěn)定優(yōu)異的性能,且無(wú)需大量超參數(shù)調(diào)優(yōu),這一事實(shí)也印證了上述優(yōu)勢(shì)(詳見(jiàn)在線方法)。

CellOT能夠推斷細(xì)胞群體對(duì)擾動(dòng)的高度復(fù)雜非線性演化過(guò)程,且無(wú)需對(duì)這些動(dòng)態(tài)過(guò)程的本質(zhì)做出強(qiáng)簡(jiǎn)化假設(shè)。與現(xiàn)有基于自動(dòng)編碼器的基線方法[12-14]不同,CellOT無(wú)需依賴學(xué)習(xí)有意義的低維嵌入空間,并將擾動(dòng)建模為該空間中的線性移位。研究者們通過(guò)對(duì)癌細(xì)胞系中不同藥物的單細(xì)胞反應(yīng)實(shí)驗(yàn)(結(jié)合RNA-seq和空間分辨4i測(cè)量技術(shù))驗(yàn)證了這一優(yōu)勢(shì),結(jié)果表明CellOT性能始終更優(yōu)(圖2及補(bǔ)充圖5)。研究者們的評(píng)估不僅局限于常用的平均治療效果和全細(xì)胞相關(guān)性分析,還通過(guò)邊緣分布分析和最大均值差異(MMD)分?jǐn)?shù)計(jì)算,對(duì)預(yù)測(cè)分布與觀測(cè)分布的匹配程度進(jìn)行了更嚴(yán)格的量化評(píng)估。

利用CellOT進(jìn)行細(xì)胞狀態(tài)感知藥物分析,研究者們能夠?qū)_動(dòng)效果量化為研究系統(tǒng)潛在異質(zhì)性的函數(shù)——本研究中即兩種對(duì)藥物敏感性不同的黑色素瘤細(xì)胞系共培養(yǎng)體系。通過(guò)這種方式,研究者們優(yōu)化了所測(cè)藥物的反應(yīng)圖譜,揭示了與細(xì)胞系供體治療史相關(guān)的多信號(hào)通路細(xì)胞狀態(tài)特異性反應(yīng)。研究者們發(fā)現(xiàn),預(yù)先暴露于MEK抑制劑的細(xì)胞中,MEK和PI3K通路的信號(hào)活性發(fā)生解偶聯(lián),這是黑色素瘤細(xì)胞已知的治療逃逸適應(yīng)機(jī)制[36]。這種通路重連與細(xì)胞分子反饋結(jié)構(gòu)從效應(yīng)器向受體的轉(zhuǎn)變相關(guān)[36, 47]。因此,將CellOT與更多組合治療方案、多重成像技術(shù)及反映疾病適應(yīng)特性的細(xì)胞體系相結(jié)合,有望助力研究者們闡明癌癥治療背景下信號(hào)通路演化的分子機(jī)制。

研究者們進(jìn)一步分析了所學(xué)映射在訓(xùn)練樣本之外(樣本外場(chǎng)景)及不同樣本組成(分布外場(chǎng)景)中的泛化能力。如圖4所示,研究者們測(cè)試了CellOT預(yù)測(cè)未見(jiàn)過(guò)狼瘡患者治療反應(yīng)、推斷低潛能干細(xì)胞發(fā)育軌跡及跨患者轉(zhuǎn)換先天免疫反應(yīng)的能力。在所有場(chǎng)景中,CellOT的準(zhǔn)確性和精確性均優(yōu)于當(dāng)前最先進(jìn)方法(圖4)。此外,擾動(dòng)后的預(yù)測(cè)細(xì)胞狀態(tài)與實(shí)際觀測(cè)細(xì)胞狀態(tài)仍高度接近。這些結(jié)果極具應(yīng)用前景,表明精準(zhǔn)的樣本外和分布外預(yù)測(cè)是切實(shí)可行的。

然而,分布外預(yù)測(cè)能力(如對(duì)未見(jiàn)過(guò)患者的預(yù)測(cè))的實(shí)現(xiàn)需滿足兩個(gè)條件:(1)在未擾動(dòng)場(chǎng)景中已觀測(cè)到相似樣本;(2)訓(xùn)練集包含不僅未擾動(dòng)狀態(tài)相似、且擾動(dòng)反應(yīng)也相似的案例。對(duì)接受帕比司他治療的膠質(zhì)母細(xì)胞瘤患者的分析(擴(kuò)展數(shù)據(jù)圖6a-c)證實(shí)了這一局限性:CellOT及基線方法能夠?qū)ξ磾_動(dòng)狀態(tài)和擾動(dòng)效果均與其他患者相似的病例預(yù)測(cè)治療結(jié)果(擴(kuò)展數(shù)據(jù)圖6f),但無(wú)法捕捉表現(xiàn)出獨(dú)特反應(yīng)患者的擾動(dòng)效果(擴(kuò)展數(shù)據(jù)圖6g)。在分布外場(chǎng)景應(yīng)用CellOT時(shí),這一局限性需重點(diǎn)考量。要解決此類問(wèn)題,需擴(kuò)大隊(duì)列規(guī)模、補(bǔ)充元信息并拓展方法學(xué)。Bunne等人[48]提出了一種神經(jīng)最優(yōu)傳輸方案,通過(guò)在預(yù)測(cè)擾動(dòng)反應(yīng)時(shí)納入上下文信息(如患者元數(shù)據(jù)),部分解決了這一問(wèn)題。

研究者們還觀察到,當(dāng)擾動(dòng)過(guò)強(qiáng)時(shí)(擾動(dòng)前后細(xì)胞分布差異極大),CellOT的預(yù)測(cè)性能會(huì)下降(圖4j),其他方法也出現(xiàn)了類似的性能下滑(補(bǔ)充圖12)。最優(yōu)傳輸理論的核心原理適用于急性細(xì)胞擾動(dòng)場(chǎng)景——在此類場(chǎng)景中,單細(xì)胞不會(huì)在多維測(cè)量空間中完全隨機(jī)重分布,通常僅在少數(shù)維度發(fā)生變化,因此整體相關(guān)結(jié)構(gòu)得以保留。當(dāng)通過(guò)規(guī)律且高頻的快照觀測(cè)擾動(dòng)反應(yīng)時(shí),該建模假設(shè)可得到滿足;但當(dāng)擾動(dòng)反應(yīng)進(jìn)展過(guò)深時(shí),分子轉(zhuǎn)換過(guò)程無(wú)法被重建。對(duì)于極強(qiáng)或極復(fù)雜的擾動(dòng),細(xì)胞多重特征圖譜可能發(fā)生劇烈變化,違背最優(yōu)傳輸假設(shè),導(dǎo)致難以基于最小努力原則重建未擾動(dòng)與擾動(dòng)群體間的對(duì)齊關(guān)系。在此類場(chǎng)景中,可能需要補(bǔ)充額外信息,例如潛在生物學(xué)模型或整合多個(gè)小時(shí)步觀測(cè)結(jié)果的模型。

盡管細(xì)胞命運(yùn)決定具有隨機(jī)性,且細(xì)胞動(dòng)態(tài)過(guò)程本質(zhì)上存在噪聲[49],但CellOT仍將細(xì)胞反應(yīng)建模為確定性軌跡。此前研究表明,與確定性方法相比,將細(xì)胞命運(yùn)決定視為概率事件的方法能更充分地估計(jì)完整動(dòng)態(tài)模型[50]。近期研究[51, 52]通過(guò)將最優(yōu)傳輸與隨機(jī)差分方程相結(jié)合,可在CellOT基礎(chǔ)上考慮生物異方差性,但需以增加模型復(fù)雜性及引入其他簡(jiǎn)化假設(shè)為代價(jià)。

盡管研究者們通過(guò)深入分析所學(xué)映射的本質(zhì),以及驗(yàn)證CellOT在多種應(yīng)用場(chǎng)景中的通用性,為其對(duì)不同數(shù)據(jù)模態(tài)下多種化學(xué)擾動(dòng)的建模能力提供了概念驗(yàn)證,但CellOT的泛化能力仍基于相對(duì)較小的數(shù)據(jù)集進(jìn)行評(píng)估。關(guān)鍵在于,由分子特征各異的患者(如具有不同潛在遺傳學(xué)特征的癌癥患者)組成的大型隊(duì)列,可能會(huì)產(chǎn)生高度異質(zhì)的治療反應(yīng)。顯然,針對(duì)這些挑戰(zhàn)的研究方法可充分利用即將出現(xiàn)的大規(guī)?;颊哧?duì)列研究數(shù)據(jù)。利用神經(jīng)最優(yōu)傳輸技術(shù)學(xué)習(xí)單細(xì)胞藥物反應(yīng),為未來(lái)研究開(kāi)辟了廣闊前景,包括助力深化對(duì)細(xì)胞療法的理解、研究患者樣本的藥物反應(yīng),以及在大規(guī)模藥物設(shè)計(jì)中更好地考慮細(xì)胞間變異性。

參考文獻(xiàn)

  1. Frangieh, C. J. et al. Multimodal pooled Perturb-CITE-seq screens in patient models define mechanisms of cancer immune cell evasion. Nat. Genet. 53, 332–341 (2021).

  2. Liberali, P., Snijder, B. & Pelkmans, L. A hierarchical map of regulatory genetic interactions in membrane trafficking. Cell 157, 1473–1487 (2014).

  3. Battich, N., Stoeger, T. & Pelkmans, L. Image-based transcriptomics in thousands of single human cells at single-molecule resolution. Nat. Methods 10, 1127–1133 (2013).

  4. Battich, N., Stoeger, T. & Pelkmans, L. Control of transcript variability in single mammalian cells. Cell 163, 1596–1610 (2015).

  5. Gut, G., Herrmann, M. D. & Pelkmans, L. Multiplexed protein maps link subcellular organization to cellular states. Science 361, eaar7042 (2018).

  6. Shaffer, S. M. et al. Rare cell variability and drug-induced reprogramming as a mode of cancer drug resistance. Nature 546, 431–4335 (2017).

  7. Kramer, B. A., Sarabia del Castillo, J. & Pelkmans, L. Multimodal perception links cellular state to decision-making in single cells. Science 377, 642–648 (2022).

  8. Snijder, B. et al. Population context determines cell-to-cell variability in endocytosis and virus infection. Nature 461, 520–523 (2009).

  9. Wu, F. et al. Single-cell profiling of tumor heterogeneity and the microenvironment in advanced non-small cell lung cancer. Nat. Commun. 12, 2540 (2021).

  10. González-Silva, L., Quevedo, L. & Varela, I. Tumor functional heterogeneity unraveled by scRNA-seq technologies. Trends Cancer 6, 13–19 (2020).

  11. Li, C. et al. Single-cell transcriptomics reveals cellular heterogeneity and molecular stratification of cervical cancer. Commun. Biol. 5, 1208 (2022).

  12. Lopez, R., Regier, J., Cole, M. B., Jordan, M. I. & Yosef, N. Deep generative modeling for single-cell transcriptomics. Nat. Methods 15, 1053–1058 (2018).

  13. Lotfollahi, M., Wolf, F. A. & Theis, F. L. scGen predicts single-cell perturbation responses. Nat. Methods 16, 715–721 (2019).

  14. Yang, K. D. et al. Predicting cell lineages using autoencoders and optimal transport. PLoS Comput. Biol. 16, e1007828 (2020).

  15. Villani, C. Optimal transport: Old and New Vol. 338 (Springer, 2009).

  16. Lavenant, H., Zhang, S., Kim, Y.-H. & Schiebinger, G. Towards a mathematical theory of trajectory inference. Preprint at https://arxiv.org/abs/2102.09204 (2021).

  17. Schiebinger, G. et al. Optimal-transport analysis of single-cell gene expression identifies developmental trajectories in reprogramming. Cell 176, 928–943 (2019).

  18. Makkuva, A., Taghvaei, M. A., Oh, S. & Lee, J. Optimal transport mapping via input convex neural networks. In Proc. 37th International Conference on Machine Learning (eds Daumé III, H. & Singh, A.) 6672–6681 (PMLR, 2020).

  19. Jacob, L., She, J., Almahairi, A., Rajeswar, S. & Courville, A. Adversarial computation of optimal transport maps. Preprint at https://arxiv.org/abs/1906.09691 (2019).

  20. Yang, K. D. & Uhler, C. Scalable unbalanced optimal transport using generative adversarial networks. In International Conference on Learning Representations (ICLR, 2019).

  21. Prasad, N., Yang, K. & Uhler, C. Optimal Transport using GANs for Lineage Tissues. Preprint at https://arxiv.org/abs/2007.12098 (2020).

  22. Amos, B., Xu, L. & Kolter, J. Z. Input convex neural networks. In Proc. 34th International Conference on Machine Learning (eds Precup, D. & Teh, Y. W.) 146–155 (PMLR, 2017).

  23. Villani, C. Topics in Optimal Transportation Vol. 58 (American Mathematical Soc., 2003).

  24. Santambrogio, F. Optimal transport for applied mathematicians. Birk?user 55, 94 (2015).

  25. Cang, Z. & Nie, Q. Inferring spatial and signaling relationships between cells from single cell transcriptomic data. Nat. Commun. 11, 2084 (2020).

  26. Demetci, P., Santorella, R., Sandstede, B., Noble, W. S. & Singh, R. SCOT: single-cell multi-omics alignment with optimal transport. J. Comput. Biol. 29, 3–18 (2022).

  27. Huizing, G.-J., Peyré, G. & Cantini, L. Optimal transport improves cell–cell similarity inference in single-cell omics data. Bioinformatics 38, 2169–2177 (2022).

  28. Zhang, S., Afanassiev, A., Greenstreet, L., Matsumoto, T. & Schiebinger, G. Optimal transport analysis reveals trajectories in steady-state systems. PLoS Comput. Biol. 17, e1009466 (2021).

  29. Korotin, A., Egiazarian, V., Asadulaev, M. A., Safin, A. & Burnaev, E. Wasserstein-2 generative networks. Preprint at https://arxiv.org/abs/1909.13082 (2021).

  30. Raaijmakers, M. I. et al. A new live-cell biobank workflow efficiently recovers heterogeneous melanoma cells from native biopsies. Exp. Dermatol. 24, 377–380 (2015).

  31. Srivatsan, S. R. et al. Massively multiplex chemical transcriptomics at single-cell resolution. Science 367, 45–51 (2020).

  32. Chen, S. et al. (Unfinished reference, original text truncated).

  33. Gretton, A. et al. A kernel two-sample test. J. Mach. Learn. Res. 13, 723–773 (2012).

  34. McInnes, L., Healy, J. & Melville, J. UMAP: Uniform Manifold Approximation and Projection for dimension reduction. Preprint at https://arxiv.org/abs/1802.03426 (2018).

  35. Smith, M. L. et al. (Unfinished reference, original text truncated).

  36. (Unfinished reference, original text truncated, associated with MEK/PI3K pathway decoupling).

  37. (Unfinished reference, original text truncated, associated with MEKi resistance mechanisms).

  38. Kang, H. M. et al. Multiplexed droplet single-cell RNA-seq of a human immune cell atlas. Preprint at https://doi.org/10.1101/229285 (2017).

  39. (Unfinished reference, associated with lupus and interferonopathies).

  40. (Unfinished reference, associated with autoimmune disease marker genes).

  41. (Unfinished reference, associated with interferon-β responses).

  42. (Unfinished reference, associated with interferon pathway targets).

  43. (Unfinished reference, associated with lupus therapy).

  44. Peidli, S. et al. (Unfinished reference, associated with glioblastoma cohort).

  45. Hagai, T. et al. (Unfinished reference, associated with cross-species LPS responses).

  46. Weinreb, C. et al. Lineage tracing reveals fate plasticity of mammalian nephron progenitors. Nature 553, 538–542 (2018).

  47. (Unfinished reference, associated with pathway rewiring).

  48. Bunne, C. et al. (Unfinished reference, associated with context-conditioned neural OT).

  49. (Unfinished reference, associated with stochastic cell-fate decisions).

  50. (Unfinished reference, associated with probabilistic cell-fate modeling).

  51. (Unfinished reference, associated with OT-stochastic difference equations).

  52. Somnath, V. et al. (Unfinished reference, associated with aligned dataset OT).

  53. Monge, G. Mémoire sur la théorie des déblais et des remblais. Histoire de l’Académie Royale des Sciences 666–704 (1781).

  54. Kantorovich, L. On the transfer of masses (in Russian). In Doklady Akademii Nauk, vol. 37 (1942).

  55. Cuturi, M. Sinkhorn Distances: Lightspeed Computation of Optimal Transport. Adv. Neural Inf. Process. Syst. (2013).

  56. Chen, Y., Shi, Y. & Zhang, B. Optimal Control Via Neural Networks: A Convex Approach. International Conference on Learning Representations (2019).

  57. Huang, C.-W., Chen, R. T. Q., Tsirigotis, C. & Courville, A. Convex Potential Flows: Universal Probability Distributions with Optimal Transport and Convex Optimization. International Conference on Learning Representations (2021).

  58. Bunne, C., Meng-Papaxanthos, L., Krause, A. & Cuturi, M. Proximal Optimal Transport Modeling of Population Dynamics. International Conference on Artificial Intelligence and Statistics (2022).

  59. Alvarez-Melis, D., Schiff, Y. & Mroueh, Y. Optimizing functionals on the space of probabilities with input convex neural networks. Transact. Mach. Learn. Res. (2023).

  60. Mokrov, P. et al. Large-Scale Wasserstein Gradient Flows. Adv. Neural Inf. Process. Syst. (2021).

  61. Fan, J., Taghvaei, A. & Chen, Y. Scalable Computations of Wasserstein Barycenter via Input Convex Neural Networks. International Conference on Machine Learning (2021).

  62. Knott, M. & Smith, C. S. On the optimal mapping of distributions. J. Optim. Theory Appl. 43, 39–49 (1984).

  63. Brenier, Y. Polar factorization and monotone rearrangement of vector-valued functions. Commun. Pure Appl. Math. 44, 375–417 (1991).

  64. Taghvaei, A. & Jalali, A. 2-Wasserstein approximation via restricted convex potentials with application to improved training for GANs. arXiv Preprint arXiv:1902.07197 (2019).

  65. Korotin, A. et al. Do Neural Optimal Transport Solvers Work? A Continuous Wasserstein-2 Benchmark. Transcript. Mach. Learn. Res. (2021).

  66. Heydari, T. et al. IQCELL: A platform for predicting the effect of gene perturbations on developmental trajectories using single-cell RNA-seq data. PLOS Comput. Biol. 18, e1009907 (2022).

  67. Tritschler, S. et al. Concepts and limitations for learning developmental trajectories from single cell genomics. Development 146, dev170506 (2019).

  68. Weinreb, C., Wolock, S., Tusi, B. K., Socolovsky, M. & Klein, A. M. Fundamental limits on dynamic inference from single-cell snapshots. Proc. Natl. Acad. Sci. USA 115, E2467–E2476 (2018).

  69. Lübeck, F. et al. Neural unbalanced optimal transport via cycle-consistent semi-couplings. arXiv preprint arXiv:2209.15621 (2022).

  70. Chen, W. et al. Live-seq enables temporal transcriptomic recording of single cells. Nature 608, 733–740 (2022).

  71. Shi, Y., De Bortoli, V., Campbell, A. & Doucet, A. Diffusion Schr?dinger Bridge Matching. arXiv preprint arXiv:2303.16852 (2023).

  72. Tong, A. et al. Conditional flow matching: simulation-free dynamic optimal transport. arXiv preprint arXiv:2302.0042 (2023).

  73. Carpenter, A. E. et al. CellProfiler: image analysis software for identifying and quantifying cell phenotypes. Genome Biol. 7, 1–11 (2006).

  74. Snijder, B. et al. Single-cell analysis of population context advances RNAi screening at multiple levels. Mol. Syst. Biol. 8, 579 (2012).

  75. Guizar-Sicairos, M., Thurman, S. T. & Fienup, J. R. Efficient subpixel image registration algorithms. Opt. Lett. 33, 156–158 (2008).

  76. Stoeger, T., Battich, N., Herrmann, M. D., Yakimovich, Y. & Pelkmans, L. Computer vision for image-based transcriptomics. Methods 85, 44–53 (2015).

  77. Van der Walt, S. et al. scikit-image: image processing in Python. PeerJ 2, e453 (2014).

  78. Wolf, F. A., Angerer, P. & Theis, F. J. SCANPY: large-scale single-cell gene expression data analysis. Genome Biol. 19, 1–15 (2018).

  79. Rybakov, S., Lotfollahi, M., Theis, F. J. & Wolf, F. A. Learning interpretable latent autoencoder representations with annotations of feature sets. bioRxiv (2020).

  80. Peidli, S. et al. scPerturb: Information resource for harmonized single-cell perturbation data. bioRxiv (2022).

  81. Kingma, D. P. & Ba, J. Adam: A Method for Stochastic Optimization. International Conference on Learning Representations (2014).

參考文獻(xiàn)可上下滑動(dòng)查看

細(xì)胞動(dòng)力學(xué)讀書(shū)會(huì)


細(xì)胞絕非孤立的單元,生命的智慧,如同蟻群的協(xié)作,涌現(xiàn)在細(xì)胞間復(fù)雜的相互作用之中。跨越臨界點(diǎn),簡(jiǎn)單規(guī)則便能催生全新的、穩(wěn)定的結(jié)構(gòu)與功能。


半個(gè)世紀(jì)以來(lái),復(fù)雜系統(tǒng)科學(xué)為我們提供了洞見(jiàn)生命現(xiàn)象的全新工具箱。本期活動(dòng),我們將融合物理學(xué)、復(fù)雜科學(xué)與系統(tǒng)生物學(xué),從Waddington景觀、自組織臨界,到反應(yīng)-擴(kuò)散模型與類器官實(shí)驗(yàn),繪制一幅理解細(xì)胞命運(yùn)與群體動(dòng)力學(xué)的連貫地圖。


本次讀書(shū)會(huì)由李輝、王維康、韋曉慧三位學(xué)者及王艷博士共同發(fā)起,并沿兩條主線展開(kāi):一是探討細(xì)胞命運(yùn)、多穩(wěn)態(tài)等理論核心;二是結(jié)合單細(xì)胞測(cè)序、時(shí)序推斷等方法,學(xué)習(xí)如何將靜態(tài)數(shù)據(jù)轉(zhuǎn)化為動(dòng)態(tài)模型。




詳情請(qǐng)見(jiàn):

1.

2.

3.

4.

5.

6.

7.

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
參加會(huì)見(jiàn)連正裝都不穿了!鄭麗文抵達(dá)首都第2天更加放松了!

參加會(huì)見(jiàn)連正裝都不穿了!鄭麗文抵達(dá)首都第2天更加放松了!

阿龍聊軍事
2026-04-12 12:09:16
中國(guó)的錢(qián)終于要回來(lái)了!路透社鐵證,西方政客集體沉默

中國(guó)的錢(qián)終于要回來(lái)了!路透社鐵證,西方政客集體沉默

安逸安逸
2026-04-12 21:42:26
“作弊” 內(nèi)幕曝光!3DMark回應(yīng)將某知名國(guó)產(chǎn)手機(jī)除名:實(shí)測(cè)性能相差24%、溫度超過(guò)50℃

“作弊” 內(nèi)幕曝光!3DMark回應(yīng)將某知名國(guó)產(chǎn)手機(jī)除名:實(shí)測(cè)性能相差24%、溫度超過(guò)50℃

快科技
2026-04-12 16:35:46
世錦賽戰(zhàn)報(bào):147,常冰玉豪取135萬(wàn)獎(jiǎng)金!再爆大冷4號(hào)種子7-10出局

世錦賽戰(zhàn)報(bào):147,常冰玉豪取135萬(wàn)獎(jiǎng)金!再爆大冷4號(hào)種子7-10出局

求球不落諦
2026-04-13 05:28:55
國(guó)際油價(jià)飆漲8%,黃金跌破4650美元,美軍開(kāi)始封鎖伊朗港口

國(guó)際油價(jià)飆漲8%,黃金跌破4650美元,美軍開(kāi)始封鎖伊朗港口

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-04-13 06:48:42
3人同日發(fā)聲!特朗普:美國(guó)“贏了”;佩澤希齊揚(yáng):以勇敢的態(tài)度進(jìn)行談判;內(nèi)塔尼亞胡:對(duì)伊打擊尚未結(jié)束

3人同日發(fā)聲!特朗普:美國(guó)“贏了”;佩澤希齊揚(yáng):以勇敢的態(tài)度進(jìn)行談判;內(nèi)塔尼亞胡:對(duì)伊打擊尚未結(jié)束

大象新聞
2026-04-12 09:45:02
廣東珠海一女神好漂亮, 身高179cm,體重50kg 美的讓人移不開(kāi)眼

廣東珠海一女神好漂亮, 身高179cm,體重50kg 美的讓人移不開(kāi)眼

今日搞笑分享
2026-04-06 17:55:16
如何優(yōu)雅地謀殺一座城:陳麗華的推土機(jī)與華新民的廢紙

如何優(yōu)雅地謀殺一座城:陳麗華的推土機(jī)與華新民的廢紙

有戲
2026-04-11 09:21:04
曝何超蕸乳癌復(fù)發(fā)去世,何超儀曾說(shuō)她太好欺負(fù),多位港民曝其人品

曝何超蕸乳癌復(fù)發(fā)去世,何超儀曾說(shuō)她太好欺負(fù),多位港民曝其人品

古希臘掌管松餅的神
2026-04-12 17:20:48
有人用銼刀把MacBook棱角磨圓了,蘋(píng)果設(shè)計(jì)師看了沉默

有人用銼刀把MacBook棱角磨圓了,蘋(píng)果設(shè)計(jì)師看了沉默

爬蟲(chóng)飼養(yǎng)員
2026-04-12 09:20:43
香港演員鄭雷去世,享年92歲,曾出演多部金庸劇

香港演員鄭雷去世,享年92歲,曾出演多部金庸劇

都市快報(bào)橙柿互動(dòng)
2026-04-12 23:36:36
伊朗官員稱在談判中抵制了美方三大“無(wú)理要求”

伊朗官員稱在談判中抵制了美方三大“無(wú)理要求”

新京報(bào)
2026-04-13 07:31:08
伊朗總統(tǒng):伊朗已做好準(zhǔn)備達(dá)成平衡且公平的協(xié)議

伊朗總統(tǒng):伊朗已做好準(zhǔn)備達(dá)成平衡且公平的協(xié)議

新華社
2026-04-12 23:26:02
新娘確實(shí)漂亮,但我更喜歡戴眼鏡那個(gè)。

新娘確實(shí)漂亮,但我更喜歡戴眼鏡那個(gè)。

動(dòng)物奇奇怪怪
2026-04-12 12:44:36
國(guó)安球迷意難平!不止因?yàn)?-2慘遭蓉城逆轉(zhuǎn),更多在于以下五點(diǎn)!

國(guó)安球迷意難平!不止因?yàn)?-2慘遭蓉城逆轉(zhuǎn),更多在于以下五點(diǎn)!

田先生籃球
2026-04-13 00:01:34
某車(chē)起火文章被投訴下架!

某車(chē)起火文章被投訴下架!

電動(dòng)知家
2026-04-12 19:53:03
馬斯克版“微信”來(lái)了,iPhone下載需謹(jǐn)慎!

馬斯克版“微信”來(lái)了,iPhone下載需謹(jǐn)慎!

果粉之家
2026-04-12 12:57:47
絕了!嚴(yán)月霞身姿碾壓鄭麗文,中國(guó)女保鏢這才是真正的大女主!

絕了!嚴(yán)月霞身姿碾壓鄭麗文,中國(guó)女保鏢這才是真正的大女主!

TVB的四小花
2026-04-13 00:26:19
鄭麗文返臺(tái)發(fā)表講話,賴清德急了,民眾黨暴露真面目,不簡(jiǎn)單

鄭麗文返臺(tái)發(fā)表講話,賴清德急了,民眾黨暴露真面目,不簡(jiǎn)單

DS北風(fēng)
2026-04-12 19:36:09
41歲足壇傳奇定居廣東成大老板,央視編導(dǎo)妻子氣質(zhì)佳

41歲足壇傳奇定居廣東成大老板,央視編導(dǎo)妻子氣質(zhì)佳

草莓信箱
2026-04-12 03:34:32
2026-04-13 08:03:00
集智俱樂(lè)部 incentive-icons
集智俱樂(lè)部
科普人工智能相關(guān)知識(shí)技能
5758文章數(shù) 4667關(guān)注度
往期回顧 全部

科技要聞

4000億智譜,想變得更貴

頭條要聞

大伯為35歲女兒周末連跑3處相親角:女兒平時(shí)工作太忙

頭條要聞

大伯為35歲女兒周末連跑3處相親角:女兒平時(shí)工作太忙

體育要聞

創(chuàng)造歷史!五大聯(lián)賽首位女性主教練誕生

娛樂(lè)要聞

賭王女兒何超蕸病逝,常年和乳癌斗爭(zhēng)

財(cái)經(jīng)要聞

美伊談判破裂的三大癥結(jié)

汽車(chē)要聞

煥新極氪007/007GT上市 限時(shí)19.39萬(wàn)起

態(tài)度原創(chuàng)

家居
本地
教育
游戲
公開(kāi)課

家居要聞

復(fù)古風(fēng)格 自然簡(jiǎn)約

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

教育要聞

教育部新推教改大動(dòng)作!這場(chǎng)重量級(jí)活動(dòng)千萬(wàn)別錯(cuò)過(guò)

性感妹子也救不了!《上古世紀(jì)》廠商新游,一個(gè)月不到就宣告停運(yùn)

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版