国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Nature?|?深度學(xué)習(xí)模型直接從DNA序列解碼人類(lèi)啟動(dòng)子調(diào)控語(yǔ)法

0
分享至


撰文|


人類(lèi)啟動(dòng)子活性預(yù)測(cè)的傳統(tǒng)深度學(xué)習(xí)方法依賴(lài)于整合大量表觀(guān)基因組數(shù)據(jù)進(jìn)行訓(xùn)練【1,2】,計(jì)算成本高且只能反映序列與表達(dá)的相關(guān)性,難以直接推斷因果關(guān)系,也無(wú)法預(yù)測(cè)未包含在訓(xùn)練集中的細(xì)胞類(lèi)型或條件下的調(diào)控變化。

近日,荷蘭烏得勒支昂科德研究所Bas van Steensel團(tuán)隊(duì)與Jeroen de Ridder團(tuán)隊(duì)合作,共同在Nature上發(fā)表了一篇題為Regulatory grammar in human promoters uncovered by MPRA-based deep learning的文章。 研究團(tuán)隊(duì)開(kāi)發(fā)了PARM(promoter activity regulatory model) —— 一個(gè)基于細(xì)胞類(lèi)型特異性MPRA數(shù)據(jù)訓(xùn)練的輕量級(jí)深度學(xué)習(xí)模型,能夠僅從DNA序列準(zhǔn)確預(yù)測(cè)啟動(dòng)子活性,并解析啟動(dòng)子的調(diào)控語(yǔ)法。


為了直接從DNA序列預(yù)測(cè)啟動(dòng)子活性并克服傳統(tǒng)表觀(guān)基因組模型的局限性,研究者利用K562和HepG2細(xì)胞的基因組范圍MPRA數(shù)據(jù)訓(xùn)練了細(xì)胞特異性卷積神經(jīng)網(wǎng)絡(luò)模型PARM。他們發(fā)現(xiàn)PARM能高精度預(yù)測(cè)啟動(dòng)子活性(K562中Pearson’s R=0.92,HepG2中R=0.89),并能準(zhǔn)確預(yù)測(cè)個(gè)體片段的活性以及整合于基因組中的啟動(dòng)子活性(R=0.78-0.80)。通過(guò)ISM分析,PARM成功預(yù)測(cè)了TERT啟動(dòng)子中致癌突變(如C250T和C228T)會(huì)增強(qiáng)表達(dá),并在預(yù)測(cè)血液組織中順式作用eQTLs方面達(dá)到了與大型模型Enformer相當(dāng)?shù)木?,但參?shù)量(742,337)遠(yuǎn)少于Borzoi(>3千萬(wàn))。

為了進(jìn)一步驗(yàn)證PARM的預(yù)測(cè)能力并探索其設(shè)計(jì)全新啟動(dòng)子的潛力,研究者采用遺傳算法,以PARM為評(píng)估函數(shù),從隨機(jī)序列開(kāi)始迭代優(yōu)化生成合成啟動(dòng)子。他們發(fā)現(xiàn)該算法生成了大量PARM預(yù)測(cè)為高活性的多樣化序列。實(shí)驗(yàn)驗(yàn)證顯示,這些合成啟動(dòng)子的實(shí)測(cè)活性與預(yù)測(cè)強(qiáng)相關(guān),其中最強(qiáng)合成啟動(dòng)子的活性與天然最強(qiáng)啟動(dòng)子相當(dāng)。更重要的是,定向突變PARM預(yù)測(cè)為關(guān)鍵的12-18個(gè)核苷酸,會(huì)導(dǎo)致合成啟動(dòng)子活性平均降低3.16±0.77倍,證明模型能精準(zhǔn)識(shí)別功能序列元件。這些 合成序列與人類(lèi)基因組無(wú)顯著相似性,但包含了K562細(xì)胞中已知激活因子(如FOS-JUN, ETS, CREB)的結(jié)合基序,表明PARM已學(xué)會(huì)在特定細(xì)胞類(lèi)型中組合有功能的TF基序 。得益于PARM的計(jì)算高效性,研究者將其ISM分析應(yīng)用于30,607個(gè)人類(lèi)啟動(dòng)子,以系統(tǒng)識(shí)別影響活性的功能性TF結(jié)合位點(diǎn)(即調(diào)控位點(diǎn)RS)。他們發(fā)現(xiàn),在K562細(xì)胞中,大多數(shù)RS與已知TF基序匹配,且對(duì)應(yīng)的TF在細(xì)胞內(nèi)均有表達(dá)或由其高度相似的家族成員表達(dá)。分析共在20,543個(gè)啟動(dòng)子中識(shí)別出至少一個(gè)RS,而無(wú)RS的啟動(dòng)子活性普遍較低。此外,研究者發(fā)現(xiàn)了1,402個(gè)不與任何已知基序匹配的RS,并對(duì)其中一個(gè)高頻未知基序(TCTCTATGGT)進(jìn)行DNA親和純化與質(zhì)譜分析,鑒定出ZNF48為其結(jié)合TF,并通過(guò)體外實(shí)驗(yàn)證實(shí),從而證明 PARM能發(fā)現(xiàn)罕見(jiàn)且注釋不全的功能性TF基序 。

由于全基因組MPRA文庫(kù)需要大量細(xì)胞且可擴(kuò)展性有限,而PARM訓(xùn)練僅需覆蓋啟動(dòng)子的片段,研究者 開(kāi)發(fā)了一種基于捕獲策略、高度富集(90%)啟動(dòng)子重疊片段的聚焦MPRA文庫(kù) 。他們發(fā)現(xiàn),這種文庫(kù)僅需約500萬(wàn)細(xì)胞(比全基因組MPRA少240倍),仍能以平均151倍的覆蓋率覆蓋所有人類(lèi)TSS,且在K562和HepG2細(xì)胞中測(cè)得的啟動(dòng)子活性及PARM的預(yù)測(cè)能力與全基因組數(shù)據(jù)相當(dāng)。利用此經(jīng)濟(jì)策略,他們成功為另外七種人類(lèi)細(xì)胞系和一種患者來(lái)源的結(jié)腸癌類(lèi)器官生成了高質(zhì)量數(shù)據(jù)和PARM模型,模型訓(xùn)練僅需約1天,證明了該策略在實(shí)驗(yàn)和計(jì)算上的高效性與通用性。

為了在多種細(xì)胞類(lèi)型中實(shí)驗(yàn)驗(yàn)證PARM的預(yù)測(cè),研究者構(gòu)建了一個(gè)包含十個(gè)啟動(dòng)子的合成MPRA文庫(kù),在其中系統(tǒng)引入每個(gè)核苷酸的所有三種突變,并在七種細(xì)胞系中測(cè)量每個(gè)單點(diǎn)突變的影響。他們發(fā)現(xiàn),在30個(gè)通過(guò)嚴(yán)格質(zhì)量控制的啟動(dòng)子-細(xì)胞系組合中,PARM預(yù)測(cè)的突變效應(yīng)與實(shí)測(cè)值之間的Pearson相關(guān)系數(shù)為0.52±0.18,與Enformer(0.50±0.19)相似,而B(niǎo)orzoi表現(xiàn)更不穩(wěn)定(0.48±0.32)。在識(shí)別實(shí)驗(yàn)可檢測(cè)的RS方面,Borzoi的召回率通常最高,但PARM的精確度普遍優(yōu)于Enformer和Borzoi。這表明 盡管PARM計(jì)算上更輕量,但其整體性能相似,且在識(shí)別RS時(shí)更為保守 。

接下來(lái),研究者利用PARM探索了九種細(xì)胞系中啟動(dòng)子調(diào)控的差異。他們發(fā)現(xiàn),盡管不同細(xì)胞類(lèi)型間自主啟動(dòng)子活性高度相關(guān)(R=0.78-0.95),但 PARM模型仍揭示了大量細(xì)胞類(lèi)型特異性的調(diào)控事件 。分析顯示,靶向數(shù)千個(gè)啟動(dòng)子的TF通常在所有細(xì)胞類(lèi)型中均活躍,而靶向較少啟動(dòng)子的TF(如HepG2中的HNF1A/HNF1B,K562中的GATA因子)則表現(xiàn)出明顯的細(xì)胞類(lèi)型特異性。一個(gè)值得注意的發(fā)現(xiàn)是, TBP在其基序上的活性并非在所有細(xì)胞類(lèi)型中普遍存在,這與近期研究提示其非必需性的觀(guān)點(diǎn)一致 。這些分析表明PARM可用于揭示啟動(dòng)子的細(xì)胞類(lèi)型特異性調(diào)控。利用PARM工作流程的經(jīng)濟(jì)性?xún)?yōu)勢(shì),研究者通過(guò)MPRA和對(duì)應(yīng)模型分析了細(xì)胞對(duì)三種不同刺激(熱激、nutlin-3a、PMA)的響應(yīng)。他們發(fā)現(xiàn),即使簡(jiǎn)單的擾動(dòng)結(jié)合聚焦PARM,也能提供關(guān)于個(gè)體啟動(dòng)子動(dòng)態(tài)調(diào)控及責(zé)任TF的詳細(xì)信息。

研究者探究了TF基序的方向和位置是否影響其調(diào)控活性。他們發(fā)現(xiàn), 在幾乎所有細(xì)胞類(lèi)型和大多數(shù)TF基序中,PARM檢測(cè)到的激活RS在兩個(gè)方向上的數(shù)量相似,但TBP和CTCF-CTCFL是顯著例外 。此外,所有啟動(dòng)子匯總的RS在TSS上游-120bp至+10bp范圍內(nèi)呈偏好性分布,峰值在-50bp,這與之前基于線(xiàn)性回歸的估計(jì)一致。而僅基于序列的基序掃描則分布更平坦且多出約20倍的匹配,表明大多數(shù)基序在研究的細(xì)胞類(lèi)型中并無(wú)功能。對(duì)匹配特定TF基序的RS進(jìn)行分析,揭示了多樣化的TF特異性位置模式,且這些功能性RS的分布比單純基序掃描得到的分布更為集中,提供了單純基序出現(xiàn)頻率無(wú)法提供的功能信息。為了更詳細(xì)研究 特定TF基序在啟動(dòng)子中的位置效應(yīng),研究者使用PARM預(yù)測(cè)了將單個(gè)TF基序插入天然啟動(dòng)子序列各處的影響。他們發(fā)現(xiàn),這種效應(yīng)高度多樣化且依賴(lài)于位置 。對(duì)30,607個(gè)啟動(dòng)子系統(tǒng)插入四種TF基序(NRF1、NFYA、SP1、YY1)的分析揭示了普遍趨勢(shì)和例外:NRF1、NFYA和SP1基序插入在活躍啟動(dòng)子中會(huì)產(chǎn)生多樣化的位置效應(yīng)(包括抑制),而YY1基序則主要表現(xiàn)出激活效應(yīng),尤其是在低活性啟動(dòng)子的TSS下游插入時(shí)。后續(xù)MPRA實(shí)驗(yàn)在四種細(xì)胞類(lèi)型中驗(yàn)證了這些預(yù)測(cè),確認(rèn)了NFYA、NRF1和SP1基序在TSS附近或下游的抑制效應(yīng),以及YY1在這些位置的最強(qiáng)激活效應(yīng),表明這些效應(yīng)并非普適,強(qiáng)烈依賴(lài)于局部序列背景和啟動(dòng)子的基線(xiàn)活性。

綜上所述,這項(xiàng)研究 開(kāi)發(fā)了名為PARM的經(jīng)濟(jì)高效深度學(xué)習(xí)框架,通過(guò)結(jié)合定制化MPRA數(shù)據(jù)與輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)了僅從DNA序列直接預(yù)測(cè)人類(lèi)啟動(dòng)子活性,并系統(tǒng)解析了其在多種細(xì)胞類(lèi)型及刺激響應(yīng)下的轉(zhuǎn)錄因子調(diào)控語(yǔ)法。 該研究突破了傳統(tǒng)依賴(lài)海量表觀(guān)基因組數(shù)據(jù)的建模瓶頸,以“輕量化”策略實(shí)現(xiàn)了對(duì)啟動(dòng)子核心調(diào)控邏輯的因果性解析,為未來(lái)在合成生物學(xué)、疾病突變解讀及個(gè)性化醫(yī)療中快速建模細(xì)胞特異性基因調(diào)控奠定了方法學(xué)基礎(chǔ)。

https://doi.org/10.1038/s41586-025-10093-z

制版人: 十一

參考文獻(xiàn)

1. Zhou, J. & Troyanskaya, O. G. Predicting effects of noncoding variants with deep learningbased sequence model.Nat. Methods12, 931–934 (2015) .

2. Kelley, D. R. et al. Sequential regulatory activity prediction across chromosomes with convolutional neural networks.Genome Res.28, 739–750 (2018).

學(xué)術(shù)合作組織

(*排名不分先后)



戰(zhàn)略合作伙伴

(*排名不分先后)



轉(zhuǎn)載須知

【原創(chuàng)文章】BioArt原創(chuàng)文章,歡迎個(gè)人轉(zhuǎn)發(fā)分享,未經(jīng)允許禁止轉(zhuǎn)載,所刊登的所有作品的著作權(quán)均為BioArt所擁有。BioArt保留所有法定權(quán)利,違者必究。

BioArt

Med

Plants

人才招聘

近期直播推薦


點(diǎn)擊主頁(yè)推薦活動(dòng)

關(guān)注更多最新活動(dòng)!


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
澳門(mén)的賭臺(tái),大面積關(guān)停!不是沒(méi)人去,而是被“算法”割廢的?

澳門(mén)的賭臺(tái),大面積關(guān)停!不是沒(méi)人去,而是被“算法”割廢的?

水泥土的搞笑
2026-02-27 17:09:36
重磅!一口氣官宣5條,西安地鐵傳爆炸性消息!

重磅!一口氣官宣5條,西安地鐵傳爆炸性消息!

西莫的藝術(shù)宮殿
2026-03-01 00:35:17
49歲仍單身!曾因"全裸寫(xiě)真"遭全網(wǎng)唾罵,如今她活成了這樣

49歲仍單身!曾因"全裸寫(xiě)真"遭全網(wǎng)唾罵,如今她活成了這樣

攬星河的筆記
2026-02-27 18:18:35
伊朗軍隊(duì)最高指揮官被擊斃

伊朗軍隊(duì)最高指揮官被擊斃

桂系007
2026-02-28 18:25:45
汪小菲喜得三胎僅2天,荒唐事接連發(fā)生,馬筱梅或走上大S的老路

汪小菲喜得三胎僅2天,荒唐事接連發(fā)生,馬筱梅或走上大S的老路

攬星河的筆記
2026-02-26 19:35:46
王石不戴假發(fā)樣子曝光!光頭更年輕,到香港聚餐,只喝茶不敢喝酒

王石不戴假發(fā)樣子曝光!光頭更年輕,到香港聚餐,只喝茶不敢喝酒

老頭的傳奇色彩
2026-02-28 19:57:17
謝霆鋒大兒子Lucas獨(dú)自跑到深圳滑雪,看臉是挺帥的,但個(gè)子不高

謝霆鋒大兒子Lucas獨(dú)自跑到深圳滑雪,看臉是挺帥的,但個(gè)子不高

小娛樂(lè)悠悠
2025-12-13 09:14:32
劉亦菲100g黃金鐲疊戴封神!原來(lái)黃金戴對(duì)了,高級(jí)感拉滿(mǎn)

劉亦菲100g黃金鐲疊戴封神!原來(lái)黃金戴對(duì)了,高級(jí)感拉滿(mǎn)

白宸侃片
2026-02-26 18:05:06
網(wǎng)飛一口氣放出8集,她曾詐騙了半個(gè)韓國(guó)演藝圈!

網(wǎng)飛一口氣放出8集,她曾詐騙了半個(gè)韓國(guó)演藝圈!

君君電影院
2026-03-01 00:12:16
警惕!47歲男子惡心嘔吐誤當(dāng)腸胃炎,確診心梗已錯(cuò)過(guò)救治黃金時(shí)間窗

警惕!47歲男子惡心嘔吐誤當(dāng)腸胃炎,確診心梗已錯(cuò)過(guò)救治黃金時(shí)間窗

極目新聞
2026-02-28 10:20:03
40歲存款要達(dá)到什么水平?

40歲存款要達(dá)到什么水平?

In風(fēng)尚
2026-02-23 06:04:00
40萬(wàn)英鎊周薪英超第2,連續(xù)10輪球荒生涯首次,薩拉赫真的老了?

40萬(wàn)英鎊周薪英超第2,連續(xù)10輪球荒生涯首次,薩拉赫真的老了?

夏侯看英超
2026-03-01 02:27:32
回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

就一點(diǎn)
2025-11-22 10:36:39
宗馥莉在上海高檔餐廳露面,與外籍男士共進(jìn)晚餐,同行女孩畫(huà)面溫馨

宗馥莉在上海高檔餐廳露面,與外籍男士共進(jìn)晚餐,同行女孩畫(huà)面溫馨

東方不敗然多多
2026-02-25 16:20:33
什么是性成癮?患者自述:比煙癮、酒癮厲害多了,比戒毒還難

什么是性成癮?患者自述:比煙癮、酒癮厲害多了,比戒毒還難

泠泠說(shuō)史
2025-10-30 15:20:45
黎明前的驚雷:一個(gè)時(shí)代的落幕與中東秩序的重塑

黎明前的驚雷:一個(gè)時(shí)代的落幕與中東秩序的重塑

高博新視野
2026-01-05 18:13:59
趙忠祥離世6年后,22年前不惜賭上清白陷害他的饒穎,如今怎樣了

趙忠祥離世6年后,22年前不惜賭上清白陷害他的饒穎,如今怎樣了

胡一舸南游y
2026-02-28 17:19:02
迪拜兩大機(jī)場(chǎng)暫停航班運(yùn)營(yíng)

迪拜兩大機(jī)場(chǎng)暫停航班運(yùn)營(yíng)

新華社
2026-02-28 21:13:04
機(jī)構(gòu)改革!不保留退役軍人事務(wù)局,成立新的民政和退役軍人事務(wù)局

機(jī)構(gòu)改革!不保留退役軍人事務(wù)局,成立新的民政和退役軍人事務(wù)局

墨蘭史書(shū)
2026-01-05 16:40:03
6局激戰(zhàn)勝出!孫穎莎4-2躋身新加坡大滿(mǎn)貫四強(qiáng),半決賽將戰(zhàn)陳熠

6局激戰(zhàn)勝出!孫穎莎4-2躋身新加坡大滿(mǎn)貫四強(qiáng),半決賽將戰(zhàn)陳熠

全景體育V
2026-02-28 21:11:37
2026-03-01 02:40:49
BioArt incentive-icons
BioArt
探索生物藝術(shù)之奧秘
9287文章數(shù) 18497關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話(huà)

頭條要聞

伊朗媒體公布反擊美軍軍事行動(dòng)結(jié)果

頭條要聞

伊朗媒體公布反擊美軍軍事行動(dòng)結(jié)果

體育要聞

球隊(duì)主力全報(bào)銷(xiāo)?頂風(fēng)擺爛演都不演了

娛樂(lè)要聞

周杰倫兒子正面照曝光,與父親好像

財(cái)經(jīng)要聞

沖突爆發(fā) 市場(chǎng)變天?

汽車(chē)要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

房產(chǎn)
教育
親子
時(shí)尚
公開(kāi)課

房產(chǎn)要聞

濱江九小也來(lái)了!集齊海僑北+哈羅、寰島...江東教育要炸了!

教育要聞

“比預(yù)估高了20多分,激動(dòng)得有點(diǎn)想哭!”今天有人歡呼,有人沉默,有人紅了眼眶,這一年都經(jīng)歷了什么?

親子要聞

嬰兒吃的“洋”輔食,九成靠代工貼牌?涉及上市公司

這6款發(fā)色居然這么火?50張圖可以直接給tony

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版