国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

知識引導(dǎo)的分子圖像自監(jiān)督學(xué)習(xí)框架,破解活性懸崖識別難題

0
分享至



作者丨論文團隊

編輯丨ScienceAI

在藥物發(fā)現(xiàn)領(lǐng)域,一個長期存在的挑戰(zhàn)是活性懸崖(Activity Cliffs)現(xiàn)象,即兩個分子結(jié)構(gòu)高度相似但生物活性卻存在顯著差異,然而,由于傳統(tǒng)方法在識別活性懸崖時,會出現(xiàn)表征坍塌的問題,因此仍然難以準(zhǔn)確捕捉懸崖分子的細微差別。

近日,湖南大學(xué)等團隊在《BMC Biology》上發(fā)表了一項研究《MaskMol: knowledge-guided molecular image pre-training framework for activity cliffs with pixel masking》,這項研究開發(fā)了名為 MaskMol 的知識引導(dǎo)分子圖像自監(jiān)督預(yù)訓(xùn)練框架,該框架能通過細粒度知識引導(dǎo)的像素掩碼策略進行準(zhǔn)確的活性懸崖估計。

活性懸崖與傳統(tǒng)模型的局限

分子性質(zhì)預(yù)測是藥物研發(fā)的核心環(huán)節(jié),其核心假設(shè)是結(jié)構(gòu)相似則性質(zhì)相似(圖 1 左)。然而活性懸崖的存在恰恰是這一理念的例外,這類分子對結(jié)構(gòu)差異微小,生物活性卻相差顯著。

圖 1 右側(cè)可見,僅一個原子不同的分子,高活性(紅色標(biāo)注)與低活性(綠色標(biāo)注)形成鮮明對比,這種結(jié)構(gòu)近、活性遠的現(xiàn)象,正是活性懸崖的典型特征,而傳統(tǒng)模型難以應(yīng)對這一挑戰(zhàn)的根源在于表征坍縮問題。



圖 1:特征空間中 SAR(左)和活性懸崖(右)的示意圖。



圖 2:特征空間中 Graph 和 Image 表征的比較。

如圖 2 所示,研究通過對比分子相似度與特征空間距離,發(fā)現(xiàn)隨著分子相似度(橫軸,Tanimoto 系數(shù))升高,圖模型(如 GCN、MPNN)的特征歐氏距離(縱軸)快速下降,這意味著結(jié)構(gòu)相似的分子在特征空間中幾乎重疊,導(dǎo)致表征坍塌,無法區(qū)分;而分子圖像的特征距離下降更平緩,保留了更多差異信息。

MaskMol框架:知識引導(dǎo)的分子圖像學(xué)習(xí)

更進一步,活性懸崖通常由不同分子層次上的細微變化引起,例如特定原子取代、鍵修飾或官能團取代。例如,在原子層面,將苯環(huán)上的氫原子替換為氯原子,會導(dǎo)致分子與受體的結(jié)合相互作用發(fā)生顯著變化,從而影響其生物活性。

因此,團隊的目標(biāo)是將已有化學(xué)知識融入模型,利用這種與活性懸崖相關(guān)的知識指導(dǎo)模型學(xué)習(xí)分子。從而,文章中提出 MaskMol,以分子圖像為核心表征,通過知識引導(dǎo)的像素掩碼與細粒度知識引導(dǎo)的像素掩碼預(yù)測任務(wù)構(gòu)建從分子圖像到化學(xué)知識的映射,其完整流程如圖 3 所示。

MaskMol 框架包含兩大核心模塊:

(1)三種知識引導(dǎo)的像素掩蔽策略:具體而言,研究團隊首先將分子 SMILES 轉(zhuǎn)換為二維圖像,然后利用 RDKit 分別對原子、化學(xué)鍵和子結(jié)構(gòu)進行高亮標(biāo)記,利用 HSV 檢測生成掩碼集,并與原始圖像結(jié)合,生成三張不同知識層次的分子掩碼圖像。

(2)三個用于預(yù)訓(xùn)練的知識引導(dǎo)像素掩碼預(yù)測任務(wù)。訓(xùn)練一個 Vision Transformer(ViT)模型來預(yù)測被掩碼部分所代表的不同層級(原子級,化學(xué)鍵級,子結(jié)構(gòu)級)的化學(xué)知識,這種設(shè)計迫使模型從圖像的剩余上下文中學(xué)習(xí)分子結(jié)構(gòu)的深層化學(xué)語義。



圖 3:MaskMol 框架。

下游任務(wù)性能

研究團隊在活性懸崖估計(ACE)和化合物效能預(yù)測(CPP)兩個關(guān)鍵下游任務(wù)上對 MaskMol 進行了全面評估。在活性懸崖估計任務(wù)上,MaskMol 與 25 種先進的深度學(xué)習(xí)和機器學(xué)習(xí)方法進行了比較,涵蓋了基于序列、圖(2D 和 3D)、圖像及多模態(tài)的模型。如圖 4 所示,MaskMol 在 10 個不同的 ACE 數(shù)據(jù)集上取得了最低的 RMSE。

特別是在骨架劃分設(shè)置下(圖 5),MaskMol 相比圖像模型(ImageMol)均有顯著提升,平均 RMSE 提升超過了 17.0%,這證明了其優(yōu)秀的泛化能力。同時,MaskMol 在化合物效能預(yù)測任務(wù)上也表現(xiàn)出色,即使在預(yù)訓(xùn)練數(shù)據(jù)量(200 萬)遠少于某些基線模型(1000 萬)的情況下,其預(yù)測精度仍優(yōu)于對比模型,顯示了框架的數(shù)據(jù)效率。



圖 4:活性懸崖估計實驗結(jié)果。



圖 5:骨架劃分實驗結(jié)果。

消融實驗

為了深入驗證 MaskMol 中各個組件的有效性,合理性,研究團隊還進行了系統(tǒng)的消融實驗,結(jié)果如上圖所示:圖 6c 的消融研究揭示了三個預(yù)訓(xùn)練任務(wù)的重要性,移除任何預(yù)訓(xùn)練任務(wù)都會導(dǎo)致性能下降,其中 Motif 級任務(wù)(MMPP)的影響最大,凸顯了子結(jié)構(gòu)知識對于捕捉活性懸崖關(guān)鍵細微差異的核心作用。

在圖中可以看到,與未預(yù)訓(xùn)練的模型相比,完整的預(yù)訓(xùn)練帶來了平均超過 34% 的性能增益。圖 6d 探討了像素掩碼比例的影響,與 BERT(15%)或 MAE(75%)不同,MaskMol 在分子圖像上的最佳掩碼比例為 50%,這很可能與分子圖像本身信息稀疏、有效像素占比較低的特性有關(guān)。

圖 6e 進一步分析了圖像大小影響,結(jié)果表明分子圖像的大小對性能無顯著影響(p>0.05)。



圖 6:消融實驗。

可解釋性分析

為了理解 MaskMol 的成功機理,研究團隊進行了特征空間探索,注意力可視化,化學(xué)知識解釋等三方面的可解釋性分析。

特征空間探索:圖 7a-b 顯示,基于 MaskMol 學(xué)習(xí)到的分子表征,高活性和低活性分子在二維空間中形成了更清晰的邊界,而基于 ECFP 指紋的表示則混雜在一起。定量分析(圖 7c)進一步證實,活性懸崖分子對在 MaskMol 特征空間中的距離遠大于在 ECFP 空間中的距離,進一步說明 MaskMol 有效緩解了表征坍塌。

注意力可視化:上圖 7d-e 表明,經(jīng)過知識引導(dǎo)預(yù)訓(xùn)練后,MaskMol 能夠精準(zhǔn)地將注意力集中在與任務(wù)相關(guān)的原子、鍵或子結(jié)構(gòu)上。相比之下,GNN 模型往往將注意力分散在分子的不重要區(qū)域或相同的結(jié)構(gòu)上,而未經(jīng)預(yù)訓(xùn)練的圖像模型則關(guān)注整個分子而忽略了關(guān)鍵細節(jié),這證明 MaskMol 確實學(xué)會了利用細微的結(jié)構(gòu)差異進行活性懸崖預(yù)測。

化學(xué)知識解釋:研究采用子結(jié)構(gòu)掩碼解釋(SME)進一步量化子結(jié)構(gòu)對 MaskMol 預(yù)測的貢獻。通過計算子結(jié)構(gòu)貢獻度,能深入理解其對分子活性的影響。如圖8a所示,添加苯環(huán)(歸因值=?1.93,Ki = 5370 nM)和乙醇(歸因值=?0.95,Ki = 758 nM)等子結(jié)構(gòu)時,歸因值均低于零,且苯環(huán)的影響顯著大于乙醇,這與分子活性值高度吻合。除生物活性外,文章中還展示了不同子結(jié)構(gòu)對毒性的分析,如圖 8c 和 d。



圖 7:特征空間和注意力可視化。



圖 8:化學(xué)知識解釋。

應(yīng)用前景:從虛擬篩選到腫瘤治療

為了驗證 MaskMol 的實際應(yīng)用潛力,研究團隊將其應(yīng)用于前列腺癌免疫治療潛在靶點 EP4 受體的抑制劑虛擬篩選。如圖 9e-f 所示,MaskMol 不僅在內(nèi)部測試集上表現(xiàn)優(yōu)異(R2 = 0.789),在來自專利文獻的外部驗證集上也保持了高預(yù)測精度(R2 = 0.755),并且能識別抑制劑和非抑制劑。

更重要的是,MaskMol 成功地從專利集中識別出了 9 個已知的 EP4 抑制劑候選化合物,如 Grapiprant、CJ-042794 等,這些分子均經(jīng)過細胞實驗或臨床試驗的驗證,這充分證明了 MaskMol 在真實藥物發(fā)現(xiàn)場景下作為高效虛擬篩選工具的可靠性。



圖 9:EP4 虛擬篩選。

總結(jié)與展望

MaskMol 研究的意義在于,它首次明確指出了活性懸崖任務(wù)中深度學(xué)習(xí)模型表征坍塌的瓶頸,并開創(chuàng)性地通過知識引導(dǎo)的分子圖像自監(jiān)督學(xué)習(xí)來突破這一瓶頸。該框架不僅顯著提升了預(yù)測性能,還具備良好的可解釋性,能為藥物化學(xué)家提供有價值的結(jié)構(gòu)-活性關(guān)系見解。

未來,在多模態(tài)知識融合、3D 構(gòu)象圖像建模以及跨模態(tài)知識蒸餾等方向還能進一步拓展 MaskMol 的能力,這也將持續(xù)推動人工智能在藥物發(fā)現(xiàn)領(lǐng)域的深入應(yīng)用。

論文地址:https://doi.org/10.1186/s12915-025-02389-3

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
剎車失靈時速115狂奔490公里司機發(fā)聲:4個半小時高度緊張,害怕車多有急彎,油盡下車后渾身發(fā)抖無法說話

剎車失靈時速115狂奔490公里司機發(fā)聲:4個半小時高度緊張,害怕車多有急彎,油盡下車后渾身發(fā)抖無法說話

極目新聞
2025-12-19 13:12:07
清朝一秀才屢試不第,無奈回鄉(xiāng),卻因一件小事被康熙皇帝御筆親封

清朝一秀才屢試不第,無奈回鄉(xiāng),卻因一件小事被康熙皇帝御筆親封

牛魔王與芭蕉扇
2025-09-23 10:41:21
西部排名又變了:森林狼創(chuàng)NBA奇跡,掘金收大禮,2隊排名互換

西部排名又變了:森林狼創(chuàng)NBA奇跡,掘金收大禮,2隊排名互換

籃球大視野
2025-12-20 16:55:15
匯源集團:已申請財產(chǎn)保全!

匯源集團:已申請財產(chǎn)保全!

揚子晚報
2025-12-20 11:41:42
南方黑芝麻糊成分含量最多的竟然不是黑芝麻?配料表引爭議,最新回應(yīng)

南方黑芝麻糊成分含量最多的竟然不是黑芝麻?配料表引爭議,最新回應(yīng)

極目新聞
2025-12-20 14:28:37
清華大學(xué)最新研究:補充這種維生素,竟能重啟抗癌T細胞,顯著抑制腫瘤生長

清華大學(xué)最新研究:補充這種維生素,竟能重啟抗癌T細胞,顯著抑制腫瘤生長

醫(yī)諾維
2025-12-20 12:47:12
億萬巨富!庫里杜蘭特2026年財富將突破10億美金,詹皇2021年已做到

億萬巨富!庫里杜蘭特2026年財富將突破10億美金,詹皇2021年已做到

818體育
2025-12-20 19:11:56
炸裂!跨境巨頭突然倒下,老板卷走2.3億跑路:上萬賣家被坑慘了

炸裂!跨境巨頭突然倒下,老板卷走2.3億跑路:上萬賣家被坑慘了

青眼財經(jīng)
2025-12-20 22:17:43
A股:剛剛,大消息傳來,釋放一信號,下周將迎來更大級別的行情

A股:剛剛,大消息傳來,釋放一信號,下周將迎來更大級別的行情

風(fēng)風(fēng)順
2025-12-21 01:00:06
轟32+6+3+4!火箭舊將變G聯(lián)賽超巨?斯通可再簽他,底薪就能拿下

轟32+6+3+4!火箭舊將變G聯(lián)賽超巨?斯通可再簽他,底薪就能拿下

熊哥愛籃球
2025-12-20 20:33:30
天空體育美女主持凱特·特蕾西慶生,透視裝驚艷粉絲

天空體育美女主持凱特·特蕾西慶生,透視裝驚艷粉絲

樂道足球
2025-12-19 10:13:52
壽命與大便次數(shù)有關(guān)?研究發(fā)現(xiàn):壽命長的人,每天排便在這個次數(shù)

壽命與大便次數(shù)有關(guān)?研究發(fā)現(xiàn):壽命長的人,每天排便在這個次數(shù)

DrX說
2025-10-24 14:15:19
大爆冷!阿森納冬窗竟決意出售功勛巨星?名記驚曝重磅消息

大爆冷!阿森納冬窗竟決意出售功勛巨星?名記驚曝重磅消息

奶蓋熊本熊
2025-12-21 01:17:49
免疫力隨年齡暴跌?科學(xué)家研究發(fā)現(xiàn):一種天然蛋白可重啟免疫系統(tǒng)

免疫力隨年齡暴跌?科學(xué)家研究發(fā)現(xiàn):一種天然蛋白可重啟免疫系統(tǒng)

熙瀚認(rèn)知
2025-12-18 20:31:21
阿森納1-0埃弗頓關(guān)鍵結(jié)論:格拉利什隱身?誰成阿森納點球保障?

阿森納1-0埃弗頓關(guān)鍵結(jié)論:格拉利什隱身?誰成阿森納點球保障?

橋看世界
2025-12-21 07:17:09
皇馬2-0,姆巴佩破門,追平C羅紀(jì)錄!阿隆索3連勝,落后巴薩1分

皇馬2-0,姆巴佩破門,追平C羅紀(jì)錄!阿隆索3連勝,落后巴薩1分

萬花筒體育球球
2025-12-21 07:36:41
大風(fēng)、暴雪來襲!湖北氣溫暴跌10℃

大風(fēng)、暴雪來襲!湖北氣溫暴跌10℃

湖北e家庭
2025-12-20 11:06:11
大爆冷!國羽世界第1被淘汰,劉圣書譚寧1:2韓國,女雙全軍覆沒

大爆冷!國羽世界第1被淘汰,劉圣書譚寧1:2韓國,女雙全軍覆沒

國乒二三事
2025-12-20 19:46:07
心疼王詩齡!李湘本想為女兒鋪路,卻意外栽在了何超瓊的晚宴上?

心疼王詩齡!李湘本想為女兒鋪路,卻意外栽在了何超瓊的晚宴上?

小椰的奶奶
2025-12-20 07:39:56
后妃侍寢規(guī)矩嚴(yán):全程禁聲成鐵律,另有一條更羞恥卻不見史書記載

后妃侍寢規(guī)矩嚴(yán):全程禁聲成鐵律,另有一條更羞恥卻不見史書記載

曉艾故事匯
2025-12-09 17:00:16
2025-12-21 08:51:00
ScienceAI incentive-icons
ScienceAI
關(guān)注人工智能與其他前沿技術(shù)
1185文章數(shù) 221關(guān)注度
往期回顧 全部

科技要聞

生態(tài)適配已超95% 鴻蒙下一關(guān):十萬個應(yīng)用

頭條要聞

臺北襲擊案行兇者被造謠是"大陸籍" 蔣萬安駁斥

頭條要聞

臺北襲擊案行兇者被造謠是"大陸籍" 蔣萬安駁斥

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂要聞

2026央視跨年晚會陣容曝光,豪華陣仗

財經(jīng)要聞

求解“地方財政困難”

汽車要聞

嵐圖推進L3量產(chǎn)測試 已完成11萬公里實際道路驗證

態(tài)度原創(chuàng)

本地
教育
家居
時尚
旅游

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

教育要聞

于潔:學(xué)生課堂睡覺、作業(yè)擺爛、屢教不改……教師該如何應(yīng)對?

家居要聞

高端私宅 理想隱居圣地

中年女人,冬天這么穿羽絨服、大衣,優(yōu)雅都藏在這3個細節(jié)里

旅游要聞

第二十二屆中國·滿洲里中俄蒙國際冰雪節(jié)開幕

無障礙瀏覽 進入關(guān)懷版