国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

清華首篇Science!用AI一天完成萬億藥物配對,覆蓋半數(shù)人類基因

0
分享至

2026 年清華大學第一篇 Science 論文花落清華大學智能科學講席教授、智能產(chǎn)業(yè)研究院(AIR)院長張亞勤院士團隊,該學院的蘭艷艷教授團隊和合作者研發(fā)出一款名為 DrugCLIP 的 AI 工具,能以前所未有的速度和準確率,為成千上萬個人類蛋白質找到潛在的藥物鑰匙。

它只需使用 8 張頂級顯卡,就能在不到 24 小時內完成超過 10 萬億次蛋白質與分子的匹配計算,為將近一半的人類基因組找到了超過 200 萬個潛在的候選藥物分子。

這一研究首次完成了覆蓋人類基因組規(guī)模的藥物虛擬篩選,首次打通了從蛋白結構預測到藥物發(fā)現(xiàn)的關鍵通道,可覆蓋約 1 萬個蛋白靶點、2 萬個蛋白口袋,分析篩選了超過 5 億個類藥小分子,借此構建了已知最大規(guī)模的蛋白-配體篩選數(shù)據(jù)庫,目前該數(shù)據(jù)庫已免費面向全球科研社區(qū)開放 [1]。


圖 | 蘭艷艷(來源:https://air.tsinghua.edu.cn/info/1046/120

論文共同一作清華大學智能產(chǎn)業(yè)研究院(AIR)博士后賈寅君告訴DeepTech:“一方面,我們聚焦于藥物研發(fā)最早期的苗頭化合物發(fā)現(xiàn)階段,把蛋白質結構預測的AI成功進一步推進到化合物層面,使研究能與化學家直接對話;另一方面,我們致力于以組學視角系統(tǒng)性探索藥物靶點,突破傳統(tǒng)單一靶點研發(fā)模式的局限,旨在通過對人類蛋白質組的全面篩選,為未來攻克更多疾病提供新起點。盡管目前距離實際藥物應用仍有 ADME 優(yōu)化、臨床驗證等諸多挑戰(zhàn),但本研究為AI驅動的大規(guī)模靶點探索奠定了基礎。”


圖 | 賈寅君(來源:賈寅君)

將以文搜圖原理用于 AI 尋藥

研究中,他們并不是讓 AI 去模擬分子擠進蛋白質口袋的復雜物理過程,而是借鑒了人們在日常生活中常用的以文字搜索圖片的技術。當我們使用搜索引擎以文字搜索圖片,尋找一張符合描述的照片時,背后的技術并不是比較像素,而是比較圖片被轉換成的一組數(shù)字特征也就是向量。對于語義相似的文字和圖片來說,它們的特征向量在數(shù)學空間里的位置會非常接近。


(來源:https://www.science.org/doi/10.1126/science.ads9530)

DrugCLIP 也是這么做的,研究人員訓練了兩個神經(jīng)網(wǎng)絡:

第一個神經(jīng)網(wǎng)絡起著分子編碼器的作用,可以把任何一個小分子化合物,轉換成為一組代表其特征的數(shù)字向量;

第二個神經(jīng)網(wǎng)絡起著口袋編碼器的功能,可以把蛋白質上那個可以結合藥物的凹陷區(qū)域也就是結合口袋,也轉換成為一組數(shù)字向量。

訓練的目標很簡單:讓能夠結合的蛋白質口袋和分子的向量變得非常相似,也就是在數(shù)字空間里靠得很近;讓不能結合的向量差異變得很大也就是離得很遠。

這樣,當面對一個新的蛋白質的時候,DrugCLIP 只需要做這樣一個步驟:把這個蛋白質口袋也變成一個向量,然后去已經(jīng)預存好的分子向量庫里,快速地計算余弦相似度,找出和它最像、也就是最可能結合的那些分子。這個過程非???,因為本質上就是大量的向量點乘運算,非常適合使用 GPU 進行并行加速。

為了讓 AI 在沒有足夠真實數(shù)據(jù)的情況下也能學好,他們想出了這樣一個方法:使用蛋白質自己假裝藥物來訓練。他們從已知的蛋白質結構數(shù)據(jù)庫中,截取一小段氨基酸鏈比如 3-8 個氨基酸,把它當做偽配體,而它周圍的區(qū)域則被當做偽口袋。

蛋白質內部氨基酸之間的相互作用,與蛋白質和藥物分子之間的相互作用原理是相同的。通過使用這種方法,他們生成了 550 萬個偽復合物數(shù)據(jù)來對 AI 進行預訓練,從而讓它掌握了識別結合模式的基本功。


(來源:https://www.science.org/doi/10.1126/science.ads9530)

認圖不認人,無中生有找新藥

經(jīng)過訓練之后,DrugCLIP 展現(xiàn)出又快又準的特點,在兩個權威的虛擬篩選測試集 DUD-E 和 LIT-PCBA 上,它的準確率超過了包括傳統(tǒng)分子對接和許多其他深度學習模型在內的所有基線方法。在速度上,它更是達到傳統(tǒng)分子對接方法的上千萬倍。在篩選 LIT-PCBA 數(shù)據(jù)集上的所有分子時,DrugCLIP 的順序計算只需要 38 秒,而傳統(tǒng)方法需要幾天甚至更久。

DrugCLIP 還展現(xiàn)出認圖不認人的特點,它無需依賴精確的蛋白質三維結構細節(jié),針對蛋白質側鏈的微小錯誤不具備敏感性。更重要的是,即使訓練數(shù)據(jù)里完全沒有某個蛋白質家族的信息,它也能很好地為這個新家族的成員找到潛在配體,具備較強的泛化能力。

DrugCLIP 亦能無中生有尋找新藥。在濕實驗驗證中,針對抑郁癥靶點 5-羥色胺 2A 受體,它從 78 個候選分子中找到了 8 個有活性的激動劑,其中最好的分子活性達到了納摩爾級別。

針對另一個抑郁癥靶點去甲腎上腺素轉運體,它找到了比常用藥物安非他酮效果更好的新型抑制劑。研究人員甚至使用冷凍電鏡拍下了這些新抑制劑與靶點蛋白緊密結合的清晰照片,證實了 AI 預測的結合模式。


(來源:https://www.science.org/doi/10.1126/science.ads9530)

TRIP12,是一個與癌癥和神經(jīng)退行性疾病相關的蛋白質,此前既沒有它與小分子結合的實驗結構,也幾乎沒有已知的抑制劑報道。為此,研究人員只能使用谷歌 DeepMind 旗下的 AlphaFold2 所預測的蛋白質結構。

然而,即使是在這樣的 hard 模式下,DrugCLIP 結合該團隊研發(fā)的另一款用于優(yōu)化預測結構中的口袋定義的工具 GenPack,竟然取得了 17.5% 的命中率,找到了能夠有效結合并抑制 TRIP12 活性的苗頭化合物,證明了 DrugCLIP 在探索完全未知的靶點上的巨大潛力。


(來源:https://www.science.org/doi/10.1126/science.ads9530)

構建公共數(shù)據(jù)庫,助推打造藥物發(fā)現(xiàn)新模式

這項研究的終極結果,是構建了一個名為 GenomeScreenDB 的公共數(shù)據(jù)庫。研究人員利用 AlphaFold2 預測的整個人類蛋白質組結構,結合 DrugCLIP 針對 5 億多個類藥分子進行了全景式掃描,最終為來自大約 1 萬個人類蛋白質的 2 萬個結合口袋,找到了 200 萬個潛在的候選分子。

這個數(shù)據(jù)庫所覆蓋的蛋白質靶點數(shù)量,是當前最全面的生物活性分子數(shù)據(jù)庫 ChEMBL 的兩倍之多,涵蓋了將近一半的人類基因組。從經(jīng)典的激酶靶點、到鮮有研究的溶質載體蛋白、甚至嗅覺受體,在該數(shù)據(jù)庫中都有預測的結合分子。目前,這些數(shù)據(jù)已在網(wǎng)站和在線服務平臺(https://drugclip.com)面向全球科學家免費開放。


(來源:https://drugclip.com)

自此以后,任何一位研究人員即使沒有太強的計算資源,也可以輕松查詢到自己感興趣的靶點,快速獲得一些經(jīng)過 AI 預篩選的候選化合物,并以此作為藥物研發(fā)的起點。這極大地降低了早期藥物發(fā)現(xiàn)的壁壘,尤其有助于針對那些冷門但是重要的疾病靶點開展研究。


(來源:https://www.science.org/doi/10.1126/science.ads9530)

清華大學智能產(chǎn)業(yè)研究院(AIR)博士后賈寅君、計算機系博士生高博文、生命學院博士后譚佳鑫、化學系博士后鄭濟青以及智能產(chǎn)業(yè)研究院(AIR)博士后洪鑫是本次論文的共同一作;通訊作者為智能產(chǎn)業(yè)研究院(AIR)蘭艷艷教授,清華大學生命學院張偉副教授、閆創(chuàng)業(yè)副教授以及清華大學化學系劉磊教授。

在后續(xù)計劃上,賈寅君表示將主要圍繞兩大方向:一是提升優(yōu)化AI發(fā)現(xiàn)的分子的安全性及成藥性,使其更接近實際制藥應用;二是進一步提高AI模型準確性與分子效力,增強初篩分子的生物學活性。這兩方面均是未來真正實現(xiàn)AI終結一切人類疾病需要攻克的關鍵問題。

參考資料:

相關論文:https://www.science.org/doi/10.1126/science.ads9530

蘭艷艷官方主頁:https://yanyanlan.com/

運營/排版:何晨龍

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
活動人士稱:大屠殺,視頻顯示伊朗德黑蘭以南尸體堆積如山

活動人士稱:大屠殺,視頻顯示伊朗德黑蘭以南尸體堆積如山

一種觀點
2026-01-12 19:57:19
16天12板“大牛股”,明起復牌!

16天12板“大牛股”,明起復牌!

每日經(jīng)濟新聞
2026-01-11 16:29:05
蘋果新品上市:1月12日,已正式上架!

蘋果新品上市:1月12日,已正式上架!

科技堡壘
2026-01-12 11:50:09
劉強東妹夫:是教師沒再婚,獨自撫養(yǎng)仨女兒,大舅哥每年給一百萬

劉強東妹夫:是教師沒再婚,獨自撫養(yǎng)仨女兒,大舅哥每年給一百萬

火之文
2026-01-12 14:37:48
金球獎這一夜,國際女星個個風情萬種,但都被一位中國女星艷壓了

金球獎這一夜,國際女星個個風情萬種,但都被一位中國女星艷壓了

八卦南風
2026-01-12 16:25:50
U23亞洲杯亂了:越南6分面臨出局!中國隊迎2好消息,亞足聯(lián)助攻

U23亞洲杯亂了:越南6分面臨出局!中國隊迎2好消息,亞足聯(lián)助攻

侃球熊弟
2026-01-12 20:29:42
岳云鵬稱今年將缺席央視春晚:能耐就這么些,寫不出更好的東西;去年被現(xiàn)場觀眾“貼臉開大”建議別上春晚

岳云鵬稱今年將缺席央視春晚:能耐就這么些,寫不出更好的東西;去年被現(xiàn)場觀眾“貼臉開大”建議別上春晚

觀威海
2026-01-12 10:06:04
反轉了!居然全是演的!視頻已清空

反轉了!居然全是演的!視頻已清空

洪觀新聞
2026-01-12 11:16:01
芯天下棄A轉港,2025年前三季度業(yè)績扭虧,毛利率回升至18%|港E聲

芯天下棄A轉港,2025年前三季度業(yè)績扭虧,毛利率回升至18%|港E聲

時代投研
2026-01-12 19:12:36
“綁架普京”言論激怒俄羅斯!扎哈羅娃一句話猛懟英防長

“綁架普京”言論激怒俄羅斯!扎哈羅娃一句話猛懟英防長

環(huán)球時報國際
2026-01-12 21:12:44
流亡一年后,阿薩德已成“透明人”,連約普京吃頓飯都做不到

流亡一年后,阿薩德已成“透明人”,連約普京吃頓飯都做不到

朔方瞭望
2026-01-06 11:11:51
巨頭集體跑路,社區(qū)團購涼透了

巨頭集體跑路,社區(qū)團購涼透了

快刀財經(jīng)
2026-01-12 22:36:46
新余致39人死亡火災事故再有進展:一燒烤原料批發(fā)部擬被罰千萬元

新余致39人死亡火災事故再有進展:一燒烤原料批發(fā)部擬被罰千萬元

新京報
2026-01-12 17:14:09
大漲日,加倉!

大漲日,加倉!

中國基金報
2026-01-12 15:15:48
Science:首次證實,有些狗狗通過偷聽主人對話學會新詞匯,能力堪比一歲半的人類寶寶

Science:首次證實,有些狗狗通過偷聽主人對話學會新詞匯,能力堪比一歲半的人類寶寶

生物世界
2026-01-12 12:24:25
對話“搖人按豬”走紅的女孩呆呆:我捅了個很大的婁子,被大家喜歡感到受寵若驚

對話“搖人按豬”走紅的女孩呆呆:我捅了個很大的婁子,被大家喜歡感到受寵若驚

極目新聞
2026-01-13 00:26:33
漲瘋了,A股一天創(chuàng)2項記錄!老股民夢回2015

漲瘋了,A股一天創(chuàng)2項記錄!老股民夢回2015

說財貓
2026-01-12 17:23:57
反轉了!居然全是演的!視頻已清空

反轉了!居然全是演的!視頻已清空

瑯琊新聞網(wǎng)
2026-01-11 23:34:05
官方披露!馬杜羅瑞士個人賬戶坐擁127噸黃金

官方披露!馬杜羅瑞士個人賬戶坐擁127噸黃金

老馬拉車莫少裝
2026-01-12 18:14:12
俄方爆料!“美軍一開始就沒打算讓任何人活下來”

俄方爆料!“美軍一開始就沒打算讓任何人活下來”

浙江之聲
2026-01-11 18:23:51
2026-01-13 01:32:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16114文章數(shù) 514478關注度
往期回顧 全部

科技要聞

面對SpaceX瘋狂“下餃子” 中國正面接招

頭條要聞

日媒:高市連續(xù)兩日閉門不出 不回應媒體采訪請求

頭條要聞

日媒:高市連續(xù)兩日閉門不出 不回應媒體采訪請求

體育要聞

一場安東尼奧式勝利,給中國足球帶來驚喜

娛樂要聞

蔡少芬結婚18周年,與張晉過二人世界

財經(jīng)要聞

倍輕松信披迷霧 實控人占用資金金額存疑

汽車要聞

增配不加價 北京現(xiàn)代 第五代 勝達2026款上市

態(tài)度原創(chuàng)

游戲
親子
本地
數(shù)碼
公開課

從暴打猛男發(fā)展到捆綁美女,“戰(zhàn)敗CG”為什么變成這樣?

親子要聞

楊樂樂曬兒子正臉照,一家四口合照曝光,沐沐疑和妹妹睡上下鋪

本地新聞

云游內蒙|“包”你再來?一座在硬核里釀出詩意的城

數(shù)碼要聞

ID - COOLING酷凜AT - 120系列機箱風扇開售,59元起

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版