国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

讓AI從零設(shè)計(jì)出能催化自然界從未有過的化學(xué)反應(yīng)的全新酶

0
分享至


這項(xiàng)由加州理工學(xué)院、Mila魁北克人工智能研究所及蒙特利爾大學(xué)等多家機(jī)構(gòu)聯(lián)合開展的研究,于2026年4月6日以預(yù)印本形式發(fā)布在arXiv平臺(tái),論文編號(hào)為arXiv:2604.05181。感興趣的讀者可通過該編號(hào)查閱完整論文。

地球上存在著數(shù)以億計(jì)的蛋白質(zhì)分子,它們是生命運(yùn)轉(zhuǎn)的幕后工程師。其中一類特殊的蛋白質(zhì)叫做"酶",你可以把它們理解為細(xì)胞內(nèi)的精密機(jī)器,專門負(fù)責(zé)加速各種化學(xué)反應(yīng)——消化食物、合成藥物、修復(fù)DNA,這些都離不開酶的參與。幾十億年的進(jìn)化為我們留下了數(shù)量龐大、功能各異的天然酶庫(kù),科學(xué)家們也學(xué)會(huì)了通過改造這些天然酶來完成更多任務(wù)。

但有一個(gè)根本性的瓶頸始終存在:每一輪酶工程改造,都需要一個(gè)"起點(diǎn)"——你至少得先找到一個(gè)對(duì)目標(biāo)化學(xué)反應(yīng)有一丁點(diǎn)兒活性的天然蛋白質(zhì),然后才能在此基礎(chǔ)上反復(fù)優(yōu)化。對(duì)于那些自然界完全沒有觸碰過的化學(xué)反應(yīng),這個(gè)起點(diǎn)根本不存在。這就好比你想學(xué)一門全新的語言,卻發(fā)現(xiàn)世界上沒有任何教材、字典或會(huì)說這門話的人——從零開始談何容易。

這項(xiàng)研究的核心貢獻(xiàn),正是提供了一把從零開始的鑰匙。研究團(tuán)隊(duì)開發(fā)了一個(gè)名為DISCO的深度學(xué)習(xí)模型,它能夠在沒有任何模板或已知催化殘基信息的前提下,直接為任意化學(xué)反應(yīng)從頭設(shè)計(jì)出全新的蛋白質(zhì)序列與三維結(jié)構(gòu)。更令人振奮的是,這些設(shè)計(jì)出來的蛋白質(zhì)不僅僅停留在計(jì)算機(jī)的屏幕上——它們被實(shí)際合成并測(cè)試,證明能夠催化多種自然界中從未存在過的化學(xué)反應(yīng),且活性甚至超越了科學(xué)家經(jīng)過多年人工進(jìn)化才培育出的版本。

一、為什么設(shè)計(jì)一個(gè)新酶如此困難

要理解這項(xiàng)研究的價(jià)值,先得搞清楚傳統(tǒng)方法卡在哪里。

設(shè)計(jì)一個(gè)功能性蛋白質(zhì),本質(zhì)上是在解一道極其復(fù)雜的三維拼圖。蛋白質(zhì)由數(shù)十到數(shù)百個(gè)氨基酸組成,這些氨基酸就像不同形狀的積木塊,串聯(lián)在一起之后會(huì)自動(dòng)折疊成特定的三維形狀。正是這個(gè)三維形狀——尤其是蛋白質(zhì)"活性口袋"里幾個(gè)關(guān)鍵氨基酸的精確排列——決定了這個(gè)蛋白質(zhì)能催化什么反應(yīng),不能催化什么反應(yīng)。

以往的計(jì)算設(shè)計(jì)方法,通常采用一種"先搭骨架、再填序列"的兩步走策略。第一步,用擴(kuò)散模型(一種能生成新結(jié)構(gòu)的深度學(xué)習(xí)方法)設(shè)計(jì)出蛋白質(zhì)的三維骨架;第二步,用另一個(gè)被稱為"逆折疊"的工具,根據(jù)這個(gè)骨架推算出相配的氨基酸序列。這兩步是分開進(jìn)行的,就像先畫好房子的建筑圖紙,再?zèng)Q定用什么材料建造。

這種分離式策略存在兩個(gè)本質(zhì)缺陷。其一,既然序列設(shè)計(jì)發(fā)生在骨架已經(jīng)固定之后,那么在骨架形成的關(guān)鍵階段,模型就無法利用"這個(gè)序列好不好"的信息來引導(dǎo)骨架生成,兩者無法相互促進(jìn)。其二,也是更致命的一點(diǎn),對(duì)于真正全新的化學(xué)反應(yīng),科學(xué)家往往根本不知道活性口袋里需要哪些關(guān)鍵氨基酸、它們應(yīng)該擺放在什么幾何位置,所以根本無法給骨架生成提供任何化學(xué)層面的指導(dǎo)——這種被稱為"theozyme"(理論酶)的先驗(yàn)設(shè)計(jì),對(duì)于機(jī)制未明的新反應(yīng)來說是不可能完成的任務(wù)。

DISCO的出現(xiàn),從根本上繞開了這兩個(gè)障礙。

二、DISCO是如何工作的——序列與結(jié)構(gòu)的同步舞蹈

DISCO這個(gè)名字是"用于序列結(jié)構(gòu)協(xié)同設(shè)計(jì)的擴(kuò)散模型"的英文縮寫(DIffusion for Sequence-structure CO-design)。理解它的工作原理,可以把它與傳統(tǒng)的兩步走方法做一個(gè)對(duì)比。

傳統(tǒng)方法像是先雕刻好一個(gè)石膏模具,再往里倒入液體材料成型——兩個(gè)步驟涇渭分明,互不干擾。DISCO則更像是一位雕塑家同時(shí)用雙手塑造一件作品:左手在捏形狀,右手在選材質(zhì),兩只手時(shí)刻感知對(duì)方的動(dòng)作并做出調(diào)整,最終兩者和諧統(tǒng)一。

具體來說,DISCO使用兩種不同的"噪聲-去噪"過程來同時(shí)處理蛋白質(zhì)的兩種屬性。對(duì)于三維坐標(biāo)(結(jié)構(gòu)),它使用連續(xù)擴(kuò)散過程:從一團(tuán)隨機(jī)散布在空間中的原子坐標(biāo)開始,逐步去除噪聲,使原子歸位。對(duì)于氨基酸序列,它使用離散遮蔽擴(kuò)散過程:從一串全部被遮蓋的氨基酸位置開始,逐步揭開每個(gè)位置應(yīng)該填入哪種氨基酸。這兩個(gè)過程并行運(yùn)行,在一個(gè)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)中共同演化。

支撐這一切的理論基礎(chǔ)來自一個(gè)巧妙的數(shù)學(xué)證明:只要在訓(xùn)練時(shí)對(duì)兩種模態(tài)獨(dú)立施加噪聲,那么最終學(xué)到的模型就能等價(jià)地學(xué)習(xí)到兩者聯(lián)合分布的逆過程。換句話說,不需要專門設(shè)計(jì)任何特殊的多模態(tài)損失函數(shù),用最自然的方式分別訓(xùn)練兩種損失,就能得到一個(gè)真正的聯(lián)合生成模型。

DISCO的骨干架構(gòu)大量借鑒了AlphaFold 3的設(shè)計(jì),包括其原子級(jí)別的注意力機(jī)制和Pairformer模塊,但做了若干針對(duì)性改動(dòng)。最重要的是,去掉了需要多序列比對(duì)(MSA)的模塊——因?yàn)樵谏蛇^程中,蛋白質(zhì)序列本身就在不斷變化,根本無法實(shí)時(shí)計(jì)算MSA——轉(zhuǎn)而引入了一個(gè)凍結(jié)的蛋白質(zhì)語言模型DPLM來提供進(jìn)化信息。整個(gè)模型擁有8.88億個(gè)參數(shù),其中2.35億個(gè)參數(shù)參與訓(xùn)練,在32塊L40S GPU上訓(xùn)練了11天共16萬步。訓(xùn)練數(shù)據(jù)來自蛋白質(zhì)數(shù)據(jù)庫(kù)(PDB),截止日期為2021年9月。

三、讓序列和結(jié)構(gòu)真正"聽懂對(duì)方說的話"——跨模態(tài)循環(huán)機(jī)制

DISCO能夠?qū)崿F(xiàn)高質(zhì)量協(xié)同設(shè)計(jì)的一個(gè)關(guān)鍵秘訣,是它獨(dú)特的"跨模態(tài)循環(huán)"(cross-modal recycling)機(jī)制。

普通的擴(kuò)散模型在每個(gè)去噪步驟里,只會(huì)拿到當(dāng)前時(shí)刻的噪聲狀態(tài)來做預(yù)測(cè)。DISCO則更進(jìn)一步:在每個(gè)生成步驟中,它不僅會(huì)使用當(dāng)前時(shí)刻帶噪的序列和結(jié)構(gòu),還會(huì)同時(shí)使用模型對(duì)"最終干凈狀態(tài)"的當(dāng)前最佳猜測(cè)——即它目前認(rèn)為最終序列和最終結(jié)構(gòu)應(yīng)該是什么樣子的預(yù)測(cè)值。

這四份信息(當(dāng)前噪聲序列、當(dāng)前噪聲結(jié)構(gòu)、預(yù)測(cè)的干凈序列、預(yù)測(cè)的干凈結(jié)構(gòu))都會(huì)被編碼并融入到每一步的生成過程中,讓模型在塑造結(jié)構(gòu)時(shí)能參考序列信息,在優(yōu)化序列時(shí)能參考結(jié)構(gòu)信息,形成一種雙向?qū)崟r(shí)反饋的循環(huán)。從干凈結(jié)構(gòu)預(yù)測(cè)中提取的距離圖還會(huì)被直接注入到對(duì)表示之中,為空間關(guān)系提供持續(xù)的幾何約束。

在推斷策略上,DISCO還解決了一個(gè)讓研究團(tuán)隊(duì)頗為頭疼的問題:標(biāo)準(zhǔn)的遮蔽擴(kuò)散推斷有一個(gè)硬性限制——一旦某個(gè)位置的氨基酸被揭開,就再也不能更改,即使這個(gè)選擇事后證明是錯(cuò)的。這就像你在填寫一份不能涂改的答卷,一旦落筆就無法糾錯(cuò),這對(duì)于需要全局協(xié)調(diào)的蛋白質(zhì)設(shè)計(jì)來說是致命的。

研究團(tuán)隊(duì)引入了"路徑規(guī)劃"(path planning)方法來解決這個(gè)問題:在每個(gè)序列生成步驟中,不僅允許揭開新的位置,還允許重新遮蓋一部分已經(jīng)揭開的位置,讓模型有機(jī)會(huì)修正之前的錯(cuò)誤判斷。與此同時(shí),他們還設(shè)計(jì)了一種"熵自適應(yīng)溫度"機(jī)制:在生成早期,對(duì)那些過于自信的氨基酸預(yù)測(cè)施加一定的隨機(jī)擾動(dòng),防止模型過早鎖定錯(cuò)誤的局部最優(yōu)解,從而顯著提升最終的協(xié)同可設(shè)計(jì)性。

這些推斷技巧的重要性不可小覷:使用相同的模型權(quán)重,僅靠改變推斷策略,協(xié)同可設(shè)計(jì)性指標(biāo)就能從16%飆升到88%。

四、任意分子都能作為設(shè)計(jì)條件——STUDIO-179基準(zhǔn)測(cè)試

DISCO的另一個(gè)核心能力是以任意生物分子作為條件來設(shè)計(jì)蛋白質(zhì)。無論是小分子藥物、金屬輔因子、核酸序列還是反應(yīng)中間體,只要能提供原子坐標(biāo)和鍵合信息,DISCO就能圍繞它設(shè)計(jì)出配套的蛋白質(zhì)。

為了系統(tǒng)評(píng)估這種能力,研究團(tuán)隊(duì)創(chuàng)建了一個(gè)全新的基準(zhǔn)數(shù)據(jù)集,命名為STUDIO-179。這個(gè)數(shù)據(jù)集涵蓋179種天然和非天然配體,橫跨催化、制藥、發(fā)光和傳感等多個(gè)應(yīng)用領(lǐng)域,包括極端剛性分子(如污染物四氯二苯并二噁英)、大型柔性分子(如輔酶Q10)以及金屬/金屬簇(如四鐵四硫簇[4Fe-4S]),可謂對(duì)條件生成能力的全方位壓力測(cè)試。

評(píng)價(jià)標(biāo)準(zhǔn)是"協(xié)同可設(shè)計(jì)性",定義為:用蛋白質(zhì)折疊軟件Chai-1重新折疊生成的序列后,折疊結(jié)果中蛋白質(zhì)骨架與設(shè)計(jì)骨架的RMSD(均方根偏差)小于2埃,且所有配體質(zhì)心位置的RMSD也小于2?!簿褪钦f,不僅蛋白質(zhì)本身要折疊正確,配體也要停留在設(shè)計(jì)好的位置。

在179個(gè)配體中,DISCO在178個(gè)上都取得了最高比例的多樣化且協(xié)同可設(shè)計(jì)的復(fù)合物,這一表現(xiàn)遠(yuǎn)超所有基準(zhǔn)方法,包括RFDiffusion3、BoltzGen和RFDiffusion All-Atom。

更能說明問題的是一些定性觀察。DISCO設(shè)計(jì)的活性口袋在化學(xué)上是"有意識(shí)的":口袋的疏水性與配體的親脂性(logP值)之間存在顯著的正相關(guān)(R?=0.51),這意味著模型確實(shí)學(xué)會(huì)了為疏水配體設(shè)計(jì)疏水口袋,為親水配體設(shè)計(jì)親水口袋,而不是隨機(jī)堆砌殘基。對(duì)于特定輔因子,合適的配位殘基會(huì)自然涌現(xiàn)——比如為銅離子配位中心自動(dòng)生成兩個(gè)組氨酸、兩個(gè)半胱氨酸和一個(gè)谷氨酸的四面體配位結(jié)構(gòu)。DISCO還能在保持剛性幾何的同時(shí),探索配體的構(gòu)象自由度,生成在訓(xùn)練集中罕見甚至從未出現(xiàn)過的配體構(gòu)象。

通過Folddisco工具在AlphaFoldDB中搜索,研究團(tuán)隊(duì)發(fā)現(xiàn)DISCO生成的活性口袋中,超過80%(以最近5個(gè)殘基為單位)在已知蛋白質(zhì)結(jié)構(gòu)中找不到相近的同源物(定義為無匹配或RMSD超過3埃),且生成口袋間的聚類多樣性超過90%——這些都是設(shè)計(jì)真正新穎性的有力證明。

五、推斷時(shí)的"方向盤"——費(fèi)曼-卡茨校正器

DISCO還提供了一套精巧的推斷時(shí)引導(dǎo)機(jī)制,被稱為"費(fèi)曼-卡茨校正器"(Feynman-Kac Corrector,簡(jiǎn)稱FKC)。

傳統(tǒng)的"生成再篩選"策略(先大量生成候選,再篩選出滿足要求的)效率低下,當(dāng)目標(biāo)特性非常稀有時(shí)更是近乎無效。費(fèi)曼-卡茨校正器的思路是:與其被動(dòng)篩選,不如主動(dòng)引導(dǎo)——在每一步生成過程中就施加一個(gè)軟約束,把采樣分布向期望的目標(biāo)推動(dòng)。

研究團(tuán)隊(duì)推導(dǎo)了兩種具體的FKC方法。第一種叫FKC-多模態(tài)(FKC-MM),允許同時(shí)對(duì)序列和結(jié)構(gòu)施加聯(lián)合獎(jiǎng)勵(lì)函數(shù)。以增加二硫鍵數(shù)量為例:二硫鍵需要兩個(gè)半胱氨酸殘基(序列信息)且這兩個(gè)殘基的Cβ原子必須相互靠近約3.8埃(結(jié)構(gòu)信息),這種序列-結(jié)構(gòu)聯(lián)合約束正是單模態(tài)方法無法處理的。實(shí)驗(yàn)結(jié)果顯示,F(xiàn)KC-MM生成的前2%設(shè)計(jì)中,100個(gè)氨基酸長(zhǎng)度的蛋白質(zhì)含有六個(gè)二硫鍵,而訓(xùn)練數(shù)據(jù)中僅有前0.2%的同等長(zhǎng)度蛋白質(zhì)達(dá)到這一密度——模型不僅學(xué)會(huì)了約束,還能在此約束下超越訓(xùn)練分布。

第二種叫FKC-特異性引導(dǎo)(FKC-SG),目標(biāo)是設(shè)計(jì)只結(jié)合目標(biāo)分子而回避結(jié)構(gòu)相似"誘餌"分子的蛋白質(zhì)。這通過在采樣時(shí)同時(shí)運(yùn)行兩個(gè)模型——一個(gè)以目標(biāo)分子為條件,一個(gè)以誘餌分子為條件——并讓目標(biāo)模型的分?jǐn)?shù)占主導(dǎo)、誘餌模型的分?jǐn)?shù)起排斥作用來實(shí)現(xiàn)。即使面對(duì)結(jié)構(gòu)極為相近的分子對(duì)(如醛固酮與可的松,兩者互為構(gòu)造異構(gòu)體的甾體),F(xiàn)KC-SG也能生成對(duì)目標(biāo)和誘餌的配體質(zhì)心RMSD超過6埃的蛋白質(zhì),而簡(jiǎn)單的最優(yōu)N篩選方法在某些情況下甚至無法產(chǎn)生任何通過篩選的候選。

六、真正的考驗(yàn):從零設(shè)計(jì)出能催化新反應(yīng)的酶

所有這些技術(shù)成就的終極考場(chǎng),是一個(gè)實(shí)驗(yàn)室里的真實(shí)挑戰(zhàn):能否用DISCO設(shè)計(jì)出真正能催化化學(xué)反應(yīng)的酶?

研究團(tuán)隊(duì)選擇了"卡賓轉(zhuǎn)移反應(yīng)"作為測(cè)試靶標(biāo)??ㄙe是一種碳原子只有兩個(gè)成鍵的高活性化學(xué)物種,自然界中沒有任何已知酶能催化這類反應(yīng)。過去十幾年,弗朗西絲·阿諾德(Frances Arnold)團(tuán)隊(duì)通過對(duì)細(xì)胞色素P450、細(xì)胞色素c和球蛋白等天然蛋白質(zhì)進(jìn)行大量定向進(jìn)化,成功培育出能催化多種卡賓反應(yīng)的人工酶,但每次都需要從一個(gè)具有初始活性的天然蛋白質(zhì)出發(fā),經(jīng)歷漫長(zhǎng)的進(jìn)化歷程。從頭設(shè)計(jì)卡賓轉(zhuǎn)移酶,在此之前從未有人成功。

關(guān)鍵的設(shè)計(jì)決策是:不使用完整的過渡態(tài)結(jié)構(gòu),而僅以"鐵卡賓前體復(fù)合物"——反應(yīng)關(guān)鍵中間體——的DFT(密度泛函理論)計(jì)算幾何結(jié)構(gòu)和鍵合模式作為DISCO的條件輸入。這體現(xiàn)了一種蓄意的簡(jiǎn)化:與其試圖精確固定一個(gè)在真空中計(jì)算的過渡態(tài),不如讓DISCO的協(xié)同折疊機(jī)制自由探索與之兼容的構(gòu)象空間。這一決策使得設(shè)計(jì)可以完全繞開"theozyme"的構(gòu)建——而對(duì)于催化機(jī)制不明的反應(yīng),theozyme根本無法構(gòu)建。

從約一萬個(gè)DISCO生成的序列-結(jié)構(gòu)對(duì)出發(fā),經(jīng)過雙重折疊預(yù)測(cè)(AlphaFold3和Chai-1)、置信度指標(biāo)(鏈pAE和ipTM)、活性口袋接觸數(shù)、溶劑暴露程度、凈電荷和表面疏水性等多項(xiàng)過濾,研究團(tuán)隊(duì)最終挑選出90個(gè)設(shè)計(jì)用于實(shí)驗(yàn)測(cè)試,沒有對(duì)任何序列或結(jié)構(gòu)進(jìn)行后期重新設(shè)計(jì)。

這90個(gè)設(shè)計(jì)被分為四組,分別測(cè)試四種不同的卡賓轉(zhuǎn)移反應(yīng)。第一種是對(duì)甲氧基苯乙烯與重氮乙酸乙酯(EDA)的烯烴環(huán)丙烷化反應(yīng);第二種是1,3-二甲基咪唑-2-亞基硼烷與重氮丙酸乙酯(EDP)的B-H鍵插入反應(yīng);第三種是1-苯基吡咯烷與EDA的C(sp?)-H鍵烷基化反應(yīng);第四種是叔丁基-3-亞甲基氮雜環(huán)丁烷-1-羧酸酯與EDA的螺環(huán)丙烷化反應(yīng),這是一類在藥物合成中極具價(jià)值但技術(shù)上極具挑戰(zhàn)性的反應(yīng)。

七、實(shí)驗(yàn)結(jié)果:超越人工進(jìn)化的活性,發(fā)現(xiàn)全新的活性位點(diǎn)結(jié)構(gòu)

測(cè)試結(jié)果令人振奮。

在烯烴環(huán)丙烷化反應(yīng)中,最佳設(shè)計(jì)達(dá)到了72%的產(chǎn)率和4050的總周轉(zhuǎn)數(shù)(TTN,可以理解為每個(gè)酶分子能催化多少次反應(yīng)),反式/順式非對(duì)映選擇比高達(dá)99:1。這一數(shù)字超越了早期進(jìn)化的P411酶(364 TTN)和近期基于卟啉theozyme設(shè)計(jì)的PNC2酶(630 TTN)。

B-H鍵插入反應(yīng)的結(jié)果更為驚人:最佳設(shè)計(jì)達(dá)到了98%的產(chǎn)率和5170 TTN,遠(yuǎn)超此前的起始點(diǎn)(120 TTN,來自Rma細(xì)胞色素c)和實(shí)驗(yàn)室經(jīng)多輪進(jìn)化才達(dá)到的最優(yōu)變體(2490 TTN)。換句話說,DISCO從頭設(shè)計(jì)的第一版就超越了科學(xué)家花費(fèi)大量時(shí)間和精力進(jìn)化出來的最終版本。

C(sp?)-H鍵插入是最具挑戰(zhàn)性的反應(yīng)之一,此前需要14輪定向進(jìn)化才能獲得滿意的催化劑,且由于機(jī)制不明而無法構(gòu)建theozyme。DISCO的最佳設(shè)計(jì)達(dá)到了42%的產(chǎn)率和2360 TTN,與經(jīng)歷了漫長(zhǎng)進(jìn)化歷程的P411-CHF催化劑的最優(yōu)性能(2030 TTN)旗鼓相當(dāng)。

螺環(huán)丙烷化是最難的反應(yīng),活性變體數(shù)量較少,活性也相對(duì)較低,但仍有多個(gè)設(shè)計(jì)顯示出可檢測(cè)的活性并對(duì)映選擇性高達(dá)35% ee。值得注意的是,不同設(shè)計(jì)對(duì)兩種對(duì)映體的偏好方向各異,說明DISCO探索的活性口袋幾何結(jié)構(gòu)確實(shí)呈現(xiàn)出多樣性。

在所有四種反應(yīng)中,2.2%到66%的設(shè)計(jì)活性超過了陰性對(duì)照(表達(dá)無關(guān)蛋白的大腸桿菌)。90個(gè)設(shè)計(jì)中沒有任何兩個(gè)序列相似性超過50%,75個(gè)形成了結(jié)構(gòu)上完全不同的聚類(TM得分閾值0.5),證明了設(shè)計(jì)多樣性的真實(shí)性。

這些設(shè)計(jì)的活性位點(diǎn)結(jié)構(gòu)更是令人稱奇。通過Folddisco在AlphaFoldDB中搜索,超過80%的活性口袋(以最近五個(gè)殘基為單位)找不到已知同源物。以最佳螺環(huán)丙烷化設(shè)計(jì)dCT-H11為例,其活性位點(diǎn)最近五個(gè)殘基的RMSD與AlphaFoldDB中最相近結(jié)構(gòu)之間高達(dá)7.40?!@幾乎是完全不同的空間排列。

同樣值得關(guān)注的是,這些酶在全局結(jié)構(gòu)層面同樣是新穎的:dCT-H11的最近結(jié)構(gòu)相似物是一個(gè)來自極端嗜鹽菌的TetR家族轉(zhuǎn)錄因子(TM得分0.81,序列同一性僅21%),這個(gè)同源物本身并沒有任何已知的催化活性;dCT-F9和dCT-G9的最近結(jié)構(gòu)相似物TM得分只有0.52和0.51,在AlphaFoldDB中找不到對(duì)應(yīng)的活性口袋模體。沒有任何一個(gè)最近結(jié)構(gòu)相似物是天然的含血紅素蛋白——這意味著DISCO捕捉到了血紅素結(jié)合與卡賓轉(zhuǎn)移所需要的底層生化原理,并將其移植到了全新的蛋白質(zhì)拓?fù)浣Y(jié)構(gòu)中。

八、可進(jìn)化性的驗(yàn)證——一輪隨機(jī)突變就能顯著提升活性

僅僅具有初始活性還不夠。研究團(tuán)隊(duì)特別測(cè)試了一個(gè)在實(shí)際應(yīng)用中至關(guān)重要的特性:這些設(shè)計(jì)能否像天然蛋白質(zhì)一樣,通過定向進(jìn)化進(jìn)一步提升性能?

他們選擇了螺環(huán)丙烷化反應(yīng)(設(shè)計(jì)活性相對(duì)較弱)和dCT-H11作為目標(biāo),進(jìn)行了一輪易錯(cuò)PCR隨機(jī)突變,篩選了大約700個(gè)突變體。結(jié)果顯示,約35個(gè)變體相對(duì)于親本酶顯示出明顯更高的活性,其中一些不僅提升了親本偏好方向的對(duì)映選擇性(從+35% ee提升到+49% ee),還有一些將對(duì)映選擇性完全翻轉(zhuǎn)到相反方向(從+35% ee變?yōu)?35% ee)。產(chǎn)生顯著效果的突變位點(diǎn)分散在蛋白質(zhì)序列各處,而非集中在活性口袋附近,這種"長(zhǎng)程表位效應(yīng)"正是天然酶進(jìn)化的典型特征。

這一結(jié)果證明,DISCO設(shè)計(jì)的蛋白質(zhì)不僅僅是孤立的功能點(diǎn),而是處于適應(yīng)性景觀中一個(gè)具有向上爬坡路徑的有利位置——這正是定向進(jìn)化能夠持續(xù)工作的前提條件。

歸根結(jié)底,DISCO這項(xiàng)工作回答了一個(gè)讓蛋白質(zhì)工程師長(zhǎng)期困擾的問題:對(duì)于那些自然界從未觸碰過的化學(xué)反應(yīng),我們究竟能不能直接設(shè)計(jì)出起點(diǎn)?答案已經(jīng)非常清晰:可以,而且可以做得相當(dāng)好。

DISCO提供的核心能力有三:第一,序列與結(jié)構(gòu)真正同步生成,兩者相互約束、協(xié)同優(yōu)化,而非順序流水線;第二,可以以任意化學(xué)物種為條件,無需預(yù)先指定任何催化殘基或幾何約束;第三,設(shè)計(jì)本身落在可進(jìn)化的序列空間中,能夠作為后續(xù)定向進(jìn)化的有效起點(diǎn)。

這對(duì)制藥、精細(xì)化學(xué)品合成和綠色化工等領(lǐng)域的潛在影響是實(shí)實(shí)在在的:以往需要花費(fèi)數(shù)年時(shí)間、進(jìn)行數(shù)千次篩選才能找到的酶起始點(diǎn),如今可能只需要一臺(tái)計(jì)算機(jī)和幾周時(shí)間就能獲得,而且可以為各種此前完全不可能酶催化的反應(yīng)來嘗試。

當(dāng)然,值得保持冷靜的是,目前的結(jié)果仍然集中在卡賓轉(zhuǎn)移這一類特定的化學(xué)反應(yīng)上,反應(yīng)的底物范圍也有限。螺環(huán)丙烷化活性的相對(duì)較弱也提示,并非所有反應(yīng)都能以同等效率被設(shè)計(jì)。對(duì)于更復(fù)雜的催化機(jī)制——例如需要精確酸堿協(xié)同或多步化學(xué)的反應(yīng)——DISCO當(dāng)前的方法是否同樣有效,還有待驗(yàn)證。

不過,這些都是"如何做得更好"的問題,而不是"能不能做"的問題。門已經(jīng)打開了。

有興趣深入了解技術(shù)細(xì)節(jié)的讀者,可以通過arXiv編號(hào)2604.05181查閱完整論文,模型代碼和權(quán)重也已開源,地址是github.com/DISCO-design/DISCO。

Q&A

Q1:DISCO和傳統(tǒng)蛋白質(zhì)設(shè)計(jì)方法的核心區(qū)別是什么?

A:傳統(tǒng)方法是"先設(shè)計(jì)三維結(jié)構(gòu)骨架,再用逆折疊工具推算匹配的氨基酸序列",兩個(gè)步驟完全分離,序列信息無法影響結(jié)構(gòu)生成階段。DISCO則把兩個(gè)過程合并到一個(gè)模型中同步進(jìn)行,序列和結(jié)構(gòu)在每一個(gè)生成步驟中相互感知、互相約束,就像兩只手同時(shí)塑造一件作品。這種協(xié)同設(shè)計(jì)使模型能在不預(yù)先指定任何活性位點(diǎn)殘基的情況下,直接圍繞化學(xué)反應(yīng)中間體設(shè)計(jì)出有功能的蛋白質(zhì)。

Q2:DISCO設(shè)計(jì)的酶活性為什么能超過人工進(jìn)化多年的版本?

A:這并不意味著DISCO"更聰明",而是反映了兩種策略的不同起點(diǎn)。定向進(jìn)化受限于初始蛋白質(zhì)的序列空間,每一輪突變只能在已有結(jié)構(gòu)基礎(chǔ)上小幅探索。DISCO則完全沒有這種約束,它可以探索自然界從未出現(xiàn)過的全新蛋白質(zhì)折疊和活性口袋幾何結(jié)構(gòu)。當(dāng)一個(gè)全新的口袋幾何形狀恰好比進(jìn)化起點(diǎn)更適合某個(gè)反應(yīng)時(shí),DISCO的設(shè)計(jì)自然就能超越進(jìn)化的結(jié)果。

Q3:DISCO設(shè)計(jì)的蛋白質(zhì)能不能用于藥物生產(chǎn)或工業(yè)合成?

A:目前的研究結(jié)果表明技術(shù)上是可行的,但距離實(shí)際工業(yè)應(yīng)用還有幾個(gè)步驟。現(xiàn)有設(shè)計(jì)已經(jīng)能在大腸桿菌全細(xì)胞體系中催化反應(yīng)并產(chǎn)生可量化的產(chǎn)物,且經(jīng)過一輪隨機(jī)突變就能進(jìn)一步提升活性,這說明它們是可以通過定向進(jìn)化優(yōu)化的有效起點(diǎn)。但工業(yè)應(yīng)用通常還需要更高的穩(wěn)定性、更寬的底物范圍和更嚴(yán)格的立體選擇性控制,這些都需要后續(xù)的工程優(yōu)化工作來完成。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
長(zhǎng)治女子萬達(dá)墜亡持續(xù)升級(jí)!目擊者再添實(shí)錘,不止是意外這么簡(jiǎn)單

長(zhǎng)治女子萬達(dá)墜亡持續(xù)升級(jí)!目擊者再添實(shí)錘,不止是意外這么簡(jiǎn)單

離離言幾許
2026-04-21 07:18:30
缺口超50%!光模塊核心材料,國(guó)產(chǎn)化提速!龍頭股暴漲超60倍

缺口超50%!光模塊核心材料,國(guó)產(chǎn)化提速!龍頭股暴漲超60倍

數(shù)據(jù)寶
2026-04-22 07:39:19
曾高喊打敗美帝:如今卻全家跑去美國(guó),84歲活成這樣,引人熱議!

曾高喊打敗美帝:如今卻全家跑去美國(guó),84歲活成這樣,引人熱議!

小莜讀史
2026-04-20 22:58:35
高99米,北京最高摩天輪歡樂谷“大眼京”預(yù)計(jì)6月28日運(yùn)營(yíng)

高99米,北京最高摩天輪歡樂谷“大眼京”預(yù)計(jì)6月28日運(yùn)營(yíng)

新京報(bào)
2026-04-22 13:06:20
取消午休,改成16點(diǎn)下班,你愿意嗎?網(wǎng)友吵翻!

取消午休,改成16點(diǎn)下班,你愿意嗎?網(wǎng)友吵翻!

魯中晨報(bào)
2026-04-22 14:28:23
網(wǎng)友爸爸2年前垃圾堆里撿回72條32GB DDR4內(nèi)存:如今價(jià)值近14萬

網(wǎng)友爸爸2年前垃圾堆里撿回72條32GB DDR4內(nèi)存:如今價(jià)值近14萬

快科技
2026-04-20 10:51:04
段睿悲痛萬分,深夜發(fā)布訃告:他走了,再也沒有人等我回去了!

段睿悲痛萬分,深夜發(fā)布訃告:他走了,再也沒有人等我回去了!

米果說識(shí)
2026-04-22 14:41:50
單Agent時(shí)代正式結(jié)束:一個(gè)干不過,就上300個(gè)

單Agent時(shí)代正式結(jié)束:一個(gè)干不過,就上300個(gè)

機(jī)器之心Pro
2026-04-21 18:46:39
蔣介石恐做夢(mèng)也沒想到,被拒之門外的私生子,最終卻代表了蔣家

蔣介石恐做夢(mèng)也沒想到,被拒之門外的私生子,最終卻代表了蔣家

曉張說
2026-04-21 07:04:10
玉林烤鴨品牌創(chuàng)始人、玉林餐飲集團(tuán)董事長(zhǎng)鄒勝利去世,北京烹飪協(xié)會(huì):沉痛悼念

玉林烤鴨品牌創(chuàng)始人、玉林餐飲集團(tuán)董事長(zhǎng)鄒勝利去世,北京烹飪協(xié)會(huì):沉痛悼念

界面新聞
2026-04-22 14:23:15
內(nèi)塔尼亞胡放話:參與10月7日的人,一個(gè)都別想活著離開

內(nèi)塔尼亞胡放話:參與10月7日的人,一個(gè)都別想活著離開

桂系007
2026-04-21 21:18:39
白宮:萬斯巴基斯坦之行已被取消

白宮:萬斯巴基斯坦之行已被取消

新華社
2026-04-22 06:26:43
保定通報(bào)灌溉井水呈紅色:初步研判與染料有關(guān)

保定通報(bào)灌溉井水呈紅色:初步研判與染料有關(guān)

界面新聞
2026-04-22 17:32:17
讓華北的地下水上一次熱搜吧!

讓華北的地下水上一次熱搜吧!

細(xì)雨中的呼喊
2026-04-22 13:29:31
楊瀚森NBA生涯季后賽首勝:全場(chǎng)遭棄用躺贏 回主場(chǎng)后能否登場(chǎng)?

楊瀚森NBA生涯季后賽首勝:全場(chǎng)遭棄用躺贏 回主場(chǎng)后能否登場(chǎng)?

醉臥浮生
2026-04-22 10:47:21
綜合ROI時(shí)代,這些高速增長(zhǎng)的商家做對(duì)了什么?

綜合ROI時(shí)代,這些高速增長(zhǎng)的商家做對(duì)了什么?

刀法研究所
2026-04-16 15:00:13
任澤平退款731萬,恒大高管們開始退錢了

任澤平退款731萬,恒大高管們開始退錢了

互聯(lián)網(wǎng)大觀
2026-04-22 13:44:17
非常炸裂:以色列列出全球黑名單,明確警告各國(guó):反以,就是反猶

非常炸裂:以色列列出全球黑名單,明確警告各國(guó):反以,就是反猶

遠(yuǎn)方風(fēng)林
2026-04-22 11:58:01
我有罪,大導(dǎo)演昆汀花1萬美金,在包房舔腳半小時(shí),直到皮膚起皺

我有罪,大導(dǎo)演昆汀花1萬美金,在包房舔腳半小時(shí),直到皮膚起皺

西樓知趣雜談
2026-04-20 08:40:47
45歲金·卡戴珊與漢密爾頓海邊嬉戲,“如膠似漆”,卻引發(fā)爭(zhēng)議

45歲金·卡戴珊與漢密爾頓海邊嬉戲,“如膠似漆”,卻引發(fā)爭(zhēng)議

譯言
2026-04-22 07:23:37
2026-04-22 17:56:49
科技行者 incentive-icons
科技行者
科技正在如何變革商業(yè)世界
8088文章數(shù) 562關(guān)注度
往期回顧 全部

科技要聞

對(duì)話梅濤:沒有視頻底座,具身智能走不遠(yuǎn)

頭條要聞

特朗普180°轉(zhuǎn)彎延長(zhǎng)停火 伊朗硬剛首次直接回絕談判

頭條要聞

特朗普180°轉(zhuǎn)彎延長(zhǎng)?;?伊朗硬剛首次直接回絕談判

體育要聞

網(wǎng)易傳媒再度簽約法國(guó)隊(duì)和阿根廷隊(duì)

娛樂要聞

復(fù)婚無望!baby黃曉明陪小海綿零交流

財(cái)經(jīng)要聞

伊朗拒絕出席 特朗普宣布延長(zhǎng)?;鹌谙?/h3>

汽車要聞

純電續(xù)航301km+激光雷達(dá) 宋Pro DM-i飛馳版9.99萬起

態(tài)度原創(chuàng)

游戲
藝術(shù)
親子
本地
公開課

性感美女韓游上線Steam!酥臉白腿嬌羞可愛

藝術(shù)要聞

無花不風(fēng)景

親子要聞

這下完了,3個(gè)孩子不認(rèn)我這個(gè)外國(guó)媽!

本地新聞

春色滿城關(guān)不?。座N梅浪漫盛放,吳山藏了一片四月雪

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版