国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

深度科學| Nature: MOSAIC專用模型如何實現(xiàn)智能化學合成

0
分享至

編者語:

該方法避免了嚴格定義反應類型的局限性,轉而讓系統(tǒng)直接從Voronoi單元中發(fā)現(xiàn)并利用轉化模式間的相似性。

01


背景介紹

在當今科學飛速發(fā)展的時代,化學領域正面臨著一個前所未有的挑戰(zhàn):信息爆炸。每年有數(shù)十萬個新化學反應被報道,加入已經(jīng)包含數(shù)百萬個已知反應的龐大知識庫。然而,手動查閱文獻變得低效且高度依賴個人經(jīng)驗,這些海量信息逐漸成為了化學家的負擔。并且,傳統(tǒng)的化學合成依賴研究人員的專業(yè)知識和直覺,往往需要通過反復試錯來優(yōu)化反應條件(圖1)。即使是經(jīng)驗豐富的化學家,也難以掌握所有快速發(fā)展的實驗方法學。這種局限性也影響了自動化合成平臺,缺失的實驗方案常常需要人工干預關鍵參數(shù)。盡管大型語言模型(LLMs)在化學領域已展現(xiàn)出應用潛力,但現(xiàn)有系統(tǒng)難以可靠地處理各種全新化合物的復雜轉化,且在提供可重復、完整、帶可信度評估的實驗方案方面存在明顯不足。


1. 傳統(tǒng)經(jīng)驗式試錯合成(AI圖)

2026年01月19日,耶魯大學Victor S. Batista與Timothy R. Newhouse團隊在Nature期刊發(fā)表題為“Collective intelligence for AI-assisted chemical synthesis”的研究論文。該研究開發(fā)了一種名為“多優(yōu)化專家AI輔助化學預測”的計算框架(MOSAIC框架,Multiple Optimized Specialists for AI-assisted Chemical Prediction),旨在讓化學家能夠利用數(shù)百萬反應方案的集體知識(圖2)。MOSAIC基于Llama-3.1-8B-instruct架構構建,在Voronoi聚類劃分的空間中訓練了2,498個高度專業(yè)化的化學專家模型。該方法能夠為復雜合成提供可復現(xiàn)、可執(zhí)行的實驗方案,并附帶置信度評估指標。實驗驗證顯示,其整體成功率達到71%,實現(xiàn)了 35 種以上新化合物的合成,涵蓋藥物、材料、農(nóng)用化學品和化妝品等多個領域。值得注意的是,MOSAIC還能夠發(fā)現(xiàn)超出其訓練專家知識范圍的全新反應方法,這是推動化學合成發(fā)展的關鍵能力。通過將龐大知識領域劃分為可搜索的專家區(qū)域,這一可擴展范式為在信息增長速度超越知識獲取與應用效率的領域中實現(xiàn)AI輔助發(fā)現(xiàn),提供了一種具有普適性的解決策略。


2. 圖文總覽

02


圖文解析

1.革命性設計:從通用模型到化學專家委員會

研究團隊首先開發(fā)了一種稱為核度量網(wǎng)絡(KMN)的系統(tǒng)(圖3),能夠將化學反應轉化為128維的“反應特異性指紋”。這種指紋類似于人類的指紋,能夠唯一標識每個化學反應的特征。通過FAISS相似性搜索庫,化學反應空間被劃分為2,500個Voronoi區(qū)域,每個區(qū)域由專門的專家模型負責。

這種設計的巧妙之處在于:當遇到一個新的合成問題時,系統(tǒng)會先確定這個問題屬于哪個化學空間區(qū)域,然后激活對應的專家提供解決方案。這就好比不是詢問一個“通才”,而是咨詢一個專門研究此類反應的“領域專家”。

MOSAIC的核心創(chuàng)新在于其獨特的架構設計。與傳統(tǒng)的單一大型語言模型不同,MOSAIC基于Llama-3.1-8B-instruct架構,訓練了2,498個專業(yè)化學專家,每個專家負責特定的化學反應空間。


3.MOSAIC系統(tǒng)框架示意圖

2.專業(yè)化優(yōu)勢

研究團隊還MOSAIC與當前的主流大語言模型進行了系統(tǒng)比較,包括ChatGPT-4o mini、Claude 3.5 Haiku、Claude 3.5 Sonnet和ChatGPT-o1 Pro。評估涵蓋了12種重要反應類型,包括Suzuki偶聯(lián)、烯烴復分解、Buchwald-Hartwig胺化等。結果表明,盡管MOSAIC只有80億參數(shù),遠小于ChatGPT-o1 Pro和Claude 3.5 Sonnet等模型,但其在提供明確化學合成指導方面表現(xiàn)更優(yōu)(圖4)。這表明在專業(yè)領域,針對性的微調(diào)和化學特定的優(yōu)化可以克服原始參數(shù)數(shù)量的優(yōu)勢。評估還發(fā)現(xiàn),遵循指令的能力與化學知識同樣重要。通用模型在相同提示下表現(xiàn)出顯著不同的響應一致性。例如,Claude 3.5 Haiku在一次試驗中能提供詳細回答,而在另一次試驗中則拒絕回答,聲稱信息不足。這種不一致性給尋求可靠幫助的用戶帶來了挑戰(zhàn)。


4. 提示設計與量化評估指標

3.從預測到實踐:71%的成功率驗證

實驗驗證表明,該系統(tǒng)在合成超過35種新化合物時達到了71%的整體成功率。這些化合物涵蓋藥物、材料、農(nóng)用化學品和化妝品等多個領域(圖5和圖6)。

更為重要的是,MOSAIC展現(xiàn)出了強大的預測能力:當轉化反應與專家知識域距離較近(距離<100)時,成功率超過75%;即使距離較遠(>100),仍能達到約50%的成功率。這為實驗優(yōu)先級提供了量化依據(jù)——研究人員可以優(yōu)先嘗試高置信度的預測,同時將資源合理分配于探索性研究。

具體案例充分展示了MOSAIC的實用價值。在Buchwald-Hartwig胺化反應中(藥物分子中普遍存在的碳氮鍵形成反應),MOSAIC不僅準確預測了條件,還展示了深刻的化學洞察力,為不同底物提出了鈀催化的Buchwald-Hartwig、銅催化的Goldberg和SNAr反應作為可行替代方案(圖5)。

在合成具有臨床重要性的化合物衍生物,如抗抑郁藥去甲替林和降膽固醇藥物非諾貝特時,這種多功能性被證明非常寶貴。MOSAIC還成功指導了Heck偶聯(lián)反應,其中先前報道的轉化已被證明不成功,展示了其解決合成瓶頸的潛力。


5.基于計算預測指導的全新化合物合成

4.超越已知:發(fā)現(xiàn)全新反應方法學

MOSAIC最引人注目的能力是能夠發(fā)現(xiàn)訓練數(shù)據(jù)中不存在的新反應方法學。在案例研究中,研究團隊使用雜芳基二鹵化物的級聯(lián)環(huán)化來形成吲哚的生物電子等排體類似物。研究表明,5-氮雜吲哚衍生物的合成在現(xiàn)有方法下無法進行?;谶@一局限性,MOSAIC指導開發(fā)了一種通過雜芳基二鹵化物與N-烷基烯丙胺的未報道環(huán)化反應來合成各種氮雜吲哚的新方案(圖6, 13a-d)。

對于形成目標產(chǎn)物的反應,最近的專家質心距離為320,遠高于典型的置信閾值(<150)。缺乏密切相關的前例反應表明,該預測遠遠超出了知識空間,從預測專家的角度來看,這是一個真正的新轉化。


6. 面向跨化學工業(yè)轉化應用合成的化合物

5.實際應用:從藥物開發(fā)到材料科學

MOSAIC的實際影響跨越多個化學工業(yè)領域。在藥物研發(fā)方面,它準確預測了類藥分子的合成路線;在材料科學中,精確預測了電子器件共軛化合物的合成路線;在農(nóng)業(yè)化學中,實現(xiàn)了用于作物保護的pyrabactin變體的創(chuàng)建;在消費品領域,成功合成了潛在香料和抗衰老化合物(圖6)。

特別值得關注的是,在37種實現(xiàn)的化合物中,有35種使用排名最高的預測一次嘗試即成功,只有兩種需要較低排名的程序。這些成功應用代表了所檢查轉化的大多數(shù),盡管并非所有預測都產(chǎn)生了成功的結果。

03


總結

這種利用計算搜索的方法原則隨著數(shù)據(jù)和資源的增加而有效擴展。通過將巨大的化學反應空間劃分為可搜索的Vonoroi區(qū)域并將專家分配給這些區(qū)域,MOSAIC可以隨著更多數(shù)據(jù)的可用而不斷擴展其覆蓋范圍和精度。通過FAISS的搜索機制實現(xiàn)了高效導航,使系統(tǒng)能夠快速識別任何給定查詢的最相關專家模型。MOSAIC的價值不在于取代化學專業(yè)知識,而在于快速調(diào)查廣闊的化學空間,確定有希望的實驗方向,否則這些方向需要廣泛的文獻回顧和積累的經(jīng)驗。它將傳統(tǒng)的迭代試錯方法轉變?yōu)橹樘剿?,加速進入以前未知的化學空間區(qū)域。

文獻信息

Haote Li, Sumon Sarkar, Wenxin Lu, Patrick O. Loftus, Tianyin Qiu, Yu Shee, Abbigayle E. Cuomo, John-Paul Webster, H. Ray Kelly, Vidhyadhar Manee, Sanil Sreekumar, Frederic G. Buono, Robert H. Crabtree, Timothy R. Newhouse & Victor S. Batista, Collective intelligence for AI-assisted chemical synthesis, Nature, 2026, https://doi.org/10.1038/s41586-026-10131-4

聲明:

1. 版權:推送內(nèi)容僅供學習交流分享使用,無任何商業(yè)用途,如有侵權,請聯(lián)系后臺刪除或修改,感謝支持。

2. 投稿:非常歡迎各位老師在公眾號上介紹課題組前沿或經(jīng)典研究成果!后臺或郵箱聯(lián)系即可!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
高盛:對沖基金瘋狂逃命,以13年來最快速度拋售全球股票

高盛:對沖基金瘋狂逃命,以13年來最快速度拋售全球股票

新浪財經(jīng)
2026-04-03 15:10:41
有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
意大利足球已死 多位球員怒揭丑聞:花錢才能出場 主帥無權定首發(fā)

意大利足球已死 多位球員怒揭丑聞:花錢才能出場 主帥無權定首發(fā)

我愛英超
2026-04-03 07:06:53
萬科的雷,終于還是砸下來了

萬科的雷,終于還是砸下來了

芳華青年
2026-04-02 19:32:44
25國大軍逼近!特朗普下死手,日軍越界1000人,解放軍雙語下通牒

25國大軍逼近!特朗普下死手,日軍越界1000人,解放軍雙語下通牒

素衣讀史
2026-03-31 16:49:48
被封“體壇那英”!王濛跨界參加浪姐,耿直吐槽引爆笑

被封“體壇那英”!王濛跨界參加浪姐,耿直吐槽引爆笑

情感大頭說說
2026-04-04 00:06:15
待爆帝小生被封殺了?迪麗熱巴嫌棄陳飛宇?井柏然打醬油?小S復工了?姨太問答

待爆帝小生被封殺了?迪麗熱巴嫌棄陳飛宇?井柏然打醬油?小S復工了?姨太問答

毒舌扒姨太
2026-04-03 22:39:15
女足球員瑪?shù)铝諘褡耘氖軣崤?,球迷直言期待現(xiàn)場看她比賽

女足球員瑪?shù)铝諘褡耘氖軣崤?,球迷直言期待現(xiàn)場看她比賽

懂球帝
2026-04-03 22:08:51
日本球迷熱議美和無緣8強!疲勞成要因 中國仍乒壇高墻 王藝迪身經(jīng)百戰(zhàn)

日本球迷熱議美和無緣8強!疲勞成要因 中國仍乒壇高墻 王藝迪身經(jīng)百戰(zhàn)

乒乓助手
2026-04-04 00:04:15
出大事了,伊朗導彈精準斬首!11國對美國發(fā)出通牒,特朗普變臉

出大事了,伊朗導彈精準斬首!11國對美國發(fā)出通牒,特朗普變臉

滄海閱銘
2026-04-02 23:07:08
“阿爾忒彌斯2號”任務待發(fā),專家預警:四名宇航員可能在約40萬公里外突發(fā)醫(yī)療危機

“阿爾忒彌斯2號”任務待發(fā),專家預警:四名宇航員可能在約40萬公里外突發(fā)醫(yī)療危機

Thurman在昆明
2026-04-03 16:10:43
明天起!東莞這些路邊停車位正式收費!

明天起!東莞這些路邊停車位正式收費!

東莞好生活
2026-04-03 13:09:08
隨著費利佩戴帽+成都蓉城5-1,2026賽季中超最新積分榜出爐

隨著費利佩戴帽+成都蓉城5-1,2026賽季中超最新積分榜出爐

側身凌空斬
2026-04-03 21:44:37
與輝同行:深表歉意,全額退款

與輝同行:深表歉意,全額退款

魯中晨報
2026-04-02 22:01:03
28萬彩禮到手!女子哭訴閨蜜嫁給自己的相親對象,開始羨慕嫉妒恨

28萬彩禮到手!女子哭訴閨蜜嫁給自己的相親對象,開始羨慕嫉妒恨

火山詩話
2026-04-03 05:47:58
張雪峰女兒再發(fā)聲,留言看哭萬千網(wǎng)友,去世前一家三口用餐照曝光

張雪峰女兒再發(fā)聲,留言看哭萬千網(wǎng)友,去世前一家三口用餐照曝光

叨嘮
2026-04-03 23:58:55
杉杉集團家族內(nèi)斗失控

杉杉集團家族內(nèi)斗失控

地產(chǎn)微資訊
2026-03-27 10:10:55
目前在意執(zhí)教且老婆意大利人,阿什利-科爾:我不太會說意語

目前在意執(zhí)教且老婆意大利人,阿什利-科爾:我不太會說意語

懂球帝
2026-04-03 09:14:19
現(xiàn)役第一!哈登生涯17季全部晉級季后賽 僅輸鄧肯猶他二老

現(xiàn)役第一!哈登生涯17季全部晉級季后賽 僅輸鄧肯猶他二老

醉臥浮生
2026-04-03 12:31:24
昔日A股“最牛大妖股”,又翻倍了!

昔日A股“最牛大妖股”,又翻倍了!

財經(jīng)銳眼
2026-04-03 17:14:43
2026-04-04 00:44:49
原子量 incentive-icons
原子量
探索科學魅力,實踐科技創(chuàng)新;分享化學奇趣,服務知識交流。
78文章數(shù) 11關注度
往期回顧 全部

科技要聞

5萬輛庫存車,給了特斯拉一記重拳

頭條要聞

伊朗:美飛行員跳傘在伊境內(nèi)落地 美方曾試圖營救未果

頭條要聞

伊朗:美飛行員跳傘在伊境內(nèi)落地 美方曾試圖營救未果

體育要聞

被NBA選中20年后,他重新回到籃球場

娛樂要聞

夏克立官宣再婚當爸?否認婚內(nèi)出軌

財經(jīng)要聞

專家稱長期攝入“飄香劑”存在健康隱患

汽車要聞

你介意和遠房親戚長得很像嗎?

態(tài)度原創(chuàng)

時尚
手機
旅游
房產(chǎn)
健康

冬奧雙金夫妻:愛與榮耀,頂峰相見

手機要聞

OPPO Find X9 Ultra:真機偷跑!Find X9s Pro:要做小屏影像機皇

旅游要聞

浦東文旅市場持續(xù)升溫,春假清明假期帶動客流明顯增長

房產(chǎn)要聞

小陽春全面啟動!現(xiàn)房,才是這波行情里最穩(wěn)的上車票

干細胞抗衰4大誤區(qū),90%的人都中招

無障礙瀏覽 進入關懷版