国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

UC伯克利實現(xiàn)預訓練機器學習勢函數(shù)的跨泛函遷移學習

0
分享至



作者 | 論文團隊

編輯 | ScienceAI

原子級模擬為材料性質(zhì)的預測與虛擬篩選提供了重要手段,其核心在于準確描述體系的勢能面(PES)。相比于傳統(tǒng) PES 的計算所依賴的方法——從頭算量子化學方法(如密度泛函理論 DFT)與經(jīng)驗力場而言,機器學習原子間勢函數(shù)可以更好權(quán)衡精度與效率,通過從 DFT 數(shù)據(jù)中學習原子間相互作用,對 PES 進行準確構(gòu)建。

近年來,隨著數(shù)據(jù)和模型規(guī)模的擴大,基于數(shù)百萬 DFT 計算訓練的基座勢能(foundation potentials, FPs)進一步展現(xiàn)出跨化學空間的泛化潛力,已被廣泛用于聲子譜預測、相圖構(gòu)建、催化篩選與分子動力學模擬等下游任務(wù),為多尺度材料建模奠定了新的基礎(chǔ)。

然而,絕大多數(shù) FPs 依然是在大量低精度 GGA/GGA+U 的 DFT 泛函數(shù)據(jù)上訓練的,隨著我們對于下游任務(wù)提出更高的模擬精度的需求,經(jīng)低精度數(shù)據(jù)預訓練的模型亟待通過對于高精度數(shù)據(jù)(如 r2SCAN、HSE06 泛函)的遷移學習,構(gòu)造為精度更高的模型。

為應(yīng)對這一跨泛函遷移挑戰(zhàn),來自加州大學伯克利分校(UCB)的黃旭,鄧博文,鐘佩辰及 Gerbrand Ceder 教授等,在名為 CHGNet 的基座勢能框架內(nèi)分析了這一跨泛函由低精度數(shù)據(jù)到高精度數(shù)據(jù)遷移學習問題的挑戰(zhàn)及解決方案。

該研究以「Cross-functional transferability in foundation machine learning interatomic potentials」為題,于 2025 年 10 月 21 日刊登于《npj Computational Materials》。



論文鏈接:https://www.nature.com/articles/s41524-025-01796-y

基座勢能在當前訓練數(shù)據(jù)的局限及跨泛函遷移的挑戰(zhàn)

目前用于晶體材料的基座勢能(FPs)訓練的數(shù)據(jù)集主要是 GGA 和 GGA+U 水平的 DFT 泛函數(shù)據(jù)組成。

首先,GGA/GGA + U 泛函在不同化學鍵環(huán)境下的遷移能力較低,整體計算精度較低。其次,為減少 GGA 中的自相互作用誤差而施加的 Hubbard U 校正,本質(zhì)上是半經(jīng)驗性的且具有非普適性?!缸顑?yōu)」U 值并沒有明確的定義,線性響應(yīng)法等方法表明,這樣的最優(yōu) U 值通常依賴于具體體系。

然而,GGA/GGA + U 的 FP 數(shù)據(jù)集在生成時,對每種元素都使用相同的 U 值,而不考慮局部環(huán)境或形式價態(tài)。再次,我們通常采用一種粗粒度的方案將 GGA 與 GGA + U 混合以構(gòu)建 FPs 訓練集。這樣的混合方式可能引發(fā)問題,例如在這些訓練數(shù)據(jù)之間移動時,原子間勢能可能會出現(xiàn)數(shù)百 meV 的突躍,這是不利于平滑勢能面構(gòu)建的。

在多精度 DFT 數(shù)據(jù)集之間實現(xiàn)顯式或隱式的跨泛函可遷移性的主要策略有三種:遷移學習(transfer learning)、多精度學習(multi-fidelity learning)以及混合多精度訓練(mixed multi-fidelity training)。

這三種方法有各自的優(yōu)勢及挑戰(zhàn),其中,遷移學習指的是先在大規(guī)模的低精度數(shù)據(jù)集上對一個大型神經(jīng)網(wǎng)絡(luò)進行預訓練,然后將該網(wǎng)絡(luò)的預訓練權(quán)重用于初始化在更小規(guī)模的高精度數(shù)據(jù)集上的機器學習任務(wù)。這種方法在計算和數(shù)據(jù)利用上都非常高效。然而,如果不同精度數(shù)據(jù)集之間的相關(guān)性不夠強,遷移學習的效果就會變差,甚至可能導致性能下降,這種現(xiàn)象被稱為「負遷移」(negative transfer)。

MP-r2SCAN 數(shù)據(jù)集

研究團隊構(gòu)建了一個來自 Materials Project 數(shù)據(jù)庫的 r2SCAN 弛豫軌跡解析而成的 r2SCAN 數(shù)據(jù)集(MP-r2SCAN),用于高精度訓練任務(wù),包含 34,927 個材料 ID 和 238,247 個結(jié)構(gòu)。與 MPtrj 數(shù)據(jù)集(包含 145,923 個材料 ID 和 1,580,395 個結(jié)構(gòu))相比,MP-r2SCAN 的數(shù)據(jù)規(guī)模顯著更小。

如下圖圖 b 所示,r2SCAN 與 GGA/GGA + U 的總能量分布在不同的數(shù)值范圍上。從 GGA/GGA + U 到 r2SCAN 的能量偏移量在 0–70 eV/atom 的量級,這遠大于勢函數(shù)能量精度(約 30 meV/atom),這表明這些 r2SCAN 能量標簽若沒有合適的參考或歸一化處理,是無法直接有效遷移使用的。



使用不同原子參考能量的遷移學習及基準測試





對于在具有基于 GGA/GGA + U 總能量擬合的 AtomRef 的勢函數(shù) FP 上進行的跨泛函遷移學習,可以重新擬合該 FP 的 AtomRef(用基于 r2SCAN 能量擬合得到的 AtomRef 替換原有的基于 GGA/GGA + U 的 AtomRef),從而將 FP 遷移前后圖神經(jīng)網(wǎng)絡(luò)學習的能量預測部分對齊到相近的數(shù)值尺度,并提升預訓練與微調(diào)數(shù)據(jù)集之間的相關(guān)性,克服遷移學習中「負遷移」的挑戰(zhàn)。實際上,Pearson 相關(guān)系數(shù) ρ 從未修正的 GGA/GGA + U 與 r2SCAN 數(shù)據(jù)集之間的 0.0917,提高到了在分別減去各自 AtomRef 后的 r2SCAN 能量與 GGA/GGA + U 能量之間的 0.9250。此外,此種方法也減少了微調(diào)開始階段梯度過大導致的訓練不穩(wěn)定性。由下圖可以觀察到,不重新擬合 AtomRef 的方法的初始梯度幅值至少比重新擬合 AtomRef 的方法大一個數(shù)量級,且重新擬合 AtomRef 后,模型的訓練過程更加穩(wěn)定且可靠。



在基準測試方面,該研究將重新擬合原子參考能量進行遷移學習的方法和其他幾個遷移學習方法以及從頭用 r2SCAN 數(shù)據(jù)訓練(無遷移學習)的方法進行了對比,得到在能量、原子間作用力、應(yīng)力、磁矩、熱力學穩(wěn)定性(形成能、分解能)、密度預測方面都更準確可靠的 FPs。如下圖所示,方法 4(即重新擬合原子參考能量的遷移學習)在密度預測(與實驗密度數(shù)據(jù)對比)方法顯著優(yōu)于其他方法。此外,實驗值與預測值之比的分布顯示,基于 GGA 預訓練的 CHGNet 模型更傾向于低估密度,而方法 4 所得到的分布相比其他方法更緊密地集中在理想值(比值 = 1)附近。上述結(jié)果表明,從 GGA 向 r2SCAN 的遷移學習方法是有效的,并且使用 r2SCAN 數(shù)據(jù)、通過方法 4 訓練得到的模型在實際體積與密度預測中具有更高的精度潛力。



除了從 GGA/GGA+U 到 r2SCAN 泛函數(shù)據(jù)遷移學習,團隊也研究了從 GGA/GGA+U 到鹵化物范德華數(shù)據(jù)集和 HSE06 數(shù)據(jù)集的遷移學習(見論文中的補充信息),證明了這種遷移方法的普適有效性。

擴展定律

為評估重新擬合原子參考能量的遷移學習方法的數(shù)據(jù)效率提升,研究團隊進行了擴展定律研究(下圖)。線性擬合結(jié)果表明,無論是從頭用 r2SCAN 數(shù)據(jù)訓練(無遷移學習)還是遷移學習(藍色),都表現(xiàn)出線性擴展規(guī)律的行為。僅使用 1K 個高精度數(shù)據(jù)點進行遷移學習,就能超越在超過 10K 個高精度數(shù)據(jù)點上從頭訓練的模型性能,這意味著通過 GGA 預訓練步驟獲得了超過十倍的數(shù)據(jù)效率提升。有趣的是,研究團隊觀察到,即使在包含 24 萬個結(jié)構(gòu)的完整 MP-r2SCAN 數(shù)據(jù)集上,遷移學習相較于從頭訓練的優(yōu)勢仍未飽和,表現(xiàn)出出色的數(shù)據(jù)效率。



總結(jié)與展望

研究團隊通過在 MP-r2SCAN 數(shù)據(jù)集上對不同 TL 方法進行得到在能量、原子間作用力、應(yīng)力、磁矩、熱力學穩(wěn)定性(形成能、分解能)、密度預測方面的基準測試,證明了 FPs 遷移學習中重新擬合原子參考能量的重要性及此方法的有效性。并且,通過比較具有和不具有低精度數(shù)據(jù)集預訓練的擴展定律,研究表明了得當?shù)倪w移學習方法可以實現(xiàn)顯著的數(shù)據(jù)效率提升。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
美國、德國、法國、韓國、英國等國媒體紛紛把目光轉(zhuǎn)向了中國武漢

美國、德國、法國、韓國、英國等國媒體紛紛把目光轉(zhuǎn)向了中國武漢

扶蘇聊歷史
2025-12-16 18:18:18
還沒打委內(nèi)瑞拉,美先炸第3國,美軍不宣而戰(zhàn),100枚導彈連夜空襲

還沒打委內(nèi)瑞拉,美先炸第3國,美軍不宣而戰(zhàn),100枚導彈連夜空襲

影孖看世界
2025-12-20 20:47:49
為了防止其它國家給柬埔寨運輸武器彈藥,泰國直接封鎖了泰國灣!

為了防止其它國家給柬埔寨運輸武器彈藥,泰國直接封鎖了泰國灣!

荊楚寰宇文樞
2025-12-17 22:13:04
第一批免簽去俄羅斯的中產(chǎn)傻眼了

第一批免簽去俄羅斯的中產(chǎn)傻眼了

風向觀察
2025-12-16 18:26:08
青島國企出大事了!母女實名舉報......

青島國企出大事了!母女實名舉報......

膠州西南鄉(xiāng)
2025-12-19 16:50:42
絲芭傳媒再發(fā)文:要求鞠婧祎方立刻停止侵權(quán)抹黑,將就其和關(guān)聯(lián)人涂某某等涉嫌嚴重經(jīng)濟犯罪行為,向相關(guān)監(jiān)管機構(gòu)實名舉報

絲芭傳媒再發(fā)文:要求鞠婧祎方立刻停止侵權(quán)抹黑,將就其和關(guān)聯(lián)人涂某某等涉嫌嚴重經(jīng)濟犯罪行為,向相關(guān)監(jiān)管機構(gòu)實名舉報

極目新聞
2025-12-18 11:17:51
大連一公園里,有人竟踩在這東西上玩耍、拍照……

大連一公園里,有人竟踩在這東西上玩耍、拍照……

環(huán)球網(wǎng)資訊
2025-12-20 08:58:08
4年1.86億!左膝半月板撕裂!頂薪合同砸手里了

4年1.86億!左膝半月板撕裂!頂薪合同砸手里了

籃球教學論壇
2025-12-20 10:46:16
日本暴發(fā)疫情

日本暴發(fā)疫情

中國基金報
2025-12-20 20:20:31
3連冠!谷愛凌創(chuàng)歷史,被外國網(wǎng)友批評:享受美國福利卻代表中國

3連冠!谷愛凌創(chuàng)歷史,被外國網(wǎng)友批評:享受美國福利卻代表中國

侃球熊弟
2025-12-19 19:28:01
又貴又難喝的“液體黃金”,成中產(chǎn)新寵?

又貴又難喝的“液體黃金”,成中產(chǎn)新寵?

中國新聞周刊
2025-12-20 20:47:03
中國不丹爭議地區(qū)加速收回,4500 平方公里,中國建村固邊難擋

中國不丹爭議地區(qū)加速收回,4500 平方公里,中國建村固邊難擋

墨蘭史書
2025-12-12 02:05:03
乾隆長曾孫與幼曾孫相差83歲,一個生于乾隆32年,一個活到1905年

乾隆長曾孫與幼曾孫相差83歲,一個生于乾隆32年,一個活到1905年

芊芊之言
2025-12-20 00:51:32
打敗美元的不是人民幣,而是電動汽車?7成石油進口的我們沒退路

打敗美元的不是人民幣,而是電動汽車?7成石油進口的我們沒退路

今日美食分享
2025-12-20 15:58:16
馬斯克收心了?官宣了39歲印度裔伴侶:相貌普通為他生了4個孩子

馬斯克收心了?官宣了39歲印度裔伴侶:相貌普通為他生了4個孩子

豐譚筆錄
2025-12-12 11:16:23
人民日報鐘聲:警惕日本“欺騙式外交”故伎重施

人民日報鐘聲:警惕日本“欺騙式外交”故伎重施

新京報
2025-12-20 13:04:02
山師一女生宿舍6人全員保研上岸!都是“雙一流”大學!

山師一女生宿舍6人全員保研上岸!都是“雙一流”大學!

齊魯壹點
2025-12-20 17:13:20
76歲陳百祥官宣接受安樂死,父母離世,與妻子結(jié)婚50年無兒無女

76歲陳百祥官宣接受安樂死,父母離世,與妻子結(jié)婚50年無兒無女

一娛三分地
2025-12-17 20:09:14
家門口遇害案兇手死緩 法院透露依據(jù),為正當防衛(wèi)劃出清晰邊界

家門口遇害案兇手死緩 法院透露依據(jù),為正當防衛(wèi)劃出清晰邊界

元爸體育
2025-12-21 04:40:32
33分5板6助4帽,隊史第一人!你再這么打下去,擺爛要變成爭冠了

33分5板6助4帽,隊史第一人!你再這么打下去,擺爛要變成爭冠了

鍋子籃球
2025-12-20 13:00:07
2025-12-21 06:23:00
ScienceAI incentive-icons
ScienceAI
關(guān)注人工智能與其他前沿技術(shù)
1185文章數(shù) 221關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

高市早苗擔心被邊緣化 要趕在特朗普訪華前行動

頭條要聞

高市早苗擔心被邊緣化 要趕在特朗普訪華前行動

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂要聞

2026央視跨年晚會陣容曝光,豪華陣仗

財經(jīng)要聞

求解“地方財政困難”

汽車要聞

嵐圖推進L3量產(chǎn)測試 已完成11萬公里實際道路驗證

態(tài)度原創(chuàng)

時尚
旅游
手機
本地
軍事航空

最顯腿細的騎士靴,誰穿誰是腿精

旅游要聞

不止紅墻白雪!故宮淡季爆火,藏著中國文旅升級的大信號

手機要聞

vivo X200T再曝,天璣 9400+芯片加持

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風骨

軍事要聞

澤連斯基:前線局勢愈發(fā)艱難

無障礙瀏覽 進入關(guān)懷版