
圖一|二維勢能面上的反應(yīng)物(R),過渡態(tài)(TS),產(chǎn)物(P),以及最小能量路徑(minimal energy pathway)
近日,深度原理 Deep Principle聯(lián)合佐治亞理工大學(xué),康奈爾大學(xué)等機(jī)構(gòu)聯(lián)合提出了一種革新性的過渡態(tài)檢索方法--React-OT,采用最優(yōu)傳輸(Optimal Transport, OT)的方法,從反應(yīng)物和產(chǎn)物的結(jié)構(gòu)插值開始,推導(dǎo)出高度精確的過渡態(tài)結(jié)構(gòu),相關(guān)成果已作為封面文章發(fā)表在 Nature Machine Intelligence 上,同時(shí)MIT News也對文章的第一兼通訊作者,深度原理 Deep Principle的創(chuàng)始人兼CTO段辰儒博士進(jìn)行了專訪報(bào)道。

本文將帶你深入了解 React-OT 的核心原理、與傳統(tǒng)方法的對比,以及它如何突破計(jì)算化學(xué)的瓶頸,大幅提升 TS 搜索的效率與精度,為反應(yīng)機(jī)理研究和催化劑設(shè)計(jì)提供全新工具。
一、方法創(chuàng)新

OA-ReactDiff是深度原理 Deep Principle于2023年推出的首個(gè)生成3D化學(xué)反應(yīng)的擴(kuò)散生成模型,這項(xiàng)成果已在Nature大子刊Nature Computational Science上發(fā)表,并被選為封面論文。OA-ReactDiff僅依賴反應(yīng)物和產(chǎn)物的3D幾何形狀即可生成過渡態(tài)結(jié)構(gòu),比傳統(tǒng)量化方法預(yù)測過渡態(tài)速度提升1000倍。但是由于擴(kuò)散模型采樣過程中的隨機(jī)性,OA-ReactDiff生成的過渡態(tài)也是隨機(jī)的,往往需要多次采樣才能獲得理想的過渡態(tài)結(jié)構(gòu)。
作為OA-ReactDiff的迭代升級版本,React-OT在OA-ReactDiff的基礎(chǔ)上,針對給定的反應(yīng)物和生成物(雙端搜索)進(jìn)行了改進(jìn),基于最優(yōu)傳輸理論,通過流匹配方法,從反應(yīng)物和產(chǎn)物直接推導(dǎo)TS結(jié)構(gòu),單次采樣即可生成確定性的TS結(jié)構(gòu)。


最優(yōu)傳輸是一種數(shù)學(xué)理論和計(jì)算方法,用于描述兩個(gè)概率分布之間的距離或者對應(yīng)關(guān)系。它的核心概念是如何以最佳方式將一組資源(如質(zhì)量、能量等)從一個(gè)位置傳輸?shù)搅硪粋€(gè)位置。類比初中學(xué)習(xí)的線性規(guī)劃問題:三個(gè)城市(A, B, C)分別有1、0.5、1.5噸煤,另外有兩個(gè)城市(D, E)分別需要2、1噸煤,由于不同城市之間的運(yùn)輸成本不同,城市需求也不同,需要制定策略給出最優(yōu)運(yùn)輸路線,這些“最優(yōu)路線”在化學(xué)反應(yīng)中就代表了最合理化學(xué)反應(yīng)路徑以其對應(yīng)的過渡態(tài)結(jié)構(gòu)。


1. 初始過渡態(tài)結(jié)構(gòu):OA-ReactDiff從高斯噪音中隨機(jī)采樣,所以生成的過渡態(tài)也存在隨機(jī)性。React-OT則是從反應(yīng)物和產(chǎn)物的線性插值出發(fā),并且通過平移旋轉(zhuǎn)等操作確保初始結(jié)構(gòu)的等變性和唯一性,獲得相對合理的初始猜測,將采樣路徑推向更接近最優(yōu)傳輸?shù)姆较颉?/span>
2. 采樣過程:OA-ReactDiff采用擴(kuò)散模型,過渡態(tài)生成是一個(gè)隨機(jī)采樣過程。而React-OT將采樣過程模擬為常微分方程,而不是擴(kuò)散模型中的隨機(jī)微分方程,將反應(yīng)物、產(chǎn)物和過渡態(tài)的聯(lián)合分布視為動(dòng)態(tài)傳輸問題,通過流匹配(flow matching)方法,直接從反應(yīng)物和產(chǎn)物推導(dǎo)TS結(jié)構(gòu),不再需要多次隨機(jī)采樣。
3. 更大數(shù)據(jù)集的預(yù)訓(xùn)練:使用RGD1-xTB 數(shù)據(jù)集對React-OT進(jìn)行預(yù)訓(xùn)練,然后再在Transition 1x數(shù)據(jù)集上進(jìn)行模型的微調(diào),RGD1-xTB包含95萬個(gè)基于 GFN2-xTB 計(jì)算的化學(xué)反應(yīng),對比訓(xùn)練OA-ReactDiff使用的Transition1x 數(shù)據(jù)集(1 萬個(gè)反應(yīng)),RGD1-xTB的數(shù)據(jù)量大幅增加,可為 React-OT 提供更廣泛的化學(xué)環(huán)境和結(jié)構(gòu)信息。

圖二 | 擴(kuò)散模型和最佳傳輸模型生成TS結(jié)構(gòu)的工作概述(左)OA-ReactDiff的隨機(jī)推理過程。(右)React-OT的確定性推理過程
二、結(jié)果一覽

在使用Transition 1x訓(xùn)練React-OT之前,先在RGD1-xTB 數(shù)據(jù)集上對 React-OT進(jìn)行了預(yù)訓(xùn)練,預(yù)訓(xùn)練后,React-OT在TS預(yù)測精度上實(shí)現(xiàn)了顯著提升:生成結(jié)構(gòu)的 RMSD 中位數(shù)和勢壘高度誤差降低 25%以上,相比未預(yù)訓(xùn)練模型精度提升顯著。除了精度的提升之外,搜索過渡態(tài)所需運(yùn)行時(shí)間也顯著減少。OA-ReactDiff在單張GPU上需6秒完成過渡態(tài)搜索,而React-OT的采樣過程消除了隨機(jī)性,只要0.4秒就可以得到正確的TS結(jié)構(gòu)。對比OA-ReactDiff,React-OT能適應(yīng)更復(fù)雜的化學(xué)反應(yīng)類型,對未見過反應(yīng)的預(yù)測能力也要更好。

圖三 | React-OT和OA-ReactDiff模型在生成過渡態(tài)的精度和速度方面的性能對比 a. React-OT得到滿足特定RMSD要求的TS結(jié)構(gòu)的可能性高于兩種擴(kuò)散模型。b. OA-ReactDiff和React-OT生成過渡態(tài)的質(zhì)量。c. 兩種模型預(yù)測效果的對比。d. 運(yùn)行速度的比較。

在經(jīng)過 RGD1-xTB 預(yù)訓(xùn)練后,React-OT顯著提升了對未見反應(yīng)類型的適應(yīng)性和預(yù)測能力,即使在12 個(gè)非氫原子的復(fù)雜反應(yīng)體系中,仍能準(zhǔn)確生成TS結(jié)構(gòu),具備應(yīng)對多步有機(jī)反應(yīng)的能力。為了探索React-OT在反應(yīng)網(wǎng)絡(luò)探索中的實(shí)際應(yīng)用,這篇文章選擇γ-酮過氧化氫(KHP)作為研究對象。KHP 是一個(gè)備受關(guān)注的反應(yīng)體系,近年來被廣泛用于基準(zhǔn)測試。

圖四| KHP的反應(yīng)網(wǎng)絡(luò) 其中紅色/黑色的數(shù)字分別為DFT計(jì)算/React-OT生成的過渡態(tài)上計(jì)算得到的活化能
可以看到,React-OT生成的反應(yīng)網(wǎng)絡(luò)與文獻(xiàn)記載的KHP反應(yīng)節(jié)點(diǎn)完全一致,表明其能夠準(zhǔn)確捕捉所有關(guān)鍵反應(yīng),且兩者的平均絕對能量差僅為 3.84 kcal/mol。這一案例研究展示了 React-OT 在加速反應(yīng)網(wǎng)絡(luò)探索中的應(yīng)用潛力。
三、應(yīng)用展望
段辰儒表示,“人類眨眼的平均時(shí)間是0.4秒。在這個(gè)時(shí)間內(nèi)React-OT就可以精準(zhǔn)的找到一個(gè)化學(xué)反應(yīng)的過渡態(tài),這在之前是不可想象的。極致的加速會產(chǎn)生行為模式的質(zhì)變,React-OT將改變我們對化學(xué)反應(yīng)的理解和探索新材料的方式?!?/span>

?催化劑設(shè)計(jì):快速篩選高活性反應(yīng)路徑,加速清潔能源催化劑開發(fā)。
?藥物合成:精準(zhǔn)預(yù)測有機(jī)反應(yīng)能壘,優(yōu)化合成路線,降低實(shí)驗(yàn)成本。
?材料探索:構(gòu)建超大型反應(yīng)網(wǎng)絡(luò),發(fā)現(xiàn)新型功能材料(如MOFs、鈣鈦礦)。
未來已來
React-OT標(biāo)志著化學(xué)反應(yīng)TS搜索進(jìn)入高效、精準(zhǔn)的新紀(jì)元,有望成為計(jì)算化學(xué)領(lǐng)域的重要工具。歡迎關(guān)注深度原理 Deep Principle團(tuán)隊(duì),探索更多前沿研究!
拓展閱讀:Bohrium Notebook
如果對生成式模型感興趣,想進(jìn)一步了解React-OT,復(fù)制下方鏈接,打開 Notebook:
https://bohrium.dp.tech/notebooks/47742251216
也可以通過Bohrium App或者深度原理 Deep Principle(DeepPrinciple)官方使用鏈接直接試用模型生成你想要的過渡態(tài):
https://bohrium.dp.tech/apps/bohriumweb/job?type=app
深度原理 Deep Principle(DeepPrinciple)官方使用鏈接:http://reactot-dev.deepprinciple.com
聲明:化學(xué)加刊發(fā)或者轉(zhuǎn)載此文只是出于傳遞、分享更多信息之目的,并不意味認(rèn)同其觀點(diǎn)或證實(shí)其描述。若有來源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益,請作者持權(quán)屬證明與本網(wǎng)聯(lián)系,我們將及時(shí)更正、刪除,謝謝。 電話:18676881059,郵箱:gongjian@huaxuejia.cn