自主閱讀海量文獻汲取前人智慧,制定實驗方案,在無人干預(yù)的情況下完成實驗全流程,思考出最優(yōu)解,創(chuàng)造新的化學(xué)品和材料。
這正是中國科學(xué)技術(shù)大學(xué)(以下簡稱中國科大)化學(xué)與材料科學(xué)學(xué)院教授羅毅、江俊團隊的作品:8年攻關(guān),他們開發(fā)和集成移動機器人、智能化學(xué)工作站、智能操作系統(tǒng)、科學(xué)數(shù)據(jù)與模型庫,研制出“全球首個數(shù)據(jù)智能驅(qū)動的全流程機器化學(xué)家平臺”(以下簡稱機器化學(xué)家)。
研究成果論文發(fā)表在《國家科學(xué)評論》期刊上。審稿人評價,該成果的“機器人系統(tǒng)、工作站和智能化學(xué)大腦都是最先進的” “將對化學(xué)科學(xué)產(chǎn)生巨大影響”。
“這主要得益于中國科大多學(xué)科交叉的背景,促使不同學(xué)科的科研人員匯集在一起共同做一件事。我們的目標是建成機器化學(xué)家大科學(xué)裝置,解放化學(xué)家雙手,加快新的化學(xué)品和新的材料研發(fā)創(chuàng)制?!苯∠颉吨袊茖W(xué)報》介紹。
日前,羅毅、江俊團隊獲得了2022年中國科學(xué)院年度團隊稱號。
羅毅、江俊(中)團隊部分成員在實驗室合影 張大崗 攝
“最強化學(xué)大腦”引領(lǐng)化學(xué)研究智能化
提及為何會研發(fā)機器化學(xué)家?江俊自嘲是因為自己手笨。早在2003年,還在中科院上海技術(shù)物理研究所攻讀碩博連讀學(xué)位的江俊,經(jīng)常需要做實驗?!暗俏业氖痔貏e笨,所以做實驗失敗是常有的事?!苯⌒χf,后來他師從羅毅教授,專攻理論化學(xué)研究。
在做理論研究中,江俊發(fā)現(xiàn)中國人在學(xué)術(shù)上非?!氨粍印薄!拔覀冏隽舜罅康难芯抗ぷ鳎罱K成果發(fā)表在外文期刊上。但引用這些論文數(shù)據(jù)時還得花錢買,并且只有訪問權(quán),不允許大量下載。”江俊認為,“我們應(yīng)該做中國人自己的材料數(shù)據(jù)庫”。
狄拉克說“公式都是優(yōu)美的”,底層規(guī)則是非常清晰和簡單的。但是一旦將理論應(yīng)用到實踐中,解答其方程的復(fù)雜度往往高到無法想象,人類無法計算求解。因此,由于算力和人類思考能力的局限,理論和實踐常常處于“脫節(jié)”狀態(tài)。
長期的理實“脫節(jié)”,帶來了傳統(tǒng)化學(xué)研究的最大“痛點”:科研人員主要依賴于“窮舉”“試錯”的手段去創(chuàng)制新物質(zhì),導(dǎo)致實驗成本高、周期跨度長;隨著化學(xué)研究對象日益復(fù)雜化、高維化,面對龐大的化學(xué)空間,配方和工藝的搜索常常止步于局部最優(yōu),無法進行全局探索。
逐漸興起并快速迭代進化的大數(shù)據(jù)與人工智能技術(shù)為解決這些難題提供了新的機遇。羅毅、江俊及其團隊提出“機器化學(xué)家”概念,并開展相關(guān)科研工作。從2014年到2022年,他們攻堅克難,成功研制出機器化學(xué)家。
機器化學(xué)家由“化學(xué)大腦”、機器人實驗員和智能化學(xué)工作站三部分組成。其中最核心的“化學(xué)大腦”通過分析大量化學(xué)實驗和理論數(shù)據(jù)建立知識圖譜,實現(xiàn)了閱讀理解文獻、設(shè)計化學(xué)實驗、自主優(yōu)化方案的能力,并配備了人機交互的操作系統(tǒng),可以便于“無編程基礎(chǔ)”的科研用戶使用。機器人實驗員和16個化學(xué)工作站之間能進行數(shù)據(jù)交換和互動,精準配合執(zhí)行化學(xué)實驗。
以研制潛力巨大的高熵化合物催化劑為例,江俊展示了機器化學(xué)家的“絕技”:閱讀16000篇論文,自主遴選出5種非貴金屬元素,融合2萬組理論計算數(shù)據(jù)和200組全流程機器實驗數(shù)據(jù),建立了理實交融的智能模型,從55萬種可能的金屬配比中找出最優(yōu)的高熵催化劑。將傳統(tǒng)需要消耗大量人力、物力、時間等的“炒菜式”遍歷搜索所需的1400年,縮短為5周。
業(yè)內(nèi)專家認為,機器化學(xué)家的研究工作脫離了傳統(tǒng)試錯研究范式的限制,展現(xiàn)出“最強化學(xué)大腦”指導(dǎo)的智能新范式的巨大優(yōu)勢,引領(lǐng)化學(xué)研究朝著知識理解數(shù)字化、實驗操作指令化、材料創(chuàng)制模板化的未來趨勢前進,確立了我國在智能化學(xué)創(chuàng)新領(lǐng)域的全球領(lǐng)跑地位。
“從不擺爛、從不應(yīng)付交差”
如此“聰慧”的機器化學(xué)家,其研發(fā)團隊成員近30人,多數(shù)是90后、95后。他們分工明確,配合默契。
化學(xué)實驗經(jīng)驗豐富的朱青等人負責(zé)實驗方案設(shè)計,并對機器人實驗員的操作質(zhì)量進行評估;黃炎等人負責(zé)理論模型的計算;張百成編寫程序,讓機器人讀論文、提出科學(xué)假設(shè)、形成實驗報告和方案;肖恒宇和趙路遠等主攻系統(tǒng)整體軟件架構(gòu)以及各個化學(xué)工作站的軟硬件開發(fā);自動化系的尚偉偉、張飛老師團隊負責(zé)研制機器人。
“研發(fā)的一個難點在于實現(xiàn)機器人對化學(xué)實驗操作的精準模仿?!苯≌f,人可以自然而然或是通過訓(xùn)練做出很多動作,但是機器人做不到。為解決該難題,尚偉偉與張飛把科研人員做實驗的各種動作拍成視頻,然后一點點分解,最后實現(xiàn)精準模仿。
另一個難點在于改造智能化學(xué)工作站。很多傳統(tǒng)的化學(xué)工作站與機器人之間并不具備遠程通訊互動的功能,這就要求團隊自主開發(fā)。
趙路遠和師弟曹嘉祺在編寫固體進樣儀器的驅(qū)動程序時,由于信息掌握不充足,無法準確理解并調(diào)用儀器接口。他們多次聯(lián)系了國外儀器廠商和代理商,但是得到的回應(yīng)都是“無可奉告” “商業(yè)機密”。為此,他們決定自力更生。
“當(dāng)時,我們用了3個星期的時間,重復(fù)做了3000次發(fā)送信號、等待反饋、記錄響應(yīng)的實驗,逐步逆向試出底層控制邏輯,成功實現(xiàn)了對機器人的遠程控制。”趙路遠說,令她自豪的是,后來國外儀器廠商主動聯(lián)系,希望可以購買他們研發(fā)的驅(qū)動程序。
2021年12月2日,機器化學(xué)家迎來第一次“大考”——系統(tǒng)整體試運行。團隊成員信心滿滿,結(jié)果卻差強人意。“化學(xué)設(shè)備單獨運行時是正常的,但參與到系統(tǒng)聯(lián)調(diào)時卻無法使用?!?肖恒宇說,團隊成員通宵達旦排查原因,仍無頭緒。
肖恒宇想到化學(xué)設(shè)備和機械臂均使用了紅外探測設(shè)備,可能會互相干擾。于是,他將機械臂換一個朝向,解決了問題。
在往后的開發(fā)調(diào)試中,不同領(lǐng)域的儀器設(shè)備,不同系統(tǒng)的程序通訊間,都出現(xiàn)了類似的“磨合”難題,團隊通過交叉學(xué)科思維,將它們逐一擊破。
面對的問題越復(fù)雜,就越考驗跨學(xué)科的思考能力。令江俊欣慰地是,團隊成員在面臨技術(shù)難題時,從不擺爛,從不應(yīng)付交差。一個方案受挫,他們集智攻關(guān),敢于突破,大膽創(chuàng)新、反復(fù)測試,在不斷地挫折和失敗中汲取經(jīng)驗。
計劃三至五年建成機器化學(xué)家大科學(xué)裝置
一般,人們通過“望聞問切”就可以了解實驗進展情況,比如奇怪的味道、不同的顏色,但機器人不能實時判斷出這些變化。這也是江俊團隊正在攻克的難題:用現(xiàn)代化手段賦予機器人物質(zhì)級別的感知能力。
何謂物質(zhì)級別感知能力?“簡單來說,就是增強機器人攝像頭‘本領(lǐng)’——既有紅外視覺又有可見光視覺,使得機器人可以識別出顏色變化;此外,還可以加上光譜。科研人員根據(jù)光譜變化,進而了解實驗中微觀物質(zhì)演化情況?!苯〗忉尅?/p>
對于未來,江俊希望他們可以建成一個機器化學(xué)家大科學(xué)裝置:在一整棟大樓里,布置上百個機器人、上千個智能化學(xué)工作站。一邊,全國的化學(xué)家、材料學(xué)家只需在網(wǎng)上提交自己的任務(wù);另一邊,團隊成員通過智能操作系統(tǒng)分時安排機器人完成任務(wù),最后將方案反饋給化學(xué)家們。
值得一提的是,基于這樣一個大平臺,不僅可以讓各個課題組的實驗數(shù)據(jù)交匯、共享,產(chǎn)生海量數(shù)據(jù),實現(xiàn)自動提煉出數(shù)字化的知識圖譜和人工智能的模型,進而指導(dǎo)機器人自動優(yōu)化產(chǎn)生更好、更高效率的化學(xué)品或新材料。而且在完成各個實驗過程中,機器人通過與科研人員互動,默默學(xué)習(xí)人類的操作邏輯、思維模式,可能在若干年之后,機器人有望變成一個真正智能、創(chuàng)造力比肩大學(xué)教授的機器化學(xué)家。
“我們希望爭取到國家的支持,在2至3年內(nèi)建成擁有幾十臺機器人的小型裝置,3至5年后建成一個大科學(xué)裝置。在這期間,我們還需要不斷訓(xùn)練機器人和智能化學(xué)通用模型?!苯∫?guī)劃著未來的研究藍圖。他們最終目標是改變傳統(tǒng)化學(xué)研究范式,解放化學(xué)家雙手。
近年來,各種交叉學(xué)科、各種新技術(shù)層出不窮,常常給人帶來一種錯覺,似乎各種知識都要抓緊學(xué)習(xí)。對此,結(jié)合自己的研究經(jīng)歷和體會,江俊建議青年學(xué)者首先保證“基礎(chǔ)寬厚實”,其后要“涉獵廣泛”。
“從開發(fā)機器化學(xué)家這套系統(tǒng)來看,我發(fā)現(xiàn)始終是底層的物理化學(xué)規(guī)則最重要。所以剛開始不要著急,先把本專業(yè)知識點學(xué)扎實、邏輯理清楚,然后適時地把其他專業(yè)內(nèi)容嫁接過來。”因此,江俊認為青年學(xué)者既要開放式思維做交叉科學(xué),但同時一定要保證精通自己的專業(yè)內(nèi)容。此外,他建議,一定要多相信年輕人,讓他們嘗試有挑戰(zhàn)的大課題。
聲明:化學(xué)加刊發(fā)或者轉(zhuǎn)載此文只是出于傳遞、分享更多信息之目的,并不意味認同其觀點或證實其描述。若有來源標注錯誤或侵犯了您的合法權(quán)益,請作者持權(quán)屬證明與本網(wǎng)聯(lián)系,我們將及時更正、刪除,謝謝。 電話:18676881059,郵箱:gongjian@huaxuejia.cn