谷歌旗下的AI研究機構DeepMind在全球頂級學術期刊《Nature》上發布了一篇論文,通過深度學習、計算機視覺、大數據等,開發了一個名為GNoME的圖神經網絡模型,主要用于材料發現。
研究團隊通過GnoME便快速發現了220萬個新的材料晶體結構,其中很多結構是人類預測和公式難以發現的,相較于傳統的材料開發方法效率提升了10倍。
論文地址:https://www.nature.com/articles/s41586-023-06735-9
長期以來,研發新材料一直面臨高成本、低效率的難題。實驗合成法費時費力,成功率低下;
第一性原理計算指導的材料發現也受限于算力問題,難以做到全面高效的材料空間遍歷。
谷歌DeepMind開發的深度學習模型AlphaFold在蛋白質結構預測領域,已經展現出了巨大應用潛力并已經獲得全球多家著名實驗室的應用。
因此,研究人員希望可以借助深度學習,處理復雜的材料結構數據,開發一個像“AlphaFold”一樣的高效開發系統。
簡單來說,可以把GNoME看成材料發現界的“AlphaFold”模型,同時證明了海量的第一性原理計算為模型學習原子間勢提供了支持,并實現了之前從未有過的精度和泛化能力。
GNoME是一個圖神經網絡,通過表示晶體的拓撲連接、消息傳遞等機制,實現結構到能量的映射。該系統集成了多個模塊,實現從候選結構的生成到深度學習預測的全流程自動化。
GNoME的主要技術創新點在于構建了一個 Flywheel主動學習循環系統:模型過濾得到的候選材料用第一性原理計算驗證,新數據反過來提升模型性能,二者之間形成閉環互補不斷地提升能力。
也就是說,GNoME發現的材料越多,整個模型的能力也就越強,而整個訓練流程全部由AI自動完成。
發現方式流程是,研究團隊首先基于公開材料數據庫訓練出初始的結構評價模型,然后利用該模型對數十億候選結構進行快速過濾,選擇特定數量送入第一性原理計算。
計算所得精確能量既驗證了模型預測,也為進一步增強模型提供了豐富數據。新一輪使用數據庫和計算數據重新訓練的模型則可實現更高效更準確的材料發現。
數據顯示,隨著每輪訓練數據量的積累,模型預測性能持續改善,材料發現效率也呈指數級提高。6輪迭代后,模型精度達到每個原子11meV,穩定結構篩選精確率超過80%。
超大規模的訓練數據集也是訓練GNoME的關鍵。GNoME所用的數據規模也刷新了計算材料領域的記錄。
包括公開數據庫、迭代計算以及模型生成,GNoME的訓練數據總量超過1億組,涵蓋100多萬種組成,是目前最大的計算材料數據集。
海量數據使得深度學習模型可以不斷調優提升,尤其是對發現人類難以預測的新奇材料發揮了巨大作用。
本文素材來源谷歌GNoME論文,如有侵權請聯系刪除
未經允許不得轉載:RPA中國 | RPA全球生態 | 數字化勞動力 | RPA新聞 | 推動中國RPA生態發展 | 流 > 谷歌用AI模型發現220萬種新材料,研究能力超越人類!
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發展洞察(2022)》報告正式發布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產業共進,第四屆ISIG中國產業智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業研究報告》正式發布 | RPA中國