本發(fā)明涉及新材料設計,特別涉及一種基于電子結構的材料設計方法、裝置、設備及存儲介質。
背景技術:
1、在進行材料科學的高通量篩選時,迅速設計出大量具備目標特性的候選分子是至關重要的一步。目前可以通過計算模擬、模型預測與實驗驗證的緊密結合,形成一個新材料探索的完整閉環(huán),從而實現(xiàn)快速迭代和高性能材料的發(fā)現(xiàn)。生成穩(wěn)定且高效的候選分子結構,不僅能顯著減少計算模擬、模型預測及實驗驗證所需的資源投入,還能降低新材料開發(fā)的復雜性。因此,高效且精準的分子設計方法在加速材料創(chuàng)新和優(yōu)化研發(fā)流程中具有至關重要的作用。
2、目前,人工智能方法極大促進了新材料的研發(fā)發(fā)展,特別是在候選分子生成以及材料的關鍵屬性預測方面取得了重要進展。在ai加持的新材料分子設計過程中,通常采用生成式模型進行候選分子生成。語言模型clm、自編碼模型vae、對抗生成模型gan、擴散模型等深度學習模型都被證明能夠可靠地生成大量新的有機分子。在生成新分子時,通常采用的方法是使用具有目標屬性的分子對預訓練模型進行微調,少數(shù)方法通過直接對模型輸入候選分子屬性或者基團作為條件約束進行分子生成?;谏鲜龇椒ǖ膫鹘y(tǒng)候選分子生成方法僅僅通過幾何結構信息的學習作為新分子設計的依據(jù),一般在生物醫(yī)學分子設計時能夠滿足需求。然而,在生成光電材料等具有復雜電子結構的候選分子時,要求候選分子的電子結構必須滿足特定條件,否則不能表現(xiàn)出目標性質,而傳統(tǒng)的分子生成方法僅關注幾何結構而忽略電子結構,往往難以勝任光電材料領域的設計和研發(fā)。
3、可見,現(xiàn)有技術還有待改進和提高。
技術實現(xiàn)思路
1、鑒于上述現(xiàn)有技術的不足之處,本發(fā)明的目的在于提供一種基于電子結構的材料設計方法、裝置、設備及存儲介質,旨在解決現(xiàn)有的分子設計方法不適用于設計具有復雜電子結構的光電材料。
2、為了達到上述目的,本發(fā)明采取了以下技術方案:
3、本發(fā)明第一方面提供一種基于電子結構的材料設計方法,包括如下步驟:獲取多個現(xiàn)有分子結構,采用量子化學計算方法,計算現(xiàn)有分子結構的前線分子軌道的電子分布,以獲得分子結構信息數(shù)據(jù)集;基于分子內基團相互作用關系,根據(jù)分子結構信息數(shù)據(jù)集構建跨模態(tài)信息提取模型;獲取目標分子的三維幾何結構,采用跨模態(tài)信息提取模型,根據(jù)目標分子的三維幾何結構計算目標分子的跨模態(tài)信息,將獲得的跨模態(tài)信息整合至分子結構信息數(shù)據(jù)集;根據(jù)分子結構信息數(shù)據(jù)集構建分子生成模型,獲取待預測目標材料的分子信息,采用分子生成模型根據(jù)待預測目標材料的分子信息進行預測,以獲得目標材料分子。
4、可選的,在本發(fā)明第一方面的第一種實現(xiàn)方式中,所述獲取多個現(xiàn)有分子結構,采用量子化學計算方法,計算現(xiàn)有分子結構的前線分子軌道的電子分布,以獲得分子結構信息數(shù)據(jù)集,具體包括:獲取多個有機分子的三維坐標結構信息,采用量子化學計算方法,為每個有機分子計算前線分子軌道中的電荷分布,根據(jù)計算結果為有機分子的每個原子建立標簽,以獲得分子結構信息數(shù)據(jù)集。
5、可選的,在本發(fā)明第一方面的第二種實現(xiàn)方式中,所述基于分子內基團相互作用關系,根據(jù)分子結構信息數(shù)據(jù)集構建跨模態(tài)信息提取模型,具體包括:設置第一模塊,所述第一模塊用于提取分子三維幾何結構中每個原子的累積特征;設置第二模塊,所述第二模塊用于根據(jù)每個原子的累積特征計算每個原子的電子結構信息;將第一模塊和第二模塊進行整合,獲得基礎模型;采用分子結構信息數(shù)據(jù)集對基礎模型的預測結果進行驗證,根據(jù)驗證結果對基礎模型進行優(yōu)化,獲得跨模態(tài)信息提取模型。
6、可選的,在本發(fā)明第一方面的第三種實現(xiàn)方式中,所述設置第一模塊,所述第一模塊用于提取分子三維幾何結構中每個原子的累積特征,具體包括:設置多層級采樣結構,用于根據(jù)分子三維幾何結構獲取元素信息以及多層級集合采樣結果;設置幾何結構特征提取模型,用于根據(jù)元素信息以及多層級集合采樣結果計算多層級原子特征;設置多層級特征累積模型,用于根據(jù)多層級原子特征計算每個原子的累積特征。
7、可選的,在本發(fā)明第一方面的第四種實現(xiàn)方式中,所述設置第二模塊,所述第二模塊用于根據(jù)每個原子的累積特征計算每個原子的電子結構信息,具體包括:設置基團間注意力交互子模型,用于根據(jù)每個原子的累積特征計算得到每個原子的全局交互特征;設置電子結構分布輸出模型,用于根據(jù)每個原子的全局交互特征,計算每個原子的電子結構預測結果。
8、可選的,在本發(fā)明第一方面的第五種實現(xiàn)方式中,所述獲取目標分子的三維幾何結構,采用跨模態(tài)信息提取模型,根據(jù)目標分子的三維幾何結構計算目標分子的跨模態(tài)信息,將獲得的跨模態(tài)信息整合至分子結構信息數(shù)據(jù)集,具體包括:基于跨模態(tài)信息提取模型生成多個分別針對不同前線分子軌道的電子分布預測模型;獲取目標分子的三維幾何結構,采用多個分別針對不同前線分子軌道的電子分布預測模型,根據(jù)目標分子的三維幾何結構進行預測,以分別獲得多個針對每個原子的前線分子軌道電荷分布預測值;按照數(shù)值大小對多個前線分子軌道電荷分布預測值進行排序,以數(shù)值最大的一個或多個原子作為目標分子的前線分子軌道的中心分布原子;提取與所述中心分布原子對應的全局交互特征,將中心分布原子的前線分子軌道電荷分布預測值與全局交互特征進行合并,得到跨模態(tài)信息,將獲得的跨模態(tài)信息整合至分子結構信息數(shù)據(jù)集。
9、可選的,在本發(fā)明第一方面的第六種實現(xiàn)方式中,所述根據(jù)分子結構信息數(shù)據(jù)集構建分子生成模型,獲取待預測目標材料的分子信息,采用分子生成模型根據(jù)待預測目標材料的分子信息進行預測,以獲得目標材料分子,具體包括:采用分子結構信息數(shù)據(jù)集以及已知材料的分子信息構建初始模型,所述已知材料的分子信息包括分子骨架、基團結構或理化性質,采用初始模型生成預測分子描述符;將分子結構信息數(shù)據(jù)集所對應的分子三維幾何結構進行格式轉換,獲得目標分子描述符,計算所述目標分子描述符與預測分子描述符之間的損失值,采用損失值對初始模型進行訓練,獲得分子生成模型;獲取待預測目標材料的分子信息,采用分子生成模型根據(jù)待預測目標材料的分子信息進行預測,以獲得目標材料分子。
10、本發(fā)明第二方面提供一種基于電子結構的材料設計裝置,包括:第一計算模塊,用于獲取多個現(xiàn)有分子結構,采用量子化學計算方法,計算現(xiàn)有分子結構的前線分子軌道的電子分布,以獲得分子結構信息數(shù)據(jù)集;第一構建模塊,用于基于分子內基團相互作用關系,根據(jù)分子結構信息數(shù)據(jù)集構建跨模態(tài)信息提取模型;第二計算模塊,用于獲取目標分子的三維幾何結構,采用跨模態(tài)信息提取模型,根據(jù)目標分子的三維幾何結構計算目標分子的跨模態(tài)信息,將獲得的跨模態(tài)信息整合至分子結構信息數(shù)據(jù)集;第二構建模塊,用于根據(jù)分子結構信息數(shù)據(jù)集構建分子生成模型,獲取待預測目標材料的分子信息,采用分子生成模型根據(jù)待預測目標材料的分子信息進行預測,以獲得目標材料分子。
11、本發(fā)明第三方面提供一種基于電子結構的材料設計設備,包括存儲器和至少一個處理器,所述存儲器中存儲有計算機可讀指令;所述至少一個處理器調用所述存儲器中的所述計算機可讀指令,以執(zhí)行如上所述基于電子結構的材料設計方法的各個步驟。
12、本發(fā)明第四方面提供一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機可讀指令所述計算機可讀指令被處理器執(zhí)行時實現(xiàn)如上所述基于電子結構的材料設計方法的各個步驟。
13、有益效果:本發(fā)明提供了一種基于電子結構的材料設計方法,所述基于電子結構的材料設計方法先通過獲取多個現(xiàn)有分子結構,采用量子化學計算方法,計算現(xiàn)有分子結構的前線分子軌道的電子分布,以獲得分子結構信息數(shù)據(jù)集;然后通過基于分子內基團相互作用關系,根據(jù)分子結構信息數(shù)據(jù)集構建跨模態(tài)信息提取模型并進一步獲得分子結構信息數(shù)據(jù)集;通過引入前線分子軌道理論,為新分子生成與模型的迭代優(yōu)化提供更高的可解釋性與理論依據(jù),最后根據(jù)分子結構信息數(shù)據(jù)集構建分子生成模型用于預測新的材料分子,確保了生成的新分子在生成過程中遵循所需的電子結構特性,從而具備預期的目標性質。