本發(fā)明涉及一種逆向設(shè)計納米粒子自組裝結(jié)構(gòu)相界線的計算方法。
背景技術(shù):
1、納米粒子(nps)的自組裝在通過自底而上的方法制造復(fù)雜功能超材料方面具有巨大的潛力。在納米粒子自組裝系統(tǒng)中,這些組裝體的有序結(jié)構(gòu)由大小、形狀、組成、nps的相互作用和環(huán)境條件決定的。
2、在納米粒子自組裝系統(tǒng)模擬中,通過引入多個自由參數(shù)以表征納米顆粒的自組裝系統(tǒng),可以發(fā)現(xiàn)豐富的自組裝結(jié)構(gòu)。然而,獨立參數(shù)的增加擴大了參數(shù)空間,使得手動搜索目標(biāo)結(jié)構(gòu)的穩(wěn)定區(qū)域(相界線)既耗時又乏味,從而使新的自組裝結(jié)構(gòu)的發(fā)現(xiàn)復(fù)雜化。
3、趙等人(acs?macro?lett.2021,10,598-602)基于主動機器學(xué)習(xí)自主構(gòu)建嵌段聚合物相圖,雖然主動學(xué)習(xí)模型能夠高效繪制相圖,但是仍然需要小樣本的數(shù)據(jù)集初始化模型,同時該模型主要用于繪制相圖,當(dāng)我們的關(guān)注點在某一種結(jié)構(gòu)的相區(qū)時,該方法并不夠有效,另外,該模型中結(jié)構(gòu)的自動標(biāo)注并沒有使用更為通用的標(biāo)準(zhǔn)。
4、如何開發(fā)一個強大的逆向設(shè)計方案來高效地繪制納米粒子自組裝系統(tǒng)中所需目標(biāo)結(jié)構(gòu)的相界線是目前亟需解決的技術(shù)問題。
技術(shù)實現(xiàn)思路
1、(1)要解決的技術(shù)問題
2、本發(fā)明針對目前自組裝結(jié)構(gòu)相區(qū)繪制技術(shù)成本高、效率低的缺陷,提供了一種逆向設(shè)計納米粒子自組裝結(jié)構(gòu)相界線的計算方法。本發(fā)明結(jié)合計算機模擬、機器學(xué)習(xí)和全局優(yōu)化算法高效地獲取復(fù)雜自組裝系統(tǒng)目標(biāo)結(jié)構(gòu)的形成條件并繪制目標(biāo)結(jié)構(gòu)的相界線。本發(fā)明通過實驗經(jīng)驗結(jié)構(gòu)和數(shù)學(xué)模型設(shè)計候選結(jié)構(gòu)作為數(shù)據(jù)集,加速了新結(jié)構(gòu)的發(fā)現(xiàn),所需的“實驗”成本和“實驗”時間大大減少。
3、(2)技術(shù)方案
4、本發(fā)明主要是通過以下技術(shù)方案解決上述技術(shù)問題的。
5、本發(fā)明提供了一種逆向設(shè)計納米粒子界面自組裝結(jié)構(gòu)的計算方法,其包括:
6、一候選目標(biāo)結(jié)構(gòu)的構(gòu)建模塊,用于通過實驗?zāi)M輸出的經(jīng)驗結(jié)構(gòu)數(shù)據(jù)集和滿足數(shù)學(xué)幾何方程的結(jié)構(gòu)數(shù)據(jù)集構(gòu)建候選結(jié)構(gòu)數(shù)據(jù)集;
7、一納米粒子自組裝模擬模塊,采用蒙特卡洛模擬二元納米粒子界面自組裝系統(tǒng);
8、一結(jié)構(gòu)相似度預(yù)測模塊,采用卷積神經(jīng)網(wǎng)絡(luò)(cnn)作為代理模型實現(xiàn)目標(biāo)結(jié)構(gòu)與搜索結(jié)構(gòu)之間的相似度度量;
9、一目標(biāo)結(jié)構(gòu)優(yōu)化結(jié)果輸出模塊,以自組裝系統(tǒng)的自由參數(shù)為參數(shù)空間,指定一種候選結(jié)構(gòu)作為模擬的初始化結(jié)構(gòu),在參數(shù)空間中采用bo算法優(yōu)化cnn代理模型構(gòu)建的相似度函數(shù),循環(huán)迭代直至適應(yīng)度函數(shù)接近1.0;所優(yōu)化的相似度函數(shù)為:
10、
11、其中,ω表示參數(shù)搜索空間,ptarget(x)為cnn模型在自由參數(shù)向量x處的目標(biāo)結(jié)構(gòu)的預(yù)測概率分量。
12、本發(fā)明適用于自由參數(shù)復(fù)雜的二元納米粒子的自組裝實驗或模擬,特別在模擬計算體系中,更容易實現(xiàn)該系統(tǒng)的自動化;另外,還可以用于解決目標(biāo)結(jié)構(gòu)二維或三維相界線的繪制,對于可以獲得衍射圖案的模擬體系,cnn是通用性的預(yù)測和分類代理模型。
13、本發(fā)明中,候選結(jié)構(gòu)數(shù)據(jù)集一方面來自本領(lǐng)域中已有的經(jīng)驗結(jié)構(gòu),除此之外,候選結(jié)構(gòu)的設(shè)計基于二維兩硬盤三角形堆積方程,求解該方程可獲得大量二元納米粒子自組裝結(jié)構(gòu)排列,根據(jù)數(shù)學(xué)領(lǐng)域的總結(jié),可以直接構(gòu)建這些有序排列結(jié)構(gòu)的粒子坐標(biāo)作為候選結(jié)構(gòu)數(shù)據(jù)集。
14、本發(fā)明中,衍射圖案的構(gòu)建為本領(lǐng)域常規(guī)的計算方法,一般是指定固定的盒子大小,基于以下公式獲得:
15、
16、其中密度的傅里葉變換,ri是粒子i的位置,v是波矢量,v由以下公式?jīng)Q定:
17、
18、其中,nx和ny是區(qū)間中的兩個整數(shù)[-64,64],l是盒子的長度和寬度,本工作中考慮的衍射圖樣建立在128×128網(wǎng)格上。
19、本發(fā)明中所使用的bo算法是優(yōu)化算法中常用的算法,該算法能夠在較短的迭代步數(shù)內(nèi)收斂的目標(biāo)結(jié)構(gòu)的穩(wěn)定區(qū)域,采集函數(shù)使用常用的lcb采集函數(shù)。
20、本發(fā)明中,分別在二維和三維參數(shù)空間中對目標(biāo)結(jié)構(gòu)進行搜索,bo算法的樣本采樣一般是在指定的參數(shù)空間中根據(jù)參數(shù)空間維度建立參數(shù)向量;自由參數(shù)可以為上述自組裝模型中的ε和χ或者引入更多的自由參數(shù)組成。
21、本發(fā)明中,根據(jù)本領(lǐng)域逆向設(shè)計常規(guī),需要設(shè)計一個描述搜索樣本結(jié)構(gòu)與目標(biāo)結(jié)構(gòu)相似程度的優(yōu)化函數(shù),采用兩種納米粒子分開計算的衍射圖案來訓(xùn)練cnn代理模型作為評價相似度的函數(shù),搜索樣本結(jié)構(gòu)與目標(biāo)結(jié)構(gòu)的相似度程度越高,cnn將給出更接近1.0的預(yù)測。
22、本發(fā)明中,優(yōu)化算法的迭代終止條件是相似度預(yù)測小于10-4且5個迭代步數(shù)后終止或迭代次數(shù)到達50次。
23、本發(fā)明中主動學(xué)習(xí)模型使用標(biāo)簽傳播算法為常規(guī)的圖分類算法,最小自信法為優(yōu)選的不確定采樣方法,具體的算法流程如下:
24、首先將參數(shù)空間劃分為一個有限網(wǎng)格,其中所有格點構(gòu)成采樣集g。lpa根據(jù)標(biāo)記的樣本,對參數(shù)空間中的所有樣本點進行分類。具體來說,我們使用從逆向搜索中獲得的收斂樣本作為初始采樣點。我們用向量p=[α,β,……]表示一個樣本點分屬不同結(jié)構(gòu)的概率分布,lpa將推導(dǎo)出參數(shù)空間位置x處所有未檢查點的標(biāo)記相p的概率分布p(g,p)。p(g,p)用于通過邊緣抽樣估計器計算不確定性分?jǐn)?shù)s(g),不確定性分?jǐn)?shù)最大的樣本將作為下一個采樣樣本,接下來通過模擬模塊獲得樣本結(jié)構(gòu)并使用cnn模型標(biāo)記該結(jié)構(gòu),假設(shè)樣本結(jié)構(gòu)與目標(biāo)結(jié)構(gòu)一致,則標(biāo)記為1,除此之外的任何其它結(jié)構(gòu)將全部被標(biāo)記為2(非目標(biāo)結(jié)構(gòu)),這將算法改進為適用于目標(biāo)結(jié)構(gòu)相區(qū)的繪制。重復(fù)上述步驟,直到相界線預(yù)測不再發(fā)生改變。
1.一種逆向設(shè)計納米粒子自組裝結(jié)構(gòu)相界線的計算方法,其特征在于,其包括:
2.根據(jù)權(quán)利要求1所述的計算方法,其特征在于,所述候選結(jié)構(gòu)數(shù)據(jù)集的構(gòu)建包括:一方面,基于模擬實驗獲得大量穩(wěn)定結(jié)構(gòu)的坐標(biāo)文件;另一方面,基于粒子排列規(guī)則構(gòu)建潛在的候選新結(jié)構(gòu);通常,由于結(jié)構(gòu)穩(wěn)定域不一致,每種結(jié)構(gòu)的數(shù)據(jù)數(shù)量并不一致,為了保證cnn模型訓(xùn)練的效果,每種結(jié)構(gòu)的數(shù)據(jù)按照數(shù)據(jù)數(shù)量最多的結(jié)構(gòu)進行復(fù)制。
3.根據(jù)權(quán)利要求2所述的計算方法,其特征在于,在納米粒子自組裝體系中,粒子排列滿足一定的規(guī)則,規(guī)則可以是公認(rèn)規(guī)范,如晶胞的點群和晶系描述,也可以基于單純的數(shù)學(xué)幾何方程,甚至可以是生成模型。
4.根據(jù)權(quán)利要求2所述的計算方法,其特征在于,通過數(shù)學(xué)幾何方程設(shè)計新的候選結(jié)構(gòu)有助于在搜索過程中發(fā)現(xiàn)參數(shù)空間中潛在的新結(jié)構(gòu)。
5.根據(jù)權(quán)利要求1所述的計算方法,其特征在于,納米粒子自組裝體系采用常用的模擬方法,包括蒙特卡洛模擬、分子動力學(xué)模擬等。
6.根據(jù)權(quán)利要求1所述的計算方法,其特征在于,cnn代理模型基于候選結(jié)構(gòu)數(shù)據(jù)集構(gòu)建;首先將納米粒子的三維坐標(biāo)投射到二維平面上,然后基于傅里葉變換將實空間粒子坐標(biāo)投射到倒空間以獲得衍射圖案。
7.根據(jù)權(quán)利要求1所述的計算方法,其特征在于,所述自由參數(shù)為兩個及以上的描述自組裝系統(tǒng)的熱力學(xué)或粒子屬性的相互作用參數(shù)等任意有研究意義的體系參數(shù),參數(shù)向量是由自由參數(shù)所構(gòu)成的參數(shù)空間中的樣本點。
8.根據(jù)權(quán)利要求1所述的計算方法,其特征在于,全局優(yōu)化算法所優(yōu)化的相似度函數(shù)為:
9.根據(jù)權(quán)利要求1所述的計算方法,其特征在于,所述全局優(yōu)化算法為貝葉斯優(yōu)化算法(bo)。
10.根據(jù)權(quán)利要求1所述的計算方法,其特征在于,主動學(xué)習(xí)中所述圖算法為標(biāo)簽傳播算法(lpa),采樣方法為最小自信法(lc),主動學(xué)習(xí)的原理主要是:
11.根據(jù)權(quán)利要求9所述的計算方法,其特征在于,lpa的初始化使用逆向搜索的收斂樣本作為初始化樣本,無需小批量經(jīng)驗樣本數(shù)據(jù)集。
12.根據(jù)權(quán)利要求9所述的計算方法,其特征在于,lpa的結(jié)構(gòu)標(biāo)記分為目標(biāo)結(jié)構(gòu)和非目標(biāo)結(jié)構(gòu)。
13.根據(jù)權(quán)利要求9所述的計算方法,其特征在于,lpa的結(jié)構(gòu)標(biāo)記使用訓(xùn)練好的cnn代理模型來進行判別。cnn代理模型有兩個作用,一是在逆向搜索中作為優(yōu)化函數(shù)。二是在主動學(xué)習(xí)中完成樣本的自動標(biāo)注。