本發(fā)明涉及非線性系統(tǒng)控制,特別是涉及一種具有回流裝置反應(yīng)器的深度神經(jīng)算子控制器構(gòu)建方法。
背景技術(shù):
1、在化學(xué)工程中,塞流管式反應(yīng)器(plug-flow?tubular?reactor)通常裝備有回流(recycle)裝置以提高反應(yīng)效率、轉(zhuǎn)化率以及控制溫度。反應(yīng)器中的蒸汽溫度會(huì)隨位置和時(shí)間變化,回流系統(tǒng)通過(guò)將部分蒸汽重新引入反應(yīng)器來(lái)調(diào)節(jié)溫度,使其符合預(yù)期的工藝要求。其中,反應(yīng)器的流入量由控制器給定,一般而言控制器都具有魯棒性,但是盡管是微小時(shí)滯仍會(huì)對(duì)系統(tǒng)的響應(yīng)速度提出挑戰(zhàn),甚至導(dǎo)致系統(tǒng)不穩(wěn)定,因此有必要對(duì)這種的傳輸效應(yīng)引發(fā)的時(shí)滯進(jìn)行補(bǔ)償控制。目前的時(shí)滯補(bǔ)償控制器主要是通過(guò)數(shù)值求解方法進(jìn)行繁瑣的運(yùn)算獲得,并且該方法的計(jì)算時(shí)間將會(huì)隨著空間采樣精度的提高而爆炸式增長(zhǎng),尤其對(duì)于系統(tǒng)時(shí)滯非恒定的情況,需要額外計(jì)算控制器中進(jìn)行時(shí)滯補(bǔ)償?shù)捻?xiàng)。
2、神經(jīng)網(wǎng)絡(luò)(neural?network,nn)常用于從輸入和輸出中直接逼近某一類函數(shù),而最新的深度算子網(wǎng)絡(luò)(deep?operatornet,deeponet)在前者的基礎(chǔ)上能夠?qū)W習(xí)無(wú)窮維函數(shù)之間的映射,具有更強(qiáng)大的自學(xué)習(xí)能力、非線性映射能力以及對(duì)復(fù)雜動(dòng)態(tài)系統(tǒng)的建模能力。目前,使用深度算子網(wǎng)絡(luò)解決非線性系統(tǒng)的控制問(wèn)題案例,主要集中在處理無(wú)時(shí)滯或時(shí)滯恒定的情況,其學(xué)習(xí)的目標(biāo)為反步法核函數(shù),之后將學(xué)習(xí)到的核函數(shù)用于數(shù)值求解方法計(jì)算控制器增益,是一種間接提高求解效率的方法,但是在時(shí)滯大小隨空間變化情況下,選擇控制器分支、插值以及迭代運(yùn)算仍需要耗費(fèi)大量的計(jì)算時(shí)間。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是提供一種具有回流裝置反應(yīng)器的深度神經(jīng)算子控制器構(gòu)建方法,能夠提高控制器的求解速度。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供了如下方案:
3、一種具有回流裝置反應(yīng)器的深度神經(jīng)算子控制器構(gòu)建方法,包括:
4、基于具有回流功能的塞流管式反應(yīng)器系統(tǒng)模型,構(gòu)建時(shí)滯補(bǔ)償控制器系統(tǒng)模型;
5、根據(jù)所述時(shí)滯補(bǔ)償控制器系統(tǒng)模型確定時(shí)滯函數(shù),將所述時(shí)滯函數(shù)作為深度算子網(wǎng)絡(luò)的輸入,構(gòu)建非線性映射的深度算子網(wǎng)絡(luò);
6、基于切比雪夫多項(xiàng)式生成動(dòng)態(tài)響應(yīng)的初始狀態(tài),從動(dòng)態(tài)響應(yīng)中提取輸入的狀態(tài)函數(shù),并基于所述狀態(tài)函數(shù)確定訓(xùn)練數(shù)據(jù)集;
7、利用所述訓(xùn)練數(shù)據(jù)集對(duì)所述深度算子網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并通過(guò)測(cè)試集驗(yàn)證所述深度算子網(wǎng)絡(luò)能夠鎮(zhèn)定一類由帶有隨空間變化的時(shí)滯偏微分方程pde所描述的分布參數(shù)系統(tǒng),完成深度神經(jīng)算子控制器的構(gòu)建。
8、可選地,所述具有回流功能的塞流管式反應(yīng)器系統(tǒng)模型的函數(shù)表示具體為:
9、
10、x(0,t)=u(t),
11、x(s,0)=x0(s),
12、
13、其中,為無(wú)量綱位置,需要滿足0≤s≤q≤1;狀態(tài)x(s,t)為反應(yīng)器內(nèi)部位置s處、t時(shí)刻的蒸汽溫度,時(shí)滯函數(shù)且:定義
14、
15、其中表示時(shí)滯函數(shù)的最大值,τ'表示時(shí)滯函數(shù)的關(guān)于空間的導(dǎo)數(shù);f(s,q)∈c1[0,1]定義為反應(yīng)器內(nèi)的熱傳遞系數(shù),c(s)∈c1[0,1]表示溫度衰減系數(shù),且c(1)=0;邊界控制器u(t)施加在x(0,t)的位置用于補(bǔ)償空間變化的時(shí)滯;x(0,t)表示反應(yīng)器入口;x(1,t-τ(s))表示回流蒸汽的溫度;x0(s)表示t=0時(shí)刻溫度分布;x(s,h)=0表示在t<0,初始時(shí)間之前,反應(yīng)器溫度為零。
16、可選地,所述時(shí)滯補(bǔ)償控制器系統(tǒng)模型的構(gòu)建過(guò)程包括:
17、基于處理延遲的經(jīng)典思想,首先引入一個(gè)二維的傳輸pde,隱藏狀態(tài)中的時(shí)滯,得到:
18、
19、x(0,t)=u(t),
20、
21、u(s,1,t)=x(1,t),
22、x(s,0)=x0(s),
23、
24、其中,u(s,r)∈l2([0,1]2)表示時(shí)滯狀態(tài)變量,以狀態(tài)變量u構(gòu)建系統(tǒng),其解滿足如下等式:
25、
26、新引入的狀態(tài)u(s,r,t)能夠解耦x(1,t-τ(s))項(xiàng)中的時(shí)滯,由于該級(jí)聯(lián)系統(tǒng)與原始的目標(biāo)系統(tǒng)等價(jià),直接基于pde為所述具有回流功能的塞流管式反應(yīng)器系統(tǒng)模型的原始系統(tǒng)設(shè)計(jì)等效的時(shí)滯補(bǔ)償控制器系統(tǒng)模型;
27、基于反步法為時(shí)滯系統(tǒng)設(shè)計(jì)狀態(tài)反饋,引入仿射volterra積分變換:
28、
29、其中,z(s,t)是穩(wěn)定的目標(biāo)系統(tǒng)的狀態(tài)變量;x(s,t)和u(s,r,t)是原始系統(tǒng)的狀態(tài)變量;k(s,q)是反步法的核函數(shù)系統(tǒng);c(q)表示反應(yīng)器內(nèi)的溫度衰減系數(shù);τ(q)表示隨空間變化的時(shí)滯函數(shù);δ(q)表示脈沖函數(shù);通過(guò)該變換得到如下穩(wěn)定的目標(biāo)系統(tǒng):
30、
31、z(0,t)=0,
32、
33、u(s,1,t)=z(1,t)
34、因此,核函數(shù)應(yīng)當(dāng)滿足如下等式關(guān)系:
35、
36、邊界條件根據(jù)空間位置確定:
37、
38、其中g(shù)(q):=q-τ(q),在q∈[0,1]區(qū)域上的最大值定義為為了保證其反函數(shù)的存在,假設(shè)對(duì)于使得q>τ(q)時(shí),時(shí)滯函數(shù)τ(q)的導(dǎo)數(shù)τ'(q)<1。
39、同時(shí),控制器會(huì)根據(jù)時(shí)滯的幅值產(chǎn)生如下兩個(gè)分支:
40、
41、其中,函數(shù)集
42、可選地,所述深度算子網(wǎng)絡(luò)的結(jié)構(gòu)具體包括:
43、依次連接的分支網(wǎng)絡(luò)和主干網(wǎng)絡(luò);
44、所述分支網(wǎng)絡(luò)包含3個(gè)卷積層,每個(gè)卷積層使用核大小為5,步長(zhǎng)為2的卷積濾波器;所述分支網(wǎng)絡(luò)還包括兩個(gè)全連接層,尺寸分別為1152×512和512×256;由于τ(s)、x(s)和u(s,r)作為分支網(wǎng)絡(luò)的輸入維度不同,因此需要沿著r軸將τ(s)和x(s)擴(kuò)展為2維,并將擴(kuò)充維度的τ(s)和x(s)與在21×21網(wǎng)格上采樣的u(s,r)進(jìn)行堆疊,得到一個(gè)3×21×21的張量作為神經(jīng)算子網(wǎng)絡(luò)的輸入;所述主干網(wǎng)絡(luò)用于在離散空間上對(duì)輸入函數(shù)進(jìn)行編碼,即在(s,r)∈[0,1]2的網(wǎng)格上以空間步長(zhǎng)為0.05采樣,將空間變量轉(zhuǎn)化為一個(gè)高維的特征表示;
45、所述分支網(wǎng)絡(luò)和所述主干網(wǎng)絡(luò)的最后的隱藏層的寬度都為256,因此將兩個(gè)子網(wǎng)絡(luò)的輸出合成一個(gè)新的向量,隨后中間向量再經(jīng)過(guò)多個(gè)全連接層輸出一個(gè)大小為1的標(biāo)量。
46、可選地,所述訓(xùn)練數(shù)據(jù)集的確定方法為:
47、根據(jù)控制器產(chǎn)生的兩個(gè)分支表達(dá)式,得到訓(xùn)練近似該目標(biāo)的神經(jīng)算子的輸入需要包括:時(shí)滯τ(s)、狀態(tài)x(s)和時(shí)滯的狀態(tài)u(s,r);神經(jīng)網(wǎng)絡(luò)的輸入決定了輸出精度的上限,因此對(duì)于控制器的時(shí)滯函數(shù)取自一類切比雪夫多項(xiàng)式,即其中γ1~u[0,8];函數(shù)族表現(xiàn)出顯著的參數(shù)敏感性,多項(xiàng)式的振蕩頻率由γ1控制,通過(guò)使用切比雪夫多項(xiàng)式生成數(shù)據(jù),確保生成的數(shù)據(jù)覆蓋目標(biāo)函數(shù)的多種行為模式;對(duì)于為了滿足假設(shè),定義函數(shù)族其中且γ2~u[0.8,2.4];但是對(duì)于輸入的狀態(tài)變量x(s)和u(s,r),二者展現(xiàn)出相關(guān)性,即狀態(tài)u實(shí)質(zhì)上是x的過(guò)去版本,為了避免在過(guò)大的函數(shù)空間中搜索輸入函數(shù)到控制器之間的非線性映射,減少數(shù)據(jù)集的規(guī)模,通過(guò)由初始系統(tǒng)狀態(tài)x0受到解析控制器u(t)作用的軌跡中提取不同時(shí)刻的兩個(gè)狀態(tài)變量x(s,ti),u(s,r,ti),其中i=1,2,3,…,具體而言,對(duì)于任意由切比雪夫多項(xiàng)式隨機(jī)生成的一組(x0,τ),都通過(guò)控制器產(chǎn)生關(guān)于狀態(tài)x的動(dòng)態(tài)響應(yīng)軌跡,將t∈[0,12]的軌跡根據(jù)時(shí)間步長(zhǎng)δt取出不同時(shí)刻的兩種狀態(tài),并結(jié)合時(shí)滯函數(shù)構(gòu)成一組輸入(τ,x,u),得到所述訓(xùn)練數(shù)據(jù)集。
48、可選地,利用所述訓(xùn)練數(shù)據(jù)集對(duì)所述深度算子網(wǎng)絡(luò)進(jìn)行訓(xùn)練的過(guò)程中,經(jīng)過(guò)250個(gè)epoch后,測(cè)試誤差為5.89e-4。
49、可選地,利用所述訓(xùn)練數(shù)據(jù)集對(duì)所述深度算子網(wǎng)絡(luò)進(jìn)行訓(xùn)練的過(guò)程中,將平滑l1范數(shù)作為損失函數(shù)。
50、根據(jù)本發(fā)明提供的具體實(shí)施例,本發(fā)明公開(kāi)了以下技術(shù)效果:
51、本發(fā)明公開(kāi)了一種具有回流裝置反應(yīng)器的深度神經(jīng)算子控制器構(gòu)建方法,所述方法包括基于具有回流功能的塞流管式反應(yīng)器系統(tǒng)模型,構(gòu)建時(shí)滯補(bǔ)償控制器系統(tǒng)模型;根據(jù)所述時(shí)滯補(bǔ)償控制器系統(tǒng)模型確定時(shí)滯函數(shù),將所述時(shí)滯函數(shù)作為深度算子網(wǎng)絡(luò)的輸入,構(gòu)建非線性映射的深度算子網(wǎng)絡(luò);基于切比雪夫多項(xiàng)式生成動(dòng)態(tài)響應(yīng)的初始狀態(tài),從動(dòng)態(tài)響應(yīng)中提取輸入的狀態(tài)函數(shù),并基于所述狀態(tài)函數(shù)確定訓(xùn)練數(shù)據(jù)集;利用所述訓(xùn)練數(shù)據(jù)集對(duì)所述深度算子網(wǎng)絡(luò)進(jìn)行訓(xùn)練。經(jīng)測(cè)試集驗(yàn)證,本發(fā)明能夠在保證控制精度的情況下,提高控制器的求解速度。