本發(fā)明涉及空氣制水,尤其涉及一種基于氣象大數(shù)據(jù)的空氣制水量智能預(yù)測(cè)調(diào)節(jié)方法及系統(tǒng)。
背景技術(shù):
1、空氣制水技術(shù)是一種從空氣中提取水分的創(chuàng)新技術(shù),通過制冷凝結(jié)原理將空氣中的水蒸氣轉(zhuǎn)化為液態(tài)水,在缺水地區(qū)供水、應(yīng)急救災(zāi)等領(lǐng)域具有重要應(yīng)用價(jià)值??諝庵扑手饕墉h(huán)境溫度、相對(duì)濕度等氣象因素影響,合理預(yù)測(cè)和調(diào)節(jié)制水參數(shù)對(duì)提高制水效率具有重要意義;
2、目前,空氣制水系統(tǒng)通常采用基于經(jīng)驗(yàn)規(guī)則的固定參數(shù)控制方案,或使用簡(jiǎn)單的反饋控制策略進(jìn)行參數(shù)調(diào)節(jié),隨著氣象監(jiān)測(cè)技術(shù)和人工智能技術(shù)的發(fā)展嘗試將機(jī)器學(xué)習(xí)方法應(yīng)用于制水參數(shù)優(yōu)化,以提高系統(tǒng)效率。
3、然而,現(xiàn)有的空氣制水控制方法仍存在依賴單一氣象數(shù)據(jù)源進(jìn)行預(yù)測(cè),未能充分利用多源氣象數(shù)據(jù)的互補(bǔ)性,導(dǎo)致預(yù)測(cè)精度受限以及對(duì)于極端天氣等異常工況的適應(yīng)性較差等問題;
4、因此,亟需一種方案解決現(xiàn)有技術(shù)中存在的問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明實(shí)施例提供一種基于氣象大數(shù)據(jù)的空氣制水量智能預(yù)測(cè)調(diào)節(jié)方法及系統(tǒng),至少能解決現(xiàn)有技術(shù)中存在的部分問題。
2、本發(fā)明實(shí)施例的第一方面,提供一種基于氣象大數(shù)據(jù)的空氣制水量智能預(yù)測(cè)調(diào)節(jié)方法,包括:
3、通過氣象傳感器采集氣象監(jiān)測(cè)數(shù)據(jù)并進(jìn)行標(biāo)準(zhǔn)化處理生成標(biāo)準(zhǔn)化氣象特征矩陣,通過時(shí)序分解提取周期性特征向量和趨勢(shì)性特征向量并構(gòu)建增強(qiáng)特征空間;
4、構(gòu)建遷移跨域?qū)W習(xí)網(wǎng)絡(luò)并將制冷空調(diào)領(lǐng)域和氣象預(yù)報(bào)領(lǐng)域的預(yù)訓(xùn)練模型知識(shí)通過知識(shí)遷移算法添加至空氣制水預(yù)測(cè)任務(wù)中,結(jié)合知識(shí)蒸餾將多個(gè)源域的專家知識(shí)融合至深度神經(jīng)網(wǎng)絡(luò)中;
5、基于所述增強(qiáng)特征空間,結(jié)合反向傳播算法訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)并輸出未來一天內(nèi)逐小時(shí)的預(yù)測(cè)制水量,將預(yù)測(cè)制水量作為狀態(tài)空間的輸入并配置動(dòng)作空間,根據(jù)制水效率和能耗比構(gòu)建獎(jiǎng)勵(lì)函數(shù),基于狀態(tài)空間、動(dòng)作空間和獎(jiǎng)勵(lì)函數(shù)構(gòu)建深度強(qiáng)化學(xué)習(xí)模型;
6、通過元學(xué)習(xí)自適應(yīng)框架動(dòng)態(tài)調(diào)整深度強(qiáng)化學(xué)習(xí)模型的網(wǎng)絡(luò)結(jié)構(gòu)并通過對(duì)抗樣本生成器構(gòu)建極端氣象工況對(duì)應(yīng)的訓(xùn)練樣本,基于所述訓(xùn)練樣本優(yōu)化所述深度強(qiáng)化學(xué)習(xí)模型得到候選制水參數(shù)控制策略集,基于所述候選制水參數(shù)控制策略集執(zhí)行制水過程并設(shè)置優(yōu)化目標(biāo);
7、通過多目標(biāo)貝葉斯優(yōu)化器進(jìn)行聯(lián)合優(yōu)化,生成帕累托最優(yōu)解集并通過基于置信邊界的動(dòng)態(tài)決策算法選擇最優(yōu)控制參數(shù),基于最優(yōu)控制參數(shù)動(dòng)態(tài)調(diào)整所述深度強(qiáng)化學(xué)習(xí)模型的更新步長(zhǎng)得到最優(yōu)制水策略。
8、在一種可選的實(shí)施方式中,
9、通過氣象傳感器采集氣象監(jiān)測(cè)數(shù)據(jù)并進(jìn)行標(biāo)準(zhǔn)化處理生成標(biāo)準(zhǔn)化氣象特征矩陣,通過時(shí)序分解提取周期性特征向量和趨勢(shì)性特征向量并構(gòu)建增強(qiáng)特征空間包括:
10、通過氣象傳感器采集氣象監(jiān)測(cè)數(shù)據(jù),對(duì)所述氣象監(jiān)測(cè)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,將標(biāo)準(zhǔn)化處理后的氣象監(jiān)測(cè)數(shù)據(jù)按照時(shí)間序列排列生成標(biāo)準(zhǔn)化氣象特征矩陣;
11、對(duì)所述標(biāo)準(zhǔn)化氣象特征矩陣進(jìn)行時(shí)序分解,通過構(gòu)建軌跡矩陣并進(jìn)行奇異值分解,并將所述標(biāo)準(zhǔn)化氣象特征矩陣分解為周期分量和趨勢(shì)分量,提取得到所述標(biāo)準(zhǔn)化氣象特征矩陣的周期性特征向量和趨勢(shì)性特征向量;
12、基于所述周期性特征向量和所述趨勢(shì)性特征向量構(gòu)建增強(qiáng)特征空間,其中,所述增強(qiáng)特征空間用于表征所述氣象監(jiān)測(cè)數(shù)據(jù)的周期性變化規(guī)律和長(zhǎng)期變化趨勢(shì)。
13、在一種可選的實(shí)施方式中,
14、構(gòu)建遷移跨域?qū)W習(xí)網(wǎng)絡(luò)并將制冷空調(diào)領(lǐng)域和氣象預(yù)報(bào)領(lǐng)域的預(yù)訓(xùn)練模型知識(shí)通過知識(shí)遷移算法添加至空氣制水預(yù)測(cè)任務(wù)中,結(jié)合知識(shí)蒸餾將多個(gè)源域的專家知識(shí)融合至深度神經(jīng)網(wǎng)絡(luò)中包括:
15、構(gòu)建遷移跨域?qū)W習(xí)網(wǎng)絡(luò),所述遷移跨域?qū)W習(xí)網(wǎng)絡(luò)包括特征提取器、任務(wù)特定分類器和域判別器,所述特征提取器采用帶有殘差連接的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),所述域判別器采用三層全連接網(wǎng)絡(luò)結(jié)構(gòu),所述特征提取器用于從所述制冷空調(diào)領(lǐng)域和所述氣象預(yù)報(bào)領(lǐng)域提取特征向量;
16、基于所述特征向量獲取特征統(tǒng)計(jì)信息并輸入核函數(shù)生成網(wǎng)絡(luò)得到核帶寬參數(shù)和核函數(shù)組合權(quán)重,基于域?qū)箵p失函數(shù)對(duì)所述特征向量進(jìn)行來源域識(shí)別得到域?qū)箵p失值,基于所述核帶寬參數(shù)和所述核函數(shù)組合權(quán)重構(gòu)建最大平均差異度量,計(jì)算所述制冷空調(diào)領(lǐng)域和所述氣象預(yù)報(bào)領(lǐng)域的特征向量差異得到最大平均差異值;
17、針對(duì)每個(gè)特征向量,采用注意力機(jī)制計(jì)算所述制冷空調(diào)領(lǐng)域和所述氣象預(yù)報(bào)領(lǐng)域的預(yù)訓(xùn)練模型知識(shí)的重要程度得到對(duì)應(yīng)的注意力權(quán)重,將所述注意力權(quán)重與所述特征向量相乘并疊加得到融合特征;
18、基于知識(shí)蒸餾損失函數(shù)將所述融合特征中的專家知識(shí)遷移至深度神經(jīng)網(wǎng)絡(luò)得到知識(shí)蒸餾損失值,將所述知識(shí)蒸餾損失值、所述域?qū)箵p失值和所述最大平均差異值進(jìn)行加權(quán)組合得到總體損失函數(shù);
19、采用交替優(yōu)化策略對(duì)所述遷移跨域?qū)W習(xí)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,固定所述域判別器對(duì)應(yīng)的域判別器參數(shù)并基于所述總體損失函數(shù)優(yōu)化所述特征提取器對(duì)應(yīng)的特征提取器參數(shù),固定所述特征提取器參數(shù)并基于所述域判別器的輸出優(yōu)化所述域判別器參數(shù),通過反向傳播算法迭代執(zhí)行參數(shù)優(yōu)化過程直至所述總體損失函數(shù)收斂,得到訓(xùn)練完成的遷移跨域?qū)W習(xí)網(wǎng)絡(luò)。
20、在一種可選的實(shí)施方式中,
21、基于所述特征向量獲取特征統(tǒng)計(jì)信息并輸入核函數(shù)生成網(wǎng)絡(luò)得到核帶寬參數(shù)和核函數(shù)組合權(quán)重,基于域?qū)箵p失函數(shù)對(duì)所述特征向量進(jìn)行來源域識(shí)別得到域?qū)箵p失值,基于所述核帶寬參數(shù)和所述核函數(shù)組合權(quán)重構(gòu)建最大平均差異度量,計(jì)算所述制冷空調(diào)領(lǐng)域和所述氣象預(yù)報(bào)領(lǐng)域的特征向量差異得到最大平均差異值包括:
22、基于所述特征向量在特征提取器的多個(gè)網(wǎng)絡(luò)層構(gòu)建特征金字塔結(jié)構(gòu),所述特征金字塔結(jié)構(gòu)包含淺層特征向量、中層特征向量和深層特征向量,所述淺層特征向量包含局部紋理信息,所述中層特征向量包含局部語義信息,所述深層特征向量包含全局語義信息;
23、計(jì)算所述淺層特征向量、所述中層特征向量和所述深層特征向量之間的互信息得到層間關(guān)聯(lián)性得分,基于所述層間關(guān)聯(lián)性得分選擇判別性最強(qiáng)的特征層級(jí)組合得到組合特征向量;
24、獲取所述組合特征向量的均值和方差構(gòu)建特征統(tǒng)計(jì)信息,將所述特征統(tǒng)計(jì)信息輸入核函數(shù)生成網(wǎng)絡(luò),所述核函數(shù)生成網(wǎng)絡(luò)輸出核帶寬參數(shù)和核函數(shù)組合權(quán)重;
25、計(jì)算所述制冷空調(diào)領(lǐng)域內(nèi)的組合特征向量的類間距離和類內(nèi)距離得到制冷空調(diào)領(lǐng)域特征距離,計(jì)算所述氣象預(yù)報(bào)領(lǐng)域的組合特征向量的特征方差得到氣象預(yù)報(bào)領(lǐng)域特征方差;
26、基于所述制冷空調(diào)領(lǐng)域特征距離和所述氣象預(yù)報(bào)領(lǐng)域特征方差計(jì)算特征維度重要度,將所述特征維度重要度與所述組合特征向量進(jìn)行加權(quán)得到加權(quán)特征向量;
27、將所述加權(quán)特征向量輸入域判別器,基于域?qū)箵p失函數(shù)對(duì)所述加權(quán)特征向量進(jìn)行來源域識(shí)別得到域?qū)箵p失值,基于所述核帶寬參數(shù)和所述核函數(shù)組合權(quán)重構(gòu)建最大平均差異度量,利用所述最大平均差異度量計(jì)算所述制冷空調(diào)領(lǐng)域和所述氣象預(yù)報(bào)領(lǐng)域的加權(quán)特征向量的差異得到最大平均差異值。
28、在一種可選的實(shí)施方式中,
29、基于所述增強(qiáng)特征空間,結(jié)合反向傳播算法訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)并輸出未來一天內(nèi)逐小時(shí)的預(yù)測(cè)制水量,將預(yù)測(cè)制水量作為狀態(tài)空間的輸入并配置動(dòng)作空間,根據(jù)制水效率和能耗比構(gòu)建獎(jiǎng)勵(lì)函數(shù),基于狀態(tài)空間、動(dòng)作空間和獎(jiǎng)勵(lì)函數(shù)構(gòu)建深度強(qiáng)化學(xué)習(xí)模型包括:
30、基于增強(qiáng)特征空間構(gòu)建深度神經(jīng)網(wǎng)絡(luò),所述深度神經(jīng)網(wǎng)絡(luò)包括輸入層、三個(gè)隱藏層和輸出層,所述隱藏層采用整流線性單元激活函數(shù);采用反向傳播算法訓(xùn)練所述深度神經(jīng)網(wǎng)絡(luò),得到未來一天內(nèi)逐小時(shí)的預(yù)測(cè)制水量;
31、將所述預(yù)測(cè)制水量構(gòu)建為狀態(tài)空間的輸入,配置包含壓縮機(jī)頻率、風(fēng)機(jī)轉(zhuǎn)速和系統(tǒng)啟停狀態(tài)的動(dòng)作空間;基于制水效率和能耗比構(gòu)建獎(jiǎng)勵(lì)函數(shù),其中所述制水效率為單位功率下的制水量,所述能耗比為單位能耗下的制水量;
32、基于所述狀態(tài)空間、所述動(dòng)作空間和所述獎(jiǎng)勵(lì)函數(shù)構(gòu)建深度強(qiáng)化學(xué)習(xí)模型,所述深度強(qiáng)化學(xué)習(xí)模型包括輸入層、兩個(gè)隱藏層和輸出層;設(shè)置經(jīng)驗(yàn)回放緩沖區(qū)存儲(chǔ)狀態(tài)動(dòng)作轉(zhuǎn)移樣本,構(gòu)建貪婪策略用于動(dòng)作探索。
33、在一種可選的實(shí)施方式中,
34、通過元學(xué)習(xí)自適應(yīng)框架動(dòng)態(tài)調(diào)整深度強(qiáng)化學(xué)習(xí)模型的網(wǎng)絡(luò)結(jié)構(gòu)并通過對(duì)抗樣本生成器構(gòu)建極端氣象工況對(duì)應(yīng)的訓(xùn)練樣本,基于所述訓(xùn)練樣本優(yōu)化所述深度強(qiáng)化學(xué)習(xí)模型得到候選制水參數(shù)控制策略集,基于所述候選制水參數(shù)控制策略集執(zhí)行制水過程并設(shè)置優(yōu)化目標(biāo)包括:
35、構(gòu)建元學(xué)習(xí)自適應(yīng)框架,基于所述自適應(yīng)框架計(jì)算網(wǎng)絡(luò)結(jié)構(gòu)調(diào)整梯度,根據(jù)所述網(wǎng)絡(luò)結(jié)構(gòu)調(diào)整梯度對(duì)深度強(qiáng)化學(xué)習(xí)模型的深度、神經(jīng)元數(shù)量和連接方式進(jìn)行動(dòng)態(tài)調(diào)整,得到改進(jìn)后的深度強(qiáng)化學(xué)習(xí)模型;
36、構(gòu)建對(duì)抗樣本生成器,將標(biāo)準(zhǔn)氣象條件下的采樣數(shù)據(jù)輸入所述對(duì)抗樣本生成器,通過對(duì)抗訓(xùn)練方式生成對(duì)應(yīng)高溫、低溫、高濕和低濕極端氣象工況的訓(xùn)練樣本;
37、采用在線學(xué)習(xí)方式基于所述訓(xùn)練樣本對(duì)所述改進(jìn)后的深度強(qiáng)化學(xué)習(xí)模型進(jìn)行優(yōu)化訓(xùn)練,通過最小化獎(jiǎng)勵(lì)函數(shù)的期望值更新模型參數(shù),得到在極端氣象工況下的候選制水參數(shù)控制策略集。
38、在一種可選的實(shí)施方式中,
39、通過多目標(biāo)貝葉斯優(yōu)化器進(jìn)行聯(lián)合優(yōu)化,生成帕累托最優(yōu)解集并通過基于置信邊界的動(dòng)態(tài)決策算法選擇最優(yōu)控制參數(shù),基于最優(yōu)控制參數(shù)動(dòng)態(tài)調(diào)整所述深度強(qiáng)化學(xué)習(xí)模型的更新步長(zhǎng)得到最優(yōu)制水策略包括:
40、構(gòu)建多目標(biāo)貝葉斯優(yōu)化器,將制水效率目標(biāo)函數(shù)和能耗比目標(biāo)函數(shù)作為所述多目標(biāo)貝葉斯優(yōu)化器的優(yōu)化目標(biāo),基于高斯過程回歸模型建立所述制水效率目標(biāo)函數(shù)和所述能耗比目標(biāo)函數(shù)的代理模型,采用徑向基函數(shù)核構(gòu)建所述代理模型的核函數(shù),基于預(yù)期改進(jìn)準(zhǔn)則對(duì)所述代理模型進(jìn)行采樣優(yōu)化;
41、基于所述多目標(biāo)貝葉斯優(yōu)化器獲取的采樣點(diǎn)集合構(gòu)建帕累托前沿,將非支配解作為所述帕累托前沿對(duì)應(yīng)的帕累托最優(yōu)解集,構(gòu)建置信邊界動(dòng)態(tài)決策算法,所述置信邊界動(dòng)態(tài)決策算法基于置信參數(shù)計(jì)算所述帕累托最優(yōu)解集中每個(gè)解的置信上界和置信下界,所述置信參數(shù)隨迭代次數(shù)動(dòng)態(tài)調(diào)整,基于所述置信上界和所述置信下界的差值選擇所述帕累托最優(yōu)解集中不確定性最小的解作為最優(yōu)控制參數(shù);
42、基于所述最優(yōu)控制參數(shù)設(shè)計(jì)自適應(yīng)步長(zhǎng)調(diào)整函數(shù),所述自適應(yīng)步長(zhǎng)調(diào)整函數(shù)與獎(jiǎng)勵(lì)增量成反比,將所述自適應(yīng)步長(zhǎng)調(diào)整函數(shù)得到的步長(zhǎng)值和策略梯度用于更新深度強(qiáng)化學(xué)習(xí)模型的參數(shù),引入動(dòng)量項(xiàng)對(duì)所述策略梯度進(jìn)行加權(quán)平均,基于加權(quán)后的所述策略梯度和所述步長(zhǎng)值,結(jié)合梯度校正增強(qiáng)機(jī)制和多尺度參數(shù)優(yōu)化更新所述深度強(qiáng)化學(xué)習(xí)模型的參數(shù)得到最優(yōu)制水策略。
43、在一種可選的實(shí)施方式中,
44、將所述自適應(yīng)步長(zhǎng)調(diào)整函數(shù)得到的步長(zhǎng)值和策略梯度用于更新深度強(qiáng)化學(xué)習(xí)模型的參數(shù),引入動(dòng)量項(xiàng)對(duì)所述策略梯度進(jìn)行加權(quán)平均,基于加權(quán)后的所述策略梯度和所述步長(zhǎng)值,結(jié)合梯度校正增強(qiáng)機(jī)制和多尺度參數(shù)優(yōu)化更新所述深度強(qiáng)化學(xué)習(xí)模型的參數(shù)得到最優(yōu)制水策略包括:
45、基于自適應(yīng)步長(zhǎng)調(diào)整函數(shù)得到步長(zhǎng)值,構(gòu)建周期性學(xué)習(xí)率調(diào)度函數(shù),基于基礎(chǔ)學(xué)習(xí)率和最大學(xué)習(xí)率計(jì)算周期性學(xué)習(xí)率值,將所述周期性學(xué)習(xí)率值與所述步長(zhǎng)值和獎(jiǎng)勵(lì)增益的倒數(shù)相乘得到組合學(xué)習(xí)率,在訓(xùn)練初始階段將所述組合學(xué)習(xí)率與預(yù)設(shè)時(shí)間步長(zhǎng)的比值作為預(yù)熱系數(shù),將所述組合學(xué)習(xí)率與所述預(yù)熱系數(shù)相乘得到預(yù)熱學(xué)習(xí)率;
46、計(jì)算策略梯度的一階矩估計(jì)值和二階矩估計(jì)值,基于預(yù)設(shè)偏差校正系數(shù)對(duì)所述一階矩估計(jì)值和所述二階矩估計(jì)值進(jìn)行偏差校正得到校正后的一階矩估計(jì)值和校正后的二階矩估計(jì)值,將所述預(yù)熱學(xué)習(xí)率與所述校正后的一階矩估計(jì)值、所述校正后的二階矩估計(jì)值的平方根的比值相乘,并與權(quán)重衰減項(xiàng)相加得到動(dòng)量項(xiàng);
47、將所述深度強(qiáng)化學(xué)習(xí)模型的參數(shù)劃分為細(xì)粒度參數(shù)、中粒度參數(shù)和粗粒度參數(shù),基于基礎(chǔ)更新頻率計(jì)算不同粒度參數(shù)的更新頻率,計(jì)算不同粒度參數(shù)的所述策略梯度,將不同粒度參數(shù)的所述策略梯度與對(duì)應(yīng)權(quán)重系數(shù)相乘并求和得到加權(quán)后的策略梯度;
48、對(duì)所述加權(quán)后的策略梯度進(jìn)行梯度裁剪得到裁剪后的策略梯度,基于學(xué)習(xí)率權(quán)重、所述動(dòng)量項(xiàng)的權(quán)重和衰減權(quán)重計(jì)算參數(shù)更新權(quán)重,將所述預(yù)熱學(xué)習(xí)率與所述裁剪后的策略梯度的乘積、所述動(dòng)量項(xiàng)和原始參數(shù)分別與對(duì)應(yīng)的所述參數(shù)更新權(quán)重相乘并求和得到最優(yōu)制水策略。
49、本發(fā)明實(shí)施例的第二方面,提供一種基于氣象大數(shù)據(jù)的空氣制水量智能預(yù)測(cè)調(diào)節(jié)系統(tǒng),包括:
50、第一單元,用于通過氣象傳感器采集氣象監(jiān)測(cè)數(shù)據(jù)并進(jìn)行標(biāo)準(zhǔn)化處理生成標(biāo)準(zhǔn)化氣象特征矩陣,通過時(shí)序分解提取周期性特征向量和趨勢(shì)性特征向量并構(gòu)建增強(qiáng)特征空間;
51、第二單元,用于構(gòu)建遷移跨域?qū)W習(xí)網(wǎng)絡(luò)并將制冷空調(diào)領(lǐng)域和氣象預(yù)報(bào)領(lǐng)域的預(yù)訓(xùn)練模型知識(shí)通過知識(shí)遷移算法添加至空氣制水預(yù)測(cè)任務(wù)中,結(jié)合知識(shí)蒸餾將多個(gè)源域的專家知識(shí)融合至深度神經(jīng)網(wǎng)絡(luò)中;
52、第三單元,用于基于所述增強(qiáng)特征空間,結(jié)合反向傳播算法訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)并輸出未來一天內(nèi)逐小時(shí)的預(yù)測(cè)制水量,將預(yù)測(cè)制水量作為狀態(tài)空間的輸入并配置動(dòng)作空間,根據(jù)制水效率和能耗比構(gòu)建獎(jiǎng)勵(lì)函數(shù),基于狀態(tài)空間、動(dòng)作空間和獎(jiǎng)勵(lì)函數(shù)構(gòu)建深度強(qiáng)化學(xué)習(xí)模型;
53、第四單元,用于通過元學(xué)習(xí)自適應(yīng)框架動(dòng)態(tài)調(diào)整深度強(qiáng)化學(xué)習(xí)模型的網(wǎng)絡(luò)結(jié)構(gòu)并通過對(duì)抗樣本生成器構(gòu)建極端氣象工況對(duì)應(yīng)的訓(xùn)練樣本,基于所述訓(xùn)練樣本優(yōu)化所述深度強(qiáng)化學(xué)習(xí)模型得到候選制水參數(shù)控制策略集,基于所述候選制水參數(shù)控制策略集執(zhí)行制水過程并設(shè)置優(yōu)化目標(biāo);
54、第五單元,用于通過多目標(biāo)貝葉斯優(yōu)化器進(jìn)行聯(lián)合優(yōu)化,生成帕累托最優(yōu)解集并通過基于置信邊界的動(dòng)態(tài)決策算法選擇最優(yōu)控制參數(shù),基于最優(yōu)控制參數(shù)動(dòng)態(tài)調(diào)整所述深度強(qiáng)化學(xué)習(xí)模型的更新步長(zhǎng)得到最優(yōu)制水策略。
55、本發(fā)明中,通過構(gòu)建遷移跨域?qū)W習(xí)網(wǎng)絡(luò),將制冷空調(diào)領(lǐng)域和氣象預(yù)報(bào)領(lǐng)域的預(yù)訓(xùn)練模型知識(shí)遷移至空氣制水預(yù)測(cè)任務(wù)中,并結(jié)合知識(shí)蒸餾技術(shù)融合多個(gè)源域的專家知識(shí),顯著提高了模型的預(yù)測(cè)精度和泛化能力,有效解決了空氣制水場(chǎng)景下數(shù)據(jù)稀疏和標(biāo)注困難的問題,采用元學(xué)習(xí)自適應(yīng)框架動(dòng)態(tài)調(diào)整深度強(qiáng)化學(xué)習(xí)模型的網(wǎng)絡(luò)結(jié)構(gòu),并通過對(duì)抗樣本生成器構(gòu)建極端氣象工況對(duì)應(yīng)的訓(xùn)練樣本,增強(qiáng)了模型在復(fù)雜多變環(huán)境下的適應(yīng)性和魯棒性,提高了制水過程的控制精度和穩(wěn)定性,基于多目標(biāo)貝葉斯優(yōu)化器進(jìn)行聯(lián)合優(yōu)化并結(jié)合基于置信邊界的動(dòng)態(tài)決策算法,實(shí)現(xiàn)了制水參數(shù)的自適應(yīng)調(diào)節(jié),在保證制水效率的同時(shí)降低了能耗,提高了系統(tǒng)的整體運(yùn)行效率,具有良好的工程應(yīng)用價(jià)值。