本發(fā)明涉及數(shù)據(jù)處理,特別涉及基于大模型的時(shí)間序列異常檢測(cè)方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù):
1、當(dāng)前,異常檢測(cè)是機(jī)器學(xué)習(xí)中的一個(gè)關(guān)鍵領(lǐng)域,其目標(biāo)在于辨識(shí)出那些與數(shù)據(jù)集中的常規(guī)模式明顯不同的異常點(diǎn)。
2、然而,當(dāng)前主流的對(duì)于多維時(shí)間序列的異常檢測(cè)技術(shù)存在明顯不足?;诰嚯x或分布的傳統(tǒng)方法,處理低維數(shù)據(jù)尚可,面對(duì)高維數(shù)據(jù)時(shí),因維度災(zāi)難導(dǎo)致數(shù)據(jù)稀疏性加劇,檢測(cè)性能大幅下滑。而針對(duì)特定場(chǎng)景開發(fā)的先進(jìn)方案,雖在限定環(huán)境效果出色,卻因?qū)傩詮?qiáng),難以適應(yīng)跨領(lǐng)域的多樣異常類型。同時(shí),異常樣本在數(shù)據(jù)集中占比極少,與正常樣本數(shù)量懸殊,且人工標(biāo)注異常數(shù)據(jù)需耗費(fèi)大量人力、具備專業(yè)知識(shí),成本極高。這使得多數(shù)異常檢測(cè)算法只能采用無監(jiān)督學(xué)習(xí)。但無監(jiān)督學(xué)習(xí)缺乏標(biāo)注信息指導(dǎo),極大增加了異常檢測(cè)難度與結(jié)果的不確定性。
3、因此,如何提高對(duì)多維時(shí)間序列的異常檢測(cè)的準(zhǔn)確率是當(dāng)前亟待解決的技術(shù)問題。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供基于大模型的時(shí)間序列異常檢測(cè)方法、裝置、設(shè)備及介質(zhì),能夠提高對(duì)多維時(shí)間序列的異常檢測(cè)的準(zhǔn)確率。其具體方案如下:
2、第一方面,本技術(shù)提供了一種基于大模型的時(shí)間序列異常檢測(cè)方法,所述大模型為基于變分自編碼器、循環(huán)神經(jīng)網(wǎng)絡(luò)以及卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建的異常檢測(cè)大模型;其中,所述方法包括:
3、基于所述異常檢測(cè)大模型的模型卷積層和初始多維時(shí)間序列數(shù)據(jù)確定卷積層輸出結(jié)果,并基于所述卷積層輸出結(jié)果和所述異常檢測(cè)大模型的模型循環(huán)層的長(zhǎng)短期記憶網(wǎng)絡(luò)確定單一循環(huán)層輸出結(jié)果和時(shí)間步預(yù)測(cè)矩陣;其中,所述模型卷積層包含濾波器和所述卷積神經(jīng)網(wǎng)絡(luò);
4、利用所述卷積層輸出結(jié)果、所述時(shí)間步預(yù)測(cè)矩陣、所述單一循環(huán)層輸出結(jié)果的維度以及所述異常檢測(cè)大模型的模型自注意力循環(huán)層確定自注意力循環(huán)層輸出結(jié)果,并基于所述單一循環(huán)層輸出結(jié)果、所述自注意力循環(huán)層輸出結(jié)果以及第一預(yù)設(shè)結(jié)果融合機(jī)制確定融合輸出結(jié)果;所述模型自注意力循環(huán)層包含自注意力機(jī)制和所述長(zhǎng)短期記憶網(wǎng)絡(luò);
5、基于所述異常檢測(cè)大模型的模型線性學(xué)習(xí)層和所述初始多維時(shí)間序列數(shù)據(jù)確定線性輸出結(jié)果,并利用所述線性輸出結(jié)果、所述融合輸出結(jié)果以及第二預(yù)設(shè)結(jié)果融合機(jī)制確定目標(biāo)輸出結(jié)果;
6、基于所述目標(biāo)輸出結(jié)果和所述變分自編碼器的解碼器確定目標(biāo)多維時(shí)間序列數(shù)據(jù),并利用所述目標(biāo)多維時(shí)間序列數(shù)據(jù)、所述初始多維時(shí)間序列數(shù)據(jù)以及預(yù)設(shè)異常檢測(cè)閾值進(jìn)行異常檢測(cè),以確定所述初始多維時(shí)間序列數(shù)據(jù)中的異常情況。
7、可選的,所述基于所述異常檢測(cè)大模型的模型卷積層和初始多維時(shí)間序列數(shù)據(jù)確定卷積層輸出結(jié)果,包括:
8、基于初始多維時(shí)間序列數(shù)據(jù)中數(shù)據(jù)特征的數(shù)量確定模型卷積層中濾波器的高度,以完成濾波器高度配置操作;
9、基于所述初始多維時(shí)間序列數(shù)據(jù)的周期確定所述模型卷積層中所述濾波器的寬度,以完成濾波器寬度配置操作;
10、基于所述濾波器高度配置操作和所述濾波器寬度配置操作配置所述濾波器的參數(shù),并得到配置后濾波器;
11、將所述初始多維時(shí)間序列數(shù)據(jù)輸入至所述異常檢測(cè)大模型的所述模型卷積層,并利用relu激活函數(shù)和所述配置后濾波器生成卷積層輸出結(jié)果。
12、可選的,所述基于所述卷積層輸出結(jié)果和所述異常檢測(cè)大模型的模型循環(huán)層的長(zhǎng)短期記憶網(wǎng)絡(luò)確定單一循環(huán)層輸出結(jié)果和時(shí)間步預(yù)測(cè)矩陣,包括:
13、將所述卷積層輸出結(jié)果輸入至所述異常檢測(cè)大模型的模型循環(huán)層的長(zhǎng)短期記憶網(wǎng)絡(luò),并利用所述長(zhǎng)短期記憶網(wǎng)絡(luò)中的遺忘門、輸入門以及輸出門對(duì)所述卷積層輸出結(jié)果進(jìn)行處理,以得到處理結(jié)果;
14、從所述處理結(jié)果中獲取隱藏狀態(tài)和時(shí)間步預(yù)測(cè)矩陣,并將所述隱藏狀態(tài)確定為單一循環(huán)層輸出結(jié)果。
15、可選的,所述利用所述卷積層輸出結(jié)果、所述時(shí)間步預(yù)測(cè)矩陣、所述單一循環(huán)層輸出結(jié)果的維度以及所述異常檢測(cè)大模型的模型自注意力循環(huán)層確定自注意力循環(huán)層輸出結(jié)果,包括:
16、將所述卷積層輸出結(jié)果和所述時(shí)間步預(yù)測(cè)矩陣輸入至模型自注意力循環(huán)層,并基于所述卷積層輸出結(jié)果、所述時(shí)間步預(yù)測(cè)矩陣以及所述模型自注意力循環(huán)層中的所述長(zhǎng)短期記憶網(wǎng)絡(luò)確定當(dāng)前時(shí)間序列數(shù)據(jù);
17、基于所述當(dāng)前時(shí)間序列數(shù)據(jù)和所述模型自注意力循環(huán)層中的所述自注意力機(jī)制確定query向量、key向量以及value向量;
18、將所述query向量和所述key向量進(jìn)行點(diǎn)積,以得到點(diǎn)積結(jié)果,并利用所述點(diǎn)積結(jié)果和歸一化指數(shù)函數(shù)確定權(quán)重分?jǐn)?shù);
19、基于所述權(quán)重分?jǐn)?shù)和所述value向量確定加權(quán)value向量,并利用所述加權(quán)value向量確定自注意力機(jī)制輸出結(jié)果,以基于所述自注意力機(jī)制輸出結(jié)果和所述單一循環(huán)層輸出結(jié)果的維度確定自注意力循環(huán)層輸出結(jié)果。
20、可選的,所述基于所述單一循環(huán)層輸出結(jié)果、所述自注意力循環(huán)層輸出結(jié)果以及第一預(yù)設(shè)結(jié)果融合機(jī)制確定融合輸出結(jié)果,包括:
21、將所述單一循環(huán)層輸出結(jié)果和所述自注意力循環(huán)層輸出結(jié)果進(jìn)行拼接,并基于得到的拼接結(jié)果、tanh激活函數(shù)以及預(yù)設(shè)偏置項(xiàng)確定第一權(quán)重系數(shù);
22、對(duì)所述第一權(quán)重系數(shù)進(jìn)行縮放操作,并得到第二權(quán)重系數(shù);
23、基于所述第二權(quán)重系數(shù)、所述單一循環(huán)層輸出結(jié)果以及所述自注意力循環(huán)層輸出結(jié)果確定融合輸出結(jié)果。
24、可選的,所述基于所述異常檢測(cè)大模型的模型線性學(xué)習(xí)層和所述初始多維時(shí)間序列數(shù)據(jù)確定線性輸出結(jié)果,包括:
25、將所述初始多維時(shí)間序列數(shù)據(jù)輸入至模型線性學(xué)習(xí)層;
26、利用所述模型線性學(xué)習(xí)層中的自回歸模型對(duì)所述初始多維時(shí)間序列數(shù)據(jù)進(jìn)行處理,以得到處理后的線性輸出結(jié)果。
27、可選的,所述利用所述目標(biāo)多維時(shí)間序列數(shù)據(jù)、所述初始多維時(shí)間序列數(shù)據(jù)以及預(yù)設(shè)異常檢測(cè)閾值進(jìn)行異常檢測(cè),以確定所述初始多維時(shí)間序列數(shù)據(jù)中的異常情況,包括:
28、將僅包含正常多維時(shí)間序列數(shù)據(jù)的樣本集確定為驗(yàn)證集,并基于所述驗(yàn)證集確定第一異常分?jǐn)?shù);
29、對(duì)所述第一異常分?jǐn)?shù)進(jìn)行統(tǒng)計(jì)分析,以確定相應(yīng)的平均值和標(biāo)準(zhǔn)差;
30、基于所述平均值以及預(yù)設(shè)倍數(shù)的標(biāo)準(zhǔn)差的和確定預(yù)設(shè)異常檢測(cè)閾值;
31、基于所述目標(biāo)多維時(shí)間序列數(shù)據(jù)和所述初始多維時(shí)間序列數(shù)據(jù)確定第二異常分?jǐn)?shù),以利用所述第二異常分?jǐn)?shù)和所述預(yù)設(shè)異常檢測(cè)閾值確定所述初始多維時(shí)間序列數(shù)據(jù)的異常情況。
32、第二方面,本技術(shù)提供了一種基于大模型的時(shí)間序列異常檢測(cè)裝置,所述大模型為基于變分自編碼器、循環(huán)神經(jīng)網(wǎng)絡(luò)以及卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建的異常檢測(cè)大模型;其中,所述裝置包括:
33、循環(huán)層輸出模塊,用于基于所述異常檢測(cè)大模型的模型卷積層和初始多維時(shí)間序列數(shù)據(jù)確定卷積層輸出結(jié)果,并基于所述卷積層輸出結(jié)果和所述異常檢測(cè)大模型的模型循環(huán)層的長(zhǎng)短期記憶網(wǎng)絡(luò)確定單一循環(huán)層輸出結(jié)果和時(shí)間步預(yù)測(cè)矩陣;其中,所述模型卷積層包含濾波器和所述卷積神經(jīng)網(wǎng)絡(luò);
34、第一輸出結(jié)果融合模塊,用于利用所述卷積層輸出結(jié)果、所述時(shí)間步預(yù)測(cè)矩陣、所述單一循環(huán)層輸出結(jié)果的維度以及所述異常檢測(cè)大模型的模型自注意力循環(huán)層確定自注意力循環(huán)層輸出結(jié)果,并基于所述單一循環(huán)層輸出結(jié)果、所述自注意力循環(huán)層輸出結(jié)果以及第一預(yù)設(shè)結(jié)果融合機(jī)制確定融合輸出結(jié)果;所述模型自注意力循環(huán)層包含自注意力機(jī)制和所述長(zhǎng)短期記憶網(wǎng)絡(luò);
35、第二輸出結(jié)果融合模塊,用于基于所述異常檢測(cè)大模型的模型線性學(xué)習(xí)層和所述初始多維時(shí)間序列數(shù)據(jù)確定線性輸出結(jié)果,并利用所述線性輸出結(jié)果、所述融合輸出結(jié)果以及第二預(yù)設(shè)結(jié)果融合機(jī)制確定目標(biāo)輸出結(jié)果;
36、異常檢測(cè)模塊,用于基于所述目標(biāo)輸出結(jié)果和所述變分自編碼器的解碼器確定目標(biāo)多維時(shí)間序列數(shù)據(jù),并利用所述目標(biāo)多維時(shí)間序列數(shù)據(jù)、所述初始多維時(shí)間序列數(shù)據(jù)以及預(yù)設(shè)異常檢測(cè)閾值進(jìn)行異常檢測(cè),以確定所述初始多維時(shí)間序列數(shù)據(jù)中的異常情況。
37、第三方面,本技術(shù)提供了一種電子設(shè)備,包括:
38、存儲(chǔ)器,用于保存計(jì)算機(jī)程序;
39、處理器,用于執(zhí)行所述計(jì)算機(jī)程序,以實(shí)現(xiàn)前述的基于大模型的時(shí)間序列異常檢測(cè)方法。
40、第四方面,本技術(shù)提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于保存計(jì)算機(jī)程序;其中,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)前述的基于大模型的時(shí)間序列異常檢測(cè)方法。
41、本技術(shù)中,基于所述異常檢測(cè)大模型的模型卷積層和初始多維時(shí)間序列數(shù)據(jù)確定卷積層輸出結(jié)果,并基于所述卷積層輸出結(jié)果和所述異常檢測(cè)大模型的模型循環(huán)層的長(zhǎng)短期記憶網(wǎng)絡(luò)確定單一循環(huán)層輸出結(jié)果和時(shí)間步預(yù)測(cè)矩陣;其中,所述模型卷積層包含濾波器和所述卷積神經(jīng)網(wǎng)絡(luò);利用所述卷積層輸出結(jié)果、所述時(shí)間步預(yù)測(cè)矩陣、所述單一循環(huán)層輸出結(jié)果的維度以及所述異常檢測(cè)大模型的模型自注意力循環(huán)層確定自注意力循環(huán)層輸出結(jié)果,并基于所述單一循環(huán)層輸出結(jié)果、所述自注意力循環(huán)層輸出結(jié)果以及第一預(yù)設(shè)結(jié)果融合機(jī)制確定融合輸出結(jié)果;所述模型自注意力循環(huán)層包含自注意力機(jī)制和所述長(zhǎng)短期記憶網(wǎng)絡(luò);基于所述異常檢測(cè)大模型的模型線性學(xué)習(xí)層和所述初始多維時(shí)間序列數(shù)據(jù)確定線性輸出結(jié)果,并利用所述線性輸出結(jié)果、所述融合輸出結(jié)果以及第二預(yù)設(shè)結(jié)果融合機(jī)制確定目標(biāo)輸出結(jié)果;基于所述目標(biāo)輸出結(jié)果和所述變分自編碼器的解碼器確定目標(biāo)多維時(shí)間序列數(shù)據(jù),并利用所述目標(biāo)多維時(shí)間序列數(shù)據(jù)、所述初始多維時(shí)間序列數(shù)據(jù)以及預(yù)設(shè)異常檢測(cè)閾值進(jìn)行異常檢測(cè),以確定所述初始多維時(shí)間序列數(shù)據(jù)中的異常情況。由上可見,本技術(shù)中,首先將初始多維時(shí)間序列數(shù)據(jù)輸入到異常檢測(cè)大模型的模型卷積層,經(jīng)過卷積層處理后,得到卷積層輸出結(jié)果。接著,把卷積層輸出結(jié)果輸入到異常檢測(cè)大模型的模型循環(huán)層的長(zhǎng)短期記憶網(wǎng)絡(luò),經(jīng)過長(zhǎng)短期記憶網(wǎng)絡(luò)的計(jì)算,確定單一循環(huán)層輸出結(jié)果以及時(shí)間步預(yù)測(cè)矩陣。然后,借助卷積層輸出結(jié)果、時(shí)間步預(yù)測(cè)矩陣以及單一循環(huán)層輸出結(jié)果的維度信息,將其輸入到異常檢測(cè)大模型的模型自注意力循環(huán)層。經(jīng)過自注意力循環(huán)層的處理,得到自注意力循環(huán)層輸出結(jié)果。隨后,依據(jù)第一預(yù)設(shè)結(jié)果融合機(jī)制,將單一循環(huán)層輸出結(jié)果和自注意力循環(huán)層輸出結(jié)果進(jìn)行融合,從而確定融合輸出結(jié)果。之后,把初始多維時(shí)間序列數(shù)據(jù)輸入到異常檢測(cè)大模型的模型線性學(xué)習(xí)層,經(jīng)過該層處理后確定線性輸出結(jié)果。再根據(jù)第二預(yù)設(shè)結(jié)果融合機(jī)制,將線性輸出結(jié)果和融合輸出結(jié)果進(jìn)行融合,得到目標(biāo)輸出結(jié)果。最后,將目標(biāo)輸出結(jié)果輸入到變分自編碼器的解碼器,解碼器輸出目標(biāo)多維時(shí)間序列數(shù)據(jù)。將目標(biāo)多維時(shí)間序列數(shù)據(jù)與初始多維時(shí)間序列數(shù)據(jù)進(jìn)行對(duì)比,并結(jié)合預(yù)設(shè)異常檢測(cè)閾值,開展異常檢測(cè),以此確定初始多維時(shí)間序列數(shù)據(jù)中是否存在異常情況。這樣一來,本技術(shù)能夠提高對(duì)多維時(shí)間序列的異常檢測(cè)的準(zhǔn)確率。