本申請實(shí)施例涉及數(shù)據(jù)處理,尤其涉及一種業(yè)務(wù)系統(tǒng)監(jiān)控方法、裝置、計算機(jī)設(shè)備、計算機(jī)可讀存儲介質(zhì)。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)的發(fā)展,業(yè)務(wù)平臺需要面對海量的業(yè)務(wù)請求,其運(yùn)行的穩(wěn)定性顯得格外重要。業(yè)務(wù)平臺一般需配置數(shù)據(jù)庫,例如es(elasticsearch)數(shù)據(jù)庫。以es數(shù)據(jù)庫為例,其是一種分布式文檔存儲和搜索引擎,可以用于處理大規(guī)模數(shù)據(jù)集,例如:日志、文檔、時序數(shù)據(jù)等,廣泛應(yīng)用于全文搜索、文本分析和數(shù)據(jù)聚合等領(lǐng)域。
2、本發(fā)明人發(fā)現(xiàn),雖然諸如es數(shù)據(jù)庫可以適用于存儲和查詢各種類型的日志數(shù)據(jù),但對日志的監(jiān)控告警的支持能力弱,難以實(shí)現(xiàn)高效率的實(shí)時日志監(jiān)控和關(guān)鍵告警。
3、需要說明的是,上述內(nèi)容并不必然是現(xiàn)有技術(shù),也不用于限制本申請的專利保護(hù)范圍。
技術(shù)實(shí)現(xiàn)思路
1、本申請實(shí)施例提供一種業(yè)務(wù)系統(tǒng)監(jiān)控方法、裝置、計算機(jī)設(shè)備、計算機(jī)可讀存儲介質(zhì),以解決或緩解上面提出的一項(xiàng)或更多項(xiàng)技術(shù)問題。
2、本申請實(shí)施例的一個方面提供了一種業(yè)務(wù)系統(tǒng)監(jiān)控方法,所述方法包括:
3、獲取目標(biāo)業(yè)務(wù)系統(tǒng)的監(jiān)控數(shù)據(jù),所述監(jiān)控數(shù)據(jù)包括日志數(shù)據(jù)和目標(biāo)接口的錯誤信息,所述目標(biāo)業(yè)務(wù)系統(tǒng)配置有所述目標(biāo)接口,所述目標(biāo)接口預(yù)先關(guān)聯(lián)有接口優(yōu)先級;
4、根據(jù)所述目標(biāo)接口的錯誤信息,從所述日志數(shù)據(jù)中獲取告警日志數(shù)據(jù);
5、根據(jù)所述目標(biāo)接口的接口優(yōu)先級和所述告警日志數(shù)據(jù),生成目標(biāo)告警通知并發(fā)送。
6、可選地,所述監(jiān)控數(shù)據(jù)基于查詢條件得到,所述查詢條件配置有查詢?nèi)罩炯墑e和查詢時間窗,所述查詢時間窗對應(yīng)多個子時間窗;
7、所述獲取目標(biāo)業(yè)務(wù)系統(tǒng)的監(jiān)控數(shù)據(jù),包括:
8、通過所述查詢?nèi)罩炯墑e,獲取所述目標(biāo)業(yè)務(wù)系統(tǒng)在所述查詢時間窗內(nèi)的所述日志數(shù)據(jù);及
9、獲取所述目標(biāo)接口在各個子時間窗內(nèi)的錯誤信息,其中,所述錯誤信息包括錯誤數(shù)值。
10、可選地,根據(jù)所述目標(biāo)接口的錯誤信息,從所述日志數(shù)據(jù)中獲取告警日志數(shù)據(jù),包括:
11、根據(jù)所述各個子時間窗內(nèi)的錯誤數(shù)值和預(yù)設(shè)過濾規(guī)則,從多個子時間窗中選擇出一個或多個目標(biāo)子時間窗;
12、根據(jù)所述一個或多個目標(biāo)子時間窗,從所述日志數(shù)據(jù)中獲取部分日志數(shù)據(jù),以作為所述告警日志數(shù)據(jù)。
13、可選地,所述目標(biāo)告警通知包括文本告警通知和/或即時語音連線告警通知;
14、所述根據(jù)所述目標(biāo)接口的接口優(yōu)先級和所述告警日志數(shù)據(jù),生成目標(biāo)告警通知并發(fā)送,包括:
15、在所述接口優(yōu)先級為第一優(yōu)先級的情況下,根據(jù)所述告警日志數(shù)據(jù)生成所述即時語音連線告警通知,以及所述文本告警通知;
16、在所述接口優(yōu)先級低于所述第一優(yōu)先級,且一個或多個子時間窗的錯誤數(shù)值滿足預(yù)設(shè)觸發(fā)條件的情況下,根據(jù)所述告警日志數(shù)據(jù)生成所述文本告警通知。
17、可選地,所述根據(jù)所述目標(biāo)接口的接口優(yōu)先級和所述告警日志數(shù)據(jù),生成目標(biāo)告警通知并發(fā)送,還包括:
18、根據(jù)所述告警日志數(shù)據(jù),獲取對應(yīng)的告警信息;
19、根據(jù)所述告警日志數(shù)據(jù),獲取對應(yīng)的錯誤原因和處理建議;
20、在獲取到所述對應(yīng)的錯誤原因和處理建議的情況下,根據(jù)預(yù)設(shè)的告警模板、所述告警信息、所述錯誤原因和所述處理建議,生成第一目標(biāo)告警通知;
21、在未獲取到所述對應(yīng)的錯誤原因和處理建議的情況下,根據(jù)預(yù)設(shè)的告警模板和所述告警信息,生成第二目標(biāo)告警通知。
22、可選地,根據(jù)所述告警日志數(shù)據(jù),獲取對應(yīng)的錯誤原因和處理建議,包括:
23、將所述告警日志數(shù)據(jù)和預(yù)設(shè)錯誤數(shù)據(jù)庫進(jìn)行匹配,所述預(yù)設(shè)錯誤數(shù)據(jù)庫包括多個錯誤數(shù)據(jù),每個錯誤數(shù)據(jù)關(guān)聯(lián)有錯誤原因和處理建議;
24、在所述告警日志數(shù)據(jù)和所述預(yù)設(shè)數(shù)據(jù)庫中的目標(biāo)錯誤數(shù)據(jù)匹配成功的情況下,獲取與所述目標(biāo)錯誤數(shù)據(jù)關(guān)聯(lián)的目標(biāo)錯誤原因和目標(biāo)處理建議。
25、可選地,所述業(yè)務(wù)系統(tǒng)監(jiān)控方法還包括:
26、在所述告警日志數(shù)據(jù)和所述預(yù)設(shè)錯誤數(shù)據(jù)庫匹配失敗的情況下,存儲所述告警日志數(shù)據(jù)至預(yù)設(shè)緩存區(qū)域;
27、在獲取到和所述告警日志數(shù)據(jù)對應(yīng)的目標(biāo)錯誤原因和目標(biāo)處理建議的情況下,將所述告警日志數(shù)據(jù)作為錯誤數(shù)據(jù)新增到所述預(yù)設(shè)錯誤數(shù)據(jù)庫。
28、可選地,生成目標(biāo)告警通知并發(fā)送,包括:
29、獲取和所述目標(biāo)接口相關(guān)聯(lián)的目標(biāo)對象信息,所述目標(biāo)對象信息包括語音連線接口和通訊接口;
30、通過所述語音連線接口向目標(biāo)對象發(fā)送即時語音連線告警通知;和/或通過所述通訊接口發(fā)送文本告警通知。
31、本申請實(shí)施例的另一個方面提供了一種業(yè)務(wù)系統(tǒng)監(jiān)控裝置,所述裝置包括:
32、第一獲取模塊,用于獲取目標(biāo)業(yè)務(wù)系統(tǒng)的監(jiān)控數(shù)據(jù),所述監(jiān)控數(shù)據(jù)包括日志數(shù)據(jù)和目標(biāo)接口的錯誤信息,所述目標(biāo)業(yè)務(wù)系統(tǒng)配置有所述目標(biāo)接口,所述目標(biāo)接口預(yù)先關(guān)聯(lián)有接口優(yōu)先級;
33、第二獲取模塊,用于根據(jù)所述目標(biāo)接口的錯誤信息,從所述日志數(shù)據(jù)中獲取告警日志數(shù)據(jù);
34、發(fā)送模塊,用于根據(jù)所述目標(biāo)接口的接口優(yōu)先級和所述告警日志數(shù)據(jù),生成目標(biāo)告警通知并發(fā)送。
35、本申請實(shí)施例的另一個方面提供了一種計算機(jī)設(shè)備,包括:
36、至少一個處理器;及
37、與所述至少一個處理器通信連接的存儲器;
38、其中:所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行如上所述的方法。
39、本申請實(shí)施例的另一個方面提供了一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)內(nèi)存儲有計算機(jī)指令,所述計算機(jī)指令被處理器執(zhí)行時實(shí)現(xiàn)如上所述的方法。
40、本申請實(shí)施例采用上述技術(shù)方案可以包括如下優(yōu)勢:
41、先獲取目標(biāo)業(yè)務(wù)系統(tǒng)的日志數(shù)據(jù)以及目標(biāo)業(yè)務(wù)系統(tǒng)配置的目標(biāo)接口的錯誤信息。根據(jù)目標(biāo)接口的錯誤信息,從日志數(shù)據(jù)中過濾和篩選出告警日志數(shù)據(jù)。根據(jù)預(yù)先為目標(biāo)接口配置的接口優(yōu)先級和告警日志數(shù)據(jù),生成目標(biāo)告警通知并發(fā)送給相關(guān)負(fù)責(zé)人??芍?,本申請實(shí)施例通過目標(biāo)接口的錯誤信息可以迅速識別出需要觸發(fā)告警的日志數(shù)據(jù),并通過預(yù)先配置的接口優(yōu)先級為告警日志數(shù)據(jù)定制目標(biāo)告警通知和通知相關(guān)負(fù)責(zé)人,從而實(shí)現(xiàn)高效的實(shí)時日志監(jiān)控和關(guān)鍵告警。本申請實(shí)施例的技術(shù)方案靈活度高,適用于多種場景,例如可以用于諸如es數(shù)據(jù)庫的日志監(jiān)控。
1.一種業(yè)務(wù)系統(tǒng)監(jiān)控方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述監(jiān)控數(shù)據(jù)基于查詢條件得到,所述查詢條件配置有查詢?nèi)罩炯墑e和查詢時間窗,所述查詢時間窗對應(yīng)多個子時間窗;
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述目標(biāo)接口的錯誤信息,從所述日志數(shù)據(jù)中獲取告警日志數(shù)據(jù),包括:
4.根據(jù)權(quán)利要求1~3任一項(xiàng)所述的方法,其特征在于,所述目標(biāo)告警通知包括文本告警通知和/或即時語音連線告警通知;
5.根據(jù)權(quán)利要求1~3任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述目標(biāo)接口的接口優(yōu)先級和所述告警日志數(shù)據(jù),生成目標(biāo)告警通知并發(fā)送,還包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)所述告警日志數(shù)據(jù),獲取對應(yīng)的錯誤原因和處理建議,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,還包括:
8.根據(jù)權(quán)利要求1~3任一項(xiàng)所述的方法,其特征在于,生成目標(biāo)告警通知并發(fā)送,包括:
9.一種業(yè)務(wù)系統(tǒng)監(jiān)控裝置,其特征在于,所述裝置包括:
10.一種計算機(jī)設(shè)備,其特征在于,包括:
11.一種計算機(jī)可讀存儲介質(zhì),其特征在于,所述計算機(jī)可讀存儲介質(zhì)內(nèi)存儲有計算機(jī)指令,所述計算機(jī)指令被處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1至8中任一項(xiàng)所述的方法。