本技術(shù)涉及存儲應(yīng)用,尤其涉及一種集群管理方法、裝置、設(shè)備、存儲介質(zhì)及計算機程序產(chǎn)品。
背景技術(shù):
1、隨著大數(shù)據(jù)分析、人工智能等領(lǐng)域的快速發(fā)展,算力對于單盤性能兌付的需求陡增,在性能超賣的背景下,集群性能穩(wěn)定性遭受挑戰(zhàn)。在集群性能集中兌付場景下,集群達到性能上限簡稱性能爆池,集群業(yè)務(wù)、io請求性能降級,無法滿足對客服務(wù)水平協(xié)議(service-level?agreement,sla)承諾,易引發(fā)客訴。為維持集群穩(wěn)定性,常見的手段有云硬盤服務(wù)質(zhì)量(quality?of?service,qos)流控、云硬盤實例遷移、集群擴容等手段。云硬盤qos流控通常作為事中處理手段,常見的云硬盤qos流控方案有挑選高系統(tǒng)每秒鐘能夠處理的輸入/輸出操作數(shù)(input/output?operations?per?second,iops)、高吞吐的云硬盤進行限速或通過集群性能超限值均攤至所有卷并按比例進行限速等方式,直至集群性能水位降至合理水平。但是,在上述云硬盤qos流控過程中,對云硬盤實例進行限速,導(dǎo)致云硬盤實例的存儲性能降低,造成云硬盤實例服務(wù)性能下降。
2、申請內(nèi)容
3、為解決上述技術(shù)問題,本技術(shù)期望提供一種集群管理方法、裝置、設(shè)備、存儲介質(zhì)及計算機程序產(chǎn)品,解決了對云硬盤實例進行限速導(dǎo)致云硬盤實例的存儲性能下降的問題,在應(yīng)用過程中,動態(tài)對集群的qos流進行控制,保證了云硬盤實例的存儲性能,提高了云硬盤實例的服務(wù)性能。
4、本技術(shù)的技術(shù)方案是這樣實現(xiàn)的:
5、本技術(shù)提供一種集群管理方法,所述方法包括:
6、監(jiān)測第一集群,得到第一性能參數(shù)的第一參數(shù)值;
7、確定所述第一集群對應(yīng)的第一云存儲實例集的預(yù)設(shè)性能參數(shù)的第二參數(shù)值;其中,所述第一云存儲實例集中包括獨享型云存儲實例類型的云存儲實例和共享型云存儲實例類型的云存儲實例;
8、基于所述第一參數(shù)值和所述第二參數(shù)值,對所述第一集群和所述第一云存儲實例集進行資源管理。
9、上述方案中,所述基于所述第一參數(shù)值和所述第二參數(shù)值,對所述第一集群和所述第一云存儲實例集進行資源管理,包括:
10、基于所述第一參數(shù)值和集群性能閾值,確定所述第一集群的第一性能超限值;
11、若所述第一性能超限值大于或等于所述第二參數(shù)值,關(guān)閉所述第一集群的突發(fā)管理功能;
12、從所述第一云存儲實例集中確定待遷移云存儲實例;
13、從所述第一集群所屬的集群系統(tǒng)中,確定目標集群;
14、遷移所述待遷移云存儲實例至所述目標集群。
15、上述方案中,所述方法還包括:
16、若所述第一性能超限值小于所述第二參數(shù)值,從所述第一云存儲實例集中確定第二性能參數(shù)的參數(shù)值大于或等于第一性能閾值的云存儲實例,得到第二云存儲實例集;
17、若所述第二云存儲實例集中不包括性能突增云存儲實例,確定所述第一云存儲實例集中屬于所述共享型云存儲實例類型的全部云存儲實例的預(yù)設(shè)性能參數(shù)的第三參數(shù)值的和值,得到第一參考值;
18、基于所述第一性能超限值和所述第一參考值,對所述第二云存儲實例集中的云存儲實例進行管理。
19、上述方案中,所述方法還包括:
20、若所述第二云存儲實例集中包括性能突增云存儲實例,確定所述第二云存儲實例集中每一實例的所述第二性能參數(shù)的參數(shù)突增量;
21、若所述第二云存儲實例集中存在所述參數(shù)突增量小于對應(yīng)的實例的第二參考值,且所述參數(shù)突增量大于所述第一性能超限值的第一待調(diào)整實例,基于所述第一待調(diào)整實例的所述參數(shù)突增量,對所述第一待調(diào)整實例進行所述第二性能參數(shù)的反壓處理;其中,所述第二參考值為對應(yīng)的實例的第二性能參數(shù)的當前參數(shù)值與對應(yīng)的所述第一性能閾值的差值。
22、上述方案中,所述方法還包括:
23、若所述第二云存儲實例集中存在所述參數(shù)突增量大于或等于對應(yīng)的實例的所述第二參考值的第二待調(diào)整實例,限制所述第二待調(diào)整實例的第二性能參數(shù)為對應(yīng)的所述第一性能閾值。
24、上述方案中,所述方法還包括:
25、監(jiān)測所述第一集群的第一性能參數(shù)的第三參數(shù)值;
26、基于所述第三參數(shù)值和所述集群性能閾值,確定所述第一集群的第二性能超限值;
27、確定所述第一云存儲實例集中屬于所述共享型云存儲實例類型的全部云存儲實例的預(yù)設(shè)性能參數(shù)的第三參數(shù)值的和值,得到第一參考值;
28、基于所述第二性能超限值和所述第一參考值,對所述第二云存儲實例集進行管理。
29、上述方案中,所述基于所述第二性能超限值和所述第一參考值,對所述第二云存儲實例集進行管理,包括:
30、若所述第二性能超限值大于或等于所述第一參考值,關(guān)閉所述第二云存儲實例集中屬于所述共享型云存儲實例類型的全部云存儲實例的突發(fā)管理功能;
31、監(jiān)測所述第一集群的所述第一性能參數(shù)的第四參數(shù)值;
32、若所述第四參數(shù)值大于或等于所述集群性能閾值,確定所述第二云存儲實例集中屬于所述獨享型云存儲實例類型的全部實例,得到一個或多個第三待調(diào)整實例;
33、對一個或多個所述第三待調(diào)整實例進行管理。
34、上述方案中,所述對一個或多個所述第三待調(diào)整實例進行管理,包括:
35、確定每一所述第三待調(diào)整實例的預(yù)設(shè)配置;
36、基于一個或多個所述第三待調(diào)整實例的所述預(yù)設(shè)配置,對對應(yīng)的所述第三待調(diào)整實例的所述第二性能參數(shù)進行反壓處理,直至所述第一集群的所述第一性能參數(shù)的第三參數(shù)值小于所述集群性能閾值,或每一所述第三待調(diào)整實例的所述第二性能參數(shù)的值為對應(yīng)的所述第一性能閾值。
37、上述方案中,所述方法還包括:
38、若所述第二性能超限值小于所述第一參考值,對所述第二云存儲實例集中屬于所述共享型云存儲實例類型的第四待調(diào)整實例的預(yù)設(shè)配置,對對應(yīng)的所述第四待調(diào)整實例進行反壓處理,直至所述第一集群的所述第一性能參數(shù)的第五參數(shù)值小于所述集群性能閾值,或每一所述第四待調(diào)整實例的所述第二性能參數(shù)的值為對應(yīng)的所述第一性能閾值。
39、上述方案中,所述獨享型云存儲實例類型的云存儲實例的第一性能閾值是基于配置的第二性能參數(shù)提供的,所述第一性能閾值包括與所述第二性能參數(shù)相關(guān)的第一容量和第二容量,第二容量與所述第一容量具有關(guān)聯(lián)關(guān)系;所述共享型云存儲實例類型的云存儲實例配置用于提供第二性能參數(shù)對應(yīng)的最小性能值。
40、本技術(shù)提供一種集群管理裝置,所述裝置至少包括:監(jiān)測單元、確定單元和管理單元;其中:
41、所述監(jiān)測單元,用于監(jiān)測第一集群,得到第一性能參數(shù)的第一參數(shù)值;
42、所述確定單元,用于確定所述第一集群對應(yīng)的第一云存儲實例集的預(yù)設(shè)性能參數(shù)的第二參數(shù)值;其中,所述第一云存儲實例集中包括獨享型云存儲實例類型的云存儲實例和共享型云存儲實例類型的云存儲實例;
43、所述管理單元,用于基于所述第一參數(shù)值和所述第二參數(shù)值,對所述第一集群和所述第一云存儲實例集進行管理。
44、本技術(shù)提供一種集群管理設(shè)備,所述設(shè)備至少包括:通信接口、存儲器、處理器和通信總線;其中:
45、所述存儲器,用于存儲可執(zhí)行指令;
46、所述通信總線,用于實現(xiàn)所述通信接口、所述處理器和所述存儲器之間的通信連接;
47、所述處理器,用于執(zhí)行所述存儲器中存儲的集群管理程序,實現(xiàn)如上述任一項所述的集群管理方法的步驟。
48、本技術(shù)提供一種存儲介質(zhì),所述存儲介質(zhì)上存儲有集群管理程序,所述集群管理程序被執(zhí)行時用于實現(xiàn)如上述任一項所述的集群管理方法的步驟。
49、本技術(shù)提供一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序在被處理器執(zhí)行時實現(xiàn)如上述任一項所述的集群管理方法的步驟。
50、本技術(shù)實施例提供了一種集群管理方法、裝置、設(shè)備、存儲介質(zhì)及計算機程序產(chǎn)品,通過監(jiān)測第一集群,得到第一性能參數(shù)的第一參數(shù)值后,確定第一集群對應(yīng)的第一云存儲實例集的預(yù)設(shè)性能參數(shù)的第二參數(shù)值,并基于第一參數(shù)值和第二參數(shù)值,對第一集群和第一云存儲實例集進行資源管理。這樣,通過第一集群的第一性能參數(shù)的第一參數(shù)值與預(yù)設(shè)性能參數(shù)的第二參數(shù)值進行比較分析,來對第一集群和第一云存儲實例集進行資源管理,解決了對云硬盤實例進行限速導(dǎo)致云硬盤實例的存儲性能下降的問題,在應(yīng)用過程中,動態(tài)對集群的qos流進行控制,保證了云硬盤實例的存儲性能,提高了云硬盤實例的服務(wù)性能。
技術(shù)實現(xiàn)思路