屬于計算機數(shù)據(jù)中心智能監(jiān)測管理系統(tǒng)領(lǐng)域,涉及一種服務(wù)器溫度監(jiān)控方法,具體的說是一種基于遠程管理通訊協(xié)議的服務(wù)器溫度監(jiān)控系統(tǒng)及方法。
背景技術(shù):
當(dāng)今社會,隨著互聯(lián)網(wǎng)的高速發(fā)展,計算機數(shù)據(jù)中心的數(shù)量越來越多,規(guī)模越來越大,高密度的服務(wù)器搭建在數(shù)據(jù)中心的機房中,每臺服務(wù)器的溫度監(jiān)控就顯得非常重要,溫度的異常,輕則導(dǎo)致服務(wù)器宕機,造成業(yè)務(wù)上的異常,重則引起火災(zāi),導(dǎo)致不可預(yù)期的嚴重后果。
現(xiàn)有技術(shù)中,服務(wù)器溫度監(jiān)控方法有以下兩種:一是在服務(wù)器周圍部署溫度傳感器,但服務(wù)器內(nèi)部溫度異常傳遞到溫度傳感器有時間延遲,采集數(shù)值也不夠精確,造成該方法將溫度異常通知到用戶時,已經(jīng)錯過了最佳時機。二是在服務(wù)器操作系統(tǒng)上部署監(jiān)控軟件,由軟件讀取服務(wù)器溫度并向外部發(fā)送,該方法會較大占用操作系統(tǒng)的系統(tǒng)資源和網(wǎng)絡(luò)數(shù)據(jù)傳輸帶寬,在操作系統(tǒng)異常時整個監(jiān)控就會失效。
目前,隨著物聯(lián)網(wǎng)和嵌入式的飛速發(fā)展,在服務(wù)器主板上定制支持遠程管理和溫度采集的芯片的技術(shù)和方案已經(jīng)很成熟,這為硬件級的服務(wù)器溫度監(jiān)控方法提供了技術(shù)支持。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是,克服現(xiàn)有技術(shù)的缺點,提供一種基于遠程管理通訊協(xié)議的服務(wù)器溫度監(jiān)控系統(tǒng)及方法,可以針對大數(shù)量、高密度的數(shù)據(jù)中心里的服務(wù)器,采用硬件級芯片的方案,通過遠程管理通訊協(xié)議,對服務(wù)器溫度進行監(jiān)控,同時對采集到的溫度值進行匯總、分析、報警,預(yù)防由于溫度問題導(dǎo)致的服務(wù)器異常、數(shù)據(jù)中心安全隱患、數(shù)據(jù)中心能耗浪費。
本發(fā)明解決以上技術(shù)問題的技術(shù)方案是:
一種基于遠程管理通訊協(xié)議的服務(wù)器溫度監(jiān)控系統(tǒng),包括:
溫度采集模塊,用于采集服務(wù)器溫度,將采集到的溫度值,通過遠程管理通訊協(xié)議提供給其他模塊獲??;
溫度數(shù)據(jù)記錄模塊,與溫度采集模塊通訊,將溫度值記錄到數(shù)據(jù)庫中;
溫度數(shù)據(jù)分析模塊,用于提取溫度數(shù)據(jù)記錄模塊記錄在數(shù)據(jù)庫中的實時溫度值,對其進行匯總和分析;
溫度數(shù)據(jù)展示模塊,用于將溫度數(shù)據(jù)分析模塊產(chǎn)生的數(shù)據(jù)直觀具體的展示給用戶;
溫度數(shù)據(jù)報警模塊,用于對采集到的實時溫度值進行掃描、監(jiān)控和報警,當(dāng)實時溫度值異常時,及時的通過監(jiān)控系統(tǒng)或短信通知用戶,防止溫度異常造成的進一步損失;
所述溫度數(shù)據(jù)分析模塊包括:
小時溫度記錄子模塊,首先每隔一個小時,將這一個小時的實時溫度值取平均值,記錄在小時溫度值表中;
天溫度記錄子模塊,每隔一天,將小時溫度值表中這一天的溫度值取平均值,記錄在天溫度值表中;
數(shù)據(jù)分析模塊子模塊,通過實時、小時、天,這3個時間維度的溫度值之后,分析一天之中的最高溫度出現(xiàn)在哪個時間段,意味著哪個時間段負載最高,機房中哪些位置的服務(wù)器溫度較高,哪些位置的服務(wù)器溫度較低,溫度高的說明制冷不夠,需要加強,溫度低的說明制冷過度,需要調(diào)整。
一種基于遠程管理通訊協(xié)議的服務(wù)器溫度監(jiān)控方法,包括以下步驟:
㈠采集服務(wù)器溫度,將采集到的溫度值,通過遠程管理通訊協(xié)議提供給其他模塊獲取;
㈡與溫度采集模塊通訊,將溫度值記錄到數(shù)據(jù)庫中;
㈢提取記錄在數(shù)據(jù)庫中的實時溫度值,對其進行匯總和分析;
㈣將溫度數(shù)據(jù)分析模塊產(chǎn)生的數(shù)據(jù)直觀具體的展示給用戶;
㈤對采集到的實時溫度值進行掃描、監(jiān)控和報警,當(dāng)實時溫度值異常時,及時的通過監(jiān)控系統(tǒng)或短信通知用戶,防止溫度異常造成的進一步損失;
步驟㈢具體包括:
⑴每隔一個小時,將這一個小時的實時溫度值取平均值,記錄在小時溫度值表中;
⑵每隔一天,將小時溫度值表中這一天的溫度值取平均值,記錄在天溫度值表中;
⑶通過實時、小時、天,這3個時間維度的溫度值之后,分析一天之中的最高溫度出現(xiàn)在哪個時間段,意味著哪個時間段負載最高,機房中哪些位置的服務(wù)器溫度較高,哪些位置的服務(wù)器溫度較低,溫度高的說明制冷不夠,需要加強,溫度低的說明制冷過度,需要調(diào)整。
本發(fā)明的有益效果是:⑴基于硬件的溫度采集,穩(wěn)定,高效:溫度采集芯片位于服務(wù)器主板上,不受操作系統(tǒng)和各種軟件的干擾,即使服務(wù)器關(guān)機,仍然可以采集;因為不是傳統(tǒng)的軟件采集形式,所以沒有占用珍貴的服務(wù)器系統(tǒng)資源。⑵數(shù)據(jù)分析功能健全:系統(tǒng)將采集到的實時溫度值,按照小時、天的粒度,統(tǒng)計出平均值、最高值、最低值,為展示和報警功能提供基礎(chǔ)數(shù)據(jù)。⑶歷史數(shù)據(jù)可追溯:實時采集溫度值、數(shù)據(jù)分析生成的各種粒度、維度的溫度值,都記錄在系統(tǒng)的數(shù)據(jù)庫中,歷史數(shù)據(jù)可以很方便的進行追溯、查詢。⑷溫度監(jiān)控展示合理:在基礎(chǔ)數(shù)據(jù)的支撐下,可以向用戶展示各種粒度、維度的溫度監(jiān)控;比如實時溫度顯示、溫度歷史曲線圖、各種用戶定制的溫度報表。⑸溫度報警及時:系統(tǒng)在進行實時溫度采集的同時,會監(jiān)控溫度值,如果某臺服務(wù)器的溫度異常,將會在實時溫度顯示界面進行明顯的報警顯示,并通過郵件、手機短信等方式向監(jiān)控系統(tǒng)用戶進行報警提示,保證溫度異常的及時報警。
附圖說明
圖1為本發(fā)明的部署示意圖。
具體實施方式
實施例1
本實施例是一種基于遠程管理通訊協(xié)議的服務(wù)器溫度監(jiān)控系統(tǒng),本實施例服務(wù)器采用的主板嵌有定制的溫度監(jiān)控芯片,服務(wù)器采用的主板上嵌有支持遠程管理通訊協(xié)議的芯片,該芯片采集溫度,并支持外部讀取,現(xiàn)在物聯(lián)網(wǎng)和嵌入式技術(shù)高速發(fā)展,定制這種芯片很方便。
本實施例溫度數(shù)據(jù)處理服務(wù)器部署,將負責(zé)溫度匯總、分析、報警的溫度數(shù)據(jù)處理服務(wù)器部署在用戶數(shù)據(jù)中心網(wǎng)絡(luò)中,保證可以和所有嵌有溫度監(jiān)控芯片的服務(wù)器通訊。服務(wù)器裝有l(wèi)inux操作系統(tǒng),并安裝mysql數(shù)據(jù)庫。溫度匯總、分析、報警分成3個linux程序運行在操作系統(tǒng)上,以降低耦合。
本實施例基于遠程管理通訊協(xié)議的服務(wù)器溫度監(jiān)控系統(tǒng)包括:
溫度采集模塊,用于采集服務(wù)器溫度,將采集到的溫度值,通過遠程管理通訊協(xié)議提供給其他模塊獲??;該模塊的任務(wù)是進行服務(wù)器溫度采集,定制服務(wù)器主板上的芯片,用于采集服務(wù)器的溫度,該采集方案不依賴于操作系統(tǒng),也不占用系統(tǒng)資源,完全硬件級,高效,穩(wěn)定,即使在操作系統(tǒng)關(guān)機情況下依然可以正常工作。采集到的溫度值,通過遠程管理通訊協(xié)議,提供給其他子模塊獲?。?/p>
溫度數(shù)據(jù)記錄模塊,與溫度采集模塊通訊,將溫度值記錄到數(shù)據(jù)庫中;該模塊與溫度采集子模塊中的芯片通訊,將溫度值記錄到數(shù)據(jù)庫中;通訊周期可根據(jù)業(yè)務(wù)需要進行設(shè)置,周期越短溫度值的記錄密度越高,更利于迅速發(fā)現(xiàn)問題,但代價是對存儲空間要求也會相應(yīng)的提高;該模塊記錄的數(shù)據(jù)為其他模塊進行數(shù)據(jù)分析提供數(shù)據(jù)基礎(chǔ);
溫度數(shù)據(jù)分析模塊,用于提取溫度數(shù)據(jù)記錄模塊記錄在數(shù)據(jù)庫中的實時溫度值,對其進行匯總和分析;
溫度數(shù)據(jù)展示模塊,用于將溫度數(shù)據(jù)分析模塊產(chǎn)生的數(shù)據(jù)直觀具體的展示給用戶;溫度數(shù)據(jù)展示模塊主要通過儀表、曲線圖、報表展示給用戶。其中,所述儀表用于展示各個服務(wù)器當(dāng)前的溫度值,給用戶實時、直觀的展;曲線圖用于展示歷史溫度曲線,曲線圖的粒度可以變化,可以設(shè)置為實時溫度曲線圖、小時溫度曲線圖、天溫度曲線圖,方便用戶從不同粒度了解溫度的變化情況;報表用于系統(tǒng)、直觀的將經(jīng)過統(tǒng)計的溫度情況展示給用戶,每一類報表都有自己獨有的統(tǒng)計方法,可以根據(jù)用戶需求進行定制,展現(xiàn)不同維度的統(tǒng)計情況。
溫度數(shù)據(jù)報警模塊,用于對采集到的實時溫度值進行掃描、監(jiān)控和報警,當(dāng)實時溫度值異常時,及時的通過監(jiān)控系統(tǒng)或短信通知用戶,防止溫度異常造成的進一步損失;
溫度數(shù)據(jù)分析模塊包括:
小時溫度記錄子模塊,首先每隔一個小時,將這一個小時的實時溫度值取平均值,記錄在小時溫度值表中;
天溫度記錄子模塊,每隔一天,將小時溫度值表中這一天的溫度值取平均值,記錄在天溫度值表中;
數(shù)據(jù)分析模塊子模塊,通過實時、小時、天,這3個時間維度的溫度值之后,分析一天之中的最高溫度出現(xiàn)在哪個時間段,意味著哪個時間段負載最高,機房中哪些位置的服務(wù)器溫度較高,哪些位置的服務(wù)器溫度較低,溫度高的說明制冷不夠,需要加強,溫度低的說明制冷過度,需要調(diào)整。
本實施例的一種基于遠程管理通訊協(xié)議的服務(wù)器溫度監(jiān)控方法,包括以下步驟:
㈠采集服務(wù)器溫度,將采集到的溫度值,通過遠程管理通訊協(xié)議提供給其他模塊獲?。?/p>
㈡與溫度采集模塊通訊,將溫度值記錄到數(shù)據(jù)庫中;
㈢提取記錄在數(shù)據(jù)庫中的實時溫度值,對其進行匯總和分析;
㈣將溫度數(shù)據(jù)分析模塊產(chǎn)生的數(shù)據(jù)直觀具體的展示給用戶;
㈤對采集到的實時溫度值進行掃描、監(jiān)控和報警,當(dāng)實時溫度值異常時,及時的通過監(jiān)控系統(tǒng)或短信通知用戶,防止溫度異常造成的進一步損失;
步驟㈢具體包括:
⑴每隔一個小時,將這一個小時的實時溫度值取平均值,記錄在小時溫度值表中;
⑵每隔一天,將小時溫度值表中這一天的溫度值取平均值,記錄在天溫度值表中;
⑶通過實時、小時、天,這3個時間維度的溫度值之后,分析一天之中的最高溫度出現(xiàn)在哪個時間段,意味著哪個時間段負載最高,機房中哪些位置的服務(wù)器溫度較高,哪些位置的服務(wù)器溫度較低,溫度高的說明制冷不夠,需要加強,溫度低的說明制冷過度,需要調(diào)整。
除上述實施例外,本發(fā)明還可以有其他實施方式。凡采用等同替換或等效變換形成的技術(shù)方案,均落在本發(fā)明要求的保護范圍。