本發(fā)明涉及煤礦安全與智能巡檢,具體為一種煤礦井下機器人巡檢系統(tǒng)及其管控方法。
背景技術:
1、煤礦生產環(huán)境復雜且風險極高,巡檢工作作為煤礦安全生產的重要環(huán)節(jié),長期以來多依賴人工完成。這種傳統(tǒng)方式存在效率低、安全隱患大、數據采集精度有限等問題。為提高煤礦生產安全性和巡檢任務的效率,機器人技術逐漸應用于煤礦井下環(huán)境中,成為解決這一問題的重要手段。機器人通過自動化巡檢減少了人員下井作業(yè)的需求,并通過實時感知與數據處理,為煤礦管理提供了科學依據。
2、現有技術中,煤礦井下機器人巡檢系統(tǒng)已取得一定成果。部分技術方案通過激光雷達或攝像頭實現障礙物檢測和環(huán)境建模,能夠滿足簡單巷道中的路徑規(guī)劃需求。一些方案采用固定規(guī)則的避障方法,提高了機器人在靜態(tài)環(huán)境中的任務完成率。同時,一些技術方案能夠通過能量監(jiān)控模塊在電量耗盡前發(fā)出警告,并結合預設路徑完成巡檢返航。這些技術的應用降低了人工巡檢的安全風險,提高了部分煤礦場景下的作業(yè)效率。
3、然而,現有技術仍存在一些不足,;其一,環(huán)境感知能力有限,單一傳感器方案無法全面獲取動態(tài)障礙、巷道細節(jié)和氣體濃度等復雜信息,導致路徑規(guī)劃基礎數據不足;其二,路徑規(guī)劃多基于固定規(guī)則或靜態(tài)環(huán)境假設,無法動態(tài)調整,機器人在復雜巷道中運行容易出現震動或路徑失效的問題;其三,動態(tài)決策能力較弱,現有系統(tǒng)對障礙物密集區(qū)域或突發(fā)變化場景的響應滯后,影響巡檢效率和安全性;其四,能耗管理缺乏智能化,動力輸出與導航方向未結合任務需求優(yōu)化分配,續(xù)航能力難以保障;其五,執(zhí)行模塊功能單一,對動態(tài)環(huán)境的避障支持較差,任務數據反饋不足。
技術實現思路
1、針對現有技術的不足,本發(fā)明提供了一種煤礦井下機器人巡檢系統(tǒng)及其管控方法,解決了現有技術中環(huán)境感知不足、路徑規(guī)劃不靈活、動態(tài)決策能力弱及能耗管理與任務執(zhí)行不完善的問題。
2、為實現以上目的,本發(fā)明通過以下技術方案予以實現:一種煤礦井下機器人巡檢系統(tǒng),包括:
3、環(huán)境感知模塊,用于采集煤礦巷道的三維環(huán)境數據,包括障礙物位置、巷道形態(tài)和動態(tài)變化信息;
4、路徑優(yōu)化模塊,用于基于三維環(huán)境數據對巡檢路徑進行優(yōu)化,生成路徑長度和曲率優(yōu)化的最優(yōu)路徑;
5、強化學習決策模塊,用于根據實時感知的動態(tài)環(huán)境信息調整路徑規(guī)劃和動力輸出;
6、能耗管理模塊,用于監(jiān)控機器人電量狀態(tài)并動態(tài)分配動力輸出與導航方向;
7、執(zhí)行模塊,用于接收路徑優(yōu)化模塊與強化學習決策模塊的控制指令,驅動機器人完成巡檢任務。
8、優(yōu)選的,所述環(huán)境感知模塊包括:
9、激光雷達,用于采集煤礦巷道的障礙物位置和形態(tài)信息;
10、紅外攝像頭,用于感知巷道中的動態(tài)變化;
11、氣體檢測儀,用于監(jiān)測巷道內有害氣體濃度及環(huán)境狀態(tài)。
12、優(yōu)選的,所述路徑優(yōu)化模塊包括:
13、基于finsler幾何的路徑建模單元,用于計算巡檢路徑的環(huán)境代價和曲率代價,并生成路徑優(yōu)化目標;
14、曲率優(yōu)化單元,用于對路徑的曲率進行平滑處理,確保路徑連續(xù)性和運動平穩(wěn)性;
15、全局路徑生成單元,用于生成路徑長度與曲率綜合優(yōu)化的最優(yōu)路徑。
16、優(yōu)選的,所述強化學習決策模塊包括:
17、狀態(tài)空間構建單元,用于構建包括機器人位置、速度、加速度、電量狀態(tài)和障礙物距離的動態(tài)狀態(tài)空間;
18、動作控制單元,用于控制動力輸出與導航方向調整;
19、獎勵計算單元,用于根據路徑長度、曲率代價、能耗代價和避障要求計算獎勵值;
20、策略更新單元,用于基于proximalpolicyoptimization算法更新決策策略。
21、優(yōu)選的,所述能耗管理模塊包括:
22、電量監(jiān)控單元,用于實時監(jiān)控機器人電池的剩余電量;
23、能量分配單元,用于根據任務需求和路徑狀態(tài)動態(tài)分配動力輸出和導航能耗;
24、預警與返航單元,用于當電量低于預設閾值時發(fā)出預警并規(guī)劃返航路徑。
25、優(yōu)選的,所述執(zhí)行模塊包括:
26、運動控制單元,用于控制機器人在最優(yōu)路徑上的行進與導航;
27、障礙物規(guī)避單元,用于通過實時感知環(huán)境數據調整路徑以規(guī)避障礙物;
28、數據反饋單元,用于記錄巡檢過程中機器人路徑、能耗和環(huán)境狀態(tài),并將數據上傳至系統(tǒng)后臺。
29、本發(fā)明還提供一種煤礦井下機器人巡檢系統(tǒng)的管控方法,包括以下步驟:
30、環(huán)境感知,通過環(huán)境感知模塊采集煤礦巷道的三維環(huán)境數據;
31、路徑優(yōu)化,通過路徑優(yōu)化模塊基于環(huán)境數據生成路徑長度和曲率優(yōu)化的最優(yōu)路徑;
32、實時決策,通過強化學習決策模塊結合動態(tài)環(huán)境信息調整路徑規(guī)劃和動力輸出;
33、能耗管理,通過能耗管理模塊實時監(jiān)控電量狀態(tài),根據路徑和任務需求動態(tài)分配動力輸出和導航方向,當電量低于預設閾值時發(fā)出預警并規(guī)劃返航路徑;
34、任務執(zhí)行,通過執(zhí)行模塊接收優(yōu)化后的路徑和動力指令,驅動機器人沿最優(yōu)路徑完成巡檢任務,并在巡檢過程中記錄任務數據以供反饋和分析。
35、優(yōu)選的,所述環(huán)境感知包括:
36、采集障礙物位置和形態(tài)信息;
37、感知巷道中的動態(tài)變化;
38、監(jiān)測巷道內的氣體濃度和環(huán)境狀態(tài)。
39、優(yōu)選的,所述路徑優(yōu)化包括:
40、基于finsler幾何對路徑進行建模,計算路徑長度和環(huán)境代價;
41、基于曲率優(yōu)化方法對路徑進行平滑處理,減少路徑的曲率變化;
42、根據優(yōu)化目標生成路徑長度和曲率綜合優(yōu)化的最優(yōu)路徑。
43、優(yōu)選的,所述實時決策包括:
44、構建動態(tài)狀態(tài)空間,包括位置、速度、加速度、電量狀態(tài)和障礙物距離;
45、根據動態(tài)狀態(tài)空間計算路徑長度代價、曲率代價、能耗代價和避障獎勵;
46、基于強化學習算法調整動力輸出和導航方向,以動態(tài)優(yōu)化路徑規(guī)劃。
47、本發(fā)明提供了一種煤礦井下機器人巡檢系統(tǒng)及其管控方法。具備以下有益效果:
48、1、本發(fā)明通過強化學習的技術方案,實時調整路徑規(guī)劃和動力輸出,實現了在動態(tài)環(huán)境中的智能避障與路徑優(yōu)化。與現有技術相比,克服了傳統(tǒng)路徑規(guī)劃依賴固定規(guī)則、在動態(tài)變化場景下響應不靈活的缺陷,顯著提高了機器人在煤礦復雜環(huán)境中的適應能力。
49、2、采用動態(tài)能耗分配與低電量預警技術,本發(fā)明有效延長了機器人續(xù)航時間。在低電量狀態(tài)下,還能優(yōu)先規(guī)劃最短返航路徑,確保任務安全完成。相較于現有技術對電量消耗的被動監(jiān)控方式,該技術實現了更合理的能量調度,解決了續(xù)航不足導致的巡檢中斷問題。
50、3、本發(fā)明結合finsler幾何建模和曲率優(yōu)化,生成了路徑代價低且曲率平滑的最優(yōu)路徑,保證機器人運行的穩(wěn)定性。與僅以最短路徑為目標的現有技術不同,該方案消除了機器人因路徑不平滑引起的震動和運行不穩(wěn)定的問題,在復雜巷道環(huán)境中表現更為出色。
51、4、執(zhí)行模塊將優(yōu)化的路徑和動力指令轉化為具體的運動行為,具備精準運動控制與實時避障能力,同時記錄巡檢數據供后續(xù)分析。相比于現有技術中單一功能的執(zhí)行系統(tǒng),該模塊通過全面的數據反饋和高效的任務執(zhí)行,顯著提升了巡檢任務的完整性和可靠性。