本發(fā)明涉及人工智能,特別是涉及一種基于yolo的隧道障礙物檢測方法及系統(tǒng)。
背景技術(shù):
1、本部分的陳述僅僅是提供了與本發(fā)明相關的背景技術(shù)信息,不必然構(gòu)成在先技術(shù)。
2、隧道施工環(huán)境較為惡劣,使用機器人代替工人進行隧道環(huán)境下的危險性高、施工難度大的工作,可以有效提高工作效率,保障工作人員的生命安全。
3、目前的隧道機器人自主能力不高,導致其避障可靠性和工作效率較低。因此機器人需要具備自主避障的功能,而實現(xiàn)自主避障的前提是需要對機器人前方的障礙物進行高精度的識別檢測。
技術(shù)實現(xiàn)思路
1、為了解決上述問題,本發(fā)明提出了一種基于yolo的隧道障礙物檢測方法及系統(tǒng),基于yolov5模型,并針對隧道施工場景的特殊性,對yolov5模型進行一系列適應性改進,提升了隧道障礙物的檢測精度的同時能夠更快的識別檢測出目標。
2、為了實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
3、第一方面,本發(fā)明提供一種基于yolo的隧道障礙物檢測方法,包括以下步驟:
4、采集隧道施工場景中的圖像數(shù)據(jù),并對圖像數(shù)據(jù)集進行標注;
5、提取圖像的光照特征,獲得光照特征圖,基于光照特征圖統(tǒng)計圖像的光照分布,根據(jù)圖像的光照分布動態(tài)調(diào)整圖像的亮度和對比度,獲得第一圖像,對第一圖像進行特征提取,獲得第一特征圖;
6、提取隧道的幾何特征,基于隧道的幾何特征獲得隧道位置分布圖,將隧道位置分布圖與第一特征圖進行融合,獲得聯(lián)合特征圖,利用聯(lián)合特征圖進行隧道障礙物檢測;
7、定義損失函數(shù),優(yōu)化模型參數(shù),獲得訓練好的隧道障礙物檢測模型;
8、利用訓練好的隧道障礙物檢測模型對待檢測圖像進行檢測。
9、作為可選擇的實施方式,還包括對采集的隧道施工場景中的圖像數(shù)據(jù)進行預處理,具體為:
10、對圖像進行鏡像翻轉(zhuǎn)操作,利用swin-enlightengan算法,對較為昏暗的圖像進行亮度增強處理,最后將圖像隨機劃分為訓練集、驗證集和測試集。
11、作為可選擇的實施方式,使用swin-unet替換enlightengan生成器網(wǎng)絡中的unet架構(gòu)得到所述swin-enlightengan算法。
12、作為可選擇的實施方式,利用swin?transformer網(wǎng)絡提取圖像的光照特征,所述swin?transformer網(wǎng)絡在特定層次上引入多尺度注意力機制,以捕捉不同空間范圍內(nèi)的光照變化,且swin?transformer網(wǎng)絡具有滑動窗口機制,通過層級遞進的方式,處理不同分辨率下的圖像。
13、作為可選擇的實施方式,基于隧道的幾何特征獲得隧道位置分布圖,具體為:
14、通過卷積神經(jīng)網(wǎng)絡提取隧道的幾何特征,獲得幾何結(jié)構(gòu)圖,基于幾何結(jié)構(gòu)圖和障礙物的位置分布信息,獲得隧道位置分布圖,并顯示物體在隧道中出現(xiàn)的概率區(qū)域。
15、作為可選擇的實施方式,定義損失函數(shù)為focalloss,并針對數(shù)據(jù)集對focalloss損失函數(shù)中的參數(shù)進行修改,增強模型對昏暗圖像的檢測能力。
16、第二方面,本發(fā)明提供一種基于yolo的隧道障礙物檢測系統(tǒng),包括:
17、數(shù)據(jù)獲取模塊,被配置為:采集隧道施工場景中的圖像數(shù)據(jù),并對圖像數(shù)據(jù)集進行標注;
18、特征提取模塊,被配置為:提取圖像的光照特征,獲得光照特征圖,基于光照特征圖統(tǒng)計圖像的光照分布,根據(jù)圖像的光照分布動態(tài)調(diào)整圖像的亮度和對比度,獲得第一圖像,對第一圖像進行特征提取,獲得第一特征圖;
19、環(huán)境特征輔助模塊,被配置為:提取隧道的幾何特征,基于隧道的幾何特征獲得隧道位置分布圖,將隧道位置分布圖與第一特征圖進行融合,獲得聯(lián)合特征圖,利用聯(lián)合特征圖進行隧道障礙物檢測;
20、模型訓練模塊,被配置為:定義損失函數(shù),優(yōu)化模型參數(shù),獲得訓練好的隧道障礙物檢測模型;
21、輸出模塊,被配置為:利用訓練好的隧道障礙物檢測模型對待檢測圖像進行檢測。
22、第三方面,本發(fā)明提供一種電子設備,包括存儲器和處理器以及存儲在存儲器上并在處理器上運行的計算機指令,所述計算機指令被處理器運行時,完成第一方面所述的方法。
23、第四方面,本發(fā)明提供一種計算機可讀存儲介質(zhì),用于存儲計算機指令,所述計算機指令被處理器執(zhí)行時,完成第一方面所述的方法。
24、第五方面,本發(fā)明提供一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)完成第一方面所述的方法。
25、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果為:
26、本公開提出一種基于yolo的隧道障礙物檢測方法及系統(tǒng),利用改進的swin-enlightengan算法對低光照圖像進行增強處理,提高了昏暗圖像的對比度,通過swintransforme網(wǎng)絡提取圖像的光照特征,將不同尺度下的光照特征結(jié)合到y(tǒng)olov5主干網(wǎng)絡中,增強模型在復雜光照環(huán)境下的感知能力。根據(jù)圖像的全局光照信息,動態(tài)調(diào)整圖像的亮度和對比度,從而消除隧道環(huán)境下的光照不均勻性。通過上述操作,圖像的亮度和對比度將被調(diào)整到期望的狀態(tài),使得在隧道環(huán)境中圖像特征更容易被提取。并構(gòu)建了隧道環(huán)境模型,利用環(huán)境特征輔助目標檢測,且針對昏暗場景,修改yolov5模型的損失函數(shù)。通過對yolov5模型進行一系列的適應性改進,使得模型能夠直接給出物體的類別概率和位置,同時對原模型進行了輕量化處理,使得模型在保持較高精度的前提下,能夠更快的識別檢測出目標,滿足隧道場景下對障礙物的高效、準確的識別檢測需求。
27、本發(fā)明附加方面的優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
1.一種基于yolo的隧道障礙物檢測方法,其特征在于,包括以下步驟:
2.如權(quán)利要求1所述的一種基于yolo的隧道障礙物檢測方法,其特征在于,還包括對采集的隧道施工場景中的圖像數(shù)據(jù)進行預處理,具體為:
3.如權(quán)利要求2所述的一種基于yolo的隧道障礙物檢測方法,其特征在于,使用swin-unet替換enlightengan生成器網(wǎng)絡中的unet架構(gòu)得到所述swin-enlightengan算法。
4.如權(quán)利要求1所述的一種基于yolo的隧道障礙物檢測方法,其特征在于,利用swintransformer網(wǎng)絡提取圖像的光照特征,所述swin?transformer網(wǎng)絡在特定層次上引入多尺度注意力機制,以捕捉不同空間范圍內(nèi)的光照變化,且swin?transformer網(wǎng)絡具有滑動窗口機制,通過層級遞進的方式,處理不同分辨率下的圖像。
5.如權(quán)利要求1所述的一種基于yolo的隧道障礙物檢測方法,其特征在于,基于隧道的幾何特征獲得隧道位置分布圖,具體為:
6.如權(quán)利要求4所述的一種基于yolo的隧道障礙物檢測方法,其特征在于,定義損失函數(shù)為focalloss,并針對數(shù)據(jù)集對focalloss損失函數(shù)中的參數(shù)進行修改,增強模型對昏暗圖像的檢測能力。
7.一種基于yolo的隧道障礙物檢測系統(tǒng),其特征在于,包括:
8.一種電子設備,其特征在于,包括存儲器和處理器以及存儲在存儲器上并在處理器上運行的計算機指令,所述計算機指令被處理器運行時,完成權(quán)利要求1-6任一項所述的方法。
9.一種計算機可讀存儲介質(zhì),其特征在于,用于存儲計算機指令,所述計算機指令被處理器執(zhí)行時,完成權(quán)利要求1-6任一項所述的方法。
10.一種計算機程序產(chǎn)品,其特征在于,包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)完成權(quán)利要求1-6任一項所述的方法。