成人打一炮免费视频,亚洲天堂视频在线观看,97视频久久久,日本japanese护士色高清,五月婷婷丁香,日韩精品一级无码毛片免费,国产欧美日韩精品网红剧情演绎

一種基于RSODTR模型實(shí)現(xiàn)遙感圖像自動(dòng)檢測(cè)的方法

文檔序號(hào):41857597發(fā)布日期:2025-05-09 18:17閱讀:4來(lái)源:國(guó)知局
一種基于RSODTR模型實(shí)現(xiàn)遙感圖像自動(dòng)檢測(cè)的方法

本發(fā)明涉及遙感圖像自動(dòng)檢測(cè),更具體地說(shuō),本發(fā)明涉及一種基于rsodtr模型實(shí)現(xiàn)遙感圖像自動(dòng)檢測(cè)的方法。


背景技術(shù):

1、隨著對(duì)地觀測(cè)技術(shù)的快速創(chuàng)新和發(fā)展,遙感圖像的分辨率不斷提高,圖像中包含的地物信息也越來(lái)越豐富。作為遙感圖像自動(dòng)解譯的重要研究課題,remote_sens?ing_object_detection(rsod)能通過(guò)特定算法預(yù)測(cè)遙感圖像中感興趣目標(biāo)的位置和類別,從而準(zhǔn)確檢測(cè)圖像中的多個(gè)地物。因此,rsod被廣泛應(yīng)用于諸多領(lǐng)域中。

2、近年來(lái),部分學(xué)者將深度學(xué)習(xí)方法應(yīng)用于rsod,通過(guò)深度神經(jīng)網(wǎng)絡(luò)從遙感圖像中提取地物特征信息。仍存在以下缺陷:(1)與自然圖像相比,遙感圖像固有地?cái)y帶很少的像素點(diǎn)和不明顯的特征信息,且具有低分辨率和噪聲特征,然而,dnn中的池化層進(jìn)一步壓縮了信息量,這導(dǎo)致使用dnn提取圖像特征時(shí),關(guān)于小目標(biāo)的特征信息很容易被忽略或丟失。(2)遙感圖像中通常包含不同尺度的地物,而且不同地物的長(zhǎng)寬比也不同,與圖像分類任務(wù)不同,目標(biāo)檢測(cè)通常需要預(yù)測(cè)不同尺度的目標(biāo),而dnn默認(rèn)的特征提取方法可能無(wú)法有效地提取不同尺度下地物的特征信息,導(dǎo)致檢測(cè)效果欠佳。(3)在自然圖像中容易分辨的地物在遙感圖像中可能表現(xiàn)出較高的類間相似性,如在遙感圖像上道路和橋梁的特征很相似,它們相似的背景信息導(dǎo)致類間特征的差異很小。(4)與自然圖像相比,遙感圖像的背景復(fù)雜度較高,同類地物可能處于不同背景中,并且隨著季節(jié)和傳感器視角的變化而變化,此外,遙感圖像中背景的圖像占比往往遠(yuǎn)大于前景,導(dǎo)致同類地物類內(nèi)特征差異較大,因此,在不同背景和尺度下分辨地物類別和背景信息相當(dāng)困難,異構(gòu)實(shí)例特征與無(wú)關(guān)噪聲混合以及背景區(qū)域高響應(yīng)都有可能導(dǎo)致誤檢和漏檢。

3、目前,在rsod任務(wù)中檢測(cè)效果較好的算法大多采用cnn框架,然而,基于cnn的目標(biāo)檢測(cè)模型容易導(dǎo)致模型體量增加并不可避免地產(chǎn)生空間偽影,使得特征映射更容易受到空間偏差的影響,使網(wǎng)絡(luò)難以檢測(cè)圖像中的小目標(biāo),并且,cnn通常對(duì)內(nèi)存和算力要求較高,這使得它們難以部署在算力和功率有限的邊緣計(jì)算設(shè)備中。

4、現(xiàn)有的detr是transformer架構(gòu)在目標(biāo)檢測(cè)領(lǐng)域的一個(gè)里程碑式創(chuàng)新,它將cnn和transformer的編碼器-解碼器架構(gòu)相結(jié)合,編碼器用基于transformer架構(gòu)的自注意力機(jī)制對(duì)滑動(dòng)窗口內(nèi)的像素簇編碼并從中提取上下文信息,解碼器用交叉注意力機(jī)制根據(jù)編碼器獲取的上下文信息生成待測(cè)目標(biāo)的檢測(cè)框,然而,detr的訓(xùn)練成本較高,相比基于cnn的檢測(cè)器,它需要訓(xùn)練更久才能收斂,并且,detr無(wú)法檢測(cè)多尺度目標(biāo)的特征信息,容易優(yōu)先考慮遠(yuǎn)程語(yǔ)義信息,而忽略重要的局部特征,這導(dǎo)致detr在檢測(cè)小目標(biāo)時(shí)性能較差。

5、為了解決上述問(wèn)題,real-time_detection_transformer(rt-detr)應(yīng)運(yùn)而生,rt-detr是一種端到端的實(shí)時(shí)目標(biāo)檢測(cè)器,能實(shí)現(xiàn)實(shí)時(shí)目標(biāo)檢測(cè),而且解決了detr訓(xùn)練成本高的問(wèn)題。rt-detr引入了一種高效的混合編碼器,通過(guò)調(diào)整解碼器的層數(shù)來(lái)動(dòng)態(tài)調(diào)整推理速度,以適應(yīng)不同的應(yīng)用場(chǎng)景而無(wú)需重新訓(xùn)練。與detr相比,rt-detr使用更小的特征映射來(lái)降低計(jì)算成本,使用更少的注意力頭來(lái)降低模型中的參數(shù)量。rt-detr實(shí)現(xiàn)了目標(biāo)檢測(cè)性能和效率的平衡,資源利用率高,不需要confidence_threshold、nms等檢測(cè)結(jié)果后處理優(yōu)化,充分發(fā)揮了端到端檢測(cè)的優(yōu)勢(shì)。然而,目前很少有將rt-detr應(yīng)用于rsod的目標(biāo)檢測(cè)方法。

6、鑒于此,本發(fā)明提出一種基于rsodtr模型實(shí)現(xiàn)遙感圖像自動(dòng)檢測(cè)的方法以解決上述問(wèn)題。


技術(shù)實(shí)現(xiàn)思路

1、為了克服現(xiàn)有技術(shù)的上述缺陷,為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于rsodtr模型實(shí)現(xiàn)遙感圖像自動(dòng)檢測(cè)的方法,包括以下步驟:

2、s1:?jiǎn)?dòng)pycharm軟件,選擇數(shù)據(jù)集并將數(shù)據(jù)集內(nèi)的圖像作為輸入圖像;

3、s2:利用rsodtr模型自動(dòng)檢測(cè)輸入圖像中的目標(biāo)地物,并自動(dòng)計(jì)算輸入圖像自動(dòng)檢測(cè)時(shí)的速率與地物類型的精度,進(jìn)而得到目標(biāo)地物的位置、范圍與類別;

4、s3:保存目標(biāo)地物的位置、范圍與類別;

5、s4:rsodtr模型在自動(dòng)檢測(cè)后的輸入圖像中標(biāo)識(shí)目標(biāo)地物并顯示。

6、進(jìn)一步地,所述啟動(dòng)pycharm軟件,選擇數(shù)據(jù)集并將數(shù)據(jù)集內(nèi)的圖像作為輸入圖像的數(shù)據(jù),包括:

7、啟動(dòng)pycharm軟件后創(chuàng)建新項(xiàng)目,配置python軟件的虛擬環(huán)境;

8、通過(guò)pycharm軟件選擇包含若干張遙感圖像的數(shù)據(jù)集,將數(shù)據(jù)集內(nèi)的圖像作為輸入圖像并按照1:1:1的比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,訓(xùn)練集與驗(yàn)證集的圖像標(biāo)注有對(duì)應(yīng)的標(biāo)簽,測(cè)試集的圖像未標(biāo)注有標(biāo)簽;

9、其中,rsodtr模型的訓(xùn)練過(guò)程包括:首先用訓(xùn)練集和驗(yàn)證集對(duì)rsodtr模型進(jìn)行訓(xùn)練,完成訓(xùn)練后將測(cè)試集內(nèi)的圖像輸入rsodtr模型中進(jìn)行檢測(cè)。

10、通過(guò)pycharm軟件選擇數(shù)據(jù)集,并將數(shù)據(jù)集內(nèi)的圖像作為輸入圖像,其中,數(shù)據(jù)集包括n張遙感圖像。

11、進(jìn)一步地,所述利用rsodtr模型自動(dòng)檢測(cè)輸入圖像中的目標(biāo)地物,并自動(dòng)計(jì)算輸入圖像自動(dòng)檢測(cè)時(shí)的速率與地物類型的精度,進(jìn)而得到目標(biāo)地物的位置、范圍與類別的方式,包括:

12、通過(guò)主干網(wǎng)絡(luò)、編碼器、解碼器以及檢測(cè)頭搭建rsodtr模型并對(duì)rsodtr模型進(jìn)行訓(xùn)練,即可將輸入圖像輸入訓(xùn)練好的rsodtr模型內(nèi);

13、訓(xùn)練好的rsodtr模型通過(guò)主干網(wǎng)絡(luò)的快速基礎(chǔ)模塊和殘差連接技術(shù)從輸入圖像中提取地物的特征信息后將不同尺度的特征圖輸入編碼器中,其中,編碼器由cga、ccff和ssff組成;

14、訓(xùn)練好的rsodtr模型通過(guò)cga對(duì)backbone最后一層的輸出特征進(jìn)行進(jìn)一步編碼和上下文建模,并通過(guò)ccff和ssff將不同尺寸的特征圖融合起來(lái)轉(zhuǎn)換成一系列特征編碼作為decoder的初始目標(biāo)查詢;

15、訓(xùn)練好的rsodtr模型通過(guò)解碼器引入稀疏查詢機(jī)制和可學(xué)習(xí)的位置編碼優(yōu)化目標(biāo)查詢,進(jìn)而得到優(yōu)化后的特征編碼;

16、訓(xùn)練好的rsodtr模型通過(guò)檢測(cè)頭的分類頭和回歸頭將解碼器優(yōu)化后的特征編碼轉(zhuǎn)化為預(yù)測(cè)目標(biāo)地物的類別和預(yù)測(cè)目標(biāo)地物的位置,預(yù)測(cè)目標(biāo)地物的類別和預(yù)測(cè)目標(biāo)地物的位置即為目標(biāo)地物的檢測(cè)結(jié)果,其中,檢測(cè)頭包括一個(gè)分類頭和一個(gè)回歸頭,分類頭用于預(yù)測(cè)目標(biāo)地物的類別,回歸頭用于預(yù)測(cè)目標(biāo)地物的位置;

17、在檢測(cè)過(guò)程中,自動(dòng)計(jì)算輸入圖像的檢測(cè)速率和地物類型的精度;

18、最后,訓(xùn)練好的rsodtr模型輸出目標(biāo)地物的位置、范圍與類別。

19、進(jìn)一步地,所述訓(xùn)練好的rsodtr模型在對(duì)輸入圖像進(jìn)行自動(dòng)檢測(cè)時(shí),采用非極大值抑制過(guò)濾輸入圖像中重復(fù)的邊界框。

20、進(jìn)一步地,所述rsodtr模型訓(xùn)練150個(gè)批次,每個(gè)批次大小為32張圖像,圖像大小為800×800像素,采用adamw優(yōu)化器,學(xué)習(xí)率設(shè)為0.0003,其中,rsodtr模型在訓(xùn)練過(guò)程中有50%的概率對(duì)輸入數(shù)據(jù)進(jìn)行上下或左右翻轉(zhuǎn)數(shù)據(jù)增強(qiáng)。

21、進(jìn)一步地,所述保存目標(biāo)地物的位置、范圍與類別的方式,包括:

22、定義目標(biāo)地物的位置、范圍與類別的輸出數(shù)據(jù)結(jié)構(gòu);

23、根據(jù)定義的輸出數(shù)據(jù)結(jié)構(gòu)將目標(biāo)地物的位置、范圍與類別進(jìn)行保存。

24、進(jìn)一步地,所述rsodtr模型在自動(dòng)檢測(cè)后的輸入圖像中標(biāo)識(shí)目標(biāo)地物并顯示的方式,包括:

25、使用opencv繪制檢測(cè)框與標(biāo)簽對(duì)自動(dòng)檢測(cè)后的輸入圖像標(biāo)識(shí)目標(biāo)地物;

26、通過(guò)pycharm軟件內(nèi)置的sc?ivi?ew窗口對(duì)自動(dòng)檢測(cè)后的輸入圖像進(jìn)行顯示。

27、本發(fā)明一種基于rsodtr模型實(shí)現(xiàn)遙感圖像自動(dòng)檢測(cè)的方法的技術(shù)效果和優(yōu)點(diǎn):

28、1.能夠使遙感圖像檢測(cè)軟件可以及時(shí)更新最新的算法進(jìn)行地物自動(dòng)檢測(cè),保證檢測(cè)效率與準(zhǔn)確性。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1