本發(fā)明屬于圖像檢測,進一步涉及遙感圖像變化檢測技術,具體為一種基于張量分解與自注意力機制的遙感圖像變化檢測方法,可用于城市擴展、生態(tài)環(huán)境監(jiān)測、自然災害響應領域。
背景技術:
0、技術背景
1、遙感圖像變化檢測是遙感數(shù)據(jù)處理中的一項關鍵技術,旨在通過對比不同時間點的遙感圖像來檢測地表變化。在城市擴展、生態(tài)環(huán)境監(jiān)測、自然災害響應等領域,變化檢測技術已經得到了廣泛應用。隨著全球城市化進程加速以及環(huán)境問題日益嚴重,如何準確、高效地對地表變化進行檢測,成為城市規(guī)劃、環(huán)境管理和災害評估等領域的迫切需求。然而,隨著遙感圖像分辨率的提高以及數(shù)據(jù)維度的增加(如多光譜和高光譜圖像),傳統(tǒng)的變化檢測方法在應對高維數(shù)據(jù)時逐漸暴露出諸多不足。例如,早期的像素級變化檢測方法,如變化矢量分析(change?vector?analysis,cva)和差分圖像法,盡管在低分辨率數(shù)據(jù)中具有較好的效果,但其在高分辨率數(shù)據(jù)中表現(xiàn)不佳,主要原因在于對噪聲過于敏感且無法充分利用復雜的空間結構信息。
2、近年來,深度學習技術的發(fā)展為遙感圖像變化檢測提供了新思路。特別是卷積神經網絡cnn和transformer等模型在處理大規(guī)模圖像數(shù)據(jù)的特征提取和分類方面表現(xiàn)出色。cnn通過卷積核提取圖像的局部特征,在圖像分類和變化檢測任務中取得了顯著的效果。例如,daudt等人提出了一種基于深度卷積網絡的變化檢測方法,通過多層卷積提取圖像特征,并使用差分圖像來判斷地表變化。盡管如此,cnn的局部感受野限制了其捕捉全局特征的能力,在面對復雜的地表變化時,難以有效地結合局部和全局信息。transformer模型通過引入自注意力機制在提取長距離依賴特征方面展現(xiàn)了巨大的優(yōu)勢,逐漸被引入到遙感圖像的變化檢測任務中。dosovitskiy等人提出的vision?transformer(vit)模型通過將圖像分塊并對這些塊之間的關系進行自注意力分析,實現(xiàn)了對圖像的分類和特征提取。然而,transformer在處理圖像時需要將二維圖像展平成一維向量,這種展平過程可能會導致圖像的空間信息丟失,尤其是對于高分辨率和多光譜圖像,影響更為明顯,限制了transformer在復雜遙感任務中的應用。
3、目前的變化檢測算法在處理高分辨率遙感圖像時,往往涉及大量計算和高復雜度的網絡結構,導致算法的計算成本和資源消耗較高,尤其在硬件資源有限的場景中難以實現(xiàn)高效運行。
技術實現(xiàn)思路
1、本發(fā)明的目的在于克服上述現(xiàn)有技術的不足,提出了一種基于張量分解與自注意力機制的遙感圖像變化檢測方法,主要解決現(xiàn)有技術對于復雜地物變化分類效果不佳的問題。傳統(tǒng)模型通常存在計算復雜度高、信息丟失以及分類效果受限的情況,本發(fā)明通過引入張量分解與自注意力機制相結合,構建新型的遙感圖像變化檢測網絡,利用張量神經網絡保留圖像的空間結構信息并降低計算量,自注意力機制全面捕捉全局特征,增強變化檢測的準確性和魯棒性,在不增加顯著計算開銷的情況下提高變化檢測的精度和效率,適用于高分辨率遙感圖像的變化檢測任務。
2、為實現(xiàn)上述目的,本發(fā)明采用的技術方案包括如下步驟:
3、(1)對輸入的多時相遙感影像進行預處理,用于減少輸入影像中的光照和幾何差異,得到預處理后的三通道影像數(shù)據(jù);
4、(2)構建張量神經網絡與transformer相結合的張量transformer模型,將預處理后的三通道影像數(shù)據(jù)作為模型輸入數(shù)據(jù),經過模型處理獲取全局特征,實現(xiàn)步驟如下:
5、(2.1)通過張量神經網絡對預處理后的三通道影像數(shù)據(jù)進行特征分解和優(yōu)化,提取數(shù)據(jù)特征,得到核心張量g;
6、(2.2)利用transformer的自注意力機制對張量分解網絡提取的特征進行全局建模,挖掘影像中長距離的依賴關系和變化特征;即通過將張量神經網絡的核心張量g直接作為transformer的輸入單元,用于保留影像的空間和光譜結構,然后基于transformer進行計算,得到全局特征張量f;
7、(3)對張量transformer模型進行迭代訓練,通過不斷調整模型參數(shù)實現(xiàn)優(yōu)化,得到用于變化檢測任務的最終模型;
8、(4)通過分類器對最終模型得到的全局特征張量進行像素級分類,生成與輸入影像大小一致的二值變化檢測圖。
9、與現(xiàn)有技術相比,本發(fā)明具有以下有益效果:
10、第一、本發(fā)明通過引入張量神經網絡,有效地從遙感圖像中提取關鍵特征,保留了空間結構信息,避免了傳統(tǒng)展平操作中大量結構信息丟失的情況,與傳統(tǒng)高維數(shù)據(jù)處理方式相比,張量分解的方法顯著提高了變化檢測的精度。
11、第二、本發(fā)明創(chuàng)新提出了結合張量分解與transformer模型的新網絡結構,通過張量分解降低模型參數(shù)量,同時利用transformer的自注意力機制捕捉影像中的全局特征,克服了卷積神經網絡感受野有限的局限性;在變化檢測任務中,該網絡能夠更全面地提取特征,有效提升對復雜地物變化的分類精度。
12、第三、由于本發(fā)明采用了高效的張量分解與transformer相結合的方式,減少了計算步驟,優(yōu)化了特征提取過程的復雜度;通過有效的特征降維與自注意力機制的結合,模型在高分辨率、多光譜影像的變化檢測任務中表現(xiàn)出更高的效率和更強的魯棒性,從而實現(xiàn)了在資源有限的情況下快速、準確地完成變化檢測。
1.一種基于張量分解與自注意力機制的遙感圖像變化檢測方法,其特征在于,包括如下步驟:
2.根據(jù)權利要求1所述的方法,其特征在:步驟(1)所述預處理,包括亮度歸一化和影像配準操作。
3.根據(jù)權利要求2所述的方法,其特征在:所述亮度歸一化操作,具體如下:
4.根據(jù)權利要求2所述的方法,其特征在:所述影像配準操作,具體是將多時相影像中的對應像素點對齊到相同的地理坐標系下,配準方法包括以下步驟:
5.根據(jù)權利要求1所述的方法,其特征在:步驟(2)所述張量神經網絡,是利用張量特征提取層實現(xiàn)特征提取,該特征提取層選用tucker分解的逆過程,即使用包含n個矩陣的矩陣組從原始數(shù)據(jù)x中提取特征,得到張量y。
6.根據(jù)權利要求1所述的方法,其特征在:步驟(2.1)通過張量神經網絡對預處理后的三通道影像數(shù)據(jù)進行特征分解和優(yōu)化,提取數(shù)據(jù)特征,得到核心張量g;實現(xiàn)步驟如下:
7.根據(jù)權利要求6所述的方法,其特征在:步驟(2.2)所述基于transformer進行計算,得到全局特征張量f,實現(xiàn)步驟如下:
8.根據(jù)權利要求7所述的方法,其特征在:步驟(2.2.2)所述利用transformer的多頭自注意力機制mhsa對張量塊進行操作,其中每個注意力頭的計算公式如下:
9.根據(jù)權利要求1所述的方法,其特征在:步驟(3)所述對張量transformer模型進行迭代訓練,具體是通過監(jiān)督學習的方式最小化預測的變化檢測圖y和真實的標注變化檢測圖ytrue之間的誤差進行優(yōu)化;步驟如下:
10.根據(jù)權利要求1所述的方法,其特征在:步驟(4)所述二值變化檢測圖,根據(jù)如下操作得到: