本發(fā)明屬于圖像處理領(lǐng)域,具體涉及一種基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割方法。
背景技術(shù):
1、醫(yī)學(xué)圖像分割在現(xiàn)代醫(yī)學(xué)中具有重要作用,它能夠輔助醫(yī)生在疾病診斷、治療規(guī)劃和手術(shù)指導(dǎo)中做出更加高效準(zhǔn)確的決策。然而,醫(yī)學(xué)圖像數(shù)據(jù)復(fù)雜多樣,不同成像設(shè)備如ct、mri和超聲產(chǎn)生的圖像差異性較強(qiáng),同種設(shè)備的圖像,由于患者個(gè)體的差異和病變形態(tài)不同,也存在較大差異,并且圖像中也常存在偽影和噪聲,這些都增加了醫(yī)學(xué)圖像分割的難度。此外,醫(yī)學(xué)圖像分割需要進(jìn)行圖像的標(biāo)注,而這一標(biāo)注過(guò)程需要由專業(yè)的醫(yī)生手動(dòng)完成,不僅耗時(shí)費(fèi)力,而且高度依賴醫(yī)生的個(gè)人經(jīng)驗(yàn)。因此,在復(fù)雜醫(yī)學(xué)環(huán)境中實(shí)現(xiàn)高精度自動(dòng)圖像分割仍然是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。
2、近年來(lái),基于深度學(xué)習(xí)的醫(yī)學(xué)圖像分割方法取得了顯著進(jìn)展。在cnn框架下,以u(píng)net及其變體為代表的模型,利用編碼器-解碼器結(jié)構(gòu)和強(qiáng)大的局部特征提取能力,顯著提升了分割性能。然而,基于cnn的方法受限于局部感受野的大小,在捕獲長(zhǎng)距離上下文特征時(shí)存在不足。為了解決這一問(wèn)題,基于自注意力機(jī)制的transformer方法應(yīng)運(yùn)而生,該方法能夠有效克服計(jì)算機(jī)視覺(jué)任務(wù)中的局限性,但由于其帶來(lái)的巨大參數(shù)量,限制了其在高維醫(yī)學(xué)圖像分割中的應(yīng)用。最近,具有令牌混合mlp塊的多層感知機(jī)在大規(guī)模數(shù)據(jù)集上取得了驚人的性能?;趍lp的模型因其簡(jiǎn)潔的架構(gòu)而受到關(guān)注,但其在小數(shù)據(jù)集的醫(yī)學(xué)圖像分割任務(wù)中存在泛化能力不足的問(wèn)題。
3、然而,雖然當(dāng)前流行的醫(yī)學(xué)圖像分割網(wǎng)絡(luò)取得了一定進(jìn)展,但在網(wǎng)絡(luò)復(fù)雜度和分割精度之間難以取得良好的平衡,同時(shí),現(xiàn)有方法在捕獲圖像細(xì)節(jié)和處理圖像差異性方面仍存在不足,且存在分割精度低的問(wèn)題。
4、因此,如何提高醫(yī)學(xué)圖像分割精度,是本領(lǐng)域亟待解決的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是針對(duì)現(xiàn)有技術(shù)的缺陷,提供一種基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割方法、系統(tǒng)及設(shè)備。本發(fā)明基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割方法,構(gòu)建基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割模型msafnet;獲取醫(yī)學(xué)圖像數(shù)據(jù)集,對(duì)所述基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割模型;獲取待分割醫(yī)學(xué)圖像;將所述待分割醫(yī)學(xué)圖像輸入至訓(xùn)練好的基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割模型,對(duì)所述待分割醫(yī)學(xué)圖像進(jìn)行圖像分割,得到目標(biāo)分割圖像。本發(fā)明通過(guò)多軸混合殘差通道注意力塊mx-rcab混合多尺度特征,關(guān)注局部細(xì)節(jié)和全局依賴性,從而增強(qiáng)空間和通道維度的特征表達(dá);利用空間交叉門(mén)控塊scgb過(guò)濾冗余信息,捕獲具有判別特征的底層細(xì)節(jié)信息,從而解決了現(xiàn)有的圖像分割方法精度低的問(wèn)題。
2、為了實(shí)現(xiàn)以上目的,本發(fā)明采用以下技術(shù)方案:
3、本發(fā)明提出一種基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割方法,其特征在于,包括步驟:
4、s1、構(gòu)建基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割模型msafnet;所述醫(yī)學(xué)圖像分割模型包括編碼器和解碼器,所述編碼器包括cnn塊、多軸混合殘差通道注意力塊mx-rcab,所述解碼器包括空間交叉門(mén)控塊scgb、解碼器塊decoderblock;
5、s2、獲取醫(yī)學(xué)圖像數(shù)據(jù)集,對(duì)所述基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割模型;
6、s3、獲取待分割醫(yī)學(xué)圖像;
7、s4、將所述待分割醫(yī)學(xué)圖像輸入至訓(xùn)練好的基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割模型,對(duì)所述待分割醫(yī)學(xué)圖像進(jìn)行圖像分割,得到目標(biāo)分割圖像。
8、進(jìn)一步地,在所述基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割模型msafnet中,通過(guò)所述cnn塊從輸入的醫(yī)學(xué)圖像中逐層提取多尺度分層特征圖xl,l∈{1,2,…,l},并將提取的分層特征圖輸入至多軸混合殘差通道注意力塊mx-rcab中進(jìn)行空間和通道上的全局信息交互;所述cnn塊由多個(gè)卷積層、池化層和激活函數(shù)組成。
9、進(jìn)一步地,所述多軸混合殘差通道注意力塊mx-rcab包括空間和通道兩個(gè)分支,在空間分支中,使用多軸特征混合mlp來(lái)融合局部和全局特征;在通道分支中,采用殘差通道注意力模塊rcab實(shí)現(xiàn)通道特征的增強(qiáng);
10、然后,將空間分支與通道分支處理后的特征圖進(jìn)行拼接,再通過(guò)輸入的殘差連接融合所有通道,得到編碼器的輸出特征。
11、進(jìn)一步地,所述在空間分支中,使用多軸特征混合mlp來(lái)融合局部和全局特征,具體包括:
12、對(duì)于輸入特征xl∈rc×h×w,l∈{1,2,…,l},其中c、h、w分別表示輸入特征圖的通道數(shù),高度和寬度,l表示編碼器的深度,按vision?transformer的分塊方式劃分為n個(gè)不重疊的窗口,每個(gè)窗口的形狀大小為c×g×g,其中g(shù)為窗口大??;接著,特征圖沿通道維度分為局部分支與全局分支,每個(gè)分支都單獨(dú)使用轉(zhuǎn)置mlp注意力機(jī)制transpose?mlpattention來(lái)增強(qiáng)特征交互;
13、在transpose?mlpattention中,輸入特征x∈rc×h×w沿通道維度分為xa和xb,其中xa,xb∈rc/2×h×w;然后,對(duì)xa進(jìn)行處理以生成注意力權(quán)重,具體過(guò)程為:
14、xa=softmax(w2·relu(w1·xa+b1)+b2)
15、其中,w1,w2分別是mlp的權(quán)重矩陣,b1,b2是偏置項(xiàng),relu是激活函數(shù),softmax函數(shù)用于歸一化以生成注意力權(quán)重xa;隨后,將計(jì)算得到的注意力權(quán)重xa應(yīng)用至線性變換后的xb上,進(jìn)行加權(quán)操作:
16、
17、其中⊙表示逐元素乘法,是加權(quán)后的特征圖,w3是線性變換層的權(quán)重矩陣,b3表示線性層的偏置值。
18、進(jìn)一步地,所述在通道分支中,采用殘差通道注意力模塊rcab實(shí)現(xiàn)通道特征的增強(qiáng),具體包括:
19、對(duì)于輸入特征xl∈rc×h×w,l∈{1,2,...,l},經(jīng)過(guò)卷積層、mlp層及squeeze-excitation模塊生成通道注意力權(quán)重,然后將該注意力權(quán)重與原始特征圖在通道維度上逐元素相乘;另外,殘差連接的加入允許輸入特征圖與加權(quán)后的特征圖相加;過(guò)程表示為:
20、
21、se(x)=σ(wfc((pool(x))))⊙x
22、其中,ln表示層歸一化,mlp表示多層感知機(jī)層,se表示squeeze-excitation模塊,pool表示全局平均池化操作,wfc表示全連接層的權(quán)重矩陣,σ為sigmoid激活函數(shù),⊙表示逐元素乘法,x表示squeeze-excitation模塊的輸入特征,為經(jīng)過(guò)殘差通道注意力機(jī)制增強(qiáng)后的輸出特征圖。
23、進(jìn)一步地,所述空間交叉門(mén)控塊scgb的輸入由編碼器與解碼器輸出的特征x和y組成,它們分別通過(guò)卷積層進(jìn)行維度對(duì)齊并產(chǎn)生對(duì)應(yīng)的特征圖;然后,通過(guò)初步特征激活:
24、xact=σ(fc(ln(conv(x))))
25、yact=σ(fc(ln(conv(y))))
26、其中,conv是3×3卷積層,ln是層歸一化,fc是全連接層,σ是gelu激活函數(shù);
27、scgb的核心組件是交叉門(mén)控模塊cgb,所述交叉門(mén)控模塊對(duì)分塊后的串行窗口應(yīng)用線性層,分別生成查詢q、鍵k和值v;
28、qx,kx,vx=linear(xact)
29、qy,ky,vy=linear(yact)
30、接著,計(jì)算查詢q和鍵k之間的點(diǎn)積,經(jīng)過(guò)softmax激活函數(shù)后,生成的注意力權(quán)重與值v進(jìn)行加權(quán)求和,以得到新的特征表示:
31、
32、
33、其中,dk是縮放因子,用于平衡點(diǎn)積結(jié)果的大??;
34、另外,引入殘差連接進(jìn)行數(shù)據(jù)傳輸;為了保證輸出通道與輸入x和y具有相同的通道尺寸,使用全連接層完成線性變換,具體表示為:
35、outputx=w4(xact⊙a(bǔ)ttentiony)+x
36、outputy=w5(yact⊙a(bǔ)ttentionx)+y
37、其中,⊙表示元素點(diǎn)積,w4,w5表示對(duì)應(yīng)的mlp線性層映射特征,xact和yact表示初步激活后的特征。
38、進(jìn)一步地,所述解碼器塊decoderblock通過(guò)對(duì)解碼器輸出的低分辨率特征圖進(jìn)行上采樣操作,同時(shí)將來(lái)自編碼器中的對(duì)應(yīng)分辨率特征圖與上采樣后的特征圖進(jìn)行逐像素融合,以逐步恢復(fù)目標(biāo)圖像的空間細(xì)節(jié)并增強(qiáng)特征表達(dá);所述上采樣操作通過(guò)雙線性插值方法實(shí)現(xiàn),將低分辨率特征圖擴(kuò)大到更高的分辨率。
39、進(jìn)一步地,對(duì)所述基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割模型進(jìn)行訓(xùn)練時(shí),
40、損失函數(shù)由交叉熵?fù)p失celoss和dice相似系數(shù)損失diceloss兩部分組成,總的損失函數(shù)定義為:
41、l=0.5lce+0.5ldice
42、交叉熵?fù)p失celoss用于衡量預(yù)測(cè)值與真實(shí)標(biāo)簽之間的差異,適用于像素級(jí)分類的語(yǔ)義分割任務(wù),其計(jì)算公式如下:
43、
44、其中n表示一個(gè)批次中的樣本數(shù)量,c表示分類的總數(shù)量,yij表示第i個(gè)樣本在第j個(gè)類別的真實(shí)標(biāo)簽,pij表示第i個(gè)標(biāo)簽在第j個(gè)類別的預(yù)測(cè)概率;
45、dice相似系數(shù)損失diceloss基于dice相似系數(shù),用于評(píng)估分割結(jié)果與真實(shí)標(biāo)注之間的重疊度,其計(jì)算公式如下:
46、
47、其中pi是模型預(yù)測(cè)的分割概率,gi是真實(shí)的分割標(biāo)注。
48、本發(fā)明還提出一種基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割系統(tǒng),其特征在于,所述醫(yī)學(xué)圖像分割系統(tǒng)執(zhí)行所述的基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割方法。
49、本發(fā)明還提出一種計(jì)算機(jī)設(shè)備,所述設(shè)備包括存儲(chǔ)器及處理器,所述存儲(chǔ)器上存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述的方法。
50、與現(xiàn)有技術(shù)相比,具有如下有益效果:
51、1、本發(fā)明的基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割方法,將待分割醫(yī)學(xué)圖像輸入至訓(xùn)練好的基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割模型,對(duì)所述待分割醫(yī)學(xué)圖像進(jìn)行圖像分割,得到目標(biāo)分割圖像;所述基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割模型包含多軸混合殘差通道注意力塊mx-rcab和空間交叉門(mén)控塊scgb,提升了醫(yī)學(xué)圖像分割的精度。
52、2、本發(fā)明的基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割方法,多軸混合殘差通道注意力塊mx-rcab通過(guò)全局與局部特征融合模塊以及殘差通道再加權(quán)機(jī)制,在保留細(xì)節(jié)完整性的同時(shí)捕獲了更大感受野的全局信息,提升了模型處理復(fù)雜結(jié)構(gòu)時(shí)的特征辨別能力,進(jìn)一步提升了圖像分割的精度。
53、3、本發(fā)明的基于軸向mlp和空間交叉門(mén)控的醫(yī)學(xué)圖像分割方法,空間交叉門(mén)控塊scgb模塊,通過(guò)交叉門(mén)控機(jī)制自適應(yīng)融合編碼器的低級(jí)特征與解碼器的高級(jí)特征,有效過(guò)濾了冗余信息并保留關(guān)鍵特征,提高了底層特征的利用率,進(jìn)一步提升了圖像分割的精度。