本發(fā)明屬于醫(yī)學(xué)影像處理,特別是涉及一種增強(qiáng)型yolov7腦部mri腫瘤識(shí)別方法。
背景技術(shù):
1、腦部mri影像腫瘤檢測(cè)是醫(yī)學(xué)影像分析中的一項(xiàng)關(guān)鍵任務(wù),能夠輔助醫(yī)生對(duì)腦腫瘤進(jìn)行早期診斷和治療決策。然而,現(xiàn)有的腫瘤檢測(cè)技術(shù)在面對(duì)腦部mri影像中的復(fù)雜性、尺度差異以及不同腫瘤形態(tài)時(shí),依然面臨許多挑戰(zhàn)。傳統(tǒng)的醫(yī)學(xué)影像處理方法雖然在某些情況下取得了一定的成果,但往往依賴于手工特征提取和局部分析,難以全面捕捉腫瘤的多樣性特征和復(fù)雜結(jié)構(gòu)。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,基于卷積神經(jīng)網(wǎng)絡(luò)(cnn)的方法在腦腫瘤檢測(cè)中取得了顯著進(jìn)展,但現(xiàn)有模型通常存在計(jì)算開銷大、推理速度慢等問題,尤其是在處理高分辨率的mri影像時(shí)。
2、yolo系列目標(biāo)檢測(cè)算法作為一種高效的實(shí)時(shí)檢測(cè)模型,憑借其單階段檢測(cè)框架、端到端的訓(xùn)練方式以及優(yōu)異的推理速度,在各類目標(biāo)檢測(cè)任務(wù)中得到了廣泛應(yīng)用。然而,yolov7雖然在檢測(cè)精度和速度上取得了良好的平衡,但仍面臨處理腦部mri影像中細(xì)微和多變的腫瘤特征的挑戰(zhàn)。尤其是在高頻和低頻特征的分離、局部和全局特征的融合、多尺度特征的響應(yīng)等方面,仍有提升空間?,F(xiàn)有技術(shù)存在以下不足:
3、1)傳統(tǒng)方法的局限性:傳統(tǒng)的腦部mri影像腫瘤檢測(cè)方法多依賴于人工標(biāo)注或者基于規(guī)則的圖像處理技術(shù),這些方法在處理復(fù)雜、模糊且多變的影像特征時(shí),往往表現(xiàn)不佳。特別是在面對(duì)形態(tài)不規(guī)則、位置不同的腫瘤時(shí),傳統(tǒng)方法很難保證高效且精確的檢測(cè)結(jié)果,導(dǎo)致檢測(cè)結(jié)果不夠準(zhǔn)確且易受圖像質(zhì)量的影響。
4、2)現(xiàn)有深度學(xué)習(xí)方法的不足:雖然現(xiàn)代深度學(xué)習(xí)方法在許多醫(yī)學(xué)影像分析任務(wù)中取得了顯著進(jìn)展,但部分現(xiàn)有的深度學(xué)習(xí)模型仍然未能充分挖掘腫瘤區(qū)域與正常腦組織之間的復(fù)雜關(guān)系。這種缺乏深層次理解的局限性可能導(dǎo)致對(duì)腫瘤區(qū)域的錯(cuò)誤識(shí)別或漏檢,從而影響診斷的精度和可靠性,尤其是在腫瘤邊界模糊或位置較小的情況下。
5、3)假陽性問題的挑戰(zhàn):假陽性問題一直是醫(yī)學(xué)影像檢測(cè)中不可忽視的難題。對(duì)于腦部mri影像中的腫瘤檢測(cè),假陽性可能導(dǎo)致模型錯(cuò)誤地將非腫瘤區(qū)域識(shí)別為腫瘤,進(jìn)而導(dǎo)致錯(cuò)誤診斷。這不僅會(huì)增加患者的焦慮情緒,還可能引發(fā)不必要的醫(yī)療干預(yù),如多次檢查或不必要的手術(shù)治療,進(jìn)而浪費(fèi)寶貴的醫(yī)療資源并增加患者的身體負(fù)擔(dān)。
6、因此,需要提出一種增強(qiáng)型yolov7腦部mri腫瘤識(shí)別方法來解決上述問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明所要解決的技術(shù)問題是提供一種增強(qiáng)型yolov7腦部mri腫瘤識(shí)別方法,旨在解決現(xiàn)有技術(shù)在處理復(fù)雜、模糊且多變的影像特征時(shí)表現(xiàn)不佳,對(duì)于腫瘤識(shí)別挖掘深度不足,且假陽性率較高,容易產(chǎn)生誤判的問題,在保持輕量化參數(shù)的同時(shí),能夠精確提取腦腫瘤的細(xì)微特征,從而實(shí)現(xiàn)更快的推理速度和更高的檢測(cè)精度。
2、為實(shí)現(xiàn)上述技術(shù)效果,本發(fā)明所采用的技術(shù)方案是:
3、一種增強(qiáng)型yolov7腦部mri腫瘤識(shí)別方法,包括以下步驟:
4、s1,獲取并預(yù)處理腦部mri影像,包括調(diào)整尺寸和歸一化,確保數(shù)據(jù)一致性;
5、s2,采用小波變換將輸入圖像的高頻和低頻特征分離,以有效捕捉腫瘤在不同頻域下的細(xì)節(jié)信息;
6、s3,利用cnn-att模塊結(jié)合自注意力機(jī)制與局部特征學(xué)習(xí),增強(qiáng)模型對(duì)腦腫瘤復(fù)雜形態(tài)的處理能力;
7、s4,使用深度融合模塊進(jìn)行多尺度特征融合,整合來自不同層次的特征信息;
8、s5,將提取融合后的特征進(jìn)行檢測(cè)識(shí)別;
9、s6,對(duì)改進(jìn)后的yolov7模型在公開腦部mri影像數(shù)據(jù)集上進(jìn)行評(píng)估。
10、優(yōu)選地,步驟s1包括:
11、收集腦部mri影像數(shù)據(jù)構(gòu)建數(shù)據(jù)集,數(shù)據(jù)集包含多種腦腫瘤類型;且圖像質(zhì)量較高,腫瘤區(qū)域標(biāo)注清晰;
12、將影像調(diào)整為yolov7模型所要求的輸入尺寸,并對(duì)像素值進(jìn)行歸一化處理,以確保數(shù)據(jù)的一致性和穩(wěn)定性。
13、進(jìn)一步地,小波變換是一種用于多尺度和多頻率特征提取的圖像處理方法。小波變換能夠在不同的尺度上分離圖像的高頻(細(xì)節(jié)信息)與低頻(主要結(jié)構(gòu)信息)特征,從而增強(qiáng)腫瘤區(qū)域在不同尺度上的表現(xiàn);小波變換是一種通過多尺度的方式來分析信號(hào)的數(shù)學(xué)工具。它通過將信號(hào)與一組稱為“小波”的函數(shù)進(jìn)行卷積,能夠?qū)D像的高頻和低頻信息分離。
14、優(yōu)選地,步驟s2中小波變換的形式如下:
15、;
16、其中是輸入的圖像信號(hào), (t)是母小波函數(shù),是尺度因子,是平移因子。
17、進(jìn)一步地,小波變換提供了時(shí)間(或空間)和頻率的局部化信息,能夠有效地捕捉信號(hào)的局部特征。
18、優(yōu)選地,在小波變換后,得到的結(jié)果為多個(gè)頻率層次的子圖像;小波變換將圖像分解為不同尺度和頻率的組件,包括低頻平滑信息和高頻邊緣和細(xì)節(jié)信息,形式上為:
19、;
20、其中表示圖像的低頻分量,表示圖像的主要結(jié)構(gòu)和輪廓;表示高頻分量,包括圖像中的細(xì)節(jié)和邊緣信息。
21、進(jìn)一步地,高頻與低頻的分離通常通過將小波變換后的系數(shù)分解為近似和細(xì)節(jié)兩部分實(shí)現(xiàn)。低頻部分保持較長(zhǎng)時(shí)間的結(jié)構(gòu),而高頻部分則包含快速變化的細(xì)節(jié)。使用小波變換來增強(qiáng)腫瘤檢測(cè)需要對(duì)輸入的腦部mri影像進(jìn)行小波變換后,將低頻部分和高頻部分分離。對(duì)于腫瘤檢測(cè),低頻信息有助于保留腫瘤區(qū)域的全局結(jié)構(gòu),可以幫助模型識(shí)別腫瘤的區(qū)域及其大概位置;而高頻信息則揭示了腫瘤的細(xì)節(jié)特征,特別是邊緣部分,有助于精細(xì)的定位和診斷。
22、優(yōu)選地,在經(jīng)過小波分解后,對(duì)不同尺度和頻率的特征進(jìn)行選擇性融合,得到最終的多尺度特征表示:
23、;
24、其中,表示底個(gè)尺度的特征,是權(quán)重因子。
25、進(jìn)一步地,小波分解對(duì)不同尺度和頻率的特征進(jìn)行融合,以便模型能夠綜合不同尺度下的腫瘤特征,增強(qiáng)對(duì)復(fù)雜腫瘤形態(tài)的處理能力。
26、優(yōu)選地,步驟s3包括:
27、cnn-att模塊結(jié)合了自注意力機(jī)制(self-attention)和局部特征學(xué)習(xí)(localfeature?learning),旨在通過更精細(xì)地捕捉圖像中的局部特征以及全局上下文信息,提升模型對(duì)于復(fù)雜腦腫瘤形態(tài)的處理能力。
28、自注意力機(jī)制(self-attention)是近年來在自然語言處理和計(jì)算機(jī)視覺中廣泛應(yīng)用的技術(shù),其核心思想是通過計(jì)算每個(gè)位置(如像素)與其他位置的關(guān)系,捕捉全局依賴性。自注意力機(jī)制使得模型能夠關(guān)注到遠(yuǎn)距離的信息,并且自適應(yīng)地加權(quán)各個(gè)部分的貢獻(xiàn)。其基本原理是在特征圖中計(jì)算每個(gè)位置與其他位置的相關(guān)性(權(quán)重),以決定該位置對(duì)全局上下文信息的依賴程度。
29、局部特征學(xué)習(xí)(local?feature?learning)主要是通過深度卷積來提取圖像中的局部信息。它能夠識(shí)別腫瘤的細(xì)節(jié)特征,包括邊緣、紋理等,對(duì)局部區(qū)域的處理精度至關(guān)重要。
30、cnn-att模塊通過將自注意力機(jī)制與卷積神經(jīng)網(wǎng)絡(luò)結(jié)合,既能夠捕捉局部細(xì)節(jié),也能有效整合全局信息,尤其對(duì)于腫瘤的復(fù)雜形態(tài)和不同尺度的變化具有優(yōu)勢(shì)。
31、通過深度可分離卷積進(jìn)行特征提取,獲取輸入圖像特征;在卷積操作中通過局部感受野學(xué)習(xí)局部特征,捕捉腫瘤的細(xì)節(jié)結(jié)構(gòu)包括邊緣和局部紋理;自適應(yīng)選擇卷積核的大小和步幅,以捕捉不同大小和形態(tài)的腫瘤特征;公式表示為:
32、;
33、其中,表示局部特征圖,表示卷積操作,是輸入圖像特征。
34、優(yōu)選地,步驟s3中,局部特征學(xué)習(xí)結(jié)束后進(jìn)行全局特征處理,將特征圖進(jìn)行降采樣,通過注意力機(jī)制捕捉全局信息,然后將特征圖還原到原始尺寸;自注意力機(jī)制通過計(jì)算輸入特征圖各位置之間的相關(guān)性,為每個(gè)位置分配不同的權(quán)重,進(jìn)而加權(quán)組合各個(gè)位置的特征;
35、這種方式能夠讓模型在進(jìn)行特征提取時(shí)考慮圖像的全局上下文信息,幫助模型關(guān)注到腫瘤的細(xì)微變化和遠(yuǎn)距離依賴關(guān)系;自注意力機(jī)制的計(jì)算步驟如下:
36、輸入的特征圖經(jīng)過降采樣后變?yōu)?,再?jīng)過線性變換,生成query(查詢)、key(鍵)和value(值)三個(gè)矩陣:
37、;
38、其中,,,分別是用于生成query、key、value的權(quán)重矩陣;自注意力機(jī)制通過計(jì)算query與key之間的相似性來生成權(quán)重矩陣,使用點(diǎn)積操作:
39、;
40、其中,是注意力矩陣,是特征的維度,計(jì)算了query和key之間的點(diǎn)積;
41、將注意力權(quán)重應(yīng)用于value矩陣,得到最終的加權(quán)特征圖:
42、;
43、其中,經(jīng)過自注意力機(jī)制處理后的特征圖;將局部特征和自注意力特征進(jìn)行融合,這樣,模型既能夠保留腫瘤的細(xì)節(jié)信息,也能夠結(jié)合全局上下文的關(guān)聯(lián)性進(jìn)行綜合處理;
44、融合后的特征圖進(jìn)一步輸入到后續(xù)的網(wǎng)絡(luò)模塊中進(jìn)行進(jìn)一步處理,公式表示為:
45、;
46、其中,是融合權(quán)重,根據(jù)任務(wù)的需求進(jìn)行選擇;是融合后的特征圖。
47、進(jìn)一步地,cnn-att模塊通過自注意力機(jī)制與局部特征學(xué)習(xí)的結(jié)合,顯著提升了yolov7對(duì)復(fù)雜腦腫瘤形態(tài)的處理能力。自注意力機(jī)制使得模型能夠關(guān)注全局信息,并根據(jù)圖像中不同區(qū)域的重要性進(jìn)行加權(quán);而局部特征學(xué)習(xí)則保證了細(xì)節(jié)的精確捕捉。這種多層次、多尺度的信息融合有助于模型在面對(duì)復(fù)雜的腫瘤形態(tài)時(shí),能夠準(zhǔn)確地提取有效特征并進(jìn)行精確分類。
48、優(yōu)選地,步驟s4包括:
49、深度融合模塊的主要目的是對(duì)多個(gè)尺度的特征圖進(jìn)行有效融合,確保每個(gè)尺度的信息都能為最終的腫瘤檢測(cè)提供貢獻(xiàn)。通常情況下,低層的特征圖具有更高的空間分辨率,但語義信息較弱;而高層特征則具有較強(qiáng)的語義信息,但空間分辨率較低。深度融合通過多尺度的聚合機(jī)制,彌補(bǔ)了這些差異,使得網(wǎng)絡(luò)能夠同時(shí)考慮細(xì)節(jié)和全局信息。
50、首先對(duì)輸入的圖像通過多個(gè)不同的網(wǎng)絡(luò)層提取特征,每個(gè)層次的特征圖都具有不同的空間分辨率和語義信息,低層特征通常具有較高的空間分辨率(細(xì)節(jié)豐富),而深層特征則通常具有較低的空間分辨率但更抽象的語義信息(全局視野)。
51、為了捕捉多種尺度上的信息,深度融合模塊通常通過不同尺度的卷積操作提取特征,這些卷積核的大小決定了網(wǎng)絡(luò)對(duì)不同尺度信息的敏感度,通過這種方式,模型能夠在多個(gè)尺度上進(jìn)行特征提取。公式表示為:
52、;
53、其中,表示在尺度下提取到的特征,是輸入特征圖,表示在該尺度下使用的卷積核;
54、為了整合不同尺度的特征,深度融合模塊將提取到的多尺度特征進(jìn)行融合:
55、;
56、其中,表示融合后的特征,是來自第 i層尺度的特征,是學(xué)習(xí)到的融合權(quán)重,是尺度的數(shù)量。
57、融合后的多尺度特征圖通過卷積層進(jìn)一步處理,提取更加高層次的語義信息,并對(duì)腫瘤區(qū)域進(jìn)行精確定位;此時(shí),融合后的特征圖包含了從低層到高層的多種信息,可以更全面地描述腫瘤區(qū)域的空間分布和結(jié)構(gòu)特征。
58、將處理后的特征圖輸入到網(wǎng)絡(luò)的后續(xù)層進(jìn)行分類和回歸操作,最終得到腫瘤的定位和分類結(jié)果。模型能夠在各個(gè)尺度下響應(yīng)腫瘤區(qū)域,并根據(jù)多尺度信息進(jìn)行精確的定位和識(shí)別。
59、優(yōu)選地,步驟s5包括使用yolov7網(wǎng)絡(luò)的后半部分對(duì)提取融合后的特征進(jìn)行候選框生成再經(jīng)過目標(biāo)框回歸檢測(cè)識(shí)別出腦部mri影像的結(jié)果。
60、優(yōu)選地,步驟s6包括:
61、引入map(所有類別的平均精度)、precision(精度)和recall(召回率)三個(gè)指標(biāo)來驗(yàn)證模型的有效性;
62、map綜合了精度和召回率,能夠全面反映模型在不同檢測(cè)精度要求下的表現(xiàn)。precision衡量的是模型預(yù)測(cè)為正類的樣本中,實(shí)際為正類的比例,表示模型的準(zhǔn)確性;recall衡量的是實(shí)際為正類的樣本中,模型能夠正確識(shí)別的比例,表示模型的全面性。通過這三個(gè)指標(biāo),可以全面評(píng)估模型在檢測(cè)任務(wù)中的表現(xiàn)。下面給出具體計(jì)算公式為:
63、;
64、;
65、;
66、;
67、其中是類別總數(shù),是類別的平均精度,是召回率為時(shí)對(duì)應(yīng)的精度,是真正例數(shù),是假正例數(shù)。
68、本發(fā)明的有益效果如下:
69、1,高效的檢測(cè)速度:通過基于yolov7的單階段深度學(xué)習(xí)架構(gòu),結(jié)合重參數(shù)化、多尺度跨層聚合和輔助頭訓(xùn)練等策略,能夠在保持較輕量參數(shù)的同時(shí),提高推理速度,提升處理效率。
70、2,精確的特征提取能力:改進(jìn)后的模型能夠精確地提取腦腫瘤的細(xì)微特征,特別是在復(fù)雜的腦部mri影像中,能夠準(zhǔn)確識(shí)別腫瘤區(qū)域,確保較高的檢測(cè)精度。
71、3,良好的適應(yīng)性和魯棒性:通過深度融合模塊,模型能夠整合不同層次的特征信息,增強(qiáng)了對(duì)各種腫瘤形態(tài)的適應(yīng)能力及魯棒性,特別是在變化多樣的影像數(shù)據(jù)中。
72、4,引入小波變換模塊,精確分離輸入圖像的高頻和低頻特征,有效捕捉腫瘤在不同頻域下的細(xì)節(jié)信息,提升了對(duì)不同類型腫瘤的敏感度;結(jié)合自注意力機(jī)制與局部特征學(xué)習(xí),增強(qiáng)了模型在處理腦腫瘤復(fù)雜形態(tài)時(shí)的能力,使得yolov7能夠更好地捕捉腫瘤的局部細(xì)節(jié)與全局結(jié)構(gòu);通過深度融合模塊整合不同尺度的特征信息,提升了yolov7對(duì)腫瘤區(qū)域的響應(yīng)能力,有效提升了模型在復(fù)雜和多變的腦部mri影像中的表現(xiàn);通過引入重參數(shù)化思想、多尺度跨層聚合和輔助頭訓(xùn)練等策略,在保持輕量化參數(shù)的同時(shí),能夠精確提取腦腫瘤的細(xì)微特征,從而實(shí)現(xiàn)更快的推理速度和更高的檢測(cè)精度。為了進(jìn)一步提升檢測(cè)性能。