本發(fā)明涉機(jī)器學(xué)習(xí)領(lǐng)域,特別涉及一種基于卷積神經(jīng)的農(nóng)作物害蟲(chóng)圖像識(shí)別方法。
背景技術(shù):
傳統(tǒng)的病蟲(chóng)害診斷采用人工觀測(cè)的方式,這一方式存在主觀性、局限性、模糊性等不足。隨著計(jì)算機(jī)圖像處理以及人工智能技術(shù)的發(fā)展,人們開(kāi)始利用計(jì)算機(jī)代替人來(lái)進(jìn)行農(nóng)作物的病蟲(chóng)害診斷,提出了在計(jì)算機(jī)上實(shí)現(xiàn)病蟲(chóng)害的識(shí)別。
目前有基于傳統(tǒng)的圖像識(shí)別技術(shù)對(duì)病蟲(chóng)害圖像進(jìn)行識(shí)別,該技術(shù)采用灰度變換、中值濾波、閥值分割、輪廓檢測(cè)、病斑提取作為與處理數(shù)據(jù),從預(yù)處理數(shù)據(jù)顯式提取紋理特征、顏色特征和形狀特征。傳統(tǒng)的圖像識(shí)別方法是基于圖像的“點(diǎn)特征”或“線特征”進(jìn)行的。對(duì)于一般圖像的識(shí)別匹配效果較好,但是當(dāng)光照條件較復(fù)雜、拍照角度變化大時(shí),魯棒性不好?;诰矸e神經(jīng)的圖像識(shí)別方法克服了傳統(tǒng)算法中對(duì)光照條件改變和拍照角度改變適應(yīng)性不強(qiáng)的問(wèn)題。
而且,上述傳統(tǒng)的圖像識(shí)別方法只提取圖像的部分具有代表性的特征,比如sift和surf,具有一定的局限性,某些過(guò)程還需要人工選??;人工神經(jīng)網(wǎng)絡(luò)容易過(guò)擬合,參數(shù)很難調(diào)整,訓(xùn)練比較慢,并且在層數(shù)較少時(shí)效果并不比其他方法更優(yōu)。
20世紀(jì)60年代,hubel和wiesel在研究貓腦皮層中用于局部敏感和方向選擇的神經(jīng)元時(shí)發(fā)現(xiàn)其獨(dú)特的網(wǎng)絡(luò)結(jié)構(gòu)可以有效地降低反饋神經(jīng)網(wǎng)絡(luò)的復(fù)雜性,繼而提出了卷積神經(jīng)網(wǎng)(convolutionalneuralnetworks-簡(jiǎn)稱(chēng)cnn)?,F(xiàn)在,cnn已經(jīng)成為眾多科學(xué)領(lǐng)域的研究熱點(diǎn)之一,特別是在模式分類(lèi)領(lǐng)域,由于該網(wǎng)絡(luò)避免了對(duì)圖像的復(fù)雜前期預(yù)處理,可以直接輸入原始圖像,因而得到了更為廣泛的應(yīng)用。
技術(shù)實(shí)現(xiàn)要素:
為解決現(xiàn)有技術(shù)中的缺點(diǎn)和不足,本發(fā)明提出一種基于卷積神經(jīng)的農(nóng)作物害蟲(chóng)圖像識(shí)別方法,將卷積神經(jīng)與農(nóng)作物害蟲(chóng)圖像識(shí)別相結(jié)合,采用逐層初始化的訓(xùn)練方式,充分發(fā)揮深度學(xué)習(xí)自我學(xué)習(xí)的優(yōu)勢(shì)可以有效解決特征提取困難、訓(xùn)練難度大、參數(shù)很難調(diào)整的問(wèn)題。
本發(fā)明的技術(shù)方案時(shí)這樣實(shí)現(xiàn)的:
一種基于卷積神經(jīng)的農(nóng)作物害蟲(chóng)圖像的方法,包括:農(nóng)作物害蟲(chóng)圖像數(shù)據(jù)庫(kù)、圖像預(yù)處理、卷積神經(jīng)網(wǎng)絡(luò)和模型;農(nóng)作物害蟲(chóng)圖像數(shù)據(jù)庫(kù)的圖像經(jīng)過(guò)預(yù)處理輸入到卷積神經(jīng)網(wǎng)絡(luò),經(jīng)過(guò)帶標(biāo)簽圖像訓(xùn)練后得到逐層計(jì)算后能夠提取具有代表性的特征的模型,將要分類(lèi)的圖像經(jīng)過(guò)預(yù)處理輸入到訓(xùn)練好模型的卷積神經(jīng)網(wǎng)絡(luò)得到該圖像屬于各種類(lèi)型的概率。
可選地,所述輸入層,隱藏層和輸出層,包括以下步驟:
步驟a,輸入層輸入經(jīng)過(guò)預(yù)處理的三通道圖像像素值。
步驟b,隱含層包括:卷積層、池化層、dropout層和全連接層,隱藏層首先使用前向傳播,再食用反向傳播進(jìn)行訓(xùn)練;
步驟c,輸出層即進(jìn)行分類(lèi)的層,分類(lèi)器softmax接收全連接層輸入,輸出該圖像所屬各類(lèi)別的概率。
可選地,隱藏層使用前向傳播的步驟,具體包括:
步驟a,從樣本集中取一個(gè)樣本x,yp,將x輸入網(wǎng)絡(luò);
步驟b,計(jì)算相應(yīng)的實(shí)際輸出op。
在此階段,信息從輸入層經(jīng)過(guò)逐級(jí)的變換,傳送到輸出層。這個(gè)過(guò)程也是網(wǎng)絡(luò)在完成訓(xùn)練后正常運(yùn)行時(shí)執(zhí)行的過(guò)程。在此過(guò)程中,網(wǎng)絡(luò)執(zhí)行的計(jì)算是(實(shí)際上就是輸入與每層的權(quán)值矩陣相點(diǎn)乘,得到最后的輸出結(jié)果):
op=fn(…(f2(f1(x*w1+b1)w2+b2)…)wn+bn)。
可選地,隱藏層使用反向傳播,具體過(guò)程為:
步驟a,計(jì)算實(shí)際輸出op與相應(yīng)的理想輸出yp的差;
步驟b,按極小化誤差的方法反向傳播調(diào)整權(quán)矩陣。
算法如下的:
卷積層的輸出=sigmoid(sum(卷積值)+偏移量)。
本發(fā)明的有益效果是:
1、充分發(fā)揮深度學(xué)習(xí)的自我學(xué)習(xí)優(yōu)勢(shì),經(jīng)過(guò)前向傳播和反向傳播訓(xùn)練得到能提取具有代表性特征的模型,當(dāng)輸入一副圖像時(shí),能夠快速準(zhǔn)確的提取特征,進(jìn)行逐層抽象知道形成某一事物的概念,并用分類(lèi)器進(jìn)行分類(lèi);
2、利用深度學(xué)習(xí)網(wǎng)絡(luò)的結(jié)構(gòu)特征,采取逐層初始化的訓(xùn)練機(jī)制,大大降低訓(xùn)練難度;
3、由于深度學(xué)習(xí)網(wǎng)絡(luò)將圖像分割后提取每一部分的特征,然后再將特征進(jìn)行組合,而非直接比較整幅圖,從任何角度拍攝獲取的圖像,得到的局部特征都幾乎相同,這就解決了拍攝角度的問(wèn)題;而且可以識(shí)別位移、縮放及其他形式扭曲不變性的二維圖形,這就解決了拍攝角度限制的問(wèn)題。
4、卷積神經(jīng)與農(nóng)民關(guān)注的農(nóng)作害蟲(chóng)防治結(jié)合,更方便農(nóng)民治理害蟲(chóng),易于被認(rèn)可和傳播,提高研究?jī)r(jià)值。
附圖說(shuō)明
圖1是本發(fā)明所述卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖;
圖2是本發(fā)明所述卷積示意圖;
圖3是本發(fā)明所述dropout層示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)例僅僅是本發(fā)明一部分實(shí)例,而不是全部的實(shí)例?;诒景l(fā)明中的實(shí)例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲的的所有其他實(shí)例,都屬于本發(fā)明保護(hù)的范圍。
如圖1-3所示,本發(fā)明的基于卷積神經(jīng)的農(nóng)作物害蟲(chóng)圖像識(shí)別方法,包括:農(nóng)作物害蟲(chóng)圖像數(shù)據(jù)庫(kù)、圖像預(yù)處理、卷積神經(jīng)網(wǎng)絡(luò)和模型;農(nóng)作物害蟲(chóng)圖像數(shù)據(jù)庫(kù)的圖像經(jīng)過(guò)預(yù)處理輸入到卷積神經(jīng)網(wǎng)絡(luò),經(jīng)過(guò)帶標(biāo)簽圖像訓(xùn)練后得到逐層計(jì)算后能夠提取具有代表性的特征的模型,將要分類(lèi)的圖像經(jīng)過(guò)預(yù)處理輸入到訓(xùn)練好模型的卷積神經(jīng)網(wǎng)絡(luò)得到該圖像屬于各種類(lèi)型的概率,即分類(lèi)結(jié)果。
其中,深度學(xué)習(xí)網(wǎng)絡(luò)分為:輸入層、隱藏層和輸出層,包括以下步驟:
步驟a,輸入層輸入經(jīng)過(guò)預(yù)處理的三通道圖像像素值。
步驟b,隱藏層設(shè)置為7層,首先使用前向傳播,再使用反向傳播修改模型參數(shù)來(lái)進(jìn)行訓(xùn)練。
步驟c,輸出層進(jìn)行分類(lèi)的層,分類(lèi)器softmax接收全連接層輸入,輸出該圖像所屬各類(lèi)別的概率。
隱藏層使用前向傳播的步驟,具體包括:
步驟a,從樣本集中取一個(gè)樣本x,yp,將x輸入網(wǎng)絡(luò);
步驟b,計(jì)算相應(yīng)的實(shí)際輸出op。
在此階段,信息從輸入層經(jīng)過(guò)逐級(jí)的變換,傳送到輸出層。這個(gè)過(guò)程也是網(wǎng)絡(luò)在完成訓(xùn)練后正常運(yùn)行時(shí)執(zhí)行的過(guò)程。在此過(guò)程中,網(wǎng)絡(luò)執(zhí)行的計(jì)算是(實(shí)際上就是輸入與每層的權(quán)值矩陣相點(diǎn)乘,得到最后的輸出結(jié)果):
op=fn(…(f2(f1(x*w1+b1)w2+b2)…)wn+bn)
隱藏層使用反向傳播,具體過(guò)程為:
步驟a,計(jì)算前向傳播輸出op與相應(yīng)的理想輸出yp的差;
步驟b,按極小化誤差的方法反向傳播調(diào)整權(quán)矩陣。
其中,上述步驟b中,調(diào)整權(quán)矩陣過(guò)程為:通過(guò)梯度下降法修改權(quán)值w和偏移值b使前向傳播輸出值op收斂。
算法如下的:
卷積層的輸出=sigmoid(sum(卷積值)+偏移量);
圖2為本發(fā)明中部分卷積神經(jīng)網(wǎng)絡(luò)的解析圖,由圖2可以看出,輸入層為顯層,輸入經(jīng)過(guò)預(yù)處理的圖像像素值。
本發(fā)明充分發(fā)揮深度學(xué)習(xí)的自我學(xué)習(xí)優(yōu)勢(shì),經(jīng)過(guò)前向傳播和反向傳播訓(xùn)練得到能提取具有代表性特征的模型,當(dāng)輸入一副圖像時(shí),能夠快速準(zhǔn)確的提取特征,進(jìn)行逐層抽象知道形成某一事物的概念,并用分類(lèi)器進(jìn)行分類(lèi);而且可以識(shí)別位移、縮放及其他形式扭曲不變性的二維圖形,這就解決了拍攝角度限制的問(wèn)題。
而且,由于深度學(xué)習(xí)網(wǎng)絡(luò)將圖像分割后提取每一部分的特征,然后再將特征進(jìn)行組合,而非直接比較整幅圖像,從任何角度拍攝獲取的圖像,得到的局部特征都幾乎相同,這就解決了拍攝角度限制的問(wèn)題。
并且,農(nóng)作物害蟲(chóng)圖像的識(shí)別更關(guān)注農(nóng)作物的產(chǎn)量和質(zhì)量,利于普遍推廣,將兩者結(jié)合具有很高的研究?jī)r(jià)值與應(yīng)用前景。
以上所述僅為本發(fā)明的較佳實(shí)例而已,并不用以限制本發(fā)明,凡在本發(fā)明精神和原則之內(nèi),所作出的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。