成人打一炮免费视频,亚洲天堂视频在线观看,97视频久久久,日本japanese护士色高清,五月婷婷丁香,日韩精品一级无码毛片免费,国产欧美日韩精品网红剧情演绎

圖像字符信息的識(shí)別方法、裝置、存儲(chǔ)介質(zhì)及電子裝置與流程

文檔序號(hào):41872575發(fā)布日期:2025-05-09 18:45閱讀:2來(lái)源:國(guó)知局
圖像字符信息的識(shí)別方法、裝置、存儲(chǔ)介質(zhì)及電子裝置與流程

本申請(qǐng)涉及圖像處理領(lǐng)域,具體而言,涉及一種圖像字符信息的識(shí)別方法、圖像字符信息的識(shí)別裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及電子裝置。


背景技術(shù):

1、現(xiàn)有技術(shù)中,以票據(jù)圖像為例的圖像中文字識(shí)別主要采用光學(xué)字符識(shí)別技術(shù),即使用計(jì)算機(jī)視覺(jué)技術(shù)來(lái)檢測(cè)和識(shí)別字符,然后將其轉(zhuǎn)換為可編輯格式。盡管已經(jīng)取得了很大的進(jìn)展,可以應(yīng)用于各種場(chǎng)景,但在處理票據(jù)圖像時(shí)仍然面臨以下問(wèn)題:

2、(1)當(dāng)前已有的票據(jù)圖像識(shí)別系統(tǒng)在處理復(fù)雜的低分辨率或模糊存在噪聲的文字圖像時(shí),可能出現(xiàn)錯(cuò)誤的識(shí)別結(jié)果。尤其是對(duì)于手寫(xiě)、或非標(biāo)準(zhǔn)化文字的票據(jù)圖像,識(shí)別準(zhǔn)確率可能更低。

3、(2)識(shí)別結(jié)果受到圖像質(zhì)量的影響極大,當(dāng)前票據(jù)圖像識(shí)別系統(tǒng)對(duì)圖像質(zhì)量要求較高,對(duì)于采集環(huán)境過(guò)暗、光線不均勻、或者其他圖像失真的情況,識(shí)別準(zhǔn)確率下降嚴(yán)重。


技術(shù)實(shí)現(xiàn)思路

1、本申請(qǐng)的主要目的在于提供一種圖像字符信息的識(shí)別方法、圖像字符信息的識(shí)別裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及電子裝置,以至少解決現(xiàn)有技術(shù)中圖片中的字符信息識(shí)別不準(zhǔn)確的問(wèn)題。

2、根據(jù)本申請(qǐng)的一方面,提供了一種圖像字符信息的識(shí)別方法,包括:獲取待識(shí)別圖像,所述待識(shí)別圖像包括至少一個(gè)字符信息;至少對(duì)所述待識(shí)別圖像進(jìn)行圖像增強(qiáng)處理,以增加所述待識(shí)別圖像的照度,得到預(yù)處理圖像;提取所述預(yù)處理圖像的圖像特征,得到多個(gè)目標(biāo)圖像特征,并獲取多個(gè)所述目標(biāo)圖像特征的概率分布,得到目標(biāo)概率分布,其中,所述目標(biāo)圖像特征為所述字符信息對(duì)應(yīng)的圖像特征;采用ctc算法對(duì)所述目標(biāo)概率分布進(jìn)行處理,得到所述待識(shí)別圖像的識(shí)別結(jié)果。

3、可選地,至少對(duì)所述待識(shí)別圖像進(jìn)行圖像增強(qiáng)處理,以增加所述待識(shí)別圖像的照度,得到預(yù)處理圖像,包括:采用非局部均值去噪算法對(duì)所述待識(shí)別圖像進(jìn)行去噪處理,得到第一處理圖像;對(duì)所述第一處理圖像進(jìn)行雙邊伽馬變換處理,得到第二處理圖像;對(duì)所述第二處理圖像進(jìn)行形態(tài)學(xué)處理,得到第三處理圖像,其中,所述形態(tài)學(xué)處理包括腐蝕處理和膨脹處理;采用canny邊緣算法對(duì)所述第三處理圖像進(jìn)行處理,得到所述第三處理圖像的輪廓信息;根據(jù)所述輪廓信息,對(duì)所述第三處理圖像進(jìn)行霍夫變換處理,得到所述預(yù)處理圖像。

4、可選地,采用非局部均值去噪算法對(duì)所述待識(shí)別圖像進(jìn)行去噪處理,得到第一處理圖像,包括:對(duì)所述待識(shí)別圖像進(jìn)行分割處理,得到多個(gè)圖像塊;分別計(jì)算當(dāng)前圖像塊的平均像素值與其他圖像塊的平均像素值的歐氏距離,得到多個(gè)歐氏距離,其中,所述當(dāng)前圖像塊為任意一個(gè)所述圖像塊,所述其他圖像塊為多個(gè)所述圖像塊中除所述當(dāng)前圖像塊以外的任意一個(gè)所述圖像塊;確定多個(gè)所述歐氏距離中的最大值對(duì)應(yīng)的所述其他圖像塊為所述當(dāng)前圖像塊對(duì)應(yīng)的相似圖像塊;對(duì)所述其他圖像塊的像素值的權(quán)重進(jìn)行加權(quán)平均處理,得到更新像素值,其中,所述其他圖像塊的像素值的權(quán)重與所述歐氏距離呈正比;采用所述更新像素值分別對(duì)多個(gè)所述圖像塊的像素值進(jìn)行更新,得到所述第一處理圖像。

5、可選地,所述第一處理圖像包括多個(gè)第一像素點(diǎn),所述第二處理圖像包括多個(gè)第二像素點(diǎn),對(duì)所述第一處理圖像進(jìn)行雙邊伽馬變換處理,得到第二處理圖像,包括:獲取所述第一像素點(diǎn)的位置信息s0(x0,y0);根據(jù)公式s1(x1,y1)=α(1-(1-s0(x0,y0))γ)+(1-α)(1-(1-s0(x,y)1/γ)γ)對(duì)所述第一像素點(diǎn)進(jìn)行雙邊伽馬變換處理,得到對(duì)應(yīng)的所述第二像素點(diǎn)的位置信息s1(x1,y1),其中,γ為伽馬指數(shù),x0與x1一一對(duì)應(yīng)設(shè)置,y0與y1一一對(duì)應(yīng)設(shè)置,所述伽馬指數(shù)的取值范圍為2~2.5,α為所述第一處理圖像的歸一化像素的平均值。

6、可選地,提取所述預(yù)處理圖像的圖像特征,得到多個(gè)目標(biāo)圖像特征,包括:獲取歷史圖像,所述歷史圖像為當(dāng)前時(shí)刻之前獲取得到的圖像,所述歷史圖像包括至少一個(gè)所述字符信息;將所述預(yù)處理圖像輸入至多尺度卷積神經(jīng)網(wǎng)絡(luò)模型中,得到所述目標(biāo)圖像特征,其中,所述多尺度卷積神經(jīng)網(wǎng)絡(luò)模型為使用所述歷史圖像和所述歷史圖像的圖像特征訓(xùn)練得到的。

7、可選地,獲取多個(gè)所述目標(biāo)圖像特征的概率分布,得到目標(biāo)概率分布,包括:將多個(gè)所述目標(biāo)圖像特征依次輸入至雙向長(zhǎng)短期記憶網(wǎng)絡(luò)模型中,得到所述目標(biāo)概率分布,其中,所述雙向長(zhǎng)短期記憶網(wǎng)絡(luò)模型包括依次連接的反向?qū)雍颓跋驅(qū)?,所述反向?qū)雍退銮跋驅(qū)臃謩e包括多個(gè)依次連接的長(zhǎng)短期記憶網(wǎng)絡(luò)單元。

8、可選地,采用ctc算法對(duì)所述目標(biāo)概率分布進(jìn)行處理,得到所述待識(shí)別圖像的識(shí)別結(jié)果,包括:計(jì)算所述目標(biāo)概率分布的累加條件概率,以將所述目標(biāo)概率分布轉(zhuǎn)換為多個(gè)字符序列,得到所述識(shí)別結(jié)果,其中,所述字符信息包括所述字符序列。

9、根據(jù)本申請(qǐng)的另一方面,提供了一種圖像字符信息的識(shí)別裝置,包括:獲取單元,用于獲取待識(shí)別圖像,所述待識(shí)別圖像包括至少一個(gè)字符信息;處理單元,用于至少對(duì)所述待識(shí)別圖像進(jìn)行圖像增強(qiáng)處理,以增加所述待識(shí)別圖像的照度,得到預(yù)處理圖像;提取單元,用于提取所述預(yù)處理圖像的圖像特征,得到多個(gè)目標(biāo)圖像特征,并獲取多個(gè)所述目標(biāo)圖像特征的概率分布,得到目標(biāo)概率分布,其中,所述目標(biāo)圖像特征為所述字符信息對(duì)應(yīng)的圖像特征;識(shí)別單元,用于采用ctc算法對(duì)所述目標(biāo)概率分布進(jìn)行處理,得到所述待識(shí)別圖像的識(shí)別結(jié)果。

10、根據(jù)本申請(qǐng)的再一方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)包括存儲(chǔ)的程序,其中,在所述程序運(yùn)行時(shí)控制所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)所在設(shè)備執(zhí)行任意一種所述的方法。

11、根據(jù)本申請(qǐng)的又一方面,提供了一種電子裝置,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序,所述處理器被設(shè)置為通過(guò)所述計(jì)算機(jī)程序執(zhí)行任意一種所述的方法。

12、應(yīng)用本申請(qǐng)的技術(shù)方案,提供了一種圖像字符信息的識(shí)別方法,首先,獲取待識(shí)別圖像,所述待識(shí)別圖像包括至少一個(gè)字符信息;再至少對(duì)所述待識(shí)別圖像進(jìn)行圖像增強(qiáng)處理,以增加所述待識(shí)別圖像的照度,得到預(yù)處理圖像;然后,提取所述預(yù)處理圖像的圖像特征,得到多個(gè)目標(biāo)圖像特征,并獲取多個(gè)所述目標(biāo)圖像特征的概率分布,得到目標(biāo)概率分布,其中,所述目標(biāo)圖像特征為所述字符信息對(duì)應(yīng)的圖像特征;最后,采用ctc算法對(duì)所述目標(biāo)概率分布進(jìn)行處理,得到所述待識(shí)別圖像的識(shí)別結(jié)果。通過(guò)在字符識(shí)別之前進(jìn)行圖像增強(qiáng)處理,以增強(qiáng)圖像的照度,考慮了圖像采集過(guò)程中環(huán)境的光照不均勻問(wèn)題,與現(xiàn)有技術(shù)中只運(yùn)用深度學(xué)習(xí)的識(shí)別方法相比,在處理低質(zhì)量的圖像方面識(shí)別精確度更高。其次,提取圖像特征后,通過(guò)計(jì)算目標(biāo)圖像特征的概率分布,可以進(jìn)一步在處理圖像特征過(guò)程中避免出現(xiàn)語(yǔ)義問(wèn)題。最后,使用ctc算法處理輸出票據(jù)圖像中的文字。因此,上述方案可以實(shí)現(xiàn)自動(dòng)化、智能化的圖像中的字符信息識(shí)別和處理,提高識(shí)別準(zhǔn)確性。解決了現(xiàn)有技術(shù)中圖片中的字符信息識(shí)別不準(zhǔn)確的技術(shù)問(wèn)題。



技術(shù)特征:

1.一種圖像字符信息的識(shí)別方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,至少對(duì)所述待識(shí)別圖像進(jìn)行圖像增強(qiáng)處理,以增加所述待識(shí)別圖像的照度,得到預(yù)處理圖像,包括:

3.根據(jù)權(quán)利要求2所述的方法,其特征在于,采用非局部均值去噪算法對(duì)所述待識(shí)別圖像進(jìn)行去噪處理,得到第一處理圖像,包括:

4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述第一處理圖像包括多個(gè)第一像素點(diǎn),所述第二處理圖像包括多個(gè)第二像素點(diǎn),對(duì)所述第一處理圖像進(jìn)行雙邊伽馬變換處理,得到第二處理圖像,包括:

5.根據(jù)權(quán)利要求1所述的方法,其特征在于,提取所述預(yù)處理圖像的圖像特征,得到多個(gè)目標(biāo)圖像特征,包括:

6.根據(jù)權(quán)利要求1所述的方法,其特征在于,獲取多個(gè)所述目標(biāo)圖像特征的概率分布,得到目標(biāo)概率分布,包括:

7.根據(jù)權(quán)利要求1所述的方法,其特征在于,采用ctc算法對(duì)所述目標(biāo)概率分布進(jìn)行處理,得到所述待識(shí)別圖像的識(shí)別結(jié)果,包括:

8.一種圖像字符信息的識(shí)別裝置,其特征在于,包括:

9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)包括存儲(chǔ)的程序,其中,在所述程序運(yùn)行時(shí)控制所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)所在設(shè)備執(zhí)行權(quán)利要求1至7中任意一項(xiàng)所述的方法。

10.一種電子裝置,包括存儲(chǔ)器和處理器,其特征在于,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序,所述處理器被設(shè)置為通過(guò)所述計(jì)算機(jī)程序執(zhí)行權(quán)利要求1至7中任意一項(xiàng)所述的方法。


技術(shù)總結(jié)
本申請(qǐng)?zhí)峁┝艘环N圖像字符信息的識(shí)別方法、裝置、存儲(chǔ)介質(zhì)及電子裝置。該方法包括:獲取待識(shí)別圖像,待識(shí)別圖像包括至少一個(gè)字符信息;至少對(duì)待識(shí)別圖像進(jìn)行圖像增強(qiáng)處理,以增加待識(shí)別圖像的照度,得到預(yù)處理圖像;提取預(yù)處理圖像的圖像特征,得到多個(gè)目標(biāo)圖像特征,并獲取多個(gè)目標(biāo)圖像特征的概率分布,得到目標(biāo)概率分布,其中,目標(biāo)圖像特征為字符信息對(duì)應(yīng)的圖像特征;采用CTC算法對(duì)目標(biāo)概率分布進(jìn)行處理,得到待識(shí)別圖像的識(shí)別結(jié)果。解決了現(xiàn)有技術(shù)中圖片中的字符信息識(shí)別不準(zhǔn)確的技術(shù)問(wèn)題。

技術(shù)研發(fā)人員:湯世強(qiáng),許艷松,范麗文,王希斌,劉新宇
受保護(hù)的技術(shù)使用者:中國(guó)郵政儲(chǔ)蓄銀行股份有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/8
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1