本申請(qǐng)涉及圖片處理領(lǐng)域,尤其涉及一種相似圖片檢測(cè)方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,移動(dòng)應(yīng)用的功能也在不斷增加,安卓應(yīng)用程序包(android?application?package,apk)體積也在不斷增加。其中,隨著產(chǎn)品迭代,圖片資源不斷增加,不可避免出現(xiàn)一些相同圖片或者相近圖片重復(fù)被添加到apk中的情況。而如何在apk的資源文件中找到這些相同或相近的圖片,成為了一個(gè)亟待解決的問題。
2、相關(guān)技術(shù)中,確定apk中相同或者相似圖片,通常有兩種方案,一種使用是消息摘要算法(message?digest?algorithm,md5)等加密哈希算法,這種方式可以判斷兩張圖片是否為同一文件,但不能判斷兩張圖片的相似度。另一種是采用各種圖片相似度比較算法,常用的圖片相似度比較算法包括均方差算法、結(jié)構(gòu)相似性算法與哈希算法。由于均方差算法在進(jìn)行圖片相似度比較時(shí)計(jì)算復(fù)雜,結(jié)構(gòu)相似性算法將圖片抽象為特征點(diǎn)存儲(chǔ)時(shí),數(shù)據(jù)量較大,因此采用哈希算法,將圖片壓縮為一個(gè)字符串,便于比較與存儲(chǔ)。常用的圖片哈希算法,包括平均哈希算法ahash、感知哈希算法phash、梯度哈希算法dhash、小波哈希算法whash等。
3、然后,單一的哈希算法僅關(guān)注圖片在某一維度的相似度,從而忽略了圖片其他維度信息對(duì)圖片相似度的影響,進(jìn)而導(dǎo)致圖片相似度判斷結(jié)果準(zhǔn)確率較低。
技術(shù)實(shí)現(xiàn)思路
1、為了解決上述技術(shù)問題,本申請(qǐng)?zhí)峁┝艘环N相似圖片檢測(cè)方法、裝置、設(shè)備和存儲(chǔ)介質(zhì),采用多維哈希算法計(jì)算圖片的相似度,提高圖片相似度計(jì)算準(zhǔn)確性。
2、第一方面,本申請(qǐng)?zhí)峁┝艘环N相似圖片檢測(cè)方法,該方法包括:獲取多個(gè)待處理圖片;獲取各個(gè)待處理圖片的哈希數(shù)組,哈希數(shù)組包括待處理圖片的透明度哈希值和顏色哈希值中的至少一個(gè),以及待處理圖片的內(nèi)容哈希值,內(nèi)容哈希值為對(duì)待處理圖片的圖片內(nèi)容進(jìn)行哈希處理得到,透明度哈希值為對(duì)待處理圖片的透明度信息進(jìn)行哈希處理得到,顏色哈希值為對(duì)待處理圖片的顏色信息進(jìn)行哈希處理得到;基于各個(gè)待處理圖片的哈希數(shù)組進(jìn)行相似度檢測(cè),得到各個(gè)哈希數(shù)組的檢測(cè)結(jié)果,哈希數(shù)組的檢測(cè)結(jié)果包括:透明度哈希值的相似度檢測(cè)結(jié)果和顏色哈希值檢測(cè)結(jié)果中的至少一個(gè),以及內(nèi)容哈希值的相似度檢測(cè)結(jié)果;基于各個(gè)哈希數(shù)組的檢測(cè)結(jié)果確定多個(gè)待處理圖片的相似度檢測(cè)結(jié)果。
3、第二方面,本申請(qǐng)?zhí)峁┝艘环N相似圖片檢測(cè)裝置,該裝置包括:圖片獲取模塊,用于獲取多個(gè)待處理圖片;哈希數(shù)組獲取模塊,用于獲取各個(gè)所述待處理圖片的哈希數(shù)組,所述哈希數(shù)組包括所述待處理圖片的透明度哈希值和顏色哈希值中的至少一個(gè),以及所述待處理圖片的內(nèi)容哈希值,所述內(nèi)容哈希值為對(duì)所述待處理圖片的圖片內(nèi)容進(jìn)行哈希處理得到,所述透明度哈希值為對(duì)所述待處理圖片的透明度信息進(jìn)行哈希處理得到,所述顏色哈希值為對(duì)所述待處理圖片的顏色信息進(jìn)行哈希處理得到;哈希數(shù)組檢測(cè)模塊,用于基于各個(gè)所述待處理圖片的哈希數(shù)組進(jìn)行相似度檢測(cè),得到各個(gè)所述哈希數(shù)組的檢測(cè)結(jié)果,所述哈希數(shù)組的檢測(cè)結(jié)果包括:所述透明度哈希值的相似度檢測(cè)結(jié)果和所述顏色哈希值檢測(cè)結(jié)果中的至少一個(gè),以及所述內(nèi)容哈希值的相似度檢測(cè)結(jié)果;圖片相似度檢測(cè)模塊,用于基于各個(gè)所述哈希數(shù)組的檢測(cè)結(jié)果確定多個(gè)所述待處理圖片的相似度檢測(cè)結(jié)果。
4、第三方面,本申請(qǐng)?zhí)峁┝艘环N相似圖片檢測(cè)設(shè)備,該設(shè)備包括:一個(gè)或多個(gè)處理器;存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序;當(dāng)一個(gè)或多個(gè)程序被一個(gè)或多個(gè)處理器執(zhí)行,使得一個(gè)或多個(gè)處理器實(shí)現(xiàn)如上述第一方面中的相似圖片檢測(cè)方法。
5、第四方面,本申請(qǐng)?zhí)峁┝艘环N存儲(chǔ)介質(zhì),該存儲(chǔ)介質(zhì)可以是計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述第一方面中的相似圖片檢測(cè)方法。
6、第五方面,本申請(qǐng)實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序或指令,該計(jì)算機(jī)程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述第一方面中任一項(xiàng)所述相似圖片檢測(cè)方法。
7、本申請(qǐng)實(shí)施例提供的技術(shù)方案與現(xiàn)有技術(shù)相比具有如下優(yōu)點(diǎn):
8、本申請(qǐng)實(shí)施例提供了一種相似圖片檢測(cè)方法、裝置、設(shè)備和存儲(chǔ)介質(zhì),該方法包括:獲取多個(gè)待處理圖片;獲取各個(gè)待處理圖片的哈希數(shù)組,哈希數(shù)組包括待處理圖片的透明度哈希值和顏色哈希值中的至少一個(gè),以及待處理圖片的內(nèi)容哈希值,內(nèi)容哈希值為對(duì)待處理圖片的圖片內(nèi)容進(jìn)行哈希處理得到,透明度哈希值為對(duì)待處理圖片的透明度信息進(jìn)行哈希處理得到,顏色哈希值為對(duì)待處理圖片的顏色信息進(jìn)行哈希處理得到;基于各個(gè)待處理圖片的哈希數(shù)組進(jìn)行相似度檢測(cè),得到各個(gè)哈希數(shù)組的檢測(cè)結(jié)果,哈希數(shù)組的檢測(cè)結(jié)果包括:透明度哈希值的相似度檢測(cè)結(jié)果和顏色哈希值檢測(cè)結(jié)果中的至少一個(gè),以及內(nèi)容哈希值的相似度檢測(cè)結(jié)果;基于各個(gè)哈希數(shù)組的檢測(cè)結(jié)果確定多個(gè)待處理圖片的相似度檢測(cè)結(jié)果。本申請(qǐng)通過將待處理圖片壓縮為一個(gè)多維度哈希數(shù)組,通過比較哈希數(shù)組中各個(gè)維度的哈希值之間的距離,來判斷圖片的相似度,多維度哈希數(shù)組包含了表示圖片內(nèi)容的內(nèi)容哈希值、表示透明度信息的透明度哈希值,以及表示顏色信息的顏色哈希值。通過比較哈希數(shù)組中各個(gè)維度的哈希值之間的距離,確定圖片之間的相似度,解決了單一哈希算法,僅關(guān)注圖片在某一維度的相似度,從而忽略了圖片其他維度信息對(duì)圖片相似度影響的問題,提高了圖片相似度計(jì)算準(zhǔn)確性。
1.一種相似圖片檢測(cè)方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于各個(gè)所述哈希數(shù)組的檢測(cè)結(jié)果確定多個(gè)所述待處理圖片的相似度檢測(cè)結(jié)果,包括:
3.根據(jù)權(quán)利要求2中所述的方法,其特征在于,所述透明度哈希值的相似度值大于第一相似度閾值,包括:透明度哈希值的漢明距離小于第一距離閾值;
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取多個(gè)待處理圖片,包括:
5.根據(jù)權(quán)利要求1-4中任一項(xiàng)所述的方法,其特征在于,所述獲取多個(gè)待處理圖片,包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述從多個(gè)所述文件路徑中篩選出多個(gè)圖片文件路徑之后,還包括:
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,還包括:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述從所述相似圖片集合中確定待刪除圖片,包括:
9.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述從所述相似圖片集合中確定待刪除圖片,包括:
10.一種相似圖片檢測(cè)裝置,其特征在于,所述裝置包括:
11.一種電子設(shè)備,其特征在于,所述設(shè)備包括:
12.一種存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-9中任一項(xiàng)所述相似圖片檢測(cè)方法。