一種數(shù)據(jù)位置的確定方法及裝置的制造方法
【專利摘要】本發(fā)明實施例公開了一種數(shù)據(jù)位置的確定方法及裝置。方法包括:接收采樣圖像以及采樣圖像中數(shù)據(jù)的矩形框四個頂點的實際坐標值;根據(jù)所述采樣圖像以及所述實際坐標值,訓(xùn)練用于確定所述數(shù)據(jù)位置的模型;接收待檢測圖像;根據(jù)訓(xùn)練好的所述模型和所述待檢測圖像,確定所述待檢測圖像中所述數(shù)據(jù)的位置。利用本發(fā)明實施例,可以減少計算機CPU和內(nèi)存的占用。
【專利說明】
-種數(shù)據(jù)位置的確定方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及數(shù)據(jù)位置技術(shù)領(lǐng)域,特別設(shè)及一種數(shù)據(jù)位置的確定方法及裝置。
【背景技術(shù)】
[0002] 當今多媒體時代,圖像視頻資源日益增長,在處理運些圖像數(shù)據(jù)時,能快速地定位 到圖像中感興趣的數(shù)據(jù)顯得尤為重要,比如圖形類的數(shù)據(jù)衣物箱包等,或者文字類數(shù)據(jù)字 幕、彈幕等。
[0003] 目前大多數(shù)圖像中數(shù)據(jù)位置確定的方法都是基于滑動窗或邊緣信息來提取候選 區(qū)域,再利用預(yù)先訓(xùn)練好的分類器進行檢測識別,獲取得分值最高的矩形框作為最終區(qū)域, 或采用非極大值抑制算法融合多候選區(qū)域。但是運類方法需要首先得到數(shù)百個候選數(shù)據(jù)目 標來覆蓋感興趣數(shù)據(jù)目標所出現(xiàn)的位置,再對運些大量的區(qū)域處理,有時對于不同類別的 數(shù)據(jù)目標還需要訓(xùn)練特定的分類器,導(dǎo)致運算量很大,計算機CPU和內(nèi)存的占用較大。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實施例的目的在于提供一種數(shù)據(jù)位置的確定方法及裝置,W減少計算機 CPU和內(nèi)存的占用。
[0005] 為達到上述目的,本發(fā)明公開了一種數(shù)據(jù)位置的確定方法,技術(shù)方案如下:
[0006] 接收至少一幅采樣圖像W及采樣圖像中數(shù)據(jù)的矩形框四個頂點的實際坐標值;
[0007] 根據(jù)所述采樣圖像W及所述實際坐標值,訓(xùn)練用于確定數(shù)據(jù)位置的模型;
[000引接收待檢測圖像;
[0009] 根據(jù)訓(xùn)練好的所述模型和所述待檢測圖像,確定所述待檢測圖像中數(shù)據(jù)的位置。
[0010] 較佳的,所述模型為:
[0011] Alex化t網(wǎng)絡(luò)結(jié)構(gòu)模型。
[0012] 較佳的,所述根據(jù)所述采樣圖像W及所述實際坐標值,訓(xùn)練用于確定數(shù)據(jù)位置的 模型,包括:
[0013] 根據(jù)所述至少一幅采樣圖像W及所述模型,得到針對所述至少一幅采樣圖像中每 一幅采樣圖像的數(shù)據(jù)的矩形框四個頂點的輸出坐標值;
[0014] 計算所述至少一幅采樣圖像中每一幅采樣圖像的輸出坐標值與實際坐標值之間 的匹配距離;
[0015] 根據(jù)每一幅采樣圖像的匹配距離,計算所述至少一幅采樣圖像的匹配距離的平均 值;
[0016] 判斷當前平均值與上次計算得到的平均值之差的絕對值是否大于預(yù)設(shè)口限闊值;
[0017] 如果是,根據(jù)當前所述模型的參數(shù)值W及深度網(wǎng)絡(luò)學(xué)習(xí)技術(shù),計算梯度值;根據(jù)所 述梯度值,調(diào)整所述模型的參數(shù)值;繼續(xù)執(zhí)行根據(jù)所述至少一幅采樣圖像W及所述模型,得 到針對所述至少一幅采樣圖像中每一幅采樣圖像的數(shù)據(jù)的矩形框四個頂點的輸出坐標值 的操作步驟。
[0018] 較佳的,計算所述至少一幅采樣圖像中每一幅采樣圖像的輸出坐標值與實際坐標 值之間的匹配距離,所采用的公式為:
[0019]
[0020] 其中,F(xiàn)matchd,g)為采樣圖像的輸出坐標值1與實際坐標值g之間的匹配距離,n為 預(yù)設(shè)值,Ii為輸出坐標值1的第i個元素,gi為實際坐標值g的第i個元素。
[0021] 較佳的,所述根據(jù)訓(xùn)練好的所述模型和所述待檢測圖像,確定所述待檢測圖像中 數(shù)據(jù)的位置,包括:
[0022] 根據(jù)所述待檢測圖像W及訓(xùn)練好的所述模型,得到針對所述待檢測圖像的數(shù)據(jù)的 矩形框四個頂點的輸出坐標值;
[0023] 將所述輸出坐標值構(gòu)成的區(qū)域,確定為所述待檢測圖像中數(shù)據(jù)的位置。
[0024] 為達到上述目的,本發(fā)明還公開了一種數(shù)據(jù)位置的確定裝置,包括:
[0025] 第一接收模塊,用于接收至少一幅采樣圖像W及采樣圖像中數(shù)據(jù)的矩形框四個頂 點的實際坐標值;
[0026] 訓(xùn)練模塊,用于根據(jù)所述采樣圖像W及所述實際坐標值,訓(xùn)練用于確定數(shù)據(jù)位置 的模型;
[0027] 第二接收模塊,用于接收待檢測圖像;
[002引確定模塊,用于根據(jù)訓(xùn)練好的所述模型和所述待檢測圖像,確定所述待檢測圖像 中數(shù)據(jù)的位置。
[0029] 較佳的,所述模型為:
[0030] Alex化t網(wǎng)絡(luò)結(jié)構(gòu)模型。
[0031 ]較佳的,所述訓(xùn)練模塊包括:
[0032] 第一坐標輸出單元,用于根據(jù)所述至少一幅采樣圖像W及所述模型,得到針對所 述至少一幅采樣圖像中每一幅采樣圖像的數(shù)據(jù)的矩形框四個頂點的輸出坐標值;
[0033] 距離計算單元,用于計算所述至少一幅采樣圖像中每一幅采樣圖像的輸出坐標值 與實際坐標值之間的匹配距離.
[0034] 均值計算單元,用于根據(jù)每一幅采樣圖像的匹配距離,計算所述至少一幅采樣圖 像的匹配距離的平均值;
[0035] 判斷單元,用于判斷當前平均值與上次計算得到的平均值之差的絕對值是否大于 預(yù)設(shè)口限闊值;
[0036] 參數(shù)調(diào)整單元,用于在所述判斷單元判斷結(jié)果為是的情況下,根據(jù)當前所述模型 的參數(shù)值W及深度網(wǎng)絡(luò)學(xué)習(xí)技術(shù),計算梯度值;根據(jù)所述梯度值,調(diào)整所述模型的參數(shù)值; 觸發(fā)所述第一坐標輸出單元。
[0037] 較佳的,所述距離計算單元中,計算所述至少一幅采樣圖像中每一幅采樣圖像的 輸出坐標值與實際坐標值之間的匹配距離,所采用的公式為:
[00;3 引
[0039]其中,F(xiàn)matchd,g)為采樣圖像的輸出坐標值1與實際坐標值g之間的匹配距離,n為 預(yù)設(shè)值,Ii為輸出坐標值1的第i個元素,gi為實際坐標值g的第i個元素。
[0040] 較佳的,所述確定模塊,包括:
[0041] 第二坐標輸出單元,用于根據(jù)所述待檢測圖像W及訓(xùn)練好的所述模型,得到針對 所述待檢測圖像的數(shù)據(jù)的矩形框四個頂點的輸出坐標值;
[0042] 位置確定單元,用于將所述輸出坐標值構(gòu)成的區(qū)域,確定為所述待檢測圖像中數(shù) 據(jù)的位置。
[0043] 由上述的技術(shù)方案可見,本發(fā)明實施例提供的數(shù)據(jù)位置的確定方法及裝置,接收 至少一幅采樣圖像W及采樣圖像中數(shù)據(jù)的矩形框四個頂點的實際坐標值;根據(jù)所述采樣圖 像W及所述實際坐標值,訓(xùn)練用于確定數(shù)據(jù)位置的模型;接收待檢測圖像;根據(jù)訓(xùn)練好的所 述模型和所述待檢測圖像,確定所述待檢測圖像中數(shù)據(jù)的位置。
[0044] 可見,采用訓(xùn)練好的Alex化t網(wǎng)絡(luò)結(jié)構(gòu)模型,輸入待檢測圖像,可W直接確定待檢 測圖像中數(shù)據(jù)的位置,不需要對每個數(shù)據(jù)類別單獨訓(xùn)練模型,避免了繁雜的候選提取和分 類器訓(xùn)練的操作,減小了運算量,進而減少了計算機CPU和內(nèi)存的占用。
[0045] 當然,實施本發(fā)明的任一產(chǎn)品或方法必不一定需要同時達到W上所述的所有優(yōu) 點。
【附圖說明】
[0046] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可W 根據(jù)運些附圖獲得其他的附圖。
[0047] 圖1為本發(fā)明實施例提供的一種數(shù)據(jù)位置的確定方法的流程示意圖;
[0048] 圖2為本發(fā)明實施例提供的一種數(shù)據(jù)位置的確定裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0049] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于 本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
[0050] 本發(fā)明實施例公開了一種數(shù)據(jù)位置的確定方法及裝置,W下分別進行詳細說明。
[0051] 參見圖1,圖1為本發(fā)明實施例提供的一種數(shù)據(jù)位置的確定方法的流程示意圖,包 括如下步驟:
[0052] SlOl,接收至少一幅采樣圖像W及采樣圖像中數(shù)據(jù)的矩形框四個頂點的實際坐標 值;
[0053] 其中,所述數(shù)據(jù)可W為圖形類的數(shù)據(jù),例如衣物、箱包等等,或者文字類的數(shù)據(jù),例 如字幕、彈幕等等。
[0054] 在一個具體實現(xiàn)方式中,可W隨機抽取出10000張圖片作為采樣圖像,并定義若干 個數(shù)據(jù)大類,例如五個數(shù)據(jù)大類:上衣、下裝、裙裝、箱包和鞋子。人工用矩形框標記出該大 類數(shù)據(jù)在圖像中對應(yīng)的位置,從而得到采樣圖像中數(shù)據(jù)的矩形框四個頂點的實際坐標值。
[0055] 需要強調(diào)的是,上述所給出的關(guān)于SlOl的具體實現(xiàn)方式僅僅作為示例,并不應(yīng)該 構(gòu)成對本發(fā)明實施例的限定。
[0056] S102,根據(jù)所述采樣圖像W及所述實際坐標值,訓(xùn)練用于確定所述數(shù)據(jù)位置的模 型;
[0057] 其中,所述模型為Alex化t網(wǎng)絡(luò)結(jié)構(gòu)模型(W下簡稱Alex化t模型),該模型比較簡 單,層數(shù)較少,但效果顯著,因此可W用少量的運算存儲達到令人滿意的分類精度。該模型 共有8層,其中前5層是卷積層(包括正則化,闊值化和池化等操作),后面3層是全連接層(其 輸出可W直接作為輸入圖像的特征)。將標注數(shù)據(jù)位置的矩形框四個頂點的橫縱坐標值(共 8個值)作為Ale曲et模型的輸出值,用向量IGR8表示,例如1 = (1,1,1,3,2,3,2,1)表示數(shù) 據(jù)的矩形框四個頂點坐標分別為(1,1)、(1,3)、(2,3)、(2,1)。為保證算法對圖像的尺度不 變性,需要根據(jù)圖像的大小對輸出值進行歸一化(即除W采樣圖像的寬度和高度)。
[005引在一個具體實現(xiàn)方式中,AlexNet模型的訓(xùn)練參數(shù)設(shè)置為:批量大小設(shè)為256,初始 的網(wǎng)絡(luò)學(xué)習(xí)率設(shè)為0.001,動量設(shè)為0.9,采用每步遞減學(xué)習(xí)率的方法,步長設(shè)為10000。將隨 機抽取的10000幅采樣圖像打亂順序,每256幅采樣圖像作為一個整體輸入AlexNet模型,得 到每一幅采樣圖像的數(shù)據(jù)的矩形框四個頂點的輸出坐標值;計算256幅采樣圖像中每一幅 采樣圖像的輸出坐標值與實際坐標值之間的匹配距離;根據(jù)每一幅采樣圖像的匹配距離, 計算256幅采樣圖像的匹配距離的平均值;判斷當前平均值與上次計算得到的平均值之差 的絕對值是否大于預(yù)設(shè)口限闊值;如果是,根據(jù)當前所述模型的參數(shù)值W及深度網(wǎng)絡(luò)學(xué)習(xí) 技術(shù),計算梯度值;根據(jù)所述梯度值,調(diào)整Ale曲et模型的參數(shù)值。其中,深度網(wǎng)絡(luò)學(xué)習(xí)屬于 現(xiàn)有技術(shù),在此不再寶述。
[0059] 在本步驟的具體實現(xiàn)方式中,訓(xùn)練過程總共迭代了80000輪,每輪迭代256次,一輪 迭代完成之后,調(diào)整更新一次Alex化t模型中前屯層網(wǎng)絡(luò)的參數(shù)。最后兩次的輸出損失值即 匹配距離為0.053和0.050,預(yù)設(shè)口限值為0.0 l,相鄰兩次所述歐氏距離值的差值0.003小于 預(yù)設(shè)口限值,結(jié)束訓(xùn)練,得到訓(xùn)練好的AlexNet模型。
[0060] 其中,在將采樣圖像輸入Ale曲et模型之前,為適應(yīng)該模型的網(wǎng)絡(luò)參數(shù),需要對采 樣圖像進行縮放、裁剪。效果最優(yōu)的做法是先對采樣圖像縮放到分辨率為256*256,然后裁 剪出分辨率為224*224的圖像中屯、部分,將裁剪后的圖像輸入到Alex化t模型中。當然,對采 樣圖像只縮放或只裁剪也可W應(yīng)用于本發(fā)明實施例,前提是處理后的圖像尺寸均為正方 形,且保證數(shù)據(jù)的矩形框完整地被包含在處理后的采樣圖像中。
[0061] 其中,可W定義目標函數(shù)定量表示匹配距離,兩者體現(xiàn)的意義一致,用來定量衡量 采樣圖像中數(shù)據(jù)的矩形框四個頂點的坐標的匹配程度,在實際應(yīng)用中也可W使用歐氏距離 來定量衡量。匹配距離值越小,說明匹配程度越高。目標函數(shù)公式如下:
[0062]
[0063] 其中,F(xiàn)matchd,g)為采樣圖像的輸出坐標值1與實際坐標值g之間的匹配距離,n為 預(yù)設(shè)值,Ii為輸出坐標值1的第i個元素,gi為實際坐標值g的第i個元素。在本步驟的具體實 現(xiàn)方式中,n設(shè)定為1/2。
[0064] 在本步驟的具體實現(xiàn)方式中,在Alex化t模型訓(xùn)練的迭代過程中,也可W用觀察判 斷的方法結(jié)束訓(xùn)練。在進行大量迭代之后,訓(xùn)練后期的匹配距離即目標函數(shù)值Fmatch會趨于 在極小區(qū)域范圍例如0.04-0.06內(nèi)微弱震蕩,大小不會出現(xiàn)明顯變化,但也有可能出現(xiàn)某相 鄰兩次的歐氏距離值的差值例如0.015大于預(yù)設(shè)口限值0.01的個別情況??蒞根據(jù)具體的 實施方式,在歐式距離值最終趨于不變時,自行結(jié)束訓(xùn)練,訓(xùn)練好的Alex化t模型W達到可 用于確定所述數(shù)據(jù)的位置為準。
[0065] 需要強調(diào)的是,上述所給出的關(guān)于S102的具體實現(xiàn)方式僅僅作為示例,并不應(yīng)該 構(gòu)成對本發(fā)明實施例的限定。
[0066] S103,接收待檢測圖像;
[0067] 其中,計算機接收的待檢測圖像中包含完整的數(shù)據(jù)。數(shù)據(jù)可W為圖形類的數(shù)據(jù),例 如衣物、箱包等等,或者文字類的數(shù)據(jù),例如字幕、彈幕等等。
[0068] S104,根據(jù)訓(xùn)練好的所述模型和所述待檢測圖像,確定所述待檢測圖像中所述數(shù) 據(jù)的位置。
[0069] 在一個具體實現(xiàn)方式中,將一幅待檢測圖像輸入訓(xùn)練好的AlexNet模型中去, AlexNet模型輸出運一幅待檢測圖像的數(shù)據(jù)的矩形框四個頂點的坐標值,用向量L表示為L =(0.1,0.3,0.1,0.5,0.2,0.5,0.2,0.3),從而得到數(shù)據(jù)的矩形框的四個頂點坐標分別 (0.1,0.3)、(0.1,0.5)、(0.2,0.5)、(0.2,0.3);將待檢測圖像的數(shù)據(jù)的矩形框四個頂點構(gòu) 成的矩形框區(qū)域,確定為所述待檢測圖像中數(shù)據(jù)的位置。
[0070] 其中,在將待檢測圖像輸入AlexNet模型之前,按照S102中對采樣圖像處理所采用 的同種方式對待檢測圖像進行處理,例如對待檢測圖像進行裁剪、縮放等。
[0071] 其中,根據(jù)S102中對輸出值向量是否進行歸一化,判斷是否需要對Alex化t模型的 輸出坐標值進行處理。在進行歸一化的情況下,AlexNet模型輸出的運一幅待檢測圖像的數(shù) 據(jù)的矩形框四個頂點的坐標值需要乘W待檢測圖像的寬度和高度,得到數(shù)據(jù)的矩形框四個 頂點的絕對坐標值。例如在本步驟的具體實現(xiàn)方式中,待檢測圖像的寬度為10,高度為10, 則得到數(shù)據(jù)的矩形框的四個頂點坐標分別(1,3)、(1,5)、(2,5)、(2,3)。根據(jù)得到的四個絕 對坐標值,確定數(shù)據(jù)的矩形框的位置,從而確定待檢測圖像中數(shù)據(jù)的位置。
[0072] 需要強調(diào)的是,上述所給出的關(guān)于S104的具體實現(xiàn)方式僅僅作為示例,并不應(yīng)該 構(gòu)成對本發(fā)明實施例的限定。
[0073] 可見,采用訓(xùn)練好的Alex化t網(wǎng)絡(luò)結(jié)構(gòu)模型,輸入待檢測圖像,可W直接確定待檢 測圖像中數(shù)據(jù)的位置,不需要對每個數(shù)據(jù)類別單獨訓(xùn)練模型,避免了繁雜的候選提取和分 類器訓(xùn)練的操作,減小了運算量,進而減少了計算機CPU和內(nèi)存的占用。
[0074] 參見圖2,圖2為本發(fā)明實施例提供的一種數(shù)據(jù)位置的確定裝置的結(jié)構(gòu)示意圖,與 圖1所示的流程相對應(yīng),包括第一接收模塊201、訓(xùn)練模塊202、第二接收模塊203、確定模塊 204。
[0075] 其中,第一接收模塊201,用于接收至少一幅采樣圖像W及采樣圖像中數(shù)據(jù)的矩形 框四個頂點的實際坐標值。
[0076] 訓(xùn)練模塊202,用于根據(jù)所述采樣圖像W及所述實際坐標值,訓(xùn)練用于確定數(shù)據(jù)位 置的模型。
[0077] 第二接收模塊203,用于接收待檢測圖像。
[0078] 確定模塊204,用于根據(jù)訓(xùn)練好的所述模型和所述待檢測圖像,確定所述待檢測圖 像中數(shù)據(jù)的位置。
[0079] 具體的,所述模型為:
[0080] Alex化t網(wǎng)絡(luò)結(jié)構(gòu)模型。
[0081 ]具體的,所述訓(xùn)練模塊包括:
[0082] 第一坐標輸出單元,用于根據(jù)所述至少一幅采樣圖像W及所述模型,得到針對所 述至少一幅采樣圖像中每一幅采樣圖像的數(shù)據(jù)的矩形框四個頂點的輸出坐標值;
[0083] 距離計算單元,用于計算所述至少一幅采樣圖像中每一幅采樣圖像的輸出坐標值 與實際坐標值之間的匹配距離.
[0084] 均值計算單元,用于根據(jù)每一幅采樣圖像的匹配距離,計算所述至少一幅采樣圖 像的匹配距離的平均值;
[0085] 判斷單元,用于判斷當前平均值與上次計算得到的平均值之差的絕對值是否大于 預(yù)設(shè)口限闊值;
[0086] 參數(shù)調(diào)整單元,用于在所述判斷單元判斷結(jié)果為是的情況下,根據(jù)當前所述模型 的參數(shù)值W及深度網(wǎng)絡(luò)學(xué)習(xí)技術(shù),計算梯度值;根據(jù)所述梯度值,調(diào)整所述模型的參數(shù)值; 觸發(fā)所述第一坐標輸出單元。
[0087] 具體的,所述距離計算單元中,計算所述至少一幅采樣圖像中每一幅采樣圖像的 輸出坐標值與實際坐標值之間的匹配距離,所采用的公式為:
[008引
[0089] 其中,F(xiàn)match (1,
g)為米祥閣像的輸出坐標值1與實際坐標值g之間的匹配距離,n為 預(yù)設(shè)值,Ii為輸出坐標值1的第i個元素,gi為實際坐標值g的第i個元素。
[0090] 具體的,所述確定模塊,包括:
[0091] 第二坐標輸出單元,用于根據(jù)所述待檢測圖像W及訓(xùn)練好的所述模型,得到針對 所述待檢測圖像的數(shù)據(jù)的矩形框四個頂點的輸出坐標值;
[0092] 位置確定單元,用于將所述輸出坐標值構(gòu)成的區(qū)域,確定為所述待檢測圖像中數(shù) 據(jù)的位置。
[0093] 可見,采用訓(xùn)練好的Alex化t網(wǎng)絡(luò)結(jié)構(gòu)模型,輸入待檢測圖像,可W直接確定待檢 測圖像中數(shù)據(jù)的位置,不需要對每個數(shù)據(jù)類別單獨訓(xùn)練模型,避免了繁雜的候選提取和分 類器訓(xùn)練的操作,減小了運算量,進而減少了計算機CPU和內(nèi)存的占用。
[0094] 需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實 體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示運些實體或操作之間存 在任何運種實際的關(guān)系或者順序。而且,術(shù)語"包括"、"包含"或者其任何其他變體意在涵蓋 非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要 素,而且還包括沒有明確列出的其他要素,或者是還包括為運種過程、方法、物品或者設(shè)備 所固有的要素。在沒有更多限制的情況下,由語句"包括一個……"限定的要素,并不排除在 包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0095] 本說明書中的各個實施例均采用相關(guān)的方式描述,各個實施例之間相同相似的部 分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于裝置實 施例而言,由于其基本相似于方法實施例,所W描述的比較簡單,相關(guān)之處參見方法實施例 的部分說明即可。
[0096] 本領(lǐng)域普通技術(shù)人員可W理解實現(xiàn)上述方法實施方式中的全部或部分步驟是可 W通過程序來指令相關(guān)的硬件來完成,所述的程序可W存儲于計算機可讀取存儲介質(zhì)中, 運里所稱得的存儲介質(zhì),如:ROM/RAM、磁碟、光盤等。
[0097] W上所述僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。凡在 本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進等,均包含在本發(fā)明的保護范圍 內(nèi)。
【主權(quán)項】
1. 一種數(shù)據(jù)位置的確定方法,其特征在于,包括: 接收至少一幅采樣圖像以及采樣圖像中數(shù)據(jù)的矩形框四個頂點的實際坐標值; 根據(jù)所述采樣圖像以及所述實際坐標值,訓(xùn)練用于確定數(shù)據(jù)位置的模型; 接收待檢測圖像; 根據(jù)訓(xùn)練好的所述模型和所述待檢測圖像,確定所述待檢測圖像中數(shù)據(jù)的位置。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述模型為: AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述采樣圖像以及所述實際坐標 值,訓(xùn)練用于確定數(shù)據(jù)位置的模型,包括: 根據(jù)所述至少一幅采樣圖像以及所述模型,得到針對所述至少一幅采樣圖像中每一幅 采樣圖像的數(shù)據(jù)的矩形框四個頂點的輸出坐標值; 計算所述至少一幅采樣圖像中每一幅采樣圖像的輸出坐標值與實際坐標值之間的匹 配距離; 根據(jù)每一幅采樣圖像的匹配距離,計算所述至少一幅采樣圖像的匹配距離的平均值; 判斷當前平均值與上次計算得到的平均值之差的絕對值是否大于預(yù)設(shè)門限閾值; 如果是,根據(jù)當前所述模型的參數(shù)值以及深度網(wǎng)絡(luò)學(xué)習(xí)技術(shù),計算梯度值;根據(jù)所述梯 度值,調(diào)整所述模型的參數(shù)值;繼續(xù)執(zhí)行根據(jù)所述至少一幅采樣圖像以及所述模型,得到針 對所述至少一幅采樣圖像中每一幅采樣圖像的數(shù)據(jù)的矩形框四個頂點的輸出坐標值的操 作步驟。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,計算所述至少一幅采樣圖像中每一幅采樣 圖像的輸出坐標值與實際坐標值之間的匹配距離,所采用的公式為:其中,F(xiàn)match(l,g)為采樣圖像的輸出坐標值1與實際坐標值g之間的匹配距離,η為預(yù)設(shè) 值,I1為輸出坐標值1的第i個元素,gl為實際坐標值g的第i個元素。5. 根據(jù)權(quán)利要求1至4任一項所述的方法,其特征在于,所述根據(jù)訓(xùn)練好的所述模型和 所述待檢測圖像,確定所述待檢測圖像中數(shù)據(jù)的位置,包括: 根據(jù)所述待檢測圖像以及訓(xùn)練好的所述模型,得到針對所述待檢測圖像的數(shù)據(jù)的矩形 框四個頂點的輸出坐標值; 將所述輸出坐標值構(gòu)成的區(qū)域,確定為所述待檢測圖像中數(shù)據(jù)的位置。6. -種數(shù)據(jù)位置的確定裝置,其特征在于,所述裝置包括: 第一接收模塊,用于接收至少一幅采樣圖像以及采樣圖像中數(shù)據(jù)的矩形框四個頂點的 實際坐標值; 訓(xùn)練模塊,用于根據(jù)所述采樣圖像以及所述實際坐標值,訓(xùn)練用于確定數(shù)據(jù)位置的模 型; 第二接收模塊,用于接收待檢測圖像; 確定模塊,用于根據(jù)訓(xùn)練好的所述模型和所述待檢測圖像,確定所述待檢測圖像中數(shù) 據(jù)的位置。7. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述模型為: AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型。8. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述訓(xùn)練模塊,包括: 第一坐標輸出單元,用于根據(jù)所述至少一幅采樣圖像以及所述模型,得到針對所述至 少一幅采樣圖像中每一幅采樣圖像的數(shù)據(jù)的矩形框四個頂點的輸出坐標值; 距離計算單元,用于計算所述至少一幅采樣圖像中每一幅采樣圖像的輸出坐標值與實 際坐標值之間的匹配距離; 均值計算單元,用于根據(jù)每一幅采樣圖像的匹配距離,計算所述至少一幅采樣圖像的 匹配距離的平均值; 判斷單元,用于判斷當前平均值與上次計算得到的平均值之差的絕對值是否大于預(yù)設(shè) 門限閾值; 參數(shù)調(diào)整單元,用于在所述判斷單元判斷結(jié)果為是的情況下,根據(jù)當前所述模型的參 數(shù)值以及深度網(wǎng)絡(luò)學(xué)習(xí)技術(shù),計算梯度值;根據(jù)所述梯度值,調(diào)整所述模型的參數(shù)值;觸發(fā) 所述第一坐標輸出單元。9. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述距離計算單元,所采用的公式為:其中,F(xiàn)match(l,g)為采樣圖像的輸出坐標值1與實際坐標值g之間的匹配距離,η為預(yù)設(shè) 值,I1為輸出坐標值1的第i個元素,gl為實際坐標值g的第i個元素。10. 根據(jù)權(quán)利要求6至9任一項所述的裝置,其特征在于,所述確定模塊,包括: 第二坐標輸出單元,用于根據(jù)所述待檢測圖像以及訓(xùn)練好的所述模型,得到針對所述 待檢測圖像的數(shù)據(jù)的矩形框四個頂點的輸出坐標值; 位置確定單元,用于將所述輸出坐標值構(gòu)成的區(qū)域,確定為所述待檢測圖像中數(shù)據(jù)的 位置。
【文檔編號】G06K9/32GK106022295SQ201610379844
【公開日】2016年10月12日
【申請日】2016年5月31日
【發(fā)明人】李甫, 蘭細鵬, 朱宏吉
【申請人】北京奇藝世紀科技有限公司