識別數(shù)字圖像中相關(guān)區(qū)域的方法、對數(shù)字圖像編碼的方法及編碼器系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)字圖像處理的領(lǐng)域,并且尤其涉及識別數(shù)字圖像中的相關(guān)區(qū)域的方 法、對數(shù)字圖像進行編碼的方法以及編碼器系統(tǒng)。
【背景技術(shù)】
[0002] 在諸如網(wǎng)絡(luò)攝像機監(jiān)控系統(tǒng)的數(shù)字視頻系統(tǒng)中,使用各種視頻編碼方法在傳輸之 前壓縮視頻序列。在許多數(shù)字視頻編碼系統(tǒng)中兩個主要模式,用于壓縮一系列視頻幀中的 視頻幀:幀內(nèi)模式和幀間模式。在幀內(nèi)模式中,通過利用單個幀的給定通道中的像素的空間 冗余,經(jīng)由預(yù)測、變換和熵編碼來對亮度和色度通道進行編碼。編碼的幀被稱作幀內(nèi)幀,且 也可被稱為I-幀。相反,幀間模式利用獨立的幀之間的時間冗余,并依賴運動補償預(yù)測技 術(shù),該技術(shù)通過對像素的選中塊的從一個幀到另一個幀的像素中的運動進行編碼,從一個 或多個先前幀預(yù)測幀的各部分。編碼的幀被稱作幀間幀,且也可被稱為P-幀(向前預(yù)測的 幀)或B-幀(雙向預(yù)測的幀),p-幀可指按解碼順序的先前幀,B-幀可指兩個或多個先前 解碼的幀,并可具有用于預(yù)測的幀的任何隨意的顯示順序關(guān)系。進一步,編碼的幀被排布在 圖像組或G0P中,其中每個圖像組開始于I-幀,并且隨后的幀是P-幀或B-幀。圖像組中 的幀的數(shù)量通常被稱為G0P長度。G0P長度可從1到例如255變化,1意味著圖像組中僅存 在幀內(nèi)幀,并且不存在幀間幀,255意味著圖像組中存在1個幀內(nèi)幀,隨后是254個幀間幀。
[0003] 在編碼的視頻序列接收的位置,對編碼的幀進行解碼。網(wǎng)絡(luò)攝像機監(jiān)控系統(tǒng)所關(guān) 注的是用于編碼的視頻的傳輸?shù)目捎脦?。這在使用大量攝像機的系統(tǒng)中尤其如此。進一 步,這種關(guān)注在可用帶寬低的情況(諸如,當視頻序列傳輸?shù)揭苿釉O(shè)備(諸如,移動電話、 PDA、平板電腦)時)特別重要。就圖像的存儲而言(例如,在將圖像存儲到攝像機中的內(nèi) 建SD卡時),會發(fā)生類似的問題。在可用的帶寬或存儲與高質(zhì)量圖像的利益之間做出權(quán)衡 的情況下,不得不做出折衷。為了減小從攝像機傳輸?shù)谋忍芈?,許多方法和系統(tǒng)已用于控制 編碼。這些已知的方法和系統(tǒng)通常應(yīng)用比特率限制,并且控制編碼使得來自攝像機的輸出 的比特率總是低于比特率限制。以這種方式,可確??捎脦捠亲銐虻?,使得系統(tǒng)中的所有 攝像機可將它們的視頻序列傳輸?shù)浇邮盏奈恢茫ɡ纾刂浦行模?,在該位置操作人員可從 系統(tǒng)的攝像機監(jiān)控視頻,并且在該位置視頻可被記錄以供以后使用。然而,無論被監(jiān)控的場 景發(fā)生什么,由于比特率限制可能要求包含許多細節(jié)的圖像的嚴格的壓縮,因此將比特率 限制應(yīng)用到所有攝像機可偶爾導(dǎo)致不理想的低的圖像質(zhì)量。一些細節(jié)可能對在接收的位置 處的觀察者來說是令人感興趣的,然而其他細節(jié)可能不是令人感興趣的。但是,在應(yīng)用比特 率限制時,為了不超過該限制,具有許多細節(jié)的圖像可能需要被高度壓縮,從而導(dǎo)致低的圖 像質(zhì)量。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的一個目的是提供一種識別圖像中相關(guān)區(qū)域的方法。另一個目的是使數(shù)字 圖像能夠有效壓縮,允許令人感興趣的對象的高質(zhì)量圖像。
[0005] 根據(jù)第一方面,這些目的和其他目的全部或至少部分地通過一種識別數(shù)字圖像中 的相關(guān)區(qū)域的方法實現(xiàn),所述方法包括:接收第一數(shù)字圖像中的表示像素的信息,計算第一 圖像中的鄰近像素組的所述信息的和、平均值或中間值以形成每個像素組的組值,計算組 值之間的差,將所述差與預(yù)定的閾值進行比較。如果所述差等于或大于所述閾值,則所述方 法包括將所述組識別為在相關(guān)區(qū)域中,并且如果所述差小于所述閾值,則所述方法包括將 所述組識別為在不相關(guān)區(qū)域中。利用這種方法,可以區(qū)分圖像中的相關(guān)區(qū)域和不相關(guān)區(qū)域。 該區(qū)分或圖像的子分割可用于不同方面,諸如用于控制對圖像的編碼。
[0006] 所述相關(guān)區(qū)域是包含相關(guān)對象的區(qū)域,相關(guān)對象是諸如人、面部、動物、車輛、號 牌、窗戶、門、大門或人攜帶的物品之類的對象。
[0007] 在所述方法的變形中,所述像素組包括適合于產(chǎn)生組值之間的小于所述閾值的差 的若干像素,所述組值在不包含相關(guān)對象的第一數(shù)字圖像的區(qū)域中。
[0008] 所述像素組中的每一個可包括至少256個像素。這可以是16X 16像素組,并且像 素組的大小可對應(yīng)于圖像中面部的大小。
[0009] 所述第一圖像中的表示像素的信息可以是來自于由以下數(shù)據(jù)組成的組中的至少 一個:關(guān)于亮度的數(shù)據(jù)、關(guān)于光亮度的數(shù)據(jù)和關(guān)于顏色值的數(shù)據(jù)以及任何這些數(shù)據(jù)的方差。 所述方差可例如表示為標準偏差。
[0010] 在變形中,所述方法進一步包括:接收第二數(shù)字圖像中的表示像素的信息,計算所 述第二圖像中的鄰近像素組的所述信息的和、平均值或中間值以形成每個像素組的組值, 以及從所述第一圖像和所述第二圖像累積對應(yīng)組的所述組值,其中所述計算組值之間的差 是使用所累積的組值執(zhí)行的。
[0011] 根據(jù)第二方面,這些目的和其他目的全部或至少部分地通過一種對數(shù)字圖像進行 編碼的方法實現(xiàn),包括:使用第一方面所述的方法識別相關(guān)區(qū)域,基于對所述相關(guān)區(qū)域的識 別來設(shè)定每個像素組的壓縮值,其中相關(guān)區(qū)域中的塊被給定第一壓縮值,并且所述相關(guān)區(qū) 域外部的塊被給定第二壓縮值,所述第二壓縮值表示比所述第一壓縮值產(chǎn)生更低圖像質(zhì)量 的壓縮,以及使用針對所述像素組設(shè)定的壓縮值來對所述第一圖像進行編碼。利用這種方 法,可以控制用于表示圖像的不相關(guān)區(qū)域的若干比特,而允許圖像的相關(guān)區(qū)域的高質(zhì)量的 表示。被壓縮值分配的塊可以或不可以與用于識別相關(guān)區(qū)域的像素組相同。塊可以是像素 組的子組。
[0012] 根據(jù)所述方法的變形,具有第二壓縮值的像素組被編碼為跳塊。以這種方式,可減 小輸出的比特率。
[0013] 所述方法進一步包括:在對所述第一圖像進行編碼之前,在變換模塊中處理所述 第一圖像,以及在對所述第一圖像進行編碼之前,在所述變換模塊中處理對應(yīng)于所述圖像 的所述組值或壓縮值。所述變換模塊可以是硬件加速傳輸模塊,且有時可被稱為定標器。 變換模塊或定標器可執(zhí)行例如調(diào)整大小、剪切、旋轉(zhuǎn)、隱私遮色的添加或電子圖像穩(wěn)定的操 作。
[0014] 根據(jù)第三方面,上面涉及的目的全部或至少部分地通過一種用于對對應(yīng)于輸入圖 像的圖像數(shù)據(jù)進行編碼的數(shù)字圖像編碼器系統(tǒng)實現(xiàn),包括:編碼器模塊,被設(shè)置成使用壓縮 值處理輸入圖像;接收模塊,被設(shè)置成接收第一數(shù)字圖像中的表示像素的信息;組值模塊, 被設(shè)置成計算所述第一圖像中的鄰近像素組的所述信息的和、平均值或中間值以形成每個 像素組的組值;差計算模塊,被設(shè)置成計算組值之間的差;比較模塊,被設(shè)置成將所述差與 預(yù)定的閾值進行比較;識別模塊,被設(shè)置成如果所述差等于或大于所述閾值,則將像素組識 別為在相關(guān)區(qū)域中,并且如果所述差小于所述閾值,則將所述像素組識別為在不相關(guān)區(qū)域 中;以及壓縮值設(shè)定模塊,被設(shè)置成基于對相關(guān)區(qū)域的所述識別來設(shè)定每個像素組的壓縮 值,使得相關(guān)區(qū)域中的像素組被給定第一壓縮值,并且在不相關(guān)區(qū)域中的像素組被給定第 二壓縮值,所述第二壓縮值表示比所述第一壓縮值產(chǎn)生更低圖像質(zhì)量的壓縮。利用這種編 碼器系統(tǒng),可以減小輸出的比特率,同時還允許監(jiān)控的場景中的令人感興趣的對象的高質(zhì) 量圖像。
[0015] 通常,可以以與第二方面的方法相同的方式伴隨所附優(yōu)勢而體現(xiàn)第三方面的編碼 器系統(tǒng)。
[0016] 根據(jù)第四方面,上面涉及的目的全部或至少部分地通過一種包括根據(jù)第三方面的 數(shù)字編碼器系統(tǒng)的攝像機來實現(xiàn)。
[0017] 根據(jù)第五方面,上面涉及的目的全部或至少部分地通過一種包括具有如下指令的 計算機可讀存儲介質(zhì)的計算機程序產(chǎn)品來實現(xiàn),所述指令適于在由處理器執(zhí)行時執(zhí)行根據(jù) 第一發(fā)面和第二方面的方法。所述處理器可以是任何種類的處理器,例如中央處理器單元 (CPU)、圖形處理單元(GPU)、集成電路中實現(xiàn)的定制的處理器件、ASIC、FPGA或包括分立元 件的邏輯電路。
[0018] 根據(jù)下面給出的詳細