成人打一炮免费视频,亚洲天堂视频在线观看,97视频久久久,日本japanese护士色高清,五月婷婷丁香,日韩精品一级无码毛片免费,国产欧美日韩精品网红剧情演绎

一種牛聲去噪與分類方法及系統(tǒng)

文檔序號(hào):41856104發(fā)布日期:2025-05-09 18:15閱讀:6來源:國知局
一種牛聲去噪與分類方法及系統(tǒng)

本發(fā)明涉及音頻去噪與分類,具體地涉及一種牛聲去噪與分類方法及系統(tǒng)。


背景技術(shù):

1、隨著智慧牧場管理技術(shù)的發(fā)展,聲音數(shù)據(jù)逐漸成為監(jiān)控牛只健康與行為的重要手段。然而,牧場環(huán)境中復(fù)雜的非平穩(wěn)噪聲(如風(fēng)聲、機(jī)械噪聲、其他動(dòng)物的聲音)會(huì)嚴(yán)重影響聲音信號(hào)的提取和分類。傳統(tǒng)的譜減法、維納濾波等去噪方法雖然能一定程度上降低噪聲,但在強(qiáng)噪聲干擾和非平穩(wěn)環(huán)境下會(huì)引入語音失真或噪聲殘留,從而降低聲音分類的準(zhǔn)確性。

2、現(xiàn)有技術(shù)中,基于波束形成的去噪方法能夠增強(qiáng)目標(biāo)信號(hào),但在動(dòng)態(tài)噪聲場景下效果有限。此外,聲音分類系統(tǒng)大多僅依賴單通道信號(hào),無法有效結(jié)合多通道信息以提升定位和分類性能。為此,亟需一種結(jié)合多通道數(shù)據(jù)處理、相干譜減法優(yōu)化和深度學(xué)習(xí)分類技術(shù)的系統(tǒng),以實(shí)現(xiàn)更高效的噪聲抑制、聲源定位及聲音分類。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明實(shí)施例的目的是提供一種牛聲去噪與分類方法,該方法用于實(shí)現(xiàn)對(duì)多通道音頻數(shù)據(jù)的去噪,從而提高音頻分類的準(zhǔn)確性。

2、為了實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供一種牛聲去噪與分類方法,所述方法包括:接收多通道牛聲音頻數(shù)據(jù),并對(duì)其進(jìn)行通道分離以獲得多個(gè)單通道音頻數(shù)據(jù);利用波束形成技術(shù)將所述多個(gè)單通道音頻數(shù)據(jù)合并至一個(gè)通道后,通過噪聲音頻估計(jì)獲得合并后的音頻數(shù)據(jù)中的噪聲信號(hào);對(duì)所述合并后的音頻數(shù)據(jù)進(jìn)行stft短時(shí)傅里葉變換及平滑處理,以獲得所述合并后的音頻數(shù)據(jù)的頻譜幅度;根據(jù)所述音頻數(shù)據(jù)的頻譜幅度,計(jì)算所述合并后的音頻數(shù)據(jù)與所述噪聲信號(hào)的相干性系數(shù);根據(jù)所述相干性系數(shù),自適應(yīng)地調(diào)整α參數(shù),以控制去除所述音頻數(shù)據(jù)中的噪聲信號(hào)的比例,得到去噪后的所述音頻數(shù)據(jù);以及利用分類模型對(duì)所述去噪后的所述音頻數(shù)據(jù)進(jìn)行分類,得到所述音頻數(shù)據(jù)的類別信息。

3、可選的,在利用波束形成技術(shù)將所述多個(gè)單通道音頻數(shù)據(jù)合并至一個(gè)通道之前,所述方法還包括:分別對(duì)所述多個(gè)單通道音頻數(shù)據(jù)進(jìn)行信號(hào)處理,以獲得所述多個(gè)單通道音頻數(shù)據(jù)的位置信息。

4、可選的,所述信號(hào)處理包括:根據(jù)接收到所述多個(gè)單通道音頻數(shù)據(jù)的時(shí)間差以及采集所述多通道牛聲音頻數(shù)據(jù)的音頻數(shù)據(jù)采集裝置的位置信息,利用時(shí)延估計(jì)獲得所述多個(gè)單通道音頻數(shù)據(jù)的位置信息;對(duì)經(jīng)過時(shí)延估計(jì)后的所述多個(gè)單通道音頻數(shù)據(jù)進(jìn)行時(shí)延補(bǔ)償,以調(diào)整所述多個(gè)單通道音頻數(shù)據(jù)之間的時(shí)間差。

5、可選的,所述方法還包括:接收牛只視頻數(shù)據(jù),利用深度估計(jì)模型對(duì)所述視頻數(shù)據(jù)進(jìn)行逐幀深度估計(jì)并生成深度圖;以及結(jié)合所述深度圖將所述位置信息映射至所述視頻數(shù)據(jù)的視頻幀圖像中,并根據(jù)所述位置信息,將與該位置信息相對(duì)應(yīng)的類別信息標(biāo)注至所述視頻幀圖像中對(duì)應(yīng)的位置處。

6、可選的,根據(jù)所述音頻數(shù)據(jù)的頻譜幅度,計(jì)算合并后的音頻數(shù)據(jù)與所述噪聲信號(hào)的相干性系數(shù),包括:計(jì)算所述合并后的音頻數(shù)據(jù)與所述噪聲信號(hào)在頻率f處的相干程度,其計(jì)算公式為:

7、

8、其中,γ(f)為相干性系數(shù),x(f)表示所述音頻數(shù)據(jù)中的音頻信號(hào)在頻率f處的復(fù)數(shù)頻譜,n(f)表示所述噪聲信號(hào)在頻率f處的復(fù)數(shù)頻譜,e[·]表示x(f)與n(f)之間的期望值,表示所述噪聲信號(hào)在頻率f處復(fù)數(shù)頻譜的平均近似值。

9、可選的,根據(jù)所述相干性系數(shù),自適應(yīng)地調(diào)整α參數(shù),其計(jì)算公式為:

10、

11、其中,α0是譜減系數(shù),用于調(diào)節(jié)減噪的強(qiáng)度,γ(f)是在頻率f處計(jì)算的相干性系數(shù),∈是設(shè)定的數(shù)值,用于避免分母為零的情況,αmax是α(f)的最大值,用于防止α(f)過大導(dǎo)致過度減噪。

12、第二方面,本發(fā)明實(shí)施例提供一種牛聲去噪與分類系統(tǒng),所述系統(tǒng)包括:

13、多通道音頻采集模塊,用于采集多通道牛聲音頻數(shù)據(jù),并對(duì)其進(jìn)行通道分離以獲得多個(gè)單通道音頻數(shù)據(jù);去噪模塊,用于利用波束形成技術(shù)將所述多個(gè)單通道音頻數(shù)據(jù)合并至一個(gè)通道后,通過噪聲音頻估計(jì)獲得合并后的音頻數(shù)據(jù)中的噪聲信號(hào),對(duì)所述合并后的音頻數(shù)據(jù)進(jìn)行stft短時(shí)傅里葉變換及平滑處理,以獲得所述合并后的音頻數(shù)據(jù)的頻譜幅度,根據(jù)所述音頻數(shù)據(jù)的頻譜幅度,計(jì)算所述合并后的音頻數(shù)據(jù)與所述噪聲信號(hào)的相干性系數(shù),根據(jù)所述相干性系數(shù),自適應(yīng)地調(diào)整α參數(shù),以控制去除所述音頻數(shù)據(jù)中的噪聲信號(hào)的比例,得到去噪后的所述音頻數(shù)據(jù);以及分類模塊,用于利用分類模型對(duì)所述去噪處理后的音頻數(shù)據(jù)進(jìn)行分類,得到所述音頻數(shù)據(jù)的類別信息。

14、可選的,所述系統(tǒng)還包括:視頻處理模塊,采集牛只視頻數(shù)據(jù),利用深度估計(jì)模型對(duì)所述視頻數(shù)據(jù)進(jìn)行逐幀深度估計(jì)并生成深度圖;可視化模塊,用于結(jié)合所述深度圖將所述位置信息映射至所述視頻數(shù)據(jù)的視頻幀圖像中,并根據(jù)所述位置信息,將與該位置信息相對(duì)應(yīng)的類別信息標(biāo)注至所述視頻幀圖像中對(duì)應(yīng)的位置處。

15、第三方面,本發(fā)明實(shí)施例提供一種機(jī)器可讀存儲(chǔ)介質(zhì),該機(jī)器可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有指令,該指令用于使得機(jī)器執(zhí)行本申請(qǐng)上述任一項(xiàng)牛聲去噪與分類的方法。

16、第四方面,本發(fā)明實(shí)施例提供一種處理器,其特征在于,用于運(yùn)行程序,其中,所述程序被運(yùn)行時(shí)用于執(zhí)行:如權(quán)利要求1-6任意一項(xiàng)所述的牛聲去噪與分類方法。

17、通過上述技術(shù)方案,本發(fā)明實(shí)施例通過接收多聲道的音頻數(shù)據(jù),并將多聲道音頻數(shù)據(jù)進(jìn)行通道分離后對(duì)多個(gè)單通道音頻數(shù)據(jù)進(jìn)行處理,可以有效的結(jié)合多通道音頻信息提升音頻分類的性能。利用波束形成技術(shù)將多個(gè)單通道的音頻合并至一個(gè)通道后進(jìn)行去噪處理,以達(dá)到增強(qiáng)音頻數(shù)據(jù)的目的。利用基于相干譜減法的去噪,結(jié)合動(dòng)態(tài)調(diào)整的自適應(yīng)參數(shù)α,根據(jù)信號(hào)與噪聲的相干性特征靈活調(diào)節(jié)去噪強(qiáng)度,在復(fù)雜噪聲環(huán)境下顯著提升去噪效果,有效保留音頻信號(hào)的細(xì)節(jié)信息,減少信號(hào)失真。并且,利用去噪后的音頻數(shù)據(jù)進(jìn)行后續(xù)的音頻分類,提高了分類的準(zhǔn)確性。

18、本發(fā)明實(shí)施例的其它特征和優(yōu)點(diǎn)將在隨后的具體實(shí)施方式部分予以詳細(xì)說明。



技術(shù)特征:

1.一種牛聲去噪與分類方法,其特征在于,所述方法包括:

2.根據(jù)權(quán)利要求1所述的牛聲去噪與分類方法,其特征在于,在利用波束形成技術(shù)將所述多個(gè)單通道音頻數(shù)據(jù)合并至一個(gè)通道之前,所述方法還包括:

3.根據(jù)權(quán)利要求2所述的牛聲去噪與分類方法,其特征在于,所述信號(hào)處理包括:

4.根據(jù)權(quán)利要求2所述的牛聲去噪與分類方法,其特征在于,所述方法還包括:

5.根據(jù)權(quán)利要求1所述的牛聲去噪與分類方法,其特征在于,根據(jù)所述音頻數(shù)據(jù)的頻譜幅度,計(jì)算合并后的音頻數(shù)據(jù)與所述噪聲信號(hào)的相干性系數(shù),包括:

6.根據(jù)權(quán)利要求1所述的牛聲去噪與分類方法,其特征在于,根據(jù)所述相干性系數(shù),自適應(yīng)地調(diào)整α參數(shù),其計(jì)算公式為:

7.一種牛聲去噪與分類系統(tǒng),其特征在于,所述系統(tǒng)包括:

8.根據(jù)權(quán)利要求7所述的牛聲去噪與分類系統(tǒng),其特征在于,所述系統(tǒng)還包括:

9.一種機(jī)器可讀存儲(chǔ)介質(zhì),該機(jī)器可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有指令,該指令用于使得機(jī)器執(zhí)行本申請(qǐng)上述任一項(xiàng)牛聲去噪與分類的方法。

10.一種處理器,其特征在于,用于運(yùn)行程序,其中,所述程序被運(yùn)行時(shí)用于執(zhí)行:如權(quán)利要求1-6任意一項(xiàng)所述的牛聲去噪與分類方法。


技術(shù)總結(jié)
本發(fā)明實(shí)施例提供一種牛聲去噪與分類方法,所述方法包括:接收多通道牛聲音頻數(shù)據(jù),并對(duì)其進(jìn)行通道分離獲得多個(gè)單通道音頻數(shù)據(jù);利用波束形成技術(shù)將多個(gè)單通道音頻數(shù)據(jù)合并至一個(gè)通道后,對(duì)該音頻數(shù)據(jù)進(jìn)行短時(shí)傅里葉變換,并計(jì)算音頻數(shù)據(jù)與噪聲信號(hào)的相干性系數(shù);根據(jù)相干性系數(shù),自適應(yīng)地調(diào)整α參數(shù),以控制去除音頻數(shù)據(jù)中的噪聲信號(hào)的比例,得到去噪后的音頻數(shù)據(jù);以及利用分類模型對(duì)去噪后的音頻數(shù)據(jù)進(jìn)行分類,得到音頻數(shù)據(jù)的類別信息。本發(fā)明實(shí)現(xiàn)了對(duì)多通道音頻數(shù)據(jù)的處理,通過計(jì)算信號(hào)的相干性,有效區(qū)分音頻信號(hào)與噪聲,更好地保留了牛聲的細(xì)節(jié)信息,從而提升牛聲分類的準(zhǔn)確性。

技術(shù)研發(fā)人員:房建東,宋健,趙于東
受保護(hù)的技術(shù)使用者:內(nèi)蒙古工業(yè)大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/8
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1