成人打一炮免费视频,亚洲天堂视频在线观看,97视频久久久,日本japanese护士色高清,五月婷婷丁香,日韩精品一级无码毛片免费,国产欧美日韩精品网红剧情演绎

一種語(yǔ)音喚醒系統(tǒng)及其喚醒方法、可穿戴設(shè)備與流程

文檔序號(hào):41869898發(fā)布日期:2025-05-09 18:38閱讀:5來源:國(guó)知局
一種語(yǔ)音喚醒系統(tǒng)及其喚醒方法、可穿戴設(shè)備與流程

本發(fā)明涉及音頻處理,更具體地,涉及一種語(yǔ)音喚醒系統(tǒng)及其喚醒方法、可穿戴設(shè)備。


背景技術(shù):

1、對(duì)于現(xiàn)有的大多數(shù)可穿戴設(shè)備,通常采樣多個(gè)聲波麥克風(fēng)來進(jìn)行收聲。例如智能眼鏡,其可以在鏡框或鏡腿上布置多個(gè)聲波麥克風(fēng)。目前,這類型可穿戴設(shè)備在喚醒時(shí)大多需要持續(xù)檢測(cè)并保持語(yǔ)音喚醒功能,同時(shí)需要在待機(jī)和工作模式之間頻繁切換,這導(dǎo)致設(shè)備功耗較大。


技術(shù)實(shí)現(xiàn)思路

1、有鑒于此,本發(fā)明實(shí)施例提供一種語(yǔ)音喚醒系統(tǒng)及其喚醒方法、可穿戴設(shè)備,以利用骨傳導(dǎo)麥克風(fēng)語(yǔ)音活動(dòng)檢測(cè)以實(shí)現(xiàn)一級(jí)語(yǔ)音喚醒,并在檢測(cè)到語(yǔ)音活動(dòng)后才對(duì)采集到的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,以進(jìn)行喚醒詞的二級(jí)語(yǔ)音喚醒,這使得本發(fā)明實(shí)施例可以在保證喚醒靈敏度的同時(shí)有效避免誤喚醒,降低了設(shè)備功耗。

2、第一方面,本發(fā)明實(shí)施例提供一種語(yǔ)音喚醒系統(tǒng),所述語(yǔ)音喚醒系統(tǒng)包括:

3、至少一個(gè)聲波麥克風(fēng);

4、至少一個(gè)骨傳導(dǎo)麥克風(fēng);以及

5、控制器,用于根據(jù)所述骨傳導(dǎo)麥克風(fēng)檢測(cè)語(yǔ)音活動(dòng)信號(hào),響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào),對(duì)采集到的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,響應(yīng)于檢測(cè)到喚醒詞,喚醒對(duì)應(yīng)的設(shè)備。

6、進(jìn)一步地,所述至少一個(gè)聲波麥克風(fēng)分布設(shè)置可穿戴設(shè)備的兩側(cè),所述骨傳導(dǎo)麥克風(fēng)設(shè)置在所述可穿戴設(shè)備的預(yù)定區(qū)域,其中,所述預(yù)定區(qū)域中的至少部分區(qū)域在所述可穿戴設(shè)備被穿戴后與穿戴對(duì)象接觸。

7、進(jìn)一步地,所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào),基于預(yù)先訓(xùn)練的第一語(yǔ)音識(shí)別模型對(duì)所述骨傳導(dǎo)麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,以進(jìn)行喚醒詞檢測(cè)。

8、進(jìn)一步地,所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào),控制啟動(dòng)至少一個(gè)聲波麥克風(fēng),并基于預(yù)先訓(xùn)練的第二語(yǔ)音識(shí)別模型對(duì)所述聲波麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,以進(jìn)行喚醒詞檢測(cè)。

9、進(jìn)一步地,所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào),控制啟動(dòng)至少一個(gè)聲波麥克風(fēng),并基于預(yù)先訓(xùn)練的第三語(yǔ)音識(shí)別模型對(duì)所述骨傳導(dǎo)麥克風(fēng)和各所述聲波麥克風(fēng)采集的多個(gè)聲音信號(hào)進(jìn)行融合處理,以進(jìn)行喚醒詞檢測(cè)。

10、進(jìn)一步地,所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào),控制啟動(dòng)至少一個(gè)聲波麥克風(fēng),基于預(yù)先訓(xùn)練的第一語(yǔ)音識(shí)別模型對(duì)所述骨傳導(dǎo)麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,響應(yīng)于所述第一語(yǔ)音識(shí)別模型檢測(cè)到喚醒詞,基于預(yù)先訓(xùn)練的第二語(yǔ)音識(shí)別模型對(duì)各所述聲波麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,以進(jìn)行喚醒詞檢測(cè)的校驗(yàn)。

11、進(jìn)一步地,所述控制器用于響應(yīng)于所述第一語(yǔ)音識(shí)別模型檢測(cè)到喚醒詞且檢測(cè)置信度小于預(yù)定值,基于預(yù)先訓(xùn)練的第二語(yǔ)音識(shí)別模型對(duì)所述聲波麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,以進(jìn)行喚醒詞檢測(cè)的校驗(yàn)。

12、進(jìn)一步地,所述語(yǔ)音喚醒系統(tǒng)還包括:

13、主控,用于在受控喚醒后對(duì)接收到的聲音信號(hào)進(jìn)行音頻處理;

14、其中,所述控制器用于響應(yīng)于檢測(cè)到喚醒詞,喚醒所述主控。

15、進(jìn)一步地,所述主控部署有第四語(yǔ)音識(shí)別模型,所述主控用于根據(jù)所述第四語(yǔ)音識(shí)別模型對(duì)所述控制器的喚醒詞檢測(cè)結(jié)果進(jìn)行校驗(yàn)。

16、第二方面,本發(fā)明實(shí)施例提供一種可穿戴設(shè)備,所述可穿戴設(shè)備包括:

17、設(shè)備主體;以及

18、如上所述的語(yǔ)音喚醒系統(tǒng)。

19、進(jìn)一步地,所述可穿戴設(shè)備為智能眼鏡,所述語(yǔ)音喚醒系統(tǒng)中的聲波麥克風(fēng)分布設(shè)置在鏡腿和/或鏡框上,所述語(yǔ)音喚醒系統(tǒng)中的骨傳導(dǎo)麥克風(fēng)設(shè)置在鼻托所在區(qū)域。

20、進(jìn)一步地,各所述聲波麥克風(fēng)對(duì)稱分布在兩側(cè)的所述鏡腿和/或鏡框上。

21、第三方面,本發(fā)明實(shí)施例提供一種語(yǔ)音喚醒系統(tǒng)的喚醒方法,所述語(yǔ)音喚醒系統(tǒng)包括至少一個(gè)聲波麥克風(fēng)和至少一個(gè)骨傳導(dǎo)麥克風(fēng),所述方法包括:

22、啟動(dòng)所述骨傳導(dǎo)麥克風(fēng)檢測(cè)語(yǔ)音活動(dòng)信號(hào);

23、響應(yīng)于所述骨傳導(dǎo)麥克風(fēng)檢測(cè)到語(yǔ)音活動(dòng)信號(hào),采集目標(biāo)麥克風(fēng)的聲音信號(hào),所述目標(biāo)麥克風(fēng)包括至少一個(gè)所述聲波麥克風(fēng)和/或骨傳導(dǎo)麥克風(fēng);

24、對(duì)所述聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,以進(jìn)行喚醒詞檢測(cè);

25、響應(yīng)于檢測(cè)到喚醒詞,喚醒對(duì)應(yīng)的設(shè)備。

26、本發(fā)明實(shí)施例的語(yǔ)音喚醒系統(tǒng)包括至少一個(gè)聲波麥克風(fēng)、至少一個(gè)骨傳導(dǎo)麥克風(fēng)和控制器,其中,控制器用于根據(jù)骨傳導(dǎo)麥克風(fēng)檢測(cè)語(yǔ)音活動(dòng)信號(hào),響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào),對(duì)采集到的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,響應(yīng)于檢測(cè)到喚醒詞,喚醒對(duì)應(yīng)的設(shè)備。由此,本發(fā)明實(shí)施例可以利用骨傳導(dǎo)麥克風(fēng)語(yǔ)音活動(dòng)檢測(cè)以實(shí)現(xiàn)一級(jí)語(yǔ)音喚醒,并在檢測(cè)到語(yǔ)音活動(dòng)后對(duì)采集到的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,以進(jìn)行喚醒詞的二級(jí)語(yǔ)音喚醒,這使得本發(fā)明實(shí)施例可以在保證喚醒靈敏度的同時(shí)有效避免誤喚醒,降低了設(shè)備功耗。



技術(shù)特征:

1.一種語(yǔ)音喚醒系統(tǒng),其特征在于,所述語(yǔ)音喚醒系統(tǒng)包括:

2.根據(jù)權(quán)利要求1所述的語(yǔ)音喚醒系統(tǒng),其特征在于,所述至少一個(gè)聲波麥克風(fēng)分布設(shè)置可穿戴設(shè)備的兩側(cè),所述骨傳導(dǎo)麥克風(fēng)設(shè)置在所述可穿戴設(shè)備的預(yù)定區(qū)域,其中,所述預(yù)定區(qū)域中的至少部分區(qū)域在所述可穿戴設(shè)備被穿戴后與穿戴對(duì)象接觸。

3.根據(jù)權(quán)利要求1所述的語(yǔ)音喚醒系統(tǒng),其特征在于,所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào),基于預(yù)先訓(xùn)練的第一語(yǔ)音識(shí)別模型對(duì)所述骨傳導(dǎo)麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,以進(jìn)行喚醒詞檢測(cè)。

4.根據(jù)權(quán)利要求1所述的語(yǔ)音喚醒系統(tǒng),其特征在于,所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào),控制啟動(dòng)至少一個(gè)聲波麥克風(fēng),并基于預(yù)先訓(xùn)練的第二語(yǔ)音識(shí)別模型對(duì)所述聲波麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,以進(jìn)行喚醒詞檢測(cè)。

5.根據(jù)權(quán)利要求1所述的語(yǔ)音喚醒系統(tǒng),其特征在于,所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào),控制啟動(dòng)至少一個(gè)聲波麥克風(fēng),并基于預(yù)先訓(xùn)練的第三語(yǔ)音識(shí)別模型對(duì)所述骨傳導(dǎo)麥克風(fēng)和各所述聲波麥克風(fēng)采集的多個(gè)聲音信號(hào)進(jìn)行融合處理,以進(jìn)行喚醒詞檢測(cè)。

6.根據(jù)權(quán)利要求1所述的語(yǔ)音喚醒系統(tǒng),其特征在于,所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào),控制啟動(dòng)至少一個(gè)聲波麥克風(fēng),基于預(yù)先訓(xùn)練的第一語(yǔ)音識(shí)別模型對(duì)所述骨傳導(dǎo)麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,響應(yīng)于所述第一語(yǔ)音識(shí)別模型檢測(cè)到喚醒詞,基于預(yù)先訓(xùn)練的第二語(yǔ)音識(shí)別模型對(duì)各所述聲波麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,以進(jìn)行喚醒詞檢測(cè)的校驗(yàn)。

7.根據(jù)權(quán)利要求6所述的語(yǔ)音喚醒系統(tǒng),其特征在于,所述控制器用于響應(yīng)于所述第一語(yǔ)音識(shí)別模型檢測(cè)到喚醒詞且檢測(cè)置信度小于預(yù)定值,基于預(yù)先訓(xùn)練的第二語(yǔ)音識(shí)別模型對(duì)所述聲波麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,以進(jìn)行喚醒詞檢測(cè)的校驗(yàn)。

8.根據(jù)權(quán)利要求1所述的語(yǔ)音喚醒系統(tǒng),其特征在于,所述語(yǔ)音喚醒系統(tǒng)還包括:

9.根據(jù)權(quán)利要求8所述的語(yǔ)音喚醒系統(tǒng),其特征在于,所述主控部署有第四語(yǔ)音識(shí)別模型,所述主控用于根據(jù)所述第四語(yǔ)音識(shí)別模型對(duì)所述控制器的喚醒詞檢測(cè)結(jié)果進(jìn)行校驗(yàn)。

10.一種可穿戴設(shè)備,其特征在于,所述可穿戴設(shè)備包括:

11.根據(jù)權(quán)利要求10所述的可穿戴設(shè)備,其特征在于,所述可穿戴設(shè)備為智能眼鏡,所述語(yǔ)音喚醒系統(tǒng)中的聲波麥克風(fēng)分布設(shè)置在鏡腿和/或鏡框上,所述語(yǔ)音喚醒系統(tǒng)中的骨傳導(dǎo)麥克風(fēng)設(shè)置在鼻托所在區(qū)域。

12.根據(jù)權(quán)利要求11所述的可穿戴設(shè)備,其特征在于,各所述聲波麥克風(fēng)對(duì)稱分布在兩側(cè)的所述鏡腿和/或鏡框上。

13.一種語(yǔ)音喚醒系統(tǒng)的喚醒方法,其特征在于,所述語(yǔ)音喚醒系統(tǒng)包括至少一個(gè)聲波麥克風(fēng)和至少一個(gè)骨傳導(dǎo)麥克風(fēng),所述方法包括:


技術(shù)總結(jié)
本發(fā)明實(shí)施例公開了一種語(yǔ)音喚醒系統(tǒng)及其喚醒方法、可穿戴設(shè)備,本發(fā)明實(shí)施例的語(yǔ)音喚醒系統(tǒng)包括至少一個(gè)聲波麥克風(fēng)、至少一個(gè)骨傳導(dǎo)麥克風(fēng)和控制器,其中,控制器用于根據(jù)骨傳導(dǎo)麥克風(fēng)檢測(cè)語(yǔ)音活動(dòng)信號(hào),響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào),對(duì)采集到的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,響應(yīng)于檢測(cè)到喚醒詞,喚醒設(shè)備。由此,本發(fā)明實(shí)施例可以利用骨傳導(dǎo)麥克風(fēng)語(yǔ)音活動(dòng)檢測(cè)以實(shí)現(xiàn)一級(jí)語(yǔ)音喚醒,并在檢測(cè)到語(yǔ)音活動(dòng)后對(duì)采集到的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別,以進(jìn)行喚醒詞的二級(jí)語(yǔ)音喚醒,這使得本發(fā)明實(shí)施例可以在保證喚醒靈敏度的同時(shí)有效避免誤喚醒,降低了設(shè)備功耗。

技術(shù)研發(fā)人員:王洪裕,梁小濤,宋剛
受保護(hù)的技術(shù)使用者:浙江未來精靈人工智能科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/8
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1