一種語(yǔ)音喚醒系統(tǒng)及其喚醒方法、可穿戴設(shè)備與流程

文檔序號(hào)：41869898發(fā)布日期：2025-05-09 18:38閱讀：5來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及音頻處理，更具體地，涉及一種語(yǔ)音喚醒系統(tǒng)及其喚醒方法、可穿戴設(shè)備。

背景技術(shù)：

1、對(duì)于現(xiàn)有的大多數(shù)可穿戴設(shè)備，通常采樣多個(gè)聲波麥克風(fēng)來進(jìn)行收聲。例如智能眼鏡，其可以在鏡框或鏡腿上布置多個(gè)聲波麥克風(fēng)。目前，這類型可穿戴設(shè)備在喚醒時(shí)大多需要持續(xù)檢測(cè)并保持語(yǔ)音喚醒功能，同時(shí)需要在待機(jī)和工作模式之間頻繁切換，這導(dǎo)致設(shè)備功耗較大。

技術(shù)實(shí)現(xiàn)思路

1、有鑒于此，本發(fā)明實(shí)施例提供一種語(yǔ)音喚醒系統(tǒng)及其喚醒方法、可穿戴設(shè)備，以利用骨傳導(dǎo)麥克風(fēng)語(yǔ)音活動(dòng)檢測(cè)以實(shí)現(xiàn)一級(jí)語(yǔ)音喚醒，并在檢測(cè)到語(yǔ)音活動(dòng)后才對(duì)采集到的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，以進(jìn)行喚醒詞的二級(jí)語(yǔ)音喚醒，這使得本發(fā)明實(shí)施例可以在保證喚醒靈敏度的同時(shí)有效避免誤喚醒，降低了設(shè)備功耗。

2、第一方面，本發(fā)明實(shí)施例提供一種語(yǔ)音喚醒系統(tǒng)，所述語(yǔ)音喚醒系統(tǒng)包括：

3、至少一個(gè)聲波麥克風(fēng)；

4、至少一個(gè)骨傳導(dǎo)麥克風(fēng)；以及

5、控制器，用于根據(jù)所述骨傳導(dǎo)麥克風(fēng)檢測(cè)語(yǔ)音活動(dòng)信號(hào)，響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào)，對(duì)采集到的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，響應(yīng)于檢測(cè)到喚醒詞，喚醒對(duì)應(yīng)的設(shè)備。

6、進(jìn)一步地，所述至少一個(gè)聲波麥克風(fēng)分布設(shè)置可穿戴設(shè)備的兩側(cè)，所述骨傳導(dǎo)麥克風(fēng)設(shè)置在所述可穿戴設(shè)備的預(yù)定區(qū)域，其中，所述預(yù)定區(qū)域中的至少部分區(qū)域在所述可穿戴設(shè)備被穿戴后與穿戴對(duì)象接觸。

7、進(jìn)一步地，所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào)，基于預(yù)先訓(xùn)練的第一語(yǔ)音識(shí)別模型對(duì)所述骨傳導(dǎo)麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，以進(jìn)行喚醒詞檢測(cè)。

8、進(jìn)一步地，所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào)，控制啟動(dòng)至少一個(gè)聲波麥克風(fēng)，并基于預(yù)先訓(xùn)練的第二語(yǔ)音識(shí)別模型對(duì)所述聲波麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，以進(jìn)行喚醒詞檢測(cè)。

9、進(jìn)一步地，所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào)，控制啟動(dòng)至少一個(gè)聲波麥克風(fēng)，并基于預(yù)先訓(xùn)練的第三語(yǔ)音識(shí)別模型對(duì)所述骨傳導(dǎo)麥克風(fēng)和各所述聲波麥克風(fēng)采集的多個(gè)聲音信號(hào)進(jìn)行融合處理，以進(jìn)行喚醒詞檢測(cè)。

10、進(jìn)一步地，所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào)，控制啟動(dòng)至少一個(gè)聲波麥克風(fēng)，基于預(yù)先訓(xùn)練的第一語(yǔ)音識(shí)別模型對(duì)所述骨傳導(dǎo)麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，響應(yīng)于所述第一語(yǔ)音識(shí)別模型檢測(cè)到喚醒詞，基于預(yù)先訓(xùn)練的第二語(yǔ)音識(shí)別模型對(duì)各所述聲波麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，以進(jìn)行喚醒詞檢測(cè)的校驗(yàn)。

11、進(jìn)一步地，所述控制器用于響應(yīng)于所述第一語(yǔ)音識(shí)別模型檢測(cè)到喚醒詞且檢測(cè)置信度小于預(yù)定值，基于預(yù)先訓(xùn)練的第二語(yǔ)音識(shí)別模型對(duì)所述聲波麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，以進(jìn)行喚醒詞檢測(cè)的校驗(yàn)。

12、進(jìn)一步地，所述語(yǔ)音喚醒系統(tǒng)還包括：

13、主控，用于在受控喚醒后對(duì)接收到的聲音信號(hào)進(jìn)行音頻處理；

14、其中，所述控制器用于響應(yīng)于檢測(cè)到喚醒詞，喚醒所述主控。

15、進(jìn)一步地，所述主控部署有第四語(yǔ)音識(shí)別模型，所述主控用于根據(jù)所述第四語(yǔ)音識(shí)別模型對(duì)所述控制器的喚醒詞檢測(cè)結(jié)果進(jìn)行校驗(yàn)。

16、第二方面，本發(fā)明實(shí)施例提供一種可穿戴設(shè)備，所述可穿戴設(shè)備包括：

17、設(shè)備主體；以及

18、如上所述的語(yǔ)音喚醒系統(tǒng)。

19、進(jìn)一步地，所述可穿戴設(shè)備為智能眼鏡，所述語(yǔ)音喚醒系統(tǒng)中的聲波麥克風(fēng)分布設(shè)置在鏡腿和/或鏡框上，所述語(yǔ)音喚醒系統(tǒng)中的骨傳導(dǎo)麥克風(fēng)設(shè)置在鼻托所在區(qū)域。

20、進(jìn)一步地，各所述聲波麥克風(fēng)對(duì)稱分布在兩側(cè)的所述鏡腿和/或鏡框上。

21、第三方面，本發(fā)明實(shí)施例提供一種語(yǔ)音喚醒系統(tǒng)的喚醒方法，所述語(yǔ)音喚醒系統(tǒng)包括至少一個(gè)聲波麥克風(fēng)和至少一個(gè)骨傳導(dǎo)麥克風(fēng)，所述方法包括：

22、啟動(dòng)所述骨傳導(dǎo)麥克風(fēng)檢測(cè)語(yǔ)音活動(dòng)信號(hào)；

23、響應(yīng)于所述骨傳導(dǎo)麥克風(fēng)檢測(cè)到語(yǔ)音活動(dòng)信號(hào)，采集目標(biāo)麥克風(fēng)的聲音信號(hào)，所述目標(biāo)麥克風(fēng)包括至少一個(gè)所述聲波麥克風(fēng)和/或骨傳導(dǎo)麥克風(fēng)；

24、對(duì)所述聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，以進(jìn)行喚醒詞檢測(cè)；

25、響應(yīng)于檢測(cè)到喚醒詞，喚醒對(duì)應(yīng)的設(shè)備。

26、本發(fā)明實(shí)施例的語(yǔ)音喚醒系統(tǒng)包括至少一個(gè)聲波麥克風(fēng)、至少一個(gè)骨傳導(dǎo)麥克風(fēng)和控制器，其中，控制器用于根據(jù)骨傳導(dǎo)麥克風(fēng)檢測(cè)語(yǔ)音活動(dòng)信號(hào)，響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào)，對(duì)采集到的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，響應(yīng)于檢測(cè)到喚醒詞，喚醒對(duì)應(yīng)的設(shè)備。由此，本發(fā)明實(shí)施例可以利用骨傳導(dǎo)麥克風(fēng)語(yǔ)音活動(dòng)檢測(cè)以實(shí)現(xiàn)一級(jí)語(yǔ)音喚醒，并在檢測(cè)到語(yǔ)音活動(dòng)后對(duì)采集到的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，以進(jìn)行喚醒詞的二級(jí)語(yǔ)音喚醒，這使得本發(fā)明實(shí)施例可以在保證喚醒靈敏度的同時(shí)有效避免誤喚醒，降低了設(shè)備功耗。

技術(shù)特征：

1.一種語(yǔ)音喚醒系統(tǒng)，其特征在于，所述語(yǔ)音喚醒系統(tǒng)包括：

2.根據(jù)權(quán)利要求1所述的語(yǔ)音喚醒系統(tǒng)，其特征在于，所述至少一個(gè)聲波麥克風(fēng)分布設(shè)置可穿戴設(shè)備的兩側(cè)，所述骨傳導(dǎo)麥克風(fēng)設(shè)置在所述可穿戴設(shè)備的預(yù)定區(qū)域，其中，所述預(yù)定區(qū)域中的至少部分區(qū)域在所述可穿戴設(shè)備被穿戴后與穿戴對(duì)象接觸。

3.根據(jù)權(quán)利要求1所述的語(yǔ)音喚醒系統(tǒng)，其特征在于，所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào)，基于預(yù)先訓(xùn)練的第一語(yǔ)音識(shí)別模型對(duì)所述骨傳導(dǎo)麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，以進(jìn)行喚醒詞檢測(cè)。

4.根據(jù)權(quán)利要求1所述的語(yǔ)音喚醒系統(tǒng)，其特征在于，所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào)，控制啟動(dòng)至少一個(gè)聲波麥克風(fēng)，并基于預(yù)先訓(xùn)練的第二語(yǔ)音識(shí)別模型對(duì)所述聲波麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，以進(jìn)行喚醒詞檢測(cè)。

5.根據(jù)權(quán)利要求1所述的語(yǔ)音喚醒系統(tǒng)，其特征在于，所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào)，控制啟動(dòng)至少一個(gè)聲波麥克風(fēng)，并基于預(yù)先訓(xùn)練的第三語(yǔ)音識(shí)別模型對(duì)所述骨傳導(dǎo)麥克風(fēng)和各所述聲波麥克風(fēng)采集的多個(gè)聲音信號(hào)進(jìn)行融合處理，以進(jìn)行喚醒詞檢測(cè)。

6.根據(jù)權(quán)利要求1所述的語(yǔ)音喚醒系統(tǒng)，其特征在于，所述控制器用于響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào)，控制啟動(dòng)至少一個(gè)聲波麥克風(fēng)，基于預(yù)先訓(xùn)練的第一語(yǔ)音識(shí)別模型對(duì)所述骨傳導(dǎo)麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，響應(yīng)于所述第一語(yǔ)音識(shí)別模型檢測(cè)到喚醒詞，基于預(yù)先訓(xùn)練的第二語(yǔ)音識(shí)別模型對(duì)各所述聲波麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，以進(jìn)行喚醒詞檢測(cè)的校驗(yàn)。

7.根據(jù)權(quán)利要求6所述的語(yǔ)音喚醒系統(tǒng)，其特征在于，所述控制器用于響應(yīng)于所述第一語(yǔ)音識(shí)別模型檢測(cè)到喚醒詞且檢測(cè)置信度小于預(yù)定值，基于預(yù)先訓(xùn)練的第二語(yǔ)音識(shí)別模型對(duì)所述聲波麥克風(fēng)采集的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，以進(jìn)行喚醒詞檢測(cè)的校驗(yàn)。

8.根據(jù)權(quán)利要求1所述的語(yǔ)音喚醒系統(tǒng)，其特征在于，所述語(yǔ)音喚醒系統(tǒng)還包括：

9.根據(jù)權(quán)利要求8所述的語(yǔ)音喚醒系統(tǒng)，其特征在于，所述主控部署有第四語(yǔ)音識(shí)別模型，所述主控用于根據(jù)所述第四語(yǔ)音識(shí)別模型對(duì)所述控制器的喚醒詞檢測(cè)結(jié)果進(jìn)行校驗(yàn)。

10.一種可穿戴設(shè)備，其特征在于，所述可穿戴設(shè)備包括：

11.根據(jù)權(quán)利要求10所述的可穿戴設(shè)備，其特征在于，所述可穿戴設(shè)備為智能眼鏡，所述語(yǔ)音喚醒系統(tǒng)中的聲波麥克風(fēng)分布設(shè)置在鏡腿和/或鏡框上，所述語(yǔ)音喚醒系統(tǒng)中的骨傳導(dǎo)麥克風(fēng)設(shè)置在鼻托所在區(qū)域。

12.根據(jù)權(quán)利要求11所述的可穿戴設(shè)備，其特征在于，各所述聲波麥克風(fēng)對(duì)稱分布在兩側(cè)的所述鏡腿和/或鏡框上。

13.一種語(yǔ)音喚醒系統(tǒng)的喚醒方法，其特征在于，所述語(yǔ)音喚醒系統(tǒng)包括至少一個(gè)聲波麥克風(fēng)和至少一個(gè)骨傳導(dǎo)麥克風(fēng)，所述方法包括：

技術(shù)總結(jié)
本發(fā)明實(shí)施例公開了一種語(yǔ)音喚醒系統(tǒng)及其喚醒方法、可穿戴設(shè)備，本發(fā)明實(shí)施例的語(yǔ)音喚醒系統(tǒng)包括至少一個(gè)聲波麥克風(fēng)、至少一個(gè)骨傳導(dǎo)麥克風(fēng)和控制器，其中，控制器用于根據(jù)骨傳導(dǎo)麥克風(fēng)檢測(cè)語(yǔ)音活動(dòng)信號(hào)，響應(yīng)于檢測(cè)到語(yǔ)音活動(dòng)信號(hào)，對(duì)采集到的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，響應(yīng)于檢測(cè)到喚醒詞，喚醒設(shè)備。由此，本發(fā)明實(shí)施例可以利用骨傳導(dǎo)麥克風(fēng)語(yǔ)音活動(dòng)檢測(cè)以實(shí)現(xiàn)一級(jí)語(yǔ)音喚醒，并在檢測(cè)到語(yǔ)音活動(dòng)后對(duì)采集到的聲音信號(hào)進(jìn)行語(yǔ)音識(shí)別，以進(jìn)行喚醒詞的二級(jí)語(yǔ)音喚醒，這使得本發(fā)明實(shí)施例可以在保證喚醒靈敏度的同時(shí)有效避免誤喚醒，降低了設(shè)備功耗。

技術(shù)研發(fā)人員：王洪裕,梁小濤,宋剛
受保護(hù)的技術(shù)使用者：浙江未來精靈人工智能科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/5/8

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王洪裕,梁小濤,宋剛
技術(shù)所有人：浙江未來精靈人工智能科技有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

成人打一炮免费视频,亚洲天堂视频在线观看,97视频久久久,日本japanese护士色高清,五月婷婷丁香,日韩精品一级无码毛片免费,国产欧美日韩精品网红剧情演绎

一種語(yǔ)音喚醒系統(tǒng)及其喚醒方法、可穿戴設(shè)備與流程