成人打一炮免费视频,亚洲天堂视频在线观看,97视频久久久,日本japanese护士色高清,五月婷婷丁香,日韩精品一级无码毛片免费,国产欧美日韩精品网红剧情演绎

車輛語(yǔ)音識(shí)別方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)與流程

文檔序號(hào):41870951發(fā)布日期:2025-05-09 18:41閱讀:6來源:國(guó)知局
車輛語(yǔ)音識(shí)別方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)與流程

本公開涉及人工智能,具體涉及自動(dòng)駕駛、智能交通、語(yǔ)音識(shí)別以及深度學(xué)習(xí)等,尤其涉及一種車輛語(yǔ)音識(shí)別方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)。


背景技術(shù):

1、隨著車輛技術(shù)的發(fā)展,車輛已經(jīng)成為人們生活中必不可少的一部分。隨著人們對(duì)車輛的要求越來越高,在保證安全駕駛的前提下,人們同樣希望擁有良好的駕駛體驗(yàn)。語(yǔ)音交互技術(shù)作為一種方便快捷的技術(shù)手段,能夠很好地提高行車安全,在汽車上得到了廣泛的應(yīng)用。用戶可以通過語(yǔ)音與智能語(yǔ)音設(shè)備進(jìn)行交互,控制智能語(yǔ)音設(shè)備執(zhí)行相應(yīng)的操作,例如解鎖車門、賬號(hào)登錄等。


技術(shù)實(shí)現(xiàn)思路

1、本公開提供了一種車輛語(yǔ)音識(shí)別方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)。

2、根據(jù)本公開的第一方面,提供了一種車輛語(yǔ)音識(shí)別方法,包括:利用預(yù)先訓(xùn)練的聲紋模型生成目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)聲紋向量,其中,聲紋模型利用不同噪音環(huán)境下的語(yǔ)音樣本對(duì)訓(xùn)練得到;計(jì)算目標(biāo)聲紋向量與車輛對(duì)應(yīng)的已注冊(cè)聲紋向量之間的相似度;響應(yīng)于確定出相似度在預(yù)設(shè)的相似度閾值范圍內(nèi),執(zhí)行目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)操作。

3、根據(jù)本公開的第二方面,提供了一種聲紋模型的訓(xùn)練方法,包括:獲取訓(xùn)練樣本集,其中,訓(xùn)練樣本集中的訓(xùn)練樣本對(duì)包括正樣本語(yǔ)音和負(fù)樣本語(yǔ)音,正樣本語(yǔ)音為用戶在安靜環(huán)境下的語(yǔ)音,負(fù)樣本語(yǔ)音為用戶在噪音環(huán)境下的語(yǔ)音;利用訓(xùn)練樣本集對(duì)初始神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到聲紋模型。

4、根據(jù)本公開的第三方面,提供了一種車輛語(yǔ)音識(shí)別裝置,包括:生成模塊,被配置成利用預(yù)先訓(xùn)練的聲紋模型生成目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)聲紋向量,其中,聲紋模型利用不同噪音環(huán)境下的語(yǔ)音樣本對(duì)訓(xùn)練得到;計(jì)算模塊,被配置成計(jì)算目標(biāo)聲紋向量與車輛對(duì)應(yīng)的已注冊(cè)聲紋向量之間的相似度;執(zhí)行模塊,被配置成響應(yīng)于確定出相似度在預(yù)設(shè)的相似度閾值范圍內(nèi),執(zhí)行目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)操作。

5、根據(jù)本公開的第四方面,提供了一種車輛語(yǔ)音識(shí)別裝置,包括:獲取模塊,被配置成獲取訓(xùn)練樣本集,其中,訓(xùn)練樣本集中的訓(xùn)練樣本對(duì)包括正樣本語(yǔ)音和負(fù)樣本語(yǔ)音,正樣本語(yǔ)音為用戶在安靜環(huán)境下的語(yǔ)音,負(fù)樣本語(yǔ)音為用戶在噪音環(huán)境下的語(yǔ)音;訓(xùn)練模塊,被配置成利用訓(xùn)練樣本集對(duì)初始神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到聲紋模型。

6、根據(jù)本公開的第五方面,提供了一種電子設(shè)備,包括:至少一個(gè)處理器;以及與至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,存儲(chǔ)器存儲(chǔ)有可被至少一個(gè)處理器執(zhí)行的指令,指令被至少一個(gè)處理器執(zhí)行,以使至少一個(gè)處理器能夠執(zhí)行如第一方面或第二方面中任一實(shí)現(xiàn)方式描述的方法。

7、根據(jù)本公開的第六方面,提供了一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行如第一方面或第二方面中任一實(shí)現(xiàn)方式描述的方法。

8、根據(jù)本公開的第七方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面或第二方面中任一實(shí)現(xiàn)方式描述的方法。

9、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本公開的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。



技術(shù)特征:

1.一種車輛語(yǔ)音識(shí)別方法,包括:

2.根據(jù)權(quán)利要求1所述的方法,還包括:

3.根據(jù)權(quán)利要求2所述的方法,其中,所述利用所述目標(biāo)語(yǔ)音對(duì)所述聲紋模型進(jìn)行更新,得到更新后的聲紋模型,包括:

4.根據(jù)權(quán)利要求2所述的方法,還包括:

5.根據(jù)權(quán)利要求1所述的方法,其中,所述已注冊(cè)聲紋向量通過以下步驟得到:

6.根據(jù)權(quán)利要求5所述的方法,還包括:

7.根據(jù)權(quán)利要求1所述的方法,還包括:

8.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于確定出所述相似度在預(yù)設(shè)的相似度閾值范圍內(nèi),執(zhí)行所述目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)操作,包括:

9.根據(jù)權(quán)利要求8所述的方法,其中,所述確定所述車輛上采集所述目標(biāo)語(yǔ)音的目標(biāo)設(shè)備,包括:

10.根據(jù)權(quán)利要求8所述的方法,其中,所述目標(biāo)操作包括:解鎖操作;以及

11.一種聲紋模型的訓(xùn)練方法,包括:

12.根據(jù)權(quán)利要求11所述的方法,還包括:

13.一種車輛語(yǔ)音識(shí)別裝置,包括:

14.一種聲紋模型的訓(xùn)練裝置,包括:

15.一種電子設(shè)備,包括:

16.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行權(quán)利要求1-10或11-12中任一項(xiàng)所述的方法。

17.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)權(quán)利要求1-10或11-12中任一項(xiàng)所述的方法。


技術(shù)總結(jié)
本公開提供了一種車輛語(yǔ)音識(shí)別方法,涉及人工智能技術(shù)領(lǐng)域,具體涉及自動(dòng)駕駛、智能交通、語(yǔ)音識(shí)別以及深度學(xué)習(xí)等技術(shù)領(lǐng)域。該方法包括:利用預(yù)先訓(xùn)練的聲紋模型生成目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)聲紋向量,其中,聲紋模型利用不同噪音環(huán)境下的語(yǔ)音樣本對(duì)訓(xùn)練得到;計(jì)算目標(biāo)聲紋向量與車輛對(duì)應(yīng)的已注冊(cè)聲紋向量之間的相似度;響應(yīng)于確定出相似度在預(yù)設(shè)的相似度閾值范圍內(nèi),執(zhí)行目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)操作。該方法提高了車輛語(yǔ)音識(shí)別的準(zhǔn)確性和魯棒性。

技術(shù)研發(fā)人員:李棚
受保護(hù)的技術(shù)使用者:北京百度網(wǎng)訊科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/8
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1