本公開涉及人工智能,具體涉及自動(dòng)駕駛、智能交通、語(yǔ)音識(shí)別以及深度學(xué)習(xí)等,尤其涉及一種車輛語(yǔ)音識(shí)別方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著車輛技術(shù)的發(fā)展,車輛已經(jīng)成為人們生活中必不可少的一部分。隨著人們對(duì)車輛的要求越來越高,在保證安全駕駛的前提下,人們同樣希望擁有良好的駕駛體驗(yàn)。語(yǔ)音交互技術(shù)作為一種方便快捷的技術(shù)手段,能夠很好地提高行車安全,在汽車上得到了廣泛的應(yīng)用。用戶可以通過語(yǔ)音與智能語(yǔ)音設(shè)備進(jìn)行交互,控制智能語(yǔ)音設(shè)備執(zhí)行相應(yīng)的操作,例如解鎖車門、賬號(hào)登錄等。
技術(shù)實(shí)現(xiàn)思路
1、本公開提供了一種車輛語(yǔ)音識(shí)別方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)。
2、根據(jù)本公開的第一方面,提供了一種車輛語(yǔ)音識(shí)別方法,包括:利用預(yù)先訓(xùn)練的聲紋模型生成目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)聲紋向量,其中,聲紋模型利用不同噪音環(huán)境下的語(yǔ)音樣本對(duì)訓(xùn)練得到;計(jì)算目標(biāo)聲紋向量與車輛對(duì)應(yīng)的已注冊(cè)聲紋向量之間的相似度;響應(yīng)于確定出相似度在預(yù)設(shè)的相似度閾值范圍內(nèi),執(zhí)行目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)操作。
3、根據(jù)本公開的第二方面,提供了一種聲紋模型的訓(xùn)練方法,包括:獲取訓(xùn)練樣本集,其中,訓(xùn)練樣本集中的訓(xùn)練樣本對(duì)包括正樣本語(yǔ)音和負(fù)樣本語(yǔ)音,正樣本語(yǔ)音為用戶在安靜環(huán)境下的語(yǔ)音,負(fù)樣本語(yǔ)音為用戶在噪音環(huán)境下的語(yǔ)音;利用訓(xùn)練樣本集對(duì)初始神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到聲紋模型。
4、根據(jù)本公開的第三方面,提供了一種車輛語(yǔ)音識(shí)別裝置,包括:生成模塊,被配置成利用預(yù)先訓(xùn)練的聲紋模型生成目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)聲紋向量,其中,聲紋模型利用不同噪音環(huán)境下的語(yǔ)音樣本對(duì)訓(xùn)練得到;計(jì)算模塊,被配置成計(jì)算目標(biāo)聲紋向量與車輛對(duì)應(yīng)的已注冊(cè)聲紋向量之間的相似度;執(zhí)行模塊,被配置成響應(yīng)于確定出相似度在預(yù)設(shè)的相似度閾值范圍內(nèi),執(zhí)行目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)操作。
5、根據(jù)本公開的第四方面,提供了一種車輛語(yǔ)音識(shí)別裝置,包括:獲取模塊,被配置成獲取訓(xùn)練樣本集,其中,訓(xùn)練樣本集中的訓(xùn)練樣本對(duì)包括正樣本語(yǔ)音和負(fù)樣本語(yǔ)音,正樣本語(yǔ)音為用戶在安靜環(huán)境下的語(yǔ)音,負(fù)樣本語(yǔ)音為用戶在噪音環(huán)境下的語(yǔ)音;訓(xùn)練模塊,被配置成利用訓(xùn)練樣本集對(duì)初始神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到聲紋模型。
6、根據(jù)本公開的第五方面,提供了一種電子設(shè)備,包括:至少一個(gè)處理器;以及與至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,存儲(chǔ)器存儲(chǔ)有可被至少一個(gè)處理器執(zhí)行的指令,指令被至少一個(gè)處理器執(zhí)行,以使至少一個(gè)處理器能夠執(zhí)行如第一方面或第二方面中任一實(shí)現(xiàn)方式描述的方法。
7、根據(jù)本公開的第六方面,提供了一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行如第一方面或第二方面中任一實(shí)現(xiàn)方式描述的方法。
8、根據(jù)本公開的第七方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面或第二方面中任一實(shí)現(xiàn)方式描述的方法。
9、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本公開的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
1.一種車輛語(yǔ)音識(shí)別方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,還包括:
3.根據(jù)權(quán)利要求2所述的方法,其中,所述利用所述目標(biāo)語(yǔ)音對(duì)所述聲紋模型進(jìn)行更新,得到更新后的聲紋模型,包括:
4.根據(jù)權(quán)利要求2所述的方法,還包括:
5.根據(jù)權(quán)利要求1所述的方法,其中,所述已注冊(cè)聲紋向量通過以下步驟得到:
6.根據(jù)權(quán)利要求5所述的方法,還包括:
7.根據(jù)權(quán)利要求1所述的方法,還包括:
8.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于確定出所述相似度在預(yù)設(shè)的相似度閾值范圍內(nèi),執(zhí)行所述目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)操作,包括:
9.根據(jù)權(quán)利要求8所述的方法,其中,所述確定所述車輛上采集所述目標(biāo)語(yǔ)音的目標(biāo)設(shè)備,包括:
10.根據(jù)權(quán)利要求8所述的方法,其中,所述目標(biāo)操作包括:解鎖操作;以及
11.一種聲紋模型的訓(xùn)練方法,包括:
12.根據(jù)權(quán)利要求11所述的方法,還包括:
13.一種車輛語(yǔ)音識(shí)別裝置,包括:
14.一種聲紋模型的訓(xùn)練裝置,包括:
15.一種電子設(shè)備,包括:
16.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行權(quán)利要求1-10或11-12中任一項(xiàng)所述的方法。
17.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)權(quán)利要求1-10或11-12中任一項(xiàng)所述的方法。