車輛語(yǔ)音識(shí)別方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)與流程

文檔序號(hào)：41870951發(fā)布日期：2025-05-09 18:41閱讀：6來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

車輛語(yǔ)音識(shí)別方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)與流程

本公開涉及人工智能，具體涉及自動(dòng)駕駛、智能交通、語(yǔ)音識(shí)別以及深度學(xué)習(xí)等，尤其涉及一種車輛語(yǔ)音識(shí)別方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)。

背景技術(shù)：

1、隨著車輛技術(shù)的發(fā)展，車輛已經(jīng)成為人們生活中必不可少的一部分。隨著人們對(duì)車輛的要求越來越高，在保證安全駕駛的前提下，人們同樣希望擁有良好的駕駛體驗(yàn)。語(yǔ)音交互技術(shù)作為一種方便快捷的技術(shù)手段，能夠很好地提高行車安全，在汽車上得到了廣泛的應(yīng)用。用戶可以通過語(yǔ)音與智能語(yǔ)音設(shè)備進(jìn)行交互，控制智能語(yǔ)音設(shè)備執(zhí)行相應(yīng)的操作，例如解鎖車門、賬號(hào)登錄等。

技術(shù)實(shí)現(xiàn)思路

1、本公開提供了一種車輛語(yǔ)音識(shí)別方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)。

2、根據(jù)本公開的第一方面，提供了一種車輛語(yǔ)音識(shí)別方法，包括：利用預(yù)先訓(xùn)練的聲紋模型生成目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)聲紋向量，其中，聲紋模型利用不同噪音環(huán)境下的語(yǔ)音樣本對(duì)訓(xùn)練得到；計(jì)算目標(biāo)聲紋向量與車輛對(duì)應(yīng)的已注冊(cè)聲紋向量之間的相似度；響應(yīng)于確定出相似度在預(yù)設(shè)的相似度閾值范圍內(nèi)，執(zhí)行目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)操作。

3、根據(jù)本公開的第二方面，提供了一種聲紋模型的訓(xùn)練方法，包括：獲取訓(xùn)練樣本集，其中，訓(xùn)練樣本集中的訓(xùn)練樣本對(duì)包括正樣本語(yǔ)音和負(fù)樣本語(yǔ)音，正樣本語(yǔ)音為用戶在安靜環(huán)境下的語(yǔ)音，負(fù)樣本語(yǔ)音為用戶在噪音環(huán)境下的語(yǔ)音；利用訓(xùn)練樣本集對(duì)初始神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，得到聲紋模型。

4、根據(jù)本公開的第三方面，提供了一種車輛語(yǔ)音識(shí)別裝置，包括：生成模塊，被配置成利用預(yù)先訓(xùn)練的聲紋模型生成目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)聲紋向量，其中，聲紋模型利用不同噪音環(huán)境下的語(yǔ)音樣本對(duì)訓(xùn)練得到；計(jì)算模塊，被配置成計(jì)算目標(biāo)聲紋向量與車輛對(duì)應(yīng)的已注冊(cè)聲紋向量之間的相似度；執(zhí)行模塊，被配置成響應(yīng)于確定出相似度在預(yù)設(shè)的相似度閾值范圍內(nèi)，執(zhí)行目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)操作。

5、根據(jù)本公開的第四方面，提供了一種車輛語(yǔ)音識(shí)別裝置，包括：獲取模塊，被配置成獲取訓(xùn)練樣本集，其中，訓(xùn)練樣本集中的訓(xùn)練樣本對(duì)包括正樣本語(yǔ)音和負(fù)樣本語(yǔ)音，正樣本語(yǔ)音為用戶在安靜環(huán)境下的語(yǔ)音，負(fù)樣本語(yǔ)音為用戶在噪音環(huán)境下的語(yǔ)音；訓(xùn)練模塊，被配置成利用訓(xùn)練樣本集對(duì)初始神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，得到聲紋模型。

6、根據(jù)本公開的第五方面，提供了一種電子設(shè)備，包括：至少一個(gè)處理器；以及與至少一個(gè)處理器通信連接的存儲(chǔ)器；其中，存儲(chǔ)器存儲(chǔ)有可被至少一個(gè)處理器執(zhí)行的指令，指令被至少一個(gè)處理器執(zhí)行，以使至少一個(gè)處理器能夠執(zhí)行如第一方面或第二方面中任一實(shí)現(xiàn)方式描述的方法。

7、根據(jù)本公開的第六方面，提供了一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行如第一方面或第二方面中任一實(shí)現(xiàn)方式描述的方法。

8、根據(jù)本公開的第七方面，提供了一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)程序，計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面或第二方面中任一實(shí)現(xiàn)方式描述的方法。

9、應(yīng)當(dāng)理解，本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本公開的實(shí)施例的關(guān)鍵或重要特征，也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。

技術(shù)特征：

1.一種車輛語(yǔ)音識(shí)別方法，包括：

2.根據(jù)權(quán)利要求1所述的方法，還包括：

3.根據(jù)權(quán)利要求2所述的方法，其中，所述利用所述目標(biāo)語(yǔ)音對(duì)所述聲紋模型進(jìn)行更新，得到更新后的聲紋模型，包括：

4.根據(jù)權(quán)利要求2所述的方法，還包括：

5.根據(jù)權(quán)利要求1所述的方法，其中，所述已注冊(cè)聲紋向量通過以下步驟得到：

6.根據(jù)權(quán)利要求5所述的方法，還包括：

7.根據(jù)權(quán)利要求1所述的方法，還包括：

8.根據(jù)權(quán)利要求1所述的方法，其中，所述響應(yīng)于確定出所述相似度在預(yù)設(shè)的相似度閾值范圍內(nèi)，執(zhí)行所述目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)操作，包括：

9.根據(jù)權(quán)利要求8所述的方法，其中，所述確定所述車輛上采集所述目標(biāo)語(yǔ)音的目標(biāo)設(shè)備，包括：

10.根據(jù)權(quán)利要求8所述的方法，其中，所述目標(biāo)操作包括：解鎖操作；以及

11.一種聲紋模型的訓(xùn)練方法，包括：

12.根據(jù)權(quán)利要求11所述的方法，還包括：

13.一種車輛語(yǔ)音識(shí)別裝置，包括：

14.一種聲紋模型的訓(xùn)練裝置，包括：

15.一種電子設(shè)備，包括：

16.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行權(quán)利要求1-10或11-12中任一項(xiàng)所述的方法。

17.一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)程序，所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)權(quán)利要求1-10或11-12中任一項(xiàng)所述的方法。

技術(shù)總結(jié)
本公開提供了一種車輛語(yǔ)音識(shí)別方法，涉及人工智能技術(shù)領(lǐng)域，具體涉及自動(dòng)駕駛、智能交通、語(yǔ)音識(shí)別以及深度學(xué)習(xí)等技術(shù)領(lǐng)域。該方法包括：利用預(yù)先訓(xùn)練的聲紋模型生成目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)聲紋向量，其中，聲紋模型利用不同噪音環(huán)境下的語(yǔ)音樣本對(duì)訓(xùn)練得到；計(jì)算目標(biāo)聲紋向量與車輛對(duì)應(yīng)的已注冊(cè)聲紋向量之間的相似度；響應(yīng)于確定出相似度在預(yù)設(shè)的相似度閾值范圍內(nèi)，執(zhí)行目標(biāo)語(yǔ)音對(duì)應(yīng)的目標(biāo)操作。該方法提高了車輛語(yǔ)音識(shí)別的準(zhǔn)確性和魯棒性。

技術(shù)研發(fā)人員：李棚
受保護(hù)的技術(shù)使用者：北京百度網(wǎng)訊科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/5/8

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李棚
技術(shù)所有人：北京百度網(wǎng)訊科技有限公司
我是此專利的發(fā)明人

上一篇：一種無牙老年人導(dǎo)管固定裝置的制作方法
上一篇：一種基于計(jì)算全息法透過散射介質(zhì)成像的裝置和方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

成人打一炮免费视频,亚洲天堂视频在线观看,97视频久久久,日本japanese护士色高清,五月婷婷丁香,日韩精品一级无码毛片免费,国产欧美日韩精品网红剧情演绎

車輛語(yǔ)音識(shí)別方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)與流程

車輛語(yǔ)音識(shí)別方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)與流程