本發(fā)明涉及一種智能對(duì)話領(lǐng)域,特別是涉及一種智能對(duì)話裝置、反饋式智能語音控制系統(tǒng)及方法。
背景技術(shù):
隨著語音分析技術(shù)的發(fā)展,現(xiàn)有很多智能人機(jī)對(duì)話裝置中都帶有語音控制,在現(xiàn)有的語音控制方案中,主要是單向無反饋的語音操控,即通過用戶輸入正確的語音指令,智能人機(jī)對(duì)話裝置對(duì)正確的語音指令進(jìn)行響應(yīng),從而執(zhí)行響應(yīng)的操作;但是,當(dāng)用戶輸入的語音指令有誤時(shí),裝置無法分析用戶真實(shí)意圖,進(jìn)而不能快速、準(zhǔn)確地響應(yīng)用戶,無法執(zhí)行用戶想要其執(zhí)行的正確操作,例如,對(duì)于某個(gè)帶有開關(guān)燈功能的智能人機(jī)對(duì)話裝置,如果該裝置內(nèi)置的正確語音指令為“開燈”,即如果用戶對(duì)該裝置說“開燈”,則該裝置能快速準(zhǔn)確地響應(yīng)用戶的意圖,自動(dòng)開燈,但是,如果用戶對(duì)該裝置說“請(qǐng)開下燈吧”,雖然此時(shí)用戶也是想讓該裝置自動(dòng)開燈,但是由于用戶說的并不是正確語音指令“開燈”,從而導(dǎo)致該裝置無法識(shí)別用戶的語音指令,此時(shí)該裝置就無法快速、準(zhǔn)確地響應(yīng)用戶的真實(shí)意圖,無法執(zhí)行用戶想要的開燈操作;
由此可知,現(xiàn)有的智能人機(jī)對(duì)話裝置在語音分析和處理這一塊有很大的技術(shù)缺陷,導(dǎo)致無法智能分析用戶語音指令,造成無法快速、準(zhǔn)確地預(yù)測和響應(yīng)用戶的真實(shí)意圖,并且,也不能在用戶發(fā)出錯(cuò)誤語音指令的情況下對(duì)用戶進(jìn)行指導(dǎo)與提示,告知其正確的語音指令,從而導(dǎo)致現(xiàn)有的智能人機(jī)對(duì)話裝置語音識(shí)別的范圍較窄、識(shí)別率較低,用戶使用體驗(yàn)很差。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明要解決的技術(shù)問題是為了克服現(xiàn)有技術(shù)中智能人機(jī)對(duì)話裝置語音識(shí)別的范圍較窄、識(shí)別率較低,用戶使用體驗(yàn)很差的缺陷,提供一種智能對(duì)話裝置、反饋式智能語音控制系統(tǒng)及方法。
本發(fā)明是通過下述技術(shù)方案來解決上述技術(shù)問題的:
本發(fā)明提供了一種反饋式智能語音控制系統(tǒng),包括語音輸入模塊、語音識(shí)別模塊、數(shù)據(jù)處理模塊、本地指令庫以及mcu(微控制單元);
所述語音輸入模塊與所述語音識(shí)別模塊電連接,所述語音識(shí)別模塊與所述數(shù)據(jù)處理模塊電連接,所述數(shù)據(jù)處理模塊分別與所述本地指令庫及所述mcu電連接;
所述本地指令庫用于存儲(chǔ)文本指令及對(duì)應(yīng)的控制指令;
所述語音輸入模塊用于采集用戶輸入的語音信息,并傳輸至所述語音識(shí)別模塊;
所述語音識(shí)別模塊用于將所述語音信息轉(zhuǎn)換為文本信息,并傳輸至所述數(shù)據(jù)處理模塊;
所述數(shù)據(jù)處理模塊用于判斷所述本地指令庫中是否包含與所述文本信息完全相同的文本指令,若否,則對(duì)所述文本信息與所述本地指令庫中的文本指令進(jìn)行模糊匹配,若與一目標(biāo)文本指令匹配成功,則將與所述目標(biāo)文本指令對(duì)應(yīng)的目標(biāo)控制指令傳輸至所述mcu;
所述mcu用于根據(jù)所述目標(biāo)控制指令執(zhí)行操作。
較佳地,所述文本信息與所述目標(biāo)文本指令匹配成功包括:
所述目標(biāo)文本指令的關(guān)鍵字均包括在所述文本信息中,或,所述文本信息與所述目標(biāo)文本指令的相同關(guān)鍵字的字?jǐn)?shù)超過第一閾值,或,所述文本信息與所述目標(biāo)文本指令的相同關(guān)鍵字的字?jǐn)?shù)與所述目標(biāo)文本指令的比值超過第二閾值。
較佳地,所述反饋式語音控制系統(tǒng)還包括語音輸出模塊;
所述數(shù)據(jù)處理模塊還用于在所述文本信息與所述目標(biāo)文本指令匹配成功時(shí),將所述目標(biāo)文本指令傳輸至所述語音輸出模塊,所述語音輸出模塊用于輸出包括所述目標(biāo)文本指令的提示語音。
較佳地,所述語音識(shí)別模塊還包括聲紋識(shí)別單元,用于在所述語音識(shí)別模塊接收到所述語音信息后,識(shí)別用戶的聲紋特征,并判斷識(shí)別出的聲紋特征是否與預(yù)設(shè)聲紋特征匹配,若是,則調(diào)用所述語音識(shí)別模塊將所述語音信息轉(zhuǎn)換為文本信息。
較佳地,所述反饋式智能語音控制系統(tǒng)還包括指紋識(shí)別模塊,用于對(duì)用戶指紋進(jìn)行識(shí)別,并在識(shí)別成功之后啟用所述語音輸入模塊采集用戶輸入的語音信息。
較佳地,所述反饋式智能語音控制系統(tǒng)還包括指令增加模塊,用于將所述文本信息及所述文本信息與所述目標(biāo)文本指令的對(duì)應(yīng)關(guān)系增加至所述本地指令庫中進(jìn)行存儲(chǔ)。
較佳地,所述反饋式智能語音控制系統(tǒng)還包括存儲(chǔ)模塊及統(tǒng)計(jì)模塊,所述存儲(chǔ)模塊用于在所述文本信息與所述目標(biāo)文本指令匹配成功時(shí)存儲(chǔ)所述文本信息;
所述統(tǒng)計(jì)模塊用于統(tǒng)計(jì)所述文本信息的存儲(chǔ)次數(shù),并在判斷所述存儲(chǔ)次數(shù)超過第三閾值時(shí),啟用所述指令增加模塊。
較佳地,所述語音識(shí)別模塊包括:
第一預(yù)存單元,用于預(yù)存多個(gè)目標(biāo)詞組及與每個(gè)目標(biāo)詞組對(duì)應(yīng)的同類詞組和近義詞組;
字符串轉(zhuǎn)換單元,用于將所述語音信息轉(zhuǎn)換為字符串;
拆分單元,用于將所述字符串拆分為若干詞組;
判斷單元,用于判斷拆分出的詞組是否包括存儲(chǔ)在所述第一預(yù)存單元中的目標(biāo)詞組,并在判斷為是時(shí),獲取與所述拆分出的詞組中的目標(biāo)詞組對(duì)應(yīng)的同類詞組和近義詞組;
文本信息生成單元,用于對(duì)所述拆分出的詞組中的非目標(biāo)詞組與目標(biāo)詞組或目標(biāo)詞組對(duì)應(yīng)的同類詞組和近義詞組進(jìn)行任意組合,生成多個(gè)文本信息,并傳輸至所述數(shù)據(jù)處理模塊。
較佳地,所述語音識(shí)別模塊包括:
第二預(yù)存單元,用于預(yù)存不同種類的特殊語言的語音信息與一標(biāo)準(zhǔn)語言的語音信息的對(duì)應(yīng)關(guān)系;
語言轉(zhuǎn)換單元,用于在識(shí)別出用戶輸入的語音信息為特殊語言的語音信息時(shí),將特殊語言的語音信息轉(zhuǎn)換為對(duì)應(yīng)的標(biāo)準(zhǔn)語言的語音信息;
文本轉(zhuǎn)換單元,用于將所述對(duì)應(yīng)的標(biāo)準(zhǔn)語言的語音信息轉(zhuǎn)換為文本信息,并傳輸至所述數(shù)據(jù)處理模塊。
較佳地,在所述本地指令庫中,同一個(gè)控制指令對(duì)應(yīng)多個(gè)文本指令,不同的文本指令用于表征不同的用戶表達(dá)習(xí)慣。
本發(fā)明還提供了一種智能對(duì)話裝置,其包括如上所述的反饋式智能語音控制系統(tǒng)。
較佳地,所述智能對(duì)話裝置為故事機(jī)或點(diǎn)讀機(jī)。
本發(fā)明還提供了一種反饋式智能語音控制方法,包括以下步驟:
s1、存儲(chǔ)文本指令及對(duì)應(yīng)的控制指令;
s2、采集用戶輸入的語音信息;
s3、將所述語音信息轉(zhuǎn)換為文本信息;
s4、判斷是否有與所述文本信息完全相同的文本指令,若否,則對(duì)所述文本信息與所述文本指令進(jìn)行模糊匹配,若與一目標(biāo)文本指令匹配成功,則輸出與所述目標(biāo)文本指令對(duì)應(yīng)的目標(biāo)控制指令;
s5、根據(jù)所述目標(biāo)控制指令執(zhí)行操作。
較佳地,步驟s4中所述文本信息與所述目標(biāo)文本指令匹配成功包括:
所述目標(biāo)文本指令的關(guān)鍵字均包括在所述文本信息中,或,所述文本信息與所述目標(biāo)文本指令的相同關(guān)鍵字的字?jǐn)?shù)超過第一閾值,或,所述文本信息與所述目標(biāo)文本指令的相同關(guān)鍵字的字?jǐn)?shù)與所述目標(biāo)文本指令的比值超過第二閾值。
較佳地,步驟s4中在所述文本信息與所述目標(biāo)文本指令匹配成功時(shí),還輸出包括所述目標(biāo)文本指令的提示語音。
較佳地,步驟s3包括:
根據(jù)所述語音信息識(shí)別用戶的聲紋特征,并判斷識(shí)別出的聲紋特征是否與預(yù)設(shè)聲紋特征匹配,若是,則將所述語音信息轉(zhuǎn)換為文本信息。
較佳地,步驟s2之前還包括:
對(duì)用戶指紋進(jìn)行識(shí)別,若識(shí)別成功,則執(zhí)行步驟s2。
較佳地,步驟s5之后還包括:
s6、存儲(chǔ)所述文本信息及所述文本信息與所述目標(biāo)文本指令的對(duì)應(yīng)關(guān)系。
較佳地,步驟s6中包括:
存儲(chǔ)所述文本信息,統(tǒng)計(jì)所述文本信息的存儲(chǔ)次數(shù),并在判斷所述存儲(chǔ)次數(shù)超過第三閾值時(shí),存儲(chǔ)所述文本信息與所述目標(biāo)文本指令的對(duì)應(yīng)關(guān)系。
較佳地,步驟s3包括:
s311、預(yù)存多個(gè)目標(biāo)詞組及與每個(gè)目標(biāo)詞組對(duì)應(yīng)的同類詞組和近義詞組;
s312、將所述語音信息轉(zhuǎn)換為字符串;
s313、將所述字符串拆分為若干詞組;
s314、判斷拆分出的詞組是否包括存儲(chǔ)在所述預(yù)存單元中的目標(biāo)詞組,并在判斷為是時(shí),獲取與所述拆分出的詞組中的目標(biāo)詞組對(duì)應(yīng)的同類詞組和近義詞組;
s315、對(duì)所述拆分出的詞組中的非目標(biāo)詞組與目標(biāo)詞組或目標(biāo)詞組對(duì)應(yīng)的同類詞組和近義詞組進(jìn)行任意組合,生成多個(gè)文本信息。
較佳地,步驟s3包括:
s321、預(yù)存不同種類的特殊語言的語音信息與一標(biāo)準(zhǔn)語言的語音信息的對(duì)應(yīng)關(guān)系;
s322、在識(shí)別出用戶輸入的語音信息為特殊語言的語音信息時(shí),將特殊語言的語音信息轉(zhuǎn)換為對(duì)應(yīng)的標(biāo)準(zhǔn)語言的語音信息;
s323、將所述對(duì)應(yīng)的標(biāo)準(zhǔn)語言的語音信息轉(zhuǎn)換為文本信息,并傳輸至所述數(shù)據(jù)處理模塊。
較佳地,步驟s1中同一個(gè)控制指令對(duì)應(yīng)多個(gè)文本指令,不同的文本指令用于表征不同的用戶表達(dá)習(xí)慣。
本發(fā)明的積極進(jìn)步效果在于:本發(fā)明實(shí)現(xiàn)了在智能人機(jī)對(duì)話過程中,當(dāng)用戶輸入的語音指令有誤時(shí),能夠?qū)φZ音指令進(jìn)行進(jìn)一步分析,從而自動(dòng)分析和預(yù)測用戶的真實(shí)意圖,進(jìn)而能快速、準(zhǔn)確地響應(yīng)用戶的真實(shí)意圖,自動(dòng)執(zhí)行用戶想要執(zhí)行的操作,從而提高了語音識(shí)別率和識(shí)別范圍,同時(shí)還可以將正確語音指令反饋提示給用戶,達(dá)到了對(duì)用戶進(jìn)行指導(dǎo)的效果,改善了用戶的使用體驗(yàn)。
附圖說明
圖1為本發(fā)明的實(shí)施例1的反饋式智能語音控制系統(tǒng)的模塊示意圖。
圖2為本發(fā)明的實(shí)施例1的反饋式智能語音控制方法的流程圖。
圖3為本發(fā)明的實(shí)施例2的反饋式智能語音控制系統(tǒng)的模塊示意圖。
圖4為本發(fā)明的實(shí)施例2的反饋式智能語音控制方法的流程圖。
圖5為本發(fā)明的實(shí)施例3的反饋式智能語音控制系統(tǒng)的模塊示意圖。
圖6為本發(fā)明的實(shí)施例3的反饋式智能語音控制方法的流程圖。
圖7為本發(fā)明的實(shí)施例4的反饋式智能語音控制系統(tǒng)的語音識(shí)別模塊的模塊示意圖。
圖8為本發(fā)明的實(shí)施例4的反饋式智能語音控制方法中步驟103的具體操作流程圖。
圖9為本發(fā)明的實(shí)施例5的反饋式智能語音控制系統(tǒng)的語音識(shí)別模塊的模塊示意圖。
圖10為本發(fā)明的實(shí)施例5的反饋式智能語音控制方法中步驟103的具體操作流程圖。
具體實(shí)施方式
下面通過實(shí)施例的方式進(jìn)一步說明本發(fā)明,但并不因此將本發(fā)明限制在所述的實(shí)施例范圍之中。
實(shí)施例1
如圖1所示,本實(shí)施例的反饋式智能語音控制系統(tǒng)包括語音輸入模塊1、語音識(shí)別模塊2、數(shù)據(jù)處理模塊3、本地指令庫4以及mcu5;
其中,所述語音輸入模塊1與所述語音識(shí)別模塊2電連接,所述語音識(shí)別模塊2與所述數(shù)據(jù)處理模塊3電連接,所述數(shù)據(jù)處理模塊3分別與所述本地指令庫4及所述mcu5電連接;
在所述本地指令庫4中,會(huì)預(yù)先存儲(chǔ)文本指令及對(duì)應(yīng)的控制指令,所述控制指令用于控制所述mcu5執(zhí)行相應(yīng)的操作;
在本實(shí)施例中,所述語音輸入模塊1具體可包括麥克風(fēng),用于采集用戶輸入的語音信息,并傳輸至所述語音識(shí)別模塊2;
所述語音識(shí)別模塊2用于將所述語音信息轉(zhuǎn)換為文本信息,并傳輸至所述數(shù)據(jù)處理模塊;語音識(shí)別及語音轉(zhuǎn)換為文本已經(jīng)屬于本領(lǐng)域比較成熟的技術(shù),在此就不再贅述;
所述數(shù)據(jù)處理模塊3則用于判斷所述本地指令庫4中是否包含與所述文本信息完全相同的文本指令,若是,則說明用戶輸入的是正確語音指令,此時(shí)就可以和現(xiàn)有技術(shù)中一樣響應(yīng)用戶的正確語音指令,即通過所述mcu5響應(yīng)與所述文本指令相對(duì)應(yīng)的控制指令,執(zhí)行相應(yīng)的操作;
若否,則對(duì)所述文本信息與所述本地指令庫4中的文本指令進(jìn)行模糊匹配,若與一目標(biāo)文本指令匹配成功,則將與所述目標(biāo)文本指令對(duì)應(yīng)的目標(biāo)控制指令傳輸至所述mcu5;
所述mcu5用于根據(jù)所述目標(biāo)控制指令執(zhí)行操作。
在本實(shí)施例中,所述數(shù)據(jù)處理模塊3可以采用現(xiàn)有的模糊匹配算法來對(duì)所述文本信息與所述本地指令庫4中的文本指令進(jìn)行模糊匹配,在此就不再贅述。
下面舉一個(gè)本實(shí)施例的反饋式智能語音控制系統(tǒng)的具體應(yīng)用實(shí)例:
例如,在本實(shí)施例的反饋式智能語音控制系統(tǒng)中,所述本地指令庫中預(yù)先存儲(chǔ)了文本指令“開燈”以及對(duì)應(yīng)的開燈指令,通過所述開燈指令可以控制所述mcu執(zhí)行開燈操作;
當(dāng)用戶輸入語音信息“開燈”時(shí),所述語音識(shí)別模塊能夠?qū)⒄Z音信息“開燈”轉(zhuǎn)換為文本信息“開燈”,所述數(shù)據(jù)處理模塊就會(huì)判斷出轉(zhuǎn)換后的文本信息“開燈”與所述本地指令庫中的文本指令“開燈”完全相同,此時(shí),即可判斷出用戶發(fā)出的是正確語音指令,從而就可以控制所述mcu執(zhí)行相應(yīng)的開燈動(dòng)作;
當(dāng)用戶輸入語音信息“請(qǐng)開燈吧”時(shí),所述語音識(shí)別模塊能夠?qū)⒄Z音信息“請(qǐng)開燈吧”轉(zhuǎn)換為文本信息“請(qǐng)開燈吧”,所述數(shù)據(jù)處理模塊就會(huì)判斷出轉(zhuǎn)換后的文本信息“請(qǐng)開燈吧”與所述本地指令庫中的文本指令“開燈”并不相同,此時(shí)就會(huì)對(duì)所述文本信息“請(qǐng)開燈吧”與所述本地指令庫中預(yù)先存儲(chǔ)的各個(gè)文本指令分別進(jìn)行模糊匹配,然后確定其與目標(biāo)文本指令“開燈”匹配成功,并將與所述目標(biāo)文本指令“開燈”相對(duì)應(yīng)的開燈指令(即目標(biāo)控制指令)傳輸至所述mcu,所述mcu就會(huì)根據(jù)開燈指令執(zhí)行開燈操作;
可見,在本實(shí)施例中,當(dāng)用戶輸入錯(cuò)誤的語音指令時(shí),本實(shí)施例的反饋式智能語音控制系統(tǒng)能夠在將用戶的語音指令轉(zhuǎn)換為文本信息后,對(duì)文本信息作進(jìn)一步的分析處理,從而能夠準(zhǔn)確分析預(yù)測用戶的真實(shí)意圖,并能夠響應(yīng)用戶的真實(shí)意圖,自動(dòng)執(zhí)行用戶想要的操作。
本實(shí)施例還提供了一種反饋式智能語音控制方法,其利用本實(shí)施例的反饋式智能語音控制系統(tǒng)實(shí)現(xiàn),如圖2所示,包括以下步驟:
步驟101、存儲(chǔ)文本指令及對(duì)應(yīng)的控制指令;
步驟102、采集用戶輸入的語音信息;
步驟103、將所述語音信息轉(zhuǎn)換為文本信息;
步驟104、判斷是否有與所述文本信息完全相同的文本指令,若否,則對(duì)所述文本信息與所述文本指令進(jìn)行模糊匹配,若與一目標(biāo)文本指令匹配成功,則輸出與所述目標(biāo)文本指令對(duì)應(yīng)的目標(biāo)控制指令;
步驟105、根據(jù)所述目標(biāo)控制指令執(zhí)行操作。
實(shí)施例2
本實(shí)施例的反饋式智能語音控制系統(tǒng)與實(shí)施例1基本相同,主要區(qū)別在于:如圖4所示,本實(shí)施例的反饋式智能語音控制系統(tǒng)還包括語音輸出模塊6以及指紋識(shí)別模塊7,并且所述語音識(shí)別模塊2還包括聲紋識(shí)別單元21;
在本實(shí)施例的反饋式智能語音控制系統(tǒng)中,在利用所述語音輸入模塊1采集用戶輸入的語音信息之前,可以先通過所述指紋識(shí)別模塊7對(duì)用戶進(jìn)行指紋識(shí)別,并只有在對(duì)用戶進(jìn)行指紋識(shí)別成功之后,才啟用所述語音輸入模塊1,若識(shí)別失敗,則不啟用所述語音輸入模塊,這樣指紋識(shí)別失敗的用戶就無法輸入語音指令來控制所述反饋式智能語音控制系統(tǒng),從而本實(shí)施例的反饋式智能語音控制系統(tǒng)大大提升了保密性和安全性。
在指紋識(shí)別的實(shí)施方案中,具體可預(yù)先存儲(chǔ)正確的用戶指紋,這樣,在采集到指紋之后,進(jìn)行指紋比對(duì)和匹配即可。
另外,在本實(shí)施例中,為了進(jìn)一步提升保密性和安全性,本實(shí)施例中,在所述語音識(shí)別模塊2接收到所述語音信息后,會(huì)先由所述聲紋識(shí)別單元21識(shí)別用戶的聲紋特征,并判斷識(shí)別出的聲紋特征是否與預(yù)設(shè)聲紋特征匹配,若是,則調(diào)用所述語音識(shí)別模塊1將所述語音信息轉(zhuǎn)換為文本信息并執(zhí)行后續(xù)操作,若否,則不調(diào)用所述語音識(shí)別模塊1。
由于每個(gè)人發(fā)出的語音信息都包含有其獨(dú)特的聲紋特征,這樣,本實(shí)施例中利用所述聲紋識(shí)別單元21可以保證,只有聲紋特征匹配的特定用戶發(fā)出的語音指令才會(huì)被進(jìn)一步分析,從而提升了保密性和安全性。
另外,在本實(shí)施例中,所述數(shù)據(jù)處理模塊3還用于在所述文本信息與所述目標(biāo)文本指令匹配成功時(shí),將所述目標(biāo)文本指令傳輸至所述語音輸出模塊6,所述語音輸出模塊6用于輸出包括所述目標(biāo)文本指令的提示語音,從而可以將正確語音指令反饋給用戶,以實(shí)施例1中的應(yīng)用實(shí)例為例,如果正確語音指令為“開燈”,當(dāng)用戶輸入語音信息“請(qǐng)開燈吧”,經(jīng)過上述各個(gè)模塊的操作之后,最終所述語音輸出模塊6會(huì)將包含正確語音指令的提示信息反饋給用戶,例如具體可以為向用戶語音提示:您是要開燈嗎?如果是的話可以對(duì)我說開燈。
在本實(shí)施例中,所述數(shù)據(jù)處理模塊3對(duì)所述文本信息與所述本地指令庫4中的文本指令進(jìn)行的模糊匹配具體可以為:
判斷所述目標(biāo)文本指令的關(guān)鍵字是否均包括在所述文本信息中,或,判斷所述文本信息與所述目標(biāo)文本指令的相同關(guān)鍵字的字?jǐn)?shù)是否超過第一閾值,或,判斷所述文本信息與所述目標(biāo)文本指令的相同關(guān)鍵字的字?jǐn)?shù)與所述目標(biāo)文本指令的比值是否超過第二閾值;
而所述文本信息與所述目標(biāo)文本指令匹配成功的情況則具體包括:
所述目標(biāo)文本指令的關(guān)鍵字均包括在所述文本信息中,或,所述文本信息與所述目標(biāo)文本指令的相同關(guān)鍵字的字?jǐn)?shù)超過第一閾值,或,所述文本信息與所述目標(biāo)文本指令的相同關(guān)鍵字的字?jǐn)?shù)與所述目標(biāo)文本指令的比值超過第二閾值。
本實(shí)施例同樣提供了一種反饋式智能語音控制方法,如圖4所示,本實(shí)施例的反饋式智能語音控制方法包括以下步驟:
步驟201、存儲(chǔ)文本指令及對(duì)應(yīng)的控制指令;
步驟2011、對(duì)用戶指紋進(jìn)行識(shí)別,若識(shí)別成功,則執(zhí)行步驟202;
步驟202、采集用戶輸入的語音信息;
步驟203、根據(jù)所述語音信息識(shí)別用戶的聲紋特征,并判斷識(shí)別出的聲紋特征是否與預(yù)設(shè)聲紋特征匹配,若是,則將所述語音信息轉(zhuǎn)換為文本信息;
步驟204、判斷是否有與所述文本信息完全相同的文本指令,若否,則對(duì)所述文本信息與所述文本指令進(jìn)行模糊匹配,若與一目標(biāo)文本指令匹配成功,則輸出與所述目標(biāo)文本指令對(duì)應(yīng)的目標(biāo)控制指令,并輸出包括所述目標(biāo)文本指令的提示語音;
步驟205、根據(jù)所述目標(biāo)控制指令執(zhí)行操作。
實(shí)施例3
本實(shí)施例的反饋式智能語音控制系統(tǒng)與實(shí)施例1基本相同,主要區(qū)別在于:如圖5所示,本實(shí)施例的反饋式智能語音控制系統(tǒng)還包括指令增加模塊8、存儲(chǔ)模塊9以及統(tǒng)計(jì)模塊10;
在本實(shí)施例中,當(dāng)所述文本信息與所述目標(biāo)文本指令匹配成功時(shí),所述存儲(chǔ)模塊9還存儲(chǔ)所述文本信息,并且每當(dāng)成功匹配一次,所述存儲(chǔ)模塊9就存儲(chǔ)一次所述文本信息;
所述統(tǒng)計(jì)模塊10則會(huì)統(tǒng)計(jì)所述文本信息的存儲(chǔ)次數(shù),并在判斷所述存儲(chǔ)次數(shù)超過第三閾值時(shí),啟用所述指令增加模塊8;
所述指令增加模塊8則用于將所述文本信息及所述文本信息與所述目標(biāo)文本指令的對(duì)應(yīng)關(guān)系增加至所述本地指令庫中進(jìn)行存儲(chǔ)。
本實(shí)施例的反饋式智能語音控制系統(tǒng)可以對(duì)用戶的發(fā)音習(xí)慣、說話習(xí)慣等進(jìn)行歸納總結(jié),從而生成全新的、符合用戶習(xí)慣的文本指令。同樣以實(shí)施例1中的應(yīng)用實(shí)例為例,如果所述本地指令庫中存儲(chǔ)的正確文本指令為“開燈”,但由于用戶說話喜歡用敬詞,因此,每次用戶想要開燈時(shí)輸入的語音信息都是“請(qǐng)開燈吧”,這樣,每次所述數(shù)據(jù)處理模塊3都會(huì)對(duì)文本信息“請(qǐng)開燈吧”進(jìn)行模糊匹配并且匹配成功,這樣,在本實(shí)施例中,每次匹配成功之后所述存儲(chǔ)模塊9就會(huì)存儲(chǔ)一次所述文本信息“請(qǐng)開燈吧”,所述統(tǒng)計(jì)模塊10則會(huì)統(tǒng)計(jì)存儲(chǔ)次數(shù),當(dāng)存儲(chǔ)次數(shù)超過第三閾值時(shí),所述指令增加模塊就會(huì)將所述文本信息“請(qǐng)開燈吧”及所述文本信息與所述目標(biāo)文本指令(即開燈指令)的對(duì)應(yīng)關(guān)系增加至所述本地指令庫中進(jìn)行存儲(chǔ),由此,原先錯(cuò)誤的語音指令“請(qǐng)開燈吧”也就變?yōu)檎_語音指令,當(dāng)用戶再次輸入語音指令“請(qǐng)開燈吧”以后,就不需要進(jìn)行模糊匹配,就可以直接控制mcu執(zhí)行開燈操作。
本實(shí)施例還提供了一種智能對(duì)話裝置,其包括本實(shí)施例所述的反饋式智能語音控制系統(tǒng),其中,優(yōu)選地,所述智能對(duì)話裝置可以為故事機(jī)或點(diǎn)讀機(jī),在本實(shí)施例中,通過用戶語音控制故事機(jī)或點(diǎn)讀機(jī)播放相應(yīng)的音視頻數(shù)據(jù)的實(shí)現(xiàn)原理與本實(shí)施例的反饋式智能語音控制系統(tǒng)完全相同,在此就不再贅述。
本實(shí)施例同樣提供了一種反饋式智能語音控制方法,如圖6所示,本實(shí)施例的反饋式智能語音控制方法包括以下步驟:
步驟301、存儲(chǔ)文本指令及對(duì)應(yīng)的控制指令;
步驟302、采集用戶輸入的語音信息;
步驟303、將所述語音信息轉(zhuǎn)換為文本信息;
步驟304、判斷是否有與所述文本信息完全相同的文本指令,若否,則對(duì)所述文本信息與所述文本指令進(jìn)行模糊匹配,若與一目標(biāo)文本指令匹配成功,則輸出與所述目標(biāo)文本指令對(duì)應(yīng)的目標(biāo)控制指令;
步驟305、根據(jù)所述目標(biāo)控制指令執(zhí)行操作;
步驟306、存儲(chǔ)所述文本信息,統(tǒng)計(jì)所述文本信息的存儲(chǔ)次數(shù),并在判斷所述存儲(chǔ)次數(shù)超過第三閾值時(shí),存儲(chǔ)所述文本信息與所述目標(biāo)文本指令的對(duì)應(yīng)關(guān)系。
實(shí)施例4
本實(shí)施例的反饋式智能語音控制系統(tǒng)與實(shí)施例1基本相同,主要區(qū)別在于:如圖7所示,本實(shí)施例的反饋式智能語音控制系統(tǒng)的語音識(shí)別模塊2具體包括:第一預(yù)存單元21、字符串轉(zhuǎn)換單元22、拆分單元23、判斷單元24、文本信息生成單元25;
其中,所述第一預(yù)存單元21用于預(yù)存多個(gè)目標(biāo)詞組及與每個(gè)目標(biāo)詞組對(duì)應(yīng)的同類詞組和近義詞組;
所述字符串轉(zhuǎn)換單元22用于將所述語音信息轉(zhuǎn)換為字符串;
所述拆分單元23用于將所述字符串拆分為若干詞組;
所述判斷單元24用于判斷拆分出的詞組是否包括存儲(chǔ)在所述第一預(yù)存單元中的目標(biāo)詞組,并在判斷為是時(shí),獲取與所述拆分出的詞組中的目標(biāo)詞組對(duì)應(yīng)的同類詞組和近義詞組;
所述文本信息生成單元25用于對(duì)所述拆分出的詞組中的非目標(biāo)詞組與目標(biāo)詞組或目標(biāo)詞組對(duì)應(yīng)的同類詞組和近義詞組進(jìn)行任意組合,生成多個(gè)文本信息,并傳輸至所述數(shù)據(jù)處理模塊。
本實(shí)施例中,所述語音識(shí)別模塊可以利用上述各個(gè)單元對(duì)用戶輸入的語音信息進(jìn)行更進(jìn)一步地分析,可以根據(jù)用戶輸入的語音信息轉(zhuǎn)換后的字符串中所包括的目標(biāo)詞組查詢出相對(duì)應(yīng)的同類詞組和近義詞組,并將其與字符串中的非目標(biāo)詞組進(jìn)行任意組合,從而實(shí)現(xiàn)了用戶說的一句話,最終可以轉(zhuǎn)換成多個(gè)文本信息,然后對(duì)每個(gè)文本信息進(jìn)行匹配,只要其中有一個(gè)匹配成功,那么用戶發(fā)出的語音信息就可以得到響應(yīng),從而提高了語音信息匹配成功的可能性,提升了對(duì)用戶輸入語音信息的響應(yīng)成功率。
下面舉一個(gè)本實(shí)施例的反饋式智能語音控制系統(tǒng)的語音識(shí)別模塊的具體應(yīng)用實(shí)例:
例如,所述第一預(yù)存單元中預(yù)存有目標(biāo)詞組“謙讓”,以及與其對(duì)應(yīng)的同類詞組“孔融讓梨”和近義詞組“謙虛”;當(dāng)用戶輸入語音信息“我想聽一個(gè)關(guān)于謙讓的故事”時(shí),所述字符串轉(zhuǎn)換單元會(huì)將其轉(zhuǎn)換為字符串“我想聽一個(gè)關(guān)于謙讓的故事”,然后所述拆分單元會(huì)將其依次拆分為若干詞組,例如拆分為“我”、“想聽”、“一個(gè)”、“關(guān)于”、“謙讓”、“的”、“故事”,其中將字符串拆分為詞組已經(jīng)屬于本領(lǐng)域比較成熟的現(xiàn)有技術(shù),在此就不再贅述;這樣,所述判斷單元會(huì)判斷拆分出的詞組是否包括存儲(chǔ)在預(yù)存單元中的目標(biāo)詞組,經(jīng)判斷,發(fā)現(xiàn)詞組“謙讓”屬于目標(biāo)詞組,然后就獲取與“謙讓”相對(duì)應(yīng)的同類詞組“孔融讓梨”和近義詞組“謙虛”;接著所述文本信息生成單元就可以對(duì)所述拆分出的詞組中的非目標(biāo)詞組(即包括:“我”、“想聽”、“一個(gè)”、“關(guān)于”、“的”、“故事”)與目標(biāo)詞組或目標(biāo)詞組對(duì)應(yīng)的同類詞組和近義詞組(即包括“謙讓”、“孔融讓梨”、“謙虛”)進(jìn)行任意組合,生成多個(gè)文本信息,當(dāng)然,優(yōu)選地,在組合時(shí),各個(gè)詞組的初始順序保持不變,這樣,最終會(huì)生成三個(gè)文本信息:
文本信息一:我想聽一個(gè)關(guān)于謙讓的故事;
文本信息二:我想聽一個(gè)關(guān)于孔融讓梨的故事;
文本信息三:我想聽一個(gè)關(guān)于謙虛的故事;
然后將這三個(gè)文本信息傳輸至所述數(shù)據(jù)處理模塊,所述數(shù)據(jù)處理模塊會(huì)對(duì)上述三個(gè)文本信息分別進(jìn)行匹配,而假設(shè)本實(shí)施例的反饋式智能語音控制系統(tǒng)運(yùn)行在故事機(jī)中,其中故事機(jī)中存儲(chǔ)有文本指令“孔融讓梨”和對(duì)應(yīng)的控制指令“語音播放孔融讓梨的故事”,這樣,文本信息二會(huì)最終與文本指令“孔融讓梨”匹配成功,從而觸發(fā)故事機(jī)播放孔融讓梨的故事。
本實(shí)施例還提供了一種反饋式智能語音控制方法,其基本步驟與實(shí)施例1的反饋式智能語音控制方法基本相同,主要區(qū)別在于,如圖8所示,本實(shí)施例的反饋式智能語音控制方法的步驟103具體包括:
步驟10311、預(yù)存多個(gè)目標(biāo)詞組及與每個(gè)目標(biāo)詞組對(duì)應(yīng)的同類詞組和近義詞組;
步驟10312、將所述語音信息轉(zhuǎn)換為字符串;
步驟10313、將所述字符串拆分為若干詞組;
步驟10314、判斷拆分出的詞組是否包括存儲(chǔ)在所述預(yù)存單元中的目標(biāo)詞組,并在判斷為是時(shí),獲取與所述拆分出的詞組中的目標(biāo)詞組對(duì)應(yīng)的同類詞組和近義詞組;
步驟10315、對(duì)所述拆分出的詞組中的非目標(biāo)詞組與目標(biāo)詞組或目標(biāo)詞組對(duì)應(yīng)的同類詞組和近義詞組進(jìn)行任意組合,生成多個(gè)文本信息。
實(shí)施例5
本實(shí)施例的反饋式智能語音控制系統(tǒng)與實(shí)施例1基本相同,主要區(qū)別在于:如圖9所示,本實(shí)施例的反饋式智能語音控制系統(tǒng)的語音識(shí)別模塊2具體包括:第二預(yù)存單元26、語言轉(zhuǎn)換單元27以及文本轉(zhuǎn)換單元28;
其中,所述第二預(yù)存單元26用于預(yù)存不同種類的特殊語言的語音信息與一標(biāo)準(zhǔn)語言的語音信息的對(duì)應(yīng)關(guān)系;
所述語言轉(zhuǎn)換單元27用于在識(shí)別出用戶輸入的語音信息為特殊語言的語音信息時(shí),將特殊語言的語音信息轉(zhuǎn)換為對(duì)應(yīng)的標(biāo)準(zhǔn)語言的語音信息;
所述文本轉(zhuǎn)換單元28用于將所述對(duì)應(yīng)的標(biāo)準(zhǔn)語言的語音信息轉(zhuǎn)換為文本信息,并傳輸至所述數(shù)據(jù)處理模塊。
在本實(shí)施例中,所謂的特殊語言具體可指方言,不同種類的特殊語言即表示不同地區(qū)的方言,而所述的標(biāo)準(zhǔn)語言即是指普通話,即本實(shí)施例的所述第二預(yù)存單元預(yù)存有不同的方言的語音信息與普通話的語音信息的對(duì)應(yīng)關(guān)系,例如對(duì)于同一個(gè)語音信息“吃飯”,不同地方的方言所對(duì)應(yīng)的的語音是不同的,而不同的表示“吃飯”的方言均預(yù)存在所述第二預(yù)存單元中,與標(biāo)準(zhǔn)的普通話語音“吃飯”相對(duì)應(yīng);
所述語言轉(zhuǎn)換單元?jiǎng)t是在識(shí)別出用戶輸入的語音信息是方言時(shí),將其轉(zhuǎn)換為普通話的語音信息;然后所述文本轉(zhuǎn)換單元將普通話的語音信息轉(zhuǎn)換為文本信息,并傳輸至所述數(shù)據(jù)處理模塊進(jìn)行匹配;
本實(shí)施例的語音識(shí)別模塊實(shí)現(xiàn)了識(shí)別不同地區(qū)的用戶輸入語音信息時(shí)的方言,并將方言表達(dá)的語音信息轉(zhuǎn)換為普通話對(duì)應(yīng)的標(biāo)準(zhǔn)語音信息進(jìn)行處理,從而本實(shí)施例拓展了能夠處理的語音的種類,提升了用戶的使用體驗(yàn)。
下面舉一個(gè)本實(shí)施例的反饋式智能語音控制系統(tǒng)的語音識(shí)別模塊的具體應(yīng)用實(shí)例:
例如,所述第一預(yù)存單元中預(yù)存有不同種類的方言表達(dá)“我想聽關(guān)于吃飯的相聲”的語音信息,以及普通話表達(dá)“我想聽關(guān)于吃飯的相聲”的語音信息;當(dāng)一個(gè)上海人用上海話輸入“我想聽關(guān)于吃飯的相聲”時(shí),所述語言轉(zhuǎn)換模塊能夠識(shí)別出表達(dá)“我想聽關(guān)于吃飯的相聲”的語音信息為上海話,并將其轉(zhuǎn)換為普通話表達(dá)的“我想聽關(guān)于吃飯的相聲”的語音信息,然后所述文本轉(zhuǎn)換單元就可以將普通話表達(dá)的“我想聽關(guān)于吃飯的相聲”的語音信息轉(zhuǎn)換為文本信息“我想聽關(guān)于吃飯的相聲”,并傳輸至所述數(shù)據(jù)處理模塊進(jìn)行匹配,而假設(shè)本實(shí)施例的反饋式智能語音控制系統(tǒng)運(yùn)行在故事機(jī)中,其中故事機(jī)中存儲(chǔ)有文本指令“我想聽關(guān)于吃飯的相聲”和控制指令“播放一段關(guān)于吃飯的相聲”,從而用戶用上海話說出的語音信息“我想聽關(guān)于吃飯的相聲”就能夠被成功識(shí)別和響應(yīng),最終控制故事機(jī)播放一段關(guān)于吃飯的相聲,從而能夠?qū)τ梅窖园l(fā)出指令的用戶進(jìn)行正確的響應(yīng)。
本實(shí)施例還提供了一種反饋式智能語音控制方法,其基本步驟與實(shí)施例1的反饋式智能語音控制方法基本相同,主要區(qū)別在于,如圖10所示,本實(shí)施例的反饋式智能語音控制方法的步驟103具體包括:
步驟10321、預(yù)存不同種類的特殊語言的語音信息與一標(biāo)準(zhǔn)語言的語音信息的對(duì)應(yīng)關(guān)系;
步驟10322、在識(shí)別出用戶輸入的語音信息為特殊語言的語音信息時(shí),將特殊語言的語音信息轉(zhuǎn)換為對(duì)應(yīng)的標(biāo)準(zhǔn)語言的語音信息;
步驟10323、將所述對(duì)應(yīng)的標(biāo)準(zhǔn)語言的語音信息轉(zhuǎn)換為文本信息,并傳輸至所述數(shù)據(jù)處理模塊。
實(shí)施例6
本實(shí)施例的反饋式智能語音控制系統(tǒng)與實(shí)施例1基本相同,主要區(qū)別在于:在所述本地指令庫中,同一個(gè)控制指令對(duì)應(yīng)多個(gè)文本指令,不同的文本指令用于表征不同的用戶表達(dá)習(xí)慣;本實(shí)施例實(shí)現(xiàn)了將不同用戶關(guān)于同一個(gè)控制指令的多個(gè)不同的文本指令統(tǒng)一存儲(chǔ)起來,并均與同一個(gè)控制指令相對(duì)應(yīng),這樣,對(duì)于具有不同表達(dá)習(xí)慣的用戶,本實(shí)施例的反饋式智能語音控制系統(tǒng)均能夠?qū)ζ溥M(jìn)行正確響應(yīng)和反饋。
例如,對(duì)于同一個(gè)控制指令“開燈”,不同用戶可能會(huì)有不同的表達(dá)習(xí)慣,例如包括“開燈”、“光亮一點(diǎn)”、“提高照明度”等等,本實(shí)施例的本地指令庫中會(huì)將這些不同的表達(dá)習(xí)慣的文本指令均與同一個(gè)控制指令“開燈”進(jìn)行對(duì)應(yīng);這樣,無論是哪個(gè)表達(dá)習(xí)慣的用戶,只要其輸入的語音信息轉(zhuǎn)換為文本信息之后,能夠與本地指令庫中的某一個(gè)表征用戶特俗表達(dá)習(xí)慣的文本指令成功匹配,都能夠?qū)崿F(xiàn)最終執(zhí)行用戶想要的控制指令。
本實(shí)施例還提供了一種反饋式智能語音控制方法,其基本步驟與實(shí)施例1的反饋式智能語音控制方法基本相同,主要區(qū)別在于,在本實(shí)施例的步驟101中,同一個(gè)控制指令對(duì)應(yīng)多個(gè)文本指令,不同的文本指令用于表征不同的用戶表達(dá)習(xí)慣。雖然以上描述了本發(fā)明的具體實(shí)施方式,但是本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這些僅是舉例說明,本發(fā)明的保護(hù)范圍是由所附權(quán)利要求書限定的。本領(lǐng)域的技術(shù)人員在不背離本發(fā)明的原理和實(shí)質(zhì)的前提下,可以對(duì)這些實(shí)施方式做出多種變更或修改,但這些變更和修改均落入本發(fā)明的保護(hù)范圍。