本技術實施例涉及推薦,具體涉及一種推薦方法、裝置、電子設備及計算機可讀存儲介質(zhì)。
背景技術:
1、聲紋識別是生物識別技術的一種,聲紋識別可以把聲信號轉(zhuǎn)換成電信號,再用計算機進行識別。相關技術利用聲紋識別用戶,并對識別出的用戶進行個性化內(nèi)容推薦。然而,每個人的語音的聲學特征既有相對穩(wěn)定性,又有變異性;聲學特征的變異性是由生理、病理、心理、模擬、偽裝或環(huán)境干擾等多種因素引起的。聲學特征的變異性會導致難以準確根據(jù)用戶語音識別出用戶的身份,進而實現(xiàn)準確的個性化推薦。
技術實現(xiàn)思路
1、本技術實施例提供一種推薦方法、裝置、電子設備及計算機可讀存儲介質(zhì),可以對用戶的語音信號的初始特征進行自適應調(diào)整,得到準確的聲紋特征,進而實現(xiàn)準確的個性化推薦。
2、第一方面,本技術實施例提供了一種推薦方法,包括:
3、獲取用戶的語音信號的初始特征;
4、對所述初始特征進行自適應調(diào)整,得到所述語音信號的音色特征;
5、基于所述音色特征,確定所述用戶的聲紋特征;
6、根據(jù)所述用戶的聲紋特征與各個參考用戶的聲紋特征的匹配度,從所述參考用戶中確定目標用戶;
7、獲取所述目標用戶的信息;
8、根據(jù)所述目標用戶的信息,對所述用戶進行個性化推薦。
9、在其中一個實施例中,所述對所述初始特征進行自適應調(diào)整,得到所述語音信號的音色特征,包括:
10、將所述初始特征輸入音色提取模型,得到所述音色提取模型為所述初始特征分配的自適應權(quán)值;
11、根據(jù)所述自適應權(quán)值對所述初始特征進行調(diào)整,得到所述音色提取模型輸出的所述音色特征。
12、在其中一個實施例中,所述音色提取模型的訓練步驟至少包括:
13、獲取多個語音信號樣本,以及各個所述語音信號樣本的音色特征樣本;
14、獲取各個所述語音信號樣本的初始特征樣本;
15、將多個所述初始特征樣本輸入初始音色提取模型,得到所述初始音色提取模型為所述初始特征樣本分配的自適應權(quán)值樣本;
16、根據(jù)所述自適應權(quán)值樣本對所述初始特征樣本進行調(diào)整,得到所述初始音色提取模型輸出的預測音色特征;
17、基于各個所述語音信號樣本的音色特征樣本和預測音色特征的匹配度,對所述初始音色提取模型進行訓練,得到訓練好的所述音色提取模型。
18、在其中一個實施例中,所述基于所述音色特征,確定所述用戶的聲紋特征,包括:
19、基于所述音色特征,提取所述語音信號的聲音特征;
20、根據(jù)所述音色特征和所述聲音特征,確定所述用戶的聲紋特征。
21、在其中一個實施例中,所述初始特征包括倒譜圖和梅爾頻率倒譜系數(shù);
22、所述獲取用戶的語音信號的初始特征,包括:
23、對所述用戶的語音信號進行離散傅里葉變換,得到頻域信號;
24、從所述頻域信號中提取所述語音信號的幅值,將所述幅值的平方確定為功率譜;
25、對所述功率譜取對數(shù),得到功率譜對數(shù);
26、對所述功率譜對數(shù)進行逆離散傅里葉變換,得到所述用戶的語音信號的倒譜圖;
27、通過梅爾頻率濾波器組對所述功率譜進行濾波,得到梅爾頻率標度的功率譜能量;
28、對所述梅爾頻率標度的功率譜能量取對數(shù),得到梅爾頻率標度的功率譜對數(shù);
29、對所述梅爾頻率標度的功率譜對數(shù)進行離散余弦變換,得到所述用戶的語音信號的梅爾頻率倒譜系數(shù)。
30、在其中一個實施例中,在所述根據(jù)所述用戶的聲紋特征與各個參考用戶的聲紋特征的匹配度,從所述參考用戶中確定目標用戶之前,所述方法還包括:
31、獲取各個所述參考用戶的聲紋特征;
32、獲取各個所述參考用戶的信息;
33、將各個所述參考用戶的聲紋特征和信息,對應存儲到服務器。
34、在其中一個實施例中,所述方法還包括:
35、在所述參考用戶的聲紋特征與所述用戶的聲紋特征不匹配時,獲取所述用戶的信息;
36、將所述用戶的信息和聲紋特征,對應存儲到服務器。
37、在其中一個實施例中,所述方法還包括:
38、從各個設備上獲取所述用戶的信息;
39、利用從各個所述設備上獲取到的所述用戶的信息,對存儲在所述服務器的用戶的信息進行更新;所述服務器中存儲的所述用戶的信息,用于向各個所述設備中登錄的所述用戶進行個性化推薦。
40、第二方面,本技術實施例提供了一種推薦裝置,包括:
41、特征獲取模塊,用于獲取用戶的語音信號的初始特征;
42、特征調(diào)整模塊,用于對所述初始特征進行自適應調(diào)整,得到所述語音信號的音色特征;
43、特征確定模塊,用于基于所述音色特征,確定所述用戶的聲紋特征;
44、用戶確定模塊,用于根據(jù)所述用戶的聲紋特征與各個參考用戶的聲紋特征的匹配度,從所述參考用戶中確定目標用戶;
45、信息獲取模塊,用于獲取所述目標用戶的信息;
46、個性化推薦模塊,用于根據(jù)所述目標用戶的信息,對所述用戶進行個性化推薦。
47、在其中一個實施例中,所述特征調(diào)整模塊包括:
48、輸入單元,用于將所述初始特征輸入音色提取模型,得到所述音色提取模型為所述初始特征分配的自適應權(quán)值;
49、調(diào)整單元,用于根據(jù)所述自適應權(quán)值對所述初始特征進行調(diào)整,得到所述音色提取模型輸出的所述音色特征。
50、在其中一個實施例中,所述音色提取模型的訓練步驟至少包括:
51、獲取多個語音信號樣本,以及各個所述語音信號樣本的音色特征樣本;
52、獲取各個所述語音信號樣本的初始特征樣本;
53、將多個所述初始特征樣本輸入初始音色提取模型,得到所述初始音色提取模型為所述初始特征樣本分配的自適應權(quán)值樣本;
54、根據(jù)所述自適應權(quán)值樣本對所述初始特征樣本進行調(diào)整,得到所述初始音色提取模型輸出的預測音色特征;
55、基于各個所述語音信號樣本的音色特征樣本和預測音色特征的匹配度,對所述初始音色提取模型進行訓練,得到訓練好的所述音色提取模型。
56、在其中一個實施例中,所述特征確定模塊包括:
57、提取單元,用于基于所述音色特征,提取所述語音信號的聲音特征;
58、聲紋特征確定單元,用于根據(jù)所述音色特征和所述聲音特征,確定所述用戶的聲紋特征。
59、在其中一個實施例中,所述初始特征包括倒譜圖和梅爾頻率倒譜系數(shù);所述特征獲取模塊包括:
60、變換單元,用于對所述用戶的語音信號進行離散傅里葉變換,得到頻域信號;
61、幅值提取單元,用于從所述頻域信號中提取所述語音信號的幅值,將所述幅值的平方確定為功率譜;
62、第一取對數(shù)單元,用于對所述功率譜取對數(shù),得到功率譜對數(shù);
63、逆變換單元,用于對所述功率譜對數(shù)進行逆離散傅里葉變換,得到所述用戶的語音信號的倒譜圖;
64、濾波單元,用于通過梅爾頻率濾波器組對所述功率譜進行濾波,得到梅爾頻率標度的功率譜能量;
65、第二取對數(shù)單元,用于對所述梅爾頻率標度的功率譜能量取對數(shù),得到梅爾頻率標度的功率譜對數(shù);
66、余弦變換單元,用于對所述梅爾頻率標度的功率譜對數(shù)進行離散余弦變換,得到所述用戶的語音信號的梅爾頻率倒譜系數(shù)。
67、在其中一個實施例中,在所述根據(jù)所述用戶的聲紋特征與各個參考用戶的聲紋特征的匹配度,從所述參考用戶中確定目標用戶之前,所述裝置還包括:
68、聲紋特征獲取模塊,用于獲取各個所述參考用戶的聲紋特征;
69、參考信息獲取模塊,用于獲取各個所述參考用戶的信息;
70、第一存儲模塊,用于將各個所述參考用戶的聲紋特征和信息,對應存儲到服務器。
71、在其中一個實施例中,所述裝置還包括:
72、第一用戶信息獲取模塊,用于在所述參考用戶的聲紋特征與所述用戶的聲紋特征不匹配時,獲取所述用戶的信息;
73、第二存儲模塊,用于將所述用戶的信息和聲紋特征,對應存儲到服務器。
74、在其中一個實施例中,所述裝置還包括:
75、第二用戶信息獲取模塊,用于從各個設備上獲取所述用戶的信息;
76、更新模塊,用于利用從各個所述設備上獲取到的所述用戶的信息,對存儲在所述服務器的用戶的信息進行更新;所述服務器中存儲的所述用戶的信息,用于向各個所述設備中登錄的所述用戶進行個性化推薦。
77、第三方面,本技術實施例還提供了一種電子設備,電子設備包括存儲器、處理器及存儲在存儲器中并可在處理器上運行的計算機程序,計算機程序被處理器執(zhí)行時實現(xiàn)上述的推薦方法中的步驟。
78、第四方面,本技術實施例還提供了一種計算機可讀存儲介質(zhì),計算機可讀存儲介質(zhì)上存儲有計算機程序,計算機程序被處理器執(zhí)行時實現(xiàn)上述的推薦方法中的步驟。
79、第五方面,本技術實施例還提供了一種計算機程序產(chǎn)品或計算機程序,該計算機程序產(chǎn)品或計算機程序包括計算機指令,該計算機指令存儲在計算機可讀存儲介質(zhì)中。計算機設備的處理器從計算機可讀存儲介質(zhì)讀取該計算機指令,處理器執(zhí)行該計算機指令,使得該計算機設備執(zhí)行本技術實施例所述的各種可選實現(xiàn)方式中提供的方法。
80、綜上,本技術實施例中,獲取到用戶的語音信號的初始特征后,可以對初始特征進行自適應調(diào)整,得到準確的音色特征,進而得到準確的聲紋特征。根據(jù)用戶的聲紋特征與各個參考用戶的聲紋特征的匹配度,可以從參考用戶中確定出目標用戶,并根據(jù)目標用戶的信息,對用戶進行個性化推薦。因為對初始特征進行了自適應調(diào)整,因此可以糾正聲學特征的變異性,得到準確的聲紋特征,進而基于用戶的聲紋特征和各個參考用戶的聲紋特征的匹配度,確定用戶為目標用戶,以根據(jù)目標用戶的信息,實現(xiàn)對用戶的準確的個性化推薦。