本發(fā)明涉及計(jì)算機(jī)?,尤其涉及一種電力客服對(duì)話模型訓(xùn)練方法、對(duì)話生成方法及相關(guān)裝置。
背景技術(shù):
1、在電力行業(yè),隨著用戶規(guī)模的不斷擴(kuò)大和業(yè)務(wù)量的持續(xù)增長(zhǎng),傳統(tǒng)的客服模式已經(jīng)難以滿足日益繁重的用戶業(yè)務(wù)咨詢需求。
2、相關(guān)技術(shù)中,早期的對(duì)話系統(tǒng)通常采用基于模塊化的方法或基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)方法,對(duì)話數(shù)據(jù)采集難度大、成本高,且通常是從一類或者少數(shù)幾類人群對(duì)話記錄中采集訓(xùn)練樣本,樣本對(duì)典型人群的偏向性強(qiáng),缺乏適普性,導(dǎo)致模型缺乏語言的靈活性和上下文理解能力,僅能幫助用戶完成單一且簡(jiǎn)單的任務(wù),且容易泄露用戶隱私,無法滿足日益增長(zhǎng)的客服-用戶對(duì)話過程的問答需求。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種電力客服對(duì)話模型訓(xùn)練方法、對(duì)話生成方法及相關(guān)裝置,用以解決現(xiàn)有技術(shù)在訓(xùn)練對(duì)話系統(tǒng)時(shí),樣本采集難度大、成本高,且缺乏適普性,導(dǎo)致對(duì)話模型生成問答內(nèi)容的質(zhì)量低且容易泄露用戶隱私的缺陷,提高了對(duì)話數(shù)據(jù)采集效率,進(jìn)而提高了對(duì)話模型的問答性能。
2、本發(fā)明提供一種電力客服對(duì)話模型訓(xùn)練方法,包括:
3、從電力行業(yè)用戶的行為數(shù)據(jù)提取出人格特征,并根據(jù)所述人格特征、用戶人物屬性和用戶種子知識(shí)構(gòu)建用戶代理智能體,根據(jù)客服人物屬性和客服種子知識(shí)構(gòu)建客服代理智能體;
4、從電力行業(yè)客服的對(duì)話記錄數(shù)據(jù)中提取出多個(gè)話題,對(duì)所述多個(gè)話題進(jìn)行話題蒸餾,得到蒸餾后的話題,并從所述蒸餾后的話題中提取出引導(dǎo)詞;
5、通過預(yù)訓(xùn)練大語言模型根據(jù)所述引導(dǎo)詞驅(qū)動(dòng)所述用戶代理智能體與所述客服代理智能體進(jìn)行多輪次對(duì)話交互,并將通過每個(gè)輪次對(duì)話交互生成的對(duì)話數(shù)據(jù)對(duì)對(duì)話生成模型進(jìn)行迭代訓(xùn)練,得到電力客服對(duì)話模型。
6、根據(jù)本發(fā)明提供的一種電力客服對(duì)話模型訓(xùn)練方法,所述對(duì)話數(shù)據(jù)包括用戶問答數(shù)據(jù)和客服問答數(shù)據(jù);
7、在所述通過預(yù)訓(xùn)練大語言模型根據(jù)所述引導(dǎo)詞驅(qū)動(dòng)所述用戶代理智能體與所述客服代理智能體進(jìn)行多輪次對(duì)話交互之后,所述方法還包括:
8、在每個(gè)輪次對(duì)話交互過程中,在所述用戶代理智能體根據(jù)所述引導(dǎo)詞生成所述用戶問答數(shù)據(jù)的情況下,所述客服代理智能體通過外掛知識(shí)庫(kù)對(duì)所述用戶問答數(shù)據(jù)進(jìn)行rag查詢式回復(fù),得到所述客服問答數(shù)據(jù)。
9、根據(jù)本發(fā)明提供的一種電力客服對(duì)話模型訓(xùn)練方法,所述客服代理通過外掛知識(shí)庫(kù)對(duì)所述用戶問答數(shù)據(jù)進(jìn)行rag查詢式回復(fù),得到所述客服問答數(shù)據(jù)包括:
10、采用下式得到所述客服問答數(shù)據(jù):
11、;
12、其中,為所述客服問答數(shù)據(jù),gen為所述客服代理智能體 c的對(duì)話生成模型,為對(duì)話交互的輪次,為檢索增強(qiáng)生成機(jī)制,為用戶代理智能體,為所述外掛知識(shí)庫(kù)。
13、根據(jù)本發(fā)明提供的一種電力客服對(duì)話模型訓(xùn)練方法,所述將通過每個(gè)輪次對(duì)話交互生成的對(duì)話數(shù)據(jù)對(duì)對(duì)話生成模型進(jìn)行迭代訓(xùn)練,得到電力客服對(duì)話模型包括:
14、采用目標(biāo)損失函數(shù)對(duì)所述對(duì)話生成模型進(jìn)行監(jiān)督微調(diào),得到所述電力客服對(duì)話模型;其中,所述目標(biāo)損失函數(shù)通過下式表示:
15、;
16、其中,是所有對(duì)話樣本的數(shù)量,是第個(gè)對(duì)話樣本中的詞或標(biāo)記數(shù),表示對(duì)話生成模型在給定上下文的情況下生成的單詞接近正確單詞的概率;是對(duì)數(shù)似然,用于計(jì)算模型生成與目標(biāo)回復(fù)之間的匹配程度,為模型參數(shù)。
17、根據(jù)本發(fā)明提供的一種電力客服對(duì)話模型訓(xùn)練方法,在所述得到電力客服對(duì)話模型之后,所述方法還包括:
18、對(duì)所述電力客服對(duì)話模型輸出的客服問答數(shù)據(jù)進(jìn)行質(zhì)量評(píng)估,得到評(píng)估后的客服問答數(shù)據(jù),并根據(jù)所述評(píng)估后的客服問答數(shù)據(jù)對(duì)所述電力客服對(duì)話模型進(jìn)行反思式優(yōu)化,得到優(yōu)化后的電力客服對(duì)話模型。
19、本發(fā)明還提供一種對(duì)話生成方法,包括:
20、獲取用戶輸入問題;
21、基于所述電力客服對(duì)話模型對(duì)所述用戶輸入問題進(jìn)行處理,得到客服回復(fù)信息;其中,所述電力客服對(duì)話模型基于所述電力客服對(duì)話模型訓(xùn)練方法訓(xùn)練得到。
22、本發(fā)明還提供一種電力客服對(duì)話模型訓(xùn)練裝置,包括:
23、智能體構(gòu)建模塊,用于從電力行業(yè)用戶的行為數(shù)據(jù)提取出人格特征,并根據(jù)所述人格特征、用戶人物屬性和用戶種子知識(shí)構(gòu)建用戶代理智能體,根據(jù)客服人物屬性和客服種子知識(shí)構(gòu)建客服代理智能體;
24、話題處理模塊,用于從電力行業(yè)客服的對(duì)話記錄數(shù)據(jù)中提取出多個(gè)話題,對(duì)所述多個(gè)話題進(jìn)行話題蒸餾,得到蒸餾后的話題,并從所述蒸餾后的話題中提取出引導(dǎo)詞;
25、訓(xùn)練模塊,用于通過預(yù)訓(xùn)練大語言模型根據(jù)所述引導(dǎo)詞驅(qū)動(dòng)所述用戶代理智能體與所述客服代理智能體進(jìn)行多輪次對(duì)話交互,并將通過每個(gè)輪次對(duì)話交互生成的對(duì)話數(shù)據(jù)對(duì)對(duì)話生成模型進(jìn)行迭代訓(xùn)練,得到電力客服對(duì)話模型。
26、本發(fā)明還提供一種對(duì)話生成裝置,包括:
27、問題輸入模塊,用于獲取用戶輸入問題;
28、答復(fù)模塊,用于基于所述電力客服對(duì)話模型對(duì)所述用戶輸入問題進(jìn)行處理,得到客服回復(fù)信息;其中,所述電力客服對(duì)話模型基于所述電力客服對(duì)話模型訓(xùn)練方法訓(xùn)練得到。
29、本發(fā)明還提供一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上述任一種所述電力客服對(duì)話模型訓(xùn)練方法或者所述對(duì)話生成方法。
30、本發(fā)明還提供一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述電力客服對(duì)話模型訓(xùn)練方法或者所述對(duì)話生成方法。
31、本發(fā)明還提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述電力客服對(duì)話模型訓(xùn)練方法或者所述對(duì)話生成方法。
32、本發(fā)明提供的電力客服對(duì)話模型訓(xùn)練方法、對(duì)話生成方法及相關(guān)裝置,通過電力行業(yè)用戶的人格特征、用戶人物屬性和用戶種子知識(shí)構(gòu)建用戶代理智能體,根據(jù)客服人物屬性和客服種子知識(shí)構(gòu)建客服代理智能體,并從電力行業(yè)客服的對(duì)話記錄數(shù)據(jù)中提取出多個(gè)話題并進(jìn)行話題蒸餾,再?gòu)恼麴s后的話題中提取出引導(dǎo)詞,最后通過預(yù)訓(xùn)練大語言模型根據(jù)引導(dǎo)詞驅(qū)動(dòng)用戶代理智能體與客服代理智能體進(jìn)行多輪次對(duì)話交互,得到電力客服對(duì)話模型,提高了對(duì)話數(shù)據(jù)采集效率和質(zhì)量,進(jìn)而增強(qiáng)了對(duì)話模型的問答性能,同時(shí)提高了用戶隱私的安全性。
1.一種電力客服對(duì)話模型訓(xùn)練方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的電力客服對(duì)話模型訓(xùn)練方法,其特征在于,所述對(duì)話數(shù)據(jù)包括用戶問答數(shù)據(jù)和客服問答數(shù)據(jù);
3.根據(jù)權(quán)利要求2所述的電力客服對(duì)話模型訓(xùn)練方法,其特征在于,所述客服代理通過外掛知識(shí)庫(kù)對(duì)所述用戶問答數(shù)據(jù)進(jìn)行rag查詢式回復(fù),得到所述客服問答數(shù)據(jù)包括:
4.根據(jù)權(quán)利要求2所述的電力客服對(duì)話模型訓(xùn)練方法,其特征在于,所述將通過每個(gè)輪次對(duì)話交互生成的對(duì)話數(shù)據(jù)對(duì)對(duì)話生成模型進(jìn)行迭代訓(xùn)練,得到電力客服對(duì)話模型包括:
5.根據(jù)權(quán)利要求1和4任一項(xiàng)所述的電力客服對(duì)話模型訓(xùn)練方法,其特征在于,在所述得到電力客服對(duì)話模型之后,所述方法還包括:
6.一種對(duì)話生成方法,其特征在于,包括:
7.一種電力客服對(duì)話模型訓(xùn)練裝置,其特征在于,包括:
8.一種對(duì)話生成裝置,其特征在于,包括:
9.一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至6任一項(xiàng)所述方法。
10.一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至6任一項(xiàng)所述方法。