本公開涉及人工智能和大數(shù)據(jù),尤其涉及一種風險分析模型的訓(xùn)練方法、風險數(shù)據(jù)的分析方法、裝置、設(shè)備、介質(zhì)和產(chǎn)品。
背景技術(shù):
1、隨著金融機構(gòu)的數(shù)字化轉(zhuǎn)型,金融機構(gòu)需要利用風險防控分析模型來對相關(guān)風險數(shù)據(jù)(例如市場風險數(shù)據(jù)、操作風險數(shù)據(jù)、信用風險數(shù)據(jù)等)進行整合和分析,從而得到相關(guān)風險數(shù)據(jù)的分析結(jié)果。
2、在構(gòu)思本公開的過程中,發(fā)明人發(fā)現(xiàn)在相關(guān)技術(shù)中針對風險數(shù)據(jù)的分析存在如下缺陷:待分析數(shù)據(jù)的數(shù)據(jù)質(zhì)量較差,影響風險分析結(jié)果的準確性;傳統(tǒng)風險數(shù)據(jù)分析中僅基于輸入數(shù)據(jù)(待分析數(shù)據(jù))固定生成輸出風險分析結(jié)果,缺乏考慮實際業(yè)務(wù)需求和不同用戶偏好,導(dǎo)致風險分析結(jié)果欠佳,用戶體驗感差,難以滿足實際業(yè)務(wù)需求。
技術(shù)實現(xiàn)思路
1、鑒于上述問題,本公開提供了一種風險分析模型的訓(xùn)練方法、風險數(shù)據(jù)的分析方法、裝置、設(shè)備、介質(zhì)和產(chǎn)品。
2、根據(jù)本公開的第一個方面,提供了一種風險分析模型的訓(xùn)練方法,包括:將目標樣本風險數(shù)據(jù)輸入至第一風險分析模型中,輸出樣本風險分析結(jié)果,其中,上述目標樣本風險數(shù)據(jù)包括與上述目標樣本風險數(shù)據(jù)對應(yīng)的標簽;
3、利用上述樣本風險分析結(jié)果以及與上述樣本風險分析結(jié)果對應(yīng)的標簽訓(xùn)練上述第一風險分析模型,得到第二風險分析模型;以及
4、利用目標評估模型和預(yù)設(shè)更新策略對上述第二風險分析模型進行更新,生成第三風險分析模型,其中,上述目標評估模型用于基于由上述樣本風險數(shù)據(jù)和上述樣本風險分析結(jié)果組成的數(shù)據(jù)對進行打分。
5、根據(jù)本公開的實施例,上述目標評估模型的獲取方式包括:
6、獲取上述樣本風險數(shù)據(jù)和上述樣本風險分析結(jié)果;以及
7、根據(jù)上述樣本風險數(shù)據(jù)、上述樣本風險分析結(jié)果以及與上述樣本風險分析結(jié)果對應(yīng)的反饋數(shù)據(jù)訓(xùn)練初始評估模型,得到上述目標評估模型。
8、根據(jù)本公開的實施例,上述反饋數(shù)據(jù)與用戶的需求相關(guān)聯(lián),包括多個反饋子數(shù)據(jù),上述反饋子數(shù)據(jù)包括由上述目標樣本風險數(shù)據(jù)與上述樣本風險分析結(jié)果組成的數(shù)據(jù)對,以及與上述數(shù)據(jù)對相對應(yīng)的反饋數(shù)據(jù),上述反饋數(shù)據(jù)用于表征相對于同一樣本風險數(shù)據(jù)生成的上述樣本風險分析結(jié)果的正向反饋或負向反饋。
9、根據(jù)本公開的實施例,上述預(yù)設(shè)更新策略包括近端策略優(yōu)化算法;
10、其中,上述利用目標評估模型和預(yù)設(shè)更新策略對上述第二風險分析模型進行更新,生成第三風險分析模型,包括:
11、利用上述目標評估模型和上述近端策略優(yōu)化算法對上述第二風險分析模型的參數(shù)進行更新,生成第三風險分析模型。
12、根據(jù)本公開的實施例,上述第三風險分析模型在用于實現(xiàn)風險分析結(jié)果的結(jié)果序列中獲得的累計反饋數(shù)據(jù)滿足預(yù)設(shè)條件,上述累計反饋數(shù)據(jù)是根據(jù)上述風險分析結(jié)果中的每個階段對應(yīng)的反饋數(shù)據(jù)得到的。
13、根據(jù)本公開的實施例,上述近端策略優(yōu)化算法包括行為優(yōu)化算法和評判優(yōu)化算法,上述結(jié)果序列包括至少一個階段;
14、其中,上述結(jié)果序列中的每個階段包括:
15、根據(jù)上述目標樣本風險數(shù)據(jù)和上述行為優(yōu)化算法,生成與上述目標樣本風險數(shù)據(jù)對應(yīng)的風險分析結(jié)果;以及
16、根據(jù)上述目標樣本風險數(shù)據(jù)和上述風險分析結(jié)果,生成當前階段的反饋數(shù)據(jù)。
17、根據(jù)本公開的實施例,上述方法還包括:
18、在接收到來自于目標數(shù)據(jù)源發(fā)送的第一樣本風險數(shù)據(jù)的情況下,對上述第一風險數(shù)據(jù)進行篩選,得到第二樣本風險數(shù)據(jù);以及
19、對上述第二樣本風險數(shù)據(jù)進行處理,得到目標樣本風險數(shù)據(jù),其中,上述目標樣本風險數(shù)據(jù)表征為與多個風險類型相對應(yīng)的樣本風險詞向量。
20、本公開的第二方面提供了一種風險數(shù)據(jù)的分析方法,包括:
21、將獲得到的初始風險數(shù)據(jù)輸入至第三風險分析模型,輸出目標風險分析結(jié)果,其中,上述第三風險分析模型是基于上述方法訓(xùn)練得到的。
22、本公開的第三方面提供了一種風險分析模型的訓(xùn)練裝置,包括:
23、樣本風險分析結(jié)果輸出模塊,用于將目標樣本風險數(shù)據(jù)輸入至第一風險分析模型中,輸出樣本風險分析結(jié)果,其中,上述目標樣本風險數(shù)據(jù)包括與上述目標樣本風險數(shù)據(jù)對應(yīng)的標簽;
24、第一風險分析模型訓(xùn)練模塊,用于利用上述樣本風險分析結(jié)果以及與上述樣本風險分析結(jié)果對應(yīng)的標簽訓(xùn)練上述第一風險分析模型,得到第二風險分析模型;以及
25、第三風險分析模型生成模塊,用于利用目標評估模型和預(yù)設(shè)更新策略對上述第二風險分析模型進行更新,生成第三風險分析模型,其中,上述目標評估模型用于基于由上述樣本風險數(shù)據(jù)和上述樣本風險分析結(jié)果組成的數(shù)據(jù)對進行打分。
26、本公開的第四方面提供了一種風險數(shù)據(jù)的分析裝置,包括:
27、目標風險分析結(jié)果輸出模塊,用于將獲得到的初始風險數(shù)據(jù)輸入至第三風險分析模型,輸出目標風險分析結(jié)果,其中,上述第三風險分析模型是基于上述方法訓(xùn)練得到的。
28、本公開的第五方面提供了一種電子設(shè)備,包括:一個或多個處理器;存儲器,用于存儲一個或多個程序,其中,當上述一個或多個程序被上述一個或多個處理器執(zhí)行時,使得一個或多個處理器執(zhí)行上述方法。
29、本公開的第六方面還提供了一種計算機可讀存儲介質(zhì),其上存儲有可執(zhí)行指令,該指令被處理器執(zhí)行時使處理器執(zhí)行上述方法。
30、本公開的第七方面還提供了一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)上述方法。
31、根據(jù)本公開提供的風險分析模型的訓(xùn)練方法、風險數(shù)據(jù)的分析方法、裝置、設(shè)備、介質(zhì)和產(chǎn)品,通過將目標樣本風險數(shù)據(jù)輸入至第一風險分析模型中,輸出樣本風險分析結(jié)果,從而可以利用樣本風險分析結(jié)果以及與樣本風險分析結(jié)果對應(yīng)的標簽來訓(xùn)練第一風險分析模型,得到第二風險分析模型,進而可以通過目標評估模型,利用經(jīng)過用戶打分后的樣本風險數(shù)據(jù)和樣本風險分析結(jié)果組成的數(shù)據(jù)對來對第二風險分析模型進行了微調(diào)訓(xùn)練,提高了訓(xùn)練數(shù)據(jù)的數(shù)據(jù)質(zhì)量和風險分析模型的整體性能,同時通過預(yù)設(shè)更新策略來改進策略梯度算法,使得風險分析模型訓(xùn)練中梯度及步長的更新更加合理科學(xué),在此基礎(chǔ)上生成的第三風險分析模型對風險數(shù)據(jù)的分析過程考慮了不同用戶的偏好和需求,進而使得風險分析結(jié)果更加準確,提高了用戶的體驗感,更好的滿足了實際業(yè)務(wù)的需求。
1.一種風險分析模型的訓(xùn)練方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,其中,所述目標評估模型的獲取方式包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,其中,所述反饋數(shù)據(jù)與用戶的需求相關(guān)聯(lián),包括多個反饋子數(shù)據(jù),所述反饋子數(shù)據(jù)包括由所述目標樣本風險數(shù)據(jù)與所述樣本風險分析結(jié)果組成的數(shù)據(jù)對,以及與所述數(shù)據(jù)對相對應(yīng)的反饋數(shù)據(jù),所述反饋數(shù)據(jù)用于表征相對于同一樣本風險數(shù)據(jù)生成的所述樣本風險分析結(jié)果的正向反饋或負向反饋。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,其中,所述預(yù)設(shè)更新策略包括近端策略優(yōu)化算法;
5.根據(jù)權(quán)利要求1至4任一項所述的方法,其特征在于,其中,所述第三風險分析模型在用于實現(xiàn)風險分析結(jié)果的結(jié)果序列中獲得的累計反饋數(shù)據(jù)滿足預(yù)設(shè)條件,所述累計反饋數(shù)據(jù)是根據(jù)所述風險分析結(jié)果中的每個階段對應(yīng)的反饋數(shù)據(jù)得到的。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,其中,所述近端策略優(yōu)化算法包括行為優(yōu)化算法和評判優(yōu)化算法,所述結(jié)果序列包括至少一個階段;
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
8.一種風險數(shù)據(jù)的分析方法,其特征在于,所述方法包括:
9.一種風險分析模型的訓(xùn)練裝置,其特征在于,所述裝置包括:
10.一種風險數(shù)據(jù)的分析裝置,其特征在于,所述裝置包括:
11.一種電子設(shè)備,包括:
12.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時實現(xiàn)根據(jù)權(quán)利要求1~8中任一項所述方法的步驟。
13.一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)根據(jù)權(quán)利要求1~8中任一項所述方法的步驟。