本技術(shù)涉及一種信用風(fēng)險(xiǎn)管控系統(tǒng)和方法,利用本技術(shù)的方法和系統(tǒng)能夠輔助金融機(jī)構(gòu)進(jìn)行更為準(zhǔn)確的風(fēng)險(xiǎn)決策,增快其數(shù)字化轉(zhuǎn)型進(jìn)程。詳細(xì)來說本技術(shù)涉及一種構(gòu)建普惠信用風(fēng)險(xiǎn)預(yù)測(cè)模型的方法和針對(duì)普惠信貸業(yè)務(wù)的scoreomega模型。
背景技術(shù):
1、在當(dāng)前消費(fèi)信貸蓬勃發(fā)展的大環(huán)境下,部分金融機(jī)構(gòu)的人工審批機(jī)制已經(jīng)無法應(yīng)對(duì)逐漸增多的信貸需求,因此迫切地希望提升金融機(jī)構(gòu)的智能化風(fēng)控能力。金融機(jī)構(gòu)希望構(gòu)建從客戶預(yù)篩選、貸前審查、貸中審批、貸后管理到早期催收階段的信貸全流程風(fēng)險(xiǎn)緩釋機(jī)制。
2、如果能夠基于早識(shí)別、早預(yù)警、早發(fā)現(xiàn)、早處置的原則開發(fā)評(píng)分系統(tǒng),快速便捷地對(duì)信貸業(yè)務(wù)進(jìn)行監(jiān)控管理,就能在在風(fēng)險(xiǎn)可控的基礎(chǔ)上,提升金融機(jī)構(gòu)自身業(yè)務(wù)體量、競(jìng)爭(zhēng)優(yōu)勢(shì)和資產(chǎn)質(zhì)量。
3、但是建設(shè)評(píng)分系統(tǒng)對(duì)于數(shù)據(jù)和技術(shù)層面的依賴性極強(qiáng),數(shù)據(jù)維度的多樣性和覆蓋度、建模技巧及方法論直接影響著評(píng)分系統(tǒng)最終的穩(wěn)定性及排序性。部分金融機(jī)構(gòu)對(duì)于普惠業(yè)務(wù)智能化風(fēng)控經(jīng)驗(yàn)積累較少,風(fēng)控能力較弱。在實(shí)際的應(yīng)用過程中,存在數(shù)據(jù)挖掘分析能力欠缺、風(fēng)險(xiǎn)建模技術(shù)薄弱等因素導(dǎo)致金融機(jī)構(gòu)無法充分發(fā)揮內(nèi)部數(shù)據(jù)價(jià)值、無法有效提高模型精準(zhǔn)度及穩(wěn)定性等管控技術(shù)難題。這也是中小型金融機(jī)構(gòu)在進(jìn)行數(shù)字化轉(zhuǎn)型方向上的面臨的主要障礙之一。
技術(shù)實(shí)現(xiàn)思路
1、在此背景下,本技術(shù)的信用風(fēng)險(xiǎn)預(yù)測(cè)方法和系統(tǒng)基于大型銀行海量的數(shù)據(jù),專門從海量數(shù)據(jù)中篩選有已申請(qǐng)企業(yè)信貸業(yè)務(wù)的客戶數(shù)據(jù),以已申請(qǐng)企業(yè)信貸業(yè)務(wù)的客戶為樣本,構(gòu)建了預(yù)測(cè)信貸業(yè)務(wù)信用風(fēng)險(xiǎn)的模型。
2、目前市場(chǎng)上其他的流行的評(píng)分模型建設(shè)過程中往往困囿于建模樣本數(shù)量較小、數(shù)據(jù)來源較為單一、數(shù)據(jù)維度同質(zhì)性較高等不利因素。同時(shí),由于目前市面上的風(fēng)險(xiǎn)評(píng)估模型大多使用單一維度的數(shù)據(jù),即基于單一金融機(jī)構(gòu)數(shù)據(jù)、單一社交平臺(tái)數(shù)據(jù)或單一網(wǎng)購商城數(shù)據(jù)等進(jìn)行建模,數(shù)據(jù)覆蓋度有限,并且難以對(duì)借款人進(jìn)行全面與真實(shí)的風(fēng)險(xiǎn)評(píng)估。
3、本技術(shù)的方法和系統(tǒng)是基于高穩(wěn)定、高覆蓋和高稀缺性的數(shù)據(jù)樣本進(jìn)行的開發(fā),并對(duì)目前已經(jīng)相對(duì)成熟的信貸風(fēng)控體系進(jìn)行了系統(tǒng)性的創(chuàng)新,同時(shí)在樣本選擇時(shí)使用信貸中的已申請(qǐng)企業(yè)信貸業(yè)務(wù)的的客戶作為建模樣本,能夠?qū)鹑跈C(jī)構(gòu)普惠業(yè)務(wù)信用風(fēng)險(xiǎn)評(píng)估體系進(jìn)行有效補(bǔ)充。
4、具體來說,本技術(shù)還可以進(jìn)一步以(1)無對(duì)公存款賬戶的客戶群體預(yù)測(cè)其未來是否會(huì)發(fā)生信貸逾期的概率;(2)有對(duì)公存款賬戶且企業(yè)信貸業(yè)務(wù)當(dāng)前時(shí)間未發(fā)生逾期的客戶群體預(yù)測(cè)其發(fā)生信貸逾期的概率;(3)有對(duì)公存款賬戶且企業(yè)信貸業(yè)務(wù)當(dāng)前時(shí)間未發(fā)生逾期的客戶群體預(yù)測(cè)其發(fā)生信貸逾期的概率,這3種信用違約概率為預(yù)測(cè)目標(biāo)(即目標(biāo)變量)進(jìn)行研發(fā)。
5、本技術(shù)的方法和系統(tǒng)與市場(chǎng)上現(xiàn)有的模型相比,在預(yù)測(cè)信貸客群發(fā)生信貸逾期30天及以上的覆蓋度、穩(wěn)定性和信息價(jià)值等方面都有著較大的優(yōu)勢(shì),在普惠信貸客群逾期風(fēng)險(xiǎn)方面具有良好的應(yīng)用前景。
6、本技術(shù)涉及如下技術(shù)方案:
7、1.一種計(jì)算普惠信用風(fēng)險(xiǎn)的方法,其包括:
8、數(shù)據(jù)采集步驟,其獲取待預(yù)測(cè)樣本的普惠信用預(yù)測(cè)數(shù)據(jù);
9、對(duì)待預(yù)測(cè)樣本進(jìn)行分類的步驟,其基于決策樹方法將待預(yù)測(cè)樣本進(jìn)行分類以確定用于計(jì)算信用違約概率的子模型;
10、信用違約概率計(jì)算步驟,將普惠信用預(yù)測(cè)數(shù)據(jù)代入信用違約概率子模型中以計(jì)算所述待預(yù)測(cè)樣本的信用違約概率。
11、2.根據(jù)項(xiàng)1所述的方法,其還包括:
12、在計(jì)算出信用違約概率之后,計(jì)算所述待預(yù)測(cè)樣本的信用評(píng)分的步驟,其用于將計(jì)算得到的信用違約概率校準(zhǔn)至0-1000分的標(biāo)準(zhǔn)化分?jǐn)?shù)。
13、3.根據(jù)項(xiàng)1或2所述的方法,其中,
14、所述普惠信用預(yù)測(cè)數(shù)據(jù)包括待預(yù)測(cè)樣本的原始普惠信用預(yù)測(cè)數(shù)據(jù)以及基于原始的普惠信用預(yù)測(cè)數(shù)據(jù)加工出衍生普惠信用預(yù)測(cè)數(shù)據(jù);
15、優(yōu)選,所述原始普惠信用預(yù)測(cè)數(shù)據(jù)包括:
16、企業(yè)信貸類基礎(chǔ)數(shù)據(jù),其是基于樣本(企業(yè))用戶的貸款申請(qǐng)情況及使用行為的全部可獲取的數(shù)據(jù),
17、企業(yè)對(duì)公存款類基礎(chǔ)數(shù)據(jù),其是基于樣本(企業(yè))用戶在金融機(jī)構(gòu)辦理的人民幣存款的全部可獲取的數(shù)據(jù),
18、企業(yè)基本信息類基礎(chǔ)數(shù)據(jù),其是基于樣本(企業(yè))用戶本身的屬性,但與在金融機(jī)構(gòu)的行為不直接關(guān)聯(lián)的數(shù)據(jù),
19、企業(yè)主金融資產(chǎn)類基礎(chǔ)數(shù)據(jù),其是樣本(企業(yè)實(shí)控人)用戶在金融機(jī)構(gòu)與信用卡和貸款不相關(guān)的其他全部金融資產(chǎn)和金融交易類數(shù)據(jù),
20、企業(yè)主信貸類基礎(chǔ)數(shù)據(jù),其是基于樣本(企業(yè)實(shí)控人)用戶的貸款申請(qǐng)情況及使用行為的全部可獲取的數(shù)據(jù),
21、企業(yè)主基本信息類基礎(chǔ)數(shù)據(jù),其是基于樣本(企業(yè)實(shí)控人)用戶本身的屬性,但與在金融機(jī)構(gòu)的行為不直接關(guān)聯(lián)的數(shù)據(jù)。
22、4.根據(jù)項(xiàng)1~3中任一項(xiàng)所述的方法,其中,
23、基于原始的普惠信用預(yù)測(cè)數(shù)據(jù)加工出衍生普惠信用預(yù)測(cè)數(shù)據(jù)是指基于時(shí)間維度、空間維度、頻率維度、統(tǒng)計(jì)信息維度對(duì)采集的原始的普惠信用預(yù)測(cè)數(shù)據(jù)進(jìn)行加工而得到的數(shù)據(jù);
24、優(yōu)選,衍生普惠信用預(yù)測(cè)數(shù)據(jù)包括但不限于:
25、基于樣本關(guān)系長度進(jìn)行加工得到的衍生普惠信用預(yù)測(cè)數(shù)據(jù),
26、基于時(shí)間間隔類變量進(jìn)行加工得到的衍生普惠信用預(yù)測(cè)數(shù)據(jù),
27、基于樣本行為頻率程度進(jìn)行加工得到的衍生普惠信用預(yù)測(cè)數(shù)據(jù),
28、基于樣本當(dāng)前時(shí)間點(diǎn)情況進(jìn)行加工得到的衍生普惠信用預(yù)測(cè)數(shù)據(jù),
29、基于樣本持續(xù)行為進(jìn)行加工得到的衍生普惠信用預(yù)測(cè)數(shù)據(jù),
30、基于統(tǒng)計(jì)信息維度對(duì)樣本數(shù)據(jù)進(jìn)行加工得到的衍生普惠信用預(yù)測(cè)數(shù)據(jù)。
31、5.根據(jù)項(xiàng)1~4中任一項(xiàng)所述的方法,其中,所述普惠信用預(yù)測(cè)數(shù)據(jù)選自以下中的一種或兩種或三種或四種或五種或六種或七種:
32、企業(yè)過去12個(gè)月(貸款總余額/合同總額度)最小值、企業(yè)實(shí)控人近6個(gè)月所有信貸申請(qǐng)拒絕次數(shù)、企業(yè)過去6個(gè)月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/貸款總余額)最小值、企業(yè)過去12個(gè)月新增抵質(zhì)押貸款放款金額最大值、企業(yè)當(dāng)前住宅抵押擔(dān)保合同抵押物評(píng)估價(jià)值、企業(yè)過去12個(gè)月(貸款總余額/抵質(zhì)押擔(dān)保合同擔(dān)保金額之和)最小值、對(duì)公存款當(dāng)前月存款賬戶余額值、企業(yè)實(shí)控人個(gè)人貸款過去6個(gè)月還款金額平均值、企業(yè)過去6個(gè)月(存款賬戶月均貸方交易金額/貸款余額)平均值的分位數(shù)水平、企業(yè)當(dāng)前月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/主合同額度之和)<10%的主合同個(gè)數(shù)、企業(yè)實(shí)控人過去3個(gè)月存款賬戶時(shí)點(diǎn)最小余額、企業(yè)過去12個(gè)月(逾期金額/總放款金額)平均值、企業(yè)實(shí)控人個(gè)人貸款過去12個(gè)月利息還款金額>0的月數(shù)占比、企業(yè)實(shí)控人信用卡(過去三個(gè)月平均賬單余額/過去三個(gè)月平均額度)、對(duì)公存款當(dāng)前月(月均貸方交易金額-月均借方交易金額)、企業(yè)實(shí)控人近12個(gè)月所有信貸申請(qǐng)拒絕次數(shù)。
33、6.根據(jù)項(xiàng)1~5中任一項(xiàng)所述的方法,其中,
34、對(duì)待預(yù)測(cè)樣本進(jìn)行分類的步驟包括如下子步驟:
35、該待測(cè)樣本是否是持有對(duì)公存款賬戶的客戶;
36、該待測(cè)樣本是否是企業(yè)信貸發(fā)生逾期的客戶;
37、基于上述子步驟對(duì)待預(yù)測(cè)樣本進(jìn)行分類以確定用于計(jì)算信用違約概率的子模型,在保證業(yè)務(wù)邏輯合理的前提下,上述子步驟進(jìn)行的順序可以任意設(shè)定;
38、優(yōu)選按照如下順序?qū)ΥA(yù)測(cè)樣本進(jìn)行分類:
39、該待測(cè)樣本是否是持有對(duì)公存款賬戶的客戶;
40、該待測(cè)樣本是否是企業(yè)信貸發(fā)生逾期的客戶。
41、7.根據(jù)項(xiàng)1~6中任一項(xiàng)所述的方法,其中,
42、對(duì)普惠信用預(yù)測(cè)數(shù)據(jù)進(jìn)行特征轉(zhuǎn)換后再代入信用違約概率子模型中計(jì)算所述待預(yù)測(cè)樣本的信用違約概率,所述特征轉(zhuǎn)換步驟包括:
43、基于需要代入信用違約概率子模型的普惠信用預(yù)測(cè)數(shù)據(jù)的特征類型選擇woe方式或連續(xù)型方式進(jìn)行特征轉(zhuǎn)換。
44、8.根據(jù)項(xiàng)7所述的方法,其中,
45、采用連續(xù)型方式進(jìn)行特征轉(zhuǎn)換包括如下方式:直接選取原始值、計(jì)算原始數(shù)據(jù)的平方、計(jì)算原始數(shù)據(jù)平方根、計(jì)算原始數(shù)據(jù)立方根或計(jì)算原始數(shù)據(jù)自然對(duì)數(shù)的方式進(jìn)行連續(xù)型特征轉(zhuǎn)換。
46、9.根據(jù)項(xiàng)1~8中任一項(xiàng)所述的方法,其中,
47、信用違約概率子模型為基于樣本普惠信用預(yù)測(cè)數(shù)據(jù)和信用違約概率采用邏輯回歸基于已有用戶人群構(gòu)建的模型。
48、10.根據(jù)項(xiàng)1~9中任一項(xiàng)所述的方法,其中,
49、所述普惠信用預(yù)測(cè)數(shù)據(jù)選自:企業(yè)過去6個(gè)月逾期期數(shù)>0的抵質(zhì)押合同筆數(shù)之和、企業(yè)過去12個(gè)月(貸款總余額/合同總額度)最小值、企業(yè)實(shí)控人近6個(gè)月所有信貸申請(qǐng)拒絕次數(shù)、企業(yè)過去6個(gè)月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/貸款總余額)最小值、企業(yè)過去12個(gè)月新增抵質(zhì)押貸款放款金額最大值、企業(yè)當(dāng)前住宅抵押擔(dān)保合同抵押物評(píng)估價(jià)值中的一個(gè)、兩個(gè)、三個(gè)、四個(gè)、五個(gè)或六個(gè)。
50、11.根據(jù)項(xiàng)10所述的方法,其中,信用違約概率計(jì)算步驟包括:
51、對(duì)企業(yè)過去6個(gè)月逾期期數(shù)>0的抵質(zhì)押合同筆數(shù)之和、企業(yè)過去12個(gè)月(貸款總余額/合同總額度)最小值、企業(yè)實(shí)控人近6個(gè)月所有信貸申請(qǐng)拒絕次數(shù)、企業(yè)過去6個(gè)月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/貸款總余額)最小值、企業(yè)過去12個(gè)月新增抵質(zhì)押貸款放款金額最大值、企業(yè)當(dāng)前住宅抵押擔(dān)保合同抵押物評(píng)估價(jià)值進(jìn)行特征轉(zhuǎn)化,
52、優(yōu)選對(duì)企業(yè)過去6個(gè)月逾期期數(shù)>0的抵質(zhì)押合同筆數(shù)之和采用連續(xù)型轉(zhuǎn)換方式;對(duì)企業(yè)過去12個(gè)月(貸款總余額/合同總額度)最小值采用連續(xù)型轉(zhuǎn)換方式;對(duì)企業(yè)實(shí)控人近6個(gè)月所有信貸申請(qǐng)拒絕次數(shù)采用woe轉(zhuǎn)換方式;對(duì)企業(yè)過去6個(gè)月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/貸款總余額)最小值采用連續(xù)型轉(zhuǎn)換方式;對(duì)企業(yè)過去12個(gè)月新增抵質(zhì)押貸款放款金額最大值采用連續(xù)型轉(zhuǎn)換方式;對(duì)企業(yè)當(dāng)前住宅抵押擔(dān)保合同抵押物評(píng)估價(jià)值采用連續(xù)型轉(zhuǎn)換方式;
53、進(jìn)一步優(yōu)選,對(duì)企業(yè)過去6個(gè)月逾期期數(shù)>0的抵質(zhì)押合同筆數(shù)之和使用取對(duì)數(shù)的計(jì)算方式;對(duì)企業(yè)過去12個(gè)月(貸款總余額/合同總額度)最小值使用取原始值的計(jì)算方式;對(duì)企業(yè)過去6個(gè)月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/貸款總余額)最小值使用取立方根的計(jì)算方式;對(duì)企業(yè)過去12個(gè)月新增抵質(zhì)押貸款放款金額最大值使用取立方根的計(jì)算方式;對(duì)企業(yè)當(dāng)前住宅抵押擔(dān)保合同抵押物評(píng)估價(jià)值使用取立方根的計(jì)算方式。
54、12.根據(jù)項(xiàng)11所述的方法,其中,
55、將企業(yè)過去6個(gè)月逾期期數(shù)>0的抵質(zhì)押合同筆數(shù)之和、企業(yè)過去12個(gè)月(貸款總余額/合同總額度)最小值、企業(yè)實(shí)控人近6個(gè)月所有信貸申請(qǐng)拒絕次數(shù)、企業(yè)過去6個(gè)月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/貸款總余額)最小值、企業(yè)過去12個(gè)月新增抵質(zhì)押貸款放款金額最大值、企業(yè)當(dāng)前住宅抵押擔(dān)保合同抵押物評(píng)估價(jià)值這六個(gè)特征轉(zhuǎn)換后的數(shù)值代入基于樣本普惠信用預(yù)測(cè)數(shù)據(jù)和信用違約概率采用邏輯回歸構(gòu)建的子模型來計(jì)算該待預(yù)測(cè)樣本的違約概率。
56、13.根據(jù)項(xiàng)12所述的方法,其中,
57、其中所述子模型如下公式1所示:
58、
59、其中,k為進(jìn)入的模型的特征數(shù)量,優(yōu)選k為6,
60、α為截距項(xiàng),數(shù)值范圍為(-1.35454,-3.32983),最優(yōu)為-2.342;
61、β1為企業(yè)過去6個(gè)月逾期期數(shù)>0的抵質(zhì)押合同筆數(shù)之和對(duì)應(yīng)系數(shù),數(shù)值范圍為(3.76101,3.2228),最優(yōu)為3.492;
62、β2為企業(yè)過去12個(gè)月(貸款總余額/合同總額度)最小值對(duì)應(yīng)系數(shù),數(shù)值范圍為(0.02864,0.02511),最優(yōu)為0.027;
63、β3為企業(yè)實(shí)控人近6個(gè)月所有信貸申請(qǐng)拒絕次數(shù)對(duì)應(yīng)系數(shù),數(shù)值范圍為(-1.03442,-1.21788),最優(yōu)為-1.126;
64、β4為企業(yè)過去6個(gè)月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/貸款總余額)最小值對(duì)應(yīng)系數(shù),數(shù)值范圍為(-0.25209,-0.31363),最優(yōu)為-0.283;
65、β5為企業(yè)過去12個(gè)月新增抵質(zhì)押貸款放款金額最大值對(duì)應(yīng)系數(shù),數(shù)值范圍為(0.01243,0.0093),最優(yōu)為0.011;
66、β6為企業(yè)當(dāng)前住宅抵押擔(dān)保合同抵押物評(píng)估價(jià)值對(duì)應(yīng)系數(shù),取值范圍為(-0.00539,-0.00775),最優(yōu)為-0.007;
67、x1為特征轉(zhuǎn)換步驟生成的企業(yè)過去6個(gè)月逾期期數(shù)>0的抵質(zhì)押合同筆數(shù)之和的自然對(duì)數(shù)轉(zhuǎn)換值;
68、x2為特征轉(zhuǎn)換步驟生成的企業(yè)過去12個(gè)月(貸款總余額/合同總額度)最小值的原始轉(zhuǎn)換值;
69、x3為特征轉(zhuǎn)換步驟生成的企業(yè)實(shí)控人近6個(gè)月所有信貸申請(qǐng)拒絕次數(shù)的woe轉(zhuǎn)換值;
70、x4為特征轉(zhuǎn)換步驟生成的企業(yè)過去6個(gè)月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/貸款總余額)最小值的立方根轉(zhuǎn)換值;
71、x5為特征轉(zhuǎn)換步驟生成的企業(yè)過去12個(gè)月新增抵質(zhì)押貸款放款金額最大值的立方根轉(zhuǎn)換;
72、x6為特征轉(zhuǎn)換步驟生成的企業(yè)當(dāng)前住宅抵押擔(dān)保合同抵押物評(píng)估價(jià)值的立方根轉(zhuǎn)換值。
73、14.根據(jù)項(xiàng)13所述的方法,其中,
74、在計(jì)算出信用違約概率之后,計(jì)算所述待預(yù)測(cè)樣本的信用評(píng)分的步驟為利用如下公式計(jì)算生成用于表征所述借款人的信用評(píng)分:
75、
76、
77、其中,p為計(jì)算信用違約概率模塊中生成的借款人的違約概率(p),a為54.2458;b為115.4156,round函數(shù)對(duì)計(jì)算分?jǐn)?shù)四舍五入后的取整值;最后將大于1000的分?jǐn)?shù)置為1000分,小于0分的分?jǐn)?shù)置為0分。
78、15.根據(jù)項(xiàng)1~9中任一項(xiàng)所述的方法,其中,
79、所述普惠信用預(yù)測(cè)數(shù)據(jù)選自:企業(yè)過去12個(gè)月(貸款總余額/抵質(zhì)押擔(dān)保合同擔(dān)保金額之和)最小值、對(duì)公存款當(dāng)前月存款賬戶余額值、企業(yè)過去12個(gè)月(貸款總余額/合同總額度)最小值、企業(yè)實(shí)控人個(gè)人貸款過去6個(gè)月還款金額平均值、企業(yè)過去6個(gè)月(存款賬戶月均貸方交易金額/貸款余額)平均值的分位數(shù)水平、企業(yè)當(dāng)前月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/主合同額度之和)<10%的主合同個(gè)數(shù)、企業(yè)實(shí)控人過去3個(gè)月存款賬戶時(shí)點(diǎn)最小余額中的一個(gè)、兩個(gè)、三個(gè)、四個(gè)、五個(gè)、六個(gè)或七個(gè)。
80、16.根據(jù)項(xiàng)15所述的方法,其中,信用違約概率計(jì)算步驟包括:
81、將企業(yè)過去12個(gè)月(貸款總余額/抵質(zhì)押擔(dān)保合同擔(dān)保金額之和)最小值、對(duì)公存款當(dāng)前月存款賬戶余額值、企業(yè)過去12個(gè)月(貸款總余額/合同總額度)最小值、企業(yè)實(shí)控人個(gè)人貸款過去6個(gè)月還款金額平均值、企業(yè)過去6個(gè)月(存款賬戶月均貸方交易金額/貸款余額)平均值的分位數(shù)水平、企業(yè)當(dāng)前月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/主合同額度之和)<10%的主合同個(gè)數(shù)、企業(yè)實(shí)控人過去3個(gè)月存款賬戶時(shí)點(diǎn)最小余額進(jìn)行特征轉(zhuǎn)換,
82、優(yōu)選對(duì)企業(yè)過去12個(gè)月(貸款總余額/抵質(zhì)押擔(dān)保合同擔(dān)保金額之和)最小值采用連續(xù)型轉(zhuǎn)換方式;對(duì)對(duì)公存款當(dāng)前月存款賬戶余額值采用連續(xù)型轉(zhuǎn)換方式;對(duì)企業(yè)過去12個(gè)月(貸款總余額/合同總額度)最小值采用連續(xù)型轉(zhuǎn)換方式;對(duì)企業(yè)實(shí)控人個(gè)人貸款過去6個(gè)月還款金額平均值采用連續(xù)型轉(zhuǎn)換方式;對(duì)企業(yè)過去6個(gè)月(存款賬戶月均貸方交易金額/貸款余額)平均值的分位數(shù)水平采用連續(xù)型轉(zhuǎn)換方式;對(duì)企業(yè)當(dāng)前月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/主合同額度之和)<10%的主合同個(gè)數(shù)采用連續(xù)型轉(zhuǎn)換方式;對(duì)企業(yè)實(shí)控人過去3個(gè)月存款賬戶時(shí)點(diǎn)最小余額采用連續(xù)型轉(zhuǎn)換方式;
83、進(jìn)一步優(yōu)選,對(duì)企業(yè)過去12個(gè)月(貸款總余額/抵質(zhì)押擔(dān)保合同擔(dān)保金額之和)最小值使用取平方根的計(jì)算方式;對(duì)對(duì)公存款當(dāng)前月存款賬戶余額值使用取對(duì)數(shù)的計(jì)算方式;對(duì)企業(yè)過去12個(gè)月(貸款總余額/合同總額度)最小值使用取平方的計(jì)算方式;對(duì)企業(yè)實(shí)控人個(gè)人貸款過去6個(gè)月還款金額平均值取對(duì)數(shù)的計(jì)算方式;對(duì)企業(yè)過去6個(gè)月(存款賬戶月均貸方交易金額/貸款余額)平均值的分位數(shù)水平使用取原始值的計(jì)算方式;對(duì)企業(yè)當(dāng)前月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/主合同額度之和)<10%的主合同個(gè)數(shù)使用取原始值的計(jì)算方式;對(duì)企業(yè)實(shí)控人過去3個(gè)月存款賬戶時(shí)點(diǎn)最小余額使用取對(duì)數(shù)的計(jì)算方式。
84、17.根據(jù)項(xiàng)15所述的方法,其中,
85、將企業(yè)過去12個(gè)月(貸款總余額/抵質(zhì)押擔(dān)保合同擔(dān)保金額之和)最小值、對(duì)公存款當(dāng)前月存款賬戶余額值、企業(yè)過去12個(gè)月(貸款總余額/合同總額度)最小值、企業(yè)實(shí)控人個(gè)人貸款過去6個(gè)月還款金額平均值、企業(yè)過去6個(gè)月(存款賬戶月均貸方交易金額/貸款余額)平均值的分位數(shù)水平、企業(yè)當(dāng)前月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/主合同額度之和)<10%的主合同個(gè)數(shù)、企業(yè)實(shí)控人過去3個(gè)月存款賬戶時(shí)點(diǎn)最小余額這七個(gè)特征轉(zhuǎn)換后的數(shù)值代入基于樣本普惠信用預(yù)測(cè)數(shù)據(jù)采用邏輯回歸構(gòu)建的子模型來計(jì)算該待預(yù)測(cè)樣本的違約概率。
86、18.根據(jù)項(xiàng)17所述的方法,其中,
87、所述子模型如下公式2所示:
88、
89、其中,k為進(jìn)入的模型的特征數(shù)量,優(yōu)選k為7;
90、α為截距項(xiàng),數(shù)值范圍為(2.76651,1.35845),最優(yōu)為2.062;
91、β1為企業(yè)過去12個(gè)月(貸款總余額/抵質(zhì)押擔(dān)保合同擔(dān)保金額之和)最小值對(duì)應(yīng)系數(shù),數(shù)值范圍為(0.28152,0.21763),最優(yōu)為0.250;
92、β2為對(duì)公存款當(dāng)前月存款賬戶余額值對(duì)應(yīng)系數(shù),數(shù)值范圍為(-0.13684,-0.15997),最優(yōu)為-0.148;
93、β3為企業(yè)過去12個(gè)月(貸款總余額/合同總額度)最小值對(duì)應(yīng)系數(shù),數(shù)值范圍為(0.07758,0.0521),最優(yōu)為0.065;
94、β4為企業(yè)實(shí)控人個(gè)人貸款過去6個(gè)月還款金額平均值對(duì)應(yīng)系數(shù),數(shù)值范圍為(-0.07126,-0.08419),最優(yōu)為-0.078;
95、β5為企業(yè)過去6個(gè)月(存款賬戶月均貸方交易金額/貸款余額)平均值的分位數(shù)水平對(duì)應(yīng)系數(shù),數(shù)值范圍為(-0.01233,-0.01429),最優(yōu)為-0.013;
96、β6為企業(yè)當(dāng)前月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/主合同額度之和)<10%的主合同個(gè)數(shù)對(duì)應(yīng)系數(shù),數(shù)值范圍為(0.32322,0.28441),最優(yōu)為0.304;
97、β7為企業(yè)實(shí)控人過去3個(gè)月存款賬戶時(shí)點(diǎn)最小余額對(duì)應(yīng)系數(shù),數(shù)值范圍為(-0.0847,-0.10038),最優(yōu)為-0.093;
98、x1為特征轉(zhuǎn)換步驟生成的企業(yè)過去12個(gè)月(貸款總余額/抵質(zhì)押擔(dān)保合同擔(dān)保金額之和)最小值的平方根轉(zhuǎn)換值;
99、x2為特征轉(zhuǎn)換步驟生成的對(duì)公存款當(dāng)前月存款賬戶余額值的自然對(duì)數(shù)轉(zhuǎn)換值;
100、x3為特征轉(zhuǎn)換步驟生成的企業(yè)過去12個(gè)月(貸款總余額/合同總額度)最小值的平方轉(zhuǎn)換值;
101、x4為特征轉(zhuǎn)換步驟生成的企業(yè)實(shí)控人個(gè)人貸款過去6個(gè)月還款金額平均值的自然對(duì)數(shù)轉(zhuǎn)換值;
102、x5為特征轉(zhuǎn)換步驟生成的企業(yè)過去6個(gè)月(存款賬戶月均貸方交易金額/貸款余額)平均值的分位數(shù)水平的原始轉(zhuǎn)換值;
103、x6為特征轉(zhuǎn)換步驟生成的企業(yè)當(dāng)前月(抵質(zhì)押擔(dān)保合同擔(dān)保金額之和/主合同額度之和)<10%的主合同個(gè)數(shù)的原始轉(zhuǎn)換值;
104、x7為特征轉(zhuǎn)換步驟生成的企業(yè)實(shí)控人過去3個(gè)月存款賬戶時(shí)點(diǎn)最小余額的自然對(duì)數(shù)轉(zhuǎn)換值。
105、19.根據(jù)項(xiàng)18所述的方法,其中,
106、在計(jì)算出信用違約概率之后,計(jì)算所述待預(yù)測(cè)樣本的信用評(píng)分的步驟為利用如下公式計(jì)算生成用于表征所述借款人的信用評(píng)分:
107、
108、
109、其中,p為計(jì)算信用違約概率模塊中生成的借款人的違約概率(p),a為54.2458;b為115.4156,round函數(shù)對(duì)計(jì)算分?jǐn)?shù)四舍五入后的取整值;最后將大于1000的分?jǐn)?shù)置為1000分,小于0分的分?jǐn)?shù)置為0分。
110、20.根據(jù)項(xiàng)1~9中任一項(xiàng)所述的方法,其中,
111、所述普惠信用預(yù)測(cè)數(shù)據(jù)選自:企業(yè)過去12個(gè)月(逾期金額/總放款金額)平均值、企業(yè)實(shí)控人個(gè)人貸款過去12個(gè)月利息還款金額>0的月數(shù)占比、企業(yè)實(shí)控人信用卡(過去三個(gè)月平均賬單余額/過去三個(gè)月平均額度)、對(duì)公存款當(dāng)前月(月均貸方交易金額-月均借方交易金額)、企業(yè)實(shí)控人近12個(gè)月所有信貸申請(qǐng)拒絕次數(shù)中的一個(gè)、兩個(gè)、三個(gè)、四個(gè)或五個(gè)。
112、21.根據(jù)項(xiàng)20所述的方法,其中,信用違約概率計(jì)算步驟包括:
113、將企業(yè)過去12個(gè)月(逾期金額/總放款金額)平均值、企業(yè)實(shí)控人個(gè)人貸款過去12個(gè)月利息還款金額>0的月數(shù)占比、企業(yè)實(shí)控人信用卡(過去三個(gè)月平均賬單余額/過去三個(gè)月平均額度)、對(duì)公存款當(dāng)前月(月均貸方交易金額-月均借方交易金額)、企業(yè)實(shí)控人近12個(gè)月所有信貸申請(qǐng)拒絕次數(shù)進(jìn)行特征轉(zhuǎn)換,
114、優(yōu)選對(duì)企業(yè)過去12個(gè)月(逾期金額/總放款金額)平均值采用連續(xù)型轉(zhuǎn)換方式;對(duì)企業(yè)實(shí)控人個(gè)人貸款過去12個(gè)月利息還款金額>0的月數(shù)占比采用連續(xù)型轉(zhuǎn)換方式;對(duì)企業(yè)實(shí)控人信用卡(過去三個(gè)月平均賬單余額/過去三個(gè)月平均額度)采用連續(xù)型轉(zhuǎn)換方式;對(duì)對(duì)公存款當(dāng)前月(月均貸方交易金額-月均借方交易金額)采用連續(xù)型轉(zhuǎn)換方式;對(duì)企業(yè)實(shí)控人近12個(gè)月所有信貸申請(qǐng)拒絕次數(shù)采用連續(xù)型轉(zhuǎn)換方式;
115、進(jìn)一步優(yōu)選,對(duì)企業(yè)過去12個(gè)月(逾期金額/總放款金額)平均值使用取立方根的計(jì)算方式;對(duì)企業(yè)實(shí)控人個(gè)人貸款過去12個(gè)月利息還款金額>0的月數(shù)占比使用原始值的計(jì)算方式;對(duì)企業(yè)實(shí)控人信用卡(過去三個(gè)月平均賬單余額/過去三個(gè)月平均額度)使用取平方的計(jì)算方式;對(duì)對(duì)公存款當(dāng)前月(月均貸方交易金額-月均借方交易金額)使用取對(duì)數(shù)的計(jì)算方式;對(duì)企業(yè)實(shí)控人近12個(gè)月所有信貸申請(qǐng)拒絕次數(shù)使用取平方根的計(jì)算方式。
116、22.根據(jù)項(xiàng)20所述的方法,其中,
117、將企業(yè)過去12個(gè)月(逾期金額/總放款金額)平均值、企業(yè)實(shí)控人個(gè)人貸款過去12個(gè)月利息還款金額>0的月數(shù)占比、企業(yè)實(shí)控人信用卡(過去三個(gè)月平均賬單余額/過去三個(gè)月平均額度)、對(duì)公存款當(dāng)前月(月均貸方交易金額-月均借方交易金額)、企業(yè)實(shí)控人近12個(gè)月所有信貸申請(qǐng)拒絕次數(shù)這五個(gè)特征轉(zhuǎn)換后的數(shù)值代入基于樣本普惠信用預(yù)測(cè)數(shù)據(jù)和信用違約概率采用邏輯回歸構(gòu)建的子模型來計(jì)算該待預(yù)測(cè)樣本的違約概率。
118、23.根據(jù)項(xiàng)22所述的方法,其中,
119、所述子模型如下公式3所示:
120、
121、其中,k為進(jìn)入的模型的特征數(shù)量,優(yōu)選k為5;
122、α為截距項(xiàng),數(shù)值范圍為(-2.32928,-2.45472),最優(yōu)為-2.392;
123、β1為企業(yè)過去12個(gè)月(逾期金額/總放款金額)平均值對(duì)應(yīng)系數(shù),數(shù)值范圍為(-0.60156,-0.65644),最優(yōu)為-0.629;
124、β2為企業(yè)實(shí)控人個(gè)人貸款過去12個(gè)月利息還款金額>0的月數(shù)占比對(duì)應(yīng)系數(shù),數(shù)值范圍為(-0.84424,-0.96576),最優(yōu)為-0.905;
125、β3為企業(yè)實(shí)控人信用卡(過去三個(gè)月平均賬單余額/過去三個(gè)月平均額度)對(duì)應(yīng)系數(shù),數(shù)值范圍為(-0.49976,-0.57424),最優(yōu)為-0.537;
126、β4為對(duì)公存款當(dāng)前月(月均貸方交易金額-月均借方交易金額)對(duì)應(yīng)系數(shù),數(shù)值范圍為(-0.05612,-0.06788),最優(yōu)為-0.062;
127、β5為企業(yè)實(shí)控人近12個(gè)月所有信貸申請(qǐng)拒絕次數(shù)對(duì)應(yīng)系數(shù),數(shù)值范圍為(-0.74304,-0.94296),最優(yōu)為-0.843;
128、x1為特征轉(zhuǎn)換步驟生成的企業(yè)過去12個(gè)月(逾期金額/總放款金額)平均值的立方根轉(zhuǎn)換值;
129、x2為特征轉(zhuǎn)換步驟生成的企業(yè)實(shí)控人個(gè)人貸款過去12個(gè)月利息還款金額>0的月數(shù)占比的原始轉(zhuǎn)換值;
130、x3為特征轉(zhuǎn)換步驟生成的企業(yè)實(shí)控人信用卡(過去三個(gè)月平均賬單余額/過去三個(gè)月平均額度)的平方轉(zhuǎn)換值;
131、x4為特征轉(zhuǎn)換步驟生成的對(duì)公存款當(dāng)前月(月均貸方交易金額-月均借方交易金額)的自然對(duì)數(shù)轉(zhuǎn)換值;
132、x5為特征轉(zhuǎn)換步驟生成的企業(yè)實(shí)控人近12個(gè)月所有信貸申請(qǐng)拒絕次數(shù)的平方根轉(zhuǎn)換值。
133、24.根據(jù)項(xiàng)23所述的方法,其中,
134、在計(jì)算出信用違約概率之后,計(jì)算所述待預(yù)測(cè)樣本的信用評(píng)分的步驟為利用如下公式計(jì)算生成用于表征所述借款人的信用評(píng)分:
135、
136、
137、其中,p為計(jì)算信用違約概率模塊中生成的借款人的違約概率(p),a為54.2458;b為115.4156,round函數(shù)對(duì)計(jì)算分?jǐn)?shù)四舍五入后的取整值;最后將大于1000的分?jǐn)?shù)置為1000分,小于0分的分?jǐn)?shù)置為0分。
138、25.一種計(jì)算普惠信用風(fēng)險(xiǎn)的裝置,其包括:
139、數(shù)據(jù)采集模塊,其用于獲取待預(yù)測(cè)樣本的普惠信用預(yù)測(cè)數(shù)據(jù);
140、對(duì)待預(yù)測(cè)樣本進(jìn)行分類的模塊,其用于基于決策樹方法將待預(yù)測(cè)樣本進(jìn)行分類以確定用于計(jì)算信用違約概率的子模型;
141、信用違約概率計(jì)算模塊,其用于將普惠信用預(yù)測(cè)數(shù)據(jù)代入信用違約概率子模型中以計(jì)算所述待預(yù)測(cè)樣本的信用違約概率。
142、26.根據(jù)項(xiàng)25所述的裝置,其中,所述裝置執(zhí)行項(xiàng)1~24中任一項(xiàng)所述的計(jì)算普惠信用風(fēng)險(xiǎn)的方法的步驟。
143、27.一種計(jì)算普惠信用風(fēng)險(xiǎn)的系統(tǒng),其特征在于,所述計(jì)算普惠信用風(fēng)險(xiǎn)的系統(tǒng)包括:存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的所述計(jì)算普惠信用風(fēng)險(xiǎn)方法的程序,所述計(jì)算普惠信用風(fēng)險(xiǎn)的程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如項(xiàng)1~24中任一項(xiàng)所述的計(jì)算普惠信用風(fēng)險(xiǎn)的方法的步驟。
144、28.一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算普惠信用風(fēng)險(xiǎn)方法的程序,所述計(jì)算普惠信用風(fēng)險(xiǎn)方法的程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如項(xiàng)1~24中任一項(xiàng)所述的計(jì)算普惠信用風(fēng)險(xiǎn)的方法的步驟。
145、29.一種構(gòu)建普惠信用風(fēng)險(xiǎn)預(yù)測(cè)模型的方法,其包括:
146、數(shù)據(jù)采集步驟,其獲取用于構(gòu)建模型的樣本的原始普惠信用預(yù)測(cè)數(shù)據(jù);
147、數(shù)據(jù)衍生步驟,其基于原始的普惠信用預(yù)測(cè)數(shù)據(jù)加工出衍生普惠信用預(yù)測(cè)數(shù)據(jù);
148、特征初篩步驟,其對(duì)包括原始普惠信用預(yù)測(cè)數(shù)據(jù)和衍生普惠信用預(yù)測(cè)數(shù)據(jù)的全部類別,即全部特征進(jìn)行初步篩選,以獲得初步篩選后的特征;
149、初篩數(shù)據(jù)轉(zhuǎn)換步驟,對(duì)初步篩選后的特征進(jìn)行轉(zhuǎn)換方式的判斷以確認(rèn)采用woe轉(zhuǎn)換方式、啞特征轉(zhuǎn)換方式以及連續(xù)型轉(zhuǎn)換方式中的一種來進(jìn)行特征轉(zhuǎn)換,并針對(duì)每一個(gè)初步篩選后的特征采用判斷的最優(yōu)方式來進(jìn)行特征轉(zhuǎn)換;
150、特征精篩步驟,對(duì)進(jìn)行特征轉(zhuǎn)換后的初步篩選的特征進(jìn)行深度篩選以獲得精篩后的特征;
151、信用違約概率建模步驟,針對(duì)精篩后的特征結(jié)合與信用違約之間的概率關(guān)系選擇邏輯回歸的方式進(jìn)行模型構(gòu)建,并確認(rèn)用于計(jì)算信用違約概率的方式;
152、其中數(shù)據(jù)采集步驟獲取的數(shù)據(jù)樣本為使用過企業(yè)信貸業(yè)務(wù)的客戶樣本。
153、30.根據(jù)項(xiàng)29所述的方法,其中,
154、在數(shù)據(jù)采集步驟中,獲取的用于構(gòu)建模型的樣本的原始普惠信用預(yù)測(cè)數(shù)據(jù)包括:
155、企業(yè)信貸類基礎(chǔ)數(shù)據(jù),其是基于樣本(企業(yè))用戶的貸款申請(qǐng)情況及使用行為的全部可獲取的數(shù)據(jù),
156、企業(yè)對(duì)公存款類基礎(chǔ)數(shù)據(jù),其是基于樣本(企業(yè))用戶在金融機(jī)構(gòu)辦理的人民幣存款的全部可獲取的數(shù)據(jù),
157、企業(yè)基本信息類基礎(chǔ)數(shù)據(jù),其是基于樣本(企業(yè))用戶本身的屬性,但與在金融機(jī)構(gòu)的行為不直接關(guān)聯(lián)的數(shù)據(jù),
158、企業(yè)主金融資產(chǎn)類基礎(chǔ)數(shù)據(jù),其是樣本(企業(yè)實(shí)控人)用戶在金融機(jī)構(gòu)與信用卡和貸款不相關(guān)的其他全部金融資產(chǎn)和金融交易類數(shù)據(jù),
159、企業(yè)主信貸類基礎(chǔ)數(shù)據(jù),其是基于樣本(企業(yè)實(shí)控人)用戶的貸款申請(qǐng)情況及使用行為的全部可獲取的數(shù)據(jù),
160、企業(yè)主基本信息類基礎(chǔ)數(shù)據(jù),其是基于樣本(企業(yè)實(shí)控人)用戶本身的屬性,但與在金融機(jī)構(gòu)的行為不直接關(guān)聯(lián)的數(shù)據(jù)。
161、31.根據(jù)項(xiàng)29所述的方法,其中,
162、在數(shù)據(jù)衍生步驟中,基于原始的普惠信用預(yù)測(cè)數(shù)據(jù)加工出衍生普惠信用預(yù)測(cè)數(shù)據(jù)是指基于時(shí)間維度、空間維度、頻率維度、統(tǒng)計(jì)信息維度對(duì)采集的原始的普惠信用預(yù)測(cè)數(shù)據(jù)進(jìn)行加工而得到的數(shù)據(jù);
163、優(yōu)選,衍生普惠信用預(yù)測(cè)數(shù)據(jù)包括但不限于:
164、基于樣本關(guān)系長度進(jìn)行加工得到的衍生普惠信用預(yù)測(cè)數(shù)據(jù),
165、基于時(shí)間間隔類變量進(jìn)行加工得到的衍生普惠信用預(yù)測(cè)數(shù)據(jù),
166、基于樣本行為頻率程度進(jìn)行加工得到的衍生普惠信用預(yù)測(cè)數(shù)據(jù),
167、基于樣本當(dāng)前時(shí)間點(diǎn)情況進(jìn)行加工得到的衍生普惠信用預(yù)測(cè)數(shù)據(jù),
168、基于樣本持續(xù)行為進(jìn)行加工得到的衍生普惠信用預(yù)測(cè)數(shù)據(jù),
169、基于統(tǒng)計(jì)信息維度對(duì)樣本數(shù)據(jù)進(jìn)行加工得到的衍生普惠信用預(yù)測(cè)數(shù)據(jù)。
170、32.根據(jù)項(xiàng)29~31中任一項(xiàng)所述的方法,其中,
171、特征初篩步驟包括如下步驟:
172、第一初篩步驟,基于用于構(gòu)建模型的樣本的每一特征的數(shù)據(jù)缺失情況來對(duì)特征進(jìn)行篩選,
173、第二初篩步驟,基于某一特征樣本的單一值過高情況來對(duì)特征進(jìn)行篩選,
174、第三初篩步驟,計(jì)算每一個(gè)特征的信息iv值對(duì)特征進(jìn)行初步篩選;
175、第一初篩步驟、第二初篩步驟和第三初篩步驟的順序可以為任意順序,
176、第四初篩步驟,對(duì)經(jīng)過第一~第三初步篩選后的特征采用逐步判別算法進(jìn)行特征的初步篩選;
177、第五初篩步驟,對(duì)經(jīng)過第四初篩步驟之后的特征基于各個(gè)特征本身的風(fēng)險(xiǎn)特性與用于模型構(gòu)建的樣本實(shí)際的真實(shí)結(jié)果的吻合情況來進(jìn)行特征的初步篩選。
178、33.根據(jù)項(xiàng)29~32中任一項(xiàng)所述的方法,其中,還包括:
179、樣本選定步驟,其用于在數(shù)據(jù)采集步驟之前對(duì)全部用戶進(jìn)行篩選并獲取用于模型構(gòu)建的使用了企業(yè)信貸業(yè)務(wù)的樣本,
180、優(yōu)選,樣本選定步驟包括基于決策樹對(duì)樣本全部用戶進(jìn)行分類,分類依據(jù)包括但不限于:
181、某一用戶是否是持有對(duì)公存款賬戶的客戶;
182、某一用戶是否是企業(yè)信貸發(fā)生逾期的客戶。
183、34.根據(jù)項(xiàng)29~33中任一項(xiàng)所述的方法,其中,在初篩數(shù)據(jù)轉(zhuǎn)換步驟中,初步篩選后的特征進(jìn)行轉(zhuǎn)換方式的判斷,是基于經(jīng)過初步篩選特征的集中度和數(shù)據(jù)類型來進(jìn)行判斷的。
184、35.根據(jù)項(xiàng)34所述的方法,其中,
185、初篩數(shù)據(jù)轉(zhuǎn)換步驟基于集中度和數(shù)據(jù)類型的判斷包括如下步驟:
186、針對(duì)每一特征的數(shù)據(jù)類型進(jìn)行分類將每一特征分類成字符型變量和數(shù)值型變量,
187、對(duì)字符型變量采用啞特征轉(zhuǎn)換方式進(jìn)行初篩數(shù)據(jù)轉(zhuǎn)換,
188、對(duì)數(shù)值型變量進(jìn)一步進(jìn)行分類的過程包括如下子步驟:
189、如果該數(shù)值型變量的取值少于n個(gè),采用woe的轉(zhuǎn)換方式進(jìn)行初篩數(shù)據(jù)轉(zhuǎn)換,
190、如果該數(shù)值型變量的取值在n個(gè)以上時(shí),進(jìn)一步判斷如果轉(zhuǎn)換為連續(xù)型變量取值較多且單一取值的集中度大于m%,則采用woe的轉(zhuǎn)換方式,如果單一取值的集中度小于等于m%,則采用連續(xù)型的轉(zhuǎn)換方式,
191、優(yōu)選,n和m均為正整數(shù),其中n=5~10,m=90~99。
192、36.根據(jù)項(xiàng)35所述的方法,其中,還包括:
193、針對(duì)確認(rèn)采用連續(xù)型的轉(zhuǎn)換方式的特征基于該特征在不同連續(xù)型轉(zhuǎn)換方式下與信用違約的相關(guān)性高低來選擇最優(yōu)轉(zhuǎn)換方法來進(jìn)行該特征的連續(xù)型特征轉(zhuǎn)換,
194、優(yōu)選采用直接選取原始值、計(jì)算原始數(shù)據(jù)的平方、計(jì)算原始數(shù)據(jù)平方根、計(jì)算原始數(shù)據(jù)立方根或計(jì)算原始數(shù)據(jù)自然對(duì)數(shù)的方式進(jìn)行連續(xù)型特征轉(zhuǎn)換。
195、37.根據(jù)項(xiàng)29~36中任一項(xiàng)所述的方法,其中,特征精篩步驟包括:
196、第一精篩步驟,基于逐步回歸算法,基于f檢驗(yàn)與t檢驗(yàn)對(duì)特征的顯著性進(jìn)行特征的篩選,
197、第二精篩步驟,基于每個(gè)特征計(jì)算方差膨脹因子并剔除方差膨脹因子較高的特征來進(jìn)行特征的篩選,
198、第三精篩步驟,基于邏輯回歸對(duì)經(jīng)過第一精篩步驟和第二精篩步驟之后的特征,分析特征系數(shù)是否符合針對(duì)信用違約的預(yù)測(cè)結(jié)果的趨勢(shì)以進(jìn)一步進(jìn)行特征篩選。
199、38.根據(jù)項(xiàng)29~37中任一項(xiàng)所述的方法,其中,信用違約概率建模步驟將經(jīng)過特征精篩步驟篩選的特征代入sigmoid函數(shù)進(jìn)行邏輯回歸計(jì)算信用違約概率的模型。
200、39.一種構(gòu)建普惠信用風(fēng)險(xiǎn)預(yù)測(cè)模型的裝置,其特征在于,所述裝置包括:
201、數(shù)據(jù)采集模塊,其用于獲取用于構(gòu)建模型的樣本的原始普惠信用預(yù)測(cè)數(shù)據(jù);
202、數(shù)據(jù)衍生模塊,其用于基于原始的普惠信用預(yù)測(cè)數(shù)據(jù)加工出衍生普惠信用預(yù)測(cè)數(shù)據(jù);
203、特征初篩模塊,其用于對(duì)包括原始普惠信用預(yù)測(cè)數(shù)據(jù)和衍生普惠信用預(yù)測(cè)數(shù)據(jù)的全部類別,即全部特征進(jìn)行初步篩選,以獲得初步篩選后的特征;
204、初篩數(shù)據(jù)轉(zhuǎn)換模塊,其用于對(duì)初步篩選后的特征進(jìn)行轉(zhuǎn)換方式的判斷以確認(rèn)采用woe轉(zhuǎn)換方式、啞特征轉(zhuǎn)換方式以及連續(xù)型轉(zhuǎn)換方式中的一種來進(jìn)行特征轉(zhuǎn)換,并針對(duì)每一個(gè)初步篩選后的特征采用判斷的最優(yōu)方式來進(jìn)行特征轉(zhuǎn)換;
205、特征精篩模塊,其用于對(duì)進(jìn)行特征轉(zhuǎn)換后的初步篩選的特征進(jìn)行深度篩選以獲得精篩后的特征;
206、信用違約概率建模模塊,其用于針對(duì)精篩后的特征結(jié)合與信用違約之間的概率關(guān)系選擇邏輯回歸的方式進(jìn)行模型構(gòu)建,并確認(rèn)用于計(jì)算信用違約概率的方式,
207、其中數(shù)據(jù)采集模塊獲取的數(shù)據(jù)樣本為使用過企業(yè)信貸業(yè)務(wù)的客戶樣本。
208、40.根據(jù)項(xiàng)39所述的裝置,其中,所述裝置執(zhí)行項(xiàng)29~38中任一項(xiàng)所述的構(gòu)建普惠信用風(fēng)險(xiǎn)預(yù)測(cè)模型方法的步驟。
209、41.一種構(gòu)建普惠信用風(fēng)險(xiǎn)預(yù)測(cè)模型的系統(tǒng),其特征在于,所述系統(tǒng)包括:存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的構(gòu)建普惠信用風(fēng)險(xiǎn)預(yù)測(cè)模型方法的程序,所述構(gòu)建普惠信用風(fēng)險(xiǎn)預(yù)測(cè)模型方法的程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如項(xiàng)29~38中任一項(xiàng)所述的構(gòu)建普惠信用風(fēng)險(xiǎn)預(yù)測(cè)模型方法的步驟。
210、發(fā)明效果
211、本技術(shù)用于構(gòu)建普惠信用風(fēng)險(xiǎn)預(yù)測(cè)模型的方法和系統(tǒng)在構(gòu)建模型時(shí)結(jié)合了某大型金融機(jī)構(gòu)的大量樣本,并從中篩選已申請(qǐng)企業(yè)信貸業(yè)務(wù)的客戶數(shù)據(jù),并深入地對(duì)樣本獲得的原始數(shù)據(jù)進(jìn)行加工和衍生,利用高級(jí)統(tǒng)計(jì)分析方法和可解釋的機(jī)器學(xué)習(xí)技術(shù),根據(jù)原始數(shù)據(jù)和衍生數(shù)據(jù)的自身特點(diǎn)以及數(shù)據(jù)中包含的市場(chǎng)上難以獲取的強(qiáng)金融屬性信息,構(gòu)建的普惠信用類通用評(píng)分模型。
212、此外本技術(shù)在構(gòu)建模型之初先利用決策樹的方法對(duì)樣本進(jìn)行最為合理的分類并基于分類的樣本構(gòu)建子分類模型。結(jié)合決策樹構(gòu)建金融模型可以有效地將樣本按照可執(zhí)行的類別進(jìn)行分類,從而更好覆蓋不同客群的信用風(fēng)險(xiǎn)特點(diǎn),避免將全部樣本用于構(gòu)建模型導(dǎo)致模型缺乏子群代表性的問題。
213、進(jìn)一步在本技術(shù)構(gòu)建風(fēng)險(xiǎn)預(yù)測(cè)模型時(shí)由于采用了逐步判別分析方法進(jìn)行模型特征的初步篩選充分提高了模型開發(fā)的整體效率。逐步判別的方法能夠更好地甄選出相同維度下更為重要的特征變量,大幅度減少下一步驟中需要開發(fā)人員根據(jù)變量趨勢(shì)逐一判斷篩選的工作量,在不影響整體模型效果的前提下充分提高模型開發(fā)效率,使初篩變量時(shí)更加高效和精準(zhǔn)。
214、本技術(shù)在模型構(gòu)建時(shí)開創(chuàng)性地將連續(xù)型轉(zhuǎn)換、woe轉(zhuǎn)換、啞特征轉(zhuǎn)換三種方式結(jié)合,對(duì)經(jīng)過了初始篩選地部分特征進(jìn)行再加工,結(jié)合了三種轉(zhuǎn)換方式的優(yōu)缺點(diǎn),并且獨(dú)創(chuàng)性地設(shè)計(jì)了轉(zhuǎn)換判斷方法,根據(jù)特征數(shù)據(jù)屬性、缺失率、集中度的等參數(shù)輔以業(yè)務(wù)邏輯上的判斷,選擇最優(yōu)的特征轉(zhuǎn)換方式,通過這樣的模型構(gòu)建方法能夠規(guī)避以完全woe變量構(gòu)建模型時(shí)存在的過擬合、以完全連續(xù)型變量構(gòu)建模型時(shí)存在的無法很好適配分類型變量的這些技術(shù)缺點(diǎn)。
215、此外,用本技術(shù)構(gòu)建的計(jì)算信用風(fēng)險(xiǎn)概率或?qū)π庞蔑L(fēng)險(xiǎn)進(jìn)行評(píng)分的方法和系統(tǒng),即scoreomega模型(scoreomega系列評(píng)分卡)(包括omega-1~omega-3子模型或子評(píng)分卡),由于其模型構(gòu)建時(shí)首先基于決策樹進(jìn)行拆分,因此信用風(fēng)險(xiǎn)進(jìn)行計(jì)算初始先對(duì)客戶樣本進(jìn)行有效地決策分類選擇其最為適合的子模型或子評(píng)分卡進(jìn)行處理,同時(shí)由于子模型或子評(píng)分卡中使用的模型構(gòu)建方法為本技術(shù)所述方法,在構(gòu)建過程中同樣的規(guī)避了以完全woe變量構(gòu)建模型時(shí)存在的過擬合、以完全連續(xù)型變量構(gòu)建模型時(shí)存在的無法很好適配分類型變量的這些技術(shù)缺點(diǎn),因此其在預(yù)測(cè)信用風(fēng)險(xiǎn)方面有著顯著優(yōu)于現(xiàn)有模型的效果。除此之外,由于本技術(shù)針對(duì)的是普惠信貸業(yè)務(wù),樣本數(shù)據(jù)是從海量銀行數(shù)據(jù)中篩選出已申請(qǐng)企業(yè)信貸業(yè)務(wù)的客戶數(shù)據(jù),涵蓋了普惠信貸業(yè)務(wù)的預(yù)測(cè)類變量,因此通過特定的業(yè)務(wù)場(chǎng)景數(shù)據(jù)利用統(tǒng)計(jì)學(xué)原理提煉出的風(fēng)險(xiǎn)規(guī)律,在針對(duì)普惠信貸業(yè)務(wù)的信用風(fēng)險(xiǎn)方面有著非常顯著的適配性和區(qū)分性。