本發(fā)明涉及風(fēng)險(xiǎn)評(píng)估預(yù)測(cè),尤其涉及一種基于神經(jīng)網(wǎng)絡(luò)的尿失禁風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)模型的構(gòu)建方法。
背景技術(shù):
1、機(jī)器學(xué)習(xí)是ai的一部分,越來(lái)越多地用于診斷、并發(fā)癥、預(yù)后和復(fù)發(fā)預(yù)測(cè)。與傳統(tǒng)的統(tǒng)計(jì)模型相比,機(jī)器學(xué)習(xí)可以主動(dòng)學(xué)習(xí)數(shù)據(jù)之間的復(fù)雜關(guān)系,克服非線性的局限性,保持高維數(shù)據(jù)集的穩(wěn)定性,在分析非結(jié)構(gòu)化數(shù)據(jù)(如圖片和其他類(lèi)型的數(shù)據(jù))方面具有獨(dú)特的優(yōu)勢(shì),非常適合協(xié)助臨床預(yù)測(cè)治療結(jié)果或疾病進(jìn)展,但這種潛力在很大程度上仍未開(kāi)發(fā)。
2、女性尿失禁的發(fā)病機(jī)制涉及多個(gè)因素,如年齡、體重、生育史、盆底肌肉功能等,需要大量的數(shù)據(jù)來(lái)建立準(zhǔn)確的預(yù)測(cè)模型。同時(shí),數(shù)據(jù)的質(zhì)量也會(huì)影響預(yù)測(cè)模型的準(zhǔn)確性和可靠性。因此尋求一種更強(qiáng)大的算法模型顯得尤為必要。目前已經(jīng)建立了多種女性尿失禁的預(yù)測(cè)模型,但這些模型在中國(guó)人群中具有較差的區(qū)分度和校準(zhǔn)度。
3、因此,針對(duì)上述技術(shù)缺陷,本發(fā)明提出了一種基于神經(jīng)網(wǎng)絡(luò)的尿失禁風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)模型的構(gòu)建方法。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是提供一種基于神經(jīng)網(wǎng)絡(luò)的尿失禁風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)模型的構(gòu)建方法,解決相關(guān)技術(shù)中女性尿失禁發(fā)病預(yù)測(cè)模型對(duì)于不平衡數(shù)據(jù)處理困難、泛化能力差、無(wú)法有效處理醫(yī)療數(shù)據(jù)的高維稀疏特征、可解釋性差等因素導(dǎo)致預(yù)測(cè)效果不佳的技術(shù)問(wèn)題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于神經(jīng)網(wǎng)絡(luò)的尿失禁風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)模型的構(gòu)建方法,包括以下步驟:
3、步驟s1、采集關(guān)于尿失禁患者的數(shù)據(jù)信息;
4、步驟s2、對(duì)步驟s1所采集的數(shù)據(jù)信息進(jìn)行數(shù)據(jù)預(yù)處理,并建立風(fēng)險(xiǎn)評(píng)估數(shù)據(jù)集;
5、步驟s3、基于風(fēng)險(xiǎn)評(píng)估數(shù)據(jù)集,構(gòu)建尿失禁風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)模型;
6、步驟s4、對(duì)所構(gòu)建的尿失禁風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)模型進(jìn)行優(yōu)化訓(xùn)練;
7、步驟s5、基于優(yōu)化好的尿失禁風(fēng)險(xiǎn)評(píng)估模型,對(duì)測(cè)試集進(jìn)行風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)。
8、優(yōu)選的,在步驟s1中,尿失禁患者的數(shù)據(jù)信息來(lái)源于醫(yī)院的電子病歷系統(tǒng)、患者問(wèn)卷調(diào)查、臨床研究;
9、尿失禁患者的數(shù)據(jù)信息包括:患者基本信息、相關(guān)環(huán)境危險(xiǎn)因素、婦科疾病和其他疾病史。
10、優(yōu)選的,在步驟s2中,數(shù)據(jù)預(yù)處理包括:數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)歸一化;
11、其中,數(shù)據(jù)清洗包括填補(bǔ)缺失值,修正錯(cuò)誤數(shù)據(jù),刪除重復(fù)記錄;數(shù)據(jù)轉(zhuǎn)換是使用獨(dú)熱編碼將非數(shù)值數(shù)據(jù)轉(zhuǎn)換為數(shù)值形式;數(shù)據(jù)歸一化是對(duì)數(shù)值型數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化或歸一化處理,以消除量綱影響;
12、基于預(yù)處理后的數(shù)據(jù)信息,構(gòu)建風(fēng)險(xiǎn)評(píng)估數(shù)據(jù)集。
13、優(yōu)選的,在步驟s3中,基于風(fēng)險(xiǎn)評(píng)估數(shù)據(jù)集,構(gòu)建尿失禁風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)模型,具體過(guò)程如下:
14、步驟s31、將風(fēng)險(xiǎn)評(píng)估數(shù)據(jù)集分成訓(xùn)練集和測(cè)試集,并設(shè)置訓(xùn)練集和測(cè)試集的比例為8:2,構(gòu)建尿失禁風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)模型;
15、其中,尿失禁風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)模型即為神經(jīng)網(wǎng)絡(luò)模型,具體包括輸入層、隱藏層和輸出層;輸入層負(fù)責(zé)接收風(fēng)險(xiǎn)評(píng)估數(shù)據(jù)集中的數(shù)據(jù),隱藏層進(jìn)行數(shù)據(jù)處理和特征提取,輸出層輸出評(píng)估報(bào)告;
16、步驟s32、更新神經(jīng)網(wǎng)絡(luò)模型參數(shù)。
17、優(yōu)選的,在步驟s32中,更新神經(jīng)網(wǎng)絡(luò)模型參數(shù),具體過(guò)程如下:
18、步驟s321、計(jì)算一階矩和二階矩,如下所示:
19、
20、mt=β1mt-1+(1-β1)gt;
21、
22、其中,gt是第t次更新時(shí)損失函數(shù)對(duì)神經(jīng)網(wǎng)絡(luò)參數(shù)的梯度;是參數(shù)θ上的梯度;j是損失函數(shù);θt-1是第t-1次更新時(shí)的神經(jīng)網(wǎng)絡(luò)參數(shù);mt和mt-1分別是第t次和第t-1次更新時(shí)的一階矩;vt和vt-1分別是第t次和第t-1次更新時(shí)的二階矩;β1和β2是一階矩衰減率和二階矩衰減率;是gt的平方,t是神經(jīng)網(wǎng)絡(luò)參數(shù)的更新索引;
23、步驟s322、偏置校正如下所示:
24、
25、其中,和分別是第t次更新時(shí)偏置校正后的一階矩和二階矩;和分別是β1和β2的t次冪;
26、步驟s323、梯度修剪,設(shè)計(jì)自適應(yīng)縮放因子,基于自適應(yīng)縮放因子修剪神經(jīng)網(wǎng)絡(luò)參數(shù)的梯度;
27、計(jì)算總梯度范數(shù),如下所示:
28、
29、其中,sft是第t次更新時(shí)的總梯度范數(shù);d是參數(shù)索引,d是神經(jīng)網(wǎng)絡(luò)參數(shù)的總數(shù),是第j次更新時(shí)第d個(gè)參數(shù)的梯度,是l2范數(shù)的平方;
30、計(jì)算歷史梯度基準(zhǔn),歷史梯度基準(zhǔn)包括歷史梯度均值和歷史梯度方差,如下所示:
31、
32、其中,lzt和lct分別是第t次更新時(shí)的歷史梯度均值和歷史梯度方差;gj是第j次更新時(shí)損失函數(shù)對(duì)神經(jīng)網(wǎng)絡(luò)參數(shù)的梯度;
33、設(shè)計(jì)自適應(yīng)縮放因子,如下所示:
34、
35、其中,zst是第t次更新時(shí)的自適應(yīng)縮放因子;gnmax是最大梯度范數(shù);γ是控制因子;
36、應(yīng)用修剪,如下所示:
37、
38、其中,是第j次更新時(shí)第d個(gè)參數(shù)修剪后的梯度;
39、步驟s325、設(shè)計(jì)自適應(yīng)學(xué)習(xí)率,根據(jù)時(shí)間和設(shè)定的參數(shù)動(dòng)態(tài)調(diào)整學(xué)習(xí)率,學(xué)習(xí)率在訓(xùn)練過(guò)程中周期性地變化,如下所示:
40、
41、其中,xlt是第t次更新時(shí)的自適應(yīng)學(xué)習(xí)率;xl0、xlfd和xlzq分別是學(xué)習(xí)率的初始值、學(xué)習(xí)率變化的周期長(zhǎng)度和學(xué)習(xí)率變化的幅度;
42、步驟s325、神經(jīng)網(wǎng)絡(luò)模型參數(shù)更新,基于自適應(yīng)學(xué)習(xí)率和插值因子進(jìn)行神經(jīng)網(wǎng)絡(luò)參數(shù)的更新,如下所示:
43、
44、其中,θt是第t次更新時(shí)的神經(jīng)網(wǎng)絡(luò)參數(shù);σ是插值因子,∈是平滑項(xiàng)。
45、優(yōu)選的,在步驟s4中,對(duì)所構(gòu)建的尿失禁風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)模型進(jìn)行優(yōu)化訓(xùn)練,具體過(guò)程如下:
46、初始化個(gè)體位置,對(duì)尿失禁風(fēng)險(xiǎn)評(píng)估模型中的一階矩衰減率β1、二階矩衰減率β2、最大梯度范數(shù)gnmax、控制因子γ、學(xué)習(xí)率的初始值xl0、學(xué)習(xí)率變化的周期長(zhǎng)度xlfd、學(xué)習(xí)率變化的幅度xlzq和插值因子σ建立搜索空間,在搜索空間內(nèi)隨機(jī)初始化a個(gè)個(gè)體位置,用個(gè)體位置作為尿失禁風(fēng)險(xiǎn)評(píng)估模型參數(shù)的代表,將基于模型參數(shù)建立的尿失禁風(fēng)險(xiǎn)評(píng)估模型的損失函數(shù)作為個(gè)體的適應(yīng)度值。
47、優(yōu)選的,設(shè)計(jì)參考位置,包括以下內(nèi)容:
48、步驟s41、計(jì)算局部搜索比例值,如下所示:
49、
50、其中,δh(u)是第u次迭代時(shí)的局部搜索比例值;xbest(u)是第u次迭代時(shí)全局最優(yōu)個(gè)體的位置;是第u次迭代時(shí)所有個(gè)體的平均位置;u是當(dāng)前迭代次數(shù);i是個(gè)體索引;rand(·)是隨機(jī)數(shù)生成函數(shù);xi(u)是第u次迭代時(shí)第i個(gè)個(gè)體的位置;
51、步驟s42、計(jì)算本地位置修正值,如下所示:
52、
53、其中,wi(u)是第u次迭代時(shí)第i個(gè)個(gè)體的本地位置修正值;xworst(u)是第u次迭代時(shí)全局最差個(gè)體的位置;
54、步驟s43、計(jì)算查詢(xún)值,基于本地位置修正值和局部搜索比例值為每個(gè)個(gè)體生成兩個(gè)不同的查詢(xún)值,如下所示:
55、
56、其中,和分別是第u次迭代時(shí)第i個(gè)個(gè)體的第一查詢(xún)值和第二查詢(xún)值;
57、步驟s44、計(jì)算兩個(gè)參考位置,基于查詢(xún)值為每個(gè)個(gè)體生成兩個(gè)不同的參考位置;引導(dǎo)個(gè)體向更有潛力的方向移動(dòng),如下所示:
58、
59、其中,和分別是第u次迭代時(shí)第i個(gè)個(gè)體的第一參考個(gè)體和第二參考位置;xr1(u)是第u次迭代時(shí)第一隨機(jī)個(gè)體的位置;
60、步驟s45、計(jì)算擾動(dòng)位置,基于levy飛行策略和隨機(jī)個(gè)體為每個(gè)個(gè)體生成一個(gè)擾動(dòng)位置,如下所示:
61、
62、其中,oi(u)是第u次迭代時(shí)第i個(gè)個(gè)體的擾動(dòng)位置;a是基于levy飛行策略生成的隨機(jī)數(shù);b和p取自正態(tài)分布;b~n(0,λ2),p~n(0,λ2);λ是形狀參數(shù);γ(·)是伽瑪函數(shù);ε是正態(tài)分布的標(biāo)準(zhǔn)差;xr2(u)和xr3(u)分別是第u次迭代時(shí)第二隨機(jī)個(gè)體和第三隨機(jī)個(gè)體的位置;是向上取整函數(shù);
63、步驟s46、個(gè)體位置更新,基于參考位置和擾動(dòng)位置進(jìn)行所有個(gè)體的位置更新,如下所示:
64、
65、其中,xi(u+1)是第u+1次迭代時(shí)第i個(gè)個(gè)體的位置;s1和s2分別是(0,1)范圍內(nèi)的第一隨機(jī)值和第二隨機(jī)值;
66、步驟s47、最優(yōu)參數(shù)確定,預(yù)先設(shè)定適應(yīng)度閾值,更新個(gè)體的適應(yīng)度值和全局最優(yōu)個(gè)體,當(dāng)全局最優(yōu)個(gè)體對(duì)應(yīng)的適應(yīng)度值低于適應(yīng)度閾值時(shí),全局最優(yōu)個(gè)體位置對(duì)應(yīng)的模型參數(shù)為最優(yōu)參數(shù),基于最優(yōu)參數(shù)構(gòu)建尿失禁風(fēng)險(xiǎn)評(píng)估模型;否則,若達(dá)到最大迭代次數(shù),則重新初始化個(gè)體位置;否則,將迭代次數(shù)加1并重新計(jì)算參考位置和擾動(dòng)位置,并進(jìn)行個(gè)體位置更新。
67、優(yōu)選的,在步驟s5中,基于優(yōu)化好的尿失禁風(fēng)險(xiǎn)評(píng)估模型,對(duì)測(cè)試集進(jìn)行風(fēng)險(xiǎn)評(píng)估預(yù)測(cè),具體過(guò)程如下:
68、首先,將測(cè)試集數(shù)據(jù)輸入尿失禁風(fēng)險(xiǎn)評(píng)估模型;其次,預(yù)先設(shè)置風(fēng)險(xiǎn)評(píng)估閾值,當(dāng)模型輸出的風(fēng)險(xiǎn)評(píng)估等級(jí)高于風(fēng)險(xiǎn)評(píng)估閾值時(shí),智能芯片發(fā)送預(yù)警信息;最后,將風(fēng)險(xiǎn)評(píng)估報(bào)告進(jìn)行輸出,用于后續(xù)診斷輔助。
69、一種基于神經(jīng)網(wǎng)絡(luò)的尿失禁風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)模型:包括數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊、模型構(gòu)建模塊、模型優(yōu)化模塊和模型預(yù)測(cè)模塊;
70、其中,數(shù)據(jù)采集模塊用于采集尿失禁患者的數(shù)據(jù)信息;數(shù)據(jù)預(yù)處理模塊用于對(duì)采集的數(shù)據(jù)信息進(jìn)行數(shù)據(jù)預(yù)處理,并建立風(fēng)險(xiǎn)評(píng)估數(shù)據(jù)集;模型構(gòu)建模塊用于構(gòu)建尿失禁風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)模型;模型優(yōu)化模塊用于對(duì)尿失禁風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)模型進(jìn)行優(yōu)化訓(xùn)練;模型預(yù)測(cè)模塊用于對(duì)測(cè)試者進(jìn)行尿失禁風(fēng)險(xiǎn)評(píng)估,并輸出風(fēng)險(xiǎn)評(píng)估結(jié)果。
71、因此,本發(fā)明采用上述一種基于神經(jīng)網(wǎng)絡(luò)的尿失禁風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)模型的構(gòu)建方法,有益效果如下:
72、(1)基于總梯度范數(shù)和歷史梯度基準(zhǔn)設(shè)計(jì)自適應(yīng)縮放因子,使用自適應(yīng)縮放因子修剪神經(jīng)網(wǎng)絡(luò)參數(shù)的梯度,設(shè)計(jì)自適應(yīng)學(xué)習(xí)率,并結(jié)合插值因子進(jìn)行神經(jīng)網(wǎng)絡(luò)參數(shù)的更新,避免了梯度不穩(wěn)定和梯度爆炸導(dǎo)致的訓(xùn)練異常,使學(xué)習(xí)率能更好地適應(yīng)不同訓(xùn)練階段,有助于更好地處理復(fù)雜數(shù)據(jù),提升了尿失禁風(fēng)險(xiǎn)評(píng)估模型的準(zhǔn)確性和可靠性,提高用戶(hù)的生活質(zhì)量和便利性;
73、(2)基于本地位置修正值和局部搜索比例值生成查詢(xún)值和參考位置,基于levy飛行策略和隨機(jī)個(gè)體生成擾動(dòng)位置,并基于參考位置和擾動(dòng)位置進(jìn)行所有個(gè)體的位置更新,確定最優(yōu)參數(shù),提高了模型參數(shù)優(yōu)化的效率和準(zhǔn)確性,增強(qiáng)了模型的適應(yīng)性和靈活性,更好地適應(yīng)不同患者的個(gè)體差異,提高了模型的泛化能力,提升了尿失禁風(fēng)險(xiǎn)評(píng)估模型的性能和可靠性,有助于更準(zhǔn)確地預(yù)警尿失禁風(fēng)險(xiǎn)。
74、下面通過(guò)附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。