本發(fā)明涉及機器學(xué)習(xí),尤其涉及一種預(yù)測效果好的基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法。
背景技術(shù):
1、心血管系統(tǒng)是人體中負(fù)責(zé)輸送血液的封閉管道系統(tǒng),由心臟、動脈、靜脈和毛細(xì)血管組成。心臟是這個系統(tǒng)的核心,它像一個泵一樣,通過收縮和舒張來推動血液流動。心血管系統(tǒng)的主要功能是將氧氣和營養(yǎng)物質(zhì)輸送到全身的細(xì)胞,并帶走細(xì)胞代謝產(chǎn)生的廢物。血壓和心率是反映心血管系統(tǒng)狀態(tài)的重要指標(biāo),兩者是心血管系統(tǒng)健康的“窗口”,通過監(jiān)測和調(diào)控血壓及心率,可以有效預(yù)防和管理心血管疾病,同時延緩心血管系統(tǒng)的生理衰老。心血管生理年齡是基于心血管系統(tǒng)的功能狀態(tài)和健康指標(biāo),評估個體心血管系統(tǒng)在生理上的衰老程度的一個量化指標(biāo)。它反映了心血管系統(tǒng)的實際功能年齡,可用于衡量心血管健康狀態(tài)和衰老速度。參考tian,y.e等2023年發(fā)表在《自然醫(yī)學(xué)》上的文章,心血管疾病患者的生理年齡要顯著高于健康個體,不良的生活習(xí)慣(吸煙,飲酒,熬夜等)也與更高的生理年齡相關(guān)。
2、現(xiàn)有的技術(shù)方案大多使用全部的體檢指標(biāo)進行機器學(xué)習(xí)模型的構(gòu)建,未有將相關(guān)指標(biāo)劃分到對應(yīng)的器官或者系統(tǒng)中,但個體不同的器官或系統(tǒng)往往具有不同的生理年齡指數(shù),單個整體模型難以反映個體不同器官或系統(tǒng)的生理年齡,并且有些指標(biāo)男女之間差別很大,單個模型難以反映不同性別個體,不同器官或系統(tǒng)的生理年齡。
3、因此,有必要提出一種改進,以克服現(xiàn)有技術(shù)缺陷。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的是解決現(xiàn)有技術(shù)中的問題,提供一種預(yù)測效果好的基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法。
2、本發(fā)明的技術(shù)方案是:
3、一種基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法,包括以下步驟:s1、采集健康體檢數(shù)據(jù):所述健康體檢數(shù)據(jù)包括心血管數(shù)據(jù)、性別及日歷年齡;s2、將健康體檢數(shù)據(jù)根據(jù)性別分為男性數(shù)據(jù)集和女性數(shù)據(jù)集;s3、分別將男性數(shù)據(jù)集和女性數(shù)據(jù)集中按比例劃分為訓(xùn)練集和測試集;s4、對訓(xùn)練集的數(shù)據(jù)進行均一化處理:分別對男性數(shù)據(jù)集和女性數(shù)據(jù)集中的訓(xùn)練集內(nèi)的數(shù)據(jù)進行均一化處理;s5、建模并進行模型訓(xùn)練:分別對男性數(shù)據(jù)集和女性數(shù)據(jù)集中的訓(xùn)練集的數(shù)據(jù)進行建模,并進行網(wǎng)格搜索的方式進行交叉驗證超參數(shù)優(yōu)化;s6、進行心血管系統(tǒng)生理年齡預(yù)測校正:根據(jù)回歸趨中效應(yīng)進行年齡校正,將日歷年齡作為自變量,原始年齡差作為因變量進行線性回歸;原始年齡差=斜率*日歷年齡+截距+殘差;其中,殘差為校正之后的年齡差,即從原始的年齡差中去除與日歷年齡相關(guān)的部分,公式為:校正年齡差=原始年齡差–(斜率*原始年齡差+截距);其中,男性斜率為-0.9465,男性截距為48.16,女性斜率為-0.8059,女性截距為39.21。
4、作為一種優(yōu)選的技術(shù)方案,步驟s6之后還包括以下步驟:s7、計算衰老指數(shù):衰老指數(shù)計算公式為:衰老指數(shù)=校正年齡差/日歷年齡。
5、作為一種優(yōu)選的技術(shù)方案,步驟s1中心血管數(shù)據(jù)包括三個原始測量指標(biāo);所述原始測量指標(biāo)包括舒張壓、收縮壓及心率。
6、作為一種進一步優(yōu)選的技術(shù)方案,步驟s1中心血管數(shù)據(jù)還包括三個衍生指標(biāo):平均血壓、脈壓及心率血壓乘積;平均血壓=1/3*收縮壓+2/3*舒張壓;脈壓=收縮壓-舒張壓;心率血壓乘積=心率*收縮壓。
7、作為一種優(yōu)選的技術(shù)方案,步驟s3中訓(xùn)練集和測試集數(shù)據(jù)量的比值為4:1。
8、作為一種優(yōu)選的技術(shù)方案,步驟s4對訓(xùn)練集的數(shù)據(jù)進行均一化處理中,均一化的方式選擇z-score標(biāo)準(zhǔn)化,公式為z=(x-u)/σ,其中x是原始數(shù)據(jù)點,u是數(shù)據(jù)集的均值,σ是數(shù)據(jù)集的標(biāo)準(zhǔn),z是標(biāo)準(zhǔn)化后的數(shù)值。
9、作為一種優(yōu)選的技術(shù)方案,步驟s5中分別對男性數(shù)據(jù)集和女性數(shù)據(jù)集中的訓(xùn)練集的數(shù)據(jù)進行建模,并進行網(wǎng)格搜索的方式進行交叉驗證超參數(shù)優(yōu)化具體包括以下步驟:s51、創(chuàng)建建模;s52、定義參數(shù)網(wǎng)格:所述參數(shù)網(wǎng)格包括懲罰系數(shù)、核函數(shù)、核函數(shù)系數(shù)及松弛變量;s53、進行超參數(shù)調(diào)優(yōu);s54、獲取最佳參數(shù)和模型。
10、作為一種進一步優(yōu)選的技術(shù)方案,步驟s54之后還包括以下步驟:s55、在訓(xùn)練集和/或測試集上進行評估驗證。
11、作為一種更進一步優(yōu)選的技術(shù)方案,步驟s5中建模采用以下一個或多個回歸機器學(xué)習(xí)模型:svr,lightgbm,catboost,ridge,randomforest,xgboost,huber,lasso,elasticnet。
12、作為一種優(yōu)選的技術(shù)方案,步驟s6中斜率和截距為計算得出,具體計算方法為:分別在男性數(shù)據(jù)集和女性數(shù)據(jù)集的訓(xùn)練集中將原始年齡差和日歷年齡進行線性擬合,得到男性數(shù)據(jù)集和女性數(shù)據(jù)集中的斜率和截距。
13、本發(fā)明的一種基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法,通過有針對性地采集心血管健康數(shù)據(jù),圍繞心血管健康數(shù)據(jù)分別針對男性和女性數(shù)據(jù)進行計算機模型建模,構(gòu)建男女心血管系統(tǒng)的計算機模型,用以評估不同性別的個體心血管系統(tǒng)的生理年齡。本發(fā)明的一種基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法,由于核心數(shù)據(jù)只使用心血管系統(tǒng)相關(guān)的血壓和心率指標(biāo)進行建模,構(gòu)建心血管系統(tǒng)的生理年齡模型,可以有針對性地評估心血管生理年齡;并且,本發(fā)明的一種基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法基于男女性別的數(shù)據(jù)差異針對男女分別建模,使得預(yù)測結(jié)果更加準(zhǔn)確。
1.一種基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法,其特征在于:包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法,其特征在于:步驟s6之后還包括以下步驟:
3.根據(jù)權(quán)利要求1所述的一種基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法,其特征在于:步驟s1中心血管數(shù)據(jù)包括三個原始測量指標(biāo);所述原始測量指標(biāo)包括舒張壓、收縮壓及心率。
4.根據(jù)權(quán)利要求2所述的一種基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法,其特征在于:步驟s1中心血管數(shù)據(jù)還包括三個衍生指標(biāo):平均血壓、脈壓及心率血壓乘積;平均血壓=1/3*收縮壓+2/3*舒張壓;脈壓=收縮壓-舒張壓;心率血壓乘積=心率*收縮壓。
5.根據(jù)權(quán)利要求1所述的一種基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法,其特征在于:步驟s3中訓(xùn)練集和測試集數(shù)據(jù)量的比值為4:1。
6.根據(jù)權(quán)利要求1所述的一種基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法,其特征在于:步驟s4對訓(xùn)練集的數(shù)據(jù)進行均一化處理中,均一化的方式選擇z-score標(biāo)準(zhǔn)化,公式為z=(x-u)/σ,其中x是原始數(shù)據(jù)點,u是數(shù)據(jù)集的均值,σ是數(shù)據(jù)集的標(biāo)準(zhǔn),z?是標(biāo)準(zhǔn)化后的數(shù)值。
7.根據(jù)權(quán)利要求1所述的一種基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法,其特征在于:步驟s5中分別對男性數(shù)據(jù)集和女性數(shù)據(jù)集中的訓(xùn)練集的數(shù)據(jù)進行建模,并進行網(wǎng)格搜索的方式進行交叉驗證超參數(shù)優(yōu)化具體包括以下步驟:
8.根據(jù)權(quán)利要求7所述的一種基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法,其特征在于:步驟s54之后還包括以下步驟:
9.根據(jù)權(quán)利要求1或7或8任一權(quán)利要求所述的一種基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法,其特征在于:步驟s5中建模采用以下一個或多個回歸機器學(xué)習(xí)模型:svr,lightgbm,catboost,ridge,randomforest,xgboost,huber,lasso,elasticnet。
10.根據(jù)權(quán)利要求所述的一種基于機器學(xué)習(xí)的心血管系統(tǒng)生理年齡預(yù)測方法,其特征在于:步驟s6中斜率和截距為計算得出,具體計算方法為:分別在男性數(shù)據(jù)集和女性數(shù)據(jù)集的訓(xùn)練集中將原始年齡差和日歷年齡進行線性擬合,得到男性數(shù)據(jù)集和女性數(shù)據(jù)集中的斜率和截距。