本發(fā)明屬于iib-iv浸潤(rùn)性導(dǎo)管癌患者預(yù)后的評(píng)估,尤其涉及一種評(píng)估iib-iv浸潤(rùn)性導(dǎo)管癌女性患者預(yù)后生存及條件生存率的模型及其應(yīng)用,可以通過(guò)相關(guān)的預(yù)測(cè)變量準(zhǔn)確預(yù)測(cè)患者的生存及條件生存率。
背景技術(shù):
1、乳腺癌是許多國(guó)家導(dǎo)致發(fā)病率和死亡率的主要原因之一。不同類(lèi)型乳腺癌的預(yù)后差異顯著,準(zhǔn)確預(yù)測(cè)浸潤(rùn)性導(dǎo)管癌(idc)這一最常見(jiàn)的乳腺癌組織學(xué)類(lèi)型,對(duì)于改善患者的治療結(jié)果至關(guān)重要。得益于乳腺癌早期檢測(cè)和治療的進(jìn)展,乳腺癌女性患者的死亡率已降低43%,五年生存率顯著提高。因此,現(xiàn)有大量乳腺癌患者能夠?qū)崿F(xiàn)長(zhǎng)期生存。然而,傳統(tǒng)的kaplan-meier生存分析僅評(píng)估診斷的預(yù)后,未能考慮生存概率隨時(shí)間變化的動(dòng)態(tài)特性。
2、近年來(lái),條件生存(cs)評(píng)估作為一種優(yōu)于傳統(tǒng)方法的生存預(yù)測(cè)方式,尤其在乳腺癌患者中得到了廣泛應(yīng)用。條件生存不僅考慮診斷后的時(shí)間,還結(jié)合治療后的生存情況,使得生存概率能夠在患者的生存過(guò)程中動(dòng)態(tài)調(diào)整。這種方法為癌癥幸存者提供了更精確的生存風(fēng)險(xiǎn)變化估計(jì)。動(dòng)態(tài)生存預(yù)測(cè)模型對(duì)于持續(xù)風(fēng)險(xiǎn)評(píng)估至關(guān)重要,但大多數(shù)現(xiàn)有的idc列線圖未能考慮這一點(diǎn)。傳統(tǒng)列線圖雖然可以在某一時(shí)間點(diǎn)提供個(gè)體化預(yù)測(cè),但缺乏動(dòng)態(tài)更新生存信息的能力。相比之下,能夠在治療多年后提供更新生存估計(jì)的模型,使得長(zhǎng)期預(yù)后評(píng)估更加精確和主動(dòng)。
3、目前現(xiàn)有的同類(lèi)發(fā)明,其臨床特征模型構(gòu)建均為預(yù)測(cè)患者生存率,盡量模型的靈敏度和特異度均較高,但缺乏了生存信息對(duì)患者結(jié)局的影響。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明提供了一種評(píng)估iib-iv浸潤(rùn)性導(dǎo)管癌女性患者預(yù)后生存及條件生存率的模型及其應(yīng)用。本發(fā)明基于常規(guī)預(yù)測(cè)患者生存率的方法,通過(guò)條件生存計(jì)算,構(gòu)建了預(yù)測(cè)女性iib-iv期浸潤(rùn)性導(dǎo)管癌患者生存率及條件生存率預(yù)測(cè)列線圖。采用cox回歸、lasso回歸和最佳子集回歸篩選并驗(yàn)證了12個(gè)預(yù)測(cè)變量,總體生存期(os)為終點(diǎn)事件并通過(guò)公式cs(y|x)?=?os(y+x)/os(x)計(jì)算患者條件生存率,構(gòu)建了條件生存列線圖。
2、本發(fā)明由如下技術(shù)方案實(shí)現(xiàn)的:一種評(píng)估iib-iv浸潤(rùn)性導(dǎo)管癌患者預(yù)后生存及條件生存率的模型,所述模型包括條件生存列線圖;
3、所述列線圖包括第一列的分值標(biāo)尺,其中,分值的范圍為0-100;第二行為患者年齡分層,不同年齡段對(duì)應(yīng)第一行一個(gè)相應(yīng)的得分;第三行為患者的婚姻狀態(tài),包括已婚和單身狀態(tài);第五行為患者腫瘤t分期,其中,包括t0~1、t2、t3、t4,并分別對(duì)應(yīng)第一列的得分;第六行為患者腫瘤n分期,n0則選擇0,n1則選擇1,n2選擇2,n3選擇3,分別對(duì)應(yīng)第一行相應(yīng)得分;第七行為患者腫瘤臨床分期;第八到十行為患者治療情況分別為手術(shù)、放療、化療情況,包括已行相應(yīng)治療和未行相應(yīng)治療;第十一行到十三行為分別為患者腫瘤受體er、pr、her2表達(dá)情況,包括陽(yáng)性和陰性兩種情況,分別對(duì)應(yīng)第一行得分;第十四行為患者總得分情況,由第二行至第十三行共12個(gè)指標(biāo)在第一行對(duì)應(yīng)的得分相加,得到患者總分值;第十五行為根據(jù)總分得到的風(fēng)險(xiǎn)分層情況,當(dāng)總分位于綠色條帶時(shí),認(rèn)為患者處于生存低風(fēng)險(xiǎn)狀態(tài),當(dāng)總分位于紅色條帶時(shí),認(rèn)為患者處于生存高風(fēng)險(xiǎn)狀態(tài);
4、所述列線圖還包括第十六、十七、十八行,分別對(duì)應(yīng)患者從診斷時(shí)日起第3、5、10年的生存率;第十九行至第二十七行分別對(duì)應(yīng)患者自診斷時(shí)日起生存了1-9年后,第10年的生存率。
5、所述模型還包括:采用kaplan-meier方法評(píng)估總生存期os,條件生存cs的計(jì)算利用方程cs(y|x)=os(y+x)/os(x),式中:cs(y|x)表示在已經(jīng)存活x年后存活額外y年的可能性。
6、本發(fā)明還提供了構(gòu)建所述模型的方法,采用cox回歸、lasso回歸和最佳子集回歸篩選并驗(yàn)證12個(gè)預(yù)測(cè)變量,總體生存期os為終點(diǎn)事件,通過(guò)公式cs(y|x)?=?os(y+x)/os(x)計(jì)算患者條件生存率,構(gòu)建條件生存列線圖。
7、進(jìn)一步的,具體構(gòu)建方法包括如下步驟:
8、(1)篩選并驗(yàn)證預(yù)測(cè)變量:測(cè)量和收集ib-iv期浸潤(rùn)性導(dǎo)管癌idc女性患者樣本的與無(wú)病生存相關(guān)性最強(qiáng)的變量:診斷時(shí)的年齡,婚姻狀況:已婚或單身,腫瘤分期:t或n,臨床分級(jí):從iib到iv,免疫組織化學(xué)標(biāo)志物:er,pr,her2狀態(tài);治療方式:手術(shù),放療,化療;變量得分情況為:
9、年齡:20-69=0分;70-80=15分;
10、婚姻狀況:已婚=0分;單身=1分;
11、腫瘤分期:t分期:t0-1=0分;t2=18分;t3=22分;t4=37分;n分期:n0=0分;n1=5分;n2=8分;n3=29分;
12、臨床分級(jí):iib=0分;iiia-c=38分;iv=100分;
13、治療方式:手術(shù):是=0分;否=35分;放療:是=0分;否=9分;化療:是=0分;否=19分;
14、er:+=0分;-=22分;pr:+=0分;-=29分;her2:+=0分;-=35分;
15、每個(gè)樣本的所有上述預(yù)測(cè)變量的得分相加,即為該患者總體風(fēng)險(xiǎn)評(píng)分,患者總得分越高預(yù)后越差;0-155低風(fēng)險(xiǎn),>155高風(fēng)險(xiǎn);
16、(2)將篩選的樣本隨機(jī)分為訓(xùn)練組和驗(yàn)證組用于建立預(yù)后模型;
17、(3)通過(guò)單因素cox回歸分析、多因素cox回歸分析、最佳子集回歸分析以及l(fā)asso回歸分析,并通過(guò)逐步雙向回歸進(jìn)一步細(xì)化選定的變量,并根據(jù)最低赤池信息量準(zhǔn)則aic選擇最終模型;
18、(4)構(gòu)建生存及條件生存率預(yù)測(cè)模型并以列線圖的形式呈現(xiàn),然后驗(yàn)證列線圖對(duì)預(yù)后判斷的準(zhǔn)確性,最后應(yīng)用校準(zhǔn)曲線及臨床決策曲線評(píng)估預(yù)測(cè)列線圖的準(zhǔn)確性;
19、(5)每個(gè)樣本的所有上述預(yù)測(cè)變量的得分相加,即為該患者總體風(fēng)險(xiǎn)評(píng)分,患者總得分越高預(yù)后越差;0-155低風(fēng)險(xiǎn),>155高風(fēng)險(xiǎn);
20、在生存列線圖上,找到對(duì)應(yīng)的總得分,該分值對(duì)應(yīng)3年,5年,10年生存期的概率;患者總得分越高預(yù)后越差,0-155低風(fēng)險(xiǎn),>155高風(fēng)險(xiǎn)。
21、本發(fā)明分析的數(shù)據(jù)來(lái)自17個(gè)地區(qū)性seer登記處的數(shù)據(jù),更新至2022年,研究對(duì)象為2010?至?2019年間,年齡在20?至80歲之間、診斷為乳腺浸潤(rùn)性導(dǎo)管癌(idc)的女性患者。納入標(biāo)準(zhǔn)為idc為唯一主要惡性腫瘤、病理分期iib及以上,并具有完整臨床病理和治療記錄。排除數(shù)據(jù)不完整、未通過(guò)組織病理學(xué)確認(rèn)、無(wú)生存月份、死于非癌癥原因或缺失關(guān)鍵變量的病例。
22、主要終點(diǎn)為總生存期(os),定義為從診斷到死亡的時(shí)間間隔。數(shù)據(jù)收集包括診斷年齡、婚姻狀況、腫瘤分期(t、n)、臨床分級(jí)、免疫組化標(biāo)志物及治療方式(手術(shù)、放療、化療)。這些變量用于分析其對(duì)idc預(yù)后的影響。數(shù)據(jù)被分為訓(xùn)練隊(duì)列(23,630名患者)和驗(yàn)證隊(duì)列(10,128名患者),比例為7:3。
23、首先采用了單變量和多變量cox回歸分析,獲得了每個(gè)12個(gè)變量的危險(xiǎn)比(hr)和置信區(qū)間(ci)。進(jìn)行了最佳子集回歸,以確定最重要的變量。該方法評(píng)估了12個(gè)候選變量的所有可能組合,按照不同的統(tǒng)計(jì)標(biāo)準(zhǔn),通過(guò)調(diào)整r2值評(píng)估其預(yù)測(cè)能力。最佳子集回歸選擇了8個(gè)變量。最終,通過(guò)lasso回歸篩選出的12個(gè)變量子集與使用5倍交叉驗(yàn)證和10倍交叉驗(yàn)證的多因素cox回歸結(jié)果一致,且通過(guò)逐步回歸基于aic計(jì)算篩選出的變量集被確認(rèn)是最佳模型變量。
24、本發(fā)明在訓(xùn)練集中基于診斷年齡、婚姻狀況、腫瘤分期(t、n)、臨床分級(jí)、免疫組化標(biāo)志物及治療方式(手術(shù)、放療、化療)這12個(gè)變量構(gòu)建了列線圖,該列線圖為變量分配了分值,并將總分轉(zhuǎn)換為線性預(yù)測(cè)分?jǐn)?shù),然后將其映射到3年、5年和10年的生存概率,以及對(duì)于存活1到9年的患者的條件性10年生存概率。
25、然后在訓(xùn)練組和驗(yàn)證組中通過(guò)一致性c指數(shù)評(píng)估列線圖的準(zhǔn)確性。最后應(yīng)用校準(zhǔn)曲線及臨床決策曲線評(píng)估預(yù)測(cè)列線圖的準(zhǔn)確性。
26、該列線圖的實(shí)施促進(jìn)了患者的高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)分層,其中風(fēng)險(xiǎn)評(píng)分>中位風(fēng)險(xiǎn)評(píng)分的患者被定義為高風(fēng)險(xiǎn)患者,風(fēng)險(xiǎn)評(píng)分≤中位風(fēng)險(xiǎn)評(píng)分的患者被定義為低風(fēng)險(xiǎn)患者。該列線圖還與以tnm為變量構(gòu)建的列線圖從c指數(shù),auc值,校準(zhǔn)性、臨床決策能力上進(jìn)行了比較。
27、與現(xiàn)有技術(shù)相比,本發(fā)明所構(gòu)建的該模型能夠準(zhǔn)確預(yù)測(cè)女性iib-iv期浸潤(rùn)性導(dǎo)管癌患者預(yù)后,不同于傳統(tǒng)列線圖在某一時(shí)間點(diǎn)提供的個(gè)體化預(yù)測(cè),本發(fā)明的模型優(yōu)于以tnm為變量構(gòu)建的預(yù)測(cè)模型,并且能夠在治療多年后提供更新生存估計(jì)的模型,使得長(zhǎng)期預(yù)后評(píng)估更加精確和主動(dòng)。
28、利用seer數(shù)據(jù)庫(kù)進(jìn)行條件生存分析,為非早期idc女性患者提供更精確的生存預(yù)測(cè)。此外還將cs列線圖與傳統(tǒng)tnm列線圖進(jìn)行了比較,突出動(dòng)態(tài)生存預(yù)測(cè)方法的優(yōu)勢(shì)?;谙嚓P(guān)的臨床病理特征和生存時(shí)間開(kāi)發(fā)了一個(gè)cs列線圖,為生存評(píng)估和隨訪提供了有價(jià)值的工具。通過(guò)提高idc患者的預(yù)后準(zhǔn)確性,旨在改善個(gè)性化治療計(jì)劃和長(zhǎng)期患者管理。