本發(fā)明涉及機(jī)器學(xué)習(xí),尤其涉及一種聯(lián)邦學(xué)習(xí)帕金森病診斷方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù):
1、帕金森病是一種常見(jiàn)的神經(jīng)退行性疾病,其主要特征是中樞神經(jīng)系統(tǒng)中黑質(zhì)多巴胺能神經(jīng)元的逐步退化,導(dǎo)致患者在運(yùn)動(dòng)和非運(yùn)動(dòng)功能方面出現(xiàn)顯著障礙。典型的運(yùn)動(dòng)癥狀包括靜止性震顫、步態(tài)和姿勢(shì)異常、運(yùn)動(dòng)遲緩、肌肉僵硬等,這些癥狀不僅嚴(yán)重影響患者的日?;顒?dòng),還會(huì)顯著增加跌倒風(fēng)險(xiǎn),進(jìn)一步引發(fā)行動(dòng)障礙。與此同時(shí),帕金森病患者通常還伴隨情緒障礙(如抑郁和焦慮)、認(rèn)知功能減退及睡眠紊亂等非運(yùn)動(dòng)癥狀。這些表現(xiàn)的進(jìn)展因個(gè)體差異而呈現(xiàn)多樣化,尤其是在疾病早期階段,癥狀隱匿且不典型,增加了疾病診斷的難度。
2、帕金森病的早期診斷對(duì)于延緩疾病進(jìn)程、優(yōu)化干預(yù)措施以及改善患者生活質(zhì)量至關(guān)重要。然而,傳統(tǒng)診斷方法往往依賴有限的臨床數(shù)據(jù)和專家經(jīng)驗(yàn),其效果容易受到數(shù)據(jù)質(zhì)量、樣本量不足等因素的限制,難以滿足精確診斷的需求?,F(xiàn)有的基于機(jī)器學(xué)習(xí)的預(yù)測(cè)模型通常采用集中式數(shù)據(jù)收集與處理方式,但這種方法不僅面臨醫(yī)療數(shù)據(jù)隱私保護(hù)政策的嚴(yán)格約束,還因跨機(jī)構(gòu)數(shù)據(jù)共享困難而導(dǎo)致模型的訓(xùn)練數(shù)據(jù)規(guī)模不足。這些問(wèn)題限制了帕金森病預(yù)測(cè)模型的廣泛應(yīng)用及其在實(shí)際臨床場(chǎng)景中的表現(xiàn)。
3、聯(lián)邦學(xué)習(xí)作為一種新興的分布式機(jī)器學(xué)習(xí)框架,能夠在不共享原始患者數(shù)據(jù)的情況下實(shí)現(xiàn)跨機(jī)構(gòu)協(xié)同建模,為醫(yī)療數(shù)據(jù)隱私保護(hù)和數(shù)據(jù)孤島問(wèn)題提供了全新的解決方案。在帕金森病的診斷場(chǎng)景中,聯(lián)邦學(xué)習(xí)可以整合來(lái)自多個(gè)醫(yī)療機(jī)構(gòu)的數(shù)據(jù),為模型的訓(xùn)練提供更多樣化的信息資源。然而,由于數(shù)據(jù)來(lái)源的多樣性(如醫(yī)療設(shè)備、采集方式和患者特征分布的差異),帕金森病患者數(shù)據(jù)通常呈現(xiàn)非獨(dú)立同分布(non-iid)特性。這種數(shù)據(jù)異質(zhì)性會(huì)導(dǎo)致全局共享模型難以充分適應(yīng)各機(jī)構(gòu)數(shù)據(jù)分布,從而顯著降低診斷模型的泛化性能和預(yù)測(cè)準(zhǔn)確性。
技術(shù)實(shí)現(xiàn)思路
1、為至少一定程度上解決現(xiàn)有技術(shù)中存在的技術(shù)問(wèn)題之一,本發(fā)明的目的在于提供一種面向異質(zhì)性醫(yī)療數(shù)據(jù)的聯(lián)邦學(xué)習(xí)帕金森病診斷方法、裝置、設(shè)備及介質(zhì),主要針對(duì)帕金森病診斷中面臨的數(shù)據(jù)隱私保護(hù)和異質(zhì)性數(shù)據(jù)分布問(wèn)題進(jìn)行設(shè)計(jì),能夠在保護(hù)患者隱私的同時(shí),提高診斷模型的適應(yīng)性和準(zhǔn)確性。
2、本發(fā)明所采用的第一技術(shù)方案是:
3、一種聯(lián)邦學(xué)習(xí)帕金森病診斷方法,包括以下步驟:
4、服務(wù)器端初始化全局共享模型,并指示客戶端初始化本地個(gè)性化模型;
5、進(jìn)行聯(lián)邦迭代訓(xùn)練,更新全局共享模型;
6、客戶端下載服務(wù)器端的共享全局模型,利用驗(yàn)證集評(píng)估本地個(gè)性化模型和全局共享模型的性能,并動(dòng)態(tài)確定本地個(gè)性化模型和全局共享模型在帕金森病診斷中的最佳加權(quán)融合系數(shù),以優(yōu)化模型的預(yù)測(cè)精度;
7、客戶端基于驗(yàn)證集確定的加權(quán)融合系數(shù),在集成學(xué)習(xí)過(guò)程中融合本地個(gè)性化模型與共享模型,通過(guò)持續(xù)優(yōu)化兩者的參數(shù),以提高模型對(duì)異質(zhì)性帕金森病數(shù)據(jù)的診斷性能;
8、經(jīng)過(guò)多輪訓(xùn)練和優(yōu)化后,客戶端將最終優(yōu)化的共享模型提交至服務(wù)器端,由服務(wù)器端完成全局共享模型的更新,形成最終的帕金森病診斷聯(lián)邦學(xué)習(xí)預(yù)測(cè)模型。
9、進(jìn)一步地,所述進(jìn)行聯(lián)邦迭代訓(xùn)練,更新全局共享模型,包括:
10、在每輪訓(xùn)練中,客戶端基于本地帕金森病數(shù)據(jù)(包括患者的語(yǔ)音特征、生理指標(biāo)等)對(duì)本地個(gè)性化模型和共享模型進(jìn)行訓(xùn)練,將更新后的客戶端共享模型提交至服務(wù)器端;
11、服務(wù)器端接收所有客戶端傳回的共享模型更新結(jié)果,通過(guò)基于梯度的加權(quán)機(jī)制計(jì)算客戶端權(quán)重,并對(duì)客戶端的共享模型結(jié)果進(jìn)行加權(quán)聚合,更新全局共享模型。
12、進(jìn)一步地,所述進(jìn)行聯(lián)邦迭代訓(xùn)練,更新全局共享模型,包括:
13、本地訓(xùn)練和提交:客戶端i使用本地?cái)?shù)據(jù)集di進(jìn)行本地個(gè)性化模型vi和共享模型wi的訓(xùn)練;在每輪訓(xùn)練后,客戶端i將更新后的共享模型參數(shù)提交至服務(wù)器端;
14、局部梯度計(jì)算:客戶端i在本地訓(xùn)練完成后,計(jì)算其共享模型的局部梯度
15、全局梯度計(jì)算:服務(wù)器端接收所有客戶端的梯度后,計(jì)算全局梯度gt;
16、加權(quán)融合:服務(wù)器端根據(jù)局部梯度和全局梯度gt的余弦相似度計(jì)算每個(gè)客戶端的權(quán)重;
17、權(quán)重歸一化:服務(wù)器對(duì)所有客戶端權(quán)重進(jìn)行歸一化處理;
18、全局模型更新:服務(wù)器端根據(jù)歸一化權(quán)重對(duì)各客戶端的共享模型更新結(jié)果進(jìn)行加權(quán)聚合,生成新的全局共享模型的參數(shù)。
19、進(jìn)一步地,所述局部梯度的計(jì)算公式為:
20、
21、式中,為客戶端i的共享模型參數(shù),pt為當(dāng)前全局共享模型參數(shù);客戶端將局部梯度提交至服務(wù)器端;
22、所述全局梯度gt的計(jì)算公式為:
23、
24、式中,n為客戶端的數(shù)量;
25、客戶端的權(quán)重的計(jì)算公式為:
26、
27、式中,表示客戶端i的貢獻(xiàn)程度;
28、權(quán)重歸一化的公式為:
29、
30、式中,表示客戶端j的貢獻(xiàn)程度。
31、進(jìn)一步地,所述客戶端基于驗(yàn)證集確定的加權(quán)融合系數(shù),在集成學(xué)習(xí)過(guò)程中融合本地個(gè)性化模型與共享模型,包括:
32、加權(quán)融合模型:在每輪訓(xùn)練中,客戶端i基于驗(yàn)證集確定的加權(quán)系數(shù)將本地個(gè)性化模型vi和共享模型wt行加權(quán)融合,生成最終的集成模型:
33、
34、式中,是集成模型對(duì)輸入x的最終預(yù)測(cè)結(jié)果,f(x;vi)和f(x;wt)分別表示個(gè)性化模型與共享模型的預(yù)測(cè)結(jié)果;
35、訓(xùn)練與輸出:采用集成學(xué)習(xí)的方法對(duì)共享模型和本地個(gè)性化模型進(jìn)行訓(xùn)練,經(jīng)過(guò)多輪優(yōu)化后,客戶端生成的最終預(yù)測(cè)模型由集成模型提供,同時(shí)將優(yōu)化后的共享模型提交至服務(wù)器,用于下一輪全局聚合。
36、本發(fā)明所采用的第二技術(shù)方案是:
37、一種聯(lián)邦學(xué)習(xí)帕金森病診斷裝置,包括:
38、初始化模塊,用于服務(wù)器端初始化全局共享模型,并指示客戶端初始化本地個(gè)性化模型;
39、聯(lián)邦訓(xùn)練模塊,用于進(jìn)行聯(lián)邦迭代訓(xùn)練,更新全局共享模型;
40、加權(quán)系數(shù)確定模塊,用于客戶端下載服務(wù)器端的共享全局模型,利用驗(yàn)證集評(píng)估本地個(gè)性化模型和全局共享模型的性能,并動(dòng)態(tài)確定本地個(gè)性化模型和全局共享模型在帕金森病診斷中的最佳加權(quán)融合系數(shù),以優(yōu)化模型的預(yù)測(cè)精度;
41、集成學(xué)習(xí)模塊,用于客戶端基于驗(yàn)證集確定的加權(quán)融合系數(shù),在集成學(xué)習(xí)過(guò)程中融合本地個(gè)性化模型與共享模型,通過(guò)持續(xù)優(yōu)化兩者的參數(shù),以提高模型對(duì)異質(zhì)性帕金森病數(shù)據(jù)的診斷性能;
42、全局更新模塊,用于經(jīng)過(guò)多輪訓(xùn)練和優(yōu)化后,客戶端將最終優(yōu)化的共享模型提交至服務(wù)器端,由服務(wù)器端完成全局共享模型的更新,形成最終的帕金森病診斷聯(lián)邦學(xué)習(xí)預(yù)測(cè)模型。
43、本發(fā)明所采用的第三技術(shù)方案是:
44、一種電子設(shè)備,所述電子設(shè)備包括處理器和存儲(chǔ)器,所述存儲(chǔ)器中存儲(chǔ)有至少一條指令、至少一段程序、代碼集或指令集,所述至少一條指令、所述至少一段程序、所述代碼集或指令集由所述處理器加載并執(zhí)行,以實(shí)現(xiàn)如上所述的一種聯(lián)邦學(xué)習(xí)帕金森病診斷方法。
45、本發(fā)明所采用的第四技術(shù)方案是:
46、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)中存儲(chǔ)有至少一條指令、至少一段程序、代碼集或指令集,所述至少一條指令、所述至少一段程序、所述代碼集或指令集由處理器加載并執(zhí)行以實(shí)現(xiàn)如上所述的一種聯(lián)邦學(xué)習(xí)帕金森病診斷方法。
47、本發(fā)明所采用的第五技術(shù)方案是:
48、一種計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序,該計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序包括計(jì)算機(jī)指令,該計(jì)算機(jī)指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中。計(jì)算機(jī)設(shè)備的處理器可以從計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取該計(jì)算機(jī)指令,處理器執(zhí)行該計(jì)算機(jī)指令,使得該計(jì)算機(jī)設(shè)備執(zhí)行上述的方法。
49、本發(fā)明的有益效果是:本發(fā)明通過(guò)為客戶端定制個(gè)性化的本地模型,而不是依賴單一全局共享模型,實(shí)現(xiàn)對(duì)異質(zhì)性數(shù)據(jù)的更有效適配。最終通過(guò)加權(quán)融合本地模型和全局模型的預(yù)測(cè)結(jié)果,提升了帕金森病診斷的準(zhǔn)確性。此外,本發(fā)明還引入了一種基于梯度的客戶端權(quán)重評(píng)估,根據(jù)客戶端與服務(wù)器更新方向的相似性來(lái)評(píng)估相對(duì)應(yīng)的權(quán)重,實(shí)現(xiàn)更有效的聚合。