成人打一炮免费视频,亚洲天堂视频在线观看,97视频久久久,日本japanese护士色高清,五月婷婷丁香,日韩精品一级无码毛片免费,国产欧美日韩精品网红剧情演绎

一種基于集成學(xué)習(xí)的基因調(diào)控網(wǎng)絡(luò)推斷方法和系統(tǒng)

文檔序號:41850372發(fā)布日期:2025-05-09 18:09閱讀:7來源:國知局
一種基于集成學(xué)習(xí)的基因調(diào)控網(wǎng)絡(luò)推斷方法和系統(tǒng)

本發(fā)明涉及生物信息學(xué)和計(jì)算生物學(xué),更具體地,涉及一種基于集成學(xué)習(xí)的基因調(diào)控網(wǎng)絡(luò)推斷方法和系統(tǒng)。


背景技術(shù):

1、基因調(diào)控網(wǎng)絡(luò)(gene?regulatory?network,grn)的重建對于研究細(xì)胞的生命活動(dòng)以及癌癥的治療具有重要意義。grn的推斷是指通過對基因與轉(zhuǎn)錄因子表達(dá)數(shù)據(jù)的分析與建模,推斷出基因和轉(zhuǎn)錄因子之間的調(diào)控關(guān)系。目前常見的grn推斷方法有線性回歸、貝葉斯網(wǎng)絡(luò)和隨機(jī)森林等機(jī)器學(xué)習(xí)方法,但這些方法與深度學(xué)習(xí)方法相比具有諸多不足,如非線性關(guān)系建模能力較弱、特征選擇和提取依賴于領(lǐng)域知識等。深度學(xué)習(xí)模型通過深層的神經(jīng)網(wǎng)絡(luò),可以學(xué)習(xí)到更復(fù)雜的非線性關(guān)系,并準(zhǔn)確推斷出基因和轉(zhuǎn)錄因子之間的調(diào)控關(guān)系。因此,基于深度學(xué)習(xí)的單細(xì)胞rna序列基因調(diào)控推斷方法具有廣闊前景。

2、近年來,人們開發(fā)出了許多基于深度學(xué)習(xí)的方法用于推斷基因調(diào)控網(wǎng)絡(luò),例如,現(xiàn)有技術(shù)中公開了及一種基因調(diào)控網(wǎng)絡(luò)重建方法、系統(tǒng)及設(shè)備,該方法通過ai算法預(yù)測和重構(gòu)基因調(diào)控網(wǎng)絡(luò),其中,ai算法包括bp神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、極限學(xué)習(xí)機(jī)、循環(huán)神經(jīng)網(wǎng)絡(luò)、transformer,然而,包括該現(xiàn)有技術(shù)在內(nèi)的大多數(shù)方案都是基于單一神經(jīng)網(wǎng)絡(luò)模型進(jìn)行獨(dú)立預(yù)測,預(yù)測精度和魯棒性較差,在復(fù)雜情況下推斷效果不佳,面對不同數(shù)據(jù)分布的基因表達(dá)數(shù)據(jù)時(shí)推斷效果波動(dòng)較大,在實(shí)際應(yīng)用中往往難以達(dá)到理想的推斷準(zhǔn)確性,并且操作復(fù)雜,不利于非專業(yè)用戶的使用。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明為克服上述現(xiàn)有技術(shù)在推斷基因調(diào)控網(wǎng)絡(luò)時(shí)存在推斷效果不佳和操作復(fù)雜、難以使用的缺陷,提供一種基于集成學(xué)習(xí)的基因調(diào)控網(wǎng)絡(luò)推斷方法和系統(tǒng),通過整合多種經(jīng)典的深度學(xué)習(xí)模型,并利用stacking集成學(xué)習(xí)的策略有效提升基因調(diào)控網(wǎng)絡(luò)的推斷準(zhǔn)確性,同時(shí)配套交互友好的用戶界面,使得基因調(diào)控網(wǎng)絡(luò)的推斷更加高效、準(zhǔn)確且易于使用,從而推動(dòng)基因調(diào)控網(wǎng)絡(luò)研究及其在癌癥治療等領(lǐng)域的應(yīng)用發(fā)展。

2、為解決上述技術(shù)問題,本發(fā)明的技術(shù)方案如下:

3、一種基于集成學(xué)習(xí)的基因調(diào)控網(wǎng)絡(luò)推斷方法,包括以下步驟:

4、s1:獲取若干組已知基因調(diào)控網(wǎng)絡(luò)的基因表達(dá)數(shù)據(jù)構(gòu)成基因數(shù)據(jù)集,并對所述基因數(shù)據(jù)集進(jìn)行預(yù)處理;

5、s2:構(gòu)建基因調(diào)控網(wǎng)絡(luò)推斷模型,所述基因調(diào)控網(wǎng)絡(luò)推斷模型的結(jié)構(gòu)包括:輸入層、若干個(gè)并列的基學(xué)習(xí)器、特征融合層、元學(xué)習(xí)器和輸出層;

6、所述輸入層用于輸入基因表達(dá)數(shù)據(jù)至各個(gè)基學(xué)習(xí)器;每個(gè)所述基學(xué)習(xí)器分別初步預(yù)測基因表達(dá)數(shù)據(jù)對應(yīng)的基因調(diào)控網(wǎng)絡(luò),并分別將其預(yù)測結(jié)果輸入特征融合層;所述特征融合層用于將所有基學(xué)習(xí)器的預(yù)測結(jié)果進(jìn)行融合,獲取融合特征并輸入元學(xué)習(xí)器;所述元學(xué)習(xí)器用于根據(jù)融合特征進(jìn)行集成預(yù)測,獲取集成預(yù)測結(jié)果并經(jīng)輸出層輸出,獲取最終的基因調(diào)控網(wǎng)絡(luò);

7、s3:利用所述預(yù)處理后的基因數(shù)據(jù)集訓(xùn)練所述基因調(diào)控網(wǎng)絡(luò)推斷模型,獲取訓(xùn)練好的基因調(diào)控網(wǎng)絡(luò)推斷模型;

8、s4:建立用戶交互界面,獲取待推斷的基因表達(dá)數(shù)據(jù)并利用所述用戶交互界面輸入所述訓(xùn)練好的基因調(diào)控網(wǎng)絡(luò)推斷模型,獲取待推斷的基因表達(dá)數(shù)據(jù)對應(yīng)的基因調(diào)控網(wǎng)絡(luò)。

9、基學(xué)習(xí)器(base?learner)是指獨(dú)立的深度學(xué)習(xí)模型,這些模型負(fù)責(zé)捕捉數(shù)據(jù)中的模式或規(guī)律;基學(xué)習(xí)器的輸出作為后續(xù)步驟的輸入,用于構(gòu)建更高層次的預(yù)測模型;

10、元學(xué)習(xí)器(meta?learner)是stacking集成學(xué)習(xí)中的更高層次的模型,用于對基學(xué)習(xí)器的輸出進(jìn)行進(jìn)一步融合,并預(yù)測最終的結(jié)果;其目標(biāo)是充分利用各個(gè)基學(xué)習(xí)器學(xué)習(xí)到的數(shù)據(jù)的分布和特征,在不同的數(shù)據(jù)分布下也能獲得較優(yōu)的預(yù)測性能。

11、優(yōu)選地,所述步驟s1中,預(yù)處理包括:

12、將所述基因表達(dá)數(shù)據(jù)轉(zhuǎn)換為矩陣形式并對其進(jìn)行標(biāo)準(zhǔn)化,所述矩陣中的行代表基因,列代表細(xì)胞,矩陣中的元素代表標(biāo)準(zhǔn)化后的基因表達(dá)值;

13、將所述基因表達(dá)數(shù)據(jù)對應(yīng)的基因調(diào)控網(wǎng)絡(luò)轉(zhuǎn)換為鄰接矩陣,所述鄰接矩陣中,已知的基因調(diào)控關(guān)系標(biāo)簽為“1”,未知的基因調(diào)控關(guān)系標(biāo)簽為“0”。

14、優(yōu)選地,所述步驟s1中,基因數(shù)據(jù)集為gene?expression?omnibus數(shù)據(jù)庫中開源的數(shù)據(jù)集,具體為小鼠紅系造血干細(xì)胞數(shù)據(jù)集mhsc-e、小鼠粒系造血干細(xì)胞數(shù)據(jù)集mhsc-gm、小鼠淋巴系造血干細(xì)胞數(shù)據(jù)集mhsc-l、小鼠樹突狀細(xì)胞數(shù)據(jù)集mdc、人類胚胎干細(xì)胞數(shù)據(jù)集hesc和人類肝細(xì)胞數(shù)據(jù)集hhep中的任意一種。

15、優(yōu)選地,所述步驟s2中,至少包括以下五種:deepdrim模型、cnnc模型、stgrns模型、genelink模型和gnnlink模型。

16、優(yōu)選地,所述步驟s2中,特征融合層將所有基學(xué)習(xí)器的預(yù)測結(jié)果進(jìn)行拼接操作,將拼接后的向量視為新的特征并進(jìn)行歸一化操作,獲取所述融合特征。

17、優(yōu)選地,所述步驟s2中,元學(xué)習(xí)器具體為多層感知機(jī)mlp;

18、所述多層感知機(jī)mlp的結(jié)構(gòu)包括依次連接的:子輸入層、第一隱藏層、第二隱藏層、第三隱藏層和子輸出層;所述第一隱藏層和第二隱藏層用于對子輸入層輸入的融合特征依次進(jìn)行特征升維,所述第三隱藏層用于特征降維,所述子輸出層用于將降維后的融合特征轉(zhuǎn)化為預(yù)測得分,獲取所述集成預(yù)測結(jié)果。

19、利用多層感知機(jī)作為元學(xué)習(xí)器,優(yōu)點(diǎn)在于能夠自適應(yīng)地學(xué)習(xí)各個(gè)基學(xué)習(xí)器的重要程度,為基學(xué)習(xí)器分配不同的權(quán)重,從而有效地緩解數(shù)據(jù)分布不同帶來的預(yù)測偏差,提高整體的預(yù)測性能。

20、優(yōu)選地,所述步驟s2中,輸出層通過預(yù)設(shè)的閾值對所述集成預(yù)測結(jié)果進(jìn)行二值化處理,獲取最終的基因調(diào)控網(wǎng)絡(luò)。

21、優(yōu)選地,所述步驟s3中,利用所述預(yù)處理后的基因數(shù)據(jù)集訓(xùn)練所述基因調(diào)控網(wǎng)絡(luò)推斷模型,在訓(xùn)練過程中,通過優(yōu)化預(yù)設(shè)的損失函數(shù)來提高基因調(diào)控網(wǎng)絡(luò)推斷模型的預(yù)測性能,并采用早停法或?qū)W習(xí)率調(diào)整策略來防止模型過擬合。

22、優(yōu)選地,所述預(yù)設(shè)的損失函數(shù)具體為二元交叉熵?fù)p失函數(shù)。

23、本發(fā)明還提供一種基于集成學(xué)習(xí)的基因調(diào)控網(wǎng)絡(luò)推斷系統(tǒng),應(yīng)用上述的一種基于集成學(xué)習(xí)的基因調(diào)控網(wǎng)絡(luò)推斷方法,包括:

24、預(yù)處理單元:用于獲取若干組已知基因調(diào)控網(wǎng)絡(luò)的基因表達(dá)數(shù)據(jù)構(gòu)成基因數(shù)據(jù)集,并對所述基因數(shù)據(jù)集進(jìn)行預(yù)處理;

25、模型構(gòu)建單元:用于構(gòu)建基因調(diào)控網(wǎng)絡(luò)推斷模型;

26、模型訓(xùn)練單元:用于利用所述預(yù)處理后的基因數(shù)據(jù)集訓(xùn)練所述基因調(diào)控網(wǎng)絡(luò)推斷模型,獲取訓(xùn)練好的基因調(diào)控網(wǎng)絡(luò)推斷模型;

27、人機(jī)交互單元:用于建立用戶交互界面,獲取待推斷的基因表達(dá)數(shù)據(jù)并利用所述用戶交互界面輸入所述訓(xùn)練好的基因調(diào)控網(wǎng)絡(luò)推斷模型,獲取待推斷的基因表達(dá)數(shù)據(jù)對應(yīng)的基因調(diào)控網(wǎng)絡(luò)。

28、與現(xiàn)有技術(shù)相比,本發(fā)明技術(shù)方案的有益效果是:

29、本發(fā)明提供一種基于集成學(xué)習(xí)的基因調(diào)控網(wǎng)絡(luò)推斷方法和系統(tǒng),首先獲取若干組已知基因調(diào)控網(wǎng)絡(luò)的基因表達(dá)數(shù)據(jù)構(gòu)成基因數(shù)據(jù)集,并對基因數(shù)據(jù)集進(jìn)行預(yù)處理;接著構(gòu)建基因調(diào)控網(wǎng)絡(luò)推斷模型,基因調(diào)控網(wǎng)絡(luò)推斷模型的結(jié)構(gòu)包括:輸入層、若干個(gè)并列的基學(xué)習(xí)器、特征融合層、元學(xué)習(xí)器和輸出層;之后利用預(yù)處理后的基因數(shù)據(jù)集訓(xùn)練基因調(diào)控網(wǎng)絡(luò)推斷模型,獲取訓(xùn)練好的基因調(diào)控網(wǎng)絡(luò)推斷模型;最后建立用戶交互界面,獲取待推斷的基因表達(dá)數(shù)據(jù)并利用用戶交互界面輸入訓(xùn)練好的基因調(diào)控網(wǎng)絡(luò)推斷模型,獲取待推斷的基因表達(dá)數(shù)據(jù)對應(yīng)的基因調(diào)控網(wǎng)絡(luò);

30、本發(fā)明通過整合多種經(jīng)典的神經(jīng)網(wǎng)絡(luò)并采用集成學(xué)習(xí)策略,能夠綜合各模型的優(yōu)勢,有效減少單一模型可能帶來的偏差,顯著提高基因調(diào)控網(wǎng)絡(luò)推斷的準(zhǔn)確性和魯棒性,同時(shí)能夠適應(yīng)不同類型的基因表達(dá)數(shù)據(jù)和研究需求;其次,本發(fā)明還配套有直觀友好的用戶交互界面,簡化了復(fù)雜的數(shù)據(jù)處理和模型配置過程,使得用戶無需具備深厚的編程或生物信息學(xué)背景也能輕松操作,大大降低了使用門檻;另外,準(zhǔn)確的基因調(diào)控網(wǎng)絡(luò)推斷對于理解細(xì)胞生命活動(dòng)機(jī)制、疾病發(fā)生發(fā)展及尋找治療靶點(diǎn)至關(guān)重要;本發(fā)明的推廣使用將加速這些領(lǐng)域的研究進(jìn)程,特別是在癌癥治療策略的開發(fā)上,有望為精準(zhǔn)醫(yī)療提供有力支持。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1