本發(fā)明涉及人工智能領(lǐng)域,特別是涉及一種醫(yī)學(xué)建議的解讀方法及相關(guān)組件。
背景技術(shù):
1、醫(yī)學(xué)建議,泛指由醫(yī)療機(jī)構(gòu)或智能化家用醫(yī)療器械給出,被醫(yī)學(xué)檢驗(yàn)、檢查或生理監(jiān)測(cè)等結(jié)果所支撐的,關(guān)于下一步醫(yī)學(xué)相關(guān)行動(dòng)的建議,且通常是非緊急的。具體例子有體檢報(bào)告中關(guān)于非重要異常結(jié)果的隨訪或生活方式干預(yù)建議、病歷中包含的由本科室檢驗(yàn)檢查順帶產(chǎn)生的其他科室隨訪建議等。面對(duì)這些建議,公眾普遍有細(xì)化解讀、深入了解并再結(jié)合自身?xiàng)l件判斷的需求。但同樣普遍地,建議的提供方由于人力限制及缺乏合適的計(jì)算機(jī)輔助手段,難以伴隨建議逐條給出個(gè)性化、非模板化的詳細(xì)解釋,更難以提供交互式的解讀體驗(yàn)。相關(guān)技術(shù)中采用大型語(yǔ)言模型對(duì)醫(yī)學(xué)建議進(jìn)行解讀,但是大型語(yǔ)言模型需要經(jīng)常的進(jìn)行微調(diào),算力成本和時(shí)間成本都較高。同時(shí)大型語(yǔ)言模型在檢索的過(guò)程中采用內(nèi)部已經(jīng)訓(xùn)練好的內(nèi)容,并沒有輸出的依據(jù),用戶無(wú)法校驗(yàn)其正確性,導(dǎo)致輸出的解讀的可追溯性較低。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是提供一種醫(yī)學(xué)建議的解讀方法及相關(guān)組件,結(jié)合了稀疏向量與稠密向量得到的關(guān)聯(lián)文獻(xiàn)文本與醫(yī)學(xué)建議文本的相關(guān)性較高。在解讀時(shí)基于關(guān)聯(lián)文獻(xiàn)文檔,可以使得語(yǔ)言模型輸出的解讀具有可追溯性,提高了解讀的可信度。對(duì)解讀的更新可以通過(guò)更新知識(shí)庫(kù)中的文獻(xiàn)文本替代更新語(yǔ)言模型,維護(hù)的時(shí)間成本降低。。
2、為解決上述技術(shù)問(wèn)題,本發(fā)明提供了一種醫(yī)學(xué)建議的解讀方法,包括:
3、獲取用戶輸入的針對(duì)檢測(cè)項(xiàng)目的醫(yī)學(xué)建議文本,并提取所述醫(yī)學(xué)建議文本中的關(guān)鍵內(nèi)容;
4、將所述醫(yī)學(xué)建議文本中的關(guān)鍵內(nèi)容轉(zhuǎn)換為稀疏向量及稠密向量;
5、基于所述稀疏向量及所述稠密向量在知識(shí)庫(kù)中進(jìn)行文獻(xiàn)文檔匹配,得到至少一個(gè)與所述醫(yī)學(xué)建議文本匹配的關(guān)聯(lián)文獻(xiàn)文檔;
6、控制語(yǔ)言模型根據(jù)輸入的需求,基于所述關(guān)聯(lián)文獻(xiàn)文檔輸出對(duì)所述醫(yī)學(xué)建議文本的解讀結(jié)果及所述關(guān)聯(lián)文獻(xiàn)文檔中與所述解讀結(jié)果直接相關(guān)的片段,所述解讀結(jié)果包括對(duì)所述檢測(cè)項(xiàng)目的異常判斷結(jié)果及對(duì)應(yīng)的臨床意義文本;
7、獲取更新文獻(xiàn)文檔,并使用所述更新文獻(xiàn)文檔對(duì)所述知識(shí)庫(kù)進(jìn)行更新。
8、另一方面,還包括:
9、接收導(dǎo)入的文獻(xiàn)文檔;
10、對(duì)所述文獻(xiàn)文檔進(jìn)行格式清洗,得到預(yù)設(shè)格式的文獻(xiàn)文檔;
11、將所述預(yù)設(shè)格式的文獻(xiàn)文檔保存至所述知識(shí)庫(kù)。
12、另一方面,接收導(dǎo)入的文獻(xiàn)文檔之后,還包括:
13、使用光學(xué)字符識(shí)別技術(shù)對(duì)非文本類型的文獻(xiàn)文檔中的文字進(jìn)行提取,以將所述非文本類型的文獻(xiàn)文檔轉(zhuǎn)換為文本類型的文獻(xiàn)文檔;
14、對(duì)所述文獻(xiàn)文檔進(jìn)行格式清洗,得到預(yù)設(shè)格式的文檔,包括:
15、按照預(yù)設(shè)邏輯規(guī)則將所述文本類型的文獻(xiàn)文檔中的文字劃分為文本塊,每個(gè)所述文本塊作為所述文獻(xiàn)文檔中的一段;
16、清除劃分為文本塊后的文獻(xiàn)文檔中的格式標(biāo)記及重復(fù)內(nèi)容,將所述文獻(xiàn)文檔轉(zhuǎn)換為markdown格式文件。
17、另一方面,獲取更新文獻(xiàn)文檔,并使用所述更新文獻(xiàn)文檔對(duì)所述知識(shí)庫(kù)進(jìn)行更新,包括:
18、接收導(dǎo)入的更新版本的文獻(xiàn)文檔;
19、確定所述更新版本的文獻(xiàn)文檔對(duì)應(yīng)的原始版本的文獻(xiàn)文檔在所述知識(shí)庫(kù)中的索引位置;
20、將所述更新版本的文獻(xiàn)文檔進(jìn)行格式清洗后保存至所述原始版本的文獻(xiàn)文檔在所述知識(shí)庫(kù)中的索引位置。
21、另一方面,獲取用戶輸入的針對(duì)檢測(cè)項(xiàng)目的醫(yī)學(xué)建議文本,并提取所述醫(yī)學(xué)建議文本中的關(guān)鍵內(nèi)容,包括:
22、根據(jù)預(yù)先訓(xùn)練好的文本分詞模型,將所述醫(yī)學(xué)建議文本進(jìn)行文本分割,得到多個(gè)第一詞匯單元;
23、將屬于停用詞的第一詞匯單元的刪除,得到第一檢索詞匯單元,所述停用詞為與解讀無(wú)關(guān)的詞匯單元,所述第一檢索詞匯單元作為所述醫(yī)學(xué)建議文本中的關(guān)鍵內(nèi)容;
24、基于所述稀疏向量及所述稠密向量在知識(shí)庫(kù)中進(jìn)行文獻(xiàn)文檔匹配,得到至少一個(gè)與所述醫(yī)學(xué)建議文本匹配的關(guān)聯(lián)文獻(xiàn)文檔之前,還包括:
25、根據(jù)預(yù)先訓(xùn)練好的文本分詞模型,將所述知識(shí)庫(kù)中的文獻(xiàn)文檔進(jìn)行文本分割,得到多個(gè)第二詞匯單元;
26、將屬于停用詞的第二詞匯單元的刪除,得到第二檢索詞匯單元。
27、另一方面,將所述醫(yī)學(xué)建議文本中的關(guān)鍵內(nèi)容轉(zhuǎn)換為稀疏向量及稠密向量,包括:
28、按照所述第一檢索詞匯單元與所述第二檢索詞匯單元出現(xiàn)的頻率,將所述第一檢索詞匯單元與所述第二檢索詞匯單元形成稀疏向量;
29、按照所述稀疏向量得到第一檢索詞匯單元與所述第二檢索詞匯單元對(duì)應(yīng)的文獻(xiàn)文檔的第一相關(guān)性;
30、將所述第一檢索詞匯單元與所述第二檢索詞匯單元均轉(zhuǎn)換為稠密向量;
31、采用距離度量方法衡量所述第一檢索詞匯單元構(gòu)成的稠密向量與所述第二檢索詞匯單元構(gòu)成的稠密向量得到第一檢索詞匯單元與所述第二檢索詞匯單元對(duì)應(yīng)的文獻(xiàn)文檔的第二相關(guān)性;
32、基于所述稀疏向量及所述稠密向量在知識(shí)庫(kù)中進(jìn)行文獻(xiàn)文檔匹配,得到至少一個(gè)與所述醫(yī)學(xué)建議文本匹配的關(guān)聯(lián)文獻(xiàn)文檔,包括:
33、按照所述第一相關(guān)性及所述第二相關(guān)性對(duì)所述文獻(xiàn)文檔進(jìn)行相關(guān)性評(píng)分;
34、根據(jù)所述相關(guān)性評(píng)分由高至低選擇預(yù)設(shè)個(gè)文獻(xiàn)文檔作為包含所述關(guān)鍵內(nèi)容的文獻(xiàn)文檔。
35、另一方面,獲取用戶輸入的針對(duì)檢測(cè)項(xiàng)目的醫(yī)學(xué)建議文本,包括:
36、接收用戶在用戶界面輸入,并由所述用戶界面轉(zhuǎn)發(fā)的醫(yī)學(xué)建議文本;
37、控制語(yǔ)言模型根據(jù)輸入的需求,基于所述關(guān)聯(lián)文獻(xiàn)文檔輸出對(duì)所述醫(yī)學(xué)建議文本的解讀結(jié)果及所述關(guān)聯(lián)文獻(xiàn)文檔中與所述解讀結(jié)果直接相關(guān)的片段之后,還包括:
38、將輸出的對(duì)所述醫(yī)學(xué)建議文本的解讀結(jié)果及所述關(guān)聯(lián)文獻(xiàn)文檔中與所述解讀結(jié)果直接相關(guān)的片段展示在所述用戶界面上。
39、另一方面,在所述需求為根據(jù)檢查異常到臨床意義,并根據(jù)臨床意義到對(duì)應(yīng)科室推導(dǎo)時(shí),控制語(yǔ)言模型根據(jù)輸入的需求,基于所述關(guān)聯(lián)文獻(xiàn)文檔輸出對(duì)所述醫(yī)學(xué)建議文本的解讀結(jié)果及所述關(guān)聯(lián)文獻(xiàn)文檔中與所述解讀結(jié)果直接相關(guān)的片段,包括:
40、根據(jù)所述醫(yī)學(xué)建議文本確定所述檢測(cè)項(xiàng)目的結(jié)果是否異常,所述異常包括結(jié)果相較于正常范圍偏高或偏低;
41、確定所述檢測(cè)項(xiàng)目的異常判斷結(jié)果在所述關(guān)聯(lián)文獻(xiàn)文檔中對(duì)應(yīng)的臨床意義文本,所述臨床意義文本表征所述異常的檢測(cè)項(xiàng)目的結(jié)果對(duì)應(yīng)的疾??;
42、輸出檢測(cè)項(xiàng)目的異常判斷結(jié)果、所述臨床意義文本、所述檢測(cè)項(xiàng)目對(duì)應(yīng)的科室及所述關(guān)聯(lián)文獻(xiàn)文檔中與所述解讀結(jié)果直接相關(guān)的片段。
43、為解決上述技術(shù)問(wèn)題,本發(fā)明還提供了一種醫(yī)學(xué)建議的解讀系統(tǒng),包括:
44、醫(yī)學(xué)建議文本獲取單元,用于獲取用戶輸入的針對(duì)檢測(cè)項(xiàng)目的醫(yī)學(xué)建議文本,并提取所述醫(yī)學(xué)建議文本中的關(guān)鍵內(nèi)容;
45、向量轉(zhuǎn)換單元,用于將所述醫(yī)學(xué)建議文本中的關(guān)鍵內(nèi)容轉(zhuǎn)換為稀疏向量及稠密向量;
46、匹配單元,用于基于所述稀疏向量及所述稠密向量在知識(shí)庫(kù)中進(jìn)行文獻(xiàn)文檔匹配,得到至少一個(gè)與所述醫(yī)學(xué)建議文本匹配的關(guān)聯(lián)文獻(xiàn)文檔;
47、解讀單元,用于控制語(yǔ)言模型根據(jù)輸入的需求,基于所述關(guān)聯(lián)文獻(xiàn)文檔輸出對(duì)所述醫(yī)學(xué)建議文本的解讀結(jié)果及所述關(guān)聯(lián)文獻(xiàn)文檔中與所述解讀結(jié)果直接相關(guān)的片段,所述解讀結(jié)果包括對(duì)所述檢測(cè)項(xiàng)目的異常判斷結(jié)果及對(duì)應(yīng)的臨床意義文本;
48、更新單元,用于獲取更新文獻(xiàn)文檔,并使用所述更新文獻(xiàn)文檔對(duì)所述知識(shí)庫(kù)進(jìn)行更新。
49、為解決上述技術(shù)問(wèn)題,本發(fā)明還提供了一種醫(yī)學(xué)建議的解讀裝置,包括:
50、存儲(chǔ)器,用于存儲(chǔ)計(jì)算機(jī)程序;
51、處理器,用于執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述的醫(yī)學(xué)建議的解讀方法的步驟。
52、本發(fā)明公開了一種醫(yī)學(xué)建議的解讀方法及相關(guān)組件,涉及人工智能領(lǐng)域,包括基于醫(yī)學(xué)建議文本中的關(guān)鍵內(nèi)容轉(zhuǎn)換為的稀疏向量及稠密向量在知識(shí)庫(kù)中進(jìn)行文獻(xiàn)文檔匹配,得到至少一個(gè)與醫(yī)學(xué)建議文本匹配的關(guān)聯(lián)文獻(xiàn)文檔;控制語(yǔ)言模型根據(jù)輸入的需求,基于關(guān)聯(lián)文獻(xiàn)文檔輸出對(duì)醫(yī)學(xué)建議文本的解讀結(jié)果及關(guān)聯(lián)文獻(xiàn)文檔中與解讀結(jié)果直接相關(guān)的片段;獲取更新文獻(xiàn)文檔,并使用更新文獻(xiàn)文檔對(duì)知識(shí)庫(kù)進(jìn)行更新。結(jié)合了稀疏向量與稠密向量得到的關(guān)聯(lián)文獻(xiàn)文本與醫(yī)學(xué)建議文本的相關(guān)性較高。在解讀時(shí)基于關(guān)聯(lián)文獻(xiàn)文檔,可以使得語(yǔ)言模型輸出的解讀具有可追溯性,提高了解讀的可信度。對(duì)解讀的更新可以通過(guò)更新知識(shí)庫(kù)中的文獻(xiàn)文本替代更新語(yǔ)言模型,維護(hù)的時(shí)間成本降低。