本發(fā)明涉及深度學(xué)習(xí),特別涉及一種基于大模型的文檔審核方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著信息技術(shù)的迅猛發(fā)展,企業(yè)或其他一些研究單位在日常中會(huì)生成和使用大量文檔,如技術(shù)報(bào)告、研究報(bào)告、操作規(guī)程、合同等,這些文檔必須符合相關(guān)法律法規(guī)和行業(yè)標(biāo)準(zhǔn),確保文檔的合法性與規(guī)范性。然而,傳統(tǒng)的人工審核方式存在效率低下、成本高昂以及審核質(zhì)量不穩(wěn)定等問(wèn)題。雖然基于規(guī)則的自動(dòng)審核系統(tǒng)在一定程度上提高了審核效率,但其在處理復(fù)雜、多變的文檔內(nèi)容時(shí)仍存在局限性,難以實(shí)現(xiàn)高效、準(zhǔn)確的自動(dòng)化合規(guī)審核。因此,如何提高文檔審核的效率是本領(lǐng)域有待解決的技術(shù)問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種基于大模型的文檔審核方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),通過(guò)智能化的文檔解析、審核數(shù)據(jù)庫(kù)檢索和微調(diào)大模型的合規(guī)性判別,實(shí)現(xiàn)文檔審核的自動(dòng)化、高效化、準(zhǔn)確化。其具體方案如下:
2、第一方面,本申請(qǐng)?zhí)峁┝艘环N基于大模型的文檔審核方法,包括:
3、從若干預(yù)設(shè)數(shù)據(jù)源獲取文檔審核資料,并根據(jù)預(yù)設(shè)文檔解析規(guī)則對(duì)所述文檔審核資料進(jìn)行解析;所述文檔審核資料包括用于表征文檔審核規(guī)則的審核材料、歷史文檔審核案例和標(biāo)準(zhǔn)文檔;
4、基于解析后的所述文檔審核資料構(gòu)建文檔審核數(shù)據(jù)庫(kù),并基于所述文檔審核數(shù)據(jù)庫(kù)構(gòu)建大模型微調(diào)數(shù)據(jù)集;
5、利用所述大模型微調(diào)數(shù)據(jù)集對(duì)預(yù)設(shè)文檔審核大模型進(jìn)行微調(diào),以得到微調(diào)后的目標(biāo)文檔審核大模型;
6、確定當(dāng)前的文檔審核任務(wù),并利用所述目標(biāo)文檔審核大模型對(duì)所述文檔審核任務(wù)對(duì)應(yīng)的待審核文檔進(jìn)行審核,以生成所述待審核文檔的審核報(bào)告。
7、可選的,所述根據(jù)預(yù)設(shè)文檔解析規(guī)則對(duì)所述文檔審核資料進(jìn)行解析,包括:
8、確定所述文檔審核資料的文檔格式,并確定各所述文檔格式的所述文檔審核資料對(duì)應(yīng)的所述預(yù)設(shè)文檔解析規(guī)則;
9、根據(jù)所述預(yù)設(shè)文檔解析規(guī)則對(duì)相應(yīng)的所述文檔審核資料進(jìn)行解析。
10、可選的,所述基于所述文檔審核數(shù)據(jù)庫(kù)構(gòu)建大模型微調(diào)數(shù)據(jù)集,包括:
11、基于所述文檔審核數(shù)據(jù)庫(kù)中的所述文檔審核資料構(gòu)建風(fēng)險(xiǎn)點(diǎn)識(shí)別數(shù)據(jù)集、風(fēng)險(xiǎn)等級(jí)評(píng)估數(shù)據(jù)集、整改建議生成數(shù)據(jù)集和證據(jù)鏈構(gòu)建數(shù)據(jù)集。
12、可選的,所述利用所述大模型微調(diào)數(shù)據(jù)集對(duì)預(yù)設(shè)文檔審核大模型進(jìn)行微調(diào),包括:
13、通過(guò)低秩適配器分別利用所述風(fēng)險(xiǎn)點(diǎn)識(shí)別數(shù)據(jù)集、所述風(fēng)險(xiǎn)等級(jí)評(píng)估數(shù)據(jù)集、所述整改建議生成數(shù)據(jù)集和所述證據(jù)鏈構(gòu)建數(shù)據(jù)集對(duì)所述預(yù)設(shè)文檔審核大模型進(jìn)行微調(diào)。
14、可選的,所述利用所述目標(biāo)文檔審核大模型對(duì)所述文檔審核任務(wù)對(duì)應(yīng)的待審核文檔進(jìn)行審核,包括:
15、確定所述文檔審核任務(wù)對(duì)應(yīng)的所述審核材料,并利用所述目標(biāo)文檔審核大模型基于所述審核材料對(duì)所述文檔審核任務(wù)對(duì)應(yīng)的所述待審核文檔進(jìn)行審核;
16、并且,所述確定所述文檔審核任務(wù)對(duì)應(yīng)的所述審核材料過(guò)程中,包括:
17、若接收到當(dāng)前所述文檔審核任務(wù)的補(bǔ)充材料,則基于所述補(bǔ)充材料更新所述審核材料,以便利用更新后的審核材料對(duì)所述文檔審核任務(wù)對(duì)應(yīng)的所述待審核文檔進(jìn)行審核。
18、可選的,所述利用所述目標(biāo)文檔審核大模型對(duì)所述文檔審核任務(wù)對(duì)應(yīng)的待審核文檔進(jìn)行審核,以生成所述待審核文檔的審核報(bào)告,包括:
19、利用所述目標(biāo)文檔審核大模型對(duì)所述文檔審核任務(wù)對(duì)應(yīng)的所述待審核文檔進(jìn)行審核,得到所述待審核文檔的風(fēng)險(xiǎn)點(diǎn);
20、對(duì)所述風(fēng)險(xiǎn)點(diǎn)對(duì)應(yīng)的文檔進(jìn)行語(yǔ)義解析,并基于得到的解析結(jié)果和所述審核材料確定所述風(fēng)險(xiǎn)點(diǎn)對(duì)應(yīng)的風(fēng)險(xiǎn)等級(jí);
21、利用所述目標(biāo)文檔審核大模型基于所述風(fēng)險(xiǎn)點(diǎn)的所述風(fēng)險(xiǎn)等級(jí)生成所述待審核文檔對(duì)應(yīng)的整改建議和審核證據(jù)鏈;
22、基于所述風(fēng)險(xiǎn)點(diǎn)、所述風(fēng)險(xiǎn)等級(jí)、所述整改建議和所述審核證據(jù)鏈生成所述待審核文檔的所述審核報(bào)告。
23、可選的,所述利用所述目標(biāo)文檔審核大模型對(duì)所述文檔審核任務(wù)對(duì)應(yīng)的待審核文檔進(jìn)行審核,以生成所述待審核文檔的審核報(bào)告之后,還包括:
24、獲取用戶(hù)基于所述審核報(bào)告發(fā)送的調(diào)整意見(jiàn),以根據(jù)所述調(diào)整意見(jiàn)基于所述審核報(bào)告生成所述待審核文檔的目標(biāo)報(bào)告;
25、基于所述審核報(bào)告和所述目標(biāo)報(bào)告更新所述大模型微調(diào)數(shù)據(jù)集,以便繼續(xù)利用更新后的所述大模型微調(diào)數(shù)據(jù)集對(duì)所述目標(biāo)文檔審核大模型進(jìn)行微調(diào)。
26、第二方面,本申請(qǐng)?zhí)峁┝艘环N基于大模型的文檔審核裝置,包括:
27、資料解析模塊,用于從若干預(yù)設(shè)數(shù)據(jù)源獲取文檔審核資料,并根據(jù)預(yù)設(shè)文檔解析規(guī)則對(duì)所述文檔審核資料進(jìn)行解析;所述文檔審核資料包括用于表征文檔審核規(guī)則的審核材料、歷史文檔審核案例和標(biāo)準(zhǔn)文檔;
28、數(shù)據(jù)集構(gòu)建模塊,用于基于解析后的所述文檔審核資料構(gòu)建文檔審核數(shù)據(jù)庫(kù),并基于所述文檔審核數(shù)據(jù)庫(kù)構(gòu)建大模型微調(diào)數(shù)據(jù)集;
29、模型微調(diào)模塊,用于利用所述大模型微調(diào)數(shù)據(jù)集對(duì)預(yù)設(shè)文檔審核大模型進(jìn)行微調(diào),以得到微調(diào)后的目標(biāo)文檔審核大模型;
30、文檔審核模塊,用于確定當(dāng)前的文檔審核任務(wù),并利用所述目標(biāo)文檔審核大模型對(duì)所述文檔審核任務(wù)對(duì)應(yīng)的待審核文檔進(jìn)行審核,以生成所述待審核文檔的審核報(bào)告。
31、第三方面,本申請(qǐng)?zhí)峁┝艘环N電子設(shè)備,所述電子設(shè)備包括處理器和存儲(chǔ)器;其中,所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)程序,所述計(jì)算機(jī)程序由所述處理器加載并執(zhí)行以實(shí)現(xiàn)前述的基于大模型的文檔審核方法。
32、第四方面,本申請(qǐng)?zhí)峁┝艘环N計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于保存計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)前述的基于大模型的文檔審核方法。
33、本申請(qǐng)中首先從若干預(yù)設(shè)數(shù)據(jù)源獲取文檔審核資料,并根據(jù)預(yù)設(shè)文檔解析規(guī)則對(duì)文檔審核資料進(jìn)行解析;上述文檔審核資料包括用于表征文檔審核規(guī)則的審核材料、歷史文檔審核案例和標(biāo)準(zhǔn)文檔;之后基于解析后的文檔審核資料構(gòu)建文檔審核數(shù)據(jù)庫(kù),并基于文檔審核數(shù)據(jù)庫(kù)構(gòu)建大模型微調(diào)數(shù)據(jù)集,以及利用大模型微調(diào)數(shù)據(jù)集對(duì)預(yù)設(shè)文檔審核大模型進(jìn)行微調(diào),以得到微調(diào)后的目標(biāo)文檔審核大模型,接著可以確定當(dāng)前的文檔審核任務(wù),并利用目標(biāo)文檔審核大模型對(duì)文檔審核任務(wù)對(duì)應(yīng)的待審核文檔進(jìn)行審核,以生成待審核文檔的審核報(bào)告。這樣一來(lái),本申請(qǐng)能夠通過(guò)構(gòu)建審核任務(wù)數(shù)據(jù)庫(kù)和微調(diào)審核大模型,實(shí)現(xiàn)智能化的文檔解析、利用審核知識(shí)庫(kù)檢索以及微調(diào)大模型的合規(guī)性判別,幫助用戶(hù)實(shí)現(xiàn)文檔合規(guī)性的自動(dòng)化、高效化、準(zhǔn)確化審核,從而實(shí)現(xiàn)了審計(jì)流程的自動(dòng)化、智能化,能夠高效實(shí)現(xiàn)文檔審核,大幅提升審計(jì)工作效率和準(zhǔn)確性。
1.一種基于大模型的文檔審核方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于大模型的文檔審核方法,其特征在于,所述根據(jù)預(yù)設(shè)文檔解析規(guī)則對(duì)所述文檔審核資料進(jìn)行解析,包括:
3.根據(jù)權(quán)利要求1所述的基于大模型的文檔審核方法,其特征在于,所述基于所述文檔審核數(shù)據(jù)庫(kù)構(gòu)建大模型微調(diào)數(shù)據(jù)集,包括:
4.根據(jù)權(quán)利要求3所述的基于大模型的文檔審核方法,其特征在于,所述利用所述大模型微調(diào)數(shù)據(jù)集對(duì)預(yù)設(shè)文檔審核大模型進(jìn)行微調(diào),包括:
5.根據(jù)權(quán)利要求1所述的基于大模型的文檔審核方法,其特征在于,所述利用所述目標(biāo)文檔審核大模型對(duì)所述文檔審核任務(wù)對(duì)應(yīng)的待審核文檔進(jìn)行審核,包括:
6.根據(jù)權(quán)利要求1所述的基于大模型的文檔審核方法,其特征在于,所述利用所述目標(biāo)文檔審核大模型對(duì)所述文檔審核任務(wù)對(duì)應(yīng)的待審核文檔進(jìn)行審核,以生成所述待審核文檔的審核報(bào)告,包括:
7.根據(jù)權(quán)利要求1至6任一項(xiàng)所述的基于大模型的文檔審核方法,其特征在于,所述利用所述目標(biāo)文檔審核大模型對(duì)所述文檔審核任務(wù)對(duì)應(yīng)的待審核文檔進(jìn)行審核,以生成所述待審核文檔的審核報(bào)告之后,還包括:
8.一種基于大模型的文檔審核裝置,其特征在于,包括:
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括處理器和存儲(chǔ)器;其中,所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)程序,所述計(jì)算機(jī)程序由所述處理器加載并執(zhí)行以實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的基于大模型的文檔審核方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,用于保存計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的基于大模型的文檔審核方法。