本公開涉及通信,尤其涉及一種信息處理方法、系統(tǒng)、電子設備、存儲介質(zhì)及程序產(chǎn)品。
背景技術(shù):
1、大語言模型(llm)是指使用大量文本數(shù)據(jù)訓練的深度學習模型,可以生成自然語言文本或理解語言文本的含義。llm可以處理多種自然語言任務,如文本分類、問答、對話等,是通向人工智能的一條重要途徑。然而,在實際使用中,可能會出現(xiàn)llm生成的內(nèi)容與給定的輸入不一致的情況或者和事實不符的情況。通常,將出現(xiàn)的上述情況稱為llm出現(xiàn)了“幻覺”。因此,如何解決llm出現(xiàn)“幻覺”的問題也是目前l(fā)lm研究的重要課題之一。
技術(shù)實現(xiàn)思路
1、有鑒于此,本公開的實施例提供一種信息處理方法,可以有效解決目標生成模型所生成內(nèi)容與給定的輸入不一致或者與事實不符的問題。
2、上述信息處理方法包括:接收來自用戶的第一交互信息;基于所述第一交互信息調(diào)用經(jīng)過訓練的目標生成模型得到與所述第一交互信息對應的第二交互信息;從知識庫獲取與所述第二交互信息相關(guān)的知識內(nèi)容;以及基于所述知識內(nèi)容對所述第二交互信息進行驗證。
3、在本公開的實施例中,所述從知識庫獲取與所述第二交互信息相關(guān)的知識內(nèi)容包括:從所述第二交互信息中提取所述第二交互信息的關(guān)鍵信息;基于所述第二交互信息的關(guān)鍵信息調(diào)用所述知識庫獲取相關(guān)的知識內(nèi)容;以及將獲取的知識內(nèi)容作為所述第二交互信息相關(guān)的知識內(nèi)容。
4、在本公開的實施例中,所述從知識庫獲取與所述第二交互信息相關(guān)的知識內(nèi)容包括:從所述第一交互信息中提取所述第一交互信息的關(guān)鍵信息;基于所述第一交互信息的關(guān)鍵信息調(diào)用所述知識庫獲取相關(guān)的知識內(nèi)容;以及將獲取的知識內(nèi)容作為所述第二交互信息相關(guān)的知識內(nèi)容。
5、在本公開的實施例中,所述從知識庫獲取與所述第二交互信息相關(guān)的知識內(nèi)容包括:從所述第一交互信息中提取所述第一交互信息的關(guān)鍵信息;從所述第二交互信息中提取所述第二交互信息的關(guān)鍵信息;基于所述第一交互信息的關(guān)鍵信息以及所述第二交互信息的關(guān)鍵信息調(diào)用所述知識庫獲取相關(guān)的知識內(nèi)容;以及將獲取的知識內(nèi)容作為所述第二交互信息相關(guān)的知識內(nèi)容。
6、在本公開的實施例中,其中,所述從所述第二交互信息中提取所述第二交互信息的關(guān)鍵信息包括:從所述目標生成模型獲取所述第二交互信息的關(guān)鍵信息;或者,基于經(jīng)過訓練的關(guān)鍵信息提取模型,從所述第二交互信息中提取所述第二交互信息的關(guān)鍵信息;或者,對所述第二交互信息進行意圖識別和實體識別,并將識別得到的意圖信息以及實體信息作為所述第二交互信息的關(guān)鍵信息。
7、在本公開的實施例中,其中,所述從所述第一交互信息中提取所述第一交互信息的關(guān)鍵信息包括:基于經(jīng)過訓練的關(guān)鍵信息提取模型,從所述第一交互信息中提取所述第一交互信息的關(guān)鍵信息;或者,對所述第一交互信息進行意圖識別和實體識別,并將識別得到的意圖信息以及實體信息作為所述第一交互信息的關(guān)鍵信息。
8、在本公開的實施例中,其中,所述基于所述知識內(nèi)容對所述第二交互信息進行驗證包括:將所述知識內(nèi)容作為前提;將所述第二交互信息作為假設;調(diào)用經(jīng)過訓練的推理模型確定所述前提和所述假設之間的邏輯關(guān)系;以及基于所述前提和所述假設之間的邏輯關(guān)系確定所述第二交互信息是否通過驗證。
9、在本公開的實施例中,所述基于所述知識內(nèi)容對所述第二交互信息進行驗證包括:基于所述知識內(nèi)容以及所述第二交互信息調(diào)用經(jīng)過訓練的準確性預測模型,確定所述第二交互信息是否通過驗證。
10、在本公開的實施例中,所述基于所述第一交互信息調(diào)用經(jīng)過訓練的目標生成模型得到與所述第一交互信息對應的第二交互信息包括:基于所述第一交互信息的關(guān)鍵信息調(diào)用知識庫獲取與所述第一交互信息對應的知識內(nèi)容;基于所述關(guān)鍵信息以及所述知識內(nèi)容構(gòu)建與所述第一交互信息對應的提示信息;以及基于所述提示信息調(diào)用所述目標生成模型得到與所述提示信息對應的第二交互信息。
11、基于上述信息處理方法,本公開的一些實施例還提供了一種信息處理系統(tǒng),包括:
12、知識庫,包括用于存儲知識內(nèi)容的一個或多個數(shù)據(jù)庫;
13、用戶界面,用于接收來自用戶的第一交互信息;
14、交互模塊,用于基于所述第一交互信息調(diào)用經(jīng)過訓練的目標生成模型得到所述第二交互信息;
15、知識內(nèi)容提取模塊,用于從知識庫獲取與所述第二交互信息相關(guān)的知識內(nèi)容;
16、風控模塊,用于基于所述知識內(nèi)容對所述第二交互信息進行驗證。
17、此外,本公開的實施例還提供了一種電子設備,包括:存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)上述信息處理方法。
18、本公開的實施例還提供了一種非暫態(tài)計算機可讀存儲介質(zhì),所述非暫態(tài)計算機可讀存儲介質(zhì)存儲計算機指令,所述計算機指令用于使計算機執(zhí)行上述信息處理方法。
19、本公開的實施例還提供了一種計算機程序產(chǎn)品,包括計算機程序指令,當所述計算機程序指令在計算機上運行時,使得計算機執(zhí)行上述信息處理方法。
20、通過上述信息處理方法及相關(guān)設備,在接收到用戶輸入的第一交互信息后,可以通過調(diào)用預先訓練好的目標生成模型,生成作為上述第一交互信息的回復的第二交互信息。接下來,再基于預先建立的知識庫對上述目標生成模型生成的第二交互信息進行驗證。這樣,一方面可以保障輸出的第二交互信息與用戶所輸入第一交互信息之間的一致性;另一方面還可以保障輸出的第二交互信息符合事實,從而有效解決目標生成模型出現(xiàn)“幻覺”的問題。
21、此外,在本公開的實施例中,上述目標生成模型可以基于llm訓練得到,因此,上述信息處理方法可以有效支持基于llm的人機交互應用,充分利用llm在自然語言處理方面的優(yōu)勢,實現(xiàn)高效并且準確的信息處理。
22、更進一步,上述對第二交互信息進行驗證的過程也可以通過經(jīng)過訓練的llm實現(xiàn),從而進一步充分利用llm在自然語言處理方面性能的優(yōu)勢,提升針對用戶回復的準確性,以獲得更優(yōu)的人機交互效果。
1.一種信息處理方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,所述從知識庫獲取與所述第二交互信息相關(guān)的知識內(nèi)容包括:
3.根據(jù)權(quán)利要求1所述的方法,所述從知識庫獲取與所述第二交互信息相關(guān)的知識內(nèi)容包括:
4.根據(jù)權(quán)利要求1所述的方法,所述從知識庫獲取與所述第二交互信息相關(guān)的知識內(nèi)容包括:
5.根據(jù)權(quán)利要求2或4所述的方法,其中,所述從所述第二交互信息中提取所述第二交互信息的關(guān)鍵信息包括:
6.根據(jù)權(quán)利要求3或4所述的方法,其中,所述從所述第一交互信息中提取所述第一交互信息的關(guān)鍵信息包括:
7.根據(jù)權(quán)利要求1所述的方法,其中,所述基于所述知識內(nèi)容對所述第二交互信息進行驗證包括:
8.根據(jù)權(quán)利要求1所述的方法,其中,所述基于所述知識內(nèi)容對所述第二交互信息進行驗證包括:
9.根據(jù)權(quán)利要求3或4所述的方法,其中,所述基于所述第一交互信息調(diào)用經(jīng)過訓練的生成模型得到與所述第一交互信息對應的第二交互信息包括:
10.一種信息處理系統(tǒng),包括:
11.一種電子設備,包括:存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)如權(quán)利要求1-4以及7-8中任意一項所述的信息處理方法。
12.一種非暫態(tài)計算機可讀存儲介質(zhì),所述非暫態(tài)計算機可讀存儲介質(zhì)存儲計算機指令,所述計算機指令用于使計算機執(zhí)行權(quán)利要求1-4以及7-8中任意一項所述的信息處理方法。
13.一種計算機程序產(chǎn)品,包括計算機程序指令,當所述計算機程序指令在計算機上運行時,使得計算機執(zhí)行如權(quán)利要求1-4以及7-8中任意一項所述的信息處理方法。