本說明書的實(shí)施例總體涉及機(jī)器學(xué)習(xí)領(lǐng)域,具體涉及用于訓(xùn)練語言模型的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品。
背景技術(shù):
1、目前,機(jī)器學(xué)習(xí)行業(yè)的發(fā)展越來越迅速,隨著機(jī)器學(xué)習(xí)行業(yè)的發(fā)展,機(jī)器學(xué)習(xí)被逐漸應(yīng)用于各種場(chǎng)景。例如,機(jī)器學(xué)習(xí)可以被用于工業(yè)制造領(lǐng)域、圖像識(shí)別領(lǐng)域、自然語言處理領(lǐng)域、語音識(shí)別、自動(dòng)駕駛領(lǐng)域等等諸多領(lǐng)域。并且隨著機(jī)器學(xué)習(xí)的發(fā)展,各種領(lǐng)域之間還可以借助機(jī)器學(xué)習(xí)來進(jìn)行跨領(lǐng)域合作,例如可以將語音識(shí)別任務(wù)和圖形識(shí)別任務(wù)一起處理來實(shí)現(xiàn)語音控制生成圖片的工作,又例如可以將文本處理工作、語音識(shí)別任務(wù)和圖像識(shí)別任務(wù)一起進(jìn)行應(yīng)用來實(shí)現(xiàn)針對(duì)多模態(tài)內(nèi)容的處理。
2、隨著與機(jī)器學(xué)習(xí)相關(guān)的產(chǎn)業(yè)的發(fā)展的日益壯大,機(jī)器學(xué)習(xí)在某些領(lǐng)域的相關(guān)數(shù)據(jù)處理的能力越來越強(qiáng)大,在某些領(lǐng)域的優(yōu)勢(shì)也越來越明顯。尤其在文本處理、圖像處理領(lǐng)域、語音處理領(lǐng)域等,機(jī)器學(xué)習(xí)模型相關(guān)的技術(shù)層出不窮,現(xiàn)如今,機(jī)器學(xué)習(xí)模型的推理能力也變得越來越強(qiáng)大,機(jī)器學(xué)習(xí)模型的推理能力的日益強(qiáng)大同樣離不開針對(duì)機(jī)器學(xué)習(xí)模型的訓(xùn)練工作。因此,對(duì)于機(jī)器學(xué)習(xí)模型的訓(xùn)練,還有許多方面有待研究和提升。
技術(shù)實(shí)現(xiàn)思路
1、本說明書的實(shí)施例提供了一種用于訓(xùn)練語言模型的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品。
2、根據(jù)本說明書的第一方面,提供了一種用于訓(xùn)練語言模型的方法。該方法包括按照多個(gè)選擇策略,從用戶交互過的對(duì)象中選擇多組對(duì)象。該方法還包括由語言模型基于多個(gè)選擇策略和多組對(duì)象,確定是否向用戶推薦目標(biāo)對(duì)象的多個(gè)預(yù)測(cè)結(jié)果。該方法還包括基于多個(gè)預(yù)測(cè)結(jié)果,確定與多組對(duì)象相關(guān)的多個(gè)第一損失,多個(gè)第一損失用于訓(xùn)練語言模型。
3、在本說明書的第二方面中,提供了一種用于訓(xùn)練語言模型的裝置。該裝置包括對(duì)象選擇模塊,被配置為按照多個(gè)選擇策略,從用戶交互過的對(duì)象中選擇多組對(duì)象;預(yù)測(cè)結(jié)果確定模塊,被配置為由語言模型基于多個(gè)選擇策略和多組對(duì)象,確定是否向用戶推薦目標(biāo)對(duì)象的多個(gè)預(yù)測(cè)結(jié)果;以及第一損失確定模塊,被配置為基于多個(gè)預(yù)測(cè)結(jié)果,確定與多組對(duì)象相關(guān)的多個(gè)第一損失,多個(gè)第一損失用于訓(xùn)練語言模型。
4、在本說明書的第三方面中,提供了一種計(jì)算設(shè)備,包括處理器;以及與處理器耦合的存儲(chǔ)器,存儲(chǔ)器具有存儲(chǔ)于其中的指令,指令在被處理器執(zhí)行時(shí),使得計(jì)算設(shè)備實(shí)現(xiàn)根據(jù)本說明書的第一方面的方法。
5、在本說明書的第四方面中,提供了一種計(jì)算機(jī)程序產(chǎn)品。該計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)本說明書的第一方面的方法。
6、應(yīng)當(dāng)理解,該內(nèi)容部分中所描述的內(nèi)容并非旨在限定本說明書的實(shí)施例的關(guān)鍵或重要特征,亦非用于限制本說明書的范圍。本說明書的其它特征將通過以下的描述變得容易理解。
1.一種用于訓(xùn)練語言模型的方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中確定所述多個(gè)預(yù)測(cè)結(jié)果包括:
3.根據(jù)權(quán)利要求2所述的方法,其中預(yù)測(cè)結(jié)果中還包括是否向所述用戶推薦目標(biāo)對(duì)象的概率,并且確定所述多個(gè)預(yù)測(cè)結(jié)果包括:
4.根據(jù)權(quán)利要求1所述的方法,其中確定所述多個(gè)第一損失包括:
5.根據(jù)權(quán)利要求1所述的方法,還包括:
6.根據(jù)權(quán)利要求5所述的方法,其中所述語言模型中包括分類器,并且確定所述多個(gè)權(quán)重包括:
7.根據(jù)權(quán)利要求5所述的方法,訓(xùn)練所述語言模型包括:
8.根據(jù)權(quán)利要求7所述的方法,其中確定所述第二總損失包括:
9.根據(jù)權(quán)利要求1所述的方法,其中選擇所述多組對(duì)象包括:
10.根據(jù)權(quán)利要求1所述的方法,其中所述多個(gè)選擇策略包括以下至少兩項(xiàng):
11.根據(jù)權(quán)利要求1至11中任一項(xiàng)所述的方法,還包括:
12.一種用于訓(xùn)練語言模型的裝置,包括:
13.一種計(jì)算設(shè)備,包括:
14.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行以實(shí)現(xiàn)根據(jù)權(quán)利要求1至11中任一項(xiàng)所述的方法。