成人打一炮免费视频,亚洲天堂视频在线观看,97视频久久久,日本japanese护士色高清,五月婷婷丁香,日韩精品一级无码毛片免费,国产欧美日韩精品网红剧情演绎

用于訓(xùn)練語言模型的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品與流程

文檔序號(hào):41851884發(fā)布日期:2025-05-09 18:11閱讀:2來源:國知局
用于訓(xùn)練語言模型的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品與流程

本說明書的實(shí)施例總體涉及機(jī)器學(xué)習(xí)領(lǐng)域,具體涉及用于訓(xùn)練語言模型的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品。


背景技術(shù):

1、目前,機(jī)器學(xué)習(xí)行業(yè)的發(fā)展越來越迅速,隨著機(jī)器學(xué)習(xí)行業(yè)的發(fā)展,機(jī)器學(xué)習(xí)被逐漸應(yīng)用于各種場(chǎng)景。例如,機(jī)器學(xué)習(xí)可以被用于工業(yè)制造領(lǐng)域、圖像識(shí)別領(lǐng)域、自然語言處理領(lǐng)域、語音識(shí)別、自動(dòng)駕駛領(lǐng)域等等諸多領(lǐng)域。并且隨著機(jī)器學(xué)習(xí)的發(fā)展,各種領(lǐng)域之間還可以借助機(jī)器學(xué)習(xí)來進(jìn)行跨領(lǐng)域合作,例如可以將語音識(shí)別任務(wù)和圖形識(shí)別任務(wù)一起處理來實(shí)現(xiàn)語音控制生成圖片的工作,又例如可以將文本處理工作、語音識(shí)別任務(wù)和圖像識(shí)別任務(wù)一起進(jìn)行應(yīng)用來實(shí)現(xiàn)針對(duì)多模態(tài)內(nèi)容的處理。

2、隨著與機(jī)器學(xué)習(xí)相關(guān)的產(chǎn)業(yè)的發(fā)展的日益壯大,機(jī)器學(xué)習(xí)在某些領(lǐng)域的相關(guān)數(shù)據(jù)處理的能力越來越強(qiáng)大,在某些領(lǐng)域的優(yōu)勢(shì)也越來越明顯。尤其在文本處理、圖像處理領(lǐng)域、語音處理領(lǐng)域等,機(jī)器學(xué)習(xí)模型相關(guān)的技術(shù)層出不窮,現(xiàn)如今,機(jī)器學(xué)習(xí)模型的推理能力也變得越來越強(qiáng)大,機(jī)器學(xué)習(xí)模型的推理能力的日益強(qiáng)大同樣離不開針對(duì)機(jī)器學(xué)習(xí)模型的訓(xùn)練工作。因此,對(duì)于機(jī)器學(xué)習(xí)模型的訓(xùn)練,還有許多方面有待研究和提升。


技術(shù)實(shí)現(xiàn)思路

1、本說明書的實(shí)施例提供了一種用于訓(xùn)練語言模型的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品。

2、根據(jù)本說明書的第一方面,提供了一種用于訓(xùn)練語言模型的方法。該方法包括按照多個(gè)選擇策略,從用戶交互過的對(duì)象中選擇多組對(duì)象。該方法還包括由語言模型基于多個(gè)選擇策略和多組對(duì)象,確定是否向用戶推薦目標(biāo)對(duì)象的多個(gè)預(yù)測(cè)結(jié)果。該方法還包括基于多個(gè)預(yù)測(cè)結(jié)果,確定與多組對(duì)象相關(guān)的多個(gè)第一損失,多個(gè)第一損失用于訓(xùn)練語言模型。

3、在本說明書的第二方面中,提供了一種用于訓(xùn)練語言模型的裝置。該裝置包括對(duì)象選擇模塊,被配置為按照多個(gè)選擇策略,從用戶交互過的對(duì)象中選擇多組對(duì)象;預(yù)測(cè)結(jié)果確定模塊,被配置為由語言模型基于多個(gè)選擇策略和多組對(duì)象,確定是否向用戶推薦目標(biāo)對(duì)象的多個(gè)預(yù)測(cè)結(jié)果;以及第一損失確定模塊,被配置為基于多個(gè)預(yù)測(cè)結(jié)果,確定與多組對(duì)象相關(guān)的多個(gè)第一損失,多個(gè)第一損失用于訓(xùn)練語言模型。

4、在本說明書的第三方面中,提供了一種計(jì)算設(shè)備,包括處理器;以及與處理器耦合的存儲(chǔ)器,存儲(chǔ)器具有存儲(chǔ)于其中的指令,指令在被處理器執(zhí)行時(shí),使得計(jì)算設(shè)備實(shí)現(xiàn)根據(jù)本說明書的第一方面的方法。

5、在本說明書的第四方面中,提供了一種計(jì)算機(jī)程序產(chǎn)品。該計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)本說明書的第一方面的方法。

6、應(yīng)當(dāng)理解,該內(nèi)容部分中所描述的內(nèi)容并非旨在限定本說明書的實(shí)施例的關(guān)鍵或重要特征,亦非用于限制本說明書的范圍。本說明書的其它特征將通過以下的描述變得容易理解。



技術(shù)特征:

1.一種用于訓(xùn)練語言模型的方法,包括:

2.根據(jù)權(quán)利要求1所述的方法,其中確定所述多個(gè)預(yù)測(cè)結(jié)果包括:

3.根據(jù)權(quán)利要求2所述的方法,其中預(yù)測(cè)結(jié)果中還包括是否向所述用戶推薦目標(biāo)對(duì)象的概率,并且確定所述多個(gè)預(yù)測(cè)結(jié)果包括:

4.根據(jù)權(quán)利要求1所述的方法,其中確定所述多個(gè)第一損失包括:

5.根據(jù)權(quán)利要求1所述的方法,還包括:

6.根據(jù)權(quán)利要求5所述的方法,其中所述語言模型中包括分類器,并且確定所述多個(gè)權(quán)重包括:

7.根據(jù)權(quán)利要求5所述的方法,訓(xùn)練所述語言模型包括:

8.根據(jù)權(quán)利要求7所述的方法,其中確定所述第二總損失包括:

9.根據(jù)權(quán)利要求1所述的方法,其中選擇所述多組對(duì)象包括:

10.根據(jù)權(quán)利要求1所述的方法,其中所述多個(gè)選擇策略包括以下至少兩項(xiàng):

11.根據(jù)權(quán)利要求1至11中任一項(xiàng)所述的方法,還包括:

12.一種用于訓(xùn)練語言模型的裝置,包括:

13.一種計(jì)算設(shè)備,包括:

14.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行以實(shí)現(xiàn)根據(jù)權(quán)利要求1至11中任一項(xiàng)所述的方法。


技術(shù)總結(jié)
本說明書的實(shí)施例涉及用于訓(xùn)練語言模型的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品。該方法包括按照多個(gè)選擇策略,從用戶交互過的對(duì)象中選擇多組對(duì)象。該方法還包括由語言模型基于多個(gè)選擇策略和多組對(duì)象,確定是否向用戶推薦目標(biāo)對(duì)象的多個(gè)預(yù)測(cè)結(jié)果。該方法還包括基于多個(gè)預(yù)測(cè)結(jié)果,確定與多組對(duì)象相關(guān)的多個(gè)第一損失,多個(gè)第一損失用于訓(xùn)練語言模型。

技術(shù)研發(fā)人員:劉天賜,方飛騰,耿斌宗,沈彬,何勇,張亮,莫林劍,朱興,楊敏
受保護(hù)的技術(shù)使用者:支付寶(杭州)信息技術(shù)有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/8
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1