用于訓(xùn)練語言模型的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品與流程

文檔序號(hào)：41851884發(fā)布日期：2025-05-09 18:11閱讀：2來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

用于訓(xùn)練語言模型的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品與流程

本說明書的實(shí)施例總體涉及機(jī)器學(xué)習(xí)領(lǐng)域，具體涉及用于訓(xùn)練語言模型的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品。

背景技術(shù)：

1、目前，機(jī)器學(xué)習(xí)行業(yè)的發(fā)展越來越迅速，隨著機(jī)器學(xué)習(xí)行業(yè)的發(fā)展，機(jī)器學(xué)習(xí)被逐漸應(yīng)用于各種場(chǎng)景。例如，機(jī)器學(xué)習(xí)可以被用于工業(yè)制造領(lǐng)域、圖像識(shí)別領(lǐng)域、自然語言處理領(lǐng)域、語音識(shí)別、自動(dòng)駕駛領(lǐng)域等等諸多領(lǐng)域。并且隨著機(jī)器學(xué)習(xí)的發(fā)展，各種領(lǐng)域之間還可以借助機(jī)器學(xué)習(xí)來進(jìn)行跨領(lǐng)域合作，例如可以將語音識(shí)別任務(wù)和圖形識(shí)別任務(wù)一起處理來實(shí)現(xiàn)語音控制生成圖片的工作，又例如可以將文本處理工作、語音識(shí)別任務(wù)和圖像識(shí)別任務(wù)一起進(jìn)行應(yīng)用來實(shí)現(xiàn)針對(duì)多模態(tài)內(nèi)容的處理。

2、隨著與機(jī)器學(xué)習(xí)相關(guān)的產(chǎn)業(yè)的發(fā)展的日益壯大，機(jī)器學(xué)習(xí)在某些領(lǐng)域的相關(guān)數(shù)據(jù)處理的能力越來越強(qiáng)大，在某些領(lǐng)域的優(yōu)勢(shì)也越來越明顯。尤其在文本處理、圖像處理領(lǐng)域、語音處理領(lǐng)域等，機(jī)器學(xué)習(xí)模型相關(guān)的技術(shù)層出不窮，現(xiàn)如今，機(jī)器學(xué)習(xí)模型的推理能力也變得越來越強(qiáng)大，機(jī)器學(xué)習(xí)模型的推理能力的日益強(qiáng)大同樣離不開針對(duì)機(jī)器學(xué)習(xí)模型的訓(xùn)練工作。因此，對(duì)于機(jī)器學(xué)習(xí)模型的訓(xùn)練，還有許多方面有待研究和提升。

技術(shù)實(shí)現(xiàn)思路

1、本說明書的實(shí)施例提供了一種用于訓(xùn)練語言模型的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品。

2、根據(jù)本說明書的第一方面，提供了一種用于訓(xùn)練語言模型的方法。該方法包括按照多個(gè)選擇策略，從用戶交互過的對(duì)象中選擇多組對(duì)象。該方法還包括由語言模型基于多個(gè)選擇策略和多組對(duì)象，確定是否向用戶推薦目標(biāo)對(duì)象的多個(gè)預(yù)測(cè)結(jié)果。該方法還包括基于多個(gè)預(yù)測(cè)結(jié)果，確定與多組對(duì)象相關(guān)的多個(gè)第一損失，多個(gè)第一損失用于訓(xùn)練語言模型。

3、在本說明書的第二方面中，提供了一種用于訓(xùn)練語言模型的裝置。該裝置包括對(duì)象選擇模塊，被配置為按照多個(gè)選擇策略，從用戶交互過的對(duì)象中選擇多組對(duì)象；預(yù)測(cè)結(jié)果確定模塊，被配置為由語言模型基于多個(gè)選擇策略和多組對(duì)象，確定是否向用戶推薦目標(biāo)對(duì)象的多個(gè)預(yù)測(cè)結(jié)果；以及第一損失確定模塊，被配置為基于多個(gè)預(yù)測(cè)結(jié)果，確定與多組對(duì)象相關(guān)的多個(gè)第一損失，多個(gè)第一損失用于訓(xùn)練語言模型。

4、在本說明書的第三方面中，提供了一種計(jì)算設(shè)備，包括處理器；以及與處理器耦合的存儲(chǔ)器，存儲(chǔ)器具有存儲(chǔ)于其中的指令，指令在被處理器執(zhí)行時(shí)，使得計(jì)算設(shè)備實(shí)現(xiàn)根據(jù)本說明書的第一方面的方法。

5、在本說明書的第四方面中，提供了一種計(jì)算機(jī)程序產(chǎn)品。該計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序，該計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)本說明書的第一方面的方法。

6、應(yīng)當(dāng)理解，該內(nèi)容部分中所描述的內(nèi)容并非旨在限定本說明書的實(shí)施例的關(guān)鍵或重要特征，亦非用于限制本說明書的范圍。本說明書的其它特征將通過以下的描述變得容易理解。

技術(shù)特征：

1.一種用于訓(xùn)練語言模型的方法，包括：

2.根據(jù)權(quán)利要求1所述的方法，其中確定所述多個(gè)預(yù)測(cè)結(jié)果包括：

3.根據(jù)權(quán)利要求2所述的方法，其中預(yù)測(cè)結(jié)果中還包括是否向所述用戶推薦目標(biāo)對(duì)象的概率，并且確定所述多個(gè)預(yù)測(cè)結(jié)果包括：

4.根據(jù)權(quán)利要求1所述的方法，其中確定所述多個(gè)第一損失包括：

5.根據(jù)權(quán)利要求1所述的方法，還包括：

6.根據(jù)權(quán)利要求5所述的方法，其中所述語言模型中包括分類器，并且確定所述多個(gè)權(quán)重包括：

7.根據(jù)權(quán)利要求5所述的方法，訓(xùn)練所述語言模型包括：

8.根據(jù)權(quán)利要求7所述的方法，其中確定所述第二總損失包括：

9.根據(jù)權(quán)利要求1所述的方法，其中選擇所述多組對(duì)象包括：

10.根據(jù)權(quán)利要求1所述的方法，其中所述多個(gè)選擇策略包括以下至少兩項(xiàng)：

11.根據(jù)權(quán)利要求1至11中任一項(xiàng)所述的方法，還包括：

12.一種用于訓(xùn)練語言模型的裝置，包括：

13.一種計(jì)算設(shè)備，包括：

14.一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行以實(shí)現(xiàn)根據(jù)權(quán)利要求1至11中任一項(xiàng)所述的方法。

技術(shù)總結(jié)
本說明書的實(shí)施例涉及用于訓(xùn)練語言模型的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品。該方法包括按照多個(gè)選擇策略，從用戶交互過的對(duì)象中選擇多組對(duì)象。該方法還包括由語言模型基于多個(gè)選擇策略和多組對(duì)象，確定是否向用戶推薦目標(biāo)對(duì)象的多個(gè)預(yù)測(cè)結(jié)果。該方法還包括基于多個(gè)預(yù)測(cè)結(jié)果，確定與多組對(duì)象相關(guān)的多個(gè)第一損失，多個(gè)第一損失用于訓(xùn)練語言模型。

技術(shù)研發(fā)人員：劉天賜,方飛騰,耿斌宗,沈彬,何勇,張亮,莫林劍,朱興,楊敏
受保護(hù)的技術(shù)使用者：支付寶（杭州）信息技術(shù)有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/5/8

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：劉天賜,方飛騰,耿斌宗,沈彬,何勇,張亮,莫林劍,朱興,楊敏
技術(shù)所有人：支付寶（杭州）信息技術(shù)有限公司
我是此專利的發(fā)明人

上一篇：電池組管理集成電路BMIC、電池管理系統(tǒng)BMS的制作方法
上一篇：一種印刷清晰的瓦楞紙板印刷裝置的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

成人打一炮免费视频,亚洲天堂视频在线观看,97视频久久久,日本japanese护士色高清,五月婷婷丁香,日韩精品一级无码毛片免费,国产欧美日韩精品网红剧情演绎

用于訓(xùn)練語言模型的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品與流程

用于訓(xùn)練語言模型的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品與流程