本發(fā)明涉及物料推薦領(lǐng)域,具體涉及一種物料召回方法、系統(tǒng)及計算機可讀存儲介質(zhì)及計算機設(shè)備。
背景技術(shù):
1、在微博的視頻后推薦業(yè)務(wù)中,采用目前業(yè)內(nèi)廣泛使用的推薦系統(tǒng)架構(gòu)。為了給用戶提供個性化的信息流推薦服務(wù),推薦引擎會先后經(jīng)過召回(從幾百萬物料中獲取近萬條)->粗排(模型篩選后保留千條物料)->精排(對千條物料打分排序)->規(guī)則系統(tǒng)(選出排名最高且符合策略的10條)階段。在召回階段,模型召回分為規(guī)則召回、協(xié)同召回、向量召回、樹召回等,其中協(xié)同召回包括了物料協(xié)同過濾召回,物料協(xié)同過濾召回一般通過矩陣分解、圖、深度網(wǎng)絡(luò)等方法實現(xiàn)。
2、現(xiàn)有技術(shù)中,物料協(xié)同過濾召回實現(xiàn)離線方法是deepwalk圖算法,構(gòu)建用戶和物料的交互行為圖,只利用了用戶的id信息和物料的id信息(沒有利用用戶和物料的其他特征),通過skip?gram訓(xùn)練得到物料的embedding,構(gòu)建faiss索引,得到每個物料的topn相似物料,將物料的相似物料和相似度得分寫入redis里,供線上使用;線上用戶請求,得到用戶過去一段時間交互過的物料列表,對于觸發(fā)列表中的每一個item,讀取redis里物料的相似物料數(shù)據(jù)得到與其最相似的topn物料作為協(xié)同物料召回的結(jié)果,作為后續(xù)鏈路粗排的部分輸入以推薦給用戶。
3、在實現(xiàn)本發(fā)明過程中,申請人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題:
4、使用的deepwalk圖算法中,只有物料節(jié)點的id信息,缺失很多信息,表達能力不足,召回物料的數(shù)量受限,會漏下很多相似物料。
技術(shù)實現(xiàn)思路
1、本發(fā)明實施例提供一種物料召回方法、系統(tǒng)、存儲介質(zhì)及計算機設(shè)備,能夠解決現(xiàn)有技術(shù)中的“使用的deepwalk圖算法中,只有物料節(jié)點的id信息,缺失很多信息,表達能力不足,召回物料的數(shù)量受限,會漏下很多相似物料”的技術(shù)問題。
2、為達上述目的,第一方面,本發(fā)明實施例提供一種物料召回方法,包括:
3、收目標(biāo)用戶的物料推薦請求,基于所述目標(biāo)用戶的交互行為數(shù)據(jù),獲取第二時間范圍內(nèi)所述目標(biāo)用戶具有交互行為、且滿足設(shè)定條件的物料,作為觸發(fā)物料;
4、基于周期性更新的物料數(shù)據(jù)庫,確定每個觸發(fā)物料對應(yīng)的相似物料,將所有觸發(fā)物料對應(yīng)的相似物料作為待篩選物料;所述物料數(shù)據(jù)庫中記錄第一時間范圍內(nèi)每個物料及其對應(yīng)的至少一個相似物料;所述物料數(shù)據(jù)庫是通過將第一時間范圍內(nèi)所有用戶的交互行為數(shù)據(jù)輸入eges圖算法,訓(xùn)練得到每個物料對應(yīng)的物料嵌入向量后生成的;
5、確定每個待篩選物料與對應(yīng)的觸發(fā)物料之間的相關(guān)性分?jǐn)?shù)值,基于所述相關(guān)性分?jǐn)?shù)值從所有待篩選物料中確定所述目標(biāo)用戶對應(yīng)的召回物料進行召回;所述相關(guān)性分?jǐn)?shù)值表征所述待篩選物料與對應(yīng)的觸發(fā)物料之間的相似度。
6、第二方面,本發(fā)明實施例提供一種物料召回系統(tǒng),包括:
7、觸發(fā)物料獲取單元,用于接收目標(biāo)用戶的物料推薦請求,基于所述目標(biāo)用戶的交互行為數(shù)據(jù),獲取第二時間范圍內(nèi)所述目標(biāo)用戶具有交互行為、且滿足設(shè)定條件的物料,作為觸發(fā)物料;
8、第一物料召回單元,用于基于周期性更新的物料數(shù)據(jù)庫,確定每個觸發(fā)物料對應(yīng)的相似物料,將所有觸發(fā)物料對應(yīng)的相似物料作為待篩選物料;所述物料數(shù)據(jù)庫中記錄第一時間范圍內(nèi)每個物料及其對應(yīng)的至少一個相似物料;所述物料數(shù)據(jù)庫是通過將第一時間范圍內(nèi)所有用戶的交互行為數(shù)據(jù)輸入eges圖算法,訓(xùn)練得到每個物料對應(yīng)的物料嵌入向量后生成的;
9、第二物料召回單元,用于確定每個待篩選物料與對應(yīng)的觸發(fā)物料之間的相關(guān)性分?jǐn)?shù)值,基于所述相關(guān)性分?jǐn)?shù)值從所有待篩選物料中確定所述目標(biāo)用戶對應(yīng)的召回物料進行召回;所述相關(guān)性分?jǐn)?shù)值表征所述待篩選物料與對應(yīng)的觸發(fā)物料之間的相似度。
10、第三方面,本發(fā)明實施例提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲一個或多個程序,所述一個或多個程序當(dāng)被計算機設(shè)備執(zhí)行時,使得所述計算機設(shè)備執(zhí)行前述的物料召回方法。
11、上述技術(shù)方案具有如下有益效果:提前離線采用eges圖算法,對具有用戶交互行為的物料進行訓(xùn)練,訓(xùn)練得到每個物料對應(yīng)的物料嵌入向量后,構(gòu)建每個物料的相似物料,物料相關(guān)性更好,在離線時就能夠召回更多相似物料,并且冷物料(曝光量少)能夠表現(xiàn)的更好。當(dāng)具有目標(biāo)用戶的物料推薦請求時,獲取第二時間范圍內(nèi)所述目標(biāo)用戶具有交互行為、且滿足設(shè)定條件的物料,作為觸發(fā)物料,獲取觸發(fā)物料的相似物料,基于相關(guān)性分?jǐn)?shù)值召回物料自目標(biāo)用戶的所有相似物料中,召回的物料相似度更高,且不會漏下物料。
1.一種物料召回方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述物料召回方法,其特征在于,還包括:
3.根據(jù)權(quán)利要求2所述物料召回方法,其特征在于,所述周期性獲取第一時間范圍內(nèi)所有用戶的交互行為數(shù)據(jù),通過eges圖算法構(gòu)建包括導(dǎo)流位和推薦位的物料二部圖,包括:
4.根據(jù)權(quán)利要求3所述物料召回方法,其特征在于,所述基于所述物料二部圖、以及每個物料的特征信息得到每個物料對應(yīng)的物料嵌入向量,包括:
5.根據(jù)權(quán)利要求3所述物料召回方法,其特征在于,所述針對所述物料二部圖內(nèi)的每個物料,將所述物料作為起點物料,根據(jù)有偏隨機游走在所述物料二部圖內(nèi)的邊上游走,根據(jù)連續(xù)游走所經(jīng)過的物料,順序構(gòu)建所述物料對應(yīng)的物料序列,具體包括:
6.根據(jù)權(quán)利要求4所述物料召回方法,其特征在于,所述針對每組物料序列,基于所述物料序列內(nèi)的各物料的特征信息通過skip-gram模型進行訓(xùn)練,輸出所述物料序列的每個物料對應(yīng)的物料嵌入向量,包括:
7.根據(jù)權(quán)利要求2所述物料召回方法,其特征在于,所述基于每個物料對應(yīng)的物料嵌入向量進行相似度計算,得到每個物料對應(yīng)的至少一個相似物料,包括:
8.根據(jù)權(quán)利要求1所述物料召回方法,其特征在于,所述確定每個待篩選物料與對應(yīng)的觸發(fā)物料之間的相關(guān)性分?jǐn)?shù)值,包括:
9.一種物料召回系統(tǒng),其特征在于,包括:
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲一個或多個程序,所述一個或多個程序當(dāng)被計算機設(shè)備執(zhí)行時,使得所述計算機設(shè)備執(zhí)行權(quán)利要求1-8中任意一項所述的物料召回方法。