本發(fā)明涉及人工智能,尤其涉及一種基于高效主動學習的模型測試時自適應方法及系統(tǒng)。
背景技術:
1、測試時自適應(test-time?adaptation,tta)方法旨在模型部署階段將預訓練模型(pre-trained?model)適應到新的數(shù)據(jù)分布。tta在自動駕駛等動態(tài)場景中至關重要,在這些場景中,分布外的數(shù)據(jù)會嚴重損害模型的性能?,F(xiàn)有方法大多訴諸于自訓練(self-training)技術,如偽標簽(pseudo-labeling)和熵最小化(entropy?minimization),在缺乏測試數(shù)據(jù)的真實標簽(ground-truth)的情況下微調(diào)源(預)訓練模型。然而,這些方法面對長序分布變化,往往容易產(chǎn)生錯誤累計,甚至造成負遷移。
2、為了解決長序測試時自適應(long-term?tta)的問題,比較常見的是在模型適應過程中引入了專家或大型基礎模型創(chuàng)建的標注。如圖2(a)所示,主動測試時自適應方法(active?test-time?adaptation,atta)從每批數(shù)據(jù)中選擇多個樣本進行標注,并將其存儲到額外緩存區(qū)(buffer)中。然后同時使用buffer中有標注的數(shù)據(jù)和當前無標注的數(shù)據(jù)訓練模型。但是,由于數(shù)據(jù)量的不斷增加,標注成本也在逐漸上升,且標注過程可能會嚴重影響測試時自適應的效率。
3、因此,現(xiàn)有技術還有待改進和提高。
技術實現(xiàn)思路
1、本發(fā)明要解決的技術問題在于,針對現(xiàn)有技術的上述缺陷,提供一種基于高效主動學習的模型測試時自適應方法及系統(tǒng),本發(fā)明所采用的技術方案如下:
2、第一方面,本發(fā)明提供一種基于高效主動學習的模型測試時自適應方法,其中,所述方法包括:
3、確定當前批次數(shù)據(jù)所對應的偽標簽和原始預測得分,基于所述偽標簽和所述原始預測得分從所述當前批次數(shù)據(jù)中選擇出目標樣本,并對所述目標樣本進行標注,所述目標樣本為模型提供目標域可學習知識;
4、基于所述目標樣本,確定有監(jiān)督學習對應的第一目標函數(shù)和無監(jiān)督學習對應的第二目標函數(shù);
5、基于梯度范數(shù)對所述第一目標函數(shù)和第二目標函數(shù)進行加權處理,得到模型的整體目標函數(shù),所述整體目標函數(shù)用于使模型同時關注有監(jiān)督學習和無監(jiān)督學習的數(shù)據(jù),以幫助模型進行長序列測試時自適應。
6、在一種實現(xiàn)方式中,所述基于所述偽標簽和所述原始預測得分從所述當前批次數(shù)據(jù)中選擇出目標樣本,包括:
7、在每個樣本的原始特征中添加噪聲數(shù)據(jù),得到每個樣本對應的加噪后的預測得分;
8、針對每個樣本,計算原始預測得分與加噪后的預測得分在偽標簽維度上的差值;
9、基于所述差值,從所述當前批次數(shù)據(jù)中選擇出所述目標樣本。
10、在一種實現(xiàn)方式中,所述基于所述差值,從所述當前批次數(shù)據(jù)中選擇出所述目標樣本,包括:
11、從所述當前批次數(shù)據(jù)中獲取差值最大的樣本;
12、將差值最大的樣本作為所述目標樣本。
13、在一種實現(xiàn)方式中,所述基于所述差值,從所述當前批次數(shù)據(jù)中選擇出所述目標樣本,包括:
14、基于每個樣本所對應的差值,對樣本進行排序,得到候選樣本序列;
15、獲取預設內(nèi)存中存儲的歷史樣本對應的歷史偽標簽和歷史差值;
16、基于所述候選樣本序列與所述歷史樣本對應的歷史偽標簽和歷史差值,確定所述目標樣本。
17、在一種實現(xiàn)方式中,所述基于所述候選樣本序列與所述歷史樣本對應的歷史偽標簽和歷史差值,確定所述目標樣本,包括:
18、依次將所述候選樣本序列中的候選樣本的偽標簽與所述歷史樣本的歷史偽標簽進行比對;
19、若當前的候選樣本的偽標簽與所述歷史樣本的歷史偽標簽不重合,則將當前的候選樣本作為所述目標樣本。
20、在一種實現(xiàn)方式中,所述基于所述候選樣本序列與所述歷史樣本對應的歷史偽標簽和歷史差值,確定所述目標樣本,還包括:
21、若當前的候選樣本的偽標簽與所述歷史樣本的歷史偽標簽重合,則將當前的候選樣本對應的差值與所述歷史樣本的歷史差值進行比較;
22、若當前的候選樣本對應的差值大于所述歷史樣本的歷史差值,則將當前的候選樣本作為所述目標樣本;
23、若當前的候選樣本對應的差值小于或等于所述歷史樣本的歷史差值,則將下一個候選樣本的偽標簽與所述歷史樣本的歷史偽標簽進行比對,依次類推,直至確定所述目標樣本。
24、在一種實現(xiàn)方式中,所述基于梯度范數(shù)對所述第一目標函數(shù)和第二目標函數(shù)進行加權處理,得到模型的整體目標函數(shù),包括:
25、分別計算所述第一目標函數(shù)的第一梯度范數(shù)以及所述第二目標函數(shù)的第二梯度范數(shù);
26、基于所述第一梯度范數(shù)和所述第二梯度范數(shù)確定所述第一目標函數(shù)的第一動態(tài)權重和所述第二目標函數(shù)的第二動態(tài)權重;
27、基于所述第一動態(tài)權重和所述第二動態(tài)權重對所述第一目標函數(shù)和第二目標函數(shù)進行加權處理,得到所述整體目標函數(shù)。
28、第二方面,本發(fā)明實施例還提供一種基于高效主動學習的模型測試時自適應系統(tǒng),其中,所述系統(tǒng)包括:
29、目標樣本選擇模塊,用于確定當前批次數(shù)據(jù)所對應的偽標簽和原始預測得分,基于所述偽標簽和所述原始預測得分從所述當前批次數(shù)據(jù)中選擇出目標樣本,并對所述目標樣本進行標注,所述目標樣本為模型提供目標域可學習知識;
30、目標函數(shù)確定模塊,用于基于所述目標樣本,確定有監(jiān)督學習對應的第一目標函數(shù)和無監(jiān)督學習對應的第二目標函數(shù);
31、函數(shù)加權處理模塊,用于基于梯度范數(shù)對所述第一目標函數(shù)和第二目標函數(shù)進行加權處理,得到模型的整體目標函數(shù),所述整體目標函數(shù)用于使模型同時關注有監(jiān)督學習和無監(jiān)督學習的數(shù)據(jù),以幫助模型進行長序列測試時自適應。
32、第三方面,本發(fā)明實施例還提供一種終端,其中,所述終端包括存儲器、處理器及存儲在存儲器中并可在處理器上運行的基于高效主動學習的模型測試時自適應程序,處理器執(zhí)行基于高效主動學習的模型測試時自適應程序時,實現(xiàn)上述方案中任一項的基于高效主動學習的模型測試時自適應方法的步驟。
33、第四方面,本發(fā)明實施例還提供一種計算機可讀存儲介質(zhì),其中,計算機可讀存儲介質(zhì)上存儲有基于高效主動學習的模型測試時自適應程序,所述基于高效主動學習的模型測試時自適應程序被處理器執(zhí)行時,實現(xiàn)上述方案中任一項所述的基于高效主動學習的模型測試時自適應方法的步驟。
34、有益效果:與現(xiàn)有技術相比,本發(fā)明提供了一種基于高效主動學習的模型測試時自適應方法,本發(fā)明首先確定當前批次數(shù)據(jù)所對應的偽標簽和原始預測得分,基于所述偽標簽和所述原始預測得分從所述當前批次數(shù)據(jù)中選擇出目標樣本,并對所述目標樣本進行標注,所述目標樣本為模型提供目標域可學習知識。然后,基于所述目標樣本,確定有監(jiān)督學習對應的第一目標函數(shù)和無監(jiān)督學習對應的第二目標函數(shù)。最后,基于梯度范數(shù)對所述第一目標函數(shù)和第二目標函數(shù)進行加權處理,得到模型的整體目標函數(shù),所述整體目標函數(shù)用于使模型同時關注有監(jiān)督學習和無監(jiān)督學習的數(shù)據(jù),以幫助模型進行長序列測試時自適應。本發(fā)明對于每一批次數(shù)據(jù)只選擇一個樣本進行標注,大大降低了標注成本,提高了模型測試時自適應的效率。并且本發(fā)明基于梯度范數(shù)對兩個目標函數(shù)的重新加權,幫助模型進行更加穩(wěn)定的長序列測試時自適應。