1.一種能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法,其特征在于,包括:
2.如權(quán)利要求1所述的能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法,其特征在于:所述要素路徑包括觸發(fā)詞t1通過(guò)要素1的角色類(lèi)型邊連接至要素1,隨后經(jīng)由要素關(guān)系連接至要素2,并通過(guò)要素2的角色類(lèi)型邊連接至觸發(fā)詞t2;
3.如權(quán)利要求2所述的能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法,其特征在于:計(jì)算所述關(guān)鍵要素路徑集合包括,計(jì)算要素路徑重要性apsij,表示為:
4.如權(quán)利要求3所述的能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法,其特征在于:所述匹配事件關(guān)系包括,根據(jù)觸發(fā)詞匹配率,從觸發(fā)詞語(yǔ)義匹配模板中選取關(guān)鍵要素路徑覆蓋比例最高的語(yǔ)義類(lèi)型,匹配事件關(guān)系,計(jì)算觸發(fā)詞對(duì)候選頻率tpceij,表示為:
5.如權(quán)利要求4所述的能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法,其特征在于:所述語(yǔ)義單元包括,根據(jù)觸發(fā)詞對(duì)與知識(shí)庫(kù)映射的framenet語(yǔ)義單元的查詢(xún)關(guān)系,進(jìn)行事件關(guān)系擴(kuò)展和噪聲過(guò)濾;
6.如權(quán)利要求5所述的能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法,其特征在于:所述語(yǔ)義單元還包括,建立事件關(guān)系抽取模型,采用兩階段對(duì)事件關(guān)系抽取模型訓(xùn)練和回標(biāo),并驗(yàn)證自動(dòng)標(biāo)注的結(jié)果的準(zhǔn)確性;
7.如權(quán)利要求6所述的能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法,其特征在于:生成所述能源事件關(guān)系語(yǔ)料庫(kù)包括,使用兩階段訓(xùn)練后的事件關(guān)系抽取模型對(duì)大規(guī)模自動(dòng)標(biāo)注的能源事件關(guān)系語(yǔ)料進(jìn)行回標(biāo),回標(biāo)數(shù)據(jù)與高質(zhì)量數(shù)據(jù)集的數(shù)據(jù)構(gòu)成能源事件關(guān)系語(yǔ)料庫(kù)。
8.一種采用如權(quán)利要求1~7任一所述方法的能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建系統(tǒng),其特征在于,包括,
9.一種計(jì)算設(shè)備,包括:存儲(chǔ)器和處理器;
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令,該計(jì)算機(jī)可執(zhí)行指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的方法的步驟。