成人打一炮免费视频,亚洲天堂视频在线观看,97视频久久久,日本japanese护士色高清,五月婷婷丁香,日韩精品一级无码毛片免费,国产欧美日韩精品网红剧情演绎

一種能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法及系統(tǒng)與流程

文檔序號(hào):39900956發(fā)布日期:2024-11-05 17:08閱讀:來(lái)源:國(guó)知局

技術(shù)特征:

1.一種能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法,其特征在于,包括:

2.如權(quán)利要求1所述的能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法,其特征在于:所述要素路徑包括觸發(fā)詞t1通過(guò)要素1的角色類(lèi)型邊連接至要素1,隨后經(jīng)由要素關(guān)系連接至要素2,并通過(guò)要素2的角色類(lèi)型邊連接至觸發(fā)詞t2;

3.如權(quán)利要求2所述的能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法,其特征在于:計(jì)算所述關(guān)鍵要素路徑集合包括,計(jì)算要素路徑重要性apsij,表示為:

4.如權(quán)利要求3所述的能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法,其特征在于:所述匹配事件關(guān)系包括,根據(jù)觸發(fā)詞匹配率,從觸發(fā)詞語(yǔ)義匹配模板中選取關(guān)鍵要素路徑覆蓋比例最高的語(yǔ)義類(lèi)型,匹配事件關(guān)系,計(jì)算觸發(fā)詞對(duì)候選頻率tpceij,表示為:

5.如權(quán)利要求4所述的能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法,其特征在于:所述語(yǔ)義單元包括,根據(jù)觸發(fā)詞對(duì)與知識(shí)庫(kù)映射的framenet語(yǔ)義單元的查詢(xún)關(guān)系,進(jìn)行事件關(guān)系擴(kuò)展和噪聲過(guò)濾;

6.如權(quán)利要求5所述的能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法,其特征在于:所述語(yǔ)義單元還包括,建立事件關(guān)系抽取模型,采用兩階段對(duì)事件關(guān)系抽取模型訓(xùn)練和回標(biāo),并驗(yàn)證自動(dòng)標(biāo)注的結(jié)果的準(zhǔn)確性;

7.如權(quán)利要求6所述的能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法,其特征在于:生成所述能源事件關(guān)系語(yǔ)料庫(kù)包括,使用兩階段訓(xùn)練后的事件關(guān)系抽取模型對(duì)大規(guī)模自動(dòng)標(biāo)注的能源事件關(guān)系語(yǔ)料進(jìn)行回標(biāo),回標(biāo)數(shù)據(jù)與高質(zhì)量數(shù)據(jù)集的數(shù)據(jù)構(gòu)成能源事件關(guān)系語(yǔ)料庫(kù)。

8.一種采用如權(quán)利要求1~7任一所述方法的能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建系統(tǒng),其特征在于,包括,

9.一種計(jì)算設(shè)備,包括:存儲(chǔ)器和處理器;

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令,該計(jì)算機(jī)可執(zhí)行指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的方法的步驟。


技術(shù)總結(jié)
本發(fā)明公開(kāi)了一種能源行業(yè)大數(shù)據(jù)的語(yǔ)料庫(kù)自動(dòng)構(gòu)建方法及系統(tǒng),包括:采集能源行業(yè)數(shù)據(jù),分析得到能源實(shí)體及事件關(guān)系,定義要素路徑并構(gòu)建觸發(fā)詞語(yǔ)義匹配模板;根據(jù)關(guān)鍵要素路徑比例,計(jì)算關(guān)鍵要素路徑集合;根據(jù)觸發(fā)詞匹配率,匹配事件關(guān)系,使用語(yǔ)義單元生成能源事件關(guān)系語(yǔ)料庫(kù)。本發(fā)明通過(guò)采集和分析能源數(shù)據(jù),定義要素路徑并構(gòu)建觸發(fā)詞語(yǔ)義匹配模板,奠定了數(shù)據(jù)處理基礎(chǔ)。計(jì)算關(guān)鍵要素路徑集合,優(yōu)化匹配模板,提高匹配精度。隨后,通過(guò)匹配事件關(guān)系,使用語(yǔ)義單元生成高質(zhì)量語(yǔ)料庫(kù),確保豐富的事件關(guān)系和實(shí)體信息。建立事件關(guān)系抽取模型并進(jìn)行兩階段訓(xùn)練,生成的語(yǔ)料庫(kù)具備高準(zhǔn)確性和全面性,顯著提升了大數(shù)據(jù)分析和應(yīng)用的效率與可靠性。

技術(shù)研發(fā)人員:李文科,張克賢,繆新萍,林昌志,黃笠煌,白雪,孫駿,吳漾,董若煙,朱昌會(huì),田鉞,王益彰
受保護(hù)的技術(shù)使用者:貴州電網(wǎng)有限責(zé)任公司
技術(shù)研發(fā)日:
技術(shù)公布日:2024/11/4
當(dāng)前第2頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1