土地利用空間數(shù)據(jù)處理中基于地理本體的屬性匹配方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及土地利用空間數(shù)據(jù)處理中的同名實體屬性匹配方法,具體是一種土地 利用空間數(shù)據(jù)處理中基于地理本體的屬性匹配方法。
【背景技術(shù)】
[0002] 在土地利用空間數(shù)據(jù)處理中,同名實體的屬性匹配是一道十分重要的環(huán)節(jié)。在現(xiàn) 有技術(shù)條件下,同名實體的屬性匹配普遍采用字符串匹配方法。字符串匹配方法是指從文 本中找出給定字符串的一個或所有出現(xiàn)的位置,然后通過簡單的疊加查詢到包含部分關(guān)鍵 字符串的文檔。實踐表明,字符串匹配方法由于自身原理所限,存在如下問題:其一,字符串 匹配方法無法理解推理出查詢的語義,由此容易造成匹配錯誤。其二,字符串匹配方法無法 滿足不同應(yīng)用系統(tǒng)之間互操作的需求,由此導(dǎo)致適用范圍受限。本發(fā)明是一種全新的同名 實體屬性匹配方法,以改進(jìn)現(xiàn)有同名實體屬性匹配方法容易造成匹配錯誤、適用范圍受限 的問題。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明為了解決現(xiàn)有同名實體屬性匹配方法容易造成匹配錯誤、適用范圍受限的 問題,提供了一種土地利用空間數(shù)據(jù)處理中基于地理本體的屬性匹配方法。
[0004] 本發(fā)明是采用如下技術(shù)方案實現(xiàn)的:土地利用空間數(shù)據(jù)處理中基于地理本體的屬 性匹配方法,該方法是采用如下步驟實現(xiàn)的:
[0005] 1)構(gòu)建地理本體;所述地理本體包括本體類庫、本體關(guān)系庫、知識庫;具體構(gòu)建步 驟包括:
[0006] 1. 1)構(gòu)建本體類庫;所述本體類庫包括土地分類、行政區(qū)劃、空間坐標(biāo)系、要素類 型;具體構(gòu)建步驟包括:
[0007] 1. 1. 1)構(gòu)建土地分類;
[0008] 1. 1. 2)構(gòu)建行政區(qū)劃;
[0009] 1. 1. 3)構(gòu)建空間坐標(biāo)系;
[0010] 1. 1. 4)構(gòu)建要素類型;
[0011] 1. 2)構(gòu)建本體關(guān)系庫:所述本體關(guān)系庫包括對象關(guān)系庫、數(shù)值關(guān)系庫;具體構(gòu)建 步驟包括:
[0012] 1. 2. 1)構(gòu)建對象關(guān)系庫;
[0013] 1. 2. 2)構(gòu)建數(shù)值關(guān)系庫;
[0014] 1.3)構(gòu)建知識庫;
[0015] 2)實體屬性匹配;具體匹配步驟包括:
[0016] 2. 1)將空間數(shù)據(jù)導(dǎo)入地理本體;
[0017] 2. 2)首先,對空間數(shù)據(jù)中的兩要素的各個數(shù)字型屬性進(jìn)行相似度計算;具體計算 公式如下:
[0019] 式⑴中:D為兩要素的同一個數(shù)字型屬性的相似度;Ap A2分別為兩要素的同一 個數(shù)字型屬性的取值;
[0020] 然后,對兩要素的各個數(shù)字型屬性的相似度進(jìn)行加權(quán),并將加權(quán)值與閾值進(jìn)行比 較;若加權(quán)值小于閾值,則結(jié)束匹配;若加權(quán)值大于閾值,則采用向量來表示空間數(shù)據(jù)中的 兩要素的各個字符型屬性,并對空間數(shù)據(jù)中的兩要素的各個字符型屬性進(jìn)行相似度計算; 具體表示公式和計算公式如下:
[0021] Aj= (w 1; 1, w2, 1, . . . , wn, 1) (2);
[0022] A2=(w1; 2, w2, 2, . . . , wn, 2) (3);
[0024] 式(2)_⑷中:Ap A2分別為兩要素的同一個字符型屬性的向量表不;w p w2,…, wn分別為獨(dú)立的詞組;cos 0為兩要素的同一個字符型屬性的相似度;A i *A2為兩要素的同 一個字符型屬性的向量表示的點(diǎn)乘;| |Al| |、| |A2| |分別為兩要素的同一個字符型屬性的 向量表示的模;
[0025] 最后,對兩要素的各個字符型屬性的相似度進(jìn)行加權(quán),并將加權(quán)值與閾值進(jìn)行比 較;若加權(quán)值小于閾值,則結(jié)束匹配;若加權(quán)值大于閾值,則將兩要素判定為同一實體,由 此完成實體屬性匹配。
[0026] 與現(xiàn)有同名實體屬性匹配方法相比,本發(fā)明所述的土地利用空間數(shù)據(jù)處理中基于 地理本體的屬性匹配方法通過將本體技術(shù)引入到同名實體的屬性匹配中,一方面實現(xiàn)了理 解推理出查詢的語義,由此有效防止了匹配錯誤,另一方面滿足了不同應(yīng)用系統(tǒng)之間互操 作的需求,由此使得適用范圍不再受限。
[0027] 本發(fā)明有效解決了現(xiàn)有同名實體屬性匹配方法容易造成匹配錯誤、適用范圍受限 的問題,適用于土地利用空間數(shù)據(jù)處理。
【附圖說明】
[0028] 圖1是本發(fā)明的步驟1. 1)的示意圖。
[0029] 圖2是本發(fā)明的步驟1. 1. 1)的示意圖。
[0030] 圖3是本發(fā)明的步驟1. 2. 1)的示意圖。
[0031] 圖4是本發(fā)明的步驟2)的示意圖。
【具體實施方式】
[0032] 土地利用空間數(shù)據(jù)處理中基于地理本體的屬性匹配方法,該方法是采用如下步驟 實現(xiàn)的:
[0033] 1)構(gòu)建地理本體;所述地理本體包括本體類庫、本體關(guān)系庫、知識庫;具體構(gòu)建步 驟包括:
[0034] 1. 1)構(gòu)建本體類庫;所述本體類庫包括土地分類、行政區(qū)劃、空間坐標(biāo)系、要素類 型;具體構(gòu)建步驟包括:
[0035] 1. 1. 1)構(gòu)建土地分類;
[0036] 1. 1. 2)構(gòu)建行政區(qū)劃;
[0037] 1. 1. 3)構(gòu)建空間坐標(biāo)系;
[0038] 1. 1. 4)構(gòu)建要素類型;
[0039] 1. 2)構(gòu)建本體關(guān)系庫:所述本體關(guān)系庫包括對象關(guān)系庫、數(shù)值關(guān)系庫;具體構(gòu)建 步驟包括:
[0040] 1. 2. 1)構(gòu)建對象關(guān)系庫;
[0041] 1. 2. 2)構(gòu)建數(shù)值關(guān)系庫;
[0042] 1. 3)構(gòu)建知識庫;
[0043] 2)實體屬性匹配;具體匹配步驟包括:
[0044] 2. 1)將空間數(shù)據(jù)導(dǎo)入地理本體;
[0045] 2. 2)首先,對空間數(shù)據(jù)中的兩要素的各個數(shù)字型屬性進(jìn)行相似度計算;具體計算 公式如下:
[0047] 式⑴中:D為兩要素的同一個數(shù)字型屬性的相似度;Ap A2分別為兩要素的同一 個數(shù)字型屬性的取值;
[0048] 然后,對兩要素的各個數(shù)字型屬性的相似度進(jìn)行加權(quán),并將加權(quán)值與閾值進(jìn)行比 較;若加權(quán)值小于閾值,則結(jié)束匹配;若加權(quán)值大于閾值,則采用向量來表示空間數(shù)據(jù)中的 兩要素的各個字符型屬性,并對空間數(shù)據(jù)中的兩要素的各個字符型屬性進(jìn)行相似度計算; 具體表示公式和計算公式如下:
[0049] Aj= (w 1; 1, w2, 1, . . . , wn, 1) (2);
[0050] A2=(w1; 2, w2, 2, . . . , wn, 2) (3);
[0052] 式(2)_⑷中:Ap A2分別為兩要素的同一個字符型屬性的向量表不;w p w2,…, wn分別為獨(dú)立的詞組;cos 0為兩要素的同一個字符型屬性的相似度;A i *A2為兩要素的同 一個字符型屬性的向量表示的點(diǎn)乘;| |Al| |、| |A2| |分別為兩要素的同一個字符型屬性的 向量表示的模;
[0053] 最后,對兩要素的各個字符型屬性的相似度進(jìn)行加權(quán),并將加權(quán)值與閾值進(jìn)行比 較;若加權(quán)值小于閾值,則結(jié)束匹配;若