一種快遞自動分揀系統(tǒng)及自動分揀方法
【技術領域】
[0001]本發(fā)明涉及一種快遞自動分揀系統(tǒng),更具體的說,涉及一種在快遞行業(yè)中的通過自動分揀方法在無人工參與的情況下完成快遞中轉和末端分揀的系統(tǒng)。
【背景技術】
[0002]現(xiàn)有的快遞分揀多為人工分揀,由工作人員根據(jù)快遞單地址來手工分配快遞的中轉或末端派件站點。一方面,快遞行業(yè)由于人工分揀而不可避免地發(fā)生分揀錯誤、誤操作,以及存在效率低下且覆蓋面窄的問題。另一方面,隨著快遞行業(yè)的發(fā)展,末端派件站點在不斷變迀,人工記憶的方式難以隨之快速變化及應對。更為重要的是,快遞地址規(guī)模十分龐大,人工記憶方式不可能記憶所有派件地址。目前,快遞行業(yè)也存在一些半自動分揀系統(tǒng)或設施,既通過人工設定一些地址關鍵字數(shù)據(jù),某些情況下也借助計算機輔助進行派件站點識別,但這類半自動分揀系統(tǒng)或設施由于實際快遞地址規(guī)模龐大且書寫方式多樣,同樣需要大量的人力和時間來整理關鍵字數(shù)據(jù),費時費力且極易出錯。
【發(fā)明內(nèi)容】
[0003]本發(fā)明針對現(xiàn)有的快遞分揀系統(tǒng)仍普遍采用人工分揀而不可避免地發(fā)生分揀錯誤、誤操作并存在效率低下且覆蓋面窄的問題,而半自動分揀系統(tǒng)或設施由于實際快遞地址規(guī)模龐大且書寫方式多樣,同樣需要大量的人力和時間來整理關鍵字數(shù)據(jù),存在費時費力且極易出錯的缺陷,提供了一種無人工干預、由計算機設定地址關鍵字數(shù)據(jù)進行派件站定識別的快遞自動分揀系統(tǒng)及自動分揀方法。
[0004]為了解決上述技術問題,本發(fā)明通過下述技術方案得以解決:
[0005]一種快遞自動分揀系統(tǒng),包括常用詞詞庫、道路數(shù)據(jù)庫、興趣點數(shù)據(jù)庫、歷史派件數(shù)據(jù)庫、派件數(shù)據(jù)糾正模塊、關鍵字抽取模塊、關鍵字數(shù)據(jù)庫、站點自動識別模塊,歷史派件數(shù)據(jù)庫包括派件地址和派件站點;常用詞詞庫保存對派件地址進行字典分詞的常用詞組;道路數(shù)據(jù)庫保存公路和街道數(shù)據(jù);興趣點數(shù)據(jù)庫保存已知的具有確定名稱的地理位置;歷史派件數(shù)據(jù)庫保存快遞系統(tǒng)歷史派件數(shù)據(jù);派件數(shù)據(jù)糾正模塊通過道路數(shù)據(jù)庫和興趣點數(shù)據(jù)庫進行派件地址特征值提取,派件數(shù)據(jù)糾正模塊整理和糾正歷史派件數(shù)據(jù),消除派件數(shù)據(jù)的系統(tǒng)偏差和人為錯誤;關鍵字抽取模塊對派件數(shù)據(jù)進行分詞、拆分、組合、排序和統(tǒng)計,抽取有效關鍵字和關鍵字對應的派件站點,形成關鍵字數(shù)據(jù)庫;關鍵字數(shù)據(jù)庫保存關鍵字和關鍵字對應的派件站點,并以關鍵字為索引,為站點自動識別模塊提供派件站點查詢;站點自動識別模塊通過對輸入的派件地址進行分詞、拆分、組合、查詢和統(tǒng)計,得到輸入的派件地址的派件站點。
[0006]作為優(yōu)選,派件數(shù)據(jù)糾正模塊包括地址規(guī)范化單元和站點糾正單元,地址規(guī)范化單元將派件地址轉換為一致格式,站點糾正單元統(tǒng)一具有相同特征值的派件地址的派件站點。
[0007]作為優(yōu)選,關鍵字抽取模塊包括關鍵字生成單元和關鍵字過濾單元;關鍵字生成單元對派件地址進行拆分組合,生成一系列關鍵字;關鍵字過濾單元使用排序、分組和統(tǒng)計的方法計算每個關鍵字對應的派件站點的比重,保留比重占絕對優(yōu)勢的關鍵字對應的派件站點。
[0008]作為優(yōu)選,站點自動識別模塊包括地址輸入單元、關鍵字生成單元、站點查詢單元和站點過濾單元;地址輸入單元輸入派件地址;關鍵字生成單元對派件地址進行拆分組合,生成一系列關鍵字;站點查詢單元從關鍵字數(shù)據(jù)庫中查詢關鍵字對應的派件站點;站點過濾單元統(tǒng)計派件站點的比重,保留比重占優(yōu)勢的派件站點作為輸出。
[0009]本發(fā)明還提供了一種基于快遞自動分揀系統(tǒng)的自動分揀方法,自動分揀步驟包括:
[0010]步驟一:關鍵字數(shù)據(jù)庫建模;
[0011 ] 步驟二:掃描派件地址;
[0012]步驟三:匹配派件站點:若成功匹配派件站點,則將快遞物品扭轉入派件站點對應通道;若無法匹配派件站點,則將快遞物品扭轉入未識別通道進行人工處理。
[0013]作為優(yōu)選,關鍵字數(shù)據(jù)庫建模步驟包括:
[0014]步驟一:讀取歷史派件數(shù)據(jù);
[0015]步驟二:規(guī)范化歷史派件地址;
[0016]步驟三:糾正歷史派件站點;
[0017]步驟四:抽取關鍵字和關鍵字對應的派件站點;
[0018]步驟五:以關鍵字為索引建立關鍵字數(shù)據(jù)庫。
[0019]作為優(yōu)選,地址規(guī)范化單元對讀取的歷史派件數(shù)據(jù)的派件地址的規(guī)范化方法包括:
[0020]繁體漢字轉換為簡體漢字;
[0021]全角字符轉換為半角字符;
[0022]中文數(shù)字轉換為阿拉伯數(shù)字;
[0023]大寫字母轉換為小寫字母;
[0024]過濾多余無地址意義符號,只保留空格、括號和破折號,保留英文單詞或數(shù)字之間空格;
[0025]經(jīng)過上述處理后得到只含有簡體漢字、半角符號、阿拉伯數(shù)字、小寫字母及有意義的空格、括號和破折號的規(guī)范化地址。
[0026]作為優(yōu)選,站點糾正單元糾正歷史派件數(shù)據(jù)中的系統(tǒng)錯誤和人工錯誤的糾正方法包括:
[0027]使用道路數(shù)據(jù)庫識別派件地址中的路號信息,提取路號信息作為派件地址的特征值;
[0028]使用興趣點數(shù)據(jù)庫識別派件地址中的興趣點,提取興趣點信息作為派件地址的特征值;
[0029]若派件地址無法提取路號信息或興趣點信息,則將整個派件地址作為特征值;
[0030]以派件地址特征值為第一依據(jù),以派件站點為第二依據(jù)進行排序和分組,計算每個特征值對應的派件站點的比重,取比重最大的派件站點作為該特征值對應的派件地址的最終派件站點。
[0031]作為優(yōu)選,關鍵字生成單元生成關鍵字的生成方法包括:
[0032]使用常用詞詞庫對派件地址進行字典分詞,將派件地址拆分為多個片段;
[0033]將派件地址中的英文單詞和數(shù)字作為單獨片段;
[0034]將拆分后相鄰兩個片段進行連接,保留含有連續(xù)兩個漢字及以上的片段連接,片段連接生成關鍵字。
[0035]作為優(yōu)選,關鍵字過濾單元過濾關鍵字的過濾方法包括:
[0036]以關鍵字為第一排序依據(jù),以派件站點為第二排序依據(jù)進行排序;
[0037]統(tǒng)計每個關鍵字對應的派件站點的比重;
[0038]保留派件站點的比重不小于80%的占絕對優(yōu)勢的關鍵字。
[0039]本發(fā)明由于采用了以上技術方案,具有顯著的技術效果:采用自動分揀系統(tǒng),通過自動分揀方法能在無人工干預環(huán)境下自動完成快遞派件站點的識別,自動實現(xiàn)快遞中轉站點和末端站點的分揀,并能保證極高的準確率,解決了快遞行業(yè)采用傳統(tǒng)人工分揀方法和半自動容易出錯、誤操作且費時費力等問題,實現(xiàn)了計算機和機器自動分揀,極大地提高了快遞行業(yè)分揀效率。
【附圖說明】
[0040]圖1是本發(fā)明的計量料倉與補償用稱重裝置裝配實施例的結構示意圖。
[0041]圖2是本發(fā)明的補償用稱重裝置和第一稱重傳感器裝設在支撐板上實施例的結構示意圖。
[0042]圖3是本發(fā)明的雙通道稱重儀表實施例的結構示意圖。
【具體實施方式】
[0043]下面結合附圖與實施例對本發(fā)明作進一步詳細描述。
[0044]實施例1
[0045]一種快遞自動分揀系統(tǒng),如圖1所示,包括常用詞詞庫11、道路數(shù)據(jù)庫12、興趣點數(shù)據(jù)庫13、歷史派件數(shù)據(jù)庫14、派件數(shù)據(jù)糾正模塊15、關鍵字抽取模塊16、關鍵字數(shù)據(jù)庫17、站點自動識別模塊18,歷史派件數(shù)據(jù)庫14包括派件地址141和派件站點142 ;常用詞詞庫11保存對派件地址141進行字典分詞的常用詞組;道路數(shù)據(jù)庫12保存公路和街道數(shù)據(jù);興趣點數(shù)據(jù)庫13保存已知的具有確定名稱的地理位置;歷史派件數(shù)據(jù)庫14保存快遞系統(tǒng)歷史派件數(shù)據(jù);派件數(shù)據(jù)糾正模塊15通過道路數(shù)據(jù)庫12和興趣點數(shù)據(jù)庫13進行派件地址141特征值提取,派件數(shù)據(jù)糾正模塊15整理和糾正歷史派件數(shù)據(jù),消除派件數(shù)據(jù)的系統(tǒng)偏差和人為錯誤;關鍵字抽取模塊16對派件數(shù)據(jù)進行分詞、拆分、組合、排序和統(tǒng)計,抽取有效關鍵字和關鍵字對應的派件站點142,形成關鍵字數(shù)據(jù)庫17 ;關鍵字數(shù)據(jù)庫17保存關鍵字和關鍵字對應的派件站點142,并以關鍵字為索引,為站點自動識別模塊18提供派件站點142查詢;站點自動識別模塊18通過對輸入的派件地址141進行分詞、拆分、組合、查詢和統(tǒng)計,得到輸入的派件地址141的派件站點142。
[0046]派件數(shù)據(jù)糾正模塊15包括地址規(guī)范化單元151和站點糾正單元152,地址規(guī)范化單元151將派件地址141轉換為一致格式,站點糾正單元152統(tǒng)一具有相同特征值的派件地址141的派件站點142。
[0047]關鍵字抽取模塊16包括關鍵字生成單元161和關鍵字過濾單元162 ;關鍵字生成單元161對派件地址141進行拆分組合,生成一系列關鍵字;關鍵字過濾單元162使用排序、分組和統(tǒng)計的方法計算每個關鍵字對應的派件站點142的比重,保留比重占絕對優(yōu)勢的關鍵字對應的派件站點142。
[0048]站點自動識別模塊18包括地址輸入單元181、關鍵字生成單元182、站點查詢單元183和站點過濾單元184 ;地址輸入單元181輸入派件地址141 ;關鍵字生成單元182對派件地址141進行拆分組合,生成一系列關鍵字;站點查詢單元183從關鍵字數(shù)據(jù)庫17中查詢關鍵字對應的派件站點142 ;站點過濾單元184統(tǒng)計派件站點142的比重,保留比重占優(yōu)勢的派件站點142作為輸出。
[0049]常用詞詞庫11保存常用詞組,這些詞組用于對派件地址141進行字典分詞,常用詞詞庫11來自輸入法提供商;道路數(shù)據(jù)庫12保存公路和街道數(shù)據(jù),用于識別地址中含有的路號信息,道路數(shù)據(jù)庫12來自地圖提供商;興趣點數(shù)據(jù)庫13保存已知的具有確定名稱的地理位置數(shù)據(jù),如學校、小區(qū)、商場、大廈等,興趣點數(shù)據(jù)庫13來自地圖提供商。
[0050]一種基于快遞自動分揀系統(tǒng)的自動分揀方法,自動分揀操作流程如圖2所示,自動分揀步驟包括:
[0051]步驟一:關鍵字數(shù)據(jù)庫17建模;
[0052]步驟二:掃描派件地址141 ;
[0053]步驟三:匹配派件站點142:若成功匹配派件站點142,則將快遞物品扭轉入派件站點142對應通道;若無法匹配派件站點142,則將快遞物品扭轉入未識別通道進行人工處理。
[0