本發(fā)明涉及文旅熱度分析,具體涉及一種基于大數(shù)據(jù)的文旅熱度分析系統(tǒng)。
背景技術:
1、基于大數(shù)據(jù)的文旅熱度分析系統(tǒng),指的是通過采集和分析大量的旅游相關數(shù)據(jù),利用數(shù)據(jù)挖掘和分析技術,來評估和預測文旅景點、旅游活動等的熱度和受歡迎程度,從而為文旅景點的運營、營銷、資源配置等方面提供精準的決策支持;
2、對于一個新的文旅景點,基于大數(shù)據(jù)的文旅熱度分析系統(tǒng)為了能準確分析其熱度,通常會針對該文旅景點建立一個熱度分析模型;該熱度分析模型會結合多種數(shù)據(jù)源,如游客的在線評價、社交媒體上的討論量、游客流量統(tǒng)計、天氣狀況、節(jié)假日效應等因素,通過機器學習和深度學習算法進行訓練,從而實現(xiàn)對該文旅景點熱度的分析;然而,這種單獨為每個新的景點建立熱度分析模型的方法,不僅耗費大量的資源和時間,還可能導致基于大數(shù)據(jù)的文旅熱度分析系統(tǒng)的效能降低,造成資源的重復投入和效率的低下。因此,為了解決這個問題,可以調(diào)用基于大數(shù)據(jù)的文旅熱度分析系統(tǒng)中已經(jīng)存有的已有的文旅熱度分析模型對新的文旅景點進行熱度分析,在高效分析熱度的同時還節(jié)省了大量的資源,使得基于大數(shù)據(jù)的文旅熱度分析系統(tǒng)運行更加流暢;
3、然而,基于大數(shù)據(jù)的文旅熱度分析系統(tǒng)中并不是所有的文旅熱度分析模型都可以適用新文旅景點的文旅熱度分析,若文旅熱度分析模型選擇不當可能會導致新文旅景點熱度分析不準確,從而影響決策的精準性。
技術實現(xiàn)思路
1、本發(fā)明的目的就在于解決上述所提出的問題,提供一種基于大數(shù)據(jù)的文旅熱度分析系統(tǒng)。
2、本發(fā)明實施提出一種基于大數(shù)據(jù)的文旅熱度分析系統(tǒng),所述系統(tǒng)包括:
3、第一特征模塊:將基于大數(shù)據(jù)的文旅熱度分析系統(tǒng)中已有的各文旅熱度分析模型記為第一模型,并獲取第一模型所分析熱度的文旅景點對應的景點特征作為第一特征;
4、第二模型集模塊:將新文旅景點對應的景點特征作為第二特征,并計算第二特征和各第一特征的相似值,并根據(jù)相似值和預設相似值閾值對所有的第一模型進行篩選,得到可適用于新文旅景點熱度分析的若干第一模型,并作為第二模型集;
5、可用模塊:對于第二模型集中的各第二模型,獲取模型的使用頻率、響應時間和相似值作為各第二模型的數(shù)據(jù)點,得到數(shù)據(jù)集,對數(shù)據(jù)集進行聚類確定各第二模型的可用系數(shù);
6、熱度分析模塊:將可用系數(shù)最大的第二模型作為新文旅景點的最終文旅熱度的分析模型,并通過最終文旅熱度分析模型對新文旅景點的文旅熱度進行分析。
7、可選地,所述景點特征包括類型特征、氣候特征和游客畫像特征,其中:
8、所述類型特征包括自然文化景觀、文化遺產(chǎn);
9、所述氣候特征包括溫帶、寒帶和熱帶;
10、所述游客畫像特征包括游客平均年齡。
11、可選地,計算第二特征和各第一特征的相似值包括:
12、將第二特征和各第一特征對應的類型特征、氣候特征和游客畫像特征分別進行計算,若第二特征和第一特征的類型特征都為自然文化景觀或文化遺產(chǎn),則將第二特征和第一特征的類型特征相似值記為1;反之則為0;
13、若第二特征和第一特征的氣候特征都為溫帶、寒帶和熱帶,則將第二特征和第一特征的氣候特征相似值記為1;反之則為0;
14、若第二特征和第一特征的游客平均年齡差值小于預設年齡差值,則將第二特征和第一特征的游客畫像特征相似值記為1;反之則為0;
15、將類型特征、氣候特征和游客畫像特征對應的相似值分別乘以對應的預設權重值,得到每一特征的最終相似值,并計算最終相似值的均值作為第二特征和各第一特征的相似值。
16、可選地,根據(jù)相似值和預設相似值閾值對所有的第一模型進行篩選,得到可適用于新文旅景點熱度分析的若干第一模型,并作為第二模型集包括:
17、將第二特征和各第一特征的相似值與預設相似值閾值進行對比,若相似值不小于預設相似值閾值,則將第一特征對應的第一模型作為可適用于新文旅景點熱度分析的第一模型,將所有的可適用于新文旅景點熱度分析的第一模型作為第二模型集。
18、可選地,對于第二模型集中的各第二模型,獲取模型的使用頻率、響應時間和相似值作為各第二模型的數(shù)據(jù)點,得到數(shù)據(jù)集,對數(shù)據(jù)集進行聚類確定各第二模型的可用系數(shù)包括:
19、獲取第二模型集中的各第二模型歷史數(shù)據(jù)中參與文旅景點熱度分析的次數(shù),并獲取每次文旅景點熱度分析時第二模型進行熱度分析所持續(xù)的時間,并計算所持續(xù)時間的均值作為平均持續(xù)時間;
20、計算預設最慢響應時間和平均持續(xù)時間的差值作為第二模型的響應時間;
21、將第二模型的使用頻率、響應時間和相似值作為各第二模型的數(shù)據(jù)點,得到數(shù)據(jù)集,對數(shù)據(jù)集進行聚類確定各第二模型的可用系數(shù)。
22、可選地,對數(shù)據(jù)集進行聚類確定各第二模型的可用系數(shù)包括:
23、使用k均值聚類法對數(shù)據(jù)集進行聚類步驟為:
24、步驟1:用于使用肘部法確定數(shù)據(jù)集的最佳聚類數(shù);
25、步驟2:用于根據(jù)最佳聚類數(shù)隨機選取對應數(shù)量的數(shù)據(jù)點作為初始聚類簇;
26、步驟3:用于對每個數(shù)據(jù)點,使用歐氏距離算法,計算數(shù)據(jù)點與每個初始聚類中心的距離,并將數(shù)據(jù)點分配到距離最近的聚類中心所屬的聚類簇中,遍歷完所有數(shù)據(jù)點,得到初始聚類中心;
27、步驟4:用于對每個初始聚類簇,計算所有數(shù)據(jù)點的平均值,并將該平均值作為新的聚類中心;
28、步驟5:用于判斷聚類中心是否發(fā)生變化,若變化,重復步驟3和步驟4,直到聚類中心不再變化,得到最終聚類簇和最終聚類中心;
29、將最終聚類簇和最終聚類中心映射到三維坐標,得到各第二模型的可用系數(shù)。
30、可選地,將最終聚類簇和最終聚類中心映射到三維坐標,得到各第二模型的可用系數(shù)包括:
31、計算每個最終聚類簇的權重系數(shù),其計算公式為其中wj表示為第j個最終聚類簇的權重系數(shù),h總表示為數(shù)據(jù)集中所有的數(shù)據(jù)點的數(shù)量,hj表示第j個最終聚類簇中的數(shù)據(jù)點數(shù)量;
32、計算每個最終聚類簇中的每個數(shù)據(jù)點在三維坐標上到坐標原心的距離,得到該數(shù)據(jù)點的初步坐標距離,將該數(shù)據(jù)點的初步坐標距離乘以該數(shù)據(jù)點處于的最終聚類簇對應的權重系數(shù),得到該數(shù)據(jù)點的實際坐標距離;
33、將每個數(shù)據(jù)點的實際坐標距離作為對應各第二模型的作為對新文旅景點熱度分析的可用系數(shù)。
34、本發(fā)明的有益效果:
35、本發(fā)明提出了一種基于大數(shù)據(jù)的文旅熱度分析系統(tǒng),通過將基于大數(shù)據(jù)的文旅熱度分析系統(tǒng)中已有的各文旅熱度分析模型記為第一模型,并獲取第一模型所分析熱度的文旅景點對應的景點特征作為第一特征;將新文旅景點對應的景點特征作為第二特征,并對所有的第一模型進行篩選,得到可適用于新文旅景點熱度分析的若干第一模型,并作為第二模型集;對于第二模型集中的各第二模型,獲取模型的使用頻率、響應時間和相似值作為各第二模型的數(shù)據(jù)點,得到數(shù)據(jù)集,對數(shù)據(jù)集進行聚類確定各第二模型的可用系數(shù);將可用系數(shù)最大的第二模型作為新文旅景點的最終文旅熱度的分析模型,并通過最終文旅熱度分析模型對新文旅景點的文旅熱度進行分析;這樣一來,能夠根據(jù)新文旅景點的特征從基于大數(shù)據(jù)的文旅熱度分析系統(tǒng)中的文旅熱度分析模型中,選擇合適的文旅熱度分析模型對新文旅景點進行熱度分析,確保新文旅景點熱度分析準確的同時還節(jié)省了大量的資源,使得基于大數(shù)據(jù)的文旅熱度分析系統(tǒng)運行更加流暢,同時確保了決策的精準性。