?

基于數據挖掘的城市旅游輿情分析系統設計與實現

2019-07-16 11:55陳紀銘卜曉
電子技術與軟件工程 2019年8期
關鍵詞:輿情數據挖掘餐廳

陳紀銘 卜曉

摘要:本文研究旅游輿情系統的設計,以及數據采集與分析,為下一步研究奠定基礎。研究網絡輿情對推動城市旅游良性發展具有現實意義。

[關鍵詞]旅游輿情數據采集數據分析

1引言

人們通過旅游網站可搜索熱門旅游城市的景點、酒店、美食、特產、攻略等信息,同時也會根據網友的評論,來對自己傾向的旅游地點進行一個綜合的評估。旅游輿情對于城市旅游業的發展起著至關重要的作用,因此旅游輿情分析就成為了數據分析的熱點。對旅游輿情研究和分析,能清楚了解到網民的關注點,以推動城市旅游業獲得更好地發展。

網絡旅游輿情信息量大,無法完全依靠人工來獲取數據和分析數據,所以必須以信息技術為依托,建立基于數據挖掘的城市旅游輿情分析系統,以利于政府機構及時決策參考。

2需求分析

基于數據挖掘的城市旅游輿情分析系統,首先要抓取城市旅游業相關數據,再將這些數據存儲到數據庫,并采用相關技術進行數據分析。要抓取和分析的數據主要有:

2.1城市

進入旅游網,網民首先就是找到計劃去的城市,并且操作要高效。

2.2攻略

游客通過各種途徑搜索到其他游客的經驗帖,再制定適合自己的旅游路線。

2.3酒店

在旅行過程中,酒店必不可少。旅游網所提供的酒店信息相對詳細,特別是游客對酒店的點評等級和分數,正是旅游輿情體現。

2.4餐廳

餐廳也是游客的重點關心對象。餐廳的營業時間以及其他客戶的品嘗感受,也是游客選擇餐廳前要關注的。

2.5特產

游客返程時常會帶上當地特色產品作為禮物贈送親友,所以特色產品的信息訪問量極大。旅游網也提供了城市特產及介紹。

2.6特色食物

除去特色餐廳,特色街頭小吃等,更是受年輕一代的喜愛。

3系統設計

3.1總體設計

基于數據挖掘的城市旅游輿情分析系統,主要包括兩個模塊:

一個是數據采集;另一個是數據分析。該系統的主要是抓取攜程網等網站上的各城市旅游輿情數據并進行分析。

3.2相關技術

網絡爬蟲以單一或者多個的原始網站為工作起點,直到滿足所需的中斷要求才會停止工作。以城市數據采集為例,簡介如下:

第一步是“抓取”,對所要爬取的數據進行定位和查找。首先定義一個對象數組,然后選定頁面地址,通過一個字符串接收頁面內容,然后將獲取的頁面內容轉換成Document類型,接下來定位到指定的類,再找到對應的文本內容,最后遍歷所需數據。

第二步是“存”,首先連接到對應的數據庫,然后定義變量用來接收并創建表格,檢查表是否已存在,如果存在就先刪除,然后再重新創建,最后獲取的數據進行儲存。

4系統實現

4.1數據采集

先采集有關數據:

(1)城市數據,包括城市名稱、首字母、城市名稱拼音等。

(2)攻略數據,包括攻略名、攻略等。

(3)酒店數據,包括店名、地址、開店時間、簡介、評分等。

(4)餐廳數據,包括餐廳名稱、地址、營業時間、客戶評論等。

(5)特產數據,包括產品名、種類等。

(6)特色食物數據,包括食品名稱、所.在城市、商店等。

然后,將數據存儲到數據庫中。

4.2數據分析

以北京市為例,我們先對北京市在攜程網的相關數據進行采集,再對北京的旅游輿情數據具體分析。以下簡介幾個分析情況:

4.2.1北京餐廳類型分析

北京餐廳類型分析,如圖1所示。

數據顯示:北京餐廳類型傾向于北京菜、快餐簡食,面包甜點以及火鍋。這極大程度是與北京當地的生活習慣與口味有關。北京生活節奏快,口味相對較重,所以偏愛于快餐簡食和川菜、粵菜、火鍋。另外北京作為國際大都市,也有很過文化美食交流,很多外國料理店入駐,這也吸引了游客的品嘗與駐足。

4.2.2北京餐廳評分分析

北京餐館評分分析,如圖2所示。

數據顯示:北京大部分餐廳的評分處于4分以上。處于中上等位置。但是評分等級較低的餐廳數量也較多,所以相關餐廳還需要繼續整改,做出相應調整。

4.3.3北京酒店類型分析

北京酒店數據分析,如圖3所示。

數據顯示:北京酒店類型以經濟型為主,舒適型為輔,豪華型、高檔型以及其他高端類別的酒店數量數量極少,只占全部數量的8%。

5結束語

通過本次的項目研究,我們將科學研究與社會環境與問題緊密結合,真正做到將技術應用在實處。網絡輿情研究,不單單抓取和存儲,簡單的分析也不足以反映我們所需的全部信息。網絡輿情分析是很多研究者和科學家正在探索和研究的問題,因為網絡輿情不僅可以反映現在社會的一些現象,還可以給政府提供一些建設性思路;所以我們還要在此基礎上繼續研究和學習。

參考文獻

[1]郭功舉,通過網絡爬蟲獲取輿情數據分析人的行為習慣[J],測繪通報,2018(S1):289-291+295.

[2]丁勝鋒,楊紹輝,數據挖掘技術在網絡輿情管理中的研究[J].大學教育,2016(11):173-174.

[3]柳淑婷,基于社交網絡的輿情關鍵技術研究[D].吉林大學,2017.

[4]付業勤。旅游危機事件網絡輿情研究:構成、機理與管控[D].華僑大學,2014.

[5]張書海?;赪eb數據挖掘的旅游者網絡用戶行為及用戶價值研究[D].廣州大學,2016.

猜你喜歡
輿情數據挖掘餐廳
TARENTUM萄木餐廳
LUNAR餐廳
城里的怪餐廳
基于并行計算的大數據挖掘在電網中的應用
“秀色可餐”的虛擬餐廳
輿情
輿情
輿情
一種基于Hadoop的大數據挖掘云服務及應用
基于GPGPU的離散數據挖掘研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合