?

數據挖掘技術在網絡輿情管理中的研究

2016-11-16 20:34丁勝鋒楊紹輝
大學教育 2016年11期
關鍵詞:網絡輿情數據挖掘研究

丁勝鋒+楊紹輝

[摘 要]目前,隨著海量網絡輿情成指數增加,傳統的數據處理技術不支持對海量輿情潛在信息的發現與挖掘,無法找到輿情信息之間的規則或關系,不能根據輿情現狀預測未來發展趨勢。在這種形勢下,非常有必要把數據挖掘技術應用到網絡輿情管理中,充分發揮數據挖掘的具體優勢,從而實現對網絡輿情的及時發現、快速分析、準確追蹤和理性引導。

[關鍵詞]數據挖掘;網絡輿情;研究

[中圖分類號] G41,TP399 [文獻標識碼] A [文章編號] 2095-3437(2016)11-0173-02

隨著因特網在全世界范圍內的普及,作為繼報刊、廣播、電視之后發展起來的與傳統大眾媒體并存的新媒體,因特網被稱為第四媒體,它成為反映社會輿情的主要載體之一。隨著信息技術的高速發展,人們積累的數據量越來越多,僅依靠傳統的人工方法收集和處理海量網絡信息是十分困難的。在這種情況下,迫切需要更加科學有效的信息處理技術,快速準確地分析網絡輿情動態,及時對網絡的熱點、焦點與敏感話題做出反應,從而提高網絡的監管能力和網絡突發事件的處置能力。

一、數據挖掘概念

數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識的過程。數據挖掘的對象是大量的、包含噪聲的數據源或數據庫,而挖掘的結果是對用戶有幫助且事先未知的信息或知識。

近年來網絡數據的爆炸性增長與數據處理技術的滯后之間的矛盾越來越突出,數據挖掘技術應運而生,并能從實際的海量數據源中抽取知識。數據挖掘技術被越來越多的行業和領域所采用,取得了較好的效果,為人們的正確決策提供了有力的幫助。[1] [2]

二、新形勢下網絡輿情現狀分析

(一)大數據背景的網絡輿情更加復雜

第一,網絡輿情數據量巨大。數據的海量性和偶然性因素使社會輿情難以有效捕獲,演變和發展過程難以推測,傳統的處理方法顯得捉襟見肘。第二,網絡輿情選擇性傳播。網絡數據的無限性和網民關注能力的有限性之間存在矛盾,這導致網民不能全面、準確了解輿情的真面目。網絡媒體具備人際傳播和大眾傳播的特點,容易讓同類網民找到共鳴點,從而使一些偏激輿論被放大。第三,網絡輿論話語權較分散。大數據背景下數據的獲取相對容易,更多的機構或個人通過信息分析得出的結論迅速傳播,有效管理輿情的難度越來越大。

(二)網絡媒體影響力增強

在互聯網發展的早期,網絡媒體主要通過引用或轉載報紙、廣播、電視的報道內容,然后進行補充式的討論。隨著近年來移動客戶端設備、軟件的出現和網民數量的大幅度增長,傳統媒體的傳播優勢逐漸減少。網絡媒體依靠其傳播的快速性和便捷性,吸引網民發布信息,引發輿論,反過來影響傳統媒體的討論。網絡媒體已經成為傳統媒體報道內容的重要來源之一。

(三)網絡輿情載體多樣化,影響力迅速提高

隨著微信、微博、QQ等網絡輿情載體的發展,網民的組織化程度越來越高。網民通過微信、微博、QQ、社交類網站來組建各種群組。這些網絡載體能為網民提供Blog、Microblog、微信、圖像、音頻、視頻等多種線上、線下互動功能。網民不再是一個獨立的個體,通過加入各種群組,他們能夠獲取小范圍的消息,并迅速把消息傳播到全世界的每個角落。同時移動互聯網的應用擴大了網民相互交流的時間域和空間域,“任何一個在場的人都可能一轉身,上網發送文字、圖片、視頻,給政府的事件處置及輿情應對帶來挑戰”,“移動終端在突發事件‘現場直播的優勢,讓其他媒體望塵莫及”。[3] [4]

(四)網絡輿情走向現實生活,推動事件發展

隨著社會的進步,越來越多的網民不再在網絡平臺上議論和分析社會上的熱點、敏感事件,不再滿足于在網絡上等待熱點事情的真相,而是積極走向社會現實,親自調查以還原事件真相。這增加了熱點事件的透明度,加快了相關政府部門、企事業單位或個人對事情的處理速度。

(五)網絡輿情導控與應對存在不足

第一,輿情應急準備不足,響應速度緩慢。目前網絡輿情管控體系還不完善,這導致我們在處理突發事件時反應緩慢;在網絡輿論爆發之時,難以進行有效監測、研判和引導。第二,危機處理方式被動,缺乏有效的制度。在一些敏感事件的處理中,我們常常采取回避、封堵或冷處理的辦法,試圖淡化輿情,急于控制事態而非疏導,這容易引發深層次的輿情危機。第三,輿情管控手段落后,設備投入不足。出現突發問題時,經常采用簡單粗暴的手段來拖延或壓制,如刪帖、封IP、斷網等。第四,網民配合消極。強大的網民力量,沒有有效地配合相關部門的工作,容易被錯誤的輿論所引導和控制。[5]

三、數據挖掘技術在網絡輿情管理中的應用

(一)網絡輿情關聯分析

在網絡輿情管理中應用關聯分析方法,能從海量、不完全、復雜多變的網絡輿情信息中尋找輿情演變的內在原因和規律,分析各內在因素之間的關系。禽流感該如何更好地監控?今天你寫Blog了嗎?這兩個事件放在一起看不出有什么特別的意義。但事實上,美國一家公司研究發現,這兩個事件之間有聯系,可以通過互聯網上的Blog網頁挖掘出和禽流感相關的信息,從而建立一個禽流感預警機制。

(二)網絡輿情聚類分析

聚類分析是一個將數據集中的所有數據,按照相似性劃分為多個類別的過程。聚類分析之后,應盡可能保證類別相同的數據之間具有較高的相似性,而類別不同的數據之間具有較低的相似性。依照網民表達的特點和性質,網絡輿情聚類主要有過程聚類和觀點聚類兩種。過程聚類主要指分析網民的思想觀點、態度情緒的改變,從而掌握網絡輿情的演變過程,監測二次輿情的發生。觀點聚類主要指把網民的相同觀點匯集起來,分析網民的各種觀點、情緒的分布和占比。

(三)網絡輿情分類分析

網絡輿情信息一般分為四類。第一,思想反映類。這主要是指社會上各個層次的網民的主流觀點,思想動態。第二,問題傾向類。這主要是指政府機關、企事業單位工作中存在的問題及不足。第三,工作動態類。這主要是指宣傳思想政治工作的形勢和動態。第四,對策建議類。這主要是指針對社會熱點、焦點話題提出的對策和建議。

根據自身需求,首先對海量的網絡輿情信息進行篩選,然后進行分類和分組,如分成教育醫療、反恐除暴、網絡安全、食品安全、城鎮化等類別,為下一步的工作打下基礎。最后對各類別的輿情信息進行分析和挖掘,得到有針對性的知識或經驗。

(四)網絡輿情預測分析

預測分析是指在掌握歷史資料和調研資料等現有信息的基礎上,依照一定的方法和規律,對事物未來趨勢或可能的結果進行測算,以預先了解事情發展的過程與結果。例如美國最重要的以軍事為主的綜合性戰略研究機構蘭德公司,運用運籌學理論和方法,曾經就“中國是否出兵朝鮮”、“中美建交”、“古巴導彈危機”、“美國經濟大蕭條”和“德國統一”等重大事件進行了成功預測,揭示了事件的變化規律和趨勢。[6]

(五)網絡輿情序列分析及時間序列

序列分析是指通過對網絡輿情信息發生的時間序列進行排序梳理,得出的重復發生概率較高的模式。序列分析技術可以很好地應用于網絡輿情的監控和預警。在輿情信息匯集和分析的基礎上,對社會運行接近負向質變的臨界值的程度做出初步確定的早期預報。事實證明,在一些危害社會穩定的不良事件發生之前、發生過程中,甚至是結束后,都能通過大量的網絡信息的收集、整理分類,有針對地選取數據并對該數據進行規律預測或優先等級排序,從而有步驟、有計劃的處理網絡輿情,這樣就能通過對輿情的收集達到實現對不良事件的預防和控制的目的;能夠及時掌握網絡輿情動態,避免很多事件向消極的方向發展,使對不良網絡輿情的處理從即時處置型向事前預警型轉變。在大規模輿情危機爆發之前,應盡早針對熱點話題梳理情況,快速應對。[7]

(六)網絡輿情偏差分析

偏差分析是指發現數據集中的異常數據。2008年3月14日發生在西藏拉薩的打砸搶燒事件,是一起駭人聽聞的嚴重暴力犯罪事件,給當地人民群眾生命財產造成了重大損失,使當地的社會秩序受到嚴重破壞。這一事件遭到了全國各族人民的強烈譴責,但同時針對這一動亂事件,西方媒體卻歪曲事實,混淆視聽,在報道中出現了極大的偏差,違背了新聞道德,損害了中國的國家利益。

四、結束語

隨著信息技術的快速發展,網絡輿情復雜多變,傳統的數據分析技術難以奏效。新興的數據挖掘技術能夠對網絡輿情進行關聯分析、聚類分析、分類分析、預測分析、序列分析和偏差分析,實現了對網絡輿情快速準確的監測、研判和引導,取得了較好的效果。

[ 參 考 文 獻 ]

[1] 趙新輝,郭瑞.基于數據挖掘技術的網絡輿情智能監測與引導平臺設計研究[J].電腦知識與技術,2012(1):1-2,4.

[2] 殷衛東,朱曉華,趙俊凱.網絡輿情技術淺析[J].信息網絡安全,2012(3):5-9.

[3] 柳勝國.網絡輿情中的具有影響力個體信息發現與WEB日志數據挖掘預處理技術[J].價值工程,2012(16):186-187.

[4] 楊永紅.基于數據挖掘技術的網絡輿情研究[D].重慶:重慶大學,2010.

[5] 徐曉日.網絡輿情事件的應急處理研究[J].華中電力大學學報(社會科學版),2007(1):89-93.

[6] 樂爍.蘭德公司發展經驗與對我國智庫建設的啟示[D].武漢:湖北大學,2013.

[7] 朱毅華,郭詩云,張超群.網絡輿情研究中的仿真方法應用綜述[J].情報雜志,2013(10):29-35.

[責任編輯:陳 明]

猜你喜歡
網絡輿情數據挖掘研究
誰說小孩不能做研究?
數據挖掘綜述
Applications of Deep Mixing to Earthquake Disaster Mitigation
A Thought:What have We Learned from Natural Disasters? Five Years after the Great East Japan Earthquake
對周期函數最小正周期判定法的研究與應用
軟件工程領域中的異常數據挖掘算法
“互聯網+”背景下高校平安校園建設研究
淺析網絡輿情治理
基于社會穩定視角的網絡輿情預警機制構建的思考
基于R的醫學大數據挖掘系統研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合