?

可視化分析技術在網絡輿情研究中的應用

2016-12-21 23:40張偉
現代情報 2016年11期
關鍵詞:可視化分析網絡輿情大數據

張偉

〔摘要〕由于網絡輿情信息具有明顯的大數據特征,使用傳統的數據收集、分析與表現方法不僅存在效率低下的問題,而且難以發現其中的關鍵信息以及信息背后的潛在特征。就此而言,發端于科學計算領域的可視化分析技術能夠化繁為簡,用易于理解的圖形圖像揭示網絡輿情的分布、發展和演化規律,因而在網絡輿情研究中具有非常顯著的應用價值。本文根據網絡輿情信息呈現形式上的差異,分別探討了層次信息、文本信息和關系網絡信息可視化方法在網絡輿情研究中的應用范式和實現途徑,以期推進網絡輿情研究的縱深化。

〔關鍵詞〕可視化分析;網絡輿情;大數據

DOI:10.3969/j.issn.1008-0821.2016.11.015

〔中圖分類號〕G203〔文獻標識碼〕A〔文章編號〕1008-0821(2016)11-0082-05

〔Abstract〕As network public opinion has obvious characteristics of large data(as a concrete manifestation of the four aspects,namely massive,diverse,dynamic and low value density),using traditional data collection,analysis and presentation method not only has the problem of low efficiency,and is also difficult to find the key information and the potential characteristics behind information.In this regard,visualization analysis technology,originating from scientific calculation,can be used to make things simplified by using easily understandable graphical images to reveal network public opinions distribution,development and evolution.Therefore,in the network public opinion research,the technology has very significant application value.Based on the difference of network public opinions information present form,the essay respectively discussed the hierarchical information,text information and network information visualization methods application paradigm and the way of realization in the research of the Internet public opinion,in order to promote the network public opinion research in depth.

〔Key words〕visualization analysis;network public opinion;big data

隨著信息網絡技術的發展以及網民數量的急劇增長,互聯網對人們生活的影響在廣度和深度上都呈現出不斷擴張的趨勢。在當今社會,互聯網不再僅僅被當作加強信息傳遞、提升工作效率和促進人際交往的工具,它所具有的匿名性、交互性、即時性和非中介性等特征從技術上突破了傳統媒介的局限,使得越來越多的人開始寄希望于通過互聯網來改善現實中的公民社會參與和政治民主實踐。近些年來頻繁進入公眾視野的網絡事件,如鄧玉嬌事件、“躲貓貓”事件、甕安事件、石首事件、郭美美事件等等,都是借助互聯網實現廣泛與快速傳播的。在社會矛盾和社會問題難以通過正常的社會通道妥善處理和解決的情況下,網絡輿情的此起彼伏成為一項短期內無法消解的社會事實。

在此背景下,網絡輿情研究成為一門受到廣泛關注的熱點研究領域。通過對現有文獻的梳理,可以發現,不同學科的研究者依托各自的學科背景對網絡輿情的各個方面進行了較為全面的研究,但這些研究主要集中在學理的討論和政策的分析上,比如,從新聞傳播學角度進行的對特定網絡輿情事件的分析以及從政治學和行政管理的視域開展的網絡輿情引導與管控策略的研究等等;就使用的方法或技術而言,當前的網絡輿情研究仍然深受傳統數據時代輿情分析的影響,與大數據這一時代背景相吻合的網絡輿情分析方法上的創新雖然已經嶄露頭角,比如基于網絡日志數據挖掘的隱性輿情分析、基于社會網絡分析的輿情主體關系發現等都被應用到網絡輿情研究領域[1],但在方法應用的實用性、契合性等方面還有待進一步向前推進。為此,本文引入發端于科學計算領域的可視化分析技術,在探討它對網絡輿情信息耦合的基礎上,詳細闡述針對不同類型網絡輿情信息可視化分析技術。

1網絡輿情信息與可視化分析技術的耦合

網絡輿情本質上是關于某一特定議題的各種信息的集合,這些信息存在于無限延展的網絡空間中,并隨時間的推進而呈現出動態的變化。具體而言,網絡輿情信息的特征可以歸納為如下4個方面:

11網絡輿情信息的海量性

相比現實輿情發生發展過程必然面臨的時空限制,網絡輿情可以在極短的時間內獲得極大范圍內的討論,因而在信息存量上得到了極大的改變,比如2014年熱度排名第一的“MH370航班失聯事件”僅微博發文量就達到了2 500萬條,排名第二的“香港占中事件”共計獲得超過2 160萬的新聞討論量,與該事件相關的微博數量接近117萬條,想要了解關于某一特定事件或議題的網絡輿情發展脈絡,或者探究其中包含的網絡民眾意見傾向性的變化趨勢,需要對這些巨量化的信息進行妥善的加工和處理。

12網絡輿情信息的多樣性

它既可以呈現為變量為核心的傳統數據形態,也可以成為視頻、圖片、網絡日志、地理位置信息等新型數據形態,也就是說,網絡輿情信息既可以是結構化的(即可以通過二維表進行邏輯表達并用數據庫直接存儲的信息),也可以是半結構化和非結構化的(即難以或無法用數據庫二維邏輯表現的信息),其中半結構化和非結構化信息在其中占據較大的份額,這些多樣化的信息表現形態對網絡輿情信息的處理能力提出了更高的要求。

13網絡輿情信息的動態性

僅僅抓住網絡輿情發展過程某一時點的信息進行橫截面的考察雖然也能獲得一些較具價值的結論,但是卻難以把握網絡輿情的發展脈絡以及其中可能涌現的規律,網絡輿情具有一個發生發展的生命周期,且一般情況下它的整個周期不會持續太長的事件,從這個意義上來說,網絡輿情信息總是處于快速的動態演進狀態。

14網絡輿情信息的低價值密度性

這是與信息的海量性相對的一個特征,它所說的是網絡輿情信息存在著較多的噪聲,如果僅僅關注于其中某一條信息將是毫無價值的,只有通過對龐大數據量的“提純”才能從中發現有價值的模式或知識。

網絡輿情信息上述4個方面的特征與Martin Hilbert等人[2-3]歸納的大數據的4個維度(Volume,即巨大的數據量;Variety,即多結構化數據;Velocity,即增長速度快;Value,即價值密度低)具有高度的契合性,這種關系可以通過圖1呈現出來。

在此情況下,使用傳統的信息處理技術進行網絡輿情信息處理將必然面臨有心無力的困境,網絡輿情信息的分析和處理方式必須在大數據的思維下有所創新[1,3]。為此,可以從4個方面著手:一是繞開語義分析的技術瓶頸,開辟“隱性”輿情分析的“第二戰線”;二是突破抽樣分析的思維,用大數據方法分析收集到的全體數據;三是將搜索數據、點擊數據、人際關系數據、網民個人特征數據、相關社會數據等關聯起來進行分析;四是主動進行網絡民意調查,有針對性地收集標準化數據[1]。在具體的分析方法上,網絡輿情信息與發端于科學計算領域的可視化分析技術具有耦合關系。作為一種比較成熟的信息處理技術,可視化分析將計算機圖形學、數據挖掘及認知心理學等諸多學科的理論和方法結合在一起,能夠將規模龐大的抽象信息以直觀的視覺方式表現出來,使人們能夠充分利用視覺感知能力去觀察和處理信息,從而發現信息之間的關系以及其中隱藏的模式。美國國家科學基金會在發表的《科學計算可視化》報告中提出了可視化的概念,指出可視化是一個可以處理海量數據的可行工具之一,它能使科研人員發現數據內部隱藏的信息,從而進一步找出信息所反映的規律,提高對海量數據的認識。在網絡輿情研究過程中,使用可視化分析技術能夠克服傳統數據收集、分析與呈現方法上存在的效率低下以及難以發現其中的關鍵信息與潛在特征的不足,通過化繁為簡、化抽象為具象,能夠使用易于理解的圖形圖像揭示網絡輿情的分布、發展和演化規律,因而在網絡輿情研究中具有非常顯著的應用價值。

2多種網絡輿情信息的可視化分析技術

網絡輿情信息的可視化是當前商業化輿情監測或分析系統意圖實現的一項主要功能,比如微博分析領域較為著名的知微網就將自己定義為一個可視化的微博信息分析平臺,利用可視化分析技術,知微網能夠通過一條微博的傳播途徑、過程和效果等信息檢測微博的傳播效果和其中傳播的主要因素。在具體的研究過程中,可視化從嚴格意義上來說是一種信息分析框架,原始信息、數據表格、可視化結構和最終呈現在用戶面前的視圖被這一框架有機的鏈接在一起[4]。圍繞網絡輿情信息的不同類型,如下部分有針對性地對這些信息的可視化分析技術進行詳細的介紹。

21網絡輿情文本信息的可視化

作為社會輿情的一種表現形式,網絡輿情是社會公眾在互聯網空間中公開表達的對某種社會現象或社會問題的具有一定影響力和傾向性的態度、意見和情緒表現的總和。由于缺乏面對面的互動,這些態度、意見和情緒一般都是以文本或符號的形式表現出來。因此,文本信息是網絡輿情信息最主要的表現形式之一,透過網絡輿情文本信息的挖掘,與此相關的一系列可視化分析技術能夠在極短的時間內準確呈現網絡輿情文本信息中的核心內容及其彼此之間的關系結構。就此而言,比較常用的可視化分析技術主要有基于關鍵詞的網絡輿情文本內容的可視化、時序性網絡輿情文本信息的可視化等等。

211基于關鍵詞的網絡輿情文本內容的可視化

網絡輿情文本信息中的關鍵詞能夠反映網絡空間中的社會公眾對特定社會現象或社會問題的聚焦點,因而對網絡輿情研究具有重要價值。所謂關鍵詞,是指從特定文本的文字描述中提取的語義單元,它能反映文本內容的側重點。關鍵詞的提取原則多種多樣,其中最為常見的方法是詞頻排序法,也就是說,越是重要的單詞,在文檔中出現的頻率就會越高?;陉P鍵詞的網絡輿情文本內容的可視化可以通過繪制標簽云[5,6]的形式加以實現,這一可視化分析技術主要通過抽取文本中的關鍵詞并將其按照一定的順序、規律和約束用整齊美觀的圖形界面呈現出來。圖2給出了2010年以來收錄在CSSCI期刊上的400余篇網絡輿情研究領域相關研究論文的關鍵詞標簽云,從中可以非常清楚地看出來自不同學科的研究者開展的網絡輿情研究到底聚焦于哪些問題、側重于何種角度,以及使用了什么方法等等,這對我們了解網絡輿情的研究現狀具有重要價值。同樣的道理,通過收集某一事件相關報道或討論的文本信息,并以此為基礎進行標簽云的繪制能夠更加清晰地呈現這一熱點事件的民眾聚焦以及事件本身的發展和演進過程。圖2網絡輿情研究領域相關論文的關鍵詞標簽云

212時序性網絡輿情文本信息的可視化

對于具有時間和順序屬性的文本信息,其內容具有有序演化的特點。研究者不但可以從這些文本信息中發掘其中的關鍵內容,還能以時間為主線探尋這些關鍵內容的演變狀況。網絡輿情信息本身具有的動態性特征,使得研究者在處理這些信息的時候不可避免地要將時間納入考慮的范圍。對于具有明顯時序性的網絡輿情信息,主題河(Theme River)是一種比較常見的可視化分析技術。如圖3所示,主題河將文本資料中的主題隱喻為時間上不斷延續的河流,能夠幫助人們觀察與特定事件相關的文本主題的產生、變化和消失的全部過程,進而呈現一個宏觀的主題演化結果。在2000年,Susan Havre等人就已經使用了這種方法分析了1990年6~8月美國聯合通訊社(The Associated Press)新聞數據的主題演變狀況[7]。在國內的網絡輿情研究中,詹建和高民權在其一篇研究論文中介紹了以主題河為核心的網絡輿情可視化關聯分析方法,并通過實證研究證明了這種方法不但能從整體上展現網絡輿情在時間上的變化,而且能從多種角度顯示類屬、關系和熱點話題等細節,進而有助于發現網絡輿情發展變化背后的原因和規律[8]。

22網絡輿情層次信息的可視化

信息集合的單元之間組成了不同的結構關系,這些結構形式通??梢苑譃轫樞蚪Y構、層次結構和網狀結構3種類型。上文提到的時序性網絡輿情文本信息的可視化所揭示的就是一種順序結構,除此以外,大量的信息集合都具有嚴格的層次結構,無論在信息技術領域還是在社會經濟的各個方面,信息的層次結構都是一個非常普遍的現象。對具有層次結構的信息進行可視化分析有助于改善研究者對層次結構數據及數據項之間關系的理解,因此,在信息認知階段,層次信息可視化技術作為有效的抽象信息展現工具,被廣泛應用于輔助理解和分析層次結構數據集。通過對抽象層次信息進行合理美觀的可視化描述,研究者能快速準確地發現數據集中隱含的特征信息,并針對任務進行可視化分析,幫助解釋現象、發現規律和制定決策[9]。隨著可視化技術的發展,能夠描述層次信息的可視化方法不斷涌現出來,按照它們各自的可視化隱喻,可以將其分為3類:一是使用節點鏈接的方法構造可視化圖形,在這類圖形中,節點用于表示數據或內容信息,節點之間的連線則可用于描述數據或內容之間的結構,該類層次信息可視化技術主要有節點鏈接樹、雙曲樹、徑向樹等;二是使用空間填充法構造可視化圖形,在這類圖形中,各種形式的包圍框用于內容信息的表示,包圍框之間的封裝關系可用于描述各內容信息之間的層級,如樹圖、勢力范圍圖等都屬于此種類型;三是使用混合的方法,結合多種可視化分析技術和思想進行可視化圖形的構造,其代表性技術有彈性層次圖、層次網圖等。在網絡輿情研究中,研究者可以根據自己的關注點選擇合適的層次信息可視化技術來呈現信息項之間錯綜復雜的層次關系,比如想要探究網絡輿情信息擴散的路徑就可以使用節點鏈接樹的方法來發掘其中的關鍵節點。圖4使用了節點鏈接樹的形式給出了一條微博信息的擴散路徑,從中可以看出,該條微博信息的擴散過程并沒有經歷較多的層級,其影響范圍主要來自信息發布者第一層級的傳播以及少量信息轉發者第二層級的傳播。

23網絡輿情關系網絡信息的可視化

相較于層次信息,關系網絡信息并不具有自下而上或自上向下的層次結構,其中嵌入的是一種更加復雜的網狀結構,使用一般的統計分析或圖示方法很難對其進行量化的表征和分析[10],隨著上世紀末期復雜網絡研究的興起,社會網絡分析逐漸成為處理此類信息的主要方法。在具體的分析過程中,社會網絡分析以關系的量化為基礎,通過繪制網絡關系圖的形式快速直觀的解釋和概覽網絡結構信息,一方面可以更好地呈現不同實體間的關系結構;另一方面也有助于挖掘隱藏在網絡內部的有價值信息。按照Shneiderman等人[11]提出網絡節點布局方法,關系網絡信息的可視化一般可以按照力導向布局(Force-directed Layout)、地圖布局(Geographical Map Layout)、環狀布局(Circular layout)、層次布局(Substrate-based Layout)和時間布局(Time-oriented Layout)等5種布局形式加以呈現。就網絡輿情研究而言,揭示不同行動者在網絡輿情傳播過程中發揮的作用大小,進而甄別其中的關鍵節點或意見領袖,對于探討輿情演化規律、引導輿情走向具有重要意義。在現有的以可視化分析技術為支撐的網絡輿情研究成果中,社會網絡分析是一種最受偏好的可視化分析方法[12-14],比如李彪以最具影響力的40個網絡輿情熱點事件為研究樣本,選取其傳播初期的前3個信息節點,運用社會網絡分析的方法分析了網絡輿情空間的基本結構,并在此基礎上構建了網絡輿情傳播的空間結構模型。圖5是使用力導向布局中的Hu Yifan布局法[15]進行的社會網絡關系圖的繪制,其數據來自2010年最具影響的34個網絡輿情事件,從中可以看出,天涯社區是當時最主要的網絡輿情發源地。

除了上述3種類型的網絡輿情信息可視化分析技術,一些常見的統計圖形亦可用于展現網絡輿情信息的時間趨勢、情感傾向、區域分布等特征。伴隨著大數據與計算社會科學的興起,網絡輿情雖然包含著較多的半結構和無結構信息,但是這些信息只需經過適當的轉換就可以通過具有一定結構的圖形形式呈現出來。網絡輿情研究是一個涉及多門學科的交叉性研究領域,來自不同學科的研究視角和研究方法都可用于網絡輿情信息的分析和處理,可視化作為一種信息分析的方法與技術可以與案例分析、調查研究等傳統的社會研究方法相互配合,共同為網絡輿情關鍵信息和內在規律的發掘提供方法和技術上的支撐。

3結論

大數據環境下的網絡輿情研究不是僅僅依靠某一學科的理論或方法就能得到理想的研究結果,作為一項綜合性圖5網絡輿情信息前期傳播空間的關系網絡圖(2010年)

社會問題,它涉及數據挖掘、輿情分析、政府決策等多個被有機聯系起來的研究領域,因而需要集合傳播學、政治學、社會學、計算機科學與技術等多個學科的理論和方法支持,才能得到富有真知灼見的創新性成果。如果囿于某一學科背景,僅從單一視角出發研究具有極大復雜性的網絡輿情信息,其研究結果往往也會受到局限。因此,大數據時代的網絡輿情研究應該突破傳統數據時代靜態化、單一化和片面化的研究思維,進行動態化、立體化和全局化的綜合探討。就此而言,可視化分析技術作為一種有效的數據表達方式,它能妥善應對網絡輿情信息具有的海量性、多樣性、動態性和低加之密度性特征,在卷帙浩繁的網絡輿情信息中發現其中內涵的趨勢、模式及規律。從這個意義上來說,可視化分析技術的應用對于推進網絡輿情研究具有重要意義。

參考文獻

[1]唐濤.基于大數據的網絡輿情分析方法研究[J].現代情報,2014,(3):3-6.

[2]Hilbert M,López P.The Worlds Technological Capacity to Store,Communicate,and Compute Information[J].Science,2011,332(6025):60-65.

[3]謝耘耕,劉銳,喬睿,等.大數據與社會輿情研究綜述[J].新媒體與社會,2014,(4):133-154.

[4]Card S K,Mackinlay J D,Shneiderman B.Readings in Information Visualization:Using Vision to Think[M].Morgan Kaufmann,1999.

[5]Viegas F B,Wattenberg M,Feinberg J.Participatory Visualization with Wordle[J].IEEE Transactions on Visualization and Computer Graphics,2009,15(6):1137-1144.

[6]McNaught C,Lam P.Using Wordle as a Supplementary Research Tool[J].The Qualitative Report,2010,15(3):630-643.

[7]Havre S,Hetzler B,Nowell L.Themeriver:Visualizing Theme Changes over Time[J].IEEE Symposium on Information Visualization,2000:115-123.

[8]詹建,高民權.基于主題河的網絡輿情可視化關聯分析方法[J].情報資料工作,2014,(6):17-22.

[9]肖衛東,孫揚,趙翔,等.層次信息可視化技術研究綜述[J].小型微型計算機系統,2011,(1):137-146.

[10]Yu-Bin Y,Ning L I,Yao Z.Networked Data Mining Based On Social Network Visualizations[J].Journal of Software,2008,(8):1980-1994.

[11]Shneiderman B,Aris A.Network Visualization by Semantic Substrates[J].IEEE Transactions on Visualization and Computer Graphics,2006,12(5):733-740.

[12]熊熙,胡勇.基于社交網絡的觀點傳播動力學研究[J].物理學報,2012,(15):104-110.

[13]何敏華,張端明,王海艷,等.基于無標度網絡拓撲結構變化的輿論演化模型[J].物理學報,2010,(8):5175-5181.

[14]卞曰瑭,何建敏,莊亞明.基于復雜網絡的非常規突發事件的傳播演化模型與仿真[J].統計與決策,2011,(4):22-24.

[15]Hu Y.Algorithms for Visualizing Large Networks[J].Combinatorial Scientific Computing,2011,5(3):180-186.

(本文責任編輯:馬卓)

猜你喜歡
可視化分析網絡輿情大數據
我國職業教育師資研究熱點可視化分析
聲波吹灰技術在SCR中的應用研究
淺析網絡輿情治理
基于社會穩定視角的網絡輿情預警機制構建的思考
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合