?

Web信息流演化模型研究

2015-04-30 21:10侯丹郭樹行
中國高新技術企業 2015年16期

侯丹 郭樹行

摘要:文章首先界定了Web信息流生命周期的研究范圍,綜述了信息數量、信息效用價值、輿情熱度等Web信息流生命指標方面的相關理論及其適用性;其次從生命周期管理模型視角對現有信息增長、信息效用價值、輿情熱度進行歸納評述;再次剖析了互聯網輿情引導的管理問題;最后討論了模型進一步研究所面臨的挑戰及未來的研究方向。

關鍵詞:信息生命周期;信息擴張模型;信息效用價值;輿情熱度;Web信息流演化模型 文獻標識碼:A

中圖分類號:TP309 文章編號:1009-2374(2015)16-0011-02 DOI:10.13535/j.cnki.11-4406/n.2015.16.006

現有研究指出Web信息流呈現指數級、爆炸式增長。面對日益增長的Web信息流資源,分析其生命周期,從而對Web信息流加以控制及管理顯得尤為重要?;ヂ摼W的廣泛應用,形成了大量Web信息流。由于Web信息流具備不同于傳統文獻信息的特點,使Web信息流生命周期雖然與傳統文獻生命周期大致相當,但在許多方面也發生了巨大的變化。Web信息流是指Web信息在網上傳輸、識別、利用的流轉形態。一般認為,Web信息流生命周期包括信息的產生(創造/發布)、采集、組織、開發、利用處置。Web信息流應該覆蓋從產生到失去效用價值所經歷的各個階段和整個過程。但是,對于Web信息流生命周期的界定應綜合上述學者的觀點,即Web信息流生命周期是指從Web信息流產生到最后利用處置的過程中,信息數量、效用價值、熱度等信息“生命指標”的變化。對于Web信息流生命周期的研究,不但包括對信息生命周期階段的劃分,還包括對信息“生命指標”的定量分析,從而更加客觀、全面地反映Web信息流生命周期的整個過程。

1 Web信息流演化概述

運用互聯網計量學的基本理論,一些學者提出了Web信息流擴張模型。一個互聯網的潛在收益,會隨著互聯網節點數量的增加而成指數地增長。即在無限的網絡環境下,假設信息的擴散不受任何條件限制,如網站數量、傳播速度、訪問限制等,則信息就能發揮其內生增長能力,網頁數量迅速增加,呈現指數增長規律,也稱為“J”型增長。一些學者分析網頁數量受到外界條件限制,不可能一直維持幾何級數增長。因此提出了運用Logistic模型來描述網頁數量隨時間推移的變化規律,即Web信息流S型增長模型。另外,參照貨幣擴張規律,以“信息轉發假設”和“信息創新假設”為基礎,一些學者提出Web信息流總量增長模型、互聯網真實信息量增長模型、互聯網泡沫信息量增長模型和Web信息流乘數擴張規律。同時,還證明了指數增長模型是將“信息創新假設”由有限創新能力改為無限創新能力時的特殊情況。

2 Web信息流演化度量

從Web信息流演化度量視角,可以包括如下視角:

2.1 引文分析法

引文分析法的一項重要應用是性能評估,它基于這樣一個假設,即引用顯示出被引用文獻對于后來研究的正的價值。一些研究表明,針對互聯網文獻這一假設同樣成立。對于互聯網出版物實施引文分析法能夠更好地分析出研究趨勢的結論,可以將文獻計量學中的文獻老化測度指標移植過來,包括對半衰期及普賴斯指數兩種度量指標。

2.2 鏈接分析法

鏈接分析法就是運用互聯網數據庫、數據分析軟件等工具,利用數學和情報學方法,對互聯網鏈接自身的屬性、鏈接對象、鏈接互聯網等各種對象進行分析,揭示其數量特征和內在規律?;ヂ摼W影響因子是常用的信息效用指標,它是指:假設某一時刻鏈接到互聯網上某一特定網站或區域的網頁數為a,而這一網站或區域本身所包含的網頁數為b,那么其互聯網影響因子的數值可以表示為。

2.3 輿情分析法

互聯網輿論的演變大致可分三個階段:發表個人意見,形成震源;意見領袖形成,促成互聯網輿情;權威意見引導互聯網輿情。例如,通過對某網絡論壇的分析,得出該網絡的度分布為冪律分布,有明顯的無標度特征。同時,互聯網輿情傳播除增長和優先連接外,還包括興趣衰減、初始吸引和邊的添加等事件。部分學者在分析互聯網輿情參與者基本屬性的基礎上,構造了話題參與者的“屬性矩陣”,提出意見領袖形成模型的綜合評價和排序方法。例如針對論壇內容,一些學者認為可以對由帖子的點擊數(或回復數)所形成的原始時間序列進行小波多尺度分析,產生一系列子序列并進行評價,并通過BP神經網絡進行類別訓練,找出使得內距離最小、類距離最大的若干系數作為特征系數,以此對網絡論壇話題的熱度趨勢進行預測。利用熱量傳遞模型對用戶在互聯網上的信息活動建模,提出適用于Web環境下的話題抽取與熱度評價算法。

3 Web信息流演化管理的問題剖析

互聯網真實信息增長模型指出,互聯網真實信息數量與互聯網節點數、Web信息流轉發輪次數(即時間)成正比,但現有增長模型沒有考慮由于信息發布者權威度不同而導致的信息社會影響力的區別。同時,不同Web信息流由于處于生命周期的不同階段,也會導致其轉發輪次數效用的區別。Web信息流生命周期應分為信息生成期、信息熱化期、信息爆炸膨脹期、信息熱度收斂期以及信息消亡期。不同時期同一主題下互聯網真實信息數量增長率()應存在相應的閾值。如果超出閾值,則應發出警報信號,比如可將預警區分為藍色祥和區(信息增長良好區)、綠色安全區(信息增長正常區)、橙色警戒區(信息增長基本安全區)和紅色警戒區(信息增長異常區)。通過對信息增長速度的監測,方便相關部門對Web信息流生命周期進行管理及控制。

Web信息流生命周期管理貫穿于Web信息流生命周期的各個階段?;ヂ摼W真實信息增長模型,不僅可以分析出Web信息流處于生命周期的哪個階段,同時也給出了Web信息流生命周期管理的入手點。從信息來源角度看,政府網站、新聞及網絡媒體站點權威度較高且大多由正規部門管理,因而可以通過控制相關站點實現對信息生命周期的管理。比如:對于社會有益信息,在信息生成期可以借助該類站點發布,同時在信息熱化期持續發布相關信息促使進入信息爆炸膨脹期,同時當監測除信息已進入熱度收斂期后,應采取挖掘信息等措施不斷引起社會關注,激發信息生命活力,避免信息進入消亡期。而對于負面信息,由于容易造成社會恐慌引起不必要的社會問題,Web信息流管理部門應及時控制論壇、博客、個人空間等帶有明顯互動或用戶自產生內容的站點的信息發布數量。該類站點雖然權威度較低,但如果相關信息大量出現,仍會對社會產生巨大的影響。

4 Web信息流演化的發展趨勢

4.1 網絡信息融合與集成

隨著大數據時代的到來,網絡信息異構的情況逐漸增加。各個系統和資源庫多平臺運行、數據庫模式各不相同、數據被割裂在不同的設備上,這樣多方式運行的弊端,不僅造成網絡信息浪費重疊,同時也造成網絡資源和數據無法共享,平臺之間信息交流和共享十分困難。如何使Web信息流融合與集成成為網絡信息發展的趨勢。信息融合應做到:提高信息的完整性,排除冗余與噪聲;降低不確定性,提高信息的精確度和可靠性;去偽存真,提高信息的一致性和可信度。目前對異構信息融合與集成的研究,側重對結構化、半結構化和非結構化這種結構級的融合和集成,而因為各信息源的分布自治性,語義級的異構的融合和集成鮮有成熟的方法和技術,語義級的異構的融合和集成是異構信息有效融合與集成瓶頸。

4.2 動態管理

網絡信息在利用的初期,信息價值得到不斷挖掘和發揮,但衰退期利用情況大幅度下降,直至被不斷新生產出來的信息覆蓋,以致在較長時間得不到利用后,便判斷為失效信息。這個時候,某些網絡信息個體往往還有較多的剩余價值沒有得到發揮就轉變成為了隱性價值。這種情況的發生大多來源于信息獲取渠道的不暢通(比如被不斷更新的信息覆蓋掉),網絡信息管理者應采取相應的干預策略,比如置頂、加精華以及熱度排行等。但目前管理者采取行動的標準一般是單一的累積點擊率排行,而這種排行沒有考慮到網絡信息的動態性所帶來的誤判概率的提高,這種管理實踐行為不但粗放而且缺乏科學依據,因此應構建生命階段模糊識別模型,實施動態管理,采用基于相對指標的定量識別模式來實現對網絡信息生命狀態的定位,可以根據網絡信息的相對利用情況以及目前所處的生命階段,采取單期或多期的推送策略來適當延長網絡信息的生命周期,以實現其價值的最大化發揮。

5 結語

Web信息流擴張模型、Web信息流效用價值模型、互聯網輿情熱度模型從不同角度研究了Web信息流生命周期的規律,但對于互聯網生命周期綜合性的研究仍處于初步階段,有關互聯網生命周期管理模型的研究也處于理論研究階段。由于Web信息流非結構性、動態性的特點,使得Web信息流生命周期的研究也較為復雜。今后的研究應在現有研究的基礎上,進一步結合現實網絡環境,更加深入、全面地對Web信息流生命周期進行剖析。

參考文獻

[1] 張春穎.信息生命周期管理研究述評[J].情報科學,2012,(6).

[2] 劉曉娟,王昊賢,張愛蕓.微博信息生命周期研究[J].圖書情報工作,2014,(1).

[3] 張青敏.基于系統動力學的網絡環境下信息生命周期演化規律研究[J].情報理論與實踐,2011,(5).

[4] 陳敏杰,馬費成.網絡信息的沉睡和喚醒現象[J].圖書情報知識,2012,(5).

[5] 劉磊.網絡輿情深度挖掘模式研究[J].情報探索,2010,(12).

[6] 馬費成,蘇小敏.網絡信息生命階段的模糊識別研究[J].情報科學,2012,(9).

作者簡介:侯丹(1994-),女,內蒙古人,就讀于中央財經大學信息學院電子商務系,研究方向:信息服務與網絡

科學。

(責任編輯:周 瓊)

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合