?

基于BP神經網絡的網絡輿情預警研究

2020-01-04 07:21侯萍崔孟杰
電子商務 2020年12期
關鍵詞:BP神經網絡網絡輿情指標體系

侯萍 崔孟杰

摘要:企業網絡輿情傳播對企業和社會產生不可忽視的影響,對企業網絡輿情監測和預警的研究能夠為管理部門提供理論和實踐指導。從輿情熱度,輿情狀況和輿情趨勢三個方面,綜合現有指標體系的優缺點,構建一個具有三個一級指標、十個二級具體指標的企業網絡輿情危機預警指標體系。將獲取到的指標數據運用定性與定量相結合的方法進行無量綱化處理,并利用Matlab進行BP神經網絡模型創建,建立企業網絡輿情危機預警模型。選取2017年以及2018年輿論相對集中的“攜程親子園”事件以及“滴滴空姐遇害”事件進行模型的訓練以及模型驗證。實驗結果表明,基于BP神經網絡的企業網絡輿情危機預警模型是有效和可行的。

關鍵詞:網絡輿情;指標體系;BP神經網絡;輿情預警

中圖分類號:G350;TP393

★基金項目:國家重點研發計劃課題(2017YFD0401005);江蘇省高校自然科學研究面上項目(18KJB520038)。

引言

隨著互聯網科技的迅速發展,網絡深入到人們的日常生活中,網絡輿情逐步轉化為社情民意的主體部分,網絡輿情技術隨著互聯網的發展,涉足面越來越廣,負面網絡輿情對于企業造成的影響越發凸顯,企業對于自身的輿論也越來越重視,能夠提前預知大規模負面輿論的爆發,可以使企業及時采取有效的措施進行防范,盡可能的降低輿論帶來的負面效應,及時止損。一個完善的企業網絡輿情預警系統有著十分重要的現實意義。在負面輿論大規模爆發的前夕及時告知企業管理者,采取相應的應對措施減少負面輿論帶來的不利影響,及時規避輿論惡化。國內外學者紛紛展開了網絡輿情指標體系和預警模型構建的研究。在網絡輿情危機預警方法方面,文獻[1]利用動態層次文本聚類法挖掘網絡輿情預警過程中的熱點話題。文獻[2,3]構建了微博輿論場超網絡模型,提出了微博輿論場場強計算公式判別微博輿論場中輿情的演化。設計了基于微博輿論場的輿情演化規則。文獻[4]首先根據Lyapunov指數證明網絡輿情具備混沌的特征,然后對網絡輿情時間序列數據進行相空間重構,最后進行網絡輿情預測。文獻[5]提出一種基于模糊推理理論的網絡輿情觀點聚合的CA(Cellular Automaton)模型,在元胞自動機模型Moore鄰域結構下演化并分析個體屬性以及鄰域環境對網絡輿情觀點聚合現象的影響。文獻[6]針對熱點傳播的問題提出改進的SIRS傳播模型,該模型結合博弈論對SIRS模型中的傳染體和免疫體進行演化博弈建模,對SIRS模型進行改進,得到熱點話題傳播的平衡點和規律。文獻[7]也構建了謠言事件傳播模型,研究熱點事件傳播規律。文獻[8]為了解決網絡輿情預警評價問題中樣本數據的非線性和髙維性等實際難題,提出以投影尋蹤理論為基礎,利用文化基因算法確定最佳投影方向,建立了基于文化基因算法的網絡輿情評價的投影尋蹤模型。文獻[9]將模糊神經網絡模型用于公司產品市場銷售狀態的預警問題,為銷售人員處理市場危機問題提供參考意見。

綜上所述,國內外學者針對輿情監測預警模型主要集中在模型構建及態勢評估等方面,從應用角度對企業網絡輿情構建模型并量化算法的實例研究的成果較少。本文構造企業網絡輿情危機預警指標體系并運用BP神經網絡模型建立企業網絡輿情預警模型。選取2017年以及2018年輿論相對集中的“攜程親子園”事件以及“滴滴空姐遇害”事件進行模型的訓練以及模型驗證。

1、企業輿情危機預警指標體系

1.1 企業輿情危機預警指標體系構建

依據2006年國務院發布的《國家突發公共事件總體應急預案》,將預警等級按照各類突發公共事件的嚴重程度、可控性和影響范圍等因素分為Ⅰ級(特別重大)、Ⅱ級(重大)、Ⅲ級(較大)和一般[10]。本文將輿情危機預警劃分為五個級別,分別是安全、一般、警告、嚴重,用1000、0100、0010、0001來表示。建立一個科學、嚴謹、高效、可行的完善的企業網絡輿情預警指標體系最關鍵的在于指標體系中各項指標的選取,合理正確的指標有助于提升指標體系的合理性。我國的輿情預警研究的學者已經在該方面取得了顯著的成果,文獻[11]從傳播媒體、傳播范圍、傳播速度、情緒傾向程度及相關度等方面對輿情潛在影響力進行探索,構建了網絡輿情潛在影響力指標體系并設計潛在影響力計算模型,對探討網絡輿論的潛在影響有一定的現實意義。文獻[12]基于網絡輿情中的輿情等級分類,劃分移動社交網絡中的輿情等級,同時結合生命周期理論,分析移動社交網絡輿情生命周期。并通過實證研究驗證指標體系是否合理。本文依據前人的研究,網絡輿情預警指標的選取本著定量為主,定性為輔、科學性、可操作性等原則,最終構建3個一級指標,10個二級指標的網絡輿情預警指標體系。在選取指標的同時,盡可能的以最少指標達最優預警目標的準則來選取,同時為了使模型容易構建,進行量化處理,盡可能的選擇定量指標。

1.2 企業輿情危機預警指標說明

輿情熱度是研究輿情的重要指標,通過搜索量、轉發數、評論數、點贊數來衡量輿情熱度,末端數據的獲取主要來自于百度指數以及新浪微博。搜索量是指在一定的時間條件下,通過百度指數高級檢索,檢索指定企業名稱為關鍵字的網絡曝光率以及網民關注度。搜索量的多少反映了網民對于該話題的關注程度,通過搜索量的排序可以明確當前的熱點話題。評論數是指在新浪微博中,網民對于某一輿情熱點話題的評論,通過評論的內容以及評論數量的多少可以反映出該輿情事件在網民心中的關注程度。轉發數轉發數是指在新浪微博中,某條關于某熱點事件的評論被轉發的次數,如果網民轉發該微博, 即表示他對于這一評論表示認同。轉發數反映了該條微博在網民中的認可度。點贊數是指在新浪微博中,某網絡輿情事件獲得的點贊數量,該數值越大,則表明網絡輿情發生的概率越大。

輿情狀況主要通過網絡輿情的真實性、輿情話題的敏感性、網民觀點的傾向度來表示。網絡輿情的真實性,話題的敏感程度以及觀點的傾向度較為全面地展示了輿情的狀況。真實性主要是因為網絡空間的虛擬性與真實性相互融合,再加上互聯網的虛擬性,許多言論難以辨分,輿情的真實性是反映輿情狀況的最關鍵的指標。真實性采取定量分析的方法來確定,參考新浪微博的認證用戶關于某網絡輿情事件的微博數占全部的百分比來確定,認證用戶是實名認證的,需要對自己發言的真實性負責,認證用戶的言論的真實性較高。輿情的敏感性是用來衡量輿情未來發展的主要指標。敏感性越高,則該網絡輿情熱點話題的關注度越高,敏感性指標通過定性分析獲取。傾向度是指網民對于某網絡輿情熱點話題所持的贊同、中立或是反對的態度。按照人們對于某事件的看法,傾向度可以分為贊同,中立,反對。該指標通過新浪微博中負面微博的占比來表示。

輿情趨勢指的是輿情在接下來的一段時間內的發展趨勢,主要是通過觀察網絡輿情的熱度變化得出,而網絡輿情熱度變化主要通過搜索量變化、轉發數變化、評論數變化得以體現,最終得出網絡輿情的趨勢變化。搜索量變化通過百度指數中在一段時間內對于某網絡輿情事件相應關鍵詞檢索的數量變化來衡量。轉發數變化通過新浪微博中關于某網絡輿情事件的微博的轉發數量的變化來計算。評論數變化指的是新浪微博中關于某網絡輿情事件的微博的評論數數量的變化。

2、企業網絡輿情預警模型構建

2.1 BP神經網絡的設置

本文采用BP神經網絡進行企業網絡輿情預警模型的構建,由于BP神經網絡結構中包含隱含層,通常情況下,隱含層越多,網絡的復雜性越高,計算難度越高。本文采用只包含一個隱含層的BP神經網絡結構。

2.1.1 輸入層、輸出層、隱含層節點確定

依據構建的企業網絡輿情預警指標體系,在該體系中選取了10個指標作為企業網絡輿情預警模型的預警指標,則輸入節點數為10,確定了預警等級為安全(1000)、一般(0100)、警告(0010)、嚴重(0001)四個等級,則輸出節點為4。

隱含節點的確定采用公式(1)進行隱含節點的計算。

其中m為輸入層節點數,n為輸出層節點數,a為1-10之間的常數。

2.1.2 輸入數據的歸一化處理

由于指標選取的時候對相應的各項預警指標進行了一定的量化處理,在進行模型構建時,為了便于計算,減小誤差,再一次的進行歸一化處理,即通過公式將所有收集到的原始數據進行整理,同意轉化為(0,1)區間內的無量綱指標值。

指標有正負方向之分,所以在進行數據歸一化的無量綱指標處理時,也有著不同的方法。正向指標指標值越大越安全,所以以最小值為基準進行歸一化處理,即在進行無量綱化處理時采用公式(2)進行處理;而負項指標與正向指標恰好相反,指標值越小越安全,在無量綱化處理時以最小值為基準,進行歸一化處理即采用公式(3)。

2.1.3 訓練參數的設置

在對數據進行歸一化處理之后,設置訓練參數,訓練參數的設置不同也會對網絡性能有一定的影響。

設置隱含層、輸出層傳遞函數為logsig(對數S型傳遞函數),具有非線性的特點,設置訓練函數為traingdx(學習率可變的BP算法),學習函數為learngdm(梯度下降動量學習函數),在相對應的訓練參數設置中,設置顯示間隔show = 25,設置網絡學習效率lr = 0.05,設置動量參數mc = 0.9,設置最大訓練次數epochs =1000,設置目標誤差goal =1e-5,而其余的相關參數保持默認值不變。

2.2 預警模型建立

依據公式(1)進行隱含節點的確認,可計算出神經元的個數為4-13之間,通過測試發現當a=10時,神經網絡的性能達到最佳,即確定隱含層節點數為10。選取2017年11月“攜程親子園虐童”事件作為本文的研究對象,以10個具體指標建立企業網絡輿情危機預警指標體系。首先分析企業網絡輿情指標體系中的各項指標的性質,得到分析結果如表1所示。按照攜程親子園事件的進展設定了8個時間點,方便數據采集以及觀測,如表2所示。

利用烽火輿情軟件進行相應的關鍵詞檢索,得出“攜程親子園”事件的輿情走勢,分析相應的負面輿情占比,通過當日的負面輿情占全部輿情數的占比得出觀點傾向度,輿情走勢如圖2所示。利用百度指數工具高級檢索對“攜程親子園”限定關鍵詞進行檢索,得出搜索量以及搜索量變化指標原始數據如圖3所示。

在每個時間節點以“天”為單位做平均值處理,使數據具備可比性。評論數、點贊數、真實性、敏感度、傾向度、轉發數、評論數變化、轉發數變化等指標數據通過新浪微博獲取,在8個時間點獲取的原始數據,為了使數據之間的關聯性更高,各個指標之間的數據的可比性更強,在依據指標的性質的基礎上進行數據的歸一化處理,歸一化后的數據如表3所示。

利用Matlab 2017a軟件進行模型的建立,以時間1-時間7的指標數據作為模型的訓練樣本,選取時間8的指標數據作為檢驗樣本來進行模型檢驗工作的實施。期望輸出如表4、表5所示。

通過調用Matlab 2017a軟件中的神經網絡工具箱,參照上述的傳遞以及訓練參數設置,進行BP神經網絡的創建,對訓練樣本進行167次訓練后,誤差值為9.945e-6,達到訓練目的,如圖4所示。

3、模型可靠性驗證

通過案例“滴滴空姐遇害事件” 進行模型可靠性驗證,數據如表6所示:

利用烽火輿情軟件進行相應的關鍵詞檢索,得出“滴滴出空姐遇害”事件的輿情走勢,分析相應的負面輿情占比,通過當日的負面輿情占全部輿情數的占比得出觀點傾向度。利用百度指數工具高級檢索對“滴滴”限定關鍵詞進行檢索,得出搜索量以及搜索量變化指標原始數據。在每個時間節點以“天”為單位做平均值處理,使數據具備可比性。評論數、點贊數、真實性、敏感度、傾向度、轉發數、評論數變化、轉發數變化等指標數據通過新浪微博獲取,對9個時間點獲取的原始數據進行歸一化處理,歸一化后的數據如表7所示。

通過以上建立的模型將原始數據進行代入檢驗,與期望輸出結果表8進行比較。

與期望輸出結果進行比較后,發現時間6的輸出出現差錯,其余結果一致,準確率達到87.5%。

4、結束語

根據上述構建的BP神經網絡模型,通過對于時間1-時間7的獲取的企業網絡輿情預警指標中的10個二級具體指標數據進行訓練測試,將時間8作為模型的檢驗樣本,在對訓練樣本進行192次訓練后,在未達到最小梯度以及最大的擬合次數的目標要求內,達到最小誤差,使得模型達到最優。通過調用神經網絡工具箱中創建BP神經網絡后的Simulate工具,進行檢驗數據的測試,將時間8的指標數據進行歸一化處理后,導入為P_test,利用訓練達標的模型進行數據預測,輸出相應的Y數據,進行輸出規則轉化后與預計預警結果進行比較,發現結果一致。在建立模型后,再次通過“滴滴空姐遇害”事件的數據進行模型可靠性的驗證,通過將實際輸出與期望輸出的結果進行比較,發現模型預測的準確率為87.5%。通過實踐證明,本文設計的企業網絡危機輿情預警指標體系是合理的,同時也證明了基于BP神經網絡的企業網絡輿情預警模型是有效的。

參考文獻

[1] Gil-Garcia R,Pons-Porrata A.Dynamic Hierarchi-cal Algorithms for Documentclustering[J].Pattern,RecogNition Letters,2010(31):469-477.

[2] 黃遠,沈乾,劉怡君.微博輿論場:突發事件輿情演化分析的新視角[J].系統工程理論與實踐,2015,35(10):2564-2572.

[3] Ma N, Liu Y J. Superedge rank algorithm and its application in identifying opinion leader of online public opinion supernetwork[J]. Expert Systems with Applications, 2014,41(4):1357-1368.

[4] 魏德志,陳福集,鄭小雪.基于混沌理論和改進徑向基函數神經網絡的網絡輿情預測方法[J].物理學報,2015,64(11):52-59.

[5] 毛乾任,王朝斌,金洪穎,李艷梅.模糊推理的網絡輿情觀點聚合CA模型研究[J].小型微型計算機系統,2017,38(07):1479-1484.

[6] 魏德志,陳福集,林麗娜.基于博弈論和SIRS的熱點事件傳播仿真研究[J].系統仿真學報,2018,30(06):2050-2057.

[7] 李喆.基于投影尋蹤模型的網絡輿情評價[J].計算機仿真,2017, 34(04):391-395.

[8] Carolin Kaiser,Sabine Schlick,Freimut Bodendorf. Warning System for Online Market Research-identifying Critical Situations in Online Opinion Formation[J]. Knowledge-based Systems,2011,24:824-836.

[9] Zhao L J, Xie W L, Gao H O, et al. A rumor spreading model with variable forgetting rate[J]. Physica A: Statistical Mechanics & Its Applications(S0378-4371), 2013, 392(23): 6146-6154.

[10] 游丹丹.我國網絡輿情預測研究綜述[J].情報科學,2016,34(12):156-160.

[11] 賀恩鋒,莊林遠,徐文根.網絡輿情潛在影響力指標體系構建及應用[J].情報雜志,2014,33(1):114-119.

[12] 聶峰英,張旸.移動社交網絡輿情預警指標體系構建[J].情報理論與實踐,2015,38(12):64-67.

作者簡介:

侯萍,南京郵電大學管理學院,博士,副教授,研究方向: 網絡輿情,電子商務;

崔孟杰,南京郵電大學管理學院。

猜你喜歡
BP神經網絡網絡輿情指標體系
2022城市商業魅力指標體系
自助圖書館選址評價指標體系研究
應用技術大學教師評價指標體系構建與應用
交通強國建設評價指標體系
“互聯網+”背景下高校平安校園建設研究
復雜背景下的手勢識別方法
BP神經網絡在軟件質量評價中的應用研究 
淺析網絡輿情治理
基于社會穩定視角的網絡輿情預警機制構建的思考
BP神經網絡算法在數值預報產品釋用中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合