?

時序感知的異質圖神經謠言檢測

2024-02-28 08:18陳林威宋玉蓉
小型微型計算機系統 2024年1期
關鍵詞:集上時序謠言

陳林威,宋玉蓉,宋 波

1(南京郵電大學 自動化學院、人工智能學院,南京 210023)

2(南京郵電大學 現代郵政學院,南京 210003)

0 引 言

隨著互聯網技術的快速發展和移動設備的廣泛使用,微博、Facebook等一批在線社交媒體,逐漸成為大眾信息消費的主要載體.社交媒體平臺的開放性和便捷性為人們提供了自由表達的空間,但這也間接為虛假信息的傳播提供了理想場所.在這里,謠言被定義為一種未經證實或故意發布的虛假消息[1].謠言的傳播會引起公眾的恐慌,對社會穩定造成巨大威脅.尤其在疫情期間,大量新的謠言不斷涌現,例如“糧食短缺,趕緊屯糧”、“新冠抗體可使人免受‘二次感染’”等謠言信息廣為散布,這無疑會誤導群眾,一定程度上影響社會秩序.因此,如何準確、快速地識別謠言是亟待解決的問題.

早期的謠言檢測方法大多利用特征工程從文本內容[2]、用戶配置信息[3]和傳播結構[4-6]等方面挖掘有效特征.這類方法依賴繁瑣的特征工程,耗時耗力,并且人工設計的特征無法表達更深層的特征,大大限制了模型的檢測性能.隨著深度學習算法的發展,神經網絡在自然語言處理領域中取得了十分顯著的效果.受此啟發,研究學者們開始利用深度學習模型對文本內容、用戶、傳播結構等進行建模,自動學習這些信息的高階特征表示[7-11].最近,基于圖模型的方法[12-15]將事件的傳播結構抽象為圖結構,并利用圖神經網絡學習事件的特征表示,有效提高了謠言檢測的準確率.但這些方法只考慮到事件內部帖子的局部傳播結構,忽略了事件在社交媒體上的全局結構關系.Yuan等人[16]認為每個事件都不是獨立的個體,事件與事件之間可能因為相同用戶的參與而產生聯系,只考慮每個事件本身的特征而忽略事件之間的聯系,勢必會限制模型的檢測性能.因此,他們從異構網絡的視角研究事件與事件之間的關聯,提出了一個聯合全局與局部關系的異質圖來捕獲消息傳播的局部語義關系和全局結構信息.盡管該模型取得了良好的效果,但他們忽略了事件內部消息傳播過程中的時序信息.事實上,在現實的消息傳播過程中,每個時間階段發布的轉發(或評論)貼可能有不同的含義.例如,在源貼剛發布不久,由于其沒有被證實,所以表示懷疑的轉發(或評論)貼可能更多;在消息傳播的后期階段,由于官方的辟謠以及事件真相的逐漸顯露,人們的態度隨之發生改變.對于謠言事件,人們更多的轉變為反對的態度,而對于非謠言事件,則越來越多的人開始肯定該言論.并且,用戶發布帖子除了受源貼的影響,還可能受到其他已發帖子的影響,進而干擾其判斷.因此,本文認為有必要挖掘消息傳播過程中的時序信息,以捕獲謠言與非謠言在不同時間階段產生的響應貼的差異性以及響應貼之間潛在的時序依賴關系.

基于這些觀察,本文考慮同時建模事件與事件之間的全局結構關系以及事件內部消息傳播的時序關系,提出一種時序感知的異質圖神經謠言檢測模型.本文首先基于謠言檢測數據集構建一張事件-用戶異質圖模擬消息在真實社交媒體上的傳播;然后,通過位置編碼建模事件內部轉發(或評論)帖之間的局部時序關系,結合多頭注意力機制關注重要的響應貼,并將具有時序信息的響應貼與源貼融合,得到事件節點的局部時序表征;接著利用元素級注意力機制捕捉事件與事件之間的全局結構關系,學習事件節點的全局結構表征;最后,將兩種特征融合,得到最終的事件節點表示用于謠言檢測.本文的主要貢獻如下:

1)本文同時考慮事件與事件之間的全局結構關系以及事件內部消息傳播的時序關系,以異質圖為載體共同顯式建模兩種關系;

2)本文基于轉發(或評論)貼與源貼的交互時間構建響應序列,并通過時序感知的自注意力機制挖掘事件內部的時序信息,然后融合源貼和響應貼的表示,得到每個事件節點的局部時序表征;

3)本文基于用戶與事件的交互關系,利用元素級注意力機制學習每個事件節點的全局結構表征,以捕獲復雜多樣的傳播結構特征;

4)本文在3個公開的真實數據集上驗證方法的有效性.實驗結果表明,本文模型優于現有最先進的謠言檢測模型,并且具有更高的早期檢測性能.

1 相關工作

謠言檢測的研究最早是基于帖子的內容信息展開,致力于挖掘文本特征,捕獲謠言與非謠言在內容上的差異.但考慮到謠言的發布者常??桃庑Х抡鎸嵪⒌恼Z言風格,導致單純基于內容的方法無法捕捉有效的特征進行謠言識別.隨后的一些研究工作開始從消息的傳播結構特征著手,捕獲謠言事件與非謠言事件在傳播模式上的差異,取得了良好的效果.本文將現有的謠言檢測方法大致分為:1)基于內容的謠言檢測方法;2)基于傳播結構的謠言檢測方法.

1.1 基于內容的謠言檢測方法

早期基于內容的謠言檢測的研究工作主要集中在人工設計特征上,再結合如邏輯回歸、決策樹等分類算法對消息的真實性進行判別.Wu等人[17]利用狄利克雷分布(Latent Dirichlet Allocation,LDA)生成文本的主題,并基于隨機游走圖核的SVM算法在微博數據上進行謠言檢測;Sun等人[18]提取了描述事件的動詞數、包含事件動詞的消息比例、是否包含強消極詞以及包含強消極詞的消息比例4種新的文本特征,并利用決策樹分類算法用于謠言檢測.這類方法均基于繁重的手工特征提取,只能挖掘謠言的淺層特征,無法進一步提升謠言檢測的精度.伴隨著深度學習的快速發展,各類模型結構層出不窮,神經網絡不斷加深使得網絡能夠對特征進行充分挖掘,降低了對人工設計特征的要求,謠言檢測方向也逐漸從特征挖掘遷移到模型結構設計上.Yu等人[19]、Liu等人[20]將卷積神經網絡(Convolutional Neural Network,CNN)應用于謠言檢測問題,通過CNN自動生成高階抽象特征,對事件的表示進行學習,提升了謠言檢測精度;Zhang等人[21]利用注意力模型分別學習文本內容和情感符號的特征表示,并將二者融合的結果作為微博文本的語義表示,一定程度上豐富了微博文本的情感語義信息;Pan等人[22]結合文本卷積神經網絡(Text CNN)與引入注意力機制,通過注意力機制對Text CNN學習到的文本表示進行加權輸出,提取更為顯著的微博文本特征.雖然這類方法取得了一定效果,但目前的謠言發布者常常會通過刻意模仿真實消息的寫作手法、表達風格等途徑達到逃避檢測的目的.這就導致僅依賴于文本內容的方法無法捕捉有效特征進行謠言的識別.

1.2 基于傳播結構的謠言檢測方法

基于傳播結構的方法重點關注的是謠言事件與非謠言事件傳播特征之間的差異.Ma等人[7]考慮消息在傳播過程的時序特征,首次提出利用循環神經網絡(Recurrent Neural Network,RNN)捕獲每個源貼及其轉發(或評論)貼的語義變化,并根據語義變化進行預測,這也是第一次引入深度學習模型進行謠言檢測的研究;而后,Ma等人[8]又探究了一種基于樹的遞歸神經網絡(RvNN),分別建模自頂向下和自底向上的消息傳播樹,用以捕捉源貼的語義信息和傳播結構信息;Liao等[9]提取文本的潛在特征和局部的用戶特征,并利用帶有注意力機制的雙向GRU網絡學習微博事件的表示;Chen等人[10]將RNN與注意力機制結合,捕獲消息傳播過程中的語義變化,一定程度上提高了謠言檢測性能.這些方法大多只關注到事件內部的時間變化,將消息的傳播結構構建為時間序列,忽略了帖子之間顯式的轉發(評論)關系.基于此,Bian等人[13]根據帖子之間的轉發(或評論)關系將傳播結構構建成圖結構,通過雙向圖卷積網絡(Bi-Directional Graph Convolution Network,Bi-GCN)學習消息轉發的結構特征;Hu等[14]基于消息傳播樹中蘊含的層間依賴關系與層內依賴關系,利用多關系圖卷積網絡共同建模兩種關系,以捕獲更為豐富的傳播結構特征.這些方法雖然取得了不錯的效果,但終究只關注到消息的局部傳播,即認為每個事件都是獨立的,沒有考慮到事件與事件之間的關聯,忽略了全局結構信息.而Yuan等人[16]則考慮到事件的全局結構特征,探究了一個聯合全局與局部關系的異構網絡來捕獲消息傳播的局部語義關系和全局結構信息,取得了良好的效果.但其忽略了事件內部重要的時序關系.

本文以異質圖為載體,同時融合局部時序關系和全局結構關系,提出了一種時序感知的異質圖神經謠言檢測方法,共同顯式建模局部時序信息和全局結構信息,為事件節點學習更全面的特征表示,用于提升謠言的識別能力.

2 模型方法

2.1 問題描述

設C={c1,c2,…,c|C|}為謠言事件集,其中,ci為第i個事件樣本,|C|為事件集的大小,即事件總數.對于每個ci事件,都包括1條源貼mi和n條相關的轉發(評論)貼,記為ci={mi,ri,1,ri,2,…,ri,n}.此外,本文定義U={u1,u2,…,u|U|}表示社交媒體中參與事件的用戶集合,其中|U|為數據集中用戶的總數量.

謠言檢測任務可以描述為機器學習中的分類任務,將每個事件ci標注為對應的真實標簽yi∈y,y為類別標簽集.本文的目標是學習一個函數f:f(ci)→yi來預測當前事件是否為謠言.

2.2 模型介紹

本文提出的謠言檢測模型主要由異質圖構建、局部時序信息編碼、全局結構信息編碼和謠言分類4個模塊組成.總體框架如圖1所示.首先,在異質圖構建模塊(模塊1)中,本文基于謠言檢測數據集構建事件-用戶異質圖,并利用嵌入技術對圖中各節點進行初始化表示;其次,在局部時序信息編碼模塊(模塊2)中,本文基于事件內部轉發(或評論)貼之間的時序關系,利用時序感知的自注意力機制學習具有時序信息的響應貼表示,再融合源貼本身的內容信息,得到每個事件節點的局部時序表征;在全局結構信息編碼模塊(模塊3)中,本文基于用戶與事件之間的交互關系,利用元素級注意力機制學習每個事件節點的全局結構表征;最后,在謠言分類模塊(模塊4)中,本文融合事件的局部時序表征與全局結構表征,以預測當前事件為謠言的概率.接下來,本文將詳細介紹每個模塊.為簡化說明,本文在后續的描述中,將“轉發(或評論)貼”均替代為“響應貼”.

圖1 SHGN模型總體框架Fig.1 Overall architecture of the SHGN model

1)異質圖構建

本文將事件以及相關用戶抽象為網絡中兩種不同類型的節點,并根據用戶對事件的參與情況(用戶對事件中的帖子存在轉發或評論的行為),建立用戶節點與事件節點的連邊關系.此外,在每個事件內部又包含一條源貼和一系列響應貼.根據響應貼在源貼發布后的時間延遲,將響應貼構建為時間序列,這樣每條源貼就對應一個響應序列.如圖1中模塊1所示,最終構建為具有時序信息的事件-用戶異質圖.

接下來,對異質圖中的各節點進行初始化.首先對于事件節點,其內部本質是源貼和響應貼的文本內容.而社交媒體中大多是短文本數據,由幾個到幾十個單詞組成,長度短、內容少;并且在文本語義方面,謠言發布者常??桃饽7抡鎸嵪⒌膶懽黠L格.這些因素都會導致模型無法挖掘有效的語義信息進行謠言檢測.目前主流的從詞向量序列中學習文本語義表示的模型包括卷積神經網絡、循環神經網絡等.相比之下,RNN等序列模型更適用于長文本的內容特征提取,對社交帖子這類短文本數據而言,數據稀疏問題不可避免地影響模型性能;而CNN具有關注局部語義信息的特點,在處理短文本的效果上比RNN好.

因此,本文采用詞向量的方式初始化,并利用CNN對其進行編碼.具體而言,固定每個帖子的單詞數量為L個,當單詞數量小于L時,用0填充;當單詞數量超過L時,則截斷.接著通過Word2Vec算法[23]在特定領域的語料庫上進行訓練,得到每個單詞的向量表示,對于預訓練詞向量庫中沒有出現的單詞,本文使用均勻分布進行初始化,并且保持詞向量在訓練過程中可微調.記每個單詞的初始向量為xj∈d,j表示帖子中的第j個單詞,則每條單詞數量為L的帖子可表示為:

(1)

其中,“;”為拼接操作,x1:L∈L×d.

進一步地,本文利用CNN對句子序列進行編碼.給定一個由單詞向量組成的句子序列x1:L,通過CNN的卷積層對每個可能的窗口做一維卷積操作:

ei=σ(W*xi:i+h-1)

(2)

得到特征圖e=[e1,e2,…,eL-h+1]∈L-h+1.其中,W∈h×d是大小為h的卷積核,為sigmoid激活函數.接著利用最大池化操作選擇每個特征圖的最大值,再通過拼接操作得到每個帖子的初始向量表示.這樣,對于第i個事件而言,其源貼表示為mi∈d,每條響應貼表示為ri,j∈d,將該事件中響應貼組成的矩陣記為Ri=[ri,1,ri,2,…,ri,n]∈n×d.

另一方面,對于用戶節點的初始化,本文對用戶的屬性信息(包括性別、年齡、粉絲數、關注數等)進行編碼,得到用戶節點的初始化向量表示.對于獲取不到的用戶信息,本文通過正態分布進行初始化.

2)局部時序信息編碼

受Transformer模型[24]的啟發,本文采用時序感知的自注意力機制挖掘事件內部的局部時序信息,捕獲謠言事件與非謠言事件在不同時間階段產生的響應貼的差異以及響應貼之間潛在的時序依賴關系.

首先,為了編碼每條響應貼的時延信息,本文使用Transformer模型中的位置編碼(Positional Encoding,PE)公式為每條響應貼生成一個位置嵌入P∈|P|×d:

(3)

(4)

其中,pos表示響應貼在序列中的位置,d表示位置嵌入的維度,2k表示偶數的維度,2k+1表示奇數維度(即2k≤d,2k+1≤d).

接著將每條響應貼的嵌入與其對應的位置嵌入相關聯,以捕獲響應貼之間的時序信息:

(5)

其次,利用多頭注意力機制對重要的響應貼進行重點關注.自注意力機制能夠自動學習自己與上下文之間的相關性,捕獲重要的上下文信息,而多頭則可以考慮多方面的影響因素,獲得更為全面的節點表示:

(6)

(7)

αii=softmax(LeakyReLU(aT[mi;mi]))

(8)

(9)

(10)

其中,αii、αij分別表示節點i與自身以及節點i與節點j之間的注意力分數,N(mi)為節點i的鄰居節點,即當前源貼對應的所有響應貼,W∈d(l+1)×dl為該層節點特征變換的權重參數.

3)全局結構信息編碼

對于參與到事件ci中的特定用戶uj∈d,計算用戶uj在不同方面的注意力向量γj:

γj=tanh(Wcuj+b)

(11)

其中,Wc∈d×d為特征變換矩陣,是不同方面的注意力向量.越大,表示用戶嵌入uj的第k個方面對消息傳播的影響越大.

接著,將注意力向量γj與參與到事件ci中的所有用戶以元素乘積方式進行聚合,以捕獲事件與事件之間的全局結構關系:

(12)

4)謠言分類

經過上面的過程,可以得到每個事件節點的局部時序表示和全局結構表示,二者對謠言檢測都至關重要.本文將兩種特征進行拼接作為事件節點的最終表示,并經過全連接層和softmax函數計算該事件的預測結果,即該事件為各個標簽的概率值:

(13)

其中,Fc(·)表示全連接層,輸出的維度與標簽的類別一致.

最后,為了訓練模型的參數,本文采用交叉熵損失作為模型的目標優化函數:

(14)

其中,θ為模型的所有參數,r為樣本標簽的類別數,yi∈{0,1,2,3}(Twitter),yi∈{0,1}(Weibo)為真實的標簽值.

3 實驗結果與分析

3.1 實驗數據及設置

1)實驗數據

本文在Twitter15[6]、Twitter16[6]和Weibo[7]3個公開的真實數據集上對提出模型的有效性進行評估.所有標簽都是由辟謠網站中文章的真實標簽獲取.其中,Twitter15和Twitter16數據集有4種標簽類別,分別是非謠言(non-rumor,NR)、假謠言(false rumor,FR)、真謠言(true rumor,TR)、未經證實的謠言(unverified rumor,UR);Weibo數據集包含2種標簽,分別是真謠言(true rumor,TR)和假謠言(false rumor,FR).詳細的統計情況如表1所示.

表1 數據集統計Table 1 Dataset statistics

2)評價指標及參數設置

為了公平驗證本文模型的有效性,本文采用與之前研究一致的評估指標[16],分別是準確率、F1分數、召回率和精準率.模型中的參數由Adam算法更新,其參數β1、β2分別設置為0.9和0.999,學習率初始化為1e-3,在訓練過程中逐漸降低.模型中的詞嵌入和用戶初始化嵌入都是300維,dropout比率設置為0.2.CNN卷積核大小設置為(3,4,5),每組100個.多頭注意力機制的K設置為8.實驗的batchsize設置為64,epoch設置為30.所有代碼均由Pytorch實現,所有的實驗結果都是在5次實驗的結果上取平均.

3.2 對比方法

本文選取了一些最先進的基線模型在相同的數據集上進行實驗和比較,所選取的基線模型如下:

1)DTC模型[3].該模型基于特征工程,人工設計文本內容特征和用戶特征,并利用決策樹分類器進行謠言檢測任務.

2)SVM-RBF模型[2].該模型基于帖子的總體統計數據,手工構造特征,并利用基于RBF內核的支持向量機進行謠言檢測.

3)CAMI模型[19].該模型將段落向量作為CNN的輸入,自動學習文本的深層特征進行謠言檢測.

4)GRU模型[7].該模型基于消息的傳播序列,并利用GRU學習事件的傳播結構特征,進而完成謠言檢測任務.

5)RvNN模型[8].該模型利用樹結構的遞歸神經網絡,對樹狀的消息傳播模式建模,從而完成謠言檢測任務.

6)Bi-GCN模型[13].該模型基于消息的傳播方向和擴散方向建立傳播樹,并利用雙向圖卷積神經網絡學習節點表示,進行謠言檢測.

7)GLAN模型[16].該模型基于異質圖同時捕獲事件的局部語義信息和全局結構信息,進而完成謠言檢測任務.

3.3 結果與分析

本文通過實驗得到本文模型及所有對比方法在3個數據集上的性能,如表2~表4所示.其中,Acc表示分類的總體準確率(accuracy,Acc).實驗結果證明,本文提出的SHGN模型要優于其他基線模型,且檢測的準確率和精度都得到顯著提高.下面對實驗結果進行具體分析:

表2 Twitter15數據集上的實驗結果Table 2 Experimental results on Twitter15 dataset

表3 Twitter16數據集上的實驗結果Table 3 Experimental results on Twitter16 dataset

表4 Weibo數據集上的實驗結果Table 4 Experimental results on Weibo dataset

1)相比基于傳播結構的謠言檢測方法(GRU、RvNN、Bi-GCN、GLAN以及SHGN),基于內容的方法(DTC、SVM-RBF、CAMI)性能整體較差.這是因為社交帖子具有內容少、噪聲多的特點,導致模型無法充分提取有效的語義特征進行謠言識別,而基于傳播結構的模型主要側重于挖掘謠言事件與非謠言事件傳播特征之間的差異,通過捕捉復雜多樣的傳播特征提高檢測性能.可以觀察到,相比于基于內容的模型中表現最佳的CAMI模型,SHGN結果更好,在Twitter15數據集上其準確率要比CAMI模型高21.1%,在Twitter16數據集上的準確率要比CAMI模型高17.9%,在Weibo數據集上的準確率要比CAMI模型高2.5%.實驗結果證明了本文模型的優勢以及傳播結構特征對于謠言檢測任務的重要性和必要性.

2)在所有基于傳播結構的基線模型中,GLAN模型表現最佳.這是因為GLAN考慮了消息在真實社交媒體中復雜多樣的傳播過程,以異質圖為載體同時建模局部語義信息和全局結構信息進行謠言檢測,而GRU模型將消息傳播建模為傳播序列以及Bi-GCN模型將消息傳播建模為傳播圖,都只考慮局部的結構特征,忽略了事件與事件之間的關聯,無法捕獲全局結構信息.這也表明,將謠言檢測任務建模為異質圖以捕獲全局結構信息的方法要優于通過建模為傳播序列或傳播樹捕獲局部結構信息的方法.而相比于GLAN模型,本文提出的SHGN模型結果更好,在Twitter15數據集上其準確率要比GLAN模型高2.2%,在Twitter16數據集上的準確率要比GLAN模型高2.1%,在Weibo數據集上的準確率要比GLAN模型高1.2%.這是因為SHGN模型通過引入位置編碼彌補了GLAN模型忽略的局部時序信息.由此證明局部的時序關系在謠言檢測中至關重要,捕獲局部結構中的時序信息有助于提高謠言檢測的性能.

3.4 消融實驗

為了驗證局部時序信息和全局結構信息對提高謠言檢測性能均有貢獻,本文進行了一系列消融實驗,主要包括3個部分:

1)w/o LSE(Local Sequence Embedding):移除局部時序信息編碼模塊,僅考慮全局結構信息.

2)w/o GSE(Global Structure Embedding):移除全局結構信息編碼模塊,僅考慮局部時序信息.

3)w/o PE:移除位置編碼,即沒有引入局部結構中的時序邊,僅使用多頭注意力機制捕獲局部語義信息,主要用于驗證局部傳播結構中時序邊對謠言檢測的有效性.

消融實驗的結果如圖2所示,其中ALL為原始的SHGN模型.根據表中的實驗結果,可以得到以下結論:

圖2 SHGN在3個數據集上的消融實驗結果Fig 2 Ablation experiment result of the SHGN on three datasets

首先,本文研究了局部時序編碼模塊對謠言檢測的影響.可以觀察到,移除LSE模塊顯著影響SHGN模型在3個數據集上的性能,準確率在Twitter15和Twitter16數據集上分別下降了7.6%和6.9%,在Weibo數據集上下降了8.5%.實驗結果證明了建模局部時序關系的有效性.這也說明,隨著時間推移,人們態度的轉變對于不同事件確實存在差異,并且較早發表的言論對某些用戶也確實存在一定影響.因此,局部時序編碼模塊能夠捕獲到謠言事件與非謠言事件在不同時間階段產生的響應貼的差異性以及響應貼之間潛在的時序依賴關系,對謠言檢測至關重要.

其次,本文研究了全局結構編碼模塊對謠言檢測的影響.社交媒體事件不是獨立存在的,事件與事件之間因相同的用戶建立起全局關聯.直觀地說,建模全局結構關系能夠使謠言事件與非謠言事件具有高凝聚性和低耦合性,從而提高謠言檢測性能.可以觀察到,GSE模塊的移除導致模型在3個數據集上的性能下降,準確率在Twitter15和Twitter16數據集上分別下降了6.7%和4.6%,在Weibo數據集上下降了7.7%.實驗結果同樣可以證明建模全局結構關系的有效性,事件的全局結構關系對于謠言檢測亦是不可或缺.

此外,本文還通過評估位置編碼的有效性,證明了事件內部的消息不僅僅只有顯式的關聯關系,還具有潛在的時序依賴關系.僅使用多頭注意力機制雖然可以捕獲任意響應貼之間的影響,但是其本身不能表達位置信息,即無法捕獲響應貼在傳播過程中蘊含的時序依賴關系,而加入位置編碼可以顯式地編碼各響應貼在消息傳播序列中的相對位置,從而捕獲到消息傳播過程中的上下文信息.可以觀察到,SHGN在沒有加入位置編碼的模型中,準確率在Twitter15和Twitter16數據集上分別下降了3.4%和2.4%,在Weibo數據集上下降了2.5%.因此,事件內部的消息確實具有潛在的時序關系,引入位置編碼捕獲事件局部的時序信息能夠有效提高該場景下的檢測能力.

3.5 早期檢測研究

早期檢測是指在消息傳播的早期階段進行謠言識別,以便及時采取措施,減少謠言傳播,這是評價謠言檢測方法質量的另一個重要指標.為了驗證本模型具有優秀的早期檢測性能,本文在Twitter15和Twitter16這2個數據集上進行了早期謠言檢測實驗.具體而言,本文分別選取了源貼發布后的4h、8h、12h、24h作為時間節點,代表不同的時間階段,截取這些時間段內的響應帖以及相關用戶作為早期數據.同樣,本文選取了DTC、GRU、RvNN、Bi-GCN、GLAN 5個基線模型進行對比,來評估本文模型的性能.實驗結果如圖3和圖4所示.可以看出,本文的SHGN模型使用不到4個小時的數據,在2個數據集上的準確率就達到90%以上,超過了其他基線模型,短時間內的高準確率表明本文模型具有優越的早期檢測性能.隨著時間的推移,本文的SHGN模型和GLAN模型在4h到12h之間準確率有輕微波動,這是因為隨著消息的傳播,會有更多復雜的信息加入,不可避免地給模型帶來噪聲信息.而對于早期檢測任務,一個優秀的模型應該盡可能早的達到高指標的檢測效果.因此,可以判定本文提出的模型在早期檢測任務上比GLAN模型更優,也進一步表明本文模型對數據具有更強的魯棒性和更穩定的性能.綜上所述,在2個真實世界的Twitter數據集上的實驗結果表明,本文提出的方法在早期謠言檢測方面比最先進的基線模型具有更好的性能.

圖3 Twitter15數據集上早期檢測實驗結果Fig.3 Experimental results of early detection on Twitter15 dataset

圖4 Twitter16數據集上早期檢測實驗結果Fig.4 Experimental results of early detection on Twitter16 dataset

4 總結與展望

本文提出了一個時序感知的異質圖神經謠言檢測模型.該模型通過位置編碼建模事件內部響應貼之間的時序關系,并利用多頭注意力機制關注重要的響應貼,然后利用圖注意力機制的聚合函數融合源貼和響應貼,得到事件的局部時序表征;接著,基于用戶與事件之間的交互關系,利用元素級注意力機制學習事件的全局結構表征;最后,將兩種特征表示拼接用于謠言分類.實驗結果表明,本文提出的SHGN模型優于最先進的謠言檢測方法,并且在早期檢測任務上,也具有更高的檢測性能.

在未來的研究中,本文將主要從3個方面繼續深入工作:1)在局部結構的構建方面,尋找更加合適的建模方法(如根據轉發、評論關系構建具有時序邊的消息傳播樹),用以捕獲更為豐富的消息傳播結構;2)在算法層面,尋找合適的異質圖嵌入算法,充分利用異質圖帶來的豐富異質信息以及不同類型節點之間的交互關系;3)由于社交媒體資源的多樣性,本文還將考慮利用音頻、圖像等多模態信息以提高謠言檢測性能.

猜你喜歡
集上時序謠言
中國使館駁斥荒謬謠言
基于Sentinel-2時序NDVI的麥冬識別研究
Cookie-Cutter集上的Gibbs測度
鏈完備偏序集上廣義向量均衡問題解映射的保序性
當謠言不攻自破之時
基于FPGA 的時序信號光纖傳輸系統
復扇形指標集上的分布混沌
一種毫米波放大器時序直流電源的設計
謠言
謠言大揭秘
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合