基于情感特征和用戶關系的虛假評論者的識別

2016-06-08 06:08邵珠峰姬東鴻

計算機應用與軟件 2016年5期

關鍵詞：評論者分數特征

邵珠峰　姬東鴻

(武漢大學計算機學院　湖北武漢 430072)

基于情感特征和用戶關系的虛假評論者的識別

邵珠峰姬東鴻

(武漢大學計算機學院湖北武漢 430072)

摘要隨著電子商務的迅速發展，人們越來越親睞于網上購物。在網上購物之前，消費者往往會參考該產品相關的評價以決定是否購買。因此虛假評論者的識別具有非常重要的意義?；谔摷僭u論者和真實評論者在情感極性上存在的差異，在特征建模過程中增加了評論文本的情感特征，并結合用戶之間對于特定商品之間的關系，創建了一個多邊圖的模型并提出了一種識別虛假評論者的方法。實驗結果驗證了該算法的有效性。

關鍵詞電子商務虛假評論者情感特征用戶關系

0引言

Web 2.0的到來極大地改變了人與人之間交流的方式，人們可以在各種社交平臺上發表自己的觀點。Web 2.0 網絡應用中，電子商務是發展最快的領域之一。因此，網上購物越來越受到人們的歡迎。消費者在購買商品之前，通常會閱讀與此產品相關的評論，根據評論的好壞再決定是否購買。但是，不是所有的評論都是真實的，一些虛假評論者在利益的誘引下寫下虛假評論以誤導消費者。所以，虛假評論者的識別對于電子商務的發展有很重要的意義。

在網上購物時，評論信息可以直接影響消費者的購買決策。因此，在利益的驅動下，一些商家雇人為自己的商品發布一些不切實際的正面評論以提高信譽，或者為了詆毀競爭對手而發布一些惡意的負面評論。這些虛假評論者嚴重影響了電商平臺上的正常競爭。通過總結之前研究者對虛假評論者的認識，本文將虛假評論者分為以下2類：

1) 類型1(欺騙性評論發布者)：蓄意發布一些正面評論以提高商家名聲，或者故意寫下惡意評論破壞商家聲譽。

2) 類型2(破壞性評論發布者)：發布一些與商品無關的評論、廣告。

因為人們可以很容易地識別破壞性評論，所以破壞性發布者的危害不大。但是欺騙性評論發布者可以刻意地掩飾自己所發表的虛假評論，使其與正常評論看似沒有差別，即使是人工識別方法也難以檢測。而且，到目前為止，欺騙性評論者的檢測方法不是很多，且效果不好。本文主要面向于這種識別難度更大的欺騙性虛假評論者的研究，創新性地采用了評論者之間情感方面的差異來構建特征模型，并結合用戶之間的關系構造出一種多邊圖的模型，最后計算出用戶不可靠分數來識別虛假評論者。

1相關研究

最近幾年，虛假評論者的識別已經成為數據挖掘領域最為活躍的研究之一。相關研究者提出了許多新穎的方法，但是仍然有許多問題存在。由于在很多情況下，正常用戶也無法識別一個評論是否為虛假評論，從而造成標注數據不足以及難以評估檢測效果，這也是虛假評論者識別研究中所面臨的最大問題之一。

自從Jindal等人提出虛假評論的廣泛存在[1]，研究者已經提出了許多識別技術。其中一個主要的是有監督的學習方法。Jindal、Liu通過提取評論文本、評論者和商品的特征進行建模來區分重復評論和非重復評論[1,2]。Li等人[4]利用評論和評論者的特征提出一種雙視圖、聯合訓練的半監督學習方法，取得了很好的效果。

由于缺乏標注數據，無監督的學習方法也被提出識別虛假評論者。Jindal等利用一種基于用戶行為的無監督方法識別那些操縱特定商品評分等級的虛假評論者。Lai等人[5]根據高階概念關聯的挖掘方法提供一種基本術語關聯知識的無監督識別方法。Wang等人[6]通過捕捉評論者、評論和商家之間的關系提出一種基于關系圖的無監督方法。Mukherjee等人[7]發現了評論者之間不同的行為分布，總結出9類用戶行為特征。Liang等人[8]將用戶之間關系和用戶特征結合起來，識別準確率取得了很大的提高。

由于虛假評論者團體可以很輕松地提高或破壞特定商品的聲譽，虛假評論者團體的識別成了近幾年研究的熱點。Liu等人[9]首次提出通過計算虛假評論指標值來檢測虛假評論者，然后他們又構造了一種團體、個人評論者以及他們所評論商品之間的關系模型[10]。

2用戶情感分析及特征定義

2.1用戶情感分析

傳統的評論文本分析大多基于客觀的要素，而忽略了其中所蘊含的主觀要素，比如用戶的情感信息、心理特征等。近年來，對評論文本的情感分析成為信息科學研究的熱點，心理學關于情感的研究成果也對分析網絡信息具有重要的參考價值。由于虛假評論是蓄意發布以提高或破壞產品名聲，虛假評論者在寫評論時的情緒、情感等心理特征和正常評論者必然存在一定差異。因此，本文創新性的在建模過程中加入了用戶的情感特征。

2.2特征定義

根據先前研究者對特征定義和構建的方法[2]，并結合用戶心理語言學知識以及情感極性的分析，本文總結了以下8個特征。每個特征的取值范圍為[0，1]，特征值越大，該用戶為虛假評論者的可能性就越大。表1列出了相關符號的定義。

表1　符號定義

續表1

2.2.1商品屬性詞提及度

商品屬性詞匯量是指評論中描述商品各項屬性的詞的個數。如果評論中商品屬性詞出現頻率越高，評論內容與商品的相關度就越大，該用戶為垃圾評論者的可能性就越小，反之可能性就越大。本文采用評論中屬性詞所占總詞匯的比重作為商品屬性詞提及度。

(1)

因為設定的特征值得分越高，越可能為虛假評論者，因此定義此特征為：

f1=1-RPW(r)

(2)

2.2.2第一人稱代詞詞頻

在評論中使用第一人稱代詞可以把評論者置于顯現的位置從而增強評論的真實性和親切感。所以本文認為虛假評論者應會更多地使用第一人稱代詞，以加強評論的可信性。

(3)

2.2.3詞匯的多樣性

詞匯的多樣性是指句子中使用不同詞語的比例。其中形容詞和副詞可以更準確地表達評論者的情感。本文認為虛假評論者使用詞匯的多樣性少于正常評論者。這里采用形容詞和副詞的占總詞匯的比例代表詞匯的多樣性。

(4)

f3(r)=1-LV(r)

(5)

2.2.4用戶活躍度

虛假評論者一般不是某一網站的長期用戶[10]，然而真實的用戶會經常使用自己賬戶購買東西并發表相關評論。這里通過計算用戶第一次評論與最后一次評論之間時間間隔來判定評論者的活躍度，評論時間間隔越久，評論者為虛假評論者的可疑性就越高。

(6)

其中ζ為時間間隔閾值，本文根據下文所構建的數據集，利用啟發式的方法設定閾值，此處ζ設定為60天。

2.2.5用戶積極性

用戶在網上購買商品時往往依賴于該商品靠前面的評論來抉擇是否購買。因此，虛假評論者會盡量搶占評論靠前的位置以迷惑消費者[4]。本文通過計算評論者對某商品的評論時間與該商品第一條評論之間的時間間隔來判斷評論者的積極性。

(7)

其中β為時間閾值，此處設定β為150天。當用戶評論時間與該商品第一條評論時間間隔小于150天時，我們認為此用戶可能為虛假評論者。間隔時間越短，該用戶的可疑度就越大。

2.2.6用戶極端評分

虛假評論者更容易給出極端的評分(5分或1分)以最大限度地提高或損害商品的名聲。當用戶評分為5分或1分時，我們設定此特征值為1，其他評分時則設置特征值為0。

(8)

2.2.7情感表達強度

情感是人對客觀現實的一種特殊反映形式。因此，用戶對產品的使用體會越深刻，在評論中所表達的情感的顯性程度越大。而虛假評論者往往沒有商品體驗經歷，情感表達強度會偏低。本文通過建立情感詞典，并計算情感詞占總詞匯的比例來代表情感表達強度。

(9)

2.2.8平均評分的偏差

虛假評論者通常是給質量不好的商品以好的評價，而給質量好的商品以差的評價。因此，虛假評論者的平均評分和總的用戶平均評分有一定偏差。本文認為偏差越大，該用戶為虛假評論者的可能性就越大。

(10)

2.3特征組合

我們將前面總結的8個特征組合在一起，并根據實驗和經驗對每個特征賦予一定的權重，來計算用戶的特征初始得分，這一步對識別虛假評論者很關鍵。首先分別計算每個評論者的這8個特征值，然后根據式(11)得出該用戶得分的初始值。得分越高，該用戶為虛假評論者的可能性就越大。

(11)

3用戶關系模型構建

3.1用戶關系分析

虛假評論者是被商家雇傭以促進自己商品銷售或中傷競爭對手的商品。因此，評論者、評論和商品之間必然存在著一定的聯系：

1) 虛假評論者通常對于目標商品會給出一樣或者相似的評分，而與真實評論者的評分卻有一定的偏差。

2) 虛假評論者通常被信譽不好的商家所雇傭以促進自己商品的銷售，而信譽好的商家一般不會。

3) 評論的真實性取決于所評論商品的可靠性以及與該商品其他評論的一致性。

4) 商品的可靠性取決于信譽高的評論者所給出的評分。

3.2模型構建

為了說明評論者、評論和商品之間存在的聯系，本文構建了一個異構圖的模型，如圖1所示。圖中有三種類型節點：評論者、評論和商品。同時，圖中有兩種類型的邊：(i)評論者節點與他所發表的評論節點之間的邊。(ii)評論節點指向其所評論商品節點的邊。

圖1　用戶、評論、商品之間關系

由圖1可知，不同評論者對于商品有著相同或相反的評論。例如用戶1給商品1差評，而用戶2給商品1好評，評分相反；用戶2給商品3好評，用戶3也給商品3好評，評分相同。為了更好地闡述他們之間的關系，本文根據圖1構建了用戶之間關系的多邊圖的模型，如圖2所示。圖中每個節點代表一個評論者，兩個節點之間的邊代表評論者之間的關系。在此模型中定義了兩種類型的邊：

? “支持邊”：如果兩個評論者對于商品評價相同或相似，兩個節點之間添加一條“支持邊”。如評論者2與評論者3對于商品3的評價相同，因此他們之間就添加一條關于商品3的“支持邊”。

? “反對邊”：如果兩個評論者對于商品評價相反或相差很大，兩個節點之間添加一條“反對邊”。如評論者1與評論者2關于商品1的評價不同，在他們之間添加一條關于商品1“反對邊”。

圖2　用戶之間關系

4虛假評論者識別

4.1數據集構建

本文采用httpclient模擬瀏覽器從亞馬遜購物網站上(http://www.amazon.cn/)獲取了關于日用商品的一些評論信息。每個評論信息包含以下屬性：用戶編號、商品編號、商品評分、評論日期以及評論文本。通過對評論信息的一些預處理操作，最后獲得5961條評論、2342位評論者以及412個商品作為實驗數據集。然后根據以上據數據集構建了評論者之間的關系模型，其中有21 675條同意邊以及10 184條反對邊。

4.2用戶不可靠分數

本文基于TrustRank[11]方法，并結合上文所構造的用戶關系模型和特征工程計算評論者不可靠分數。我們根據以下準則計算用戶的不可靠分數：

1) 評論者的不可靠分數不是根據所評論的數量多少，而是根據所評論的真實性。虛假評論越多，評論者不可靠分數越高，該評論者為虛假評論者的可疑度就越大。

2) 評論者的分數應當增加/減少如果和其他評論者之間有同意邊/反對邊，因為虛假評論者通常都協同合作，對特定商品給一樣或相似的評價。

3) 不可靠分數由評論者特征初始值和用戶之間關系共同決定。

因此，我們定義用戶的不可靠分數的計算方法為：

(12)

其中score(r)由式(11)所得，表示用戶的特征初始值，本文α設定為0.2。此公式采用了以e為底的指數函數作為削減函數。由公式可知，當有其他評論者支持該用戶評論時，不可靠分數會增加；反之，當有其他評論者反對此評論時，該用戶的不可靠分數會相應減少。特別的，如果當前用戶沒有相關聯的支持邊，公式的第一項值為0，不可靠分數則由用戶特征初始值決定。

4.3虛假評論者識別

本文采用的識別虛假評論者的方法既考慮了評論者的情感特征又考慮了評論者之間的關系。具體步驟如下：

輸入：用戶、評論、商品數據集合

輸出：虛假評論者候選集合

步驟1構建評論者之間的關系圖。

步驟2根據式(11)計算所有用戶的特征初始值。

步驟3歸納用戶相對應的支持邊與反對邊的集合。

步驟4根據式(12)計算用戶最終的不可靠分數。

步驟5將用戶不可靠分數按照降序排列，排名越靠前的用戶放入虛假評論者的候選集合。

5實驗結果評估與分析

5.1評估策略

本文采用基于信息檢索的評估策略，首先選取不可靠分數排名靠前的用戶作為虛假評論者的候選。然后我們邀請三位標記人對候選者進行人工標記，以判斷候選者是否為虛假評論者。相似的評估方法在之前的研究中已經被廣泛運用了[2,4]，因此這是一個完善的評估方法。具體評估流程如下：

(1) 選擇候選集合

我們選擇得分最高的100個最有可能為虛假評論者的用戶，把他們放入候選集合之中。然后將他們隨機排序，這樣他們的順序和不可靠分數就沒有關聯。

(2) 對候選者進行人工識別

由于在評論信息中沒有虛假評論者的標簽，因此采用人工評估是必要的。我們的標記人為計算機專業學生并且擁有豐富的網上購物經驗。人工識別虛假評論者是一項非常復雜的工作，不僅要研究評論者所發表的評論，而且要查看所評價的商品和商家的其他評論以及他們的品質和信譽。在識別過程中還可能受到主觀和直覺因素的影響，因此我們制定了一些虛假評論者的識別準則：

?經常與其他大多數評論者評論相反。

?經常發布重復或者相似的評論。

?經常給聲譽不好的商家以正面評論。

?經常是某些特定商品的前排評論者。

?經?？鋸埖刭潛P某商品完全沒有任何缺點。

5.2實驗結果

在選取的候選集合中，3位標記人根據自己的經驗以及上文制定的準則獨立的進行標記。一個用戶如果同時被2位及以上的標記人標記為虛假評論者，則該用戶被認為是虛假評論者。最終，61個用戶被標記為虛假評論者(49個用戶得到3票，12個用戶得到2票)，準確率為61%，對于49%的準確率有很大的提高[1]。表2給出了標記結果以及標記人之間的一致度。

表2　人工標記結果

5.3結果分析

根據表2，我們可以看出3位標記人分別標記了57、59、68個虛假評論者。標記人1與標記人2有52個相同結果與標記人3有56個相同結果；標記人2與標記人3有58個相同結果。為了研究標記人之間的一致性，我們采用Fleiss’ kappa[12]方法,得到本次的標記信度為62.4%，達到了實質上一致性的區間[0.61,0.80]，證明了本次人工標記的有效性。

6結語

本文基于用戶在情感極性方面的差異，總結了用戶情感特征。并結合用戶之間復雜的關系創新性的構造了評論者之間多邊圖模型，提出一種無監督虛假評論者的識別方法。最后通過實驗證明了該方法的有效性。

目前此方法仍有一些不足，如對用戶情感特征分析不是很全面，人工標記存在一定的偏差，影響實驗結果的評估。未來將更透徹分析不同用戶之間情感差別，并將用戶更多主觀特征加入特征集構建中。為了更好地評估方法效果，改進評估策略也是本文下一步的工作。

參考文獻

[1] Jindal N,Liu B.Review spam detection[C]//Proceedings of the 16th international conference on World Wide Web,Banff,AB,Canada,May 08-12,2007.New York,NY,USA:ACM,2007:1189-1190.

[2] Jindal N,Liu B.Opinion spam and analysis[C]//Proceedings of the international conference on Web search and web data mining,California,USA,Feb 11-12,2008.New York,NY,USA:ACM,2008:219-230.

[3] Li F,Huang M,Yang Y,et al.Learning to identify review spam[C]//Proceedings of the 22nd international joint conference on Artificial Intelligence,Barcelona,Spain,Jul 16-22,2011.Palo Alto,CA,USA:AAAI,2011:2488-2493.

[4] Lim E,Nguyen V,Jindal N,et al.Detecting product review spammers using rating behaviors[C]//Proceedings of the 19th ACM international conference on Information and knowledge management,Toronto,ON,Canada,October 26-30,2010.New York,NY,USA:ACM,2010:939-948.

[5] Lai C,Xu K,Lau R,et al.High-order concept associations mining and inferential language modeling for online review spam detection[C]//Data Mining Workshops (ICDMW),2010 IEEE International Conference,Sydney,NSW,Australia,Dec 13-13,2010.Washington,DC,USA:IEEE,2010:1120-1127.

[6] Wang G,Xie S H,Liu B,et al.Review Graph Based Online Store Review Spammer Detection[C]//Proceedings of the 11th International Conference on Data Mining,Mesa,Arizona,USA,April 28-30,2011.Washington,DC,USA:IEEE,2011:1242-1247.

[7] Mukherjee A,Kumar A,Liu B,et al.Spotting opinion spammers using behavioral footprints[C]//Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining,Chicago,IL,USA,August 11-14,2013.New York,NY,USA:ACM,2013:632-640.

[8] Liang D X,Liu X Y,Shen H.Detecting Spam Reviewers by Combing Reviewer Feature and Relationship[C]//Informative and Cybernetics for Computational Social Systems (ICCSS),2014 International Conference,Qingdao,Shandong,China,Oct 9-10 2014.Washington,DC,USA:IEEE,2014:102-107.

[9] Mukherjee A,Liu B,Wang J,et al.Detecting group review spam[C]//Proceedings of the 20th international conference companion on World wide web,Hyderabad,India,March 28-April 01,2011.New York,NY,USA:ACM,2011:93-94.

[10] Mukherjee A,Liu B,Glance N.Spotting fake reviewer groups in consumer reviews[C]//Proceedings of the 21st international conference on World Wide Web,Lyon,France April 16-20,2012.New York,NY,USA:ACM,2012:191-200.

[11] Gy?ngyi Z,GarciaMolina H,Pedersen J.Combating web spam with TrustRank[C] //Proceedings of the Thirtieth international conference on Very large data bases,Toronto,Canada,August 31-September 3 2004.San Fransisco,CA 94104,USA:Morgan Kaufmann,2004:576-587.

[12] Fleiss J L,Cohen J.The equivalence of weighted kappa and the intraclass correlation coefficient as measures of reliability[J].Educational and Psychological Measurement,1973,33(3):613-619.

SPOTTING FAKE REVIEWERS BASED ON SENTIMENT FEATURES AND USERS’ RELATIONSHIP

Shao ZhufengJi Donghong

(SchoolofComputer,WuhanUniversity,Wuhan430072,Hubei,China)

AbstractWith the rapid development of e-commerce, online shopping becomes more and more appealing. Before shopping online, consumers usually tend to refer to the relevant comments to decide whether to buy the products or not. Therefore, to identify fake reviewers is of great significance. Based on the difference of emotional polarities between fake reviewers and real reviewers, we added the sentiment features of comment text to feature modelling process. Combined with the inter-relationship between users and specific commodities, we constructed a multi-edge graph model and came up with a method of spotting fake reviewers. Experimental results verified the effectiveness of the proposed algorithm.

KeywordsE-commerceFake reviewersSentiment featuresUsers relationship

收稿日期：2015-01-12。邵珠峰，碩士，主研領域：自然語言處理。姬東鴻，教授。

中圖分類號TP3

文獻標識碼A

DOI:10.3969/j.issn.1000-386x.2016.05.039