基于情感詞典的情感分析在抑郁中的研究進展*(綜述)

2024-02-14 07:26王瑤菡曾利紅秦春香

中國健康心理學雜志 2024年1期

王瑤菡曾利紅王穎唐琴秦春香△

①中南大學湘雅護理學院(湖南) 410013 E-mail:yaohanwang@csu.edu.cn ②中南大學湘雅三醫院 △通信作者 E-mail:Chunxiangqin@csu.edu.cn

抑郁障礙是全球最常見的精神障礙之一[1],目前,全球抑郁患者高達3.5億,我國超過2600萬[2],抑郁障礙不僅對患者的生活質量產生嚴重影響,還會對醫療服務及社會經濟造成沉重負擔[3]。抑郁的早期識別與篩查是診斷和管理的基石,目前篩查方式主要是基于心理量表測評[4],但存在效率低下、識別結果滯后且主觀性強的缺點[5-6],無法實現客觀且實時的大規模監測。因此實現抑郁障礙的高效、客觀、實時、大規模監測,已經成為了當前臨床醫務工作者和心理衛生科研人員亟待解決的重要議題。而大數據時代的到來以及人工智能技術的發展,為解決這一問題提供了契機。研究表明用戶逐漸傾向于在網絡中分享日常生活,表達觀點和情緒[7],這些內容能實時、真實反映用戶當下的情緒狀態,且隱私性更強,同時有效減少部分患者就醫病恥感[8]。隨著互聯網技術的快速發展和智能手機的普及應用,社交媒體中反映用戶興趣、觀點及心理動態等方面的數據海量擴增,因此,社交媒體逐漸成為挖掘用戶心理動態的重要資源[9],其在社交媒體中會有意或無意的暴露情緒,通過獲取用戶在社交媒體中發布的文本構建情感詞典,進行情感分析,能夠判斷用戶是否有抑郁傾向[10-11],該方法具有規模廣、準確率高、客觀性強、資源消耗少的優勢。本文圍繞基于情感詞典的情感分析方法以及其在抑郁領域的應用進行綜述,旨在為早期預測與篩查抑郁個體提供參考,以便盡早實施干預促進患者康復。

1 概述

1.1 情感分析

情感分析(Sentiment Analysis),又稱意見挖掘,是通過提取文本信息,對其情感傾向進行分析,以獲得人們的觀點、看法、態度等[12]。情感分析被廣泛應用于各類領域的情緒識別,在早期的工作中,通過網絡文本信息進行情感分析的研究主要應用于輿情分析、推薦系統、用戶畫像等領域[13],如利用社交平臺網民發帖來分析群眾意見及輿情趨勢[14],利用電子商務平臺用戶評論來評估用戶對產品的滿意程度[15]。

1.2 情感詞典

情感詞典(Sentiment Lexicon)是已標注情感傾向的名詞、副詞、動詞等詞語的集合[16]。詞語是體現文本情感的基本單位[17],在一定語境中表現出正負情感極性,如 “好”的情感傾向是正向的,而“糟糕”則是負向的。通過提取這類情感詞語,標注情感傾向,整理形成情感詞典。

1.3 情感詞典在情感分析中的作用

基于情感詞典的方法是進行情感分析的方式之一,將待分析文本中的詞匯與情感詞典中的詞匯進行匹配,累積各詞語的分值計算出文本的情感得分,或根據文本中不同情感詞的比例評估出文本的情感傾向。社交媒體中的發帖及評論大多較短、具有非正式的語言風格,針對此類文本,基于情感詞典的方法具有粒度精細、操作簡便、可解釋性高、結果穩定等優勢[17-18]。因此,本文將重點聚焦于基于情感詞典的情感分析。

2 基于情感詞典的情感分析方法

2.1 構建情感詞典

構建情感詞典是情感分析的核心[19],情感分析的正確率主要取決于情感詞典的準確率和覆蓋率[20]。情感詞典的構建包括獲取原始數據、文本預處理和形成詞典。原始數據主要來源于社交媒體和網絡論壇的發文,其獲取途徑主要通過開放的應用程序編程接口和網絡爬蟲兩種方式。原始數據書寫隨意且包括很多噪聲因此需要預處理,通過數據清理、分詞、停用詞刪除、詞性標注等,使其轉換成能被計算機識別的結構化數據[21]。預處理后,人工標注出情感極性或強度集成情感詞典。在此基礎上,通過種子詞延伸[22]、詞語共現[23]等方法挖掘更多情感詞,或引入機器學習算法[24]、神經網絡[25]等來擴展詞典,以達到減少人工成本、增大詞典覆蓋面的目的。

目前研究構建的情感詞典可以分為通用性情感詞典和領域依賴性情感詞典[20]。對于通用情感詞典的構建,國外先于國內,使用較多的有SentiWordNet[26]、OpinionFinder詞典、GI(General Inquirer)詞典[20],中文詞典主要有臺灣大學的NTUSD[27]、知網的HowNet、大連理工大學的情感詞匯本體庫[28]。這類詞典通用性廣,但對垂直領域中的專有情感詞含量較少,如常能反映抑郁的詞“失眠”,但情感傾向屬于中性,沒有列入HowNet詞典[29]。而領域情感詞典則相反,是指在特定領域常用到的詞匯集合,通用性弱,但對垂直領域中的專有情感詞含量較多。隨著各領域數據極速增長和應用要求增加,領域依賴情感詞典也逐漸獲得關注,搭建了產品、電影、旅游、抑郁等領域詞典,如含有抑郁情感網絡流行詞語和表情符號的抑郁詞典[30],結合通用詞典與表情符號的多模態詞典[31]。

2.2 建立分析模型

情感詞典構建后,建立用于計算情感得分或分類情感傾向的模型,常見的可分3類:基于正負詞數量的非監督模型、基于文本情感得分的非監督模型和基于情感詞典提取特征的監督模型[16]。首先,待分析文本為整個模型的輸入,文本與情感詞典逐一匹配?；谡撛~數量的非監督模型的構建是利用Python語言設定統計函數,直接統計文本中正負情感詞數量[16,32],或根據語義相似度、同義詞關系對未收錄的詞語計算極性后運行統計函數?；谖谋厩楦械梅值姆潜O督模型構建的主要任務是用程序語言設定運算規則。當文本出現情感詞典中的詞語時,讀取該詞權值,再排查當前窗口范圍內是否有否定詞和程度副詞,編寫運算規則進行權重處理:否定詞使權值反號,程度副詞使權值加倍[33],直至遍歷全文,對全部情感詞加權運算,其總分值作為模型輸出,以上模型具有簡單實用、易于分析理解的優勢,但其情感分類精度相對較低[21]。為提高情感分析準確性,研究者構建基于情感詞典特征的監督模型,這一模型的主要思想是根據情感詞典提取文本特征,基于這些特征通過機器學習算法構造分類器,即把用戶的情感分析任務轉化成用戶文本的分類任務,其分類結果作為模型的輸出。這類模型的構建分訓練與測試兩步。將已經人工標注傾向的文本分成訓練數據和測試數據,用詞頻-逆文檔頻率(TF-IDF)、卡方(CHI)[30]、互信息(MI)[32]、信息增益(IG)[34]等方法提取訓練數據的語言特征,包括詞匯、句法或語義等[35],用于調整分類器的參數[34],再用分類器對測試數據模擬分類以檢驗分類器效能。模型的性能評估常使用的指標包括準確率(Accuracy)、精確率(Precision)、召回率(Recall)以及綜合考慮精確率與召回率的調和平均數F1值[36]。

2.3 得出情感傾向

用獲得的最佳模型進行情感分析,基本流程如下:步驟一:獲取文本,從社交媒體爬取未知文本保存到本地數據庫,作為模型的輸入;步驟二:預處理,添加開源停用詞表清理掉“#”所帶話題、超鏈接信息、亂碼字符等冗余數據,利用中科院分詞系統ICTCLAS,THULAC或Jieba分詞庫[37]進行分詞;步驟三:特征提取,根據已設定的算法提取文本特征,包括正負詞語數量、情感詞、程度副詞和否定詞特征、句法語義特征等;步驟四:得出情感類型,基于正負詞數量非監督模型中,文本正負情感詞數量分別表示為#PW和#NW,若#PW>#NW,則文本為正向,反之為負向[16]?；谖谋厩楦械梅址潜O督模型中,根據運算的整個文本的情感得分Od,若Od>0,則文本視為正向,反之為負向[33]?；谇楦性~典特征模型可直接根據分類結果得到情感傾向,如支持向量機的學習目標分為正負類,則輸出結果對應情感傾向的正面和負面[38]。

3 基于情感詞典的情感分析在抑郁中的應用

3.1 識別抑郁情緒

通過獲取用戶發布的帖子,構建情感詞典及模型來分析文本情感,能夠識別用戶的抑郁傾向。Yusof等[39]將ANEW、MPQA和SentiWordNet 3種通用詞典分別嵌入多項式樸素貝葉斯分類器,對LiveJournal平臺收集的117,516個帖子的特征向量進行二分類,實驗發現基于3種詞典構建的監督分類器均有效分類出從抑郁論壇收集的帖子,其中SentiWordNet分類準確率最高,達84.4%。方振宇等[29]在通用情感詞典基礎上構建基于抑郁軀體癥狀、抑郁行為特征及抗抑郁藥物名稱的詞典,爬取443位鑒定為心理障礙的用戶和477位正常用戶的微博,利用支持向量機算法構建模型,統計詞典內的詞在微博中出現的次數,將詞頻作為用戶的語言特征進行二分類,若結果為消極則表示用戶可能存在抑郁傾向,將算法的分類結果與用戶的診斷進行比對,評估模型性能,結果顯示基于擴展詞典方法的準確率(88.6%)、召回率(77.8%)、F1值(82.7%)均高于其他特征分類方法,正確分類出抑郁用戶微博,有利于識別潛在的抑郁用戶,進而聯系該用戶進行專業醫學檢測,盡早接受干預。

3.2 判斷抑郁程度

情感詞典中詞語的情感傾向程度可能不同,使用情感詞的不同傾向程度判斷整條文本的情感強度,幫助醫護人員判斷用戶的抑郁嚴重程度,便于實施管理或診療時選擇不同方案。Fatima等[40]基于包含情緒標簽的帖子效價的高低來判斷用戶抑郁程度的輕重,研究使用ANEW詞典中詞語的不同效價,將文本的情緒標簽與抑郁程度對應(1.0～3.5對應重度抑郁,3.6～5.5對應中度抑郁,5.6～9.0對應輕度抑郁),使用隱馬爾可夫模型和隨機森林分類器實現利用詞語的不同效價值識別帖子抑郁程度,精確率為92.3%。尹暢等[22]爬取輕、中、重度抑郁用戶的評論,運用雙向最大匹配和詞頻-極性強度值方法發掘情感詞以構建詞典,以極性強度0、1、3、5,分別代表存在抑郁、輕度、中度、重度抑郁四等,通過累加和統計,按最終計算的極性強度初步判斷用戶抑郁程度,結合用戶實際情況驗證方法性能,準確率為78.65%,F1值為81.55%,實現幫助醫護人員初步辨別抑郁患者病重程度,跟蹤抑郁患者情況?；谇楦性~典的情感分析雖然能有效分析判斷抑郁程度,但由于中度抑郁描述與輕、重度有所重疊,導致模型錯誤地將部分中度抑郁帖子分類為輕度或重度[40],成為準確區分不同抑郁程度的障礙之一,抑郁程度的強鑒別仍有待于進一步開發。

3.3 動態分析情緒波動

利用用戶一段時間內發布的文本分析抑郁情緒變化,加強對抑郁患者情緒波動的動態監測。施志偉等[30]通過獲取微博文本構建抑郁詞典,用支持向量機構造函數形成抑郁情感傾向分類器,計算分類結果中抑郁文本數量與總文本數量的比值DI,以各月DI值的變化趨勢反映個體在某段時間內的抑郁傾向的波動趨勢,避免單條微博不能刻畫用戶一段時間內的整體抑郁傾向及變化情況,為醫護人員分析抑郁患者提供輔助手段。Kalyani等[41]將基于詞典和基于機器學習的方法結合建立情緒波動分析器,通過無監督機器學習來自動檢測情緒極性,生成用戶情緒偏差和相似性的報告,形成動態分析方法,確定用戶情緒波動,可用于預防因抑郁而導致的自殺企圖。Kang等[42]開發多模態情感分析方法,構建了含有Visual Sentiment Ontology和SentiStrength的文本詞典、含有負面和正面表情符號的表情詞典以及圖像分類器,通過匯總每日或每條文本各模態隱藏的情緒,連續監控用戶的情緒趨勢,準確率提高4.4%至28.0%。Wu等[31]提出的自動生成網絡用戶情緒波動系統更加完善,該系統進一步擴展詞典,包含NTUSD、HowNet、TCCE 3種文本詞典和兩種表情詞典,生成負面情緒曲線,當曲線突然上升時觸發事件檢測,根據帖子內容、新聞、天氣數據來分析情緒變化可能的原因,不僅為抑郁患者提供自我檢查工具,也為醫護人員評估抑郁情緒波動和發生原因提供參考。

4 展望

4.1 多數據擴展情感詞典的構建

情感分析效果依賴于情感詞典的準確度,目前限制情感詞典構建的主要因素包含兩方面,一是獲取的原始數據量不足,有限的爬取量和不斷迭代的網絡新詞導致獲取的情感詞不全、詞典覆蓋面小,二是文本預處理的效果不佳,網絡文本內容豐富,為數據清洗及訓練高質量詞典帶來難度。未來需持續跟蹤用戶評論,編組更高效的爬蟲程序以增大爬取用戶數量[21],調整文本預處理的策略,及時更新并合理延伸詞典,建立更完備、更精準的情感詞典。

4.2 多模態優化情感分析的方法

社交媒體的信息包羅萬象,利用表情符號等多模態數據、結合用戶行為或語言特征、引入其他機器算法均為情感分析方法打開新思路。未來可深入對圖像、音頻、視頻等數據的研究[43],甚至可采集周邊信息如粉絲圈、轉發量、在線時間等,結合更多有利于分析抑郁傾向的多模態信息,同時考慮當多模態呈現的情感傾向不同時,如何衡量權重以提升分析的準確率。

4.3 多學科指導情感分析的應用

基于情感詞典對抑郁個體情感分析的方法跨越數據挖掘、計算機技術、心理學等多個領域,醫療衛生人員在分析個體抑郁情緒、盡早實施干預中起到重要作用,然而目前情感分析的研究多由計算機工程領域人員完成,醫療衛生等領域未充分發揮作用,未來應發揮多學科交叉融合的優勢,一方面計算機領域研究者需進一步利用新興技術,調整程序代碼以推尋更穩定可靠的模型配置;另一方面,醫療、心理等領域人員可以充分利用專業知識,結合科技成果,有效解決心理障礙高發生低篩查的問題。在醫療衛生與人工智能相結合的研究熱潮及“健康中國2030”規劃不斷推進的背景下,共同推動基于情感詞典的情感分析在抑郁領域的應用,促進心理健康狀態智能監測服務的全民覆蓋。

5 小結

早期篩查并實施有效干預對抑郁患者的健康管理和降低醫療成本具有重要作用[44],基于情感詞典的情感分析方法通過利用社交媒體文本構建詞典分析用戶情感傾向,在識別與動態監測抑郁個體中展現出巨大潛力,但目前針對抑郁的開源情感詞典不足,應用于醫療、心理領域的研究有限。因此,未來可將該方法與心理等領域相結合,以幫助臨床人員早期識別篩查抑郁用戶或檢測抑郁情緒波動,應用智能化方式改善公眾心理健康。