?

基于CNN-LSTM深度學習技術的知乎文本情感分析

2024-01-26 20:52劉飛生魏超
電腦知識與技術 2023年35期
關鍵詞:卷積神經網絡

劉飛生 魏超

摘要:知乎平臺作為中國主要的知識共享社區,承載著海量信息,因此對其進行情感分析具有重要的現實意義。本研究旨在結合卷積神經網絡(CNN) 與長短時記憶網絡(LSTM) 技術,實現對知乎平臺上大量文本數據的情感分析。本文研究并驗證了CNN和LSTM技術在文本情感分析中的性能,通過融合兩種技術有效地提升了情感分類的精度。實驗結果表明,融合了CNN與LSTM的模型在在多個領域中情感分類方面呈現出更優異的表現,從而驗證了其顯著的有效性和潛力。

關鍵詞:文本情感分析;知乎;卷積神經網絡;長短時記憶;循環神經網絡

中圖分類號:TP18? ? ? ? 文獻標識碼:A

文章編號:1009-3044(2023)35-0020-03

開放科學(資源服務)標識碼(OSID)

0 引言

在信息時代的浪潮下,社交媒體和網絡平臺扮演著不可或缺的角色,為人們提供了一個廣泛的信息交流和表達平臺。知乎作為中國領先的知識分享社區,吸引了4億多的注冊用戶,涵蓋了廣泛的話題、問題和觀點。隨著用戶規模的不斷擴大,知乎平臺所積累的海量文本信息數據變得豐富和多樣。這些文本數據承載著用戶對于各類話題的觀點、情感以及態度,其深層次的情感信息對于理解用戶需求、產品改進以及輿情分析具有重要意義。

隨著社交媒體信息的爆炸性增長,對于海量文本數據的高效處理和情感分類需求變得更加迫切[1]。傳統的文本分析方法往往受限于特征工程的復雜性和規模效應,難以滿足大規模數據的處理要求。近年來,深度學習技術的興起為文本情感分析帶來了嶄新的可能性。通過構建復雜的神經網絡結構,深度學習能夠自動地從原始文本數據中提取高層次的語義特征,從而實現高效準確的情感分類[2]。

深度學習在文本情感分析領域的應用已經取得了顯著的成果,其中卷積神經網絡(Convolutional Neural Networks,CNN) 和長短時記憶網絡(Long Short-Term Memory,LSTM) 等技術在文本分類任務中表現出色。CNN在圖像處理中的成功應用啟發了研究人員將其擴展到文本領域,其卓越的特征提取能力對于捕捉文本的局部特征非常有效[3];LSTM作為一種適用于序列數據的循環神經網絡,能夠捕捉文本的時序信息,對于情感分析尤為重要[4]。

本文旨在借助深度學習技術,通過CNN和LSTM技術進行融合來探索并解決知乎平臺上海量文本數據的情感分類問題。本文將深入研究并驗證CNN和LSTM技術在文本情感分析中的表現,進一步探討它們融合的優勢和潛力,以期為社交媒體情感分析領域的研究和應用提供有力的支持。

1 實驗環境及數據處理

1.1 實驗環境

本文的實驗環境如下所示:

l 操作系統:CentOS Linux 7.0;

l 開發環境:TensorFlow;

l 通用庫:numpy、scikit-learn、scipy、nltk。

TensorFlow作為深度學習框架,為本文的實驗提供了穩健的基礎。通過numpy、scikit-learn、scipy和nltk等通用庫的支持,我們能夠方便地進行數據處理、特征提取和模型評估。

1.2 實驗數據集

本文實驗數據集分為2個主要部分:

1) 知乎網站數據集

通過Python爬蟲技術,筆者采集了豐富的知乎用戶評論和帖子數據,作為情感分析的基礎數據集。這些數據涵蓋了多個領域和話題,涉及科技、文化、娛樂等多個領域,為我們的研究提供了豐富多樣的文本素材。

2) 新華社新聞數據集

引用中文新聞數據集,通常被稱為“新華社”數據集,作為補充實驗數據。這個數據集包含了大量的中文新聞文本,覆蓋了不同的新聞領域和主題。這樣的數據集在情感分析任務中能夠提供更多的文本樣本,豐富了研究數據。

1.3 數據預處理

為了準備數據,采取以下步驟進行數據預處理:

1) 中文分詞

使用中國科學院計算所開發的中文分詞軟件包NLPIR進行中文分詞。NLPIR不僅提供了高效準確的中文分詞功能,還能進行詞性標注、命名實體識別以及用戶詞典的支持。這有助于將文本數據轉化為更加適合模型處理的詞匯序列。

2) 文本清洗與停用詞去除

在分詞完成后,筆者進行了文本清洗,包括去除特殊字符、標點符號和無意義的空白符。此外,還剔除了停用詞,這些停用詞通常不攜帶太多情感信息,但會占據文本中的空間。

經過以上數據預處理步驟,得到了分詞、清洗且剔除了停用詞之后的文本數據,為接下來的特征提取和模型訓練做好了準備。

2 融合模型設置

為了充分發揮CNN和LSTM的優勢,在參考Ombabi[5]的研究成果基礎上,本文針對中文語境提出了一種融合方法,將它們結合起來進行知乎平臺文本情感分析。以下是該融合方法的詳細步驟:

2.1 文本表示

首先,利用預訓練的詞向量模型(如Word2Vec或GloVe) 將原始文本轉換為詞向量表示。這些詞向量能夠有效地捕捉詞匯之間的語義關系,為后續的模型提供有意義的輸入。

2.2 卷積操作

將詞向量表示輸入一層卷積神經網絡中,該網絡由多個卷積核和池化操作構成。卷積核在捕捉不同大小的局部特征方面表現出色,而池化操作則有助于減少數據的維度,同時提取關鍵特征。

2.3 LSTM建模

卷積層的輸出被饋送至一個雙向LSTM層。雙向LSTM能夠同時捕捉文本的前向和后向信息,從而更好地理解文本的上下文語境。LSTM層的輸出被連接在一起,并通過全連接層進行情感分類。

2.4 融合模型的訓練優化

在模型訓練過程中,使用以下實驗參數設置來優化融合模型:

l 優化算法:選用常用的Adam優化算法,以最小化交叉熵損失函數。

l 學習率:初試學習率設定為一個較小的值0.001,通過實驗驗證找到合適的學習率調度策略,如學習率衰減。

l 批大?。号幚泶笮δP陀柧毸俣群头€定性具有影響,進行批大小的調整和實驗。

l Dropout:在全連接層和LSTM層中引入Dropout層,以減少過擬合風險。

l Epochs:設置合適的訓練迭代次數,避免過擬合或欠擬合情況的出現。

2.5 實驗參數設置

為了驗證模型性能,筆者設計了一系列實驗,包括單獨使用CNN、單獨使用LSTM以及融合CNN與LSTM模型的情況,最終參數如表1所示。

通過對不同模型的參數設置進行調整,旨在獲得最佳性能,以便在知乎平臺文本情感分析任務中取得更準確的結果。

3 模型訓練及評估

3.1 對比實驗

在基于單獨使用CNN、LSTM以及融合CNN與LSTM三種方法的基礎上,筆者選擇了知乎平臺上不同領域內容,包括“美食”“臺風”和“科技”,進行了模型訓練及評估,其中涉及80%的訓練數據和20%的測試數據。

3.2 實驗評估指標

在評估性能時使用標準評估指標進行驗證,使用accuracy準確度、precision精密度(又稱精度)、sensitivity靈敏度(又稱召回率)、specificity特異性、F-Score 綜合評估指標這5個參數進行性能評估,其值可以使用混淆矩陣及對應公式來確定。

[準確度Accuracy=TP+TNTP+TN+FP+FN]? ?(1)

[精度Precision=TPTP+FP] (2)

[召回率Sensitity=TPTP+FN] (3)

[特異性Specificity=TNTN+FP] (4)

[F1=P*RP+R] (5)

3.3 實驗結果與分析

作者對知乎數據集和新華社數據集上進行了一系列的實驗,針對“美食”“臺風”“科技”三個特定領域進行了情感分類性能評估。實驗結果如表3所示。

通過對表3中的美食研究領域進行數據分析,評估性能如圖1所示。經過對比結果可知,本文采用的CNN與LSTM融合模型的準確度、精度、召回率、特異性、F-1分別為0.90、? 0.91、0.89、0.92、0.90,要比單獨的CNN模型和單獨的LSTM模型取得的評估性能更好。說明CNN與LSTM融合模型在知乎平臺的“美食”領域上的評估預測率更好。

通過對表3中的臺風研究領域進行數據分析,評估性能如圖2所示。經過對比結果可知,本文采用的CNN與LSTM融合模型的準確度、精度、召回率、特異性、F-1分別為0.82、0.85、0.8、0.87、0.82,要比單獨的CNN模型和單獨的LSTM模型取得的評估性能要好。說明CNN與LSTM融合模型在知乎平臺的“臺風”領域上的評估預測率更好。

通過對表3中的科技研究領域進行數據分析,評估性能如圖3所示。經過對比結果可知,本文采用的CNN與LSTM融合模型的準確度、精度、召回率、特異性、F-1分別為0.93、0.92、0.94、0.95、0.93,要比單獨的CNN模型和單獨的LSTM模型取得的評估性能更好。說明CNN與LSTM融合模型在知乎平臺的“科技”領域上的評估預測率更好。

綜合以上可知,在3個不同領域中,融合了CNN與LSTM的模型在情感分類上表現出了更高的準確率。這表明通過將卷積神經網絡和長短時記憶網絡相融合,能夠更好地捕捉文本中的特征和上下文信息,從而提高情感分類的準確性。

4 結束語

本文以知乎這個信息豐富的社交平臺為對象,探索了一種有效的文本情感分析方法。通過結合卷積神經網絡(CNN) 和長短時記憶網絡(LSTM) 的融合模型,在不同領域的情感分類任務中取得了令人滿意的成果,證實了融合模型在情感分析任務中的潛力。然而,鑒于實驗設備條件的限制,本文未能在深層次上探索CNN與LSTM的融合,未來的研究可以考慮利用更強大的計算資源,進一步挖掘模型的潛力。

參考文獻:

[1] 杜昌順.面向細分領域的輿情情感分析關鍵技術研究[D].北京:北京交通大學,2019.

[2] 鄧鈺.面向短文本的情感分析關鍵技術研究[D].成都:電子科技大學,2021.

[3] KIM Y.Convolutional neural networks for sentence classification[EB/OL].2014:arXiv:1408.5882.https://arxiv.org/abs/1408.5882.pdf

[4] HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.

[5] OMBABI A H,OUARDA W,ALIMI A M.Deep learning CNN–LSTM framework for Arabic sentiment analysis using textual information shared in social networks[J].Social Network Analysis and Mining,2020,10(1):1-13.

【通聯編輯:唐一東】

猜你喜歡
卷積神經網絡
卷積神經網絡語言模型研究
基于卷積神經網絡溫室智能大棚監控系統的研究
基于深度卷積神經網絡的物體識別算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合