?

云數據護盾下的社交網絡安全衛士*

2024-01-02 09:32饒安琪張晨光趙展鵬王楷文
山西電子技術 2023年6期
關鍵詞:模態社交文本

饒安琪,宋 斌、2,*,張晨光,趙展鵬,王楷文

(1.河南科技大學 信息工程學院,河南 洛陽 471023;2.河南科技大學 河南省網絡空間安全應用國際聯合實驗室,河南 洛陽 471023)

根據調研國內外對社交網絡安全問題的研究,目前基于社交網絡平臺獨特應用特質,人們面臨的網絡風險隱患除傳統安全威脅外主要包括四類:敏感信息檢測、虛假信息傳播、惡意用戶識別以及云存儲的數據安全性。本文創新性地提出基于細粒度情感的文本敏感分類檢測方法、多模態融合敏感分類檢測方法、動態數組多分支樹的云數據完整性驗證方案、多用戶下的云數據完整性驗證方案,構建云數據護盾下的社交網絡安全衛士平臺。

該平臺可適用于政府互聯網安全監管機構和網絡信息安全行業企業,政府機構和企業與本團隊達成合作后,需提供社交平臺的數據接口,通過調用接口實現其平臺的安全檢測及控制功能,為社交平臺安全以及用戶使用體驗提供更優質的服務以及更舒適的用戶體驗。云數據護盾下的社交網絡安全衛士平臺功能流程圖如圖1 所示。

圖1 社交網絡安全衛士平臺功能流程圖

1 敏感信息智能檢測

隨著社交網絡的極速發展和網絡用戶的增長,信息呈指數級增長,并呈現方式多樣化、內容海量化等特點,大量含有涉黃、涉政、涉恐、辱罵言論、賭博等類型的敏感信息充斥在互聯網環境中,對社會和諧安定造成了極大危害。因此,及時檢測互聯網中的敏感信息是保障互聯網健康發展的迫切需要。

社交網絡中的信息以多種形態呈現,其中敏感信息主要存在于文本和圖片中,所以對敏感類文本和圖片的檢測是網絡不良信息檢測的重要組成部分?,F有對敏感信息檢測的研究大都是采用單模態特征進行敏感識別,即所謂的單模態數據分析,很少考慮多模態在敏感信息檢測中的應用,如文本、圖片、表情、音視頻等多模態敏感信息的融合判斷,不能從整體上判斷推文的全局敏感性,識別效果和準確率還有待提高,所以加強社交網絡敏感信息檢測對凈化網絡、防止惡意傳播極其重要。

1.1 測試方法

針對現有的基于圖片或文本的單模態敏感信息檢測方法存在檢測結果無法充分反映推文整體敏感性的問題,本技術提出基于深度學習的多模態融合敏感信息分類檢測方法[1]。

該方法首先使用FastText作為文本敏感分類模型,通過引入文本情感極性,提高文本敏感信息分類檢測準確率。然后將在大規模圖片數據集上進行預訓練好的InceptionV3模型參數進行遷移,然后對其進行參數微調,使用敏感圖像數據集訓練敏感圖片分類模型,本技術主要將圖片檢測結果分為四類:涉黃類、涉政類、涉恐(暴)類和其他類。最后在決策層進行數據融合,設計了模型融合公式,將文本敏感分類模型的結果和圖片敏感分類模型的結果根據融合公式進行計算。本技術提出的多模態敏感信息分類檢測方法大致可分為三個階段:圖文敏感特征提取階段、圖文特征融合階段和敏感檢測分類階段。完整架構如圖2 所示。

圖2 多模態融合的敏感信息分類檢測框架

1.2 研究方法

針對在線社交網絡用戶發布的信息呈現內容多樣化、多模態等特點,擬研究提出基于深度學習的多模態融合敏感信息檢測方法,從而有效控制社交網絡敏感信息的發布和傳播,以實現社交平臺敏感信息監督和治理。

1) 基于細粒度情感的文本敏感分類檢測方法

我們針對傳統的關鍵字匹配方法準確率低、檢測速度慢等問題,設計了結合語義分析的快速敏感信息識別方法。該方法中敏感詞庫包含大量敏感詞,在使用過程中,用戶也可根據需要進行敏感詞的增刪改查等操作[2]。利用FastText快速文本處理方法,結合敏感詞庫和語義分析對文本進行敏感性檢測,在進行文本敏感性判定的同時,引入情感極性因子,提出一種基于情感詞和敏感詞共現分析的敏感信息識別方法。

2) 多模態融合敏感分類檢測方法

針對傳統敏感圖像檢測的二分類問題,設計敏感圖像分類檢測模型,將圖像分為四類:涉黃、涉政、涉恐和其他類圖像。為解決單模態文本或圖片的敏感信息檢測方法不能充分挖掘社交網絡敏感信息內容的問題,擬提出一種圖文融合多模態敏感信息檢測方法,采用決策層融合策略,根據概率分配和相關閾值的設定,進行圖片和文本的融合分類[3]。

2 虛假信息傳播控制

近年來,在線社交網絡中的虛假信息傳播給政治、經濟和生活等多個領域帶來嚴重的負面影響,引發了學術界與產業界對這一科學問題的持續關注。通過對國內外虛假信息傳播研究成果調研發現,虛假信息傳播研究可以追溯到早期復雜網絡和小世界網絡中的謠言傳播動力學模型研究[4],且持續到近幾年來關于社交自然人和社交機器人的混合型、交互式傳播模式研究。虛假信息傳播模型的研究主要針對傳播動力學模型、獨立級聯模型和線性閾值模型等。虛假信息傳播行為模式的研究主要是通過發布、轉發、提及、評論等多種混合式行為方式進行虛假信息傳播。如何綜合應用社交情境安全分析和新一代人工智能技術,挖掘社交用戶群體在傳播過程中的內在特征、產生機理與傳播規律成為目前亟需解決的重要問題。

面向社會化媒體平臺虛假信息傳播控制,重點圍繞社交用戶虛假信息傳播意圖檢測與傳播趨勢識別,通過利用社會情境分析和人工智能技術,擬提出傳播行為和潛在意圖的計算分析方法,實現社交用戶傳播前和傳播中及時有效的控制。虛假信息傳播控制主要用于定時預測社交平臺中用戶傳播虛假信息的潛在風險等級,根據社交平臺中用戶發布動態、發起話題的數量,預測用戶傳播虛假信息的潛在風險等級(用戶傳播虛假信息的意愿強度等級分為強、中、弱三類),以實現社交平臺對虛假信息傳播的事前和事中控制。

虛假信息檢測分為特征提取和模型構建兩個階段。特征提取階段是以形式化的數學結構來表示信息內容和社交上下文相關輔助信息。模型構建階段是進一步構建基于特征表示的信息內容模型、社交上下文模型和混合模型,來更好地檢測虛假信息和真實信息。虛假信息傳播訪問控制體系結構如圖3 所示。

圖3 虛假信息傳播訪問控制體系結構

訪問控制模型主要分為基于角色的訪問控制模型、基于屬性的訪問控制模型和基于關系的訪問控制模型[5]。這些模型分別將角色、屬性和關系作為主要元素來控制對信息的訪問。在 OSNs 信息分享過程中,基于角色的訪問控制通常利用多重關系、關系強度、方向關系、用戶到用戶的關系和用戶到資源的關系等來控制信息的傳播[5]?;陉P系的訪問控制根據社交用戶之間的各種關系進行授權訪問,來實現社交用戶對資源的傳播控制,提高了信息共享的安全性。虛假信息傳播使用控制模型如圖4 所示。

圖4 虛假信息傳播使用控制模型

3 惡意行為檢測

傳統惡意用戶檢測算法的成功應用都是建立在社交大數據基礎上的,而在實際應用場景中,惡意用戶呈現分散性、潛伏性、復雜性等特征,單方的社交用戶數據無法滿足檢測要求,需要雙方乃至多方的用戶數據。因此,怎樣在保護普通用戶信息安全的情況下結合多方信息進行建模計算、進行惡意流量的精準監測,是在線社交互聯網技術中亟待解決的難題。

針對在線社交網絡中惡意用戶檢測,擬提出一種基于縱向聯邦學習的社交網絡跨平臺惡意用戶檢測方案和面向多方隱私保護的惡意用戶檢測算法,該方案對多源異構數據進行預處理,采用加密樣本對齊和加密模型訓練方法[6],構建如圖5 所示的數據預處理層、樣本對齊層、聯邦學習層、數據應用層等層次化社交網絡跨平臺惡意用戶檢測架構,可在保障用戶隱私的前提下,實現對惡意用戶的精確檢測。

圖5 社交網絡跨平臺惡意用戶檢測架構

4 云數據安全保障

云存儲是通過虛擬化的技術以較低的成本擴充用戶的存儲空間,以此來減輕用戶管理和存儲數據的成本,并且可使用戶隨時隨地訪問云端的數據。但是,當用戶把數據存儲到云端的同時也失去了對云數據的物理控制能力[7],云端數據可能會因為受到硬件或者人為等不確定因素的影響而有所缺失,云服務提供商也可能會為了利益而丟棄一些用戶不常訪問的數據以節約存儲成本[7]。然而,出于維護自己聲譽或者避免賠償的問題,云服務提供商可能會隱瞞這些事故。這些數據安全問題極大地降低了人們對云存儲服務的信任度,嚴重地影響了云存儲服務的推廣和應用。所以,云端數據完整性驗證成為了亟待研究的問題。

4.1 動態數組多分支樹的驗證方案

擬將葉子節點設置為數組結構,降低樹的高度,提高節點的利用率,簡化動態更新的過程,縮短數據塊的查詢時間,從而有效減少驗證過程中的通信開銷和計算開銷,提高驗證效率。

4.2 多用戶下的云數據完整性驗證方案

擬將多個用戶考慮進來,設計一種多用戶下的數據完整性驗證算法,方案利用聚合簽名的性質,將多個用戶的多個標簽聚合成一個短標簽來進行完整性驗證,從而提高驗證效率。

為驗證和保持云計算環境數據完整性,如圖6所示,擬提出一種動態數組多分支樹的云數據完整性驗證方案和多用戶下的云數據完整性驗證方案,以提高人們對云存儲服務的信任度。

圖6 數據完整性驗證系統模型圖

5 結語

現如今社交網絡在人們的生活中扮演著重要的角色,它已成為網絡時代人們生活的重要部分,在為人們提供便利和歡樂的同時,其安全和隱私等問題日益凸顯。侵犯個人隱私、竊取個人信息等違法犯罪行為時有發生,網上黃賭毒、網絡謠言等屢見不鮮,已經成為影響國家公共安全的突出問題。檢測敏感信息、控制虛假信息、分析惡意行為、云數據安全技術已經是當前研究亟需解決的重要問題,關于社交網絡安全的研究具有非常廣闊的前景,也需要更多的技術迭代達到最佳的效果。因此,構建云數據護盾下的社交網絡安全衛士平臺既是時代的選擇,也是人們的需求。

猜你喜歡
模態社交文本
社交之城
社交牛人癥該怎么治
社交距離
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
你回避社交,真不是因為內向
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
國內多模態教學研究回顧與展望
基于HHT和Prony算法的電力系統低頻振蕩模態識別
由單個模態構造對稱簡支梁的抗彎剛度
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合