?

高校大數據安全與應用探析

2024-04-06 12:49劉梅梁倩
電腦知識與技術 2024年3期
關鍵詞:安全威脅隱私保護網絡信息安全

劉梅 梁倩

關鍵詞:大數據;網絡信息安全;數據預測;安全威脅;隱私保護

中圖分類號:TP393 文獻標識碼:A

文章編號:1009-3044(2024)03-0075-03

0 引言

隨著信息爆炸式增長,繼網格計算、云計算和物聯網之后,大數據成為一項新興熱門技術。它給人們的生活和工作帶來便利的同時,也帶來了新的安全威脅。網絡信息安全已經成為一級學科網絡空間安全的核心[1]。黨的十八屆五中全會通過了“十三五”規劃建議,這份未來五年綱領性指導文件中6次提到了網絡信息安全。先前浙江烏鎮舉行的主題為“互聯互通·共享共治——共建網絡空間命運共同體”的世界互聯網大會,充分體現了信息安全問題越來越受到國家層面的高度重視以及全社會的廣泛關注。然而,現有網絡信息安全中存在的國產替代的自主核心技術缺失;建立的審查制度不夠嚴密;相關法律、法規、管理尚有空白等情況都是制約我國網絡信息安全發展的“短板”。網絡信息安全又是大數據應用和安全的支撐保障,從而引發一系列的大數據安全問題,目前存在形式較為嚴峻的包括有隱私信息的保護、算法實現的信任和數據泛濫的處理等核心問題,針對這些問題采用現有的PKI/對稱密鑰機制、代碼簽名與審計機制、數據隱水印機制等傳統方法,卻并不能完全解決上述核心問題。例如大數據復雜環境下,采用PKI/對稱密鑰機制不能應對合法的數據的使用者泄露數據;如何將代碼簽名與審計機制運用在分布式的云編程模式,如何實現非數據塊的數據流隱水印技術,這些都是值得思考與研究的問題?,F有面向大數據安全的研究[2-3,5]大多都聚焦于以上核心問題,但并沒有從體系架構的角度考慮。

本文在大數據的內涵與特點基礎上,從體系架構上分析了大數據面臨的完全威脅,重點從基礎平臺、業務處理、用戶終端和共享使用四方面總結了相應解決方案,最后介紹了大數據在高校和網絡安全方面的應用。

1 大數據內涵與特點

大數據,或稱巨量數據集合,是指無法在可承受的時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合[4]。

大數據具有6V+1C特點[5]:Volume(大量)、Veloc?ity(高速)、Variety(多樣)、Value(價值)、Variability(易變)、Veracity(真實)、Complexity(復雜)。

2 大數據安全威脅及應對方案

基于大數據自身特性,在數據的整個生命周期中,從數據采集、存儲、分析與應用等都面臨各式各樣的安全問題。

大數據安全從分層角度考慮,可分為應用層的安全、數據層的安全、系統層的安全和設備層的安全;從體系架構上考慮,可具體到基礎平臺的安全、業務處理的安全、用戶終端的安全和共享使用的安全,可再進一步細分到數據和系統兩方面。解決大數據安全問題須從體系架構上規劃、設計和實施。根據圖1,下面從系統架構的角度分別論述各模塊所存在的安全威脅以及相應解決方案。

2.1 基礎平臺的安全

隱私數據泄密,是采用分布式編程框架的系統普遍存在的安全問題。大數據系統架構中,Airavat模型[6]是一個基于MapReduce框架的安全模型,它利用強制訪問控制和差分隱私保護技術對分布式計算環境下的敏感數據提供較好的訪問控制和安全隱私保護。其基于SELinux安全子系統為安全計算模型提供強制訪問控制策略;采用的差分隱私保護技術可對來自數據源中的每組輸入數據進行差分隱私處理,使任何單個數據項都不會對總的計算輸出結果產生太大的影響。

常用的非關系型數據庫(NoSQL) [7]是一種分布式的且不保證遵循ACID原則(即原子性、一致性、隔離性、持久性)的輕量級關系型數據庫,它只解決了性能與擴展問題,卻并沒有考慮安全問題。針對非關系型數據庫所存在的問題,針對性地進行安全加固,可采取的途徑包括:通過為NoSQL定制高性能的原子操作來確保事務完整性;通過為NoSQL提供Cluster集群節點強制認證等機制來完善認證機制;通過將NoSQL與系統的基于角色的訪問控制相結合來完善授權機制;針對NoSQL 領域中存在的json-注入、array-注入、view-注入、rest-注入、gql-注入等類型的注入攻擊進行檢測;通過NoSQL內部操作日志系統和日志分析系統來排除安全隱患。

2.2 業務處理的安全

隨著網絡化制造業的迅猛發展,產品借助互聯網或CD-ROM被復制、傳播和公開,盜版侵權現象日益猖獗,對數據版權保護的需求愈發強烈[8-9],數字水印技術應運而生。該技術是對數字制品的版權和完整性進行保護的有效手段,其核心思想是當數字作品出現侵權時,可通過嵌入在數字作品中的隱蔽標記來鑒別真偽。與此同時,在數據采集、分析和推廣過程中也能加強對違法來源的追蹤。

為增強數據來源的可信度,還可采用數據標簽技術進一步對“數據體制”進行規范,從而對于后續的數據來源、合法性、傳播渠道等環節分析帶來巨大的幫助;并可完善與升級授權使用體制,運用代碼與數據混合應用模式和聯網授權管理機制來提升數據源的可信度。

2.3 用戶終端的安全

攻擊者可以通過制造惡意設備;克隆ID身份,以虛擬身份提供非法數據;修改采集端應用軟件;對采集網絡進行中間人攻擊;利用采集端漏洞注入非法數據等方式向數據中心提供非法輸入,造成數據中心重要數據庫污染、DOS攻擊等安全威脅。

用戶對網絡服務使用可能帶來非可信數據的流入,最終導致用戶終端系統的可信性受到威脅。TPM 安全芯片[10-11]是一個基于密碼學的安全芯片,被可信計算組織倡導作為可信計算環境的硬件信任根,負責加密解密相關的運算和密鑰的存儲,除了能保護敏感數據之外,還具有一定的防篡改保護能力,可從終端上提高系統的安全性?;赥PM 芯片的采集端可實現用戶終端系統的校驗功能和防篡改功能,由于造價便宜,容易得到用戶認可,可廣泛推廣使用。

大數據環境下的云服務多種多樣,要求系統提供給用戶相對清晰簡潔的服務接口,但系統內部復雜的運行機制對用戶并不透明,因此當終端系統出現異常時,難以實時掌握系統運行信息,亟需開發專用云服務過濾器,實現采集信息的異常檢測與分析。

另外,為解決程序開發與交付代碼的不可信問題,引入基于King.J.C的符合執行方法,應用于平臺各類組件的缺陷測試與分析中,可幫助提升程序代碼的可信度,其核心思想是利用“符號表達與計算”的方式來對程序所有可能的狀態進行窮舉搜索,并篩選出其中的缺陷狀態部分。

2.4 基礎平臺的安全

數據的共享使用解決了數據孤島問題,但同時也帶來了數據安全問題。如何在數據共享使用過程中保護隱私安全,是一個棘手問題。以政務管理系統為例,其數據分級、分類公開應用,都需要重點關注處理敏感信息等隱私保護問題,避免因泄露而陷入不可控局面。

為應對共享使用的隱私保護安全問題,常見采用數據匿名化[12]、安全多方和密文計算數據等技術手段。典型的數據匿名化技術有群簽名、環簽名、零知識證明和不經意傳輸,其中零知識證明是證明者能夠在不向驗證者提供任何有用信息的情況下,使驗證者相信某個論斷是正確的,解決當前認證需求下的數據泄露問題;不經意傳輸是在顧客購買商品的時候,供貨商無法獲知顧客所購買的是什么商品,進一步擴展到什么時候以及如何買。安全多方技術可通過數據可取回性證明來實現。密文計算數據技術分可搜索加密技術和全同態加密技術,可搜索加密技術[13]主要應對存儲到云端的個人數據可能存在泄密的威脅,它提供的加密和密文直接檢索功能使服務器無法竊聽用戶個人數據,但可以根據查詢請求返回目標密文文件,這樣既保證了用戶數據的安全和隱私,又不會過分降低查詢效率;全同態加密技術[14]是一種密文計算數據技術,它允許將敏感的信息存儲在遠程服務器里,既避免從當地的主機端發送泄密,又保證了信息的使用和搜索。

以云計算環境為例,云用戶發布數據在云服務器上共享,可以采用從粗粒度訪問控制過渡到細粒度的訪問控制與審計的方式,將業務模型中的對象加以細分,依據用戶對數據訪問權限訪問數據對象,同時對數據對象進行更細化的審計工作。

3 大數據的應用

3.1 大數據在高校中的應用

高校中匯聚著大量的學生信息、教職工信息、教學數據、科研數據、就業數據、一卡通消費數據、資產數據等各類數據,涉及教學、科研、管理等各方面。

1) 人事管理方面:綜合各教職工的教學、科研等業績、歷史考核成績、評價、性情等各方面信息進行分析研判,為干部選拔、人事考核提供判斷依據。

2) 學生管理方面:根據學生一卡通消費等數據提供勤工助學活動的參考依據,根據學生成績、獲獎、協會、興趣、愛好、特長各方面分析,提供就業推薦及指導。

3) 教學科研方面:對學生專業、選課、成績、圖書館借閱、獲獎、協會等方面進行數據分析,提供研究方向選擇、導師選擇、畢業論文方向方面的指導等。

圖2展示了現有高校大數據體系架構及應用。在高校的學科規劃、心理咨詢、專家推薦、校友聯絡等各個具體應用上,均可借助大數據分析技術挖掘數據中潛在的價值[15]。目前,不少高校都已經意識到大數據對于高校信息化建設和校園工作的重要意義,并已經開始著手研究大數據如何更高效地為校園工作服務。

西南交大計劃推出“大數據校園”,為學校決策提供數據支撐,通過有線網絡、Wi-Fi、一卡通、門禁卡等相關系統,繪制出學生在校園里的“行為軌跡”模型,預測學生未來的發展狀況。華東師范大學也正在將一卡通消費數據與勤工助學結合起來。越來越多的高校都希望啟動大數據研究和建設工作,數據的安全也是其中的焦點。

3.2 大數據在網絡安全中的應用

1) 利用大數據平臺發現威脅和預測復雜攻擊:傳統APT攻擊[16]防護體系在應對現有網絡信息安全中的零日攻擊、社會工程學、逃逸攻擊已逐漸顯現出其不足,利用大數據技術,構建APT攻擊的數據模型,加入主動檢測技術和響應流程,形成一套完整的APT攻擊防護體系,可解決傳統信息安全中邊界防御、多層防御無法避免的“被動響應”問題。

2) 利用大數據平臺分析缺陷,快速定位軟件漏洞:通過對程序變量、內存分配和存儲方式進行分析來實現相應的內存重組織方法,用于跟蹤符號傳播過程,同時采用基于并行計算模型和相應編程模式的Spark集群計算框架可優化內存集群計算中的迭代次數,從而達到快速定位軟件漏洞的目的。

3) 利用大數據平臺實現虛擬機逃逸驗證,設計與研發基于蘋果系統的Hypervisor[17]防逃逸技術。

4 結束語

大數據作為新時代經濟與社會發展的“動力源”和“驅動力”,其體系框架現在還存在各式各樣的安全威脅,因此我們需加大力度投入大數據安全與應用,著重培養大數據安全專業人才,加快研發大數據安全技術,規范大數據平臺的建設,全面提升大數據安全響應速度和保障能力,同時也應注意盡力縮小理論研究與實際應用之間的差距。

【通聯編輯:王力】

猜你喜歡
安全威脅隱私保護網絡信息安全
大數據環境下用戶信息隱私泄露成因分析和保護對策
大數據安全與隱私保護的必要性及措施
WIFI無線網絡技術及安全問題研究
計算機網絡信息安全與其防護體系設計
《網絡信息安全》課程教學改革與探索
校園無線網絡的安全問題及應對策略
社交網絡中的隱私關注及隱私保護研究綜述
大數據時代的隱私保護關鍵技術研究
關于計算機網絡信息安全及防護策略探究
互聯網金融的風險分析與管理
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合