?

大數據安全與隱私保護發展態勢研究

2019-01-06 02:19王紹荃鐘尚染
中國科技縱橫 2019年22期

王紹荃 鐘尚染

摘 要:計算機、互聯網等信息技術的快速發展推動了“大數據”概念形成。雖然大數據技術給人們的生產、生活帶來了諸多便利性,但是大數據在采集、傳輸、儲存和使用過程中出現了安全、個人隱私等方面的問題,例如個人信息泄漏、數據刻意造假等。本文站在大數據安全角度,通過分析大數據所帶來的安全挑戰,整理相關關鍵技術和最新研究進展,并從數據獲取、數據防護與數據銷毀三方面給出了數據安全保護的相關建議。

關鍵詞:大數據;安全;隱私保護;研究

中圖分類號:TP309 文獻標識碼:A 文章編號:1671-2064(2019)22-0038-02

0 引言

當今世界正在經歷一場重要的數字化變革?;ヂ摼W、移動終端設備和物聯網快速發展產生了大量數據。根據IDC數據,全球大數據儲量從2016年的16ZB增長至2018年的33ZB,未來全球大數據儲量規模增長率將保持在40%左右。

1 認識大數據

2011年,麥肯錫提出“大數據是指其大小超出了典型數據庫軟件的采集、儲存、管理和分析等能力的數據集”,成為金融、商業、科技等領域的熱門話題。大數據具有5V特征,包括數據龐大(Volume)、數據高速(Velocity)、數據多樣(Variety)、數據準確性(Veracity)與數據應用高價值性(Value)。

“大數據”技術是指收集和存儲大量、廣泛的數據集。在利用大數據時,需前沿的處理模式才能獲得大數據的決策力、洞察發現力和流程優化能力。大數據包含海量、多樣化和高增長率的信息資產,其存儲方式和處理方法、利用角度較傳統數據架構有一定區別。大數據的基本特征對計算設施、存儲、網絡、信息資源等提出了更高的安全要求,傳統的信息安全手段和管理機制已經跟不上大數據時代的信息安全形勢發展。

2 大數據安全研究現狀和進展

近年來,“大數據安全”相關期刊論文增長趨勢明顯,學術界對“大數據安全”研究逐年增多。通過對“big data”和“security”在Engineering Village期刊論文檢索,我們發現檢索量從2014年的124篇增長至2016年的265篇。Hakuta.K等展示了大數據安全和隱私方面所面臨的挑戰有關一些最新研究成果,確定了獲取大數據相關信息和知識的三個階段,得出大數據安全生命周期模型,并從數據收集、數據存儲、數據分析、數據應用(知識創造)四方面提升數據安全。Murthy.P.K給出了大數據安全和隱私挑戰論述,強調這些挑戰將促使人們更加關注加強大數據基礎設施。陳興蜀等介紹了數據安全相關法律法規以及標準現狀。

3 大數據所帶來的安全挑戰

傳統上說,數據安全性保護包括數據的機密性、完整性和可用性三大要素,數據保密目的是保護數據免受未經授權的訪問;數據完整性是指保護數據免受未經授權的更改;數據可用性是解決如何使授權實體和用戶可以訪問數據。在大數據領域,數據隱私是保密性的一種特殊性呈現方式。

3.1 用戶隱私保護

大量事實證明,對大數據不正確處理會威脅到用戶隱私。保護用戶隱私包含以下三方面:位置隱私、標識符隱私以及連接關系隱私保護。一般來說,未經個人授權,其驗證信息不能被共享及使用,個人信息共享常常還受到隱私法的約束。除了信息直接泄露,基于用戶信息,對用戶生活的狀態和行為的分析與預測也威脅到個人隱私安全,給安全帶來了巨大挑戰。

目前,常用隱私保護方法效果一般,比如對用戶個人信息匿名顯示或脫敏公開,個人隱私信息仍可能被泄露。

目前,企業在收集、存儲、管理用戶信息數據時,缺乏一定的合規性規范與監管,用戶無法確定隱私信息的正確用途。一般來說,在數據的商業化利用過程中,用戶信息的利用狀態與處理結果等過程信息應該被用戶所知曉,從而增加對用戶隱私保護的可控性。

3.2 數據可信度

在數據采集的時候,由于數據源頭眾多、數據結構多樣性,數據增長速度快,數據的可信度成為一個重要關注點。

(1)數據刻意造假對數據可信度產生威脅,例如虛假的互聯網電商評論、手機應用APP數據會導致決策失誤。假如數據使用目標明確后,此時會產生部門人員可以提供假數據,誘導分析者得出對其有利的結論。人們較難去辨別虛假信息,無法辨別真偽,可能會作出錯誤判斷。由于網上部分評論信息的不真實性,往往會誤導客戶去選擇劣勢商品或產品服務?,F有技術無法做到對所有數據來源進行真實性鑒別。

(2)數據傳播過程中存在一定的誤差傳遞,也會對數據可信度造成一定影響。1)數據采集過程中會有人工干預從而引起誤差,誤差會逐步傳導到分析的結果中,影響分析結果的準確性。2)數據變更、傳播不及時也會導致數據失真,隨著時間變化,前期數據無法表征事件的真實性。例如,用戶電話信息變更,早期的信息已被大數據中心所收錄,造成此時推送應用信息不準確。為防止分析結果不真實造成判斷誤差,大數據利用者或研究機構在使用數據的過程中,應重視數據的真實性、數據傳播路徑的正確性以及數據處理全過程管控等,從而全面提升、保障數據可信度?,F有對數據完整性驗證的手段中,數字簽名、消息鑒別碼等技術是比較好的措施,但由于數據顆粒度差異,進行真實性鑒別時,難度較大。

3.3 實現訪問控制

由于大數據被應用在不同的領域中,數據訪問控制需求強烈,而作為數據受控共享的有效手段,隨著訪問控制需求的不斷增長,訪問控制的實現有以下兩點難點:

(1)無法輕易預設角色,從而達到劃分角色的目的。由于大數據被運用在不同的范圍、領域中,不同類型用戶訪問控制需求不一樣,包括不同行業、部門和身份用戶。當下面對海量數據及大量用戶,其權限管理要求呈現一定的未知性,預先設置角色難度較大。

(2)難以預知用戶實際權限。面對海量的數據,安全管理員由于其專業知識壁壘,無法準確為用戶設定可訪問的數據范圍,而定義所有用戶的授權規則效率很低。例如在醫療應用時,當醫生因為業務需求訪問大量信息時,管理員可對其訪問行為進行檢測和控制,從而防止醫生對病患相關信息、數據的過度訪問。另外,大數據呈現多樣性的特點與結構,存在多樣化的控制訪問需求,如何能在當前海量數據中統一描述需求、正確表述需求成為新的挑戰。隨著數據分析技術快速發展與應用,部分企業采用“保護、檢測、響應、恢復”這一措施發現潛在安全威脅,從而實現降低數據安全事故發生概率,提升了隱私保護。例如,作為新型安全工具,“IBM大數據安全智能”可綜合利用電子郵件、社交媒體等大數據信息甄別企業的數據安全威脅(內部和外部),該方法可以通過分析發現泄露公司相關機密性信息異常員工,提醒企業防范。在國際政治形勢分析中,“棱鏡”計劃是一種利用大數據進行危險局勢預測的方法,通過采集、利用海量數據,基于安全分析系統及方法,可快速發覺攻擊之前的潛在威脅。

4 大數據安全與隱私保護關鍵技術

4.1 數據發布匿名保護技術

大數據中含有大量結構化數據(或關系數據),采取發布匿名是保護大數據隱私的主要方法,是實現其隱私保護的核心關鍵技術與基本手段,具體做法包括k-匿名、l-diversity匿名、個性化匿名、t-closeness匿名、m-invariance匿名、基于“角色構成”的匿名等。匿名發布方法可防止惡意攻擊行為,在保證數據質量前提下,避免用戶隱私的泄漏。例如金融交易信息中心含有大量涉及隱私安全的數據,若公開這些數據會產生大量的安全隱患,因此在發布數據時,采用匿名發布保護技術,保護用戶隱私。

4.2 數據溯源技術

數據溯源是對數據來源、數據傳播、數據計算等過程的全方位追根溯源,從而確定數據的準確度和精確性。數據溯源技術能夠提升分析結果的準確性,可確定提升數據運算精度,發現業務問題。標記法是常用的方法之一,標記法側重于數據計算方法及出處,記錄數據在數據倉庫中的查詢與傳播歷史。數據溯源技術在云儲存場景應用、對文件回復及溯源取得了一定的成就,但與隱私之間的平衡以及其本身的安全性全面保護這兩方面面臨挑戰。

4.3 角色挖掘技術

基于角色訪問控制通過為用戶指派角色、將角色關聯至權限集合,控制與管理使用者的相關權限,實現用戶授權、簡化權限管理。角色挖掘技術目前獲得了比較高的使用率,利用該技術可自動化實現角色優化與提取,可為用戶提供不同服務,實時監控用戶行為。

4.4 身份認證技術

采用特定的技術,對用戶行為進行數據分析,形成身份認證技術。通過對海量數據的分析、采集,把握用戶行為習慣,總結用戶行為特點。身份認證技術對數據隱私保護起到一定的促進作用,有利于大數據的健康發展,第一可根據用戶特征分析結果對操作者身份進行驗證,第二增加網絡黑客惡意攻擊、盜取信息難度。

5 建議和結語

大數據快速發展帶來許多機遇,但在安全和隱私方面也帶來了問題和挑戰。企業規模、所屬行業以及現有數據系統和安全策略都會對數據安全與隱私保護產生一定影響。以下從數據獲取、數據防護與數據銷毀三方面提出大數據的安全隱私保護解決方案建議。

從信息獲取角度來說,通過限制對敏感文檔的訪問來管理用戶身份、對數據進行一定分類、對數據存儲與傳輸的加密、加強數據源頭保護都是數據安全隱私保護有效手段(數據加密包括工作設備上網絡使用規則、防病毒軟件的安裝等)。從數據安全防護角度來說,進行系統功能安全測試、加強內部員工數據安全教育與培訓、制定數據共享安全規章制度、制定安全管理標準處理流程與制度、制定數據恢復計劃(數據備份)都能有效降低數據安全帶來的風險,同時加強內部操作日志查詢,為安全事故的責任追溯提供依據。從數據銷毀機制來看,應建立一定的數據刪除機制,數據安全銷毀是一種新的數據安全措施,隨著用戶對云服務的依賴性越來越大,若云端數據消除不徹底,會導致敏感數據的惡意恢復,從而導致用戶數據或隱私面臨泄露的風險。

參考文獻

[1] 王建民,金濤,葉潤國.《大數據安全標準化白皮書(2017)》解讀[J].信息技術與標準化,2017(08):38-41.

[2] 中華人民共和國工業和信息化部.中華人民共和國網絡安全法[EB/OL].2016-11-08/2017-06-12.

[3] Issa N T,Byers S W,Dakshanamurthy S.Big data:the next frontier for innovation in therapeutics and healthcare[J].Expert Review of Clinical Pharmacology,2014,7(3):293-298.

[4] Keisuke Hakuta,Hisayoshi Sato. Cryptographic Technology for Benefiting from Big Data[M].Springer Japan:2014-06-15.

[5] Murthy P K.Top ten challenges in Big Data security and privacy[C]//Test Conference.IEEE,2015.

[6] 陳興蜀,楊露,羅永剛.大數據安全保護技術[J].工程科學與技術,2017,49(05):1-12.

[7] 大數據安全標準化白皮書[R].北京:全國信息技術標準化技術委員會大數據安全標準特別工作組,2017.

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合