?

大數據應用模式及安全風險研究

2020-12-28 02:26李洪波
中阿科技論壇(中英阿文) 2020年10期
關鍵詞:應用模式研究分析大數據

李洪波

摘要:目的:對大數據應用模式進行分析,并對其存在的安全風險進行研究。方法:采用文獻查閱法和案例分析法來對大數據應用模式中的安全風險進行分析。結果:Hadoop在云計算的應用中有不同的形式,同時也存在許多安全風險,要應對這些風險,可以對用戶、平臺、行為請求進行監控。

關鍵詞:大數據;應用模式;安全風險;研究分析

中圖分類號:TP309? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A

現階段,我國各個領域的數據生成都非常迅速,要處理的數據量也在急劇增多。這些數據除了具有數量大的特點外,還具有多樣化的符號,這就對數據處理器的性能提出了更高的要求。如今,數據的處理已經不再是簡單地要求生成統計報告,而是利用分析模型對數據進行進一步分析。依賴云計算平臺搭建而成的Hadoop計算框架由此產生。但由于其自身的特點和安全機制的薄弱,該計算框架也存在著巨大的安全風險[1]。

1? 大數據的應用模式

大數據應用模式本身就是信息技術發展的新興產物,其具有數據的海量儲存性,能夠通過數據運算對海量的信息進行準確的處理。該模式通常會被運用于企業的會計信息處理中,也就是說當下的會計信息化,其本質是將會計知識與大數據處理進行結合,進而形成有利于企業會計資源處理的一種新型模式。在該模式下,企業能夠利用云計算對每天發生的業務進行相應的處理,包括因為業務而產生的憑證、資金流動等數據,最重要的是企業可以通過云計算來將企業的每一筆資金流動進行計算,為企業財務部門提供更為準確有效且具有時效性的數據,對于企業的生產銷售、產品定位等也能帶來極大的幫助。比如可以通過云計算來整合市場數據,為企業下一步的發展做出相應的戰略分析。云計算將傳統的個人電腦和有私人數據中心的任務執行方式轉變為具有專業計算存儲功能的大型專業計算中心。這樣一來,也就強有力地實現了計算機軟件、硬件等計算資源的充分整合以及共享,使計算機軟、硬件之間的資源高度共享成為一種可能,為企業的發展提供便利,讓計算機中的私人數據與網絡中的共享數據進行有效的整合,使這些數據充分發揮其作用,更好地為企業生產、銷售等提供支撐力,為更好地服務企業提供了便利。

但是,大數據應用模式需要建立在企業擁有科學合理的數據以及企業財務人員懂得相應的計算機知識,能夠利用財務軟件進行數據處理這一基礎之上,要求財務人員逐步提升自身的綜合素質水平,將自身培養成綜合性的人才。而大數據應用模式也并非只針對財務方面的運用,還體現在企業的整體發展中,大數據應用模式能夠充分整合市場資源,對某一產品的銷售量、市場潛力進行合理的分析,幫助企業對下一季度的產品生產做出最精準的預測,進而幫助企業盈利。大數據建立在科學的分析基礎之上,其對于企業的發展具有重要的意義。由此,其應用范圍也極為廣泛。當下,大數據應用模式主要有以下幾種模式:(1)數據的出售模式。對一些時效性較強的數據進行保留,定期為各行各業提供相關的數據服務,這種應用模式需要建立在龐大的數據庫基礎之上。(2)信息的租售模式。這種模式通常集中在某一行業或領域,在大數據龐大的處理能力支持下,對信息進行廣泛的收集和有效的整合,將一些有價值的信息整理并向相應行業出售,以此來獲得回報。(3)數字媒體的模式。這一模式近年來也應用得越來越多,主要是指利用網絡媒體能夠進行快速廣泛的傳播和及時互動的能力,實時、快速、準確地捕捉到客戶群體,為客戶提供準確的數據信息服務,并獲得有效的反饋信息。(4)空間的運營方式。這個方式主要用于獲取更多的數據資源,以及對數據資源的獨占訪問。(5)云計算服務模式。其優勢是針對客戶可以定制個性化的服務,通常面向企業,是基于互聯網的動態虛擬化而提供的信息資源服務。這種模式下,企業無需花費大量的資金來購買基礎設備,更不需要對設備進行維護與安裝,這些專業的服務都將由云計算服務商來提供,只需要按照一定的方式來支付相應的租賃費用就可以對數據進行處理。這一方式不僅為企業節約了大量的資金,也為企業節省了更多的時間與人力。

通常情況下,數據應用需要與云計算相結合。Hadoop是目前大數據領域最為通用的技術平臺,也是Google云計算GFS的開源實現。這為數據的計算提供了一種計算框架,而此框架更是為現代企業云計算和數據處理模式的實際運用提供了新的可能性,能夠有效促進企業的發展,幫助企業朝現代化企業發展模式轉型,進而提升企業的綜合競爭力,讓企業以有效、及時、精準的數據來應對企業發展中可能會存在的各種風險。而其中最為核心的技術就是HDFS(Hadoop Distributed File System)以及MapReduce,企業在實際運用大數據應用模式時,需要明確這兩種核心技術的基本理論,然后將其落實于企業發展進程中。前者為大數據分析提供了高吞吐量的分析,而后者則是一種大型的數據分布式處理模型,由此可見,Hadoop為大數據的分析與處理提供了一個非常有效且可靠的信息存儲與分析系統,其是企業真正將大數據應用模式融入于企業生產、銷售的各個環節中的基礎條件,能夠助力于企業的現代化發展。當下,企業發展中運用大數據處理模式已經成為一種必然選擇,是企業在現代化發展過程中想要取得更高的利潤和拓展市場份額的必備條件,而在大數據的分析和處理中,將云計算與Hadoop相結合已經是一種必然的趨勢,當下的企業發展已經與云計算、Hadoop的實際運用產生了必然的聯系[2]。

2? 對大數據應用模式安全風險的分析

云計算將數據外包給云服務提供商并提供服務,該服務標準也允許數據所有權歸屬于CSP,在對物理資源的控制中,用戶失去了直接控制的主動權。通常,存儲在云端中的數據以合法的文本形式存在,而CSP有權控制底層數據,因此,惡意的CSP很可能會在用戶不知情的情況下竊取并篡改用戶的數據,使云計算平臺受到非法數據的控制,導致數據被非法讀取,這讓用戶和平臺的信息安全受到了威脅。這是大數據應用模式存在的安全風險之一[3]。

最初,在對Hadoop進行設計時,設計者并未考慮到相應的安全問題,在進行了多個版本的改進之后,Hadoop才有了基于ACL的訪問控制機制。但是,該實施方案仍然存在很大的安全問題,盡管已經增加了訪問控制策略,但安全形勢依然非常薄弱。因為在基于此策略的ACL控制被激活之后,才可以對ACL執行訪問控制,對其中相應的屬性進行匹配,其中包括限制用戶與組成員對資料進行訪問的節點通信。由此可以看出,這種過于依賴管理員的傳統控制機制很容易被篡改并且不易被察覺。由于ACL的訪問控制策略粒度過粗,很難對用戶的隱私字段進行保護,并且針對不同的用戶與不同的應用模式,訪問控制機制也需要定時修改,這種操作過于煩瑣且不利于維護。所以,Hadoop自帶的安全機制非常不完善。

2.1? 在不同應用模式下CAP和Uers帶來的安全風險

企業自身應用的Hadoop中,由于使用者為企業的各個員工,因此,企業外部人員無權訪問和使用這些數據與資料。而在非企業自身應用的Hadoop中,CSP被分為兩級,一組需要負責提供相應的基礎設施,另一組負責對Hadoop進行搭建與管理。當CSP存在權限過大的情況時,在用戶不知道的情況下,CSP就能獲取到用戶的數據,這就是CSP對用戶數據造成的威脅;當偽造用戶獲取到合法用戶的數據或惡意用戶對CSP提出非法請求時,也可以獲取用戶隱私數據,這便是用戶對CSP造成的威脅[4]。以Hadoop在不同的應用模式中數據可能受到的威脅點為例,如圖1所示,位置1和位置5處于相同的風險中。CSP可以通過位置1、3、4、5獲取數據,Hadoop文件格式也有多種類型,有些文件格式是二進制,所以這些文件可以被讀取。由于CSP對數據有絕對的控制權,所以很容易獲得物理磁盤的所需內容,以便進行讀取和分析。此外,CSP還可以使用超級用戶的身份特權,在用戶不知情的情況下對文件進行修改,并且可以通過位置1、2、5竊取所需的數據。非法用戶也可以相應地獲取和讀取數據,非法用戶一旦獲得合法身份,就會與合法用戶享有同等權利。它們可以在位置1和位置5發出請求,從datan-ODE獲取相應的數據,并在位置2輸出它們想要分析的數據。

2.2? 威脅模型

假設數據庫中所有的數據均是以客戶訂單日期等形式存在于數據庫中,且每個客戶都擁有一份相應的交易記錄,如果客戶想要得到某一個特殊日子里的訂單數目,客戶就可以通過Mapper來對數據進行讀取。比如記錄日期為D,那么對應的輸出鍵/值就是。K是一個字符串序列,reduce簡單地總結了所有與之相關的關鍵字K,并將結果輸出[5]。那么在這樣的情況下,商店面臨的主要風險之一是客戶提供的代碼不可靠,因此存在無意或惡意的缺陷,這將給商店帶來巨大的安全風險,使商店的信譽遭受影響,在商業上處于不利的地位,而輸出的結果也有可能遭到泄露。例如,客戶在程序中輸入了一個數據庫中并不存在的客戶沒通過對訂單數目進行修改,假設在訂單數目當中輸出100萬,否則輸出0,這就使客戶的隱私遭到了泄露。同時,也可能有黑客在平臺安全機制失效的情況下,獲得root權限讀取和銷毀數據,或是偽造和操縱數據等。

3? 安全策略

在當今大數據時代下,數據的價值變得越來越重要,數據的安全問題也變得越來越嚴重。由于大數據具有規模大,數據類型多,數據結構非常復雜的特點,因此,維護數據所需的資金成本也越來越高。在大數據應用模式下,如何以低成本來保護數據的安全變得尤為重要。對文件和系統的保護通常稱為數據服務安全保護,而對密鑰值和結果存儲內容的保護則稱為隱私保護。根據上文中提到的一些大數據應用安全風險,提出了以下解決策略。

3.1? 對CSP以及用戶的身份進行驗證

驗證CSP及用戶身份的完整性,Kerberos的雙向驗證功能可以保證使用雙方身份的安全性,這是一項在請求發起時的驗證。

3.2? 驗證平臺的安全性

除了要保障使用雙方的身份安全外,還需要對平臺的安全性進行驗證,平臺驗證可以通過使用可靠的計算技術方式進行,使用TPM技術創建一個可信任的云計算環境,并通過對平臺云計算環境的測量,建立從物理層延伸的信任鏈于虛擬化層,這樣就能夠最大限度地保證云計算的安全性。

3.3? 對行為請求進行監控

為了降低行為請求當中的安全風險,在數據使用過程中還需要對操作的請求進行實時監視。建立相應的非法操作監控機制可以確保監控這些非法操作的數據,降低數據的運算及輸出的安全風險。另外,LSM還可以建立相應的訪問控制策略,利用book函數監控內核調用,允許訪問合法數據,拒絕非法數據和不可靠行為,保證數據流與應用程序的主體一致。

4? 結語

文章對大數據的應用模式進行了闡述,分析了對云計算環境中使用Hadoop進行數據的存儲,也對云計算中Hadoop的不同應用環境進行了分析,在Hadoop的操作過程中,對不可信主體造成的安全威脅給予了相應的威脅模型,并且判斷風險主要來自于CSP以及數據的計算者。再加上通過CSP可以在用戶不知情的情況下盜取和篡改數據,這并不能夠保護客戶的隱私和數據的安全,所以,針對這些問題,也對CSP、用戶身份、平臺的安全進行驗證和對行為請求進行監控等提出了解決策略。

(責任編輯:侯辛鋒)

參考文獻:

[1]孫海勇,李青.大數據信息安全風險框架及應對策略研究[J].信息與電腦(理論版),2017(5):209-210.

[2]王帥,金華敏,沈軍,等.大數據應用安全方案及對策研究[J].廣東通信技術,2017(8):2-5.

[3]李依函,高寅生.大數據信息安全風險框架及應對方式探析[J].現代經濟信息,2018(21):320.

[4]楊子建,倪嬌嬌.大數據面臨的安全風險和對策研究[J].數字化用戶,2018(50):104.

[5]謝琦.大數據背景下個人信息安全風險及保護措施研究[J].網絡安全技術與應用,2018(3):57+76.

猜你喜歡
應用模式研究分析大數據
連翹在園林綠化中的應用模式初探
試析不動產登記信息管理基礎平臺建設思路與技術方法
電子書包在小學數學教學中的應用模式及成效探析
校園網絡安全的體系研究
淺談廣電光纖通信接入技術
關于變壓器高壓試驗技術的研究分析
基于大數據背景下的智慧城市建設研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合