?

基于大數據運維系統的設計及應用

2024-02-03 08:52
信息記錄材料 2024年1期
關鍵詞:數據系統分析法運維

康 峰

(寧夏職業技術學院 寧夏 銀川 750021)

0 引言

我國信息化建設的發展促進了信息技術在多個工作領域得到了廣泛的應用,并且各個領域在利用大數據信息資源時,在一定程度上優化了各個領域工作中運行設備的管理工作的方式[1]。 當前運維計算主要采用的是傳統的能力分散化、管理集中化的方式進行構建的,這種方式在一定程度上增加傳統運維工作的難度[2]。 大數據系統運維的核心技術主要是通過信息系統對數據的監控的分析來對系統運行風險進行評估,而傳統的神經網絡識別分析法、層次分析法以及風險矩陣等風險評估方法,在當前信息系統硬軟件系統增加的背景下,已經無法滿足運維的需要[3]。 因此,文章基于大數據以及數據包絡分析法和最小二乘支持向量機(least squares support vector machine,GA?LSSVM)研究和設計了一種大數據系統運維系統,通過提供月內風險評估的精度,達到大數據資源優化管理的目的,保障大數據系統平穩運行。

1 系統設計思路

在當前大數據系統變化復雜的背景下,大數據云計算應用的程度越來越高[4]。 也就是說,設計運維系統需要確定信息系統的類型規劃以及相關資源的管理工作,為大數據擴容的管理提供更好的服務器支撐,針對不同類型的數據進行多樣性數據的保存,將全部數據一同寫入Hadoop集群中,更進一步地分析和收集系統中采集到的各類數據。 利用數據包絡分析法和GA?LSSVM 對其進行綜合風險評估[5]。

2 系統框架

2.1 采集模塊設計

隨著大數據時代的硬軟件系統更新升級,原先采用單一性的信息分析系統很難滿足當前存在的大數據系統良好運行的信息。 因此在構造大數據運維系統的過程中,需要采用分布式信息采集方案,提升系統的硬件維護信息采集建設。 根據采集到的信息,有針對性地對大數據系統硬件上設計運行提供良好的運維方案。 同時,大數據系統中對相關軟件的運維建設需要針對現實所有信息進行分布式處理。 也就是同時數據采集模塊,采集大數據系統在運維過程中遭受攻擊的所有信道信息,并且根據采集的攻擊信息特征,確定大數據系統的攻擊類型[6]。

2.2 信息儲存模塊

構建大數據運維系統,需要構建信息儲存模塊,將采集模塊收集到的攻擊類型的數據,以及硬件設備運行狀態和性能數據等,實現對各類數據良好儲存的效果,建立的數據存儲模塊需支持運維系統正常運行過程中調用各類信息。 在該模塊設計中,通過建立結構化查詢語言(structured query language,SQL)數據庫,可以保障數據儲存模塊良好的性能[7]。 針對不同類型數據以及不同因軟件功能、運行作用和目的以及運作對象方面產生的不同數據,有針對性地設計各個模塊的信息存儲模塊[8]。

2.3 風險評估模塊

根據前期采集并儲存的數據信息,構建大數據運維系統中的風險評估分析模塊。 在該數據風險評估模塊中,利用數據包絡分析法以及GA?LSSVM 設計并構建風險評估模型[9]。 通過模型評估測試的風險評估平均值絕對誤差以及均方根誤差來檢測該數據風險評估模塊的可靠性,具體的風險評估模塊設計流程如圖1 所示。

圖1 數據運維風險評估模塊流程

通過數據采集模塊對大數據系統硬軟件系統運行的相關數據,分析并確定風險評估系統的相關指標。 基于數據包絡分析法來分析大數據系統運行過程中存在的數據權重指標,將其作為GA?LSSVM 分析的樣本,如式(1)所示。

根據遺傳算法對相關數據進行優化,對其參數和核函數參數進行優化設計,將徑向基函數作為GA?LSSVM 計算的核函數,通過GA?LSSVM 算法構建其最優化的決策函數。 最后,在決策函數的優化基礎上對大數據系統運行性能、狀態、作為評價,并且輸出相應的評價值。 根據輸出的風險評價值來進行風險的等級評定,根據風險等級確定大數據系統運行是否存在風險,從而提升運維系統的有效性。

2.3.1 模型構建基本流程

風險等級的評定模塊需要確定運維風險的等級,以及風險指標的權重進行計算,將大數據系統運行過程中存在的風險等級劃分為Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ共5 個等級風險等級,數字風險意味著風險等級越高,具體的風險權重值區間如表1 所示。

表1 大數據系統風險等級劃分

根據表1 提供的風險等級權重值分布評估表,對采集的數據進行計算分析計算后對其風險等級進行評估。

根據數據包絡分析法結合層次分析法(analytic hierarchy process,AHP)對大數據系統運維的風險指標權重進行評估根據公式(2)來判斷該矩陣中的指標是否為最優值。

式(2)中,pij,qkj分別表示的是第j 個決策單元的第i種輸入量以及第j 個決策單元的第k 種輸出量。 而pij0,qkj0則表示兩者中間的最優化的權重值,n 表示評價數據的數量,其中包含的input 以及output 指標為s,o。 根據式(2)優化處理后得到公式(3)。

根據式(3)輸入決策最優化目標后,計算出input 以及output 的風險權重指標,輸入的指標進行優化后,利用1 來代替輸入指標,由此構建出新的數據包絡分析模型,如式(4)所示。

式(4)中,θα及βα分別表示的第α個指標的權重值,將評價矩陣決策單元的輸出值代入式(4)即可以得出大數據系統的風險評估指標權重。

2.3.2 風險評估模型參數優化

計算出的風險評估權重指標作為輸出數據集對其進行風險評估,利用GA?LSSVM 將不等式約束轉換為等式約束實現風險評估目標。 將GA?LSSVM 作為正則化參數c以及核函數參數σ 作為風險評估模型的決定性參數,來提升大數據運維系統風險評估的可靠性。 具體的參數優化流程如圖2 所示。

圖2 基于遺傳算法的LSSVM 參數優化流程

由圖2 可知,對兩個參數實施編碼處理,獲得初始種群,預設遺傳算法進行代數上限值、交叉處理和變異的概率來確定函數的適應度,得出最終個體的適應度。 并且根據結果判斷算法是否符合終止條件,對于不符合終止條件的部分重復迭代進行選擇、交叉、變異等操作,直到最終輸出的權重值符合終止條件為止。

2.4 信息展示模塊

將采集的數據信息、分析和更新評估過程中收集的信息利用信息傳遞方式將其展現出來。 利用可視化技術向外傳輸所有數據采集、分析、風險評估過程中出現的數據,以人機交互裝置將收集到的數據信息展示出來。 通過該模型選取的各類專業化信息,來了解大數據系統在運行過程中硬軟件系統內部或是外部存在的故障預警情況。

3 運維系統應用實驗

因為運維系統的重點是風險評估模塊,因此將重點對文章的風險評估模塊進行風險識別仿真實驗。 利用MATLAB 仿真平臺作為仿真實驗載體,以某企業大數據運行系統中產生的數據作為樣本,采用2022 年1—3 月的數據作為樣本a,4—6 月的數據作為樣本b,7—9 月的數據作為樣本c,以及10—12 月的數據作為樣本d,以傳統的PSO?LSSVM 風險評估系統以及GA?LSAVM 系統進行對比實驗。

3.1 結果分析

根據仿真實驗得出實驗結果,如表2 所示。 通過數據統計結果可以看出樣本1 的風險評估值低,不存在風險,與企業的運維的實際情況相符,由此可見,文章設計的運維系統風險評估模塊的提供的評估數據準確度夠高。

表2 風險評估結果

3.2 風險評估誤差分析

利用平均絕對誤差、均方根誤差評價系統作為該系統風險評估性能的評價標準,對3 種評估系統進行對比,得出三個系統的風險評估誤差結果,如圖3 所示。

圖3 三個系統風險評估誤差對比

由圖3 可以看出文章構建的大數據運維分析評估模塊的評估計算出的風險評估誤差值小,評估結果的可靠性和精度較高,與其他兩個系統的風險評估結果相比效果較好。

3.3 大數據運維系統應用

該運維系統對大數據系統在運行過程中產生的初始數據進行采集、分析和完成隱蔽信道的發掘,對于攻擊方的攻擊行為形成攻擊特征日志。 通過提供的攻擊日志信息以及其他相關的硬軟件系統的故障預警信息進行專業化的分析,通過信息展示模塊,把采集的數據和各個系統和硬軟件的數據利用人機交互技術展示出來,讓運維人員充分了解大數據系統的運行情況。 有針對性地開展運維工作。

4 結語

綜上所述,文章構建的大數據運維系統主要由信息的采集、數據的存儲、風險評估以及信息可視化等多個模塊構成。 對于這幾個模塊的設計和裝配都需要以大數據云計算的技術作為支持,才能有效提升數據運用的能力,持續保障大數據運維系統運行的平穩性,使運維系統在運行過程中保持較高的性能。 系統中的風險評估模塊是該系統的關鍵,是運維系統工作的重要支持,基于數據包絡分析法以及GA?LSSVM 技術保障了運維系統風險評估的準確性。 將數據包絡分析法引入風險指標權重計算,降低了層次分析法的主觀性,以此獲得的風險評估權重計算指標更加完整、精確,在一定程度上提升了運維系統提供數據的精準度,為后運維工作提供良好的參考。

猜你喜歡
數據系統分析法運維
異步機傳統分析法之困難及其克服
運維技術研發決策中ITSS運維成熟度模型應用初探
基于Spark的高速收費站大數據系統的設計與實現
基于計算機軟件開發技術的物聯網數據系統
風電運維困局
雜亂無章的光伏運維 百億市場如何成長
基于時間重疊分析法的同車倒卡逃費探析
非均勻采樣數據系統的新型模型描述方法
層次分析法在SWOT分析法中的應用
基于ITIL的運維管理創新實踐淺析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合