?

基于改進PSO算法優化SVR的信息安全風險評估研究

2024-04-15 17:27任遠芳牛坤丁靜謝剛
關鍵詞:參數優化粒子群算法風險評估

任遠芳 牛坤 丁靜 謝剛

文章編號? 1000-5269(2024)01-0103-07

DOI:10.15958/j.cnki.gdxbzrb.2024.01.16

收稿日期:2023-05-10

基金項目:貴州省省級本科教學內容和課程體系改革資助項目(2022&25);貴州省科技計劃資助項目(黔科合支撐[2023]一般371);貴州大學引進人才科研項目(貴大人基合字2022[21])

作者簡介:任遠芳(1987—),女,助理實驗師,碩士,研究方向:多媒體教室、教育技術、信息安全,E-mail:835705116@qq.com.

*通訊作者:任遠芳,E-mail:835705116@qq.com.

摘? 要:為改善信息安全風險評價的精確度,利用改進的粒子群算法,提出了一種新的優化回歸型支持向量機的信息安全風險評估方法。首先,通過模糊理論對信息安全風險因素進行量化預處理;其次,經過預處理后的數據輸入到回歸型支持向量機模型中;再次,利用改進的粒子群算法來優化和訓練回歸型支持向量機的參數,得到了優化后的信息安全風險評估模型;最后,通過仿真實驗對該模型的性能進行驗證。實驗結果表明,提出的方法能很好地量化評估信息系統風險,提高了信息安全風險評估的精確性,是一種有效的評估方法。

關鍵詞:信息安全;風險評估;模糊理論;回歸型支持向量機;粒子群算法;參數優化

中圖分類號:TP309

文獻標志碼:A

隨著網絡化和信息化的日益進步,網絡安全事件層出不窮。2021年1月3日,國外安全團隊cyble發現有人出售中國公民信息。緊接著,1月26日,巴西數據庫泄露。以上安全事件大都是違法分子利用一些系統的漏洞進行入侵和攻擊所導致的??梢?,如何保證網絡安全是長期以來的重要探討課題。近年來,針對網絡安全方面,新的法律法規、工作指南陸續發布。2021年8月,《中華人民共和國個人信息保護法》正式公布。2023年7月,中國信息安全測評中心發布了《安全可靠測評工作指南(試行)》。由此可見,做好安全事件的預防顯得尤其重要,也很有必要。信息安全風險評估是其中一種有效的預防方法。目前,對信息安全風險評估研究,引起了國內外不少學者的關注,對此提出了眾多評估方法。最為人們所熟知的有模糊數學[1]、馬爾可夫鏈[2]、BP神經網絡(BP neural network, BP-NN)[3]、小波神經網絡[4]等方法。但是由于以上的風險評估具有非線性、不確定、小樣本等特性,如果只采用以上某一種模型,會存在局限性,導致出現了不少問題。如僅采用模糊數學等傳統的數學模型進行評估,存在的問題有具有一定的局限性、缺乏自適應、操作較繁瑣、缺乏自學習等。而神經網絡雖然在非線性問題處理上有一定的優勢,但卻存在學習樣本多、易于陷入局部極小值、過擬合等缺點。通過引入支持向量機(support vector machine,SVM)[5],能夠很好地彌補神經網絡的不足,SVM已成功地應用于信息安全風險評估 [6]。因此,本文為了更好的對信息安全進行評估,引入了回歸型支持向量機(support vector regression, SVR)。為了保證SVR的性能,必須對其參數選取嚴格把控。為了獲取精確的、適宜的參數,又將引入了粒子群(particle swarm optimization, PSO)算法。這種算法本身的結構較為簡單,收斂速度快,屬于智能搜索算法。與此同時,也存在一些缺點,比如過于早熟,容易陷入局部最值等。

鑒于此,為了能夠精確地、科學地對信息安全進行評估,本文將模糊理論、改進的PSO算法和SVR這三者的優點相結合,提出了一種優化的SVR的信息安全風險評估模型。并通過模擬仿真實驗,驗證此模型的性能較好。實驗結果表明,該模型能夠精確地評估信息安全的系統性風險。

1? 信息風險評估

信息安全風險評估是指通過分析信息系統受到的威脅,從而識別信息系統的脆弱性,綜合評估信息系統的風險,并提出相應的防護對策和整改措施[7]。信息安全風險評估主要包括資產識別、威脅識別和脆弱性識別三個基本要素。對信息系統進行較為精確地安全風險評估時,確定其風險等級的一個重要過程就是計算風險值。計算風險值(value at risk,Var)的公式如下:

Var=G(A,T,V)=G(L(T,V),F(Ia,Va))(1)

式中,G為信息安全風險的計算函數;A為資產;T 為威脅;V為脆弱性;L為威脅利用資產的脆弱性造成安全事件發生的可能性;F為安全事件發生后造成的損失程度;Ia為安全事件所作用的資產價值;Va為脆弱性的嚴重程度。

通過對公式(1)分析可以得知,G是一個復雜的函數,反映的是非線性關系。信息安全風險值是信息風險評估的重要階段,對整個評估結果有重要影響。

2? 基于改進PSO算法優化SVR的信息安全風險評估模型

2.1? 輸入量的模糊處理

由于SVR只適宜處理定量數據,無法處理定性數據,而信息安全的風險因素具有主觀性、不易確定。將風險因素直接輸入SVR進行學習和訓練是不合適的。因此,本文要量化風險因素,可采用模糊理論對其做量化處理,將處理后的數據作為SVR的輸入。具體的實現步驟如下[8]:

1)建立影響信息系統的因素集合。對信息系統的資產、威脅和脆弱性展開分析,找出影響信息安全的風險因素。并將影響因素組成一個集合,即信息系統的影響因素集U={u1,u2,…,un}。

2)應用德爾菲法進行風險評價時,必須對風險因素進行分析,并將其分為m級,評判集為V={v1,v2,…,vm}。

3)構建隸屬度矩陣R。通過專家組成的評判小組評價,根據專家意見,構造出的模糊映射如下:

f:U→F(V)(2)

ui→f(ui)=(ri1,ri2,…rim)∈F(V)(3)

其中,f表示風險因素ui隸屬于某個評語的概率;F(V)表示評判集V上的全體模糊集。

假設風險因素ui對評判集V的隸屬向量為Ri={ri1,ri2,…,rim} (i=1,2,…,n)。由隸屬向量Ri可以求得隸屬度矩陣R。

4) 對評判集V中的各評價指標,賦不同的權重[9]。假設權重分配集為A={a1,a2,…,am},權重是按照評語的高低進行分配,并且權重的總和為1,即∑mi=1ai=1。由模糊變換公式計算可以得到:

B=ART(4)

其中,B表示各信息安全風險因素在某一指標下的權重,反映了風險因素的評價值,并且其值的大小處于(0,1)之間,可以作為SVR的輸入量。

2.2? 改進后的PSO-SVR模型

2.2.1? SVR模型

支持向量機不僅能解決分類問題,而且能進行回歸擬合等,具有廣泛的應用前景。支持向量機是將 SVM用于回歸估計的一種方法。

支持向量機在回歸估計方面的應用就是SVR模型。假設具有m個樣本的樣本數據集為{(xi, yi), i=1,2,…,m},其中,xi=[x1i,x2i,…,xki]T為第i個樣本的輸入列向量,yi為輸出值。SVR的基本原理是利用一種非線性映射(也就是輸入空間到輸出空間),把輸入數據x映射到高維特征空間E,然后進行線性回歸。其線性回歸函數的公式如下:

f(x)=w·Φ(x)+b(5)

其中,b、w分別表示為偏置量、超平面的權值向量。一般情況下,SVR的損失函數為線性不靈敏損失函數,其函數的表示如下:

Lε=f(x)-y-ε,f(x)-y≥ε

0,f(x)-y<ε (6)

其中,f(x)、y分別表示為回歸函數的預測值、真實值。

在回歸函數中,對 w,b的估計可以通過使目標函數最小化來獲得,其公式如下[10]:

min{12‖w‖2+C∑mi=1(ξi+ξ*i)}(7)

s.t.yi-w·Φ(x)-b≤ε+ξi

w·Φ(x)+b-yi≤ε+ξ*i

ξi≥0,ξ*i≥0(8)

其中,C表示懲罰因子。其值越大,即會對大于Lε的數據懲罰越大。ξi和ξ*i表示松弛變量,ε規定了回歸函數的誤差要求。

可引入拉格朗日函數,將其轉化為對偶形式,如下所示:

max[-12∑mi=1∑mj=1(αi-α*i)(αj-α*j)K(xi,xj)-

∑mi=1(αi+α*i)ε+∑mi=1(αi-α*i)yi](9)

s.t.∑mi=1(αi-α*i)=00≤αi≤C0≤α*i≤C (10)

其中,K(xi, xj)表示核函數;αi和α*i表示拉格朗日乘子。

根據如上的對偶計算公式,可求得回歸函數,如下:

f(x)=∑mi=1(αi-α*i)K(xi,x)+b(11)

在SVR模型中,其泛化能力、預測精密度與選擇的參數密切相關。參數優化本身就是一個不斷尋找優化解的過程,可采用群智能優化模型對參數進行優化,由此得到SVR模型的最優參數。本文構建的SVR模型包含的參數屬于徑向基核函數的一部分,其中懲罰因子C和核參數σ對該模型的影響最為重要。通過參數優化,尋求最佳參數,并將優化后的模型用于評估信息安全風險程度,以提高評估的精確性。

2.2.2? PSO算法

PSO算法[11]是由Kennedy 、Eberhart 提出的優化算法。這個算法主要是用來求解最優化問題的,它的基本原理是群智理論,其基本思路為將待求解的問題設為一組解,并將其描述為一組粒子,以每組粒子中的每個粒子為一種可行解。每個粒子的極值Pbest代表它所經過的最佳位置,即尋找到的最優解。粒子群體全局極值Gbest代表當前整個粒子群中最好的粒子位置,也就是當前群發現的最優解,粒子在所求解的空間內作運動,通過追蹤Pbest和Gbest來更新個體的位置,每一次粒子的位置發生變化,都需要計算出相應的適應度,將計算出的新粒子與Pbest、Gbest這三個適應度值相比較并更新Pbest和Gbest。粒子i更新速度和位置的公式如下:

vij(t+1)=wvij(t)+c1R1(pij(t)-xij(t))+c2R2(pgj(t)-xij(t)) (12)

xij(t+1)=xij(t)+vij(t+1)(13)

其中,i = (1, 2,…,n);j = (1, 2,…,D);n表示粒子的個數;D表示搜索空間的維數;vij表示粒子的速度;xij表示粒子的位置;w表示慣性權重,為常數;c1和c2表示學習因子;R1和R2為[0, 1]之間的隨機數;pi表示粒子i的最佳位置,pg表示整個群體中所有粒子i的最佳位置。

2.2.3? 優化后的SVR參數

標準PSO算法存在一定的缺陷,一是容易出現過于早熟且收斂;二是非常容易陷入局部的最優解。為了解決該算法的以上問題,需改進PSO算法。通過遺傳算法中的交叉操作可以讓后代粒子繼承雙親粒子的優點,增強對粒子間的區域搜索能力。而遺傳算法的變異操作則可以增加粒子的多樣性,可以使粒子避免早熟收斂,能夠更好地找到全局最優解。為此,本文將遺傳算法的交叉操作以及變異操作引入到PSO算法中,對PSO算法進行改進。采用改進的PSO算法對SVR的參數進行優化選擇,構建改進的PSO-SVR模型。并將該模型應用于信息安全風險評估。

改進的PSO算法優化SVR參數的具體實現步驟如下:

1) 初始化。首先,隨機產生 M個粒子,其中每一個粒子都包含C、σ這兩個參數。假設需求解的總體樣本集(即種群),簡稱為U。需初始化如下參數:粒子的初始速度vi;粒子的初始位置xi;算法的最大迭代次數N;收斂精度δ。

2) 對每個粒子進行解碼,并將其用作SVR的訓練參數,進行學習,訓練樣本。最終求出各粒子的適應度,它的適應度函數,是一個與所有樣本量的誤差平方和倒數的線性函數。如公式(14)所示。由此可知,若誤差較小,那么相應的適應度值就較大,即適應性就較好。

F=k∑Hi=1(ti-yi)2+d(14)

其中,F為適應度函數;k、d都為常數;H為樣本的個數;yi表示為SVR的預測風險值;ti表示為實際的風險評估值。

3) 種群每次更新后,求出粒子群的平均適應度值Favg,如公式(15)所示。將適應度值大于或者等于Favg的適應度值求平均得到F′avg。將適應度值小于Favg的適應度值求平均得到F″avg。將種群U分成3份。適應度值大于或者等于F′avg的粒子為子種群U1,適應度值小于F′avg并且大于或者等于F″avg的粒子為子種群U2,適應度值小于F″avg的粒子為子種群U3。

Favg=1M∑Mi=1Fi(15)

4) 引入遺傳算法的操作。由于子種群U1具有較優的適應度,使用公式(12)和公式(13)來更新粒子的速度和位置。通過應用遺傳算法,對子種群U2進行交叉操作,隨機地進行兩兩交叉配對,同時利用交叉概率pc來進行交叉操作。

5) 對粒子i和粒子j的速度進行交叉操作的公式如下:

vi(t+1)=θ1×vi(t)+(1-θ1)×vj(t)vj(t+1)=(1-θ1)×vi(t)+θ1×vj(t) (16)

對粒子i和粒子j的位置進行交叉操作的公式如下:

xi(t+1)=θ2×xi(t)+(1-θ2)×xj(t)xj(t+1)=(1-θ2)×xi(t)+θ2×xj(t) (17)

其中,θ1和θ2為[0, 1]之間的隨機值。經交叉操作后,將子代和父代的粒子的適應度進行對比,選擇適應度較高的粒子進行后續迭代。對于適應度較差的子種群U3,利用變異概率pm對其進行變異操作。

6) 更新個體極值與群體全局極值。經過步驟4)的操作后,將計算出的新粒子與Pbest、Gbest的適合度值進行對比。當新粒子比Pbest的適應度更好時,就會對原Pbest進行更新,并對Pbest進行優先位置賦值。

7) 進行重復迭代。重復上述步驟2)到步驟5),直至下列條件得到滿足(即目標函數達到收斂精度δ或者迭代次數達到預設的最大次數N),結束迭代。通過以上多次訓練,就可得到SVR的最優參數。

綜上所述,基于改進的PSO算法優化SVR信息安全風險評估流程圖,如圖1所示。

3? 仿真實驗與結果分析

3.1? 數據選樣及預處理

本論文以MATLAB R2009a為軟件平臺,應用 lib svm工具箱函數,對SVR模型進行構建、訓練和仿真。為了獲得更好的比較評估效果,通過BP-NN、SVM、PSO-SVR和改進的PSO-SVR評估模型,分別進行信息安全風險評估。模型的評價指標為平均相對誤差。平均相對誤差定義如下:

ARE=1l∑li=1ti-yiyi(18)

其中,l為測試樣本的個數;yi表示為第i個樣本的實際評估值;ti表示為第i個樣本的預測值。平均相對誤差值越小,說明模型的預測誤差越小,預測精度越高,評估的準確性越高。

本文實驗收集60個信息系統的評估案例。選取未授權訪問(X1)、數據泄露(X2)、信息篡改(X3)、信息丟失(X4)、拒絕服務(X5)、系統功能崩潰(X6)作為信息系統的風險因素。每個因素的風險值是經過上述的模糊理論處理得到的。系統的風險評估值是對信息系統進行綜合評估得到的。以下實驗數據(其中各因素值四舍五入,取一位小數顯示在表格中;評估值取四位小數)是運用模糊理論進行預處理得到的,其具體步驟是[8]:

Step1:構建影響信息系統的影響因素集為U={X1,X2,X3,X4,X5,X6}

Step2:由專家進行評價,結合所有專家的評語,將專家意見分為五個等級,即{ 較低(0.0~0.2),低(0.2~0.4),中(0.4~0.6),高(0.6~0.8),較高(0.8~1.0)} ,簡稱為{LL,L,M,H,HH}。其中,數值大?。ɡ?.0~0.2)表示該因素的風險程度,數值越大風險越大。由5位經驗極其豐富的專家對以上各指標評分,最終得到以下的評分情況,如表1所示。

Step3:根據表1得到評估指標的隸屬度矩陣D。

D=0.1? 0.2? 0.3? 0.20.4? 0.3? 0.5? 0.30.2? 0.4? 0.5? 0.20.3? 0.2? 0.4? 0.20.2? 0.2? 0.3? 0.10.2? 0.3? 0.2? 0.0

Step4:對評判集中的每個指標賦予權重值,將評價向量數量化。根據相關資料[12],構建權重分配集

A=[925,725,525,325,125]。由式(2) ,得到風險評價值B=[0.2,0.3,0.4,0.2,0.4]。

Step5:對本實驗的所有原始數據都進行如上處理,最終得到本文的實驗數據。表2為訓練樣本數據其中的5組樣本數據。

Step6:采用6個風險因素的風險值作為輸入變量,系統的風險評估值作為輸出變量。將收集到的60組樣本數據分為訓練樣本集和測試樣本集。選取前面55組數據作為訓練樣本集,后面5組數據作為測試樣本集。其中,測試樣本數據如表3所示。

3.2? 參數設置

在本文實驗中,SVR模型的核函數為徑向基核函數,其公式如下:

K(x,xi)=exp(-‖x-xi‖2σ2)(19)

SVR具體類型為ε-SVR。設置損失函數的值為0.01。懲罰因子C的取值范圍為[0.1,100],核參數σ的取值范圍為[0.01,10]。

BP-NN采用輸入層(6個節點數),隱含層(11個節點數),輸出層(1個節點數)的網絡結構。動量項系數η=0.7,學習率μ=0.01。隱含層、輸出層這兩層的傳遞函數分別為Sigmoid型正切函數tansig、purelin函數。

PSO算法的種群數量M=40,學習因子c1=1.5,c2=1.6,慣性權重w=0.7,最大迭代次數N=200。改進的PSO算法中交叉操作使用的交叉概率pc=0.4,變異操作使用的變異的概率pm=0.06。

3.3? 實驗結果分析

在 SVR中輸入訓練樣本集合,再利用PSO算法及改進的PSO算法對這些樣本進行訓練,得到最佳的優化參數(如表4所示)。最后分別采用BP-NN、SVM、PSO-SVR和改進的PSO-SVR評估模型,對5組試驗樣本集數據進行檢驗。各模型的仿真結果、相對誤差比較,分別詳見表5、表6。

從表5和表6的仿真結果比較可得出以下結論,相比BP-NN、SVM、PSO-SVR評估模型,本文采用的改進的PSO-SVR評估模型的平均相對誤差MAPE分別減小了55.11%、46.86%、24.76%。由此表明,改進后的 PSO-SVR評估模型不但降低了對風險評價結果的預測誤差,而且還提高了對風險評價結果的預測精度和準確性。

4? 結束語

本文使用改進的PSO算法優化SVR,提出一種基于改進PSO算法優化SVR的信息安全風險評估方法,并引入信息安全風險數據進行仿真實驗驗證。仿真實驗結果表明,該評估方法能很好地評估信息系統風險,能較好地預測風險。這種方法不但提高了信息安全風險評估的精確性,而且在一定程度上預防了潛在的信息安全風險,降低了網絡攻擊帶來的損失。

參考文獻:

[1]孫德紅, 王慧, 解姍姍. 模糊數學計算的信息安全風險評估模型研究[J]. 九江學院學報(自然科學版), 2018, 33(1): 64-68.

[2] 李鶴田, 劉云, 何德全. 基于Markov鏈的信息安全風險評估模型[J]. 鐵道學報, 2007, 29(2): 50-53.

[3] 李森宇. 基于改進神經網絡的信息安全風險評估方法研究[D]. 徐州: 中國礦業大學, 2018.

[4] 馮雪峰, 龔軍, 呂小毅. 模糊神經網絡信息安全風險評估方法在信息系統中的應用[J]. 現代計算機(專業版), 2018(24): 50-54.

[5] LIN S W,YING K C,CHEN S C, et al. Particle swarm optimization for parameter determination and feature selection of support vector machines[J]. Expert Systems with Applications, 2008, 35(4): 1817-1824.

[6] 黨德鵬, 孟真. 基于支持向量機的信息安全風險評估[J]. 華中科技大學學報(自然科學版), 2010, 38(3): 46-49.

[7] 阮慧, 黨德鵬. 基于RBF模糊神經網絡的信息安全風險評估[J]. 計算機工程與設計, 2011, 32(6): 2113-2115.

[8] 王鑫, 唐作其, 許碩. 基于模糊理論和BRBPNN的信息安全風險評估[J]. 計算機仿真, 2019, 36(11): 184-189.

[9] ZHAO D, WANG C, MA J F. A risk assessment method of the wireless network security[J]. Journal of Electronics, 2007, 24(3): 428-432.

[10]吳景龍, 楊淑霞, 劉承水. 基于遺傳算法優化參數的支持向量機短期負荷預測方法[J]. 中南大學學報(自然科學版), 2009, 40(1): 180-184.

[11]紀震, 廖惠連, 吳青華. 粒子群優化算法及應用[M]. 北京:科學出版社, 2009.

[12]陳曼英. 基于模糊理論的地鐵火災風險評估及控制研究[D]. 泉州: 華僑大學, 2013.

(責任編輯:于慧梅)

Research on Risk Assessment of Information Security Based on

SVR Optimized by Improved PSO Algorithm

REN Yuanfang*1, NIU Kun2, DING Jing3, XIE Gang4

(1.Network and Information Management Center, Guizhou University, Guiyang 550025, China; 2.Academic Affairs Office of

Guizhou University, Guiyang 550025, China; 3.School of Computer Science and Technology, Guizhou University, Guiyang 550025, China;4.Guizhou Sida Wisdom Education Technology Co., Ltd.,Guiyang 550025, China)

Abstract:

To improve the accuracy of information security risk assessment, a method of information security risk assessment based on support vector regression (SVR) optimized by improved particle swarm optimizatio (PSO) algorithm is proposed. First, the indexes of information security risk factors are pre-treated by fuzzy theory, and the pre-treated data is inputted to the SVR model. Then, the improved PSO algorithm is used to optimize the parameters of SVR. Moreover, the SVR model is trained and an optimized information security risk assessment model is obtained. Finally, the performance of the model is verified by the simulation experiment. The experimental results show that the risk of information security can be better quantified and the accuracy of information security risk assessment is increased by the proposed method. So, the method is an effective method.

Key words:

information security; risk assessment; fuzzy theory; support vector regression; particle swarm optimization algorithm; parameter optimization

猜你喜歡
參數優化粒子群算法風險評估
電力市場交易背景下水電站優化調度研究
基于神經網絡的動力電池組焊接參數優化研究
基于粒子群算法的產業技術創新生態系統運行穩定性組合評價研究
研究LTE與WCDMA系統間小區互操作與參數優化
基于磁流變技術的汽車發動機隔振系統的參數優化
我國養老保險基金投資運營的風險評估
現代風險導向審計局限性及其對策研究
中小企業財務管理問題研究
交通堵塞擾動下多車場車輛路徑優化
車輛調度問題的全局—局部最優信息比粒子群算法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合