?

基于神經網絡的P2P流量識別方法

2021-03-31 08:56王瑋
微型電腦應用 2021年3期
關鍵詞:漏報網絡流量徑向

王瑋

(陜西藝術職業學院 基礎教學部, 陜西 西安710054)

0 引言

對等(Peer To Peer)網絡P2P打破了傳統客戶端/服務器的模式,是新一代網絡技術,相對于其它網絡,P2P網絡的速度更快,因此成為當前應用范圍最為廣泛的網絡[1]。在P2P網絡的實際應用中存在許多問題,具體為:瘋狂搶占帶寬,擁塞概率大;存在大量的不良信息;網絡入侵和網絡病毒引起的安全問題等。為了保證P2P網絡安全,提高P2P網絡的性能和穩定性,需要對P2P網絡的流量進行監控,P2P網絡流量識別是網絡管理的基礎,高精度的P2P網絡流量識別方法構建是當前研究的熱點問題[2-3]。

為了獲得理想的P2P網絡流量識別效果,提出基于神經網絡的P2P網絡流量識別方法,并與經典P2P網絡流量識別方法在相同平臺進行仿真對比實驗,結果表明,本文方法可以描述P2P網絡流量的變化特點,P2P網絡流量識別精度更高,具有十分明顯的優越性。

1 P2P流量識別的相關研究工作

近些年來,國內外對P2P網絡流量識別進行深入研究,當前P2P網絡流量識別技術主要劃分為3類:基于端口號的P2P網絡流量識別技術;基于報文檢測的P2P網絡流量識別技術;基于特征的P2P網絡流量識別技術[4]。最初,由于P2P網絡的端口比較少,而且固定,但是一些應用程序為了防止端口檢測,其端口號采用動態方式進行分析,這樣基于端口號的P2P網絡流量識別結果就更為可靠;為了解決動態端口問題,出現了基于報文檢測的識別技術,具體為基于數據包的動態端口P2P網絡流量識別方法,但是該方法會涉及用戶的隱私問題,無法廣泛使用[5-7];基于特征的P2P網絡流量識別技術主要通過流量的上下行比例、數據包大小分布等進行,然后結合機器學習算法,如支持向量機、貝葉斯算法或決策樹等[8-10],通過訓練構建P2P網絡流量識別模型,但是在實際應用中這些機器學習算法均存在一定的不足,如支持向量機的訓練過程復雜,P2P網絡流量識別時間長;貝葉斯算法、決策樹的P2P網絡流量識別精度低[11-13]。

2 神經網絡的P2P流量識別方法

2.1 P2P網絡

傳統網絡通常采用客戶端/服務器的工作模式,其中服務器是整個網絡的中心,客戶端將任務發送給服務器,服務器對任務進行處理,因此服務器完成了大部分運行,其負擔相當重,工作效率難以提升,而P2P網絡弱化了服務器,每一個節點的地位是相同的,處于一種對等狀態,每個節點既是參與的使用者,也是任務的提供者,節點可以自由的加入或離開,不僅可擴展性強,而且具有較強的魯健性。P2P網絡的模式,如圖1所示。

圖1 P2P網絡的模式

2.2 P2P網絡流量特征選擇

選擇最優P2P網絡特征向量是建立性能優異的P2P網絡流量識別方法的一個重要方面,因為特征太多,那么使得P2P網絡流量識別模型的輸入向量數量大,P2P網絡流量識別效率低,同時一些特征向量之間有信息重復,使得它們之間相互干擾,對P2P網絡流量識別精度產生不利影響,本文基于特征差異性明顯、能夠識別出P2P網絡流量和非P2P網絡流量原則,選擇的P2P網絡流量識別特征,如表1所示。

表1 P2P網絡流量識別特征

2.3 神經網絡算法

徑向基神經網絡是一種最常用的人工神經網絡,通常為3層結構,具體為:輸入層、隱含層和輸出層,每一層根據實際的問題具有不同數量的節點,設它們的節點數分別為:n、p和m個,那么徑向基神經網絡拓撲結構,如圖2所示。

圖2 徑向基神經網絡的拓撲結構

徑向基神經網絡的基本工作步驟如下。

Step1:對于輸入向量Xl=[X1l,X2l,…,Xnl]T,通過徑向基函數φ(·)變換到隱含層,可以得到隱含層第i個節點的單元輸出,如式(1)。

(1)

徑向基函數φ(·)通常采用高斯函數,那么式(1)變化為式(2)。

(2)

式中,σ表示聚類中心的寬度。

Step2:將隱含層的輸出作為輸出層的輸入,通過連接權值wik得到輸出層的第k個節點的輸出,如式(3)。

(3)

2.4 神經網絡的P2P流量識別方法

Step1:分析P2P網絡的結構,提取P2P網絡流量識別特征。

Step2:采集P2P網絡流量識別特征值,并對特征進行歸一化處理,如式(4)。

(4)

Step3:采集P2P網絡流量數據,并對P2P網絡流量和非P2P網絡流量進行標記。

Step4:根據特征和標記的P2P網絡流量和非P2P網絡流量值建立學習樣本。

Step5:根據P2P網絡流量的特征向量數確定徑向基神經網絡的輸入層節點數,并根據一定的規則確定隱含層的節點數,根據P2P網絡流量的類型確定輸出層的節點數。

Step6:初始徑向基神經網絡的相關參數,如連接權值、聚類中心的數量等。

Step7:采用徑向基神經網絡對P2P網絡流量學習樣本進行學習,建立P2P網絡流量識別模型。

3 P2P流量的仿真測試

3.1 實驗方案

為了分析神經網絡的P2P網絡流量識別效果,選擇Andrew Moore提供的公共數據集作為實驗對象,其共有11個數據集,每一個數據集中有P2P網絡流量和非P2P網絡流量,每一個數據集選擇一定數量P2P網絡流量和非P2P網絡流量樣本,如表2所示。

從表2可以看出,相對于非P2P網絡流量,P2P網絡流量樣本數量相對較少,對于每一個數據集,根據3:1的比例形成訓練樣本集合和測試樣本集合,采用VC++ 編程實現P2P網絡流量識別實驗。

3.2 P2P網絡流量識別精度比較

選擇文獻[12]和文獻[13]的P2P網絡流量識別方法進行對比實驗,統計每一個數據集。不同方法的P2P網絡流量識別精度,如表3所示。

表2 P2P網絡流量識別的實驗對象

表3 不同方法的P2P網絡流量識別精度比較

對表3的P2P網絡流量識別精度進行對比和分析可以知道,本文方法的P2P網絡流量識別精度最高,每一個數據集的識別精度超過95%,相對于文獻[12]和文獻[13],本文方法的P2P網絡流量識別精度分別提高了8.70%和6.31%,獲得了更加理想的P2P網絡流量識別結果。

3.3 P2P網絡流量的虛警率和漏報率

對于一個P2P網絡流量識別方法,只有高精度的P2P網絡流量識別結果還不行,還要分析其P2P網絡流量的虛警率和漏報率。不同方法的P2P網絡流量的虛警率和漏報率如圖3、圖4所示。

圖3 不同方法的P2P網絡流量的虛警率對比

圖4 不同方法的P2P網絡流量的漏報率對比

從圖3、圖4可以看出,無論是P2P網絡流量的虛警率或者漏報率,本文方法更低,對比結果表明,本文方法的P2P網絡流量識別整體性能更優。

3.4 不同方法的P2P網絡流量學習時間對比

由于P2P網絡流量識別的計算性能也是重要的評價指標,因此統計不同方法的P2P網絡流量學習時間(秒,s),每一種方法進行5次學習實驗,如圖5所示。

圖5 不同方法的P2P網絡流量學習對比

從圖5的P2P網絡流量識別的學習時間可以看出,本文方法的P2P網絡流量學習時間要少于文獻[12]和文獻[13],從計算性能的角度分析,本文方法是最佳的P2P網絡流量識別方法,可以對大規模的P2P網絡流量數據進行分析。

4 總結

隨著P2P網絡應用范圍的不斷拓寬,應用類型日趨復雜多樣,給P2P網絡的管理帶來了一定的挑戰,為了更加精細的對P2P網絡進行管理,結合P2P網絡流量變化特征,提出了神經網絡的P2P流量識別方法,并通過具體P2P網絡流量數據實例進行了仿真測試,結果表明,本文方法是一種精度高、速度快的P2P網絡流量識別方法,并且P2P網絡流量識別結果的穩定性要優于當前其它P2P網絡流量的識別方法,具有十分廣泛的應用前景。

猜你喜歡
漏報網絡流量徑向
基于多元高斯分布的網絡流量異常識別方法
大數據驅動和分析的艦船通信網絡流量智能估計
淺探徑向連接體的圓周運動
RN上一類Kirchhoff型方程徑向對稱正解的存在性
基于PID+前饋的3MN徑向鍛造機控制系統的研究
一類無窮下級整函數的Julia集的徑向分布
AVB網絡流量整形幀模型端到端延遲計算
某市死因監測漏報的調查報告
各類氣體報警器防誤報漏報管理系統的應用
臨床乳腺檢查篩查乳腺癌中降低病灶漏報率的探討
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合