?

基于神經網絡的入侵檢測系統的設計與實現

2023-07-17 14:27肖中峰何思熙

計算機應用文摘·觸控 2023年13期

肖中峰何思熙

摘要：入侵檢測系統可以及時發現和響應網絡攻擊，保護重要的數據和資源?；谏窠浘W絡的入侵檢測系統是一種利用神經網絡技術來賓現入侵檢測的方法，通過對現有攻擊方法和模式的模擬仿真，利用大量數據的訓練來學習特征和模式，并用于分類、識別和預測等任務。該方法具有一定的泛化能力和自適應能力．可以處理大規模和復雜的數據，提高檢測的準確率和魯棒性。文章基于遞歸神經網絡搭建了一個入侵檢測系統的框架并用NSL-KDD數據集做了訓練和測試。實驗結果表明，入侵檢測系統框架中的LSTM網絡架構表現最好，VAC，TAC，FIS分別達到了98.16%，84.76％，98.48%，可以滿足實際應用需求。

關鍵詞：循環神經網絡；入侵檢測系統；XGBoost；Softmax

中圖法分類號：TF393 文獻標識碼：A

１概述

入侵檢測系統（ＩｎｔｒｕｓｉｏｎＤｅｔｅｃｔｉｏｎＳｙｓｔｅｍ，ＩＤＳ）在計算機安全領域具有廣泛的應用，可以幫助受保護的單位及時發現和響應網絡攻擊，保護重要的數據和系統資源［１］。入侵檢測系統可以用于監控公司網絡［２］，也可以為其他公司提供軟件服務，如電子郵件、網站和應用軟件等［３］。雖然入侵檢測系統可以保護計算機系統和網絡安全，但也存在一些挑戰和不足。

例如，入侵檢測系統可能會產生誤報，即將正常的操作誤判為攻擊行為，或者漏報少報，無法檢測到真正的攻擊。入侵檢測系統還需要不斷更新和維護，才能應對新的攻擊技術和入侵模式。

２基于神經網絡入侵檢測系統

基于簽名的入侵檢測是最常見的檢測方法之一，它使用已知的攻擊簽名庫來識別網絡流量中的惡意操作。這種方法主要依賴于已知的攻擊模式和特征，因此只能識別那些已知的攻擊，并且需要經常更新簽名庫，以保持監測的全面性?；诰W絡行為的入侵檢測則是一種更加靈活的方法，它通過分析系統和網絡的行為來識別異常行為和攻擊。這種方法不依賴于已知的攻擊簽名，而是基于對正常系統和網絡調用行為的理解，通過檢測異常行為來識別潛在的攻擊?；谛袨榈娜肭謾z測可以識別新的未知攻擊，但也會產生較多誤報。除了基于簽名和基于行為的入侵檢測方法，還有一些其他的入侵檢測技術，如基于支持向量機的方法、神經網絡方法等。

基于神經網絡的入侵檢測系統是一種利用神經網絡技術來實現入侵檢測的方法。神經網絡是一種模仿人腦神經系統的計算模型，它可以通過對大量數據的訓練來學習特征和模式，并用于分類、識別和預測等任務。與傳統的入侵檢測系統相比，基于神經網絡的入侵檢測系統具有以下優點：對于新的未知攻擊，具有一定的泛化能力和自適應能力，可以識別和防范新的攻擊模式和類型；可以處理大規模和復雜的數據，可以自動提取和學習數據中的特征和模式，減少人工干預；可以通過多層網絡學習數據的高層次特征和抽象表示，提高檢測的準確率和魯棒性。但該系統也存在一些挑戰和限制。例如，需要大量的數據進行訓練和調優，如果數據質量不好或者數據不足，那么可能會影響檢測的準確率。此外，神經網絡具有一定的復雜性和計算資源需求，需要較高的計算性能和存儲容量。

基于上述問題，本文實現了一個使用機器學習技術的ＩＤＳ框架，該框架使用多種遞歸神經網絡（ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ，ＲＮＮ）和基于ＸＧＢｏｏｓｔ的特征選擇方法進行對比。為了評估所提出的ＩＤＳ框架的性能，本文采用了ＮＳＬ?ＫＤＤ基準數據集。實驗表明，與現有方法相比，本文提出的ＩＤＳ框架中的ＬＳＴＭ網絡架構表現最好。

３檢測系統基本流程及系統架構設計

３．１實驗數據及預處理

在基于神經網絡的入侵檢測系統中，通常會采用深度學習技術，使用多層神經網絡對數據進行處理和學習。一般而言，基于神經網絡的入侵檢測系統主要包含２個部分：訓練和測試。為保障入侵檢測系統的普遍適用性和穩定性，實驗數據需要選取具有代表性的數據集，實驗數據集應具有數據量大、攻擊類別全面、模擬性強以及能夠代表現實網絡攻擊行為的特點。本研究采用ＫＤＤ９９數據集的修訂版本ＮＳＬ?ＫＤＤ，利用該數據集模擬網絡環境，對不同類型的網絡攻擊行為進行仿真。數據預處理主要包含２方面：一是將數據集中的符號特征轉換成計算機能識別的數值型；二是經變換后的數據特征差別性較大，不利于模型訓練，在不破壞數據映射的情況下，需進行歸一化處理。

３．２ＬＳＴＭ網絡架構

ＲＮＮ能夠在不同的層之間循環，并且還能夠臨時存儲信息以供以后使用。標準ＲＮＮ的結構如圖１所示。ＮＮ表示標準神經網絡，ｘｐ表示輸入和ｈｐ是輸出。根據定義，ＲＮＮ被認為是深度神經網絡，因為有不同的層來處理信息。如圖１等號右側所示，展開的標準ＲＮＮ說明ＲＮＮ構造的深度。盡管標準ＲＮＮ在執行各種預測任務時有效，但它們確實存在梯度消失的問題。

為解決上述問題，本研究提出了一種新的ＩＤＳ框架。初始階段包括收集模型構建所需的數據。所提出的體系結構的第二層是數據處理和特征提取階段。

在這一步驟中，對特定數據集進行標準化，以確保所有分類屬性都正確編碼，所有數字特征都標準化。一旦數據集被清理和規范化，就應用ＸＧＢｏｏｓｔ算法。該過程生成包含特征重要性（ＦｅａｔｕｒｅＩｍｐｏｒｔａｎｃｅ，ＦＩ）值的向量，并且基于經驗選擇的ＦＩ閾值來選擇最佳特征子集。架構的第三層是模型構建階段。在這一階段，有３個主要的獨立操作，即訓練、驗證和測試。

標準ＲＮＮ、長短期記憶遞歸網絡（ＬｏｎｇＳｈｏｒｔＴｅｒｍＭｅｍｏｒｙ，ＬＳＴＭ）和門控循環單元（ＧａｔｅＲｅｃｕｒｒｅｎｔＵｎｉｔ，ＧＲＵ）的配置如圖２所示。第一層是輸入層，它輸入到ＲＮＮ／ＬＳＴＭ／ＧＲ深層的構造中。然后通過密集的ＮＮ層（可以是單層人工神經網絡（ＡｒｔｉｆｉｃｉａｌＮｅｕｒａｌＮｅｔｗｏｒｋ，ＡＮＮ）或多層感知器（Ｍｕｌｔｉ?ＬａｙｅｒＰｅｒｃｅｐｔｒｏｎ，ＭＬＰ））計算來自深層的信息。最后，通過Ｓｏｆｔｍａｘ（式１）用于多類分類配置，該Ｓｏｆｔｍａｘ激活函數返回一個向量，該向量包含相加為１的值，最高值表示預測的結果，表達式為：

３．３模型訓練及測試

在訓練階段，系統使用已知的攻擊數據和正常數據來訓練神經網絡，使其能夠學習到攻擊的特征和模式。這個過程需要使用大量的數據進行訓練，并對神經網絡進行多輪迭代訓練，以提高其準確率和魯棒性。在測試階段，系統使用已經訓練好的神經網絡對新的數據進行分類和預測。對于入侵檢測系統而言，新的數據就是系統中檢測到的網絡流量、日志數據和系統行為等。當新的數據經過神經網絡處理后，系統會根據輸出結果判斷數據是否屬于正常的行為或者是否存在入侵行為。

４實驗分析

４．１實驗環境和數據集介紹

本文使用Ｐｙｔｈｏｎ工具包Ｓｃｉｋｉｔ?Ｌｅａｒｎ和ＫｅｒａｓＭＬ及ＤＬ進行實驗，采用網絡安全數據集ＮＳＬ?ＫＤＤ訓練并測試網絡。

在硬件系統方面，所有模擬實驗均在Ｗｉｎｄｏｗｓ１０操作系統的ＤＥＬＬ?１５３０００上運行，處理器為：Ｉｎｔｅｌ（Ｒ）?Ｃｏｒｅ（ＴＭ）ｉ７?８５６８Ｕ。

ＮＳＬ?ＫＤＤ數據集包含大量的網絡流量數據和入侵攻擊數據，這些數據來自一個基于模擬的網絡環境。數據集中的網絡流量數據包括ＴＣＰ和ＵＤＰ協議的連接記錄和特征，入侵攻擊數據包括２２種不同類型的攻擊，如ＤｏＳ，Ｒ２Ｌ，Ｕ２Ｒ和ｐｒｏｂｅ等。同時，ＮＳＬ?ＫＤＤ數據集還包含大量的正常數據，可以用于建立入侵檢測模型的基準。ＮＳＬ?ＫＤＤ數據集共包含４個子集，分別是訓練集、測試集、２０％交叉驗證集和完整數據集。其中，訓練集包含１２５９７３個數據樣本，測試集包含２２５４４個數據樣本，２０％交叉驗證集包含２５１９２個數據樣本，完整數據集包含１４８５１７個數據樣本。

數據集中的特征包括４１個基本特征和１４個附加特征，涵蓋網絡連接的各個方面，如協議類型、源地址、目標地址、源端口、目標端口等。

４．２實驗結果分析

本文通過ＮＳＬ?ＫＤＤ數據集中的５個類來進行實驗驗證，使用Ｓｏｆｔｍａｘ激活函數的標準ＲＮＮ，ＬＳＴＭ和ＧＲＵ的分類方案的結果對比如表１所列。結果表明，３種網絡都是大約在隱藏層中使用１５０個ＲＮＮ單元時效果最佳，此時簡單ＲＮＮ網絡ＶＡＣ為９７．６４％，ＴＡＣ為８３．９４％，Ｆ１Ｓ為９７．９６％，并在１０８．３２ｓ內完成了訓練。關于ＬＳＴＭ方法ＶＡＣ為９８．６１％，ＴＡＣ為８４．７６％，Ｆ１Ｓ為９８．４８％，。在ＧＲＵ算法的實例中，ＶＡＣ為９８．４２％，ＴＡＣ為８４．６４％，Ｆ１Ｓ為９８．４５％，訓練時間為１４１．４４ｓ。通過對比可以看出，基于ＸＧＢｏｏｓｔ的ＬＳＴＭ分類器具有最好的效果。

５結束語

入侵檢測是一種重要的計算機安全技術，它是為了保護計算機系統和網絡免受惡意攻擊和未經授權的訪問而設計的，可以監控網絡和系統的活動，并檢測出不正常的行為和攻擊，幫助管理員及時發現和響應安全問題。本研究提出了一種ＩＤＳ框架的實現方案，該框架使用不同類型的ＲＮＮ技術以及基于ＸＧＢｏｏｓｔ的特征選擇方法做對比，并使用ＮＳＬ?ＫＤＤ數據集評估分類器的性能。實驗結果表明，在標準ＲＮＮ，ＬＳＴＭ和ＧＲＵ的分類方案的結果中，ＬＳＴＭ的效果最好，指標ＶＡＣ，ＴＡＣ，Ｆ１Ｓ分別達到了９８．１６％，８４．７６％，９８．４８％。在未來的研究中，我們還可能對多種網絡的混合方法進行研究。

參考文獻：

［１］劉海燕，張鈺，畢建權．基于分布式及協同式網絡入侵檢測技術綜述［Ｊ］．計算機工程與應用，２０１８，５４（８）：１?６＋２０．

［２］劉奇旭，王君楠，陳艷輝，等．對抗機器學習在網絡入侵檢測領域的應用［Ｊ］．通信學報，２０２１，４２（１１）：１?１２．

［３］古險峰．一種基于數據挖掘的網絡入侵檢測系統設計與實現［Ｊ］．河南科技學院學報（自然科學版），２０２０，４８（６）：５４?５８＋６７．

作者簡介：

肖中峰（１９９３—），碩士，助教，研究方向：計算機軟件、網絡安全、智慧城市。

何思熙（１９９５—），碩士，助教，研究方向：群體安全智能、人工智能。

計算機應用文摘·觸控2023年13期

計算機應用文摘·觸控的其它文章: 新工科背景下低代碼平臺在“大學計算機基礎”課程中的應用; 招投標在園林設計類課程中的創新應用; “計算機應用”課程的混合式教學模式研究; 教師在線學習的學習者畫像研究; 智慧教育理念下教學云平臺促進高校外語有效教學環境的構建與實踐; 基于OBE理念的“操作系統原理”一流課程建設的探索與思考

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合