?

數據挖掘技術在計算機網絡病毒防御中的應用分析

2015-03-21 00:30欒志福
赤峰學院學報·自然科學版 2015年15期
關鍵詞:數據源數據挖掘預處理

欒志福

(濰坊科技學院,山東 濰坊 262700)

在當前計算機網絡實際應用過程中,網絡病毒已經成為人們正常使用計算機網絡的一個重要問題.在運用計算機網絡過程中,應當選擇科學有效技術對計算機網絡病毒進行防御,防止其對計算機網絡造成威脅以及破壞.數據挖掘技術運用在網絡防御方面起到十分重要作用,使計算機網絡安全性得到大大提高,從而使計算機網絡得到更好應用[1].

1 計算機網路病毒及數據挖掘技術

1.1 計算機網絡病毒的特點

第一,病毒傳播方式較廣泛且擴散較快.網絡病毒與網絡之間是緊密結合的,計算機病毒利用多種途徑對計算機網絡蓄意進行破壞以及入侵,對其計算機網絡病毒,其重要傳播方式主要包括不良網頁、系統漏洞以及電子郵件.

第二,網絡病毒具有較強的破壞性.一般情況下,我們所了解的網絡病毒均是依賴其他相關技術得以存在的,像黑客技術與木馬技術等等,這類型病毒具備十分強烈的破壞力.該類類病毒所表現出特點往往為混合型,網絡運行環境中要發現是十分困難的.此類病毒極有可能導致計算機內部儲存的重要信息非法外泄,丟失重要數據甚至造成計算機系統癱瘓等惡劣后果,會在極大程度上破壞計算機網絡的穩定性與安全性.

第三,病毒有很多種類,并且在變化方面比較快.對于目前網絡病毒,大部分都很容易進行制作與生產,很多病毒的編寫借助的是高級程序,其他人若想重新編寫或者修改病毒非常容易,僅需要變換幾個簡單指令就能制造出許多新的病毒來,在種類上網絡病毒包含比較多,并且存在不確定性.

第四,病毒具有針對性.隨著現代網絡技術不斷發展計算機病毒生產目的也發生變化,對于傳統網絡病毒來說,無非就是病毒設計者想要表現自身具有較高的程序編寫技術,從另一層面來講,實質上體現的是個體心理扭曲對社會造成的負面影響.但隨著我國市場經濟以及社會的不斷發展與進步,病毒制造也不再僅僅為了展示個人所具備的較高編程能力,而具有更大的攻擊性,開始朝著商業盈利方向轉變,個體病毒程序編寫員企圖通過病毒入侵獲取非法利益.

1.2 數據挖掘技術

數據挖掘技術,顧名思義,指的就是運用數據分類、聚類以及分析方式,找出病毒數據之間存在的具體規律的這樣一種病毒防御技術.綜上所述,數據挖掘技術主要包括三個方面:準備數據、尋找規律以及表示規律[2].確定了數據挖掘模式之后,相關挖掘引擎便能夠在知識庫要求的依據上進行分析前期所收集到的數據,而后進行詳細分類,并從中找出數據之間所存在的特定規律,為后勤數據的分析提供依據.數據挖掘技術的重點內容便是預處理數據.預處理數據工作是數據挖掘的基礎階段,其處理效果直接影響后期數據分析的成效.預處理數據主要由鏈接數據、數據凈化、變量整合以及格式轉換等構成.數據挖掘步驟的整個過程十分復雜且繁復,不僅含有大量的規劃以及準備工作,同時還嚴格要求操作步驟.

1.3 網絡病毒攻擊及數據挖掘技術關系

對于計算機網絡病毒而言,其先感染主機,然后傳播并擴散病毒,在這一整個過程中,病毒首先應向用戶操作系統入侵,然后掃描用戶信息及用戶網絡中所存在其它用戶信息,然后進行破壞、竊取信息以及將其他用戶感染等一些操作.所存在這些異常行為能夠為應用數據挖掘技術提供支持.通過數據挖掘技術能夠抓取并分析網絡過程中數據,從而依據分析結果,對網絡中所存在異常問題及問題引發原因進行確定,從而幫助用戶選擇適當策略進行安全防護,對病毒進行阻止或者將其消除.

2 在計算機網絡病毒防御中應用數據挖掘技術可行性

為能夠使應用數據挖掘技術更好實現,應當進一步分析并了解網絡病毒傳播過程,從而將相關依據提供給數據挖掘技術的應用.比如計算機受到蠕蟲病毒感染,首先要做的工作就是掃描網絡上主機,該過程在對蠕蟲病毒檢測方面是十分關鍵的,與此同時在計算機預防系統建設方面屬于一個突破口.以數據挖掘技術作為基礎,將網絡病毒全新防御系統構建出來.通常情況下,其由以下幾個部分構成:數據源模塊,數據挖掘模塊,決策模塊,預處理模塊,規則庫模塊以及防御模塊.其工作原理為來源于網絡,向本地發送數據包在數據源形成之后,通過預處理模塊處理,并且記錄網絡信息傳輸病毒,并且對于今后性質相同病毒有免疫形成,一旦有非法入侵出現,便會有警報及時產生,并且將主機保護防御系統保護.

3 網絡病毒防御中數據挖掘技術的應用分析

3.1 數據挖掘技術組成

在網絡病毒防御中所建設數據挖掘技術主要包括五個模塊,即數據源模塊、數據挖掘模塊、規則庫模塊、預處理模塊以及決策模塊[3].以上所述五個模塊互相作用形成數據挖掘系統,并組成病毒防御系統.

第一,數據源模塊.數據源模塊的核心在于抓包程序.其所指的就是將利用網絡將所截獲的數據包輸送于主機.數據源模塊中有最原始的網絡數據包,數據包內存在包括與某個特定數據相關的數據結構.處于數據源模塊中的抓包程序接收數據包,而后將其移交給預處理模塊,實現數據的預處理目的.

第二,預處理模塊.預處理模塊是對數據源模塊工作的進一步深化.預處理模塊接收到移交自數據源模塊的數據后,通過對數據分析、變換以及處理,進行劃分歸類,使得數據在轉換之后能夠被識別處理.在經過預處理模塊工作之后,不僅可以有效縮短挖掘數據的處理時間,同時還可以有效縮短分析數據的時間,切實提高數據的辨識度與準確性.例如借助數據包中源IP地址、目標IP地址以及端口信息等數據信息,實現對數據的整理、集合與歸類處理.也即完成數據的預處理工作.

第三,規則庫模塊.規則庫模塊運用于網絡病毒出現之后.規則庫模塊借助挖掘數據、特征識別以及聚類分析等方式來實現規則集的獲取目的.如果在規則集內有此網絡病毒調整屬性等一些信息的詳細記錄,能夠在挖掘指導工作中將該記錄進行應用,并且能夠分析網絡中可能潛在病毒,實現有效防御病毒的作用.除此以外,在規則庫模塊中還可以運用聚類分析方法鑒別網絡病毒.在已經劃分好但還未標記的數據集中通常使用聚類分析方法,此方法可歸納該數據集,使其成為較多小組,而后劃分出差異度最小的一組數據,不同組之間的較大數據差異度也會比較大.針對數據挖掘技術來講,主要就是聚類分析數據.聚類分析數據不僅能夠使數據挖掘規則庫得到有效完善,還能夠提供準確且有效數據支持而分析網絡病毒特征.

第四,數據挖掘模塊.數據挖掘模塊是通過數據挖掘算法對數據庫進行詳細分析.事件庫主要是由連接請求記錄組成[4].在數據挖掘技術總體組成中數據挖掘模塊屬于比較關鍵的組成部分之一.詳細來講,數據挖掘模塊主要包括數據挖掘算法以及事件庫.運用數據挖掘算法可以收集數據組成事件庫,進而分析并歸納數據,形成規則明顯、特征清晰的探究結果.

第五,決策模塊.決策模塊運用數據挖掘形成數據庫,在數據匹配的基礎上密切連接規則庫.在數據庫之后,若有些信息與規則庫之間存在較高聯系,則能夠表示決策模塊中信息有一定病毒特征存在,有大可能感染病毒.若規則數據以及存在于結果數據庫的數據無法匹配,則表明在該數據包中存在被稱之為新型規則類的新型特征型病毒.那么,就有必要向規則庫中引入此病毒.

3.2 數據挖掘技術下的病毒防御系統

第一,關聯規則.關聯規則,顧名思義,指的就是在數據庫中存在一類能夠被關聯的知識.也即如果在數據庫中存在兩個或者兩個以上變量的取值之間具有一定的規律,那么表明這些數據之間存在著一定的關聯性.數據挖掘技術主要由因果關聯、時序關聯以及簡單關聯三種關聯組成.分析以上所講的關聯就是為了找出數據庫中存在的關聯網,挖掘數據間存在的關系,找出數據之間的關聯規則.

第二,聚類分析.聚類分析需要將獲取的數據包進行分解并劃分為不同組,對于每個組分類而言,其有某種或幾種相似特征存在,而不同組別之間又有不同特征存在.通過聚類數據,能夠及時識別數據分布中的疏密情況,使得全局分布模式得以全部呈現,使數據屬性之間所存在關系得以體現.

第三,分類分析.分類分析所指的就是在預先所設定幾個分類中將個體根據其類別分別納入,分類目的就是利用各類統計方法與機器學習方法等對分類模型進行構造,在某個特定類映射數據庫中數據,然后利用該分類規則分類其它數據.

第四,異類分析.異類分析也被稱為孤立點分析.指的就是分析數據庫中對不同點比較明顯以及與其它數據偏離較為明顯的數據.這里所需要分析的數據也即與常規模式偏離的數據[5].在異類分析中主要包括發現孤立點以及對孤立點進行分析,發現孤立點往往會有悖常理結果產生,在分析孤立點的過程中,發現與一般數據相比價值更高的數據的可能性會更大.

第五,序列分析.此分析方法是對數據進行動態處理的一種統計型方式.序列分析借助對隨機數據序列間存在的特有規律地分析,找出于事件庫中存在的病毒數據序列.

4 結語

當前社會計算機網路技術有著十分廣泛的應用,在應用過程中應當對網絡病毒加強注意,采取有效措施防御網絡病毒,在實際應當過程中應當通過對數據挖掘技術的應用防御計算機病毒,避免計算機受到入侵而影響其正常使用,保證計算機安全以及正常運行.

〔1〕劉春娟.數據挖掘技術在計算機網絡病毒防御中的應用分析[J].電子測試,2014(5).

〔2〕李智勇.數據挖掘在計算機網絡病毒防御中的應用探究[J].電子測試,2014(12).

〔3〕趙松.基于數據挖掘技術的計算機網絡病毒防御系統設計[J].無線互聯科技,2014(8).

〔4〕呂睿.數據挖掘技術在計算機網絡病毒防御中的應用分析[J].電子測試,2014(23).

〔5〕潘大勝.論數據挖掘在計算機網絡病毒防御中的應用[J].西南農業大學學報(社會科學版),2012(12).

猜你喜歡
數據源數據挖掘預處理
求解奇異線性系統的右預處理MINRES 方法
探討人工智能與數據挖掘發展趨勢
Web 大數據系統數據源選擇*
基于預處理MUSIC算法的分布式陣列DOA估計
基于并行計算的大數據挖掘在電網中的應用
基于不同網絡數據源的期刊評價研究
淺談PLC在預處理生產線自動化改造中的應用
一種基于Hadoop的大數據挖掘云服務及應用
基于真值發現的沖突數據源質量評價算法
基于膜過濾的反滲透海水淡化預處理
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合