?

淺析數據融合與數據挖掘

2013-09-03 06:32唐生枝
中國信息化·學術版 2013年7期
關鍵詞:數據融合數據挖掘

唐生枝

【摘 要】數據挖掘和數據融合是兩種分析處理海量數據、提取有用知識的技術。兩者的目標和原理各不相同,但功能上相互補充,可進行深層次的結合滲透,有效地完成復雜的數據分析工作。文章以網絡安全應用中的網絡故障管理實例,分析了兩者集成運用的優勢。

【關鍵詞】數據融合,數據挖掘,知識發現

【中圖分類號】 C37【文獻標識碼】A【文章編號】1672-5158(2013)07-0172-01

在信息時代,信息量的爆炸式增長使得信息的獲取、傳輸、存儲、轉換等信息處理技術得到了長足進步。數據融合與數據挖掘作為信息處理技術兩大分支在這一過程中萌生,并得到了人們的重視和研究。

數據融合源于傳感器技術的發展,是幫助人們處理復雜多變的外部環境產生的信息,評估環境狀態和目標信息,對戰局和威脅的提供全面和及時的信息處理技術。數據挖掘用以幫助人們從積累的“過量信息”中,擷取事先未知的潛在有用的信息和知識的信息處理技術。

一、網絡故障管理系統中應用

隨著網絡應用的發展,網絡規模以及網絡的數量得到了蓬勃發展。為了更好的對網絡進行有效的管理,及時排除網絡故障,讓網絡持續穩定地運行將數據融合作為,網絡故障的管理也就有著突出的重要性。

將數據融合作為數據挖掘的數據準備階段,在網絡故障管理方面,二者合理的結合使用,利用數據融合技術分析網絡運行中產生的狀態數據,處理結果形成數據集,在這個數據集的基礎上利用數據挖掘技術,獲得安全規則,發現異常,判斷網絡故障。系統結構如圖所示。

① 數據融合模塊

網絡故障管理系統中數據融合模塊是對網絡中多處來源的數據進行處理和組合,從而產生新的有意義的信息。這里的多處來源的數據是指網絡運行中產生的描述網絡運行的狀態信息。

網絡管理中的數據具有多源性、分布性、異構性的特點,它們主要來自網絡的數據、系統日志、網絡管理查詢信息等。而另一方面,目前數據挖

掘一般對象是靜態的數據集,解決這些矛盾的方法是數據挖掘和數據融合技術集成。

網絡故障信息中的告警數據是含噪聲的、并且大量都是重復的。主要包括告警丟失、錯亂、延遲以及重復告警、誤告警等方面。利用數據融合的關聯技術,根據數據之間的相似性,將來源數據進行處理,以減少重復數據的數量。

② 數據挖掘模塊

在網絡管理的數據挖掘中,關聯規則和序列模式是最常見的挖掘知識,二者挖掘知識的角度不同。關聯規則是從網絡告警信息中發現告警與告警之間、告警與故障之間、告警與業務之間的相關性,即在一個告警信息發生之后,另一個告警、故障、業務發生的可能性。而序列模式把告警信息序列看作以時間為主線的有序序列,在一定的時間間隔內挖掘知識,注重告警信息的時間性。

在數據挖掘階段,網絡的管理者必須對系統設置相應的參數,這些參數用于描述網絡的運行狀態。例如當某項低于或者高于某一值時,認為網絡該方面產生故障。并且根據值的大小,采取不同的措施,發出告警信息或者僅寫入日志。有時還要根據參數值的時間變化,分析故障產生的概率。對于不同的參數,挖掘算法得出的結果和提示都不盡相同,因此系統的性能對人工干預的程度有著依賴性。

二、應用分析

在網絡管理系統應用中,數據融合模塊與數據挖掘模塊處于串聯處理關系,兩者位置不能夠顛倒,首先由數據融合模塊對來源數據進行數據處理,形成相應的數據集,提供給數據挖掘模塊使用、分析。

參考文獻

[1] 習慧丹.數據挖掘研究綜述.電腦與信息技術,2012(1)

[2] 王惠中,彭安群.數據挖掘研究現狀及發展趨勢.工礦自動化,2011(2)

[3] 孟珍偉,杜友福,秦建超.現代數據挖掘技術與發展.中國科技信息,2007(2)

猜你喜歡
數據融合數據挖掘
數據挖掘技術在內河航道維護管理中的應用研究
數據挖掘綜述
軟件工程領域中的異常數據挖掘算法
多傳感器數據融合技術在機房監控系統中的應用
《可靠性工程》課程教學的幾點思考
基于數據融合的家庭遠程監護系統研究
基于R的醫學大數據挖掘系統研究
船舶動力定位中的數據融合技術文獻綜述
基于信源編碼的數據融合隱私保護技術
一本面向中高級讀者的數據挖掘好書
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合