?

基于決策樹算法的工業光纖網絡通信故障檢測系統

2014-10-14 18:30黃勇胡連城劉增良
現代電子技術 2014年20期
關鍵詞:光纖網絡決策樹數據挖掘

黃勇+胡連城+劉增良

摘 要: 針對工業光纖網絡通信故障檢測過程繁瑣、效率低的問題,設計了一種基于優化的決策樹數據挖掘算法的光纖網絡通信故障檢測系統。系統以減少檢測器重復工作和準確定位為目標,引入以決策樹為核心的故障數據挖掘模塊,降低了對非己空間的故障挖掘時間。將第一階光纖網絡故障分類時僅以IP地址作為參量變成第二階分類時使用指定的網絡指標為基礎構建決策樹,進一步提高故障檢測精度。對某車輛制造企業現有的光纖網絡應用結果表明,與標準決策樹方法相比,該算法將精度從69.0%提升到99.9%,將誤報率從3.14%降低到0.48%,優化效果明顯。

關鍵詞: 光纖網絡; 通信故障檢測; 故障診斷; 數據挖掘; 決策樹

中圖分類號: TN711?34; TP23 文獻標識碼: A 文章編號: 1004?373X(2014)20?0134?03

Industrial fiber network communication fault detection system based on decision tree algorithm

HUANG Yong1, 2, HU Lian?cheng2, LIU Zeng?liang3

(1. School of Automation, University of Science and Technology Beijing, Beijing 100083, China;

2. Communication Network Technology Management Center of Beijing Military District, Beijing 100041, China;

3. National Defense University of PLA China, Beijing 100091, China)

Abstract: For tedious fault detection process and low detection efficiency of industrial optical network communication, an optical fiber network communication fault detection system based on optimized decision tree data mining algorithm was designed. In order to reduce the repeated rework of detector and realize accurate positioning, the fault data mining module taking the decision tree as the core was introduced into the system to reduce the time of fault mining in not its own space. Only taking the IP address as a parameter in the first?order fiber?optic network fault classification is changed into the construction of decision tree based on the specified network index in the second?order classification, which further improves the accuracy of fault detection. The application results of optical network existing in a vehicle manufacturing enterprise show that, compared with the standard method of decision tree, this algorithm has increased accuracy from 69.0% to 99.9%, and reduced the false report rate from 3.14% to 0.48%. The optimization effect is obvious.

Keywords: fiber network; communication fault detection; fault diagnosis; data mining; decision tree

0 引 言

光纖網絡支持光纖應用系統和工業生產過程之間的通信,目前主要的控制網絡有樓宇自動化、工廠自動化和過程自動化[1]??刂凭W絡有許多不同的作用和應用環境,通常部署在支持安全可靠通信的緊要使命操作環節,這樣可確保光纖網絡通信會話的服務質量,并使通信延遲最小。許多傳統的光纖網絡如基金會現場總線、數字化現場總線、ModBus現場總線等主要依靠專有協議,這些控制網絡技術獨立于如今蓬勃發展的以太網和基于網際協議(IP)的網絡技術。但是由于以太網和IP技術的成本低廉、可擴展性強、易于維護等優勢,這些網絡近來也逐漸引入工業以太網和IP技術[2]。但是,當采用基于IP的控制網絡技術后,將不得不面臨IP網絡中常見的網絡問題。網絡級錯誤和光纖網絡中的錯誤大相迥異。網絡級錯誤例如包重傳和校驗錯誤等是光纖網絡錯誤的癥狀之一,明確的控制網絡錯誤和網絡級錯誤常并發于網絡條件差的IP網絡中[3]。因而光纖網絡故障檢測系統的主要需求就是能夠理解網絡級癥狀和實際錯誤間的關聯,在此基礎上設計了一套基于決策樹的光纖網絡通信故障檢測系統,用于車輛制造企業的光纖網絡。

1 光纖網絡結構分析

常見的光纖網絡結構是金字塔式的[4],如圖 1所示。頂層的控制器驅動下層被控設備執行既定操作,最頂層的是光纖控制器(PC),一般使用人機界面,是可編程邏輯控制器(PLC)開發商提供的軟硬件包,是在電腦上運行的光纖應用軟件,可快捷方便地訪問下層的PLC,通過開發商提供的服務器應用軟件進行通信,其圖形用戶界面提供實時監控結果,之間的連接使用有連接的TCP協議。中層的PLC是連接光纖網絡的光纖單片機,一系列復雜的控制裝置或工廠流水線上的低端控制設備通過PLC上運行的定制軟件程序處理運行。下層的被控設備種類繁雜,涉及傳感器、制動器、電動機等設備,通過嵌入式接口接收上層PLC的命令信息。其中頂層PC和中層PLC通過以太網連接,PLC和底層的被控設備通過專有協議連接。

圖1 光纖網絡結構

光纖網絡中的設備必須同步或順序運行,一個微小的網絡錯誤可能就是致命的,換言之,控制設備的一個錯誤可能會迫使整個生產過程耽擱甚至停滯,帶來巨大的經濟損失。因此,光纖網絡中快速準確的故障檢測舉足輕重。

2 光纖網絡故障檢測和故障診斷

2.1 故障類型分析極其弊端

通過分析光纖網絡錯誤的實際案例,可知其故障主要分為四類:IP連接故障、網絡配置錯誤、物理故障、軟件故障[5],其主要的故障現象如表 1所示。

目前已有的IP網絡故障診斷工具如嗅探器等不具備分析光纖網絡故障的能力,不能提供故障成因,而且控制網絡故障的早期癥狀常夾雜著網絡級錯誤。常見的IP網絡指標有幀沖突、巨型幀、超短幀、循環冗余碼錯誤幀、TCP校驗錯誤、分片報文、重傳報文、分組到達間隔時間、吞吐率、包突發,通過分析可知網絡故障的報警條件,這些指標本身并不獨特,但并不在大多數的商業IP網絡診斷工具的分析對象之列。由于常用工具不能完全檢測出控制網絡故障僅能生成故障網絡警報,因此需要設置新的監控分類和條件,可使用被動網絡監控技術,不會影響網絡運行。本文設計的檢測結構的部分監測指標及報警條件如表 2所示。

表1 常見的光纖網絡錯誤

表2 監測指標及報警條件

在每個涉及共享地址和端口的雙向數據包傳輸的流量信息中都監測這類指標,只要出現異常就發布警報,因為這類指標異常只要出現就意味著發生通信故障的可能,即這類指標的突變意味著光纖網絡的運行異常。網絡管理員識別出早期的控制網絡通信故障是非常關鍵的,操作者必須調查大量數據尋出網絡連接異常序列,由于不同設備的控制網絡有不同的通信量特性和故障案例,因此需要一個能夠自動地從歷史故障數據中提取故障檢測規則的系統,決策樹是一種非常合適的選擇,可自動生成反映操作控制網絡通信異常的規則用于故障檢測。

2.2 決策樹的引入光纖網絡通信挖掘優化

傳統的故障挖掘算法面臨2個難題:檢測時間過長,由于需要在大量網絡數據中進行響應的操作,因此搜索過程極其耗時;由于冗余信息的干擾,降低了系統檢測的精度。

光纖網絡通信數據挖掘充當控制網絡故障檢測的推理機,根據檢修案例、用戶經驗和網絡測量指標,推測出故障與網絡指標間的關聯,這種關聯被轉化為故障檢測規則應用于故障檢測系統。決策樹可以很好地解決這兩個問題。

決策樹用于歸類有共同屬性的數據[6],每一個決策樹代表了一種用于區分屬性的規則,主要包含內部節點、葉節點和邊界。內部節點指明區分數據的屬性,邊界根據母節點的屬性條件予以標記,葉節點根據數據劃分的決策值標記,決策樹已證明在網絡故障檢測效果較好。在控制網絡中,IP地址和商品號標記結點,故障或正常標記葉名,而標注箭頭定為邊界。決策樹根據訓練數據使用信息獲取函數構建,通過修剪決策樹獲得學習信息,這個過程會犧牲分類的精確性,如果沒有網絡故障則所有結點都標記為正常。修剪前后的故障決策樹如圖2所示。

圖2 修剪前后的故障決策樹

3 實用效果分析

使用國內某汽車生產公司的生產光纖網絡完全的數據包跟蹤,其周期為4天,光纖網絡通信總數據流量是62 GB。這些流量數據被合成有共同網絡特征的數據流,然后進行特征提取,相關的特征是前文提及的網絡指標。分析并標記數據集中的數據流,為了便于訓練和檢驗,每個數據流排成一行,并標記正?;蛘吖收?。表3所示為用于訓練和檢驗步驟的示例數據,包含58 123行正常數據和3 317行故障數據。

表3 實驗示例數據

為了測量決策樹對于光纖網絡通信網絡故障識別結果的精確度,引入數據決策技術中常用來評估精確度的三個參量:精度(PV)、檢索率(RP),可由精度(TP)、假陽性(FP)和假陰性(FN)計算得出,正確分選的對象數目占數目的比例為測量精度,反之為漏報率,正確對象被錯誤分選為其他類型則為假陰性,檢索率反映被錯誤歸類的對象比例,計算如式(1),式(2)所示。

[PV=TP(TP+FP)] (1)

[RP=TP(TP+FN)] (2)

在故障檢測中,降低漏報率值是非常關鍵的,因為誤判故障數據為正常數據將會導致發生故障造成經濟損失,必須予以糾正,這也是檢驗故障檢測技術的重要參考值。在實驗1中,首先用上文提到的光纖網絡通信網絡指標建立決策樹,并對決策樹進行剪枝。實驗2以IP連接的源地址和目的地址對作為特征值,對決策樹進行剪枝,檢驗假陰性指標。實驗3原理同實驗2一樣,只是不對決策樹進行剪枝。實驗4用二階決策樹分類方法,即在第一階分類時僅以IP地址作為參量,第二階分類時使用上文提及的網絡指標為基礎構建決策樹。實驗結果如表4所示。

表4 實驗結果

由表4可知,實驗1即標準的光纖網絡通信決策樹方法都可以保證較高的精度和檢索率,這是由于控制網絡的復雜度遠低于正常網絡,但是仍有104個漏報,比例為3.14%,這種結果是無法接受的??紤]到標準決策樹算法中沒有將IP地址作為決策樹建立的輸入參量,但是任意一個光纖網絡通信網絡連接都包含著兩個網絡設備以及源地址和目的地址,因此需要在此進行修改,即如實驗2中所用的方法,將光纖網絡通信源地址和目的地址引入決策樹構建過程,因而成功地將假陰性樹降到53個,比例為1.60%。

實驗3的原理同實驗2一樣,只是不進行決策樹剪枝,雖然增加了數據量,但是將光纖網絡通信漏報數降低到45個,比例為1.355%。實驗4的二階決策樹方法,雖然增加了系統復雜度,但是進一步地將漏報數目降低到16個,比例為0.48%。這個數值雖然很低,但仍然存在漏判故障,對這16個假陰性誤判進行檢驗,發現原因是故障案例非常稀少,在整個數據集中最多出現2次,大多數僅出現1次,即使使用交叉驗證也難以保證足夠的訓練。為了檢查出16種故障,需要引入16個決策樹獨立規則,這雖然會增加系統復雜度和硬件消耗,但考慮到控制網絡周期性地產生網絡流量,故障誘因相對較少,因而只要訓練數據足夠多,訓練較好,可以保證每一個故障都可以檢測認定。

4 結 論

本文結合IP網絡特點和光纖網絡的特點,設計了一套基于二階決策樹數據挖掘的光纖優化故障檢測系統,經過國內某車輛生產企業現用的光纖網絡實用結果表明,該系統性能優越,光纖網絡通信故障檢測率可達到99.9%。在一定數據量的基礎上,該方案可以將漏報率降低到0.48%,優化效果較為明顯,取得了較好的檢測效果,目前正逐步推廣。

參考文獻

[1] WON Y J, CHOI Mi?Jung, HONG J W. Fault detection and diagnosis in IP?based mission critical industrial process control networks [J]. IEEE Communications Magazine, 2008, 46(5): 172?180.

[2] AMOOEE Gloriz, MINAEI?BIDGOLI Behrouz, BAGHERI?DEHNAVI Malihe. A comparison between data mining prediction algorithms for fault detection [J]. IJCSI International Journal of Computer Science Issues, 2011, 8(3): 425?431.

[3] ALZGHOU A, LOFSTRAND M. Increasing availability of industrial systems through data stream mining [J]. Computers & Industrial Engineering, 2010, 10(31): 743?748.

[4] CHEN Kai?ying, CHEN Long?sheng, CHEN Mu?chen, et al. Using SVM based method for equipment fault detection in a thermal power plant [J]. Computers in Industry, 2011, 2(62): 42?50.

[5] 錢宇,徐敏,郭東,等.基于預警專家系統的航天器規避研究[J].計算機仿真,2011,28(5):93?96.

[6] 陳春燕.小波神經網絡改進算法在故障診斷中的應用[J].科技通報,2012,28(10):31?33.

表4 實驗結果

由表4可知,實驗1即標準的光纖網絡通信決策樹方法都可以保證較高的精度和檢索率,這是由于控制網絡的復雜度遠低于正常網絡,但是仍有104個漏報,比例為3.14%,這種結果是無法接受的??紤]到標準決策樹算法中沒有將IP地址作為決策樹建立的輸入參量,但是任意一個光纖網絡通信網絡連接都包含著兩個網絡設備以及源地址和目的地址,因此需要在此進行修改,即如實驗2中所用的方法,將光纖網絡通信源地址和目的地址引入決策樹構建過程,因而成功地將假陰性樹降到53個,比例為1.60%。

實驗3的原理同實驗2一樣,只是不進行決策樹剪枝,雖然增加了數據量,但是將光纖網絡通信漏報數降低到45個,比例為1.355%。實驗4的二階決策樹方法,雖然增加了系統復雜度,但是進一步地將漏報數目降低到16個,比例為0.48%。這個數值雖然很低,但仍然存在漏判故障,對這16個假陰性誤判進行檢驗,發現原因是故障案例非常稀少,在整個數據集中最多出現2次,大多數僅出現1次,即使使用交叉驗證也難以保證足夠的訓練。為了檢查出16種故障,需要引入16個決策樹獨立規則,這雖然會增加系統復雜度和硬件消耗,但考慮到控制網絡周期性地產生網絡流量,故障誘因相對較少,因而只要訓練數據足夠多,訓練較好,可以保證每一個故障都可以檢測認定。

4 結 論

本文結合IP網絡特點和光纖網絡的特點,設計了一套基于二階決策樹數據挖掘的光纖優化故障檢測系統,經過國內某車輛生產企業現用的光纖網絡實用結果表明,該系統性能優越,光纖網絡通信故障檢測率可達到99.9%。在一定數據量的基礎上,該方案可以將漏報率降低到0.48%,優化效果較為明顯,取得了較好的檢測效果,目前正逐步推廣。

參考文獻

[1] WON Y J, CHOI Mi?Jung, HONG J W. Fault detection and diagnosis in IP?based mission critical industrial process control networks [J]. IEEE Communications Magazine, 2008, 46(5): 172?180.

[2] AMOOEE Gloriz, MINAEI?BIDGOLI Behrouz, BAGHERI?DEHNAVI Malihe. A comparison between data mining prediction algorithms for fault detection [J]. IJCSI International Journal of Computer Science Issues, 2011, 8(3): 425?431.

[3] ALZGHOU A, LOFSTRAND M. Increasing availability of industrial systems through data stream mining [J]. Computers & Industrial Engineering, 2010, 10(31): 743?748.

[4] CHEN Kai?ying, CHEN Long?sheng, CHEN Mu?chen, et al. Using SVM based method for equipment fault detection in a thermal power plant [J]. Computers in Industry, 2011, 2(62): 42?50.

[5] 錢宇,徐敏,郭東,等.基于預警專家系統的航天器規避研究[J].計算機仿真,2011,28(5):93?96.

[6] 陳春燕.小波神經網絡改進算法在故障診斷中的應用[J].科技通報,2012,28(10):31?33.

表4 實驗結果

由表4可知,實驗1即標準的光纖網絡通信決策樹方法都可以保證較高的精度和檢索率,這是由于控制網絡的復雜度遠低于正常網絡,但是仍有104個漏報,比例為3.14%,這種結果是無法接受的??紤]到標準決策樹算法中沒有將IP地址作為決策樹建立的輸入參量,但是任意一個光纖網絡通信網絡連接都包含著兩個網絡設備以及源地址和目的地址,因此需要在此進行修改,即如實驗2中所用的方法,將光纖網絡通信源地址和目的地址引入決策樹構建過程,因而成功地將假陰性樹降到53個,比例為1.60%。

實驗3的原理同實驗2一樣,只是不進行決策樹剪枝,雖然增加了數據量,但是將光纖網絡通信漏報數降低到45個,比例為1.355%。實驗4的二階決策樹方法,雖然增加了系統復雜度,但是進一步地將漏報數目降低到16個,比例為0.48%。這個數值雖然很低,但仍然存在漏判故障,對這16個假陰性誤判進行檢驗,發現原因是故障案例非常稀少,在整個數據集中最多出現2次,大多數僅出現1次,即使使用交叉驗證也難以保證足夠的訓練。為了檢查出16種故障,需要引入16個決策樹獨立規則,這雖然會增加系統復雜度和硬件消耗,但考慮到控制網絡周期性地產生網絡流量,故障誘因相對較少,因而只要訓練數據足夠多,訓練較好,可以保證每一個故障都可以檢測認定。

4 結 論

本文結合IP網絡特點和光纖網絡的特點,設計了一套基于二階決策樹數據挖掘的光纖優化故障檢測系統,經過國內某車輛生產企業現用的光纖網絡實用結果表明,該系統性能優越,光纖網絡通信故障檢測率可達到99.9%。在一定數據量的基礎上,該方案可以將漏報率降低到0.48%,優化效果較為明顯,取得了較好的檢測效果,目前正逐步推廣。

參考文獻

[1] WON Y J, CHOI Mi?Jung, HONG J W. Fault detection and diagnosis in IP?based mission critical industrial process control networks [J]. IEEE Communications Magazine, 2008, 46(5): 172?180.

[2] AMOOEE Gloriz, MINAEI?BIDGOLI Behrouz, BAGHERI?DEHNAVI Malihe. A comparison between data mining prediction algorithms for fault detection [J]. IJCSI International Journal of Computer Science Issues, 2011, 8(3): 425?431.

[3] ALZGHOU A, LOFSTRAND M. Increasing availability of industrial systems through data stream mining [J]. Computers & Industrial Engineering, 2010, 10(31): 743?748.

[4] CHEN Kai?ying, CHEN Long?sheng, CHEN Mu?chen, et al. Using SVM based method for equipment fault detection in a thermal power plant [J]. Computers in Industry, 2011, 2(62): 42?50.

[5] 錢宇,徐敏,郭東,等.基于預警專家系統的航天器規避研究[J].計算機仿真,2011,28(5):93?96.

[6] 陳春燕.小波神經網絡改進算法在故障診斷中的應用[J].科技通報,2012,28(10):31?33.

猜你喜歡
光纖網絡決策樹數據挖掘
基于深度學習的光纖網絡鏈路故障診斷與定位方法
探討人工智能與數據挖掘發展趨勢
基于多模式匹配算法的網絡安全入侵檢測系統設計
一種針對不均衡數據集的SVM決策樹算法
決策樹和隨機森林方法在管理決策中的應用
基于并行計算的大數據挖掘在電網中的應用
基于決策樹的出租車乘客出行目的識別
6億戶
一種基于Hadoop的大數據挖掘云服務及應用
基于肺癌CT的決策樹模型在肺癌診斷中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合