李雪寒, 劉沁怡, 楊曉彤, 胡海敏, 王哲銘, 周文強, 盧 武
(1.上海電力大學, 上海 200090; 2.國網上海市電力公司浦東供電公司, 上海 200122;3.國網上海市電力公司市區供電公司, 上海 200080)
變壓器是變電設備的核心,而套管是其重要組成部分,擔任著固定引線和與外界絕緣的作用。根據2015年國際大電網會議(CIGRE)A2.37工作組統計的變壓器故障起因報告,電壓等級越高,由套管引起的變壓器故障比例越大,當電壓等級為500 kV及以上時,該比例達到27.8%[1]。套管一旦出現故障便會導致變壓器停運,嚴重時甚至會引發火災爆炸,因此套管運行狀態的準確評估對保證電力設備的安全運行起著至關重要的作用。
常用的套管故障檢測方法包括介質損耗法[2]、超高頻法[3]以及紅外圖像診斷法[4]等。介質損耗法需要在變壓器停運的條件下進行預防性試驗,缺乏可靠性和時效性,而超高頻法則不易實現故障定位。由于設備故障時溫度會快速升高,基于這一特點,紅外圖像診斷法可以將套管快速從背景中識別出來,進而準確地實現套管故障狀態診斷。
近年來,國內外學者展開的基于紅外圖像缺陷智能診斷研究主要包括目標識別和目標狀態診斷兩方面。目標識別主要利用區域分割[5]、閾值分割[6]等算法實現紅外圖像中目標與背景的分割,但只適用于簡單背景。深度學習理論為研究人員帶來了新思路。李文璞等人[7]利用Faster R-CNN(Region-based Comolutional Neural Networks)算法聯合溫度閾值算法實現了變電設備紅外圖像缺陷識別;王萬國等人[8]利用Faster R-CNN算法識別無人機巡檢圖像中的電力設備部件等。目標狀態診斷主要在紅外圖像識別的基礎上結合深度學習實現故障診斷。例如廖志偉等人[9]利用紅外圖像處理技術分割提取絕緣子串,之后引入K-means聚類算法和BP(Back Propation)神經網絡實現對絕緣子串低零值故障和污穢故障的診斷。
目前,針對套管的目標識別,現有的圖像處理算法已經可以實現對目標的框選,但由于分割框包含范圍較大,易導致對小目標和多目標識別精度不佳。對此本文采用基于Faster R-CNN改進而來的Mask R-CNN模型,實現對目標快速準確地識別和對套管的精細化掩模分割。同時,針對紅外圖像中“色-溫”關系不對應的問題,提出選取灰度值作為特征值。然后,使用粒子群優化(Particle Swarm Optimization,PSO)算法優化BP神經網絡(PSO-BP),對套管特征進行分類識別。最后,在實際應用中驗證了方法的可行性與準確性,為變電設備紅外圖像識別及其狀態評估問題提出了解決方案。
本文采用基于紅外圖像的變壓器套管進行故障診斷,算法的框架流程如圖1所示。其中,CNN表示卷積神經網絡,RPN表示區域生成網絡(Region Proposal Network,RPN)。整個算法主要包含套管輪廓提取算法和變壓器套管狀態診斷模型兩部分。其中,套管輪廓提取算法基于Mask R-CNN算法對變壓器套管進行識別和精細化掩模分割;變壓器套管狀態診斷模型先對套管分割圖像進行特征提取,再利用PSO-BP神經網絡對其進行聚類分析,建立聚類模型,實現套管的狀態診斷。
圖1 基于紅外圖像的變壓器套管狀態診斷算法
Mask R-CNN算法是對Faster R-CNN算法的改進,增加了掩模分支,可以同時實現目標檢測和掩模分割,具有魯棒性強、識別精度高的特點[10]。該網絡由特征提取模塊、RPN模塊、感興趣區域(Region of Interest,ROI)模塊和輸出預測模塊4部分組成[11]。
其中,特征提取模塊由ResNet殘差網絡和特征金字塔網絡(Feature Pyramid Networks,FPN)組成。ResNet殘差網絡將輸入與經過卷積層處理后的輸出進行特征值相加;FPN可以將底層信息和高層語義特征信息進行融合[12]。之后利用RPN掃描ResNet50-FPN生成的多層特征圖以提取ROI。在Faster R-CNN算法中采用ROI池化法(ROI Pooling)將上一步提取到的ROI映射到特征圖上,但這些ROI的大小不一致,無法直接進行后續處理,此時需要ROI Pooling層將其轉為固定尺寸大小,當無法整除時就采用四舍五入法,導致位置回歸生成的候選框與目標真實位置存在偏差,影響了算法對目標物體的識別精度。為了消除這種誤差,在Mask R-CNN算法采用的ROI聚集法(ROI Align)中取消量化操作,使用雙線性插值算法,從而能更好地對齊原圖上的ROI區域,使算法對小目標的定位和識別更加精確。其原理如圖2所示。
圖2 ROI Align雙線性插值算法原理
圖2中,P點為整個ROI中任意一點,點1~點4為P點最鄰近的4個點。
雙線性插值算法的公式為
(1)
式中:f(x,y)——待求點P的像素值;(x1,y1)、(x1,y2)——點1和點2的坐標;(x2,y1)、(x2,y2)——點3和點4的坐標;f(1)、f(2)、f(3)、f(4)——點1~點4的像素值。
輸出預測模塊包含了類別、位置和掩模預測層。在Mask R-CNN訓練時,該網絡的多任務損失函數L定義為
L=Lcls+Lbox+Lmask
(2)
Lcls(p,u)=-logpu
(3)
(4)
(5)
式中:Lcls、Lbox、Lmask——分類損失、回歸損失、平均二值交叉熵損失;
p、u、t、v——目標對象、目標類別標簽、預測邊界框回歸的偏移、邊界框回歸目標;
pu——邊界框被預測為含有目標的概率;
SmoothLi——平滑損失函數;
(i,j)——像素坐標。
本文利用BP神經網絡對變壓器套管進行狀態診斷。BP神經網絡是以輸入層、隱藏層和輸出層為主要結構的前饋神經網絡,非線性映射能力強,網絡結構靈活,在聚類分析領域具有廣泛應用。
PSO算法是對BP神經網絡的權值和閾值進行優化的常用方法。PSO-BP算法流程如圖3所示。PSO算法的本質是全局尋優,整個過程通過個體運動狀態的不斷反饋來尋找最優解。對每個個體設置適應度值,其中個體極值指單個的歷史最優解,群體極值指所有個體尋找的適應度值最優位置[13]。
圖3 PSOBP算法流程
PSO-BP算法中PSO優化算法原理如下:全局尋優,假設粒子總數為n,則第l個粒子的位置和速度以及對應的個體極值和群體極值為
Xl=[Xl1,Xl2,…Xld,…,XlD]T,Xld∈[Ld,Ud]
(6)
Vl=[Vl1,Vl2,…Vld,…,VlD]T,Vld∈[-Vmax,Vmax]
(7)
Pl=[Pl1,Pl2,…Pld,…,PlD]T
(8)
Pg=[Pg1,Pg2,…Pgd,…,PgD]T
(9)
式中:Xl、Vl——粒子的位置、速度;Ld、Ud——空間的下界和上界;Vmax——粒子飛行的最大速度;Pl、Pg——個體極值、群體極值;PlD——第l個粒子在D維空間中迄今為止搜索到的最優位置;
PgD——整個粒子群在D維空間中迄今為止搜索到的最優位置。
粒子的速度和位置的迭代更新公式如下:
(10)
(11)
式中:ω——慣性權重;k——當前迭代次數;c1、c2——加速度因子,分別控制飛往最優個體和群體的距離,通常取2;
r1、r2——分布在[0,1]的隨機值。
本文使用的原始數據來自國網上海市供電公司的彰武站、余姚站和鳳陽站等110 kV等級變壓器套管的紅外圖像庫。套管正常和典型故障狀態圖像如圖4所示。圖像類型包括正常、介質損耗故障、接頭故障、漏油故障。介質損耗故障由絕緣油中的水分或局部放電引起,導致整個套管體溫度升高。接頭故障通常是由接頭連接不良引起,導致接頭上過熱。漏油大多由機械密封不良引起,會導致套管底部溫度高于頂部溫度。
圖4 套管圖像
目標識別類模型的準確性需要大量的實驗樣本,但實際應用中,直接獲取海量的圖像數據較困難。因此,在對Mask R-CNN模型進行訓練之前,需要對原始數據進行擴增,本文采用數據增廣算法。數據增廣是一種有效的正則化方法,通過對原有數據進行變換操作,可產生大量與原數據相似的數據,使模型獲得更好的泛化性[14]。為解決各種故障類型圖像與正常圖像之間比例的不均衡容易造成訓練的過擬合問題,本文在數據增廣時使各種類別樣本的數量相同。常用的數據增廣方法有鏡像、旋轉、增減噪聲等。按8∶2的比例劃分為訓練集和驗證集。數據增廣后的各類型圖像數量和效果如表1和圖5所示。由表1可知,原圖共284張,擴增圖像280張,擴增后圖像共564張。
表1 數據增廣后各類型圖像數量 單位:張
圖5 數據增廣效果
大量研究表明,紅外圖像處理的最終效果與原始圖像的色彩分布緊密相連。為了能呈現更多細節,紅外成像設備一般會對溫度和圖像顏色進行自適應調整,且溫度矩陣源文件也較難獲取,這就導致紅外圖像“色-溫”不一致問題的出現。針對這一問題,本文選取灰度值作為輸變電設備紅外圖像的狀態特征。
加權平均法是轉變為灰度圖像常用的方法之一。原理是對紅、綠、藍3個顏色通道R、G、B賦予不同的權重Wr、Wg、Wb,令R=G=B=WrR+WgG+WbB。權重不同,得到的結果不同,但由于人眼對綠色敏感度最高、紅色次之、藍色最低,因此通常Wg>Wr>Wb。經過多次的實驗驗證,當Wr=29.9%,Wg=58.7%,Wb=11.4%時得到的圖像最為合理。同時0.299+0.587+0.114=1,剛好是滿偏,按此比例加權平均能夠得到較合理的灰度圖像。因此,灰度值Gray的公式如下
Gray=R·0.299+G·0.587+B·0.144
(12)
在Mask R-CNN算法分割出的圖像區域中,
(13)
式中:P(I)——灰度為I圖像區域中一階直方圖;
n(I)——灰度為I的像素數量;
N——像素總數。
若將中心線上每一點的灰度值進行提取,會包含大量冗余信息,所以等間距選取10個中心線灰度值;另外,灰度方差表示離散程度,異常狀態導致相對溫差較大,因此,還需要選取平均灰度、灰度方差、灰度最高值和最低值。中心線特征值提取過程如圖6所示。
圖6 中心線特征值提取過程
精確率(Precision)P和召回率(Recall)R可以作為衡量模型性能的指標,其計算公式如下
(14)
(15)
式中:TP——正確檢測的套管個數;FP——背景被誤預測的套管個數;FN——未被識別的套管個數。
本文設置判斷預測結果正確與否的閾值為0.5,使用平均精度均值(Mean Average Precision,mAP)來評估模型整體精度。
P-R曲線如圖7所示,以召回率R為橫軸,精確率P為縱軸,將不同閾值下的精確率和召回率連接起來形成一條曲線,其表達式為P(R)。
圖7 PR曲線
通過對P-R曲線進行積分,可以計算mAP,即
(16)
當M為無窮大時,
(17)
本文采用基于Mask R-CNN算法的實例分割模型對套管紅外圖像進行分割,采用的網絡環境配置如表2所示。
表2 網絡環境配置
本文采用Mask R-CNN算法對構建的數據集進行訓練,初始學習率為0.001,對其訓練30輪和50輪,損失函數變化曲線如圖8所示。由圖8可以看到,訓練50輪后的損失值明顯低于訓練30輪時,此時的損失值可以達到0.119 9。
圖8 損失函數變化曲線
對測試集進行迭代訓練后,將模型用于不包含訓練集中的圖像進行目標分割測試。部分變壓器套管分割結果如圖9所示。
圖9 部分變壓器套管分割結果
結果表明,Mask R-CNN算法能夠對目標進行快速準確地識別,完成目標輪廓的分割并生成掩模,其平均精度均度mAP可以達到0.91。
圖10 PSOBP算法迭代誤差變化過程
由圖10可知:在設定初始權值和閾值的條件下,PSO-BP算法在迭代大概15次時,誤差急劇下降;在大約15次迭代后,PSO算法的適應度值達到穩定,體現了該算法缺陷識別的高效性。
同時,將108組測試集的特征參數作為輸入,對套管的狀態進行預測。測試數據的混淆矩陣如圖11所示,預測結果如表3所示。
表3 PSOBP算法的預測結果
圖11 測試數據的混淆矩陣
27張測試樣本中有4處識別錯誤,其中3處接頭故障被誤分為漏油故障,1處漏油故障被誤分為接頭故障。表3的結果表明,該方法可以對變壓器套管的不同故障狀態進行準確識別,故障診斷的平均準確率可達93.518%。為了進一步驗證本文算法的優勢,將其與傳統BP算法和支持向量機(Support Vector Machine,SVM)算法進行對比。BP算法和SVM算法都是常見的故障診斷算法,使用的都是經Mask R-CNN算法分割后的相同訓練數據。預測結果對比如表4所示。
由表4可知,SVM算法的故障診斷平均準確率為87.963%,而在同樣的條件下,傳統BP神經網絡算法只有72.773%,二者均遠低于PSO-BP算法的93.518%??偟膩碚f,PSO-BP算法在很大程度上提高了預測的精度。
針對目前紅外診斷檢測效率低、背景干擾多等問題,本文提出了一種基于Mask R-CNN的變壓器套管故障診斷方法,實現目標物體的像素級分割。選取灰度值作為特征值解決紅外圖像中“色-溫”關系不對應問題,使用PSO-BP神經網絡對套管4種典型圖像類型進行分類識別,故障診斷準確率可達93.518%,優于傳統算法。因此,該算法在電力設備紅外圖像分割領域具有良好的應用前景,可以極大地提高電力設備故障分析工作的效率和準確率。