?

基于對齊自編碼器的變壓器聲音異常檢測研究

2024-02-22 08:06劉云輝王昕
電氣自動化 2024年1期
關鍵詞:編碼器時延變壓器

劉云輝, 王昕

(上海交通大學 電子信息與電氣工程學院 教學發展與學生創新中心,上海 200240)

0 引 言

變壓器作為電網中不可或缺的設備,其安全穩定運行是電網可靠供電的重要保障[1]。在變壓器運行維護過程中,因為聲信號檢測具有無電氣接觸、可實時在線檢測等優點,受到了廣泛關注[2]。聲信號可用于變壓器的異常檢測,是進行故障識別和故障定位的基礎,因而具有重要意義。

聲音的異常檢測方式包括基于統計量的檢測、基于分類的檢測和基于生成的檢測[3]?;诮y計量的檢測比較正常序列和異常序列統計信息,實現簡單,但檢測效果受統計量區分度的影響較大;基于分類的檢測一般是訓練識別正常樣本的分類器,通過劃分正常樣本邊界來實現異常樣本的檢測;基于生成的檢測通過學習正常樣本來重新生成近似的樣本,再利用模型無法很好擬合異常樣本,從而可以檢測出異常樣本。對變壓器聲音異常檢測而言,因為變壓器發生故障概率極低,采集的聲音是以正常信號為主,而異常聲音所占的比例極小且人工標注的難度大,所以半監督學習和無監督學習是目前異常識別的主要的研究方向[4]。

作為無監督學習的一種,自編碼器因為對數據有極好的擬合能力,常用于降維、特征提取和異常檢測[5]。文獻[6]借鑒了自編碼器的結構,利用長短時記憶(long short-term memory, LSTM)網絡代替了自編碼器的編碼器和解碼器部分,但是LSTM網絡計算量大,無法用于實時檢測。文獻[7]將兩個自編碼器串聯構成新模型,提高了該模型的精確率、召回率和F1值,但仍沒有解決自編碼器的時間不敏感問題。

本文設計了一種對齊自編碼器用來檢測變壓器聲音異常。首先不同的分幀方式被提出并應用到訓練集和測試集,增加了訓練樣本數量,也加快了檢測速度;其次改進了自編碼器的激活函數和損失函數,解決了自編碼器訓練慢和易受噪聲干擾的問題;接著提出了對齊自編碼器,減少了時延效應對檢測精確性的影響;最后采集正常聲音和異常聲音,通過試驗驗證了對齊自編碼器的有效性。

1 自編碼器

基于聲信號的變壓器故障檢測的檢測精度依賴于異常聲音樣本的數量,為了減少獲取異常樣本的成本,有必要研究異常信號的自動檢測。作為一種無監督學習網絡,自編碼器被廣泛用在特征提取、信號去噪和異常檢測等領域。

自編碼器包括編碼器和解碼器兩部分,設編碼器的層數為N1,解碼器的層數為N2,則有:

Z1=f(Xe1We1)

(1)

ZN1=g(XeN1WeN1)

(2)

Y1=f(Xd1Wd1)=f(ZN1Wd1)

(3)

YN2=g(XdN2WdN2)

(4)

式中:Xei、Wei、Zi(i=1或N1)分別為編碼器第i層神經元的輸入、權重和輸出;Xdi、Wdi、Yi(i=1或N2)分別為解碼器第i層神經元的輸入、權重和輸出;f(·)、g(·)為激活函數;f為LeakReLU或ReLU;g為Tanh。它們的表達式如式(5)、式(6)所示。

(5)

(6)

(7)

式中:x為神經元無激活函數時輸出向量的值;α為激活函數調整參數,一般取0.01。

損失函數常選為均方誤差(mean square error, MSE),但當輸入存在離群點時,離群點對MSE的影響較大而導致模型對樣本的預測存在較大偏差。為減小離群點的影響,結合MSE和平均絕對誤差(mean absolute error,MAE)構成Huber損失函數,其定義如式(8)所示。

(8)

2 對齊自編碼器

采集好音頻樣本后,會先將樣本按照一定比例分為訓練集和測試集。但是音頻為長時間序列,不便于直接進行訓練,常采用分幀的方式轉化為短時序列。為了充分挖掘分幀的作用,訓練集和測試集采用不同的分幀方式:訓練集的相鄰幀存在重疊,而測試集各幀不重疊。

自編碼器訓練時,訓練樣本一般需要打亂順序,輸入樣本的起始值對網絡的影響較小;而自編碼器預測時,為了方便還原預測序列,輸入樣本一般不打亂順序,這會對預測結果產生影響?;谏鲜龇治?研究了預測結果中可能存在的時延效應,并改進自編碼器形成對齊自編碼器。

2.1 時延效應

因為變壓器電壓的變化會導致聲音的異常,所以按照正弦波形式產生用標幺值表示的變壓器電壓作為正常樣本,再將變壓器常見的異常樣本添加到正常序列中,模擬多種異常的發生。包含8種異常的時間序列如圖1所示。

圖1 包含8種異常的時間序列

圖1中:序列的前一半為正常樣本,當作自編碼器的訓練集;后一半為正常和異?;旌蠘颖?當作模型的測試集。測試集中包含8種常見的異常:過載、短暫掉電(電壓暫升)、偶諧波畸變、電壓高頻閃變、輕載、電壓低頻閃變、短暫掉電(電壓暫降)和奇諧波畸變。

先利用正常樣本訓練自編碼器,然后預測帶有異常的時間序列,輸入序列、輸出(預測)結果和預測誤差絕對值的變化情況如圖2所示。

圖2 輸入輸出序列和預測誤差絕對值

圖2(a)和圖2(b)中起始點的幅值不一樣,因此預測序列很可能出現了時延效應。圖2中第一種異常的局部放大圖如圖3所示。

圖3 圖2中第一種異常的局部放大圖

圖3中的黑框表示的是異常出現的位置,對比圖3(a)和圖3(b)的異常信號可知該信號的起始值明顯不一樣,這說明預測值確實存在一定的時延。即使輸入序列中不存在任何異常,時延的存在會導致預測誤差的絕對值較大,圖3(c)的結果也證實了這一推測。

2.2 異常檢出過程

自編碼器預測時的時延效應會影響預測結果,因此通過序列對齊來實現對齊自編碼器。序列對齊能夠提高檢測精度,但為了分辨正常和異常信號還需要規定異常檢測的閾值,下面分別介紹序列對齊和異常檢測閾值。

2.2.1 序列對齊

序列對齊的實現包括時延檢測和預測序列反向延時對齊兩個步驟。時延檢測得到預測序列相對測試輸入序列的時延,序列延時對齊則是利用估計的時延來反向移動拼接預測序列首末端的序列。為減少時延檢測的計算量,先對測試序列和預測序列進行三電平削波處理,削波函數為:

(9)

式中:x為測試序列或預測序列的樣本點;xT為電平選擇閾值,默認取0.25。

確定削波函數后,時延修正的步驟如下。

(1) 利用削波函數將測試序列和預測序列轉為值為-1、0、1的三電平序列。

(2) 計算轉化后序列的時延,即測試序列超前或滯后預測序列多少采樣點。

(3) 反向延時補償預測序列。測試序列超前時,取預測序列尾端與超前采樣點數相同長度的序列,序列反轉后添至首端;測試序列滯后時,取預測序列首端與滯后采樣點數相同長度的序列,序列反轉后添至尾端。

(4)重新計算測試序列和預測序列的損失。

2.2.2 異常檢測閾值

這里對異常信號作如下規定:設正常信號的均值為μ,標準差為σ,利用“3σ”準則對異常信號進行判斷,即信號的幅值如果小于μ-3σ或大于μ+3σ就認為該信號為異常信號。實際操作過程中,將正常信號置0,異常信號置1,再檢測異常信號的起止時刻得到最終的檢測效果。

2.3 評價指標

為客觀展示對齊自編碼器的檢出效果,指標定義如下:

(10)

(11)

(12)

式中:P為精準率;TP為將正例(異常聲音)預測為正例的樣本數;FP為將負例(正常聲音)預測為正例的樣本數;R為召回率;FN為將正例預測為負例的樣本數;Fβ為綜合評價指標,規定P或R值為0時,Fβ=0;β為權重系數,β=1時,P和R重要性相同,此時Fβ記為F1。式(12)簡化為:

(13)

3 試驗驗證

為驗證對齊自編碼器的可行性,在實驗室利用麥克風采集變壓器正常聲信號和少量異常聲信號。正常聲信號為20 s,先將正常聲音按照3∶2 的比例分為訓練集和測試集。訓練集樣本保持不變,將異常聲音分段添加到測試集中來模擬異常的發生。分幀處理聲信號時,分幀窗口取為20 ms,訓練集各幀的重疊率為50%,測試集的幀重疊率為0。分幀結束后,訓練集含1 199個樣本,測試集含400個樣本,兩者的比例約為3∶1。

除了聲音預處理方式,對齊自編碼器的層數和每層神經元數目也會對異常檢測的效果產生影響。為了避免神經元輸入輸出維數變化過大,采用逐層緩降維或緩升維的辦法確定各層神經元的維數。編碼器的神經元輸入輸出維數和激活函數如表1所示,解碼器的神經元輸入輸出維數和激活函數如表2所示。

表1 編碼器的神經元輸入輸出維數和激活函數

表2 解碼器的神經元輸入輸出維數和激活函數

由表1、表2可知,編碼器和解碼器采用了對稱的網絡結構。對齊自編碼器訓練過程中誤差的變化情況如圖4所示。

圖4 訓練誤差隨訓練次數的變化情況

由圖4可知,經過了70次左右訓練誤差就達到了預期效果。模型檢測效果如圖5所示。

圖5 對齊自編碼器檢測異常聲信號效果

圖5(a)中聲信號由黑框外的正常聲信號和兩段黑框框住的異常聲信號組成:第一段異常聲信號為變壓器繞組短路的聲信號;第二段為變壓器過電壓的聲信號。圖5(b)為聲信號的預測值,由圖可看出黑框中的異常聲信號與黑框外的正常聲信號存在幅值上的差異,圖5(c)的圖像也證實了這一點。利用正常聲信號和異常聲信號預測幅值的差異可以檢測出異常聲信號的起始時刻,檢測過程如圖6所示。

圖6 生成信號異常檢測過程

圖6(a)中的信號只含0和1兩種值,當圖5(c)的信號在正常信號的“3σ”準則范圍內,其值為0,否則為1。圖6(b)顯示的是異常聲音的起始和終止時刻,其中忽略了太短的聲音片段。確定起止時刻后,就可以利用評價指標來對比不同模型的異常檢測效果,對齊自編碼器和其他模型的評價指標計算值如表3所示。

表3 對齊自編碼器和其他網絡模型的對比 單位:%

由表3可知,對齊自編碼器的評價指標較為均衡,各項指標都超過了95%,檢測效果優于其他模型,因而能夠應用于實際的異常聲信號檢測。

4 結束語

本文研究了變壓器聲音的異常檢測問題,主要討論了自編碼器結構、時延效應、序列對齊和異常信號的檢測過程,結論如下:

(1) 變壓器聲音訓練集和測試集提出了不同的分幀方式,訓練集各幀重疊占比較高,增加了樣本數量;驗證集各幀無重疊,加快了預測速度。

(2) 訓練模型改進了損失函數和激活函數,減少了噪聲干擾的同時降低了訓練次數。

(3) 提出了對齊自編碼器,利用序列對齊方法構造了對齊自編碼器,試驗結果顯示該模型的綜合評價指標達到了98.15%。

猜你喜歡
編碼器時延變壓器
理想變壓器的“三個不變”與“三個變”
基于GCC-nearest時延估計的室內聲源定位
基于改進二次相關算法的TDOA時延估計
基于FPGA的同步機軸角編碼器
開關電源中高頻變壓器的設計
基于PRBS檢測的8B/IOB編碼器設計
FRFT在水聲信道時延頻移聯合估計中的應用
一種不停電更換變壓器的帶電作業法
基于分段CEEMD降噪的時延估計研究
變壓器免維護吸濕器的開發與應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合