?

基于支持向量數據描述的往復式注水泵健康度評價方法

2024-01-06 03:08王文明張永鑫侯春來王禹琪王海龍李志偉
石油科學通報 2023年6期
關鍵詞:注水泵球體測點

王文明,張永鑫,侯春來,王禹琪,王海龍,李志偉

1 中國石油大學(北京) 機械與儲運工程學院海洋油氣智能裝備實驗室,北京 102249

2 長慶油田分公司第四采油廠,靖邊 718500

0 引言

注水泵是油田注水作業工藝中的“心臟”設備,由于實際生產中注水壓力需求較高,常采用柱塞式往復注水泵進行作業。然而,由于惡劣的工作環境,注水泵易損部件的故障率較高,容易出現軸瓦損壞、缸體與十字頭磨損嚴重、電機燒損等問題,從而影響整個注水系統的平穩安全運行。針對上述問題,研究往復式注水泵的健康狀態定量評估,及時發現設備故障狀態,將為后續優化維修策略提供依據,對保障注水系統的安全運行具有重要意義。

往復式注水泵設備健康度評價流程主要分為數據采集、數據預處理和健康度計算3 部分。數據采集方面,由于體現注水泵健康狀態的性能參數主要為機械零部件的振動信號,通常將振動信號作為注水泵的健康度評價指標。針對泵類設備的健康狀態評價方法,目前主要以健康狀態分類和故障診斷研究為主,對注水泵的健康程度量化的相關研究較少。國內學者如左學謙等[1]基于模糊層次分析法建立了柱塞泵的健康狀態評估模型,成功應用于油田用柱塞泵的故障定位與健康狀態分類,判斷矩陣的選取主觀性較強,導致在實際應用中自適應能力較弱;王前江等[2]使用經驗模態分解(Empirical Mode Decomposition,EMD)對采集的信號進行降噪處理,提取信號特征指標后利用核熵成分分析實現了對離心泵的健康狀態客觀評價,EMD方法存在模態混疊和端點效應問題[3];魏曉良等[4]基于長短時記憶和卷積神經網絡相結合的方法,實現了對高速柱塞泵的故障診斷,基于大數據的機器學習分類方法又需要大量設備運行數據,尤其是設備異常數據用于訓練健康狀態分類模型,但在實際生產工作中,大多數設備處于健康工作狀態,故障數據較少,因此容易造成樣本不均衡問題。國外學者如HANCOCK等[5]采用小波包分析方法對立式泵的振動信號進行分解,將包含泵正常和故障狀態特征信號的數據包輸入自適應神經模糊推理系統,實現了對泵的健康狀態分類,但小波包分解中閾值和小波包基函數的選取對降噪結果影響較大,導致自適應能力不強;Lee等[6]利用卡爾曼濾波將液壓齒輪泵的振動信號與壓力信號進行融合,提取特征后利用長短時記憶神經網絡成功對齒輪泵進行了健康指數分析及壽命預測,Orrù PF等[7]采集離心泵的溫度、振動、壓力信號,采用多層感知機與支持向量機相結合的方法,實現了對離心泵潛在故障的識別與分類,但這些方法同樣需要大量故障數據進行訓練機器學習模型,易造成樣本不均衡的問題。

結合上述研究中存在的優點和問題,本文借鑒變分模態分解(Variational Mode Decomposition, VMD)與支持向量數據描述(Support Vector Data Description,SVDD)相結合的方法[8]。對往復式注水泵進行健康度評價計算,該方法在液壓泵與火炮自動機的健康狀態監測及評價中已取得較好的實際應用效果[9-10]。算法流程:利用VMD方法對注水泵的振動信號進行分解,提取模態分量的排列熵(Permutation Entropy,PE)組成注水泵健康度評價特征向量;采用SVDD在單值分類問題上的優勢,僅使用健康狀態運行下注水泵數據樣本的特征向量進行SVDD超球體模型的構建,引入粒子群優化(Particle Swarm Optimization,PSO)算法對模型參數進行優化;計算注水泵不同健康狀態的數據到超球體球心的距離D,參考隸屬度函數進行公式擬合,實現注水泵的健康度定量評價。

1 算法簡介

1.1 變分模態分解

VMD[11]是2014年出現的一種自適應信號分解方法,與經驗模態分解法相比,VMD算法將最優分解問題轉化為變分約束問題,可將信號分解為K個有限帶寬且帶有中心頻率的本征模態函數(Band-Limited Intrinsic Mode Function,BIMF)分量,有效抑制了EMD算法中的模態混疊問題,具有較高的運算效率和抗噪能力。

為檢驗VMD算法相較于其他數據預處理方法的優勢,從采集到的注水泵振動信號中隨機截取100個數據點,然后分別利用EMD、集合經驗模態分解(Ensemble Empirical Mode Decomposition,EEMD)[12]、自適應噪聲完備集合經驗模態分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)[13]、VMD算法對截取的信號進行分解。將分解得到的BIMF分量用頻譜圖(圖1)的形式展現,比較信號分解效果。觀察圖1 可以得出,相較于其他信號處理方法,VMD能更明顯的將信號的不同頻率成分分解到不同的BIMF分量中,而且有效抑制了模態混疊問題。

圖1 信號處理方法BIMF分量頻譜圖Fig. 1 Spectrogram of BIMF component of each signal processing method

1.2 排列熵

熵值可體現出信號序列的復雜程度,當機械設備出現故障時,其振動信號的信息熵會發生改變,因此可以通過信息熵的變化間接判斷出注水泵設備的健康狀態變化情況。常見的信息熵有近似熵(Approximate Entropy, AE)[14]、 樣本熵(Sample Entropy, SE)[15]、 模糊熵(Fuzzy Entropy,FE)[16]、 排列熵(Permutation Entropy,PE)[17]等。根據目前學者的研究[18],對比這幾類信息熵,排列熵可有效反映非平穩信號隨時間序列的微小變化,對實時的數據變化有很強的敏感性,具有計算量少、魯棒性強、靈敏度高等優點,目前已廣泛應用于機械設備故障診斷、健康狀態監測等領域[19-20]。因此本文提取注水泵振動信號的排列熵構建特征向量,用于后續注水泵健康度評價的相關計算。

1.3 支持向量數據描述

支持向量數據描述[21]的核心思想是利用核函數對樣本進行非線性映射,映射到高維的內積空間,在特征空間中尋找一個盡可能多地包含樣本且體積最小的超球體(最優超球體),使用同樣的映射算法將待測試數據集映射至高維空間,計算數據點到超球體中心的距離D,與超球體半徑R相比較便可以判斷其是否正常,如圖2 所示。SVDD可以只對設備健康運行數據進行最優超球體模型的構建,同時將樣本映射到高維空間也降低了不均衡數據中樣本重疊的風險,因此相對于其他分類學習方法,SVDD分類精度更高。

圖2 SVDD超球體示意圖Fig. 2 Schematic diagram of SVDD hypersphere

1.4 粒子群優化算法

選擇高斯核作為SVDD模型搭建過程的核函數,其關鍵參數為懲罰因子C和高斯核參數s,超球體的體積也主要由懲罰因子C和高斯核參數s決定[22]。懲罰因子C可以控制模型的復雜度,s不變時,隨著C的增加,排除在超球體之外的樣本受到的懲罰變重,對大樣本數據的分類效果越差。高斯核參數s的大小影響支持向量的數量,當C不變時,s越小,支持向量越多,容易導致超球體模型過擬合。因此這2 個參數的選取對SVDD算法的準確率和魯棒性有很大的影響。為了提高SVDD算法的性能,引入粒子群優化(PSO)算法對懲罰因子C和高斯核參數s進行優化。

PSO算法主要模擬鳥類覓食的遷移和聚集行為[23]。PSO優化SVDD參數的步驟[24]如下:

(1) 初始化

任意分配初始值給SVDD的懲罰因子C與核函數參數s。

(2) 評價適配度

用C和s表示的待優化的每個粒子來訓練SVDD,并計算每個粒子的適配值F,計算公式為:

式中:y為測試樣本的正確分類數;N為測試樣本總數。

(3) 迭代更新

假設在一個n維空間中,種群X包含m個粒子,即X=[x1,x2, …,xm],那么第i個粒子的位置為xi=[xi1,xi2, …,xin],第i個粒子的歷史最優位置為,速度為,群體的最佳位置。對于每個粒子,將C和s下的當前適配值與上一步得到的最佳歷史適配值進行比較,如果當前的適配值優于歷史最優適配值,則在每次迭代中更新粒子的歷史最優值C和s,求解粒子速度和位置的公式為:

式中,i為粒子數;d為粒子維數;k為迭代次數;w為慣性權重;r1,r2為[0,1]之間的隨機數;c1和c2為學習系數,c1代表粒子跟蹤自身歷史最優值的系數,c2代表當前粒子對全局最優粒子學習程度的系數。

(4) 迭代結束

設定最大迭代次數作為迭代終止條件,當達到最大迭代次數時輸出SVDD參數最優解。

2 數據采集

2.1 往復式注水泵現場情況

長慶油田某注水泵房為往復式柱塞泵,注水壓力需求較高,泵體內部振動無法避免。部分注水泵因安裝及工藝布局問題振動較為明顯,影響正常注水。因此需要對其注水泵進行振動監測,并進行健康度評價,從而能第一時間發現泵的異常狀態,避免因不及時維修造成的嚴重損失。

選用3 臺型號相同但健康狀態不同的三缸柱塞泵為研究對象,其中第1 臺為剛安裝一個月的健康運行注水泵I,第2 臺為運行半年、未發生過故障的健康狀態注水泵Ⅱ,第3 臺為振動嚴重以致更換為臨時管線的健康狀態較差的注水泵Ⅲ,主要參數如表1 所示。

表1 注水泵主要參數Table 1 Main parameters of injection pump

現場采集設備振動數據,分別進行健康度評價,與設備實際健康狀態進行對比。注水泵現場圖片如圖3 所示。

圖3 注水泵現場圖片Fig. 3 On-site picture of injection pump

2.2 注水泵運行數據采集

(1)振動數據采集設備

選用壓電式加速度傳感器PCB 352C33,靈敏度為100 mVg,最高分辨率1 μg,同時選用美國NI(National Instruments)公司生產的NI 9234 型4 通道數據采集器進行傳感器數據的采集,其模擬電壓的采集范圍為±5 V,最大采樣率51.2 kS/s。根據采樣定理,采樣頻率必須大于信號成分中最高頻率的2 倍,本研究項目中采樣頻率設為1652 Hz。使用LabVIEW軟件編程實現數據的可視化,測量系統及程序界面如圖4 所示。

圖4 采集設備展示Fig. 4 Collection equipment display

(2)測點布置

振動信號采集另一個關鍵是測點的布置。測點的選取原則是基于用盡量少的測點,采集到盡量多的設備運行信息。研究項目中振動測點均在機殼表面,每臺注水泵有4 個測點,注水泵平面結構圖如圖5 所示,測點分別位于:泵閥入口、十字頭部位、曲軸輸入端、驅動電機輸出端,分別對應圖6 的1、2、3、4 標記點位置。

圖5 注水泵平面結構Fig. 5 Plane structure of injection pump

圖6 測點布置Fig. 6 Measuring point layout

各測點振動信號單次采樣時間為10 s,每間隔10 min采樣一次,采樣5 次,則每臺注水泵采集到20個樣本,3 臺注水泵共采集到60 個樣本,每個樣本中有約21 000 個數據點,利用這些樣本數據進行后續的注水泵健康度分析。

3 數據預處理

采集的振動數據在進行VMD分解之前,首先需要確定分解層數K的取值。從健康注水泵I的4 個測點的數據樣本中,每個測點隨機抽取一個樣本,從抽取的4 個樣本中各截取1000 個數據點作為K值計算樣本,分別使用依次增加的K值對其進行VMD分解,以泵閥處樣本數據為例,不同分解層數K對應的各BIMF分量的歸一化中心頻率如表1 所示。相鄰分量中心頻率的差值越小,則越容易出現模態混疊(過分解)現象,觀察表2 可知,當K值為6 時,第一次出現0.2657 Hz和0.2464 Hz這2 個相近的中心頻率,即可認為發生了過分解,因此分解層數確立為5。

表2 泵閥待評價樣本不同K值下的歸一化中心頻率Table 2 The normalized center frequency of the pump valve under different K values of the sample to be evaluated

將各測點樣本數據按照確立的分解層數分解,并進行頻譜分析得到圖7。

圖7 不同測點樣本數據VMD分解及頻譜分析Fig. 7 VMD decomposition and spectrum analysis of sample data at different measurement points

從圖7 可以看出,VMD方法可以準確地將振動信號分解為從低頻到高頻的多個單分量模態信號,且各測點BIMF分量的中心頻率沒有發生混疊現象。按照同樣的方法,經計算,十字頭、曲軸、電機測點處數據的VMD分解層數K分別確立為4、5、3。

確定好各測點數據的分解層數后,再隨機從注水泵I 4 個測點的數據樣本中,每個測點各抽取1 個樣本,然后將抽取的數據樣本各截取20 000 個數據點,按每組1000 個數據平均分為20 組,共獲得80 組數據作為注水泵健康度評價模型的數據基礎。對每組數據按照各自位置確定的分解層數K值進行VMD分解,即每組泵閥處樣本數據分解為5 個BIMF分量、每組十字頭處樣本數據分解為4 個BIMF分量、每組曲軸輸入端處樣本數據分解為5 個BIMF分量、每組電機輸出端處樣本數據分解為3 個BIMF分量,計算所有分量的排列熵,最后將每組分量的排列熵同樣按照泵閥、十字頭、曲軸、電機的順序組合成17 維特征向量,作為健康注水泵I的特征向量,如表3 所示。

表3 各測點振動信號模態分量的排列熵值(部分)Table 3 Arrangement entropy of modal components of vibration signal at each measuring point (part)

4 健康度計算

4.1 健康度定量評估

基于1.3 和1.4 的算法理論,取上述健康注水泵I的特征向量作為訓練樣本,輸入用Matlab搭建的PSO-SVDD算法程序構建超球體模型。訓練樣本經PSO-SVDD方法訓練后得到優化后的懲罰因子C=0.7563,高斯核參數s=8,超球體模型的半徑R=0.0413。超球體模型搭建完畢,再從注水泵I、注水泵Ⅱ及注水泵Ⅲ的各測點數據樣本中各隨機抽取一個樣本,按照上述注水泵I特征向量的構建方法構建測試樣本特征向量。最后將測試樣本特征向量輸入搭建的超球體模型中,通過歐氏距離法[25]得到各個樣本點到超球體球心的距離D如圖8 所示。

圖8 不同樣本點到超球體球心距離Fig. 8 Distances from different sample points to the center of the hypersphere

由圖8 可知,注水泵I、注水泵Ⅱ的測試樣本數據中,絕大部分到超球體球心的距離D小于超球體半徑R,即數據點在超球體內部,說明注水泵處于健康狀態。而對于健康狀態較差的注水泵Ⅲ,其所有樣本數據到超球體球心的距離D均大于超球體半徑,即數據點均在超球體外部,說明注水泵Ⅲ的運行狀態與健康狀態注水泵相比產生了較大偏差,健康狀態較差。計算結果與現場注水泵的實際健康狀態相符,證明了算法的可靠性。

為進一步對注水泵的健康狀態進行定量評估,引入變形后的隸屬度函數[26]將注水泵樣本數據距離超球體球心的距離D轉換為健康度H。根據樣本數據距離超球體球心的距離越大,則注水泵健康狀態越差的特點,設置當D小于R時,用二次項公式擬合H與R的線性關系,且滿足D=R時,健康度約為90 分;當D>R時,用變形后的降半柯西型公式進行擬合,并滿足拐點處健康度約為60 分,基于上述條件擬合公式確立為:

將此擬合公式用于定量評估注水泵健康度,得到2 臺測試用注水泵的健康度評價曲線如圖9 所示。

圖9 注水泵健康度評價結果Fig. 9 Health evaluation results of water injection pump

從圖9 中可以看出,注水泵I和注水泵Ⅱ健康度分值基本在90 分以上,總體上說明兩泵均處于健康狀態;而注水泵Ⅲ健康度分值普遍在70 分左右,說明健康狀態較差,與實際情況相符,證明了定量評估健康度算法的可靠性。

4.2 算法對比

為驗證PSO-SVDD相較于其他方法優化模型的準確性,采用與上文相同的注水泵訓練樣本數據,利用五折交叉驗證法,將訓練樣本數據平均分為5 組,每次選取4 組數據作為訓練集,剩余1 組作為測試集,輪流選取5 次,每次都將訓練集分別利用單SVDD方法、貝葉斯優化(Bayesian Optimization Algorithm,BOA)[27]SVDD(BOA-SVDD)方法、遺傳算法(Genetic Algorithm,GA)[28]優 化SVDD(GA-SVDD)方 法 及PSO-SVDD方法進行超球體模型的搭建,將測試集輸入超球體模型,計算測試集數據映射后落在超球體內部的比率,作為模型的準確率,最后分別將5 次的準確率取平均值,得到每個算法的綜合準確率。其中單SVDD方法根據經驗手動調參,最終設置懲罰因子C=0.3,高斯核參數s=5。計算結果對比如表4 所示。

表4 各算法計算結果對比Table 4 Comparison of calculation results of various algorithms

由表4 數據可得,使用不同算法優化參數后得到的高斯核參數s幾乎相同,此時BOA-SVDD、GASVDD和PSO-SVDD這3 種方法的懲罰因子C依次減小,得到SVDD模型的準確率依次提升,驗證了前文所述研究結果:即當s不變時,隨著C的增加,對樣本數據的分類效果越差,建立的模型準確率也越低。PSO-SVDD準確率為95%,相比于其他3 種評價方法的準確率分別提高了15%、10%和10%,準確率最高,證明更適合應用于對注水泵設備的健康度評價。

5 結論

本文結合VMD與PSO-SVDD方法對實際工程中的注水泵進行了健康度評價研究。該評價方法結合了VMD和SVDD算法的優點,同時考慮了健康度定量評估的準確性和真實性,主要結論如下:

(1)利用VMD對數據集進行變分模態分解,相比EMD等算法,可有效抑制模態混疊現象。計算模態分量的排列熵組成特征向量,保留注水泵健康狀態特征的同時,極大提高了計算效率。

(2)建立了一套可用于對注水泵進行健康度定量評價的方法流程,該方法無需大量設備故障數據,僅利用健康狀態注水泵的各測點振動數據,便可建立健康度評價算法模型。

(3)將健康狀態不同注水泵的特征向量數據輸入到搭建好的健康度算法模型中測試,然后將測試結果與注水泵的實際健康狀態進行對比,得出所提出的健康度評價方法能夠真實有效地對注水泵的健康度進行定量評估。

(4)對比了單SVDD、BOA-SVDD、GA-SVDD與PSO-SVDD方法的準確率,結果表明PSO-SVDD方法的準確性最高,進一步驗證了該方法的實用性。

猜你喜歡
注水泵球體測點
液壓支架整機靜強度試驗及等效應力分析
海上平臺大流量BB3型高壓注水泵的研制和試驗驗證
基于CATIA的汽車測點批量開發的研究與應用
越來越圓的足球
計算機生成均值隨機點推理三、四維球體公式和表面積公式
環狀注水管網注水泵優化運行
廣告創意新方法——球體思維兩極法
淺析注水泵節能措施及應用效果
Optimization of rice wine fermentation process based on the simultaneous saccharification and fermentation kinetic model☆
拱壩結構損傷的多測點R/S分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合