?

基于數字孿生與k-近鄰算法的車間設備運行狀態預測研究*

2024-03-15 07:37李忠鵬楊小紅
制造技術與機床 2024年3期
關鍵詞:車間準確率狀態

和 征 李忠鵬 楊小紅

(西安工程大學管理學院,陜西 西安 710048)

具有機械結構的復雜裝備和相應軟件共同組成了現代裝備[1],此類裝備在制造業企業生產車間能替代人工,但傳統生產車間必須能滿足布局規劃以及生產線優化的要求[2]。為支持智能制造的發展,德國提出了“工業4.0”、美國提出了“工業互聯網”,中國提出了制造業重要綱領[3-4]等,智能制造領域的產業發展,競爭愈發激烈。然而,傳統生產車間的設備數據實時交互性差,并且難以實現實時的可視化監控以及遠程運維的功能。因此,當下傳統生產車間已經很難滿足時代的要求,此時數字孿生車間應運而生[2],用以解決上述問題。近年來,將強化學習、深度學習與數字孿生結合的車間調度問題的研究較多[5-6],而k-近鄰算法能夠輔助修正深度學習的預測過程,將數字孿生效果發揮得更好[7]。綜上所述,數字孿生與k-近鄰算法相結合是學術界和企業界共同關注的問題。

針對設備運行狀態預測問題,學者們對其優化模型、算法實際應用以及數字孿生實際應用研究的較多?!肮I4.0”之前,智能制造涉及的人工智能算法領域僅為強化學習、深度學習等,但單純使用深度學習的智能算法存在較低的成功率和安全方面的問題[8]。因此k-近鄰算法因預測準確率較高、操作較為簡單等特點,引起了學者們的研究關注。

k-近鄰算法一般用于旋轉機器故障[9-10]、工業過程相關故障[11]、軸承系統故障[12]等方面的研究。也有學者使用k-近鄰算法預測設備運行參數,從而預測設備運行狀態[13]。數字孿生是“工業4.0”下智能工廠的關鍵模塊,基于數字孿生的智能裝配車間技術是實現智能制造的潛在途徑[14]。融入數字孿生的智能算法能夠很好地解決上述兩個方面的問題。數字孿生在生產車間應用的關鍵是如何有效地創建數字孿生模型,并使其作用于系統的整個生命周期[15-16]。通過數字孿生技術實時掌握車間設備的運行狀態,通過一系列算法實現設備運行狀態數據的深度分析與挖掘,進而預測設備的運行狀態和健康情況等,最后對這些結果進行可視化顯示[17]。因此,數字孿生、k-近鄰算法與車間設備運行狀態預測的結合勢在必行。

通過以上文獻分析可知,學者們對于車間設備故障預測的優化模型、算法實際應用以及數字孿生實際應用的研究較多,多數學者單純使用數字孿生模型或數字孿生與深度學習、強化學習相結合展開研究,而對數字孿生與k-近鄰算法相結合的研究很少。數字孿生與k-近鄰算法相結合能夠解決車間設備海量運行數據難以快速處理且實時跟進效果不強的問題,二者相結合的車間設備運行狀態預測模型的準確率高于深度學習的模型準確率?;诖?,本文構建了數字孿生與k-近鄰算法二者結合的車間設備運行狀態預測模型,最后對該模型進行實例驗證。通過本文的研究,希望對車間設備運行狀態預測方法的優化提供理論基礎和實踐依據。

1 理論基礎

1.1 數字孿生車間虛擬模型構建

車間作為企業生產的基本單元,其高效運行管理是提質增效的重要保障。為實現車間布局優化、工藝流程優化設計及智能決策與調度,諸多學者開展了數字孿生車間虛擬模型構建的相關研究。主要從以下兩方面展開:①對車間中的“人-機-物-環境”等生產要素進行建模,主要集中在幾何模型的構建以支持車間狀態的監控,但對車間的具體行為、規則等多維度刻畫不足,而且當前建模大多關注關鍵零部件、設備或產線等單一層級對象,缺乏從“單元級-系統級-復雜系統級”多層次角度對模型組裝與融合的系統研究;②在生產要素建模的基礎上進行車間數據實時動態性的研究,車間數據具備多源異構的特點,但當前大部分傳統車間數據采集方式仍為人工采集,雖然隨后出現了條形碼、RFID、傳感器等方式,但是又面臨信息傳輸不流暢、數據結構復雜、數據規模指數型增長等問題。數字孿生的全生命周期、實時性以及雙向性能夠更細致地描繪設備的運行情況,能夠使得產品生產數據更加精細化,進而求得更為準確的最小生命周期[2]。

1.2 k-近鄰算法

k-近鄰算法簡稱KNN,其功能在于為新數據進行分類。運用時,需要事先給定已知標簽類別的訓練數據集,然后輸入沒有標簽的新數據,將訓練數據集與新數據集做比較,最常用的比較標準為距離,計算訓練數據集與新數據集的距離,選定滿足標準的k個實例,若這k個實例多數屬于某種類別,則可判斷設備運行狀態屬于該類別。其中,距離的計算標準、k值的選取和k個實例所屬類別的判斷均需具體問題具體分析。k-近鄰算法流程如圖1所示。

圖1 k-近鄰算法流程

1.3 設備運行狀態分類標準

本文以機電設備為例,確定設備運行狀態的分類標準。當前對機電設備運行狀態進行分類的標準有兩個。第一個是由意大利都靈大學1990 年收錄的數據庫——機械分析數據庫,該數據庫收錄了某機電設備164 個運行樣本的6 種狀態模式,狀態模式1~6 分別為連接件故障、軸承失效、機械松動、基礎變形、不平衡和無故障/正常運行,見表1。第二個是意大利傳播科學研究中心收集的鋼板缺陷監測數據庫,該數據庫記錄了鋼板麻點、Z-劃傷等7種故障模式。由于本文研究的是生產車間設備運行狀態,與第一個數據庫符合度較高,因此運行狀態標準選擇第一個數據庫。機械分析數據庫中設備故障模式見表1。

表1 機械分析數據庫中設備故障模式

2 基于數字孿生與k-近鄰算法的車間設備運行狀態預測

2.1 數字孿生體的構建框架

在信息空間中,對車間中的“人-機-物-環境”等生產要素進行建模,構建車間設備實體的數字孿生模型,從“單元級-系統級-復雜系統級”多層次角度對模型進行組裝與融合,并建立設備實體與模型之間的虛實映射關系,設備實體與模型共同組成數字孿生體[2]。數字孿生體包括5 層,從下到上依次為:設備層、感知層、數據傳輸層、數據分析層和服務層,如圖2 所示。

圖2 數字孿生體構建框架

其中,設備層為車間的各類設備,是設備運行狀態預測的主要對象和基礎,為感知層提供運行數據、工作環境參數等信息。感知層包含一系列傳感器,如高靈敏度加速度計、加速度傳感器、激光測距儀等,對設備的振動速度、轉動加速度、位移等信息進行采集和傳輸。數據傳輸層處于感知層和數據分析層的中間,起到連接紐帶的作用,實現數據的傳入、運輸和空間存儲,該層利用數字孿生技術實時掌握車間設備的運行狀態。數據分析層利用機器學習模型實現設備運行數據的深度分析與挖掘,進而預測設備的運行狀態和健康情況等,該層通過數字孿生技術與k-近鄰算法的聯合,最終實現設備運行狀態數據的定量分析。服務層是實現設備調配的“窗口”,通過人機交互系統將設備運行狀態可視化顯示,實施對設備的合理調配。

2.2 數字孿生體的構建過程

制造車間的物理空間幾何參數、設備屬性等多類物理參數,可在各層之間進行傳輸和存儲??蓪底謱\生體構建框架轉化成高保真模型,通過軟件構建生產車間的超寫實仿真環境,通過設備、人員和環境等在線運行數據,實時更新構建好的車間模型與環境模擬參數,并對設備運行產生的離線數據進行模型訓練,從而迭代優化模型。將在線數據作為初始參數、離線數據作為先驗經驗,輸入到超寫實仿真環境中,進行高逼真度行為仿真,實現車間數字孿生體的構建,成功地將車間的實時狀態鏡像到虛擬空間。數字孿生體對于車間設備運行狀態的了解程度,遠高于車間操作員,通過車間設備的實時運行狀態在線可視化,為車間設備的實時調配提供決策指導。而機器學習算法主要應用于數據分析層中的預測行為以及服務層中的定量分析中。本文將對機器學習中的k-近鄰算法在車間設備運行狀態預測行為中的應用進行深入研究。

2.3 數據分析層中k-近鄰算法的具體預測過程

數據分析層中k-近鄰算法的具體預測過程包括5 個步驟:

步驟1:數據分析層對采集的實時特征數據按照相應參數標準進行異常值去除。

步驟2:將去除掉異常值的實時特征數據進行歸一化處理,使數據權重相等,且轉化為0~1 的數值,若對于設備運行狀態預測模型準確率要求較高,可選擇較高精確度的方法進行歸一化處理,反之則可選擇普通的方法,歸一化處理結束后的實時特征數據為原始數據。

步驟3:計算原始數據與歷史數據之間的歐幾里得距離,距離越小,代表設備當前的運行狀態越靠近歷史數據所標識的設備運行狀態,計算公式如式(1)所示。

式中:xi表示歸一化處理后的實時特征數據;yi表示已識別的特征數據。

步驟4:將步驟3 中計算出來的距離進行升序排序,選取前k個距離,統計k個距離的頻數,頻數中的最大值為眾數,此眾數對應實時特征數據所代表的設備運行狀態,即若前k個距離所對應的設備歷史運行狀態多數為某種運行狀態,則設備當前運行狀態即為這種運行狀態。

步驟5:根據“模型預測準確率=預測結果與實際結果一致的測試樣本數/測試總樣本數”計算模型預測準確率,最終輸出模型預測結果及準確率。

3 實例驗證

本文以制造業企業生產車間機電設備運行狀態數據為研究對象,進行實例驗證。驗證數據來源于CDA 菊安醬機器學習內部學習訓練數據和52phm公開故障診斷和故障預測數據?;跀底謱\生與k-近鄰算法的車間設備運行狀態預測過程包括3 個步驟:獲取原始數據、初步處理采集的數據(異常值去除和歸一化處理)和設備運行狀態預測(劃分訓練集與測試集、計算歐幾里得距離和預測設備運行狀態)。

3.1 獲取原始數據

構建車間機電設備實體在信息空間中的數字孿生模型,并建立機電設備實體與模型之間的虛實映射關系,機電設備實體與模型共同組成數字孿生體。

設備層包括制造業企業生產車間的機電設備;感知層通過各類傳感器采集機電設備的每小時振動速度、加速度、每小時位移、震動頻率以及溫度這5 類實時特征數據;數據傳輸層使用傳輸控制協議TCP,將感知層采集的5 類實時特征數據傳輸到數據分析層進行存儲和分析。

3.2 初步處理采集的數據(異常值去除和歸一化處理)

在數據分析層,首先,對采集的5 類實時特征數據按照“振動速度異常值范圍為>40 000 mm/h,加速度異常值范圍為≥35 g/s,位移異常值范圍為≥2 mm/h,震動頻率異常值范圍為<4.5 Hz/s,溫度異常值范圍為30~50 ℃”的標準進行異常值去除;其次,將去除掉異常值的實時特征數據進行歸一化處理,使5 類實時特征數據權重相等,且均轉化為0~1;若車間對于預測模型準確率要求較高,可選擇較高精確度的方法進行歸一化處理,反之則可選擇普通的方法,歸一化處理結束后的實時特征數據為原始數據,存儲為data.txt 文本文件。

整合后的數據集包含1 000 組原始數據,其中100 組數據被劃分為測試集,900 組數據集被劃分為訓練集,由于數據量較大,能夠很好地模擬車間機電設備日常運行狀態的數據量,因此選擇該數據集作為驗證數據集,部分數據集展示見表2。

表2 部分初始數據

3.3 設備運行狀態預測

在Jupyterlab 軟件中新建.ipynb 文件,將data.txt導入到.ipynb 文件相同工作路徑下,將原始數據進行模型訓練集與測試集的劃分,隨機選擇90%的原始數據作為模型的訓練集,10%的原始數據作為測試集,訓練集用來訓練模型,測試集用來驗證模型的準確率,訓練集比例越高,設備運行狀態預測的準確率越高。表2 數據歸一化處理后的結果見表3。

表3 歸一化處理后的部分數據

首先,在Jupyterlab 軟件中導入Python 中的pandas 包,使用datingClass 函數構建參數為“train”“test”“k”的數據分類器。其中,“train”代表訓練集;“test”代表測試集;“k”為超參數,代表選取的歐幾里得距離個數。

其次,在數據分類器中使用字典dict 構建數據集,并將數據集轉化成DataFrame 形式;根據式(1)計算原始數據與歷史數據之間的歐幾里得距離,距離越小,代表設備當前的運行狀態越靠近歷史數據所標識的設備運行狀態。

最后,使用list 函數將計算出來的歐幾里得距離進行存儲,并使用sort_values()[:k]函數對距離進行升序排序。選取前k個距離,使用value_counts()函數計算k個實時特征數據的頻數,頻數中的最大值為眾數,眾數對應實時特征數據所代表的設備運行狀態;若前k個距離所對應的設備歷史運行狀態多數為某種運行狀態,則設備當前運行狀態即為這種運行狀態。本文選取的k值為5,模型預測結果見表4。

表4 模型預測部分結果及準確率

由表4 可知,測試總樣本數為100 組,其中,預測結果與實際結果一致的測試樣本數為96 組,根據2.3 節步驟5 中的計算公式可得,模型預測準確率=96/100=96%,可見機電設備運行狀態的預測結果與實際結果幾乎一樣。

4 設備運行狀態預測算法對比

目前常用的設備預測算法有卷積神經網絡、隨機森林、因子分解機和支持向量機。卷積神經網絡和因子分解機雖然能夠處理高維度數據,但卷積神經網絡較容易丟失大量有價值信息,如果網絡層次太深,則會導致計算速度變慢,并且其運行過程屬于黑盒運行,不易操控[18];因子分解機主要適用于風險分析,對于設備運行狀態預測的效果較差[19];隨機森林和支持向量機在數據分類以及預測中的表現并不理想,且后者難以處理大規模樣本[20-22]。而k-近鄰算法適用于大規模樣本的處理,思想簡單,過程中無假設,設置好k值,即可白盒運行,準確率高,在數據分類中表現較好,且通過實例驗證,k-近鄰算法在設備運行狀態預測模型中的準確率高達96%,因此本文采取的方法是有效可行的。5 種設備運行狀態預測算法對比見表5。

表5 設備運行狀態預測算法對比

5 結語

本文采用數字孿生技術,構建了車間設備運行的數字孿生模型,并將k-近鄰算法融入數字孿生模型中,使用k-近鄰算法對車間設備運行狀態進行預測,經過實際算例驗證了預測模型的可行性。研究表明,通過k-近鄰算法與數字孿生技術相結合,能夠很好地將車間設備運行數據作為初始參數輸入到預測模型中,生成測試集與訓練集,通過訓練集的狀態標簽標記,從而預測設備的實時運行狀態。本文所提出的車間設備運行狀態預測模型具有以下優點:

(1)具備較強的預測能力,實時性較強。k-近鄰算法與數字孿生技術相結合,構建的車間設備運行狀態預測模型,不僅能夠實時采集、傳輸和處理車間設備運行數據,這些數據作為初始參數形成模型的訓練集和測試集,而且能夠較為真實和準確地預測設備運行狀態,作為先驗經驗運用到車間設備實時調度決策中。

(2)能夠促進傳統車間的數字化轉型。k-近鄰算法屬于簡單的機器學習算法,但是在制造業企業生產車間的應用還很少。從簡單機器學習算法的應用著手,可以證明人工智能技術在制造業企業中的應用具有了一定的成效。制造業企業可以更多地引入人工智能技術進行車間生產流程的改良,通過人工智能技術的應用和推廣,從而促進企業的數字化轉型。傳感器參數、圖像采集裝置參數均可依據生產車間的具體情況進行靈活調整,對于數字孿生的應用也有經驗可循,這也增加了企業數字化轉型的信心。

本文所構建的模型雖然能夠預測車間設備運行狀態,但還存在一些欠缺的地方,進一步研究工作可以從以下幾方面考慮:

第一,算法模型方面。k-近鄰算法屬于簡單的機器學習算法,與當今人工智能算法發展階段相差較遠,未來可加入具備自我學習能力的算法進行設備運行狀態預測。

第二,模型應用方面。本文提出的預測模型的構建背景為制造業企業的生產車間,所涉及的問題較為簡單,可以將模型構建的背景拓展到復雜性更高的柔性車間設備運行狀態預測問題中。

猜你喜歡
車間準確率狀態
100MW光伏車間自動化改造方案設計
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預報參考產品質量檢驗分析
狀態聯想
招工啦
高速公路車牌識別標識站準確率驗證法
生命的另一種狀態
“扶貧車間”拔窮根
把農業搬進車間
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合