?

基于GA-LM-BP神經網絡的拖拉機可靠性預測

2023-09-20 11:25文昌俊邵明穎徐云飛
計算機仿真 2023年8期
關鍵詞:拖拉機遺傳算法神經網絡

文昌俊,邵明穎,徐云飛,陳 哲

(1.湖北工業大學機械工程學院,湖北 武漢 430068;2.湖北省現代制造質量工程重點實驗室,湖北 武漢 430068)

1 引言

隨著農業機械的智能化和自動化發展,拖拉機可靠性逐步提高,但其使用環境復雜,在工作過程中會遇到各種問題,如高溫、高濕、高阻力等,這些因素對拖拉機系統可靠性產生重大影響。因此,科學準確地預測拖拉機工作可靠度是現代農業耕作的必然要求。BP神經網絡有較強的非線性映射能力和自主適應能力,在回歸擬合、可靠性工程等領域得到了廣泛應用[1-3]。馮瑞龍[4]等選取RBF和BP兩種三層神經網絡對低真空管道中運行列車的最大阻力進行預測研究,結果表明RBF神經網絡模型能更好地預測列車的最大阻力。李鑫[5]等建立BP神經網絡模型來預測刀具磨損和切削阻力,相較于經驗公式得到了更優的結果,為刀具結構的優化及加工參數的選擇提供了依據。張波[6]等利用DBSCAN聚類算法改進人工神經網絡,搭建模糊神經網絡模型,將最小二乘法與BP算法相結合對模型進行訓練,來預測拖拉機耕作過程中受到的牽引阻力,此模型相較于支持向量機和隨機森林有著更好的預測效果。溫昌凱[7]等基于大數據的拖拉機田間工作平臺構建了BP神經網絡模型,對拖拉機田間作業質量進行預測評價。王森[8]等利用LM算法改進BP神經網絡,建立LM-BP神經網絡模型對彈丸的落地點進行預測,此模型相較于數值分析法能更好地預測到彈丸的降落位置。然而,上述文獻中所運用的BP神經網絡訓練時間過長,網絡預測值與真實值的誤差較大,而LM算法屬于局部優化算法,對初值的要求比較高,若神經網絡初值選取不合理,會導致網絡訓練失敗。

針對上述神經網絡在預測過程中存在的缺陷,建立GA-LM-BP神經網絡拖拉機可靠性預測模型,將遺傳算法的全局收斂能力與LM算法的局部尋優能力相結合。首先將現場跟蹤實驗所獲得的數據進行預處理,剔除由人員操作不當引起的無效故障時間,然后建立神經網絡模型,進行仿真,最后與經典BP神經網絡、LM-BP神經網絡進行預測精度對比分析,從而驗證遺傳算法和LM算法優化BP神經網絡的有效性及可行性。

2 BP神經網絡模型

BP神經網絡是一種按誤差逆向傳播算法訓練的多層前饋神經網絡[2]。信號正向傳播,通過目標函數計算輸出值;誤差反向傳播,根據模型輸出值與期望值之間的誤差反向逐層調整各連接權值和閾值。此模型具有優良的非線性逼近能力[9]。

BP神經網絡神經元的凈激活量為

(1)

神經元節點的輸出

yi=f(neti)

(2)

若用X表示輸入向量,用W表示權重向量

X=[x0,x1,x2,…,xn],W=[wi0,wi1,wi2,…win]T

(3)

則有

neti=XWyi=f(XW)

(4)

式中wij是神經元j與神經元i之間的連接權值,θ表示閾值,xj為上一個神經元j的輸出信號。使用BP神經網絡進行訓練時,首先要初始化網絡參數,樣本輸入必須是成對出現的,設第k組樣本輸入:Xk=(X1k,X2k,…,Xnk),則必須有相對應的輸出:Yk=(Y1k,Y2k,…,Ymk)。將目標函數定義為

(5)

式中,N為訓練樣本集,Yi為網絡輸出的預測值,i為期望值,當二者的誤差值達到設定精度時,訓練結束,否則進入誤差反向傳播環節,逐層調整各連接權值

(6)

式中,η為學習速率,η>0。

由于BP神經網絡拓撲結構的選擇沒有統一規則,權值根據局部改進的方向逐步調整,可能會忽視全局極小值點,陷入局部最優,并且,若初值選取不當,網絡訓練速度就會比較慢。因此,提出利用LM算法和遺傳算法來優化經典BP神經網絡,以提高網絡模型的預測精度和收斂速度。

3 BP神經網絡模型的優化設計

3.1 LM算法及遺傳算法原理

LM(Levenberg-Marquardt)算法是一種基于標準數值優化技術的快速算法,其阻尼因子可以根據迭代結果動態調整,因此可以動態調整迭代的收斂方向。采用LM算法優化BP神經網絡,既能提高網絡的訓練速度,又能保證其良好的訓練精度[10]。下面對LM算法的基本原理進行簡單闡述[11]。

網絡的性能函數為

(7)

式中,ei(w)為誤差,w為權值和閾值向量。假設第K次的權值和閾值向量為w(k),第k+1次的權值和閾值向量為w(k+1),權值和閾值的修正量如下

Δw=-[JT(w)J(w)+μI]-1JT(w)e(w)

(8)

式中,I為單位矩陣,μ為阻尼因子,J(w)為Jacobian矩陣,其計算方式如下

(9)

LM算法有著較高的精度和較快的收斂速度,但其對初始值尤為敏感,若初始值選擇不當,會導致系統迭代誤差較大。從本質上來講,LM 算法屬于局部優化算法,進行迭代時僅考慮目標函數的下降方向,并未兼顧目標函數的大小,這就導致LM算法只能收斂至初始值附近的極小點[12],因此神經網絡初始值的選取尤為重要,故采用遺傳算法迭代尋優后的計算結果作為LM算法的初始值。

遺傳算法(GA,Genetic Algorithm)是使用生物學中的進化理論來模擬數據進化的一種智能算法[13,14]。首先選擇恰當的適應度函數,對編碼后種群個體的適應度值進行計算,然后選擇并重復適應度最佳的個體進行基因突變操作,進而計算新種群個體的適應度,若滿足初始設定條件,則輸出,否則,迭代繼續[15]。該算法能在全局范圍內搜尋最優估計解,不易陷入局部極值。

3.2 基于GA-LM算法的神經網絡模型建立

將收集到的拖拉機故障時間數據進行預處理,確定神經網絡的拓撲結構。利用遺傳算法全局搜索能力強的優點,將由遺傳操作選擇出的權值和閾值輸入神經網絡,作為網絡訓練的初始值,然后再利用LM算法局部尋優效果好的優點進行小范圍的精確求解,從而提高神經網絡的收斂速度、準確度和預測精度。

本文采用單隱含層的三層神經網絡結構,將拖拉機的故障時間作為網絡的輸入,可靠度R(t)作為網絡的輸出。設置網絡最大訓練次數為10000,目標誤差為0.001,學習速率為0.01,選擇tansig函數作為輸入層到隱含層的傳遞函數,purelin函數作為隱含層到輸出層的傳遞函數。

網絡訓練精度、收斂速度與隱含層節點的數目有著重大關系。節點個數選擇的常用經驗公式為

(10)

式中,l、m、n分別為隱含層、輸入層、輸出層神經元的個數,c為1~10之間的常數。由式(10)多次調整隱含層節點的個數可知,當l=5時,網絡性能最好,因此選擇5個隱含層節點。根據上述神經網絡拓撲結構建立基于遺傳算法和LM算法的BP神經網絡模型。GA-LM-BP神經網絡拖拉機可靠性預測流程圖如圖1。

圖1 GA-LM-BP神經網絡拖拉機可靠性預測流程圖

其步驟可總結如下:

1)產生初始化種群,設置變異概率Pm=0.1,交叉概率Pc=0.8,種群規模為M=30,最大遺傳代數G=100。

2)個體適應度值計算,網絡預測值Ri與期望值i之間的誤差平方和被用作適應度函數。適應度值越低,優化效果越好。

3)選擇和復制,使用輪盤賭算法優先選擇和復制種群中適應度優良的個體。

4)交叉操作,根據交叉概率,交叉互換上一步驟所選個體的等位基因。

5)突變操作,設定合適的突變幾率,隨機地修改個體中的一個或多個基因值,用來形成全新個體,從而提高群體的生物多樣性。

6)返回步驟2),再次計算個體的適應度值,直到適應度值達到最優或者迭代100次之后,進入下一步。

7)解碼,經一系列遺傳變異尋得了較優的權值和閾值,將其輸入神經網絡,作為LM算法的初始值。

8)計算神經網絡的誤差值,利用LM算法對權值和閾值進行微調,當誤差達到所設定的精度時停止訓練。

4 拖拉機可靠性預測

4.1 數據處理

根據現場跟蹤實驗,將收集到的23臺某輪式拖拉機的117個故障時間數據t按從小到大的順序排列為t(1)≤t(2)≤…≤t(a)≤…≤t(B),則該拖拉機的經驗分布函數FB(t)為

(11)

式中,a為按照從小到大順序排列好的故障時間順序號,B為故障時間總數,B=117。

將排列好的117個故障時間數據分為19組,前18組每組6條數據,最后一組9條數據,每組的第6條數據作為測試樣本,其余98條數據作為訓練樣本訓練神經網絡。為了預測的準確性,對數據進行歸一化處理,將其轉化為[0,1]之間

(12)

式中input(xa)為故障時間進行歸一化之后,神經網絡的第a個輸入,ta為第a個故障發生的時間,tmax為所收集到的樣本中故障時間最大值,tmin為故障時間最小值。根據式(11)和(12)對數據進行處理,處理后的部分數據見表1。

表1 處理后的部分數據

4.2 仿真與分析

首先由訓練樣本訓練神經網絡,然后輸入測試樣本進行拖拉機可靠性預測。使用遺傳算法初步優化神經網絡的權值和閾值,其適應度曲線先呈現下降的趨勢,迭代18次之后收斂,而后逐漸趨向平穩狀態,迭代過程如圖2。

圖2 遺傳算法收斂曲線

將遺傳算法迭代后的權值和閾值輸入BP神經網絡,再由LM算法進行局部優化,BP神經網絡的網絡訓練性能曲線如圖3。

圖3 網絡訓練性能曲線

由圖3可知,網絡迭代6次后的訓練精度為0.00038,達到并超過設定值0.001,結果表明,優化后的BP神經網絡模型收斂速度較快,能很快達到所設定的誤差精度。模型預測值與期望值之間的可靠度對比曲線如圖4,網絡訓練的絕對誤差如圖5。

圖4 GA-LM-BP神經網絡模型可靠度預測值

圖5 GA-LM-BP神經網絡模型絕對誤差值

由圖4和圖5可知,網絡預測的輸出值與期望值之間的擬合效果較好,絕對誤差波動幅度較低,最高不超過0.038。表明該模型有較高的預測精度和網絡訓練質量。

4.3 網絡模型驗證

為了驗證采用遺傳算法和LM算法優化BP神經網絡,能提高網絡性能,使其達到更好的預測效果,使用相同的訓練樣本、測試樣本以及網絡參數,建立經典BP神經網絡模型和LM-BP神經網絡模型。選取平均絕對誤差MAE、均方根誤差RMSE、相對均方根誤差NRMSE作為神經網絡模型的主要評價參數,定量分析三種模型預測拖拉機可靠度的準確性。評價指標的計算結果見表2。

表2 網絡模型評價指標對比

對這三種模型的仿真結果進行對比。其預測值與期望值的可靠度擬合曲線如圖6。預測值與期望值的絕對誤差對比曲線如圖7。

圖6 三種網絡模型可靠度預測值

圖7 三種網絡模型絕對誤差值

由表2、圖6和圖7可知,基于遺傳算法和LM算法的BP神經網絡模型可靠度預測值與期望值的擬合精度最高,誤差值波動幅度最小,其平均絕對誤差為1.24%,均方根誤差為1.59%,相對均方根誤差為2.82%;基于LM算法的BP神經網絡模型擬合精度和誤差波動幅度次之,其平均絕對誤差為3.11%,均方根誤差為6.91%,相對均方根誤差為9.10%;經典BP神經網絡模型擬合精度最差,誤差波動幅度也最大,其平均絕對誤差為6.71%,均方根誤差為7.90%,相對均方根誤差為13.97%。

在訓練速度方面,基于遺傳算法和LM算法的BP神經網絡訓練6次后,網絡精度即可達到0.00038,超過所設定的網絡精度;僅使用LM算法改進的BP神經網絡訓練17次網絡精度可達到0.00096,同樣超過設定的網絡精度,只是訓練速度和精度仍不及LM算法和GA算法共同優化后的神經網絡;經典BP神經網絡訓練速度比較慢,訓練了10000次,達到所設定的最大訓練次數,此時模型的精度為0.00604,仍未達到設定的網絡精度,由此可知GA-LM-BP神經網絡模型的可靠度預測性能最好。

4.4 模型擬合精度檢驗

為了進一步驗證模型的預測精度是否符合上述結論,采用皮爾遜相關系數法對三種網絡模型進行解析。用相關系數ρ來表示網絡預測值與期望值的相關程度,ρ越大表示二者相關性越強,擬合程度越高。公式如式(13)所示

(13)

計算結果表明,經典BP神經網絡的相關系數為0.9275,LM-BP神經網絡的相關系數為0.9841,GA-LM-BP神經網絡的相關系數為0.9973,可知,GA-LM-BP神經網絡模型的相關系數最大,進一步證明了LM算法與GA算法共同優化后的BP神經網絡模型的擬合精度最高。

5 結論

本文使用遺傳算法與LM算法優化BP神經網絡,建立了GA-LM-BP神經網絡模型對拖拉機進行可靠度預測,并與經典BP神經網絡模型、LM-BP神經網絡模型在迭代次數、執行時間及擬合精確度等方面進行了仿真結果對比,試驗證明經兩種算法共同優化后的BP神經網絡有更好的預測精度和更快的收斂速度。此模型為實現拖拉機可靠性精準預測提供了新的方法,為拖拉機的使用及后續維修提供了重要參考依據,同時為其它類型農業機械產品的可靠性預測提供了思路。

猜你喜歡
拖拉機遺傳算法神經網絡
飛上天的“拖拉機”
神經網絡抑制無線通信干擾探究
基于自適應遺傳算法的CSAMT一維反演
一種基于遺傳算法的聚類分析方法在DNA序列比較中的應用
牛哄哄的拖拉機
基于遺傳算法和LS-SVM的財務危機預測
拖拉機闖禍了
基于神經網絡的拉矯機控制模型建立
基于改進的遺傳算法的模糊聚類算法
復數神經網絡在基于WiFi的室內LBS應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合