?

基于可解釋極端隨機樹模型的DCT 液壓響應預測

2023-12-08 04:18趙宗琴冉若愚皮家甜
汽車工程學報 2023年6期
關鍵詞:液壓工況預測

李 想, 王 鑫, 蔡 辰, 趙宗琴, 冉若愚, 楊 德, 皮家甜

(1.重慶師范大學,重慶 401331;2.重慶長安汽車股份有限公司,重慶 401120)

汽車是現代社會不可或缺的交通工具之一,而變速器無疑是傳統燃油車甚至混合動力汽車中必不可少的一部分。其中,在各類自動變速器中,濕式雙離合器變速器因其具有動力損失小、換擋時間短、更佳的燃油經濟性等優點[1],目前被廣泛應用于燃油車、插電式混合動力汽車中。DCT變速器通過液壓系統作為執行動力源控制離合器和撥叉動作實現動力傳動比切換,DCT執行換擋操作時,動力要在兩個離合器之間來回切換,液壓系統產生液壓力去完成換擋同步器以及離合器執行機構的操作[2-3]。

DCT 液壓響應對DCT 平穩換擋具有十分重要的意義,關系到駕乘人員的駕駛體驗,也是研究基于數據驅動的方法在DCT 控制邏輯優化方面的重要部分。為進一步提升換擋品質以及優化控制策略,眾多學者以及DCT 生產商也對DCT 進行著持續深入的研究。饒坤等[4]提出一種離合器壓力非線性魯棒控制策略。戴冬華等[5]基于離合器壓力控制閥的壓力和電流特性在半結合點附近的非線性關系設計了DCT 半結合點自學習控制策略。然而,影響DCT 變速器執行性能的因素很多,包括液壓電磁閥的制造差異、離合器彈簧及間隙、油瓶狀態、殘余油量等,而上述傳統的控制策略很難全面考慮諸多因素以及硬件誤差帶來的影響。隨著機器學習方法日益成熟,基于數據驅動的方法也逐漸被用于DCT 領域。劉永剛等[6]提出了基于數據驅動的雙離合器自動變速器換擋過程的自適應控制。王蒙蒙等[7]研究了基于數據驅動的DCT 起步策略智能控制。萬有剛等[8]利用集成學習算法挖掘DCT換擋數據中蘊含的控制規律等。這些研究在一定程度上驗證了基于數據驅動的方法在DCT 方面的可行性,但是基于數據驅動的方法在DCT 控制邏輯中的研究仍然不足。

為探究DCT 液壓響應預測方法,本文收集了大量包含了不同工況下的DCT 數據,為模型訓練提供了堅實的數據基礎。但在訓練數據集中,特征數量和預測結果并非一定成正比[9],過多的特征反而可能導致預測精度下降,還會大大增加訓練開銷[10-11]。如果直接基于人工挑選重要特征,可能導致結果不準確。為建立一個能對重要特征進行可視化選擇,且能精準預測DCT 液壓響應的模型,本文提出了一種基于SHAP 可解釋極端隨機樹算法的液壓預測模型。先繪制特征值圖形結合數據的實際物理含義初步刪除其值變化小以及沒有意義的特征,再利用SHAP 法可視化選擇重要特征,最后訓練模型并進行預測。同時,將時間切片作為特征參與模型訓練,結合某汽車公司DCT 實驗室獲取的數據,預測結果表明,該模型預測的結果在設計誤差允許范圍內,預測液壓結果較精準,一定程度上解決了不同工況以及硬件誤差帶來的執行精度不可控的影響,可以為基于數據驅動的控制邏輯優化提供較準確的結果。

1 問題描述

DCT通過液壓系統作為執行動力源控制離合器和撥叉動作實現動力傳動比切換,但DCT 變速器不同樣本、不同工況下的液壓系統執行精度響應不完全可控。DCT 換擋示意圖如圖1 所示。究其原因,除了制造差異等工程問題外,DCT控制策略容差能力也是重要原因之一。而控制策略容差能力主要體現在DCT自適應學習與補償策略方面。

圖1 DCT變速器通過液壓模塊控制離合與換擋示意圖

由PPV 電磁閥閥芯平衡方程可知,當電流較小時,如果要對壓力進行控制,電磁力需要克服與運動趨勢反向的摩擦力、彈簧力、出口壓力腔反饋壓力[12]。PPV 電磁閥示意圖如圖2所示,電磁閥閥芯平衡方程如式(1)所示。同時,由于PPV 電磁閥設計有正遮蓋量,電磁閥在小電流區域無法克服正遮蓋行程及摩擦力,閥口無法打開致使壓力為0,該電流區域稱之為壓力死區。PPV 電磁閥還具有壓力遲滯與徑向不平衡力等缺陷,導致壓力響應精度不可控。壓力死區與壓力遲滯如圖3 所示。目前,業界廣泛采用自學習策略與補償策略來適應不同工況下壓力響應的差異。由于溫度發生變化導致油壓變化,而傳統的物理模型無法預測不同溫度下油壓的數值,導致換擋品質不高。而基于數據驅動的自學習策略可以在不同溫度下學得最適合當前狀態的換擋油壓,結合物理模型以期能滿足各工況下的性能要求。因此,本文重點探究利用數據預測壓力響應方法,為基于數據驅動與物理模型相結合的控制策略提供預測結果。

圖2 PPV電磁閥(常態位)

圖3 壓力死區與壓力遲滯示意圖

式中:Fe為電磁力;Ff為摩擦力;Fbs為穩態液動力;Fs為彈簧力;Fp為出口壓力腔反饋壓力。

2 數據與模型

2.1 數據集

本文利用的數據集為某汽車公司DCT 試驗室采集的真實DCT 數據。主要包括DCT 在不同溫度工況下的數據,具體溫度工況見表1。采集的原始數據共計73 個特征,1 個標簽,具體特征見表2,其中TRANS_bar_ClPressure 為標簽值,其余為特征。該模型須能預測出不同溫度下的液壓響應,因此,將溫度(temperature)也作為一條特征變量。由于原始數據量較龐大,為了方便試驗,本研究在上述數據集中,在每一種溫度工況下選取8 萬條數據,共計64萬條數據。

表1 不同溫度工況

表2 數據的全部特征

2.2 可解釋性ET模型

集成學習[13]是組合多個個體學習器,從而獲得比單一學習器性能更優的模型。目前在多個領域已經取得較好應用,如李恒杰等[14]利用集成學習預測電動汽車充電樁超短期負荷;賈志強等[15]使用XGBoost模型對消費行為進行預測;OGUNLEYE等[16]使用XGBoost 為慢性腎臟?。–hronic Kidney Disease,CKD) 提供了早期廉價的診斷方法;GUPTA 等[17]對比了隨機森林、線性模型、支持向量機神經網絡等模型預測新冠肺炎(Corona Virus Disease 2019,COVID-19)病例的確診、治愈和死亡數據,發現隨機森林(Random Forest, RF)模型的準確率最高。

極端隨機樹(Extremely Randomized Trees,ET)[18]模型屬于集成學習,它和隨機森林[19]類似。隨機森林是Bagging 的一個擴展變體,其個體學習器是CART 決策樹。其繼承了Bagging 的隨機選擇樣本,同時增加了屬性隨機,即在當前節點的屬性中隨機選擇包含k個屬性的子集,然后從這個子集中選擇一個最優屬性用于劃分。而ET 和RF 不同的是ET 模型使用全部的樣本,且完全隨機選擇特征進行分裂。在本研究中,相較于其他幾個對比模型效果更好,具有更高的抗擬合能力以及更好的泛化性。ET模型決策過程如圖4所示。

圖4 ET模型決策過程

SHAP(Shapley Additive exPlanations)[20]是機器學習中用于解釋模型輸出的方法,可以通過計算每個特征對預測標簽的貢獻來解釋結果。模型的準確率和可解釋性同等重要,但是模型越復雜準確率越高,其可解釋性越差,面臨著準確率和可解釋性的矛盾[21]。而SHAP 方法可以計算特征的全局重要性,并將特征根據重要性進行排序,比直接采用經驗判斷特征重要性具有更高的準確度。

為清楚地對比本研究采用模型相較于其他對比模型的準確性和有效性,選取平均絕對值誤差(MAE)、均方誤差(MSE)以及可決系數(R2)3個指標進行比較。其中以MSE 為主要衡量指標,MSE反映預測值與真實值的誤差,該值越小,則誤差越小。R2表示可決系數,其取值范圍為[0,1],越接近1 表明模型效果越好。MAE、MSE 及R2如式(2)所示。在數據集1,即只包含表4 中所示特征的數據集上,本文模型和其他模型的結果對比見表3。由表3可知,基于可解釋ET模型的MSE要低于其他幾個模型。

表3 本文所使用的模型和其他模型結果對比

表4 刪除無關特征后的剩余特征

式中:MAE 為平均絕對值誤差;MSE 為均方誤差指標;R2為可決系數;y為液壓響應實際數據;為模型預測的液壓響應值;為液壓相應實際平均值。

2.3 模型建立

根據本文提出的模型設計了如下試驗。首先對傳感器采集的多項關于DCT 的數據進行清理,通過繪制特征值的折線圖,可以發現很多的恒值特征,再結合實際物理模型對結果預測的先驗知識,發現這一部分特征對于液壓響應計算影響不大。因此,可以將這一部分特征刪除,初步減少數據維度,然后輸入模型進行訓練。接著使用SHAP 算法對結果進行解釋,將重要特征可視化排序。同時通過SHAP 圖可發現該數據和時間具有一定關系,因此,試驗2 將時間處理成切片并輸入模型進行訓練和驗證。最后,由于汽車ECU 計算能力有限,為了工程化考慮,試驗3 僅保留幾個最重要的特征并進行訓練,最后輸出結果。具體流程如圖5所示。

圖5 可解釋ET模型預測流程

3 結果與分析

3.1 數據集劃分

本研究的目標是利用特征變量預測DCT 液壓響應,即表2 中紅色標簽??紤]到實際應用需要,本研究將誤差設計為25 kPa以內。同時為了探究模型在高溫工況下的表現,將數據集中120 ℃工況下的數據作為測試集,測試模型的實際預測效果。為保證較好的訓練結果,本研究在訓練時采用10 折交叉驗證[22],10 折交叉驗證是將原始數據隨機劃分為幾乎相等的10份,每次輪流使用其中9個作為訓練集,剩余1個作為測試集,總共輪流10次。

3.2 特征分析

3.2.1 保留恒值以外特征試驗

為了可以更加全面地收集數據,投入了大量傳感器采集原始數據,由此導致原始數據維數過多,如果直接采用算法選擇重要特征,會造成計算時間太長,而且可能計算不準確。因此,本試驗先繪制出了特征值的圖形,可以發現很多特征值為恒值,為恒值的部分特征如圖6 所示,圖中紅色表示標簽值,藍色為特征值。對于樹模型這些特征無法使用,可以直接刪除,保留除恒值以外的特征后形成數據集1,作為試驗1。刪除恒值特征后剩余的特征見表4,可以看到,數據已由表2 中的74 維降至表4所示的43維,大大減少了數據維度。

圖6 一部分值為零值(a和b)和恒值(c和d)的特征

3.2.2 添加時間切片及升降壓判定試驗

在SHAP 圖對模型結果分析后,發現時間對結果具有一定影響。經過對標簽值圖形觀察后,發現其具有一定規律。具體來說,在一定時間周期內,液壓響應的波形先上升后下降,即先升壓后降壓,為了區分升降壓階段而添加升降壓標志。同時時間也應該隨著壓力變化而周期性變化,但數據中原始時間是不斷上升的(見圖7 綠色實線),不利于模型學習時間與液壓響應之間的關系。因此,將時間進行切片,液壓響應值變化后時間重新從0 開始計算,選取液壓響應上升時的一段數據進行繪圖,說明液壓與時間的關系。時間切片及升降壓判定特征示意圖如圖7 和圖8 所示。圖7 中紅色線段代表壓力,可以看到壓力每變化一次,時間都重新從0 開始。由圖8 可知,壓力上升階段標志為1,而下降階段標志為0。SHAP圖解釋模型結果如圖9~10所示。圖9 中橫軸表明特征的重要程度,數值越大說明該特征越重要。試驗2 在試驗1 的數據中增加了升降壓判定以及時間切片特征,形成數據集2。

圖7 原始時間、切片時間與壓力之間的關系

圖8 升降壓標志示意圖

圖9 SHAP特征重要性分析圖

圖10 SHAP摘要圖

SHAP 圖會顯示比較重要的一些特征及其重要度。圖中每一行代表一個特征,橫坐標為SHAP值,越靠前說明特征越重要。一個點代表一個樣本,顏色越紅說明特征本身數值越大,顏色越藍說明特征本身數值越小。由圖9~10 可知,請求電流(mA_ClCurrentRequest)和時間(time)對結果影響較大。

3.2.3 重要特征可解釋選擇試驗

由于車輛ECU 并不具備實驗室環境下的高算力,所以需要將模型輕量化,即只保留最重要特征?;谠囼? 中SHAP 算法對重要特征的選擇,且考慮到模型需要預測不同溫度(temperature)下的液壓響應,因此,試驗3保留了如表5所示的4個特征,形成數據集3,作為試驗3訓練數據。表5中“TRANS_bar_Cl1Pressure”表示需要預測的標簽,“time”表示時間切片屬性,“temperature”表示溫度屬性,“updown_mark”表示升降壓判定屬性,“ClC_mA_C1CurrentRequest”表示電流屬性。

表5 工程化模型訓練所需特征

3.3 試驗結果分析

在建立好的3 個數據集上分別進行訓練以及預測,表6 為3 次試驗的10 折交叉結果的平均值,評估指標使用MAE,MSE 以及R2,其中以MSE 作為主要評估指標。從MSE 結果可以看出,添加時間切片(第2 次試驗)的MSE 比沒有添加時間切片(第1 次試驗)的MSE 降低了0.551 2,這表明添加時間切片以及升降壓標記對模型精度提升有促進作用,同時也說明SHAP 法選擇的特征是正確的。輕量化試驗(第3 次試驗)的MSE 比第1,2 次試驗結果高很多,但訓練時間相比于1,2 次試驗短很多(Time/s 下的時間是在64 GB 2.9 Ghz 的CPU 上的訓練時間,不同機器的時間可能有所差異),且訓練誤差仍然可接受誤差以內,更適合工程化應用。3次試驗結果見表6所示。

表6 三個試驗結果對比

為了進一步驗證模型的精確度,說明模型的預測結果,本研究在測試集上做進一步的測試,并且將模型預測的預測值和實際值對比。將每個樣本的預測值和實際值差值的絕對值做平均(MAE),如表7 所示。圖11 展示了3 個試驗結果的預測值和實際值的曲線對比,圖12展示了3個試驗真實值和預測值的差值??梢园l現,試驗3 在測試集上的效果最好,與真實值貼合最緊,說明模型具有較好的泛化能力。

表7 不同模型實際值和預測值差值的均值

圖11 不同試驗預測結果和實際值對比圖

圖12 不同試驗實際值和預測值的差值圖

4 結論

為了探究DCT 液壓響應預測方法,本文提出了一種基于SHAP可解釋的ET模型。利用SHAP算法篩選重要的特征變量,作為ET 模型的輸入,構建預測模型。通過對比試驗可知,基于SHAP 可解釋ET模型具有以下優勢:

1)該模型可以較準確地預測液壓響應,為基于數據與物理雙驅動的控制方法提供較準確的預測結果;

2)利用SHAP 算法可以對重要特征進行篩選,并且具有良好的解釋性,可以降低訓練數據維度,減少訓練時間,同時又不會降低預測精度;

3)加入時間切片和升降壓判定屬性后,模型MSE 降至0.670 3,降低了0.551 2,說明時間序列對液壓結果有一定影響。

本試驗結果可直接運用于工程實際,在整車標定時,可參考試驗得出的液壓響應時間和跟隨效果值。

猜你喜歡
液壓工況預測
無可預測
選修2-2期中考試預測卷(A卷)
選修2-2期中考試預測卷(B卷)
熱網異常工況的辨識
不同工況下噴水推進泵內流性能研究
基于非負矩陣分解的高速列車走行部工況識別
上支承輥平衡缸液壓控制系統的設計改進
再談液壓吊裝
不必預測未來,只需把握現在
露天液壓鉆車
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合