?

基于產線數據驅動建模的鋰離子電池分容技術

2024-03-10 03:34馮雪松張曉琨
電源技術 2024年2期
關鍵詞:產線特征參數鋰離子

毛 宇,馮雪松,張曉琨,向 勇

(電子科技大學材料與能源學院,四川成都 611731)

近年來,隨著電動汽車、儲能電站等新興場景迅速發展,鋰離子電池市場規??焖僭鲩L,生產企業迫切需要提升產能[1]。典型的鋰離子電池生產制造過程包括正負極材料制備、隔膜生產、電解液配制、電池組裝、化成和分容等環節,具有生產環節多、復雜程度高和生產周期長的特點[2]。其中,電池分容是電池產品性能分級的重要過程,其目的是遴選內阻和容量一致性高的單體電池,保障電池成組后的服役可靠性。傳統生產過程中,需在分容柜中按設定的程序進行電池充放電循環,最后根據測定容量進行分選,該過程不僅成本高,并且耗時長[3]。隨著機器學習建模技術的快速發展,利用鋰離子電池產線監測數據,建立電芯產品容量精準預測模型,有望簡化甚至免除依賴充放電實驗的分容環節,支撐鋰離子電池生產企業提升產能。

機器學習算法具有快速尋找高維數據潛在關聯關系的能力,已廣泛應用于金融、電子商務、醫療、交通、制造等領域。近年來,基于機器學習算法的數據驅動建模,在鋰離子電池關鍵材料性能預測和電芯剩余容量評估等方面也取得了長足進展[4-5]。Choy等基于168 組不同摻雜配方的鋰離子電池三元NCM正極材料實驗數據,采用6 種機器學習回歸算法,研究了正極材料結構、摻雜元素特征與其初始放電容量和第50 次循環放電容量的相關性,并成功建立了摻雜元素特征與正極材料充放電性能的映射模型[6]。文獻[7]采用圍繞中心點的劃分(PAM)聚類算法,以鉛酸蓄電池使用過程中的外殼溫度和充放電電壓、電流為特征參數,設計了鉛酸蓄電池剩余容量評估方法,并以300 個報廢的鉛酸蓄電池組的服役數據為樣本驗證了該技術有效性。在鋰離子電池方面,文獻[8]基于115 個電池的195 000 條數據,設計了一種非遞歸的條件時間卷積網絡來預測鋰離子電池性能的退化行為。該模型在測試集驗證中,電芯容量平均預測誤差小于最大可用容量的4%。盡管數據驅動的機器學習建模在鋰離子電池關鍵材料和電源系統管理技術研發中已展示出巨大的潛力,但目前尚缺乏將其應用于鋰離子電池產品分容的研究報道。

本文探索了基于產線數據驅動機器學習建模的鋰離子電池分容技術。搜集了20 997 條標準容量為108 Ah 的鋰離子電池生產數據,使用四種機器學習算法訓練模型,對測試集的電池分容容量進行了預測。通過調優,所有機器學習模型容量預測結果的均方根誤差均小于標準容量的0.35%。最佳模型預測結果的統計分析顯示,分容容量的預測誤差在540 mAh (0.5%)以內的電池樣品占樣品總數的比例達88.47%。該結果證明了數據驅動機器學習建模應用于鋰電池產品分容的有效性。此外,通過分析預測結果較優的兩個算法模型中各特征參數貢獻度,揭示了影響模型分容容量判斷的關鍵共性特征,有望支撐進一步優化鋰電池生產過程,提高產品品質保障能力。

1 機器學習建模

1.1 數據集建立

數據集由20 997 條源自同一產線的鋰離子電池生產數據組成。每條數據包括21 個特征參數,分別是A 卷芯質量、B 卷芯質量、總卷芯質量、第一次電解液注液量、第一次注液前質量、第一次注液后質量、三次化成溫度的檢測參數、三次化成截止電壓的檢測參數、第二次電解液注液量、第二次注液前質量、第二次注液后質量、兩次開路電壓(OCV)檢測環節的電阻大小、兩次OCV檢測環節的電壓大小、直流內阻(DCIR)和分容容量。以上特征參數的選擇主要基于對鋰離子電池性能機理的認識以及實際的生產條件,具有一定的完備性和較好的實用性。

1.2 模型訓練

本文使用Python 編程語言和機器學習庫(scikitlearn)進行模型搭建及訓練。模型中使用20 個特征參數作為協變量對鋰電池的分容容量進行預測。模型中的每個超參數都經過了反復調優來使模型達到最優的預測性能。這項工作中采用的四種機器學習算法包括隨機森林(random forest,RF)、梯度提升機(gradient boosting machine,GBM)、XgBoost (eXtreme gradient boosting)和CatBoost (gradient boosting+categorical features)。訓練集和測試集按3∶1 的比例從整個數據集中通過分層抽樣的方式選取。測試集包括5 197 條鋰電池生產數據。

1.3 模型評價與分析方法

通過計算模型對測試集預測結果的均方根誤差(RMSE)和擬合度(R2)來評價模型的預測性能,計算方法如下:

式中:n是值的個數為監測數據為預測值;為測試集中監測數據的平均值。

模型分析可通過統計模型建立過程中各特征參數的貢獻度來進行。特征參數貢獻度的計算及排序結果可使用Python 中的SHAP 包中命令來得到。

2 結果與討論

2.1 數據相關性

在機器學習建模之前,通過計算各特征參數與分容容量之間的皮爾森相關系數可以初步了解參數之間線性相關性的強弱。圖1 展示了20 個特征參數與分容容量之間的皮爾森相關系數計算結果。橫軸表示20 個特征參數,縱軸表示相關性大小。從計算結果來看,所有特征參數與分容容量之間的相關性系數的絕對值均低于0.6,表明其線性相關性均較弱。但是該相關性分析結果并不能直觀地得出可靠的結論,具有一定的誤導性。例如,化成環節、OVC測試和DCIR的數據在理論上與分容容量之間存在較為密切的聯系,而圖1 中這三類特征參數與分容容量之間的相關性系數絕對值均低于0.3。造成相關性系數較低的原因可能是這些參數與分容容量之間的關系是較復雜的非線性關系。卷芯質量與分容容量之間呈正相關性,并且具有較大的相關性系數,其原因是卷芯中活性物質的多少和電池容量之間關系的線性度較高。此外,根據一般認知,電解液注入量與電極活性物質容量發揮、電芯內阻大小有著較緊密的聯系,是工業生產中十分重要的數據參量。然而,皮爾森相關性分析顯示兩次電解液注入量與分容容量的相關性均較弱。因此,主要針對線性關系的皮爾森相關性分析不能充分體現鋰離子電池生產過程對電芯產品性能影響的復雜性。

圖1 分容容量與20個特征參數之間的皮爾森相關性系數統計圖

2.2 模型訓練

針對皮爾森相關性分析的局限性,基于產線數據量充足的特點,使用生產過程中能夠采集到的所有特征參數來進行機器學習建模。利用機器學習快速尋找高維數據關聯性的能力,探究產線監測特征參量與分容容量之間的復雜非線性關系,并驗證通過機器學習建模預測鋰電池分容容量的有效性。研究中使用四種機器學習算法分別建立回歸預測模型,并針對每個模型進行性能驗證。表1 總結了鋰離子電池分容容量預測的四種機器學習模型的五次交叉驗證平均RMSE,測試集預測結果RMSE與R2的評價結果,對比了特征篩選前后模型預測性能。

表1 各模型的均方根誤差和擬合度

四種算法模型的測試集預測結果的RMSE值均低于標準分容容量的0.35%,R2均大于0.55,五次交叉驗證的平均RMSE的值均低于標準分容容量的0.39%,模型的性能初步滿足產線電池生產的標準。其中,CatBoost 算法模型和RF 算法模型對分容容量的預測效果最佳,具有最高的擬合度,分別為0.620 6和0.618 6。此外,使用根據皮爾森相關性系數計算結果(皮爾森相關系數絕對值>0.2)篩選出的8 個特征所組成的參數集,所訓練的四種機器學習模型對測試集的預測結果相比于未進行特征篩選時的預測結果較差,再次說明皮爾森相關性分析存在一定的誤導性。在未來研究中,結合產線機理認識設計專用的算法模型更精確地提取產線監測特征參量與分容容量之間復雜的非線性關系,將是提高模型預測性能的關鍵。

在測試集驗證中性能表現較優的RF 和CatBoost算法模型分容容量預測值和實驗值關聯的散點圖如圖2 所示。對應的R2和RMSE標注在圖中,45°的紅色直線代表了實驗值的大小,圖中每個點都代表了一個預測數據。針對5 197 條數據的預測結果大部分都接近于紅色直線。對于本研究中給定的測試集,兩種算法模型的評估結果非常接近。此外,圖中能觀察到部分預測點位于表示±0.5%誤差的兩條直線之外,這些預測誤差較大的數據是影響RMSE和R2數值的關鍵。通過對最佳RF 模型和CatBoost 模型預測結果的統計分析,發現測試集中實際測定容量在108 Ah 以上的電池樣品被正確判斷為容量達到108 Ah 以上的概率分別為90.78%和89.86%,剩余約10%的產品可通過實驗分容進一步測定容量。分容容量的預測誤差在540 mAh(標準容量的0.5%)以內的電池樣品占樣品總數的比例分別為88.14%和88.47%。本研究建立的模型對于電芯容量是否高于108 Ah 的識別準確率基本能夠滿足產線應用進行產品質量保障的要求。然而,考慮到電芯分容容量的預測誤差總和直接關系產線的經濟效益,對電芯容量絕對值的預測精度仍有待提升。

圖2 RF模型(a)和CatBoost模型(b)預測結果的散點圖

2.3 模型分析

通過獨立計算每個特征參數在模型計算過程中貢獻度大小得出的shap 值能夠體現特征參數對模型預測結果的影響程度。圖3 展示了RF 和CatBoost 兩種算法模型在對測試集預測效果達到最佳狀態時,20 個特征參數shap 值的匯總結果。x軸表示每個數據對模型預測的影響大小,y軸按照各特征參數總體的貢獻作用,進行了降序式排列,貢獻作用越大的特征參數排序越靠上。

圖3 20個特征參數對RF模型(a)和CatBoost模型(b)輸出結果影響的shap值匯總圖

首先,電芯質量相關數據在兩類模型當中均占據重要地位。在圖3(a)中的RF 模型的第二至第五個特征參數和圖3(b)中CatBoost 模型的第二、第四至第六個特征參數均與電芯質量相關,且都展示出積極的正向影響。這一結果和皮爾森相關性分析結果基本一致。與皮爾森相關性分析結果不同的是,OCV測試數據在兩個模型中均體現出較高貢獻作用,最直觀的結果是OCV2 電壓(第二次OCV檢測參數)在兩個模型中的貢獻度大小都排在第一位。DCIR同樣顯示出較突出的作用,在兩個模型中分別被列為排序第七重要(RF 模型)和第三重要(CatBoost 模型)的特征。從結果來看,相比于RF 模型,化成溫度、化成截止電壓和DCIR三類參數在CatBoost 模型中表現出的影響力更強。根據一般性的科學認知和技術經驗,較高的化成溫度不僅有利于固體電解質界面(SEI)生成反應,而且有利于隔膜被電解液充分浸潤;化成截止電壓越高,電解液越不穩定,會有更多的活性鋰被界面副反應消耗,導致鋰電池充放電容量降低;DCIR小的電池不僅大電流放電能力強,實際容量發揮率也會更高。這些關鍵參數重要性的發揮可能是CatBoost 模型性能最佳的原因。機器學習模型分析的結果符合一般認知和經驗,證明高效率的建模分析方法可輔助提高科研人員對電芯生產機理的認識水平,并再次印證了通過產線數據驅動機器學習建模實現鋰離子電池分容容量精準預測的可行性。通過模型設計優化,深入挖掘特征參數與分容容量之間的非線性關系是進一步提高模型預測精度的關鍵。

3 結論

鋰離子電池電芯的容量受各個生產環節綜合影響。本文證明了使用數據驅動的機器學習算法,建立主要工藝環節監測數據與分容容量之間精準映射關系的可行性。所使用的參數數據都是在實際的鋰電池生產線上采集的?;? 萬余條產線數據,采用四種不同的非線性機器學習算法進行了模型訓練和測試。采用RF 和CatBoost 算法建立的模型表現出較好的容量預測性能,它們的擬合度分別為0.618 6和0.620 6。測試集驗證結果統計顯示,實際測量容量在108 Ah 以上的電池樣品被正確判斷為108 Ah 以上的概率最高達90.78%,預測誤差在540 mAh(標準容量的0.5%)以內的電池樣品占比最高達88.47%。此外,通過分析模型中各特征參數貢獻度,發現了化成溫度、化成截止電壓、OCV和DCIR等參數與分容容量之間存在較為重要的關聯性。未來研究中,結合已有的科學認知和生產經驗,針對特征參數與分容容量之間非線性關系,進一步優化建模算法,提高容量預測精度,有望幫助生產企業提高產能、質量保障能力和經濟效益。

猜你喜歡
產線特征參數鋰離子
昆玉棒材軋制產線提速增效工藝改進措施
故障診斷中信號特征參數擇取方法
基于特征參數化的木工CAD/CAM系統
梅鋼1780產線高速鋼軋輥使用維護
高能鋰離子電池的“前世”與“今生”
多品種小批量智能制造產線關鍵技術及應用探討
寬厚板鋼軋一體化智能制造示范產線推進實踐
基于PSO-VMD的齒輪特征參數提取方法研究
統計特征參數及多分類SVM的局部放電類型識別
鋰離子電池組不一致性及其彌補措施
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合