?

基于K均值聚類的天津市環衛車行駛工況研究

2024-01-03 10:52田元武楊志文王計廣
河北工業大學學報 2023年6期
關鍵詞:特征參數天津市聚類

田元武,楊志文,王計廣,黎 蘇

(1.河北工業大學能源與環境工程學院,天津 300401;2.中國汽車技術研究中心,天津 300300)

0 引言

汽車行駛工況反映了車輛運行過程中的運動狀態與行駛情況,由一組速度-時間曲線所表示。工況曲線廣泛地應用在車輛動力裝置匹配、能量管理策略、排放特性研究等方面,是整車開發與檢測的重要因素。隨著我國城市化水平不斷提高,城市專用作業車輛的保有量也迎來了大幅增長,許多學者對專用作業車輛的行駛工況展開了研究。趙承輝等[1]以西安市某公交為例,以聚類分析法構建了西安市的典型公交車工況;王志強等[2]以太原市某CNG公交為研究對象,構建了太原市公交工況,并以此為基礎對CNG公交車排放特性進行了研究。苗強等[3]基于聚類和馬爾可夫鏈法構建了濟南市公交的典型工況曲線,并提出了相應優化方案。

上述研究大多聚焦在公交車上,而對城市內工作的環衛車的關注明顯不足。據統計,截至2016年底我國的環衛車保有量為16.8 萬輛,經過4 年的發展,在2020 年底達到了35.4 萬輛,平均每年增長約4.65 萬輛。Clark 等[4-6]開發的紐約環衛車行駛工況(New York garbage truck cycle,NYGTC)工況被用于美國紐約市環衛車的開發測試,但目前絕大多數國家的測試標準中并未將環衛車單獨列出。我國現行的測試標準中采用以世界重型商用車瞬態循環(World Transient Vehicle Cycle,WTVC)為基礎修訂的C-WTVC工況進行測試,該循環各工況的占比與環衛車實際行駛狀態差異較大[7],不能體現環衛車的實際運行狀態。綜上所述,構建城市環衛車的典型行駛工況對環衛車的生產、維護、檢測具有十分重要的意義。

孫強等[8]以西安市一輛環衛車為研究對象,采用聚類法構建了西安市環衛車行駛工況。由于單一的研究對象采集區域與路線固定,采集時段覆蓋較少,使得構建結果的代表性不夠理想。為全面研究城市環衛車的行駛工況與其特征,本文選取了在天津市10個行政區運行的72輛環衛車作為研究對象。對所采集的數據進行預處理后劃分運動學片段,以K-means聚類法[9]對片段進行聚類,以GIS技術對聚類結果進行可視化[10],明確環衛車在空間上的運動特征與工作狀態。最后應用鄰域搜索法完成類內工況的選取,構建了天津市環衛車代表工況。

1 數據采集與清洗

1.1 工況數據的采集

在本文的數據采集階段,考慮到環衛車活動范圍大、作業時間長的工作特點,在天津市十個行政區(市內六區與環城四區)范圍內通過移動終端采集了共72 輛環衛車作的實際行駛數據,采樣頻率為1 Hz,采樣類型包括車輛行駛速度、數據采集時間、GPS經緯度信息等運動學信息,采樣時間包含工作日與休息日早晚高峰和非擁堵時間,能夠更加完整的反映環衛車運行狀況。采集數據時長共782 ks,被采樣車輛具體情況如表1所示。

表1 采樣車輛詳情Tab.1 Details of Sampled Vehicles

1.2 實測數據預處理與分析

車輛在數據采集的過程中,受到采集設備狀態、路況狀態、與環境信號等因素的干擾,導致原始數據存在異常值與缺失值。依據國內的相關文獻和國外全球統一輕型車測試程序(World Light Vehicle Test Procedure,WLTP)對異常數據的處理方法[11],對加速度絕對值大于4 m/s2行駛數據進行剔除。針對信號屏蔽所造成的缺失問題,若采集的數據發生缺失且缺失時長小于5 s,則保留此段行程并在段內進行插值,否則刪去這段短行程。預處理后的行駛數據的速度分布如圖1 所示。由圖1 可知,環衛車在中心城區、主干路車速分布在0~20 km/h,在環線,次主干路上行駛速度相對較大,車速主要分布在0~40 km/h,具有工作區域速度低,通勤區域速度高的工作特點。

圖1 總體樣本速度分布圖Fig.1 Velocity distribution of the total sample

2 環衛車行駛工況合成

2.1 運動片段的劃分與特征值的選取

運動片段是指車輛行駛過程中兩次怠速狀態之間的運動行程[12],通常,一個運動片段具有怠速、加速、勻速、減速4 個狀態,如圖2 所示??紤]到環衛車工作地點多為擁堵路段,且完成環衛車作業時有長時間的停留,本文將初始怠速狀態的時長限制在180 s 以下,以避免極端路況與長時間作業對工況構建的影響。

圖2 運動片段示意圖Fig.2 Schematic of Kinematic sequence

在對運動片段進行信息提取與聚類分析時,特征值的選取有很大的影響。本文從時間、加速度、速度3方面對運動片段進行特征值的構建,用以描述運動片段的15個特征參數,如表2所示。

表2 運動片段特征參數Tab.2 Feature parameters of Kinematic sequence

根據上述要求對采集到的數據進行運動片段劃分,共得到3 036個運動片段,時長共計162.4 ks。

2.2 特征矩陣標準化與主成分分析

依據表2計算每個運動片段的特征參數,構成了特征參數矩陣X3036×15。因在特征參數構建時,15 個參數彼此的量綱不同、數量級差異大,直接對特征矩陣X3036×15進行降維分析與聚類分析會導致結果的穩定性較差。為此在對特征矩陣進行進一步處理前,先要對數據進行標準化。

標準化是指將數據按比例縮放,使之落入一個小的特定區間,以此去除數據的單位限制,將其轉化為無量綱的純數值,便于不同單位或量級的指標能夠進行比較和加權。本文中使用標準差標準化的方法,處理后的數據樣本均值為0,方差為1,為后期降維創造了條件,具體計算方法如公式(1)所示。

標準化后的15個特征參數間的相關性強,需要使用主成分分析法(PCA)對特征矩陣進行降維[13],從而達到節約計算資源,提升聚類準確性的目的。

主成分分析法是指利用線性變換構造出新變量(即主成分),使得各主成分間兩兩獨立且線性無關,并保留了原變量的絕大部分特征信息。研究表明,若主成分的特征值大于1,且累積貢獻率在80%以上,即滿足行駛工況開發要求[14]。特征參數矩陣在主成分分析后得到的各主成分相應特征值、貢獻率及累計貢獻率如表3所示,本文選取前5個主成分,累計貢獻率為82.7%,能夠達到降維目的,并反映特征參數矩陣的大部分信息。

表3 特征參數矩陣主成分分析結果Tab.3 PCA result of characteristic parameters

2.3 K-Means 聚類方法

車輛的行駛工況可以分為多個類別,同一類別的片段具有相同的運動特征,不同類的片段運動特征差異明顯。K-means聚類法作為一種無監督的分類方法,具有分類準確、計算時間短、類內相似度高、類間差異大的優點,被廣泛的應用于工況構建領域,其具體過程如下。

1)確定樣本的k個初始聚類中心zj。

2)計算每個樣本點xi到最近聚類中心zj的歐氏距離。歐氏距離可以反映表征類別間的不相似性,從而根據最小距離的原則重新對樣本進行劃分。

3)重新計算每個聚類的均值,將此均值作為新的聚類中心。

4)循環步驟2、3,直到每個聚類中心收斂為定值。

為了確定最佳聚類數k,本文采用Calinski-Harabasz(C-H)指標評價聚類結果,并結合“肘部法”確定最佳聚類數。

C-H指標是評價數據集聚類效果的參考,由分離度與緊密度的比值得到。因此,C-H指標越大代表著類自身越緊密,類與類之間越分散,即更優的聚類結果,其計算方法如公式(2)~公式(6):

式中:k代表聚類數;N代表全部數據數目;SB為類間方差;SW為類內方差;cq是在聚類q中的樣本點;Cq是在聚類q中的中心點;nq是聚類q中的樣本點數量;trace 只考慮了矩陣對角上的元素,即類q中所有數據點到類q中心點的歐幾里得距離。

如圖3 所示,CH 評分在k為3 時取得最大值,為1 342.8 分,之后隨著聚類數k的增大而減小,根據“肘部法”,本文將運動片段分為3類,各類片段樣本的特征值如表4所示。

圖3 C-H 指標評分Fig.3 Calinski-Harabasz score

表4 聚類結果及特征參數Tab.4 Clustering results and characteristic parameters

由表4 所示,3種類別的片段數量分別為1 386、1 040、610,特征參數差異明顯。利用采集的GPS 信息對各個類別片段進行可視化,結果如圖4所示。圖4的底圖以天津市城市核心城區為中心縮放而成,各類別樣本點依據GPS 信息在地圖上進行映射。類別1 中的平均速度最小,怠速比例最大,累計行駛路程短、時間長,多分布在主干路與中心城區,且分布集中,是典型的城區擁堵路況。類別2 的行駛速度較大、勻速比例高、加減速比例接近,與環衛車作業區域重合度高,符合環衛車作業時的特性。類別3具有行駛速度高、持續時間長的特性,多處在環線、快速路等行駛條件較好的路段,是城市道路通暢情況下的行駛工況,即環衛車前往作業區域或作業結束后跟隨城市車流駛回停車場情景。

圖4 聚類結果空間分布Fig.4 Spatial distribution of clustering results

2.4 行駛工況的合成

在類內工況構建過程中,考慮被采集環衛車的工作區域大、工作時間不固定等特點,本文采用鄰域搜索-最小誤差的方法進行類內工況構建,其具體流程如圖5所示。每類行駛工況的時長由公式(7)得出。

圖5 工況構建流程Fig.5 Condition construction process

式中:ti表示第i類運動學片段在最終行駛工況曲線中所占的時間;Ti表示第i類運動學片段庫總共持續的時間之和;T表示全部運動學片段持續的時間之和;tr表示車輛行駛工況曲線的時長,此處為1 700 s。

在候選集選取中,本文依據最小距離法進行排序,距離指每個運動片段與所屬類別簇心的歐氏距離,選每類中距簇心距離最小的100個片段作為候選集。在構建了類內的候選集后,每次從這3類候選集中隨機搜索,選取符合時間要求的運動學片段構建關于行駛工況曲線的目標集,最后根據目標集σ中每條曲線的與總樣本的誤差大小選取誤差最小的曲線作為合成工況曲線。

隨機搜索-最小誤差的構建方法引入了更高的自由度,這使得模型有一定的概率跳出局部最優解,搜索到更好的解,降低最小誤差與平均誤差,獲得更具代表性的工況曲線。最終得到的工況曲線如圖6 所示。由圖6所展示的合成工況可知,3類運動片段的差異明顯,其時長分別為769 s、525 s、451 s。在低速工況中,車速值小,怠速時間長,啟停次數多,是環衛車處于擁堵路況的運動特征;中速工況下速度處于30~50 km/h,怠速片段較低速工況較短;高速工況中,行駛速度大,怠速時間短,是環衛車在環線、快速路的典型行駛狀態。

圖6 天津市環衛車代表工況Fig.6 Driving cycle of of Tianjin sanitation truck

3 有效性檢驗

對合成的天津市環衛車代表工況(Tianjin Sanitation Truck Cycle,TJSTC)進行檢驗,以驗證其有效性。首先計算出合成工況與總樣本特征參數的誤差,如表5所示。結果表明,合成工況的平均速度、平均加速度、勻速比例等參數與總樣本的吻合程度較高,各特征參數的誤差在10%以下,相對誤差的算數平均值為4.60%,表明代表工況的運動學特征與總樣本基本一致,能體現城市環衛車的真實工作狀態。

表5 合成工況與總樣本特征參數對比Tab.5 Comparison of synthetic conditions and total sample characteristic parameters

車輛運行狀態并不只與單一運動學特征有關。速度、加速度的聯合分布規律決定了發動機的比功率(VSP),是確定車輛行駛狀態的關鍵因素[1]。因此,對合成工況進行速度-加速度聯合分布的驗證十分必要。如圖7所示,合成工況的高速段(40~60 km/h)占比較總樣本增大,是因為類別2、類別3兩類片段的抽取過程中,在該部分統計量較多。低速段(0~20 km/h)的分布趨勢比較一致,多位于加速度較小的區域內,符合環衛車的工作特點。說明所構建代表工況能很好地反映試驗數據樣本,表征城市環衛車的實際行駛特征。

圖8 TJSTC 與其他代表工況對比Fig.8 Comparation between TJSTC and other cycles

4 合成工況比較分析

為進一步分析天津市環衛車的運行工況,將所構建的天津市環衛車代表工況的部分特征參數與C-WTVC 標準工況、C-WTVC*工況、中國自卸行駛汽車工況(China Heavy-duty Commercial Vehicle Test Cycle for Dumper,CHTC-D)工況進行對比。其中,C-WTVC*工況為C-WTVC標準工況去除432 s的高速段后的工況。

TJSTC工況具有勻速比例、怠速比例大、速度變化趨勢平緩、平均速度小的特點。相比于C-WTVC工況,TJSTC工況的平均速度約為C-WTVC工況的30%,勻速、怠速比例略高,其主要原因是環衛車在清潔作業時必須保持穩定的較低車速??紤]此因素的影響,將去除高速段的C-WTVC*工況與TJSTC工況進行對比,結果表明,C-WTVC*雖在平均速度上與TJSTC更為接近,但加速、勻速比例與TJSTC工況差異依舊明顯。與CHTD-D 工況相比,TJSTC 工況的平均速度、加減速比例較低,勻速比例較高。與其他3種標準工況對比表明,現有的C-WTVC工況、C-WTVC*工況、CHTC-D工況與TJSTC 工況差異較大,難以有效的反映城市環衛車的實際工作狀態,不適用與城市環衛車的工作測試。

5 結論

1)本文以天津市環衛車為研究對象,采用自主駕駛法采集數據782 ks,經過數據清洗、片段劃分后,得到運動片段3 036 個,運用python 語言編寫程序腳本,獲得各片段的特征值,并以主成分分析法、Kmeans聚類法、肘部法對運動片段進行聚類處理,最后用鄰域搜索法完成了時長為1 745 s的天津市環衛車典型工況構建。

2)通過GIS技術對環衛車工況曲線進行可視化,3類片段的空間分布規律符合環衛車的工作特點。特征值誤差分析與速度-加速度聯合概率分布表明,合成工況與總樣本的誤差為4.60%,且速度-加速度分布趨勢相似,說明合成工況可以很好地反映總體采集樣本。

3)將構建的TJSTC工況與現有標準工況進行對比,結果表明環衛車TJSTC具有勻速比例高、平均速度低、加減速比例小的運行特點,能真實地表征城市環衛車運行狀態,為區域內環衛車性能優化提供了有效的支持。

猜你喜歡
特征參數天津市聚類
故障診斷中信號特征參數擇取方法
基于特征參數化的木工CAD/CAM系統
有趣的云
如果畫筆會說話?
天津市第三屆“未來之星”初中數學邀請賽
基于DBSACN聚類算法的XML文檔聚類
基于PSO-VMD的齒輪特征參數提取方法研究
基于高斯混合聚類的陣列干涉SAR三維成像
統計特征參數及多分類SVM的局部放電類型識別
一種層次初始的聚類個數自適應的聚類方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合