?

數據驅動的公路典型風險場景聚類與特征分析

2024-04-01 09:45胡偉超陳艷艷于鵬程于士杰牛世峰
科學技術與工程 2024年8期
關鍵詞:路段典型聚類

胡偉超, 陳艷艷, 于鵬程, 于士杰, 牛世峰*

(1.北京工業大學城市交通學院, 北京 100124; 2.公安部道路交通安全研究中心, 北京 100062; 3.長安大學汽車學院, 西安 710064)

近年來,中國公路里程和機動車保有量不斷增加,公路交通事故因嚴重程度高、對國民經濟影響大等原因,逐漸成為政府、企業和研究機構關注的重點。如何預防公路交通事故的發生成為亟需解決的難題,而公路交通典型事故場景是開展交通事故致因分析、智能輔助駕駛設備測試、車輛運行風險評估等關鍵預防預控問題研究的基礎,對其進行研究具有非常重要的意義。

目前,關于典型風險場景的研究主要集中在城市道路典型風險場景風險分析和自動駕駛測試場景設計兩個方面[1]。一些研究者針對部分城市道路典型場景的風險進行了深度分析,如人車碰撞危險場景[2-4]、丁字路口車輛與車輛碰撞危險場景[5]和特定道路環境場景[6]。自動駕駛測試場景研究主要針對自動駕駛測試場景選取和設置依據進行研究,如無人駕駛典型測試場景構建[7-10]、無人駕駛汽車安全測試方法[11-12]等??傮w來看,上述研究對于城市道路和自動駕駛領域的典型風險場景進行了一定程度的探索,而目前專門針對公路交通進行典型風險場景研究與交通風險分析的文獻相對較少,基于海量真實交通事故數據開展公路交通典型風險場景研究尚鮮見報道,嚴重制約了無人駕駛公路場景測試及公路交通安全分析和改善研究。

針對這一問題,基于6個典型區域近5年海量真實公路交通事故數據,篩選確定場景分類變量,形成公路交通事故場景數據集,針對不同路段和路口公路交通環境,基于交通主體不同運動狀態進行聚類分析,確定16種典型的公路 “動態”風險場景,并對典型風險場景“靜態”安全特征進行分析,為后續智能車輛測試場景構建和車輛運行風險評估提供場景依據和風險特征基礎。

1 數據基礎

1.1 公路交通事故原始數據說明

考慮到天氣、經濟、地形、環境等都會對場景風險度特征形成影響,選取東北、華北、西北、華東、華南、西南六大區域代表性省份5年內約60 000條公路交通事故數據作為數據源,其中隧道、急彎、橋梁和陡坡路段數據為全部交通事故數據,其他公路路段為死亡事故數據。

1.2 公路交通事故場景數據數據庫獲取

為了獲取合理有效的場景事故數據,首先對原始數據進行預處理,然后篩選確定場景分類關鍵因素,通過關鍵因素合并同類場景,計算風險度指標,形成公路交通事故場景數據庫。

1.2.1 場景分類變量篩選

原始交通事故數據屬性較多,并非所有因素都對場景分類具有顯著影響。而場景分類變量太多,會導致分類場景事故數較少,代表性變弱。在參考已有研究成果的基礎上,從自車因素、交通沖突方因素、道路因素、環境因素4個方面篩選確定14個危險場景分類變量,如圖1所示。

圖1 危險場景分類變量

1.2.2 分類變量數據獲取

分類變量數據都是從原始數據獲取,但從獲取方式來看,分類變量還可以分為直接獲取變量和間接獲取變量兩類。前者為數據庫本身具有變量,變量包含屬性值較多,需根據變量對風險的影響大小,對屬性值進行合并和賦值,包括環境、道路和自車狀態因素所有變量和沖突方交通方式。后者為數據庫不直接具有,但可通過其他屬性值進行推斷的變量,包括沖突方行駛狀態、相對運行方向兩個變量。兩個變量主要通過車輛運行狀態、違法行為和事故簡易描述獲取。

1.2.3 公路交通事故場景數據集構建

通過原始數據進行分析計算獲得場景分類變量,將場景分類變量完全相同的數據進行合并,共獲得10 603條包含不同分類變量的危險場景的數據集。該數據集是后續研究的基礎,其分類變量分布情況如圖2所示。

圖2 危險場景分類變量分布

2 公路交通典型風險場景聚類分析方法

為了能夠獲得公路交通的典型風險場景,在對已有文獻進行分析的基礎上,將公路分為7類典型路段和路口,其中路段包括橋梁路段、陡坡路段、普通路段、隧道路段、急彎路段,路口包括三枝分岔口和四枝分岔口兩類。為了獲得不同典型路段和路口發生事故的典型交通沖突形式,基于前述公路交通事故場景數據集,利用K-means算法構建了不同路段典型交通沖突方式聚類方法。

2.1 基于K-means的路段路口典型交通沖突方式聚類方法

以K-means算法為核心構建不同公路路段和路口典型交通沖突方式聚類方法,選取聚類變量包括自車交通方式、自車行駛狀態、沖突方交通方式、沖突方行駛狀態、相對運動方向5個分類變量,分別針對7類典型路段和路口進行聚類分析。

首先,利用5個分類變量構建h個m×5數據集Xp,其中,m為每類典型路段發生事故的數量,h=7。聚類目標是使得各類的聚類平方和最小,即最小化,可表示為

(1)

結合最小二乘法和拉格朗日原理,聚類中心為對應類別中各數據點的平均值,同時為了使得算法收斂,在迭代過程中,使最終的聚類中心盡可能地不變。本文聚類方法的K值通過手肘法確定,其核心指標是誤差平方和(sum of the squared errors,SSE)。

(2)

式(2)中:Ci為第i個分類;p為Ci中的樣本點;mi為Ci的質心(即Ci中所有樣本的均值);SSE為所有樣本的聚類誤差,反映聚類效果的好壞。

2.2 路段路口典型交通沖突方式聚類結果

通過聚類分析,橋梁、陡坡、普通、隧道、急彎5類路段的最佳聚類數K值分別為2、2、3、2和3,三枝分岔口和四枝分岔口兩類路口的最佳聚類數K值都是2,具體聚類結果如表1所示。

表1 公路典型風險場景庫

3 公路交通典型風險場景風險特征分析

在公路安全分析和測試場景構建中,通常需要保證選取和構建場景風險度分布符合一定規律,因此需要明晰不同場景的平均風險程度以及不同道路和環境因素對場景風險度的影響?;诓煌湫惋L險場景的交通事故數據對典型場景風險度進行分析,然后深入分析道路和環境分類變量對場景風險度的影響特征,便于后續其他研究使用。

3.1 公路交通典型場景風險特征分析

選用事故數、死亡事故平均死亡人數和平均死亡人數3個指標對典型風險場景導致事故的可能性和嚴重程度進行分析。由于原始數據源限制,平均死亡人數指標只計算橋梁、隧道、陡坡和急彎4類路段的指標,結果如表2和圖3所示。

表2 典型場景危險度分析

圖3 典型場景危險度指標變化趨勢

從事故數量角度看,P3場景發生事故數達到3 749起,可能因為普通道路在公路中的占比大導致,但也從側面說明駕駛員在公路交通駕駛中面臨P3典型風險場景的概率最高。發生事故數在200~400起的場景包括SI1、SI2和S1,可見在公路交通中路口風險場景也較為普遍風險場景,尤其十字交叉口典型場景。發生事故數在100~200起的典型場景包括Q2、J2、S2和P1,分別表示橋梁路段同向追尾或刮擦沖突、急彎路段車輛和行人沖突、三枝分岔口同向追尾或刮擦沖突以及普通路段大客車與大客車追尾或刮擦沖突,其他典型場景發生事故數都在100起以內。

從事故嚴重程度看,典型風險場景J3、Q2和P2的死亡事故平均死亡人數較大,分別達到1.4、1.2和1.17,這3種典型風險場景中J3和P2場景發生事故數較少,分別是6起和13起,平均死亡人數代表性會受到一定影響,而Q2典型風險場景發生事故數達到122起,其平均死亡人數具有較好的代表性。從最大死亡人數看,Q2、D1、J3、P1、P2、P3和SI1場景都發生過3人及以上事故,說明發生較大事故的可能性較高??傮w來看,J3、D1、Q2、P1、和P2 典型場景在平均死亡人數和最大死亡人數兩個指標都較大,需特別重點關注。

3.2 道路和環境因素對典型危險場景風險的影響特征

在測試場景構建和道路安全分析時,為了豐富和明確典型場景的風險特征,不僅需要明晰典型風險場景的平均風險程度,還需明確各道路和環境因素對典型風險場景風險度的影響關系。因此,基于道路交通事故數據,對道路和環境因素影響典型風險場景風險度的特征進行分析。

為了更好地表征各因素對場景風險度的影響,設計場景事故數相對基準變化率和死亡事故平均死亡人數兩個指標對場景風險度變化進行度量,如式(3)和式(4)所示。其中,事故數相對基準變化率主要考量各因素條件下特定場景事故所占比重相對于不考慮影響因素條件下特定場景事故所占比例的增長率。

(3)

(4)

3.2.1 道路因素對典型場景危險度的影響特征

分析的道路因素包含的路面狀況、路表情況、交通信號方式和防護設施類型4個因素,結果如圖4~圖7所示。其中平均死亡人數為0的場景是由于該場景下發生事故數為0導致。

圖4 路面狀況對典型場景風險度的影響

(1)路面狀況對典型場景風險度的影響特征。由圖4可知,路面完好與否對大部分場景事故數量比重影響不大,缺陷和施工條件下只有SU1和J1場景發生事故比重大幅增加。從平均死亡人數指標看,路面完好條件下Q2、P2和J3場景下平均死亡人數相對較高,缺陷和施工條件對平均死亡人數指標影響較小。

總體來看,路面狀況因素對場景風險度影響較小,在測試場景設計和安全分析時,可以不做重點關注。

(2)路表情況對典型場景風險度的影響特征。從事故發生數量來看(圖5),路表情況對于部分場景的事故數量比重具有較大影響,潮濕路面條件下, P2、SU1和SU2場景的事故數量比重相對基準出現較大幅增加;漫水和積水路面條件下,D1和S2場景的事故數量比重相對基準出現大幅增加;冰雪路面條件下,SU2和SI2場景的事故數量比重相對基準會大幅增加。

圖5 路表情況對典型場景風險度的影響

從事故嚴重程度看,干燥路面條件下,Q2和J3場景的平均死亡人數較高;潮濕路面條件下,D1和P2場景的平均死亡人數較多;積水和冰雪條件下,平均死亡人數影響不大。

總體來看,路表情況對典型場景風險度影響較大,在測試場景構建和公路安全分析時,需重點關注。

(3)防護設施類型對典型場景風險度的影響特征。從事故發生數量來看(圖6),無防護條件下,各典型場景的事故數量分布與基準分布較為相似,但在有物理隔離設施時,Q2、P2、SU2、J3場景的事故數量比重相對于基準出現大幅增加,這可能和物理隔離措施限制部分交通沖突方形式發生有關。在裝設護欄條件下,大部分典型場景的事故比重相對于基準出現了下降,SI1和SI2場景的事故率相對于基準有小幅上升。

圖6 防護設施類型對典型場景風險度的影響

從事故嚴重程度來看,在無防護條件下,Q2和J3 兩個場景的平均死亡人數較多;物理隔離設施條件下,D1和P2 兩個場景的平均死亡人數較多;裝設護欄條件下,D1、P1和SI1 場景的平均死亡人數稍高于其他場景。

總體來看,道路防護措施對場景風險度影響較大,尤其是物理隔離設施影響較大,在設計測試場景和安全分析時,需做重點考慮。

從事故發生數量來看(圖7),無控制條件下,P3場景事故數量比重較基準增加;有信號燈和標線條件下,P1、SU2、SI1和SI1 場景的事故數量比重會大幅增加;只有標志標線條件下,只有P2場景的事故數量比重有較大幅增加。

圖7 交通信號方式對典型場景風險度的影響

從事故嚴重程度相比,無控制條件下D1和J3場景的平均死亡人數較高;有信號燈和標線條件下,P1場景的平均死亡人數較高;只有標志標線條件下,Q2和P2場景下的平均死亡人數較高。

總體來看,在交通控制方式中是否同時具有信號燈和標線對場景的風險分布有較大影響,在測試場景設計和公路安全分析時,需做重點關注。

3.2.2 環境因素對典型場景危險度的影響特征

分析的環境因素包括照明條件、天氣和能見度,分析結果如圖8~圖10所示。

圖8 照明條件對典型場景風險度的影響

(1)照明條件對典型場景風險度的影響特征。從事故發生數量比重(圖8)來看,白天條件下,場景P1發生事故的比重較基準會大幅增加,場景Q1和J2發生事故的比重較基準會較大幅下降;夜間有路燈的條件下,Q1、D2、P1、P2、J1、J2和J3發生事故的比重較基準會一定幅度的下降;夜間無路燈條件下,P2場景發生事故的比重較基準會有非常大幅度增加,Q1、D2、P1、P2、SU2和SI1發生事故的比重較基準會一定幅度的下降。從事故嚴重程度來看,白天條件下,場景J3的平均死亡人人數較高;夜間有路燈條件下,D1、P1和J1場景發生事故的平均死亡人數較高;夜間無路燈條件下,Q2和P2場景發生事故的平均死亡人數較高??傮w來看,照明條件對各場景發生事故數量和嚴重程度都有較大影響,尤其是夜間無路燈條件影響尤其明顯,在設計測試場景和安全分析時,需做重點關注。

(2)天氣條件對典型場景風險度的影響特征。從事故發生數量角度來看(圖9),晴天和陰天條件下各場景的事故比重和基準比重較為一致,影響較小;雨天條件下, SU1場景的發生事故比重會大幅增加;雪天條件下,D2、S2和SU2場景發生事故的比重大幅增加;霧天條件下,Q1和S1場景的發生事故比重會大幅增加。從事故發生嚴重程度來看,晴天條件下,P2場景的平均死亡人數較高;陰天條件下,D1和P1場景的平均死亡人數較高;雨、雪和霧天對平均死亡人數影響不大??傮w來看,天氣因素中雨、雪、霧天氣對事故發生數量比重影響較大,晴天和陰天對特定場景的平均死亡人數有較大影響,后續使用中需注意。

圖9 天氣對典型場景風險度的影響

(3)能見度條件對典型場景風險度的影響特征。從事故發生數量角度來看(圖10),能見度為50 m以內條件下,J3場景發生事故比重會大幅增加;能見度為50~100 m條件下,P2、SU1和SU2場景發生事故比重會較大幅增加;能見度為100~200 m條件下,Q2、J1和J3場景發生事故比重會較大幅增加;能見度為200 m以上條件下,S2、P1和SI1場景發生事故比重會有小幅增加。從發生事故嚴重程度看,能見度為50 m以內對場景的平均死亡人數影響較小;能見度為50~100 m以內條件下,Q2場景的平均死亡人數較多;能見度為100~200 m條件下,P2場景的平均死亡人數會非常大幅的增加,需特別注意。能見度為200 m以上條件下,J3場景的平均死亡人數會非常大幅的增加??傮w來看,能見度對各場景風險程度的影響較大,其中,低能見度對特定場景的事故發生率影響較大,較好的能見度對特定場景的事故嚴重程度影響較大。

圖10 能見度對典型場景危險度的影響

4 結論

以6個典型區域代表性省份近五年公路交通事故大數據為源,從自車因素、交通沖突方因素、道路因素、環境因素4個方面篩選14項場景表征指標,設計典型交通方式聚類方法,分別針對橋梁路段、陡坡路段、普通路段、隧道路段、急彎路段五類路段和三枝分岔口、四枝分岔口兩類路口進行典型沖突方式聚類,獲得16種典型場景。為了方便測試場景設計和安全分析使用,對16種典型場景的風險度特征和道路和環境因素對典型場景風險性的影響特征進行分析。

猜你喜歡
路段典型聚類
用最典型的事寫最有特點的人
冬奧車道都有哪些相關路段如何正確通行
多項式求值題的典型解法
部、省、路段監測運維聯動協同探討
A Survey of Evolutionary Algorithms for Multi-Objective Optimization Problems With Irregular Pareto Fronts
典型胰島素瘤1例報道
基于XGBOOST算法的擁堵路段短時交通流量預測
基于DBSACN聚類算法的XML文檔聚類
基于高斯混合聚類的陣列干涉SAR三維成像
一種層次初始的聚類個數自適應的聚類方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合