?

面向自動駕駛汽車的三枝路口典型危險場景構建方法

2022-12-09 04:54胡越寧牛學軍
關鍵詞:商用車典型聚類

胡越寧, 趙 丹, 牛學軍

(中國人民公安大學交通管理學院,北京 100038)

0 引言

自動駕駛汽車測試主要采用基于場景的測試方法,即通過預先設定的場景,要求被測車輛完成某項特定目標或任務而對其進行測試的方法。相比于里程測試,測試場景的篩選縮減了里程測試過程中大量的“無風險”里程,測試效率高且更有針對性[1]。因此,構建自動駕駛汽車的城市道路平面交叉口測試場景十分重要。平面交叉口包括三枝路口和四枝路口,雖然三枝路口相較于四枝路口沖突點少,但事故發生量并不少[2],因此自動駕駛汽車在三枝路口的安全性能值得研究。

目前,不少學者關于交叉口危險場景的研究集中在四枝路口(主要為十字路口)[3-6]??紤]到四枝路口與三枝路口在運行規則、控制方式、設施設計上存在較大差異,一些研究也開始考慮三枝路口危險場景。Nitsche等[7]基于OTS數據庫中1 056起事故案例,采用K-Medoids聚類算法提取出13類三枝路口和6類四枝路口預碰撞場景。徐向陽等[8]基于NAIS數據庫中499起事故案例,采用層次聚類算法得到7類四枝路口和1類三枝路口場景。廖靜倩等[9]基于NAIS數據庫中277起事故案例,采用層次聚類算法得到4類三枝路口危險場景。

綜上,國內外關于三枝路口事故場景的研究還比較少,且由于道路交通事故數據來源于傳統車輛,因此,大部分學者的研究主要面向輔助駕駛測試[3-6,8-9],測試輔助駕駛系統在面對傳統車輛駕駛人的危險場景下是否可以緩解事故傷害甚至避免事故。也有學者的研究面向自動駕駛測試[7],但事故案例中往往包含大量人類駕駛人的違法行為,這些違法行為在自動駕駛汽車運行過程中根本不會出現。因此,為了提高自動駕駛汽車三枝路口測試場景覆蓋率和測試效率,本文基于實際道路交通事故數據,依據自動駕駛汽車特點篩選得到碰撞事故案例,提取典型場景要素,旨在得到面向自動駕駛汽車的三枝路口典型危險場景,從而為擴充我國自動駕駛汽車測試場景庫提供參考。

1 數據來源與篩選

本文選擇國內自動駕駛產業發展較為迅速的地區作為研究對象,選擇北京市和寧波市作為典型城市。北京市地處華北平原,常住人口2 189萬,機動車保有量685萬;寧波市地處東南沿海,常住人口954萬,機動車保有量300萬。兩市的道路交通事故數據完備,能夠代表兩類地區的交通環境和事故特征。收集兩市近3年的道路交通事故數據,共計12 454起,包括70個描述交通事故信息的字段可作為場景要素。本文研究的路口類型選定為三枝路口,事故車輛類型選定為乘用車或商用車??紤]到路口事故的多樣性,車輛運動狀態僅考慮直行、左轉彎和右轉彎。此外,還需滿足以下3個篩選條件:

(1)剔除數據缺失或者不明的事故案例;

(2)剔除由于路段常見違法行為引發的事故案例(如切入、倒車、追尾等);

(3)剔除存在違反通行規定的違法行為的事故案例(如逆向行駛、不按規定車道行駛等)。

Aydin等[10]認為使用傳統道路交通事故數據時,通過剔除人為因素,可以生成更符合自動駕駛汽車的事故場景。本文認為相對于傳統車輛駕駛人,自動駕駛汽車具備3個特點:①具備良好的駕駛技能;②不會喪失或部分喪失駕駛能力;③不會主動違反交通規則。表1列出各特點對應的傳統車輛駕駛人違法行為。選定的事故為雙方事故,若其中一方無以上違法行為,且為乘用車或商用車,則被視為自動駕駛測試車輛,另一方歸為交通參與者。

表1 傳統車輛駕駛人違法行為

按照上述條件,最終篩選得到378例碰撞事故案例。其中180例發生在公路,138例發生在城市道路,60例發生在其他道路。

篩選案例可以確保測試車輛駕駛人是理性的,但是由于交通參與者存在各種各樣的違法行為,即便駕駛人或多或少地做出了應對措施,事故仍不可避免地發生了。因此有必要了解目前駕駛人需要應對的危險情況,因為這些情況同樣可能發生在自動駕駛汽車上[7]。

2 數據處理方法

2.1 聚類分析方法

聚類分析的核心思想是將個體或對象分類,使得同一類的對象之間的相似性比與其他類對象的相似性更強。其目的在于使類內對象的同質化最大化和類與類間對象的異質化最大化。層次聚類法(hierarchical clustering method)是聚類分析諸多方法中使用最多的,該算法可以有效避免靠經驗或專業知識對分類的影響,且可復用性較高[11]。

2.1.1 算法步驟

首先,將個樣本看成n類(一類包含一個樣本),然后將性質最接近的兩類合并成一個新類,得到n-1類,再從中找出最接近的兩類加以合并,變成n-2類,如此下去,最后所有的樣本均在一類,將上述并類過程畫成一張圖(稱為聚類圖)便可決定分類數,每類各有哪些樣本。

2.1.2 樣本距離

聚類分析中,常用距離來度量樣本之間的接近程度。本文采用歐式距離計算樣本之間的距離,第i個樣本和第j個樣本之間的距離為:

式中:p為樣本中含有的變量個數;xik為第i個樣本中第j個變量的度量值。

2.1.3 類間距離

離差平方和法(Ward法)是先讓n個樣本各自成一類,然后每次縮小一類,每縮小一類,離差平方和就要增大,選擇使其增加最小的兩類合并,直到所有的樣本歸為一類為止。

類Gp中的樣本的離差平方和為:

式中:xi為類Gp中的第i個樣本,為類Gp的重心。

類Gp和Gq之間的距離平方為:

式中:Dp+q為類Gp與類Gq合并后的新類Gp+q的離差平方和;Dp為類Gp的離差平方和。

2.2 卡方檢驗

卡方檢驗(chi-square test)是應用較廣的一種假設檢驗方法,屬于非參數檢驗的一種,目的是通過樣本數據的分布來檢驗總體分布與期望分布是否一致??ǚ綑z驗的公式可表示為:

式中:fo表示實際頻數,fe代表期望頻數,n為卡方檢驗的自由度。

本文將利用聚類分析和卡方檢驗挖掘事故的特點,提取典型參數特征。

3 典型危險場景構建與分析

3.1 聚類參數選取

如前所述,描述每起交通事故信息的場景要素多達70個,因此在聚類分析前應對各場景要素進行篩選。篩選原則有3條:一是因測試車輛與交通參與者的類型、運動狀態和碰撞角度的組合可以還原碰撞事故場景,將其視為必須保留的場景要素;二是剔除無法對自動駕駛汽車的環境感知或控制執行造成影響的場景要素;三是剔除差異性不明顯的場景要素。文獻[12]指出,數據中場景要素的某一特征占樣本總數的75%以上,差異性將不明顯,不能將所有初步選定的場景要素全部用于聚類分析,如圖1所示的路表、通行和天氣情況。

圖1 未選定場景要素的特征分布

綜上所述,共選取8個典型場景要素作為聚類參數:照明條件、交通控制方式、道路物理隔離、測試車輛類型、交通參與者類型、測試車輛運動狀態、交通參與者運動狀態和碰撞角度。

3.2 典型危險場景提取

3.2.1 聚類結果

對378例碰撞事故案例進行聚類分析,得到10類聚類結果。接著對聚類結果進行卡方檢驗,取置信度為90%,將計算的卡方值與卡方對照表對應的臨界值進行比較,若卡方值大于臨界值,則說明該參數具有典型參數特征,將依據各參數特征在每一類中所占比例和各參數特征在總體中所占比例,得到每一類的典型參數特征,表2將卡方值大于臨界值的數字加粗,將得到的典型參數特征用“*”標出。反之,則說明該參數的各個特征在該類中分布差異性不明顯,該參數沒有典型參數特征。

表2 三枝路口典型危險場景聚類結果

當卡方值大于臨界值時,以第1類聚類結果為例對典型參數特征的選取原則進行解釋:

(1)測試車輛類型的參數特征“商用車”包括30個樣本,故在第1類中所占比例為78.9%,大于“乘用車”的21.1%,在總體中所占比例為14.0%,大于“乘用車”的4.9%,故“商用車”的參數特征非常顯著,屬于第1類的典型參數特征;

(2)交通控制方式的參數特征,包括“信號控制”和“無信號控制”,雖然“無信號控制”在第1類中所占比例為47.4%,小于“信號控制”的52.8%,但是“無信號控制”在總體中所占比例為17.3%,大于“信號控制”的7.3%,故兩個參數特征共同作為第1類的典型參數特征。

當卡方值小于臨界值時,也就是某一類中某個參數的各個參數特征均不具有顯著的統計學特性,說明在提取典型危險場景時需要考慮所有的參數特征。另外,考慮到典型危險場景設計的合理性,當某參數特征在某一類中所占比例過小時,需要在選取參數特征時設定閾值[9],本文取10%,即選定為典型參數特征后,該參數特征在某一類中所占比例應大于10%,如第5類中照明條件中的參數特征“夜間無路燈照明”在總體中所占比例為11.1%,大于“白天”的8.9%和“夜間有路燈照明”的4.5%,故可以歸為典型參數特征,但是“夜間無路燈照明”在第5類中所占比例為6.5%,小于10%,故不選取為典型參數特征。

3.2.2 基于事故類型進一步提取典型參數特征

為了對未區分出來的典型參數特征做進一步的提取,使每一個參數只有唯一的典型參數特征(如第1類中的“交通控制方式”兩個參數特征共同作為第1類的典型參數特征),本文根據三枝路口碰撞事故案例中的場景要素“事故類型”對聚類分析得到的10類聚類結果作進一步的分析。事故類型分為財產損失事故、傷人事故、死亡事故,按照各種事故類型的占比乘以權重得到危險程度,權重分別取為0.6、0.3、0.1,最終選取危險程度最大的參數特征作為唯一的典型參數特征,危險程度的計算公式可以表示為:

式中:D表示危險程度,ω1、ω2、ω3分別表示財產損失事故、傷人事故、死亡事故的權重,A1、A2、A3分別表示為財產損失事故、傷人事故、死亡事故在總事故中的占比。

如確定第3類中的交通參與者類型,交通參與者類型中的參數特征“商用車”“摩托車”和“非機動車”在聚類分析時均被歸為典型參數特征,但通過事故類型分析可知“摩托車”的危險程度最高,故最終選定“摩托車”作為第3類的典型參數特征,如表3所示。

表3 交通參與者類型確定

3.3 典型危險場景分析

經過提取的典型參數特征,最終得到10類典型危險場景,如表4所示。

表4 三枝路口典型危險場景

10類三枝路口典型危險場景可描述為:第1類場景為白天,右轉的商用車與直行的非機動車發生同向側面碰撞,事故發生地點無信號控制,附近有中心隔離和機非隔離設施。第2類場景為白天,直行商用車與左轉非機動車發生同向側面碰撞,事故發生地點無信號控制,附近無隔離設施。第3類場景為白天,直行的商用車與左轉的摩托車發生直角側面碰撞,事故發生地點無信號控制,附近無隔離設施。第4類場景為白天,直行的商用車與左轉的非機動車發生直角側面碰撞,事故發生地點為信號控制,附近有中心隔離和機非隔離設施。第5類場景為白天,直行的乘用車與通過人行橫道的非機動車發生直角側面碰撞,事故發生地點無信號控制,附近有中心隔離設施。第6類場景為白天,左轉的商用車與直行的非機動車發生直角側面碰撞,事故發生地點為信號控制,附近有中心隔離和機非隔離設施。第7類場景為白天,直行的商用車與通過人行橫道的行人發生碰撞,事故發生地點無信號控制,附近有中心隔離和機非隔離設施。第8類場景為白天,直行的乘用車與左轉的摩托車發生直角側面碰撞,事故發生地點無信號控制,附近無隔離設施。第9類場景為白天,左轉的乘用車與直行的摩托車發生對向側面碰撞,事故發生地點無信號控制,附近無隔離設施。第10類場景為夜間,直行的乘用車與通過人行橫道的行人發生碰撞,事故發生地點無信號控制,附近有路燈、中心隔離和機非隔離設施。

上述10類三枝路口典型危險場景,可根據其涉及的要素特征進一步歸類:①從照明條件角度而言,第10類涉及夜間有路燈照明的場景;②從交通參與者角度而言,第1、2、4、5、6類為非機動車參與場景,其中第1、2、4、6類為商用車和非機動車工況,占樣本總數的31%,另外,第3、8、9類為摩托車參與場景,第7和10類為行人參與場景;③從運動狀態角度而言,第1類場景為直行與右轉彎沖突,第2、3、4、6、8、9類為直行與左轉彎沖突,占樣本總數的63%,第5、7、10類為非機動車、行人通過人行橫道時的場景。

4 結論

本文篩選得到378例碰撞事故案例,根據案例中的場景要素分析確定聚類參數,通過聚類分析、卡方檢驗和事故類型分析,提取典型參數特征,最終得到10類三枝路口典型危險場景。

(1)篩選得到的碰撞事故案例可以了解目前測試車輛駕駛人需要應對的危險情況,這對于研究自動駕駛汽車需要面對的危險情況具有一定的參考價值。

(2)通過聚類分析和卡方檢驗提取典型參數特征,并基于事故類型進一步提取典型參數特征,得到10類符合中國交通實際的三枝路口典型危險場景,其各具有代表性和典型性。其中,商用車和非機動車工況場景,以及直行與左轉彎的沖突是需要重點關注的三枝路口典型危險場景。

本文只收集了兩個城市的道路交通事故數據,并不能完全代表國內實際,未來可以收集更多典型城市的事故數據。事故案例中沒有詳細的事故發生過程信息,無法了解雙方在發生碰撞前的具體運動狀態(如減速、轉向等),從而無法構建較為完備的場景,未來將尋找內容更豐富的深度事故數據開展研究。

猜你喜歡
商用車典型聚類
用最典型的事寫最有特點的人
商用車聯合制動系統分析
多項式求值題的典型解法
比亞迪商用車
典型胰島素瘤1例報道
基于ADVISOR的燃料電池商用車動力系統仿真
基于K-means聚類的車-地無線通信場強研究
2019年11月汽車銷量同比下降商用車表現好于乘用車
基于高斯混合聚類的陣列干涉SAR三維成像
一種層次初始的聚類個數自適應的聚類方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合