?

基于駕駛場景與決策規則的智能汽車換道決策

2024-03-19 11:46浦同林張倩兮聶枝根
關鍵詞:樣本容量車道決策

張 昆,浦同林,張倩兮,聶枝根

(昆明理工大學交通工程學院,昆明 650500)

0 引言

行為決策模塊是智能網聯汽車在復雜、動態的交通環境中安全行駛的關鍵,能夠更安全、有效地實現駕駛意圖[1]。換道行為是車輛行駛過程中最為常見的行為,分為自由換道[2]、協同換道[3]和強制換道[4],相比于車道保持行為而言,具有更高的風險。智能網聯汽車根據交通規則和其他交通參與者的運動狀態做出換道或保持車道的行為決策,如果在換道條件不滿足的情況下執行換道,將嚴重影響交通安全,因此,準確的換道決策對于交通安全至關重要。

目前,針對車輛換道決策的研究已有較多成果,Gipps等[5]最早對換道行為進行建模,從換道必要、意向和安全三方面分析,提出了一種基于規則的換道決策方法,但難以確定模型的參數。隨著人工智能技術的進步,機器學習和深度學習被廣泛應用于換道行為決策[6-10]。Motamedidehkordi等[11]提出傳統的規則模型不能精確地表示駕駛員在換道決策時考慮的諸多因素,提出了基于隨機森林(Random Forest,RF)的換道決策模型,其具有良好的預測精度。鄧建華等[12]分析了駕駛員換道決策的內外因子,引入基于換道決策機理的多車道元胞自動機模型,其在不同的V/C條件下均具有良好的適應性。徐兵等[13]分析了換道場景中各特征變量與換道決策之間的關系,提出了基于梯度提升決策樹(gradient boosting decision tree,GBDT)換道決策模型,引入新的特征變量,提高了決策模型的預測性能。賈寒冰等[14]針對智能車輛在道路上的換道決策問題,利用新增的特征變量增廣原訓練集,提高了模型預測準確率。Lopez等[15]提出了結合深度學習與博弈論的換道決策算法,設計了智能算法調整博弈參數,可快速、可靠地進行決策。Feng等[16]在給定相對位置和速度信息的情況下,通過綜合考慮時空分布、交通規則等因素,建立了基于時空間隙的換道決策模型。Feng等[17]針對不同的換道工況,從車輛的物理特性、交互感知和道路結構三方面選取特征變量,以此建立換道決策模型。Peng等[18]采用雙層深度強化學習算法對狀態空間進行處理,使用D3QN算法分析場景中潛在的換道價值并進行決策。張羽翔等[19]通過強化學習來求解車道變換過程中的精確決策參數,從而提高安全性能,并可在變道場景中模仿真實的駕駛行為。

目前,關于智能網聯汽車自由換道決策的研究較少,且預測精度較低,在復雜多變的交通環境下,如何安全、準確地做出換道決策,還有待進一步研究。因此,在上述研究的基礎上,引入一種基于換道場景與決策規則的智能網聯汽車換道決策模型,進一步提升模型訓練分類的準確率。本文的主要工作如下:

1)對NGSIM數據集進行濾波,提取了真實駕駛環境下的換道數據,包括自車和周圍車輛的行駛狀態變量。

2)NGSIM數據集存在樣本數量過少、目標數據提取繁瑣、數據質量不佳等問題,根據NGSIM的狀態變量提取原則,建立了樣本容量更大、換道特征變量取值更為直觀準確、符合真實駕駛場景的換道場景數據集,擴充了NGSIM 換道場景數據集。

3)建立了基于決策規則的自由換道決策模型,從換道安全、換道收益、換道必要性3個方面分析了換道行為決策,將決策規則用于換道場景數據集,得出正負樣本。

4)將換道場景數據集與從NGSIM數據集中提取出的換道樣本融合,基于貝葉斯優化核函數的支持向量機模型對數據集進行訓練分類,對不同樣本容量和不同機器學習模型的訓練結果進行了對比分析。

1 數據處理

NGSIM US-101和I-80車輛軌跡數據被廣泛應用于車輛換道行為研究[20]。該數據集通過視頻分析得到車輛的位置、速度、加速度等狀態信息,存在一定的噪聲,本文中使用滑動平均濾波方法[21]對原始數據進行處理,之后對數據集中的自由換道數據進行提取,根據文獻[7-9]對換道決策過程的分析提取規則。具體規則如下:

1)NGSIM數據集中包含多種車輛類型,包括摩托車、商用車、乘用車等,由于換道方式及動力學特性的差異和本文中的決策模型主要針對乘用車,因此僅保留乘用車數據。

2)數據集包含6條車道,第6車道為匯入匝道,本文中研究的內容為自由換道,不考慮匝道匯入的強制換道行為,故不考慮第6車道的換道行為。

3)換道車輛換道意圖開始時刻前、后4 s內車輛的狀態能夠較好地覆蓋整個換道過程[22],最終選?。踭0-4,t0+1]時間段內的狀態信息,其中t0為換道初始時刻。

4)換道初始時刻t0的提取尤為重要,將橫向速度大于0.2 m/s的時刻作為t0[23],數據集中存在橫向速度波動但未進行換道操作的數據,采集[t0,t0+1]]時間段內的數據,提取橫向速度大于0.2 m/s且1 s后橫向位移大于0.3 m的數據作為換道數據,同時剔除連續換道數據。

5)提取出的換道數據為正樣本,記為+1,未換道數據為負樣本,記為-1。

按照上述規則提取數據后,提取出529條換道數據和870條未換道數據。

車輛的自由換道行為涉及周圍車輛的運動狀態,換道決策需要考慮各種交通因素的影響,不考慮彎道換道行為,建立兩車道直道自由換道模型,道路分為初始車道和目標車道,交通環境包含換道車輛SV,初始車道前車PV,目標車道前車TP和目標車道后車TF,如圖1所示。

圖1 換道場景示意圖

對能從NGSIM數據集中直接獲得的原始狀態變量(位置、速度、加速度等)進行處理,得到反映各車相互關系的狀態變量,并進行編號:

1)vSV:換道車輛的速度;

2)ΔvPV=vPV-vSV:初始車道前車與換道車輛速度差;

3)ΔvTP=vTP-vSV:目標車道前車與換道車輛速度差;

4)ΔvTF=vSV-vTF:目標車道后車與換道車輛速度差;

5)SPV:初始車道前車與換道車輛車距;

6)STP:目標車道前車與換道車輛車距;

7)STF:目標車道后車與換道車輛車距;

8)ΔaPV=aPV-aSV:初始車道前車與換道車輛加速度差;

9)ΔaTP=aTP-aSV:目標車道前車與換道車輛加速度差;

10)ΔaTF=aSV-aTF:目標車道后車與換道車輛加速度差。

這些特征變量反映了在換道初始時刻交通場景中各車輛的相互關系,忽略了換道之后的交通行駛狀況對自由換道決策的影響,引入新的特征變量:

11)vdesired:換道車輛的期望車速,在NGSIM數據集中的提取規則為換道車輛在[tf-2,tf+2]時間段內的平均車速,tf為換道終止時刻;

12)ΔS=STP-SPV:換道前后換道車輛與前車的車距變化。

在提取出特征變量后,從互信息(mutual information,MI)的觀點出發,在NGSIM數據集中研究各特征變量與換道決策之間的關系[24]?;バ畔⒈硎緸椋?/p>

式中:p(a,b)為聯合分布,p(a)、p(b)為邊緣分布。

最大信息系數(maximal information coefficient,MIC)[25]是互信息在一定條件下的估值,利用互信息和網格劃分方法計算[26],用于衡量變量間相互依存的程度,能夠較好地表現特征變量間的線性和非線性關系,具有優異的普適性。MIC計算公式如下:

式中:x、y為劃分網格的數量,B為網格劃分的上限值。

圖2展現了各特征變量與換道結果的MIC數值。

圖2 特征變量與換道結果的MIC值

2 換道規則模型

換道車輛SV自身的行駛狀態及周圍車輛的行駛狀態都將影響SV是否換道,基于上文評估出的MIC值較高的特征變量,從換道安全、換道收益和換道必要性3個方面建立換道決策模型[27]。

2.1 換道安全

車輛換道的前提是保證換道過程的安全性,不與其他車輛發生碰撞。換道車輛SV在換道過程中與PV、TP及TF皆存在碰撞風險,換道安全性體現為換道車輛與環境中其他車輛的距離及速度差,因此引入碰撞時間(time to collision,TTC)來表示換道安全性。

安全換道的條件為換道車輛與環境中其他車輛的碰撞時間都大于最小換道時間,在車距較小且速度差較小的工況下,碰撞時間同樣大于閾值,此外,安全換道需要最小安全車距,由此建立安全模型。

2.2 換道收益

車輛換道的目的在于獲得更高的行駛車速或與前后車更大的行駛車距,換道車輛在換道前后都與其所在車道的前車保持跟馳關系,換道車輛SV在初始車道所能達到的最大車速為vPV,在目標車道所能達到的最大車速為vTP,由此建立換道收益函數,速度收益表示為

式中:vdesired為換道車輛期望的行駛車速,vdesiredvPV為期望速度收益,vTP-vPV為實際速度收益。

目標車道的更快的行駛車速和更大的行駛空間促使駕駛員產生換道動機,空間收益表示為

由此,換道收益模型建立為

2.3 換道必要性

換道車輛與初始車道前車的行駛狀況決定了換道必要性,車距越小、速度差越小,換道必要性越大,此外,當滿足了換道安全和收益條件,但車距相當大時,仍進行換道操作會導致車輛頻繁換道,增加換道風險,因此,引入車頭時距(time headway,THW)表示換道必要性:

蕭飛羽收回目光咽了一口唾沫,他緩緩推動鋼環沉吟了好一會才道:“我如同懸崖走馬,稍微的變故都會草木皆兵,所以昨夜見你在門前徘徊我并沒有感知殺機也猝然出手?!彼p描淡寫地告訴柳含煙安和莊與黑旗會漢口分壇起爭端,因為他不想讓外人知曉,又不僅僅有人知道她被囚禁在黑旗會漢口分壇,所以她指認這里是安和莊就只有留下她。他歉疚地道:“昨天你要見我,我想不出是什么原因,可我實在不想見你,因為除了答應你在后院可以像在家里一樣自由我不能答應你任何要求。稍安勿躁,如果沒有意外,短則數月,長則一載就會還你自由?!?/p>

式中:tTHW為車頭時距。

3 換道場景數據集及支持向量機模型

3.1 換道場景數據集

NGSIM數據集采樣時間短,存在噪聲,不同的濾波方法對狀態信息的處理效果不同,不同的換道數據提取規則提取出的數據不同,且符合換道訓練集標準的樣本量偏少,對于非換道樣本的目標數據提取,從車道保持數據中隨機選取時長為4 s的軌跡作為目標數據[23],且正負樣本比例固定,這些因素都會影響模型的分類效果。

在已有換道決策研究的基礎上,建立換道場景數據集。建立數據集選取的特征變量應是能從NGSIM數據集中可獲得的,訓練集的建立原則為

1)在[t0-5,t0+1]時間段內,交通環境中同車道前后車無碰撞風險。

2)交通環境中的車輛前后車之間保持跟馳關系,但又存在隨機性。

3)假設周圍車輛PV、TP、TF保持直道行駛,不考慮其換道行為。

4)換道車輛在t0時刻的期望速度總是大于當前速度。

換道場景選取的特征變量在t0-4時刻的取值范圍如表1所示。

在所設定的取值區間內產生n個均勻分布的數據,產生維度為[n×j]的矩陣,矩陣的一行即為一組隨機組合的換道場景數據,以此模擬復雜多變的交通環境。將決策模型應用到所建立的訓練數據集中,得出[n×1]的列向量作為訓練集的決策結果,+1為換道,-1為保持當前車道,由此換道場景數據集建立完成。

3.2 支持向量機模型

智能網聯汽車的自由換道決策是一個典型的二分類問題,支持向量機(support vector machine,SVM)是一個經典的二分類算法[28],其能找到的分割超平面具有更好的魯棒性,這個超平面可以將數據集分割為換道和不換道2個部分。

式中:D為數據集合;{(xi,yi)},i=1,2,3,…,n為訓練樣本,其中xi為輸入特征變量,即換道決策模型中的特征參數,n為樣本個數;yi={+1,-1}為樣本類別,+1記為換道,-1記為不換道。分割數據集的超平面可表示為

式中:ωT為超平面的法向量,是可調的權值向量,決定了超平面的方向;b為偏置量,是超平面和坐標原點間的距離;數據集D中每個樣本xi到分割超平面的距離γi為

間隔γ定義為2個異類的支持向量到超平面的距離之和:

支持向量機的目標就是尋找一個超平面使得間隔γ最大,將式(13)改寫為凸優化問題,故模型的求解轉化為

線性支持向量機難以處理車輛自由換道決策這樣的非線性問題,使用核函數將樣本從原始特征空間映射到更高維的空間,解決原始特征空間中的線性不可分問題。由于支持向量機的約束條件比較嚴格,為了容忍部分不滿足約束的樣本,引入松弛變量ξ,模型的求解轉化為

式中:常數C>0為超參數,是用來控制間隔和松弛變量懲罰平衡的參數。使用拉格朗日乘數法,得到式(16)的對偶形式:

式中:λi為拉格朗日乘數;κ(xi,yj)為核函數,選取最為常用的高斯核函數:

式中:σ為高斯核的帶寬,σ的數值越小,判別條件越嚴苛,這樣確保和高精度,但很容易導致過擬合,反之σ的數值越大,易導致欠擬合。

支持向量的分類性能很大程度上受到超參數C和帶寬σ的影響,需要對超參數進行優化以得到最優的分類效果。常用的超參數優化方法有貝葉斯優化 (Bayesian optimization Algorithm,BOA)[29]、網格搜索[30]和隨機搜索[31]。網格搜索十分消耗計算資源,隨機搜索雖然搜索速度快,但容易忽略某些信息的影響,因此本文中使用BOA優化超參數,假設超參數優化的函數f(x)=f(C,σ)服從高斯分布,作為代理模型:

以期望改善函數(expected improvement,EI)作為采集函數來決定輸出下一個采集點:

式中:xnext為下次迭代的最佳采樣點,xbest為當前已有樣本中的最優值。貝葉斯優化算法的框架如表2所示。

表2 貝葉斯優化算法

訓練集中不同的特征變量有著不同的取值范圍和量綱,為了減小對模型訓練過程產生的影響,使用Max-Abs歸一法對數據進行歸一化處理,使特征變量的取值范圍變為[-1,1],數據歸一化公式為

式中:z′為歸一化處理后的特征變量,z為原始特征變量,max為數據集中該特征變量的最大值。將換道決策模型應用到所建立的n條換道場景數據集中,得出結果1記為換道,-1記為保持當前車道,與從NGSIM數據集中提取出的500條換道樣本一同組成樣本容量為n+500條樣本數據,從樣本數據中隨機抽取75%作為機器學習模型的訓練集,25%為驗證集,本文中的方法框架如圖3所示。

圖3 研究方法框架示意圖

4 模型驗證及結果分析

4.1 數據集對比分析

為了驗證換道決策規則的有效性與換道場景數據集模擬真實駕駛環境的能力,對比換道場景數據集與NGSIM數據集的相似度[32]。將決策規則用于換道場景數據集中,隨機抽取529條換道數據,換道場景數據集特征變量矩陣A∈Rp×q,NGSIM數據集特征變量矩陣B∈Rp×q:

式中:p=1∶529為樣本容量,q=1∶12為特征變量編號。

若存在矩陣C∈Rp×q和D∈Rp×q,使得B=CAD,則表明B包含于A中,同理,若存在矩陣E∈Rp×q和F∈Rp×q,使得A=EBF,則表明A包含于B中,但在實際情況中,不存在B完全包含于A或A完全包含于B的情況,通過在線性變換過程中的信息損失來衡量2個數據集的相似度,隨機初始化C、D、E、F,由此變為優化問題:

將結果映射到[0,1]中,得到2個數據集的相似度:

對于換道數據,2個數據集的相似度為0.911 2,同理得出車道保持數據,相似度為0.905 5,表明決策規則符合駕駛人的決策習慣,具有擬人性,換道場景數據集能夠有效地模擬真實的換道駕駛場景。

4.2 數據集分類效果對比

換道場景數據集的樣本容量n過大會使各特征變量數值差距較小,同時也增加決策模型運算量,將不同樣本容量的數據集得到的訓練效果進行對比,驗證不同樣本容量對分類效果的影響。設置不同的換道場景數據集樣本容量,n=500、1 000、1 500、2 000,同一樣本容量下分別進行10組試驗,表3為支持向量機訓練結果,包括換道場景數據集的模型參數及加入NGSIM換道數據后的預測準確率??梢钥闯?,換道場景數據集不同的樣本容量的訓練結果平均準確率均高于90%,所建立的換道場景數據集能較好地模擬真實的換道場景,所提出的換道決策模型符合真實駕駛員的換道操作和行為決策特性,n=1 500,總樣本容量為2 000的數據集訓練效果最佳。

表3 不同樣本容量訓練分類結果

在不同樣本容量的10組試驗中抽取1組,圖4為不同樣本容量數據集的迭代優化結果,AUC為接受者操作特性曲線(receiver operating characteristic curve,ROC)的線下面積,i為迭代次數??梢钥闯?,不同樣本容量的數據集在迭代后的AUC值均接近于1,最高值為0.99,總樣本容量為2 000的數據集訓練效果最佳。

AUC值是評價二分類模型優劣的評價指標之一,還需從量化指標方面進一步評價機器學習模型的訓練效果,采用正確率(accuracy,ACC),真正類率(true positive rate,TPR),真負類率(true negative rate,TNR)評估模型的訓練效果。

式中:TP為實例是正類,被預測為正類的樣本數;TN為實例是負類,被預測為負類的樣本數;FP為實例為負類,被預測為正類的樣本數;FN為實例為正類,被預測為負類的樣本。

正確率ACC是被分類正確的樣本數占總樣本數的比率,體現了模型對整個數據集的分類能力;真正類率TPR是將為正類的實例預測為正類的比率,即將換道預測為換道;真負類率TNR是將為負類的實例預測為負類的比率,即將保持當前車道預測為保持當前車道。換道行為決策受交通環境中其他車輛的影響,將保持當前車道預測為換道相比于將換道預測為保持當前車道存在更大的危險,因此,換道決策模型在具有較高的正確率的同時應具有較高的真負類率。

利用換道規則模型對換道行為進行決策,需要對比規則模型在換道場景數據集和NGSIM數據集上的訓練效果,驗證換道規則模型和新特征變量的影響。訓練結果如表4所示。從表4可以看出,相比于原始變量77.80%的預測正確率,換道規則模型在NGSIM數據集上能取得較好的訓練效果,正確率為92.60%,在換道場景數據集中獲得了最佳的分類效果,表明換道規則模型能夠大幅提高換道決策的準確率,換道場景數據集能夠較好地模擬真實的駕駛環境。

表4 規則模型與原始變量訓練結果

4.3 不同機器學習模型性能對比

在上述數據集不同樣本容量的對比試驗中得出的訓練效果最優的總樣本容量為2 000的基礎上,利用貝葉斯優化算法對SVM、GBDT[13]、最鄰近算法[33](K-nearest neighbor,KNN)、樸素貝葉斯分類器[34](naive Bayes classifier,NBC)進行參數優化,在同一數據集下,對比不同機器學習模型的分類效果,優化過程如圖5所示。

圖5 機器學習分類器參數優化過程

圖6展示了同一數據集下,不同機器學習分類器的量化指標??梢钥闯?,相比于其他機器學習分類器,貝葉斯優化高斯核的支持向量機模型具有最高的正確率和真負類率,分別達到了94.40%和95.48%,較高的真負類率使換道決策更加安全有效。此外,使用貝葉斯優化的KNN、GBDT、NBC,同樣具有較高的分類正確率,具有良好的分類效果。

上述試驗表明,所建立的換道場景數據集能與真實的NGSIM數據充分融合,能夠較好地模擬真實的換道場景,并為換道決策研究提供訓練、驗證,為智能網聯汽車換道軌跡規劃提供工況、場景。同時表明,所提換道決策算法能夠準確預測自車的自由換道行為,符合真實駕駛環境下人為換道的決策特性。

5 結論

針對智能網聯汽車的自由換道決策問題,提出了基于換道場景與決策規則的換道決策模型。

1)真實的NGSIM數據集對于換道樣本的提取較為繁瑣,符合訓練集標準的樣本偏少,直道行駛樣本的數據提取具有隨機性,樣本容量較小,數據質量不佳,影響模型的分類效果。換道場景數據集的建立使樣本容量選取自由,換道特征變量取值更為直觀準確,省去大量的數據處理工作。

2)建立了基于決策規則的自由換道決策模型,從換道安全、換道收益、換道必要性3個方面分析了換道行為決策,將決策規則用于換道場景數據集得出正負樣本,在與NGSIM數據集換道樣本融合后用于機器學習分類器的訓練分類。

3)貝葉斯優化核函數的支持向量機以95.40%的預測正確率高于其他分類器,所提決策模型能夠準確地預測自車的自由換道行為,融合后的數據集在不同的樣本容量和不同機器學習分類器的訓練后均有較高的正確率,表明所建立的換道場景數據集能與NGSIM數據集融合,能夠較好地模擬真實的換道場景。

猜你喜歡
樣本容量車道決策
北斗+手機實現車道級導航應用
為可持續決策提供依據
避免跟車闖紅燈的地面車道線
淺談MTC車道改造
采用無核密度儀檢測壓實度的樣本容量確定方法
決策為什么失誤了
低速ETC/MTC混合式收費車道的設計與實現
廣義高斯分布參數估值與樣本容量關系
多種檢測目標下樣本容量設計的比較
兩類錯誤條件下方差檢驗中樣本容量的確定
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合