?

集成學習框架下的車輛跟馳行為建模

2024-04-13 06:03李仕琪徐志剛李光澤汪貴平
哈爾濱工業大學學報 2024年3期
關鍵詞:隊列驅動車輛

李 立,李仕琪,徐志剛,李光澤,汪貴平

(1.長安大學 電子與控制工程學院,西安 710064; 2.長安大學 信息工程學院,西安 710064)

車輛跟馳模型描述了單車道上相鄰兩車之間的運動關系,是微觀交通流仿真、道路通行能力分析、自動駕駛算法等方面研究的基礎模型之一,在交通工程學理論體系中占據重要地位[1]?,F有跟馳模型可以分為理論驅動模型和數據驅動模型兩大類[2]。理論驅動模型采用嚴格的數學表達式描述跟馳車輛的動力學機制,具有精確的物理意義,能夠確保在合理的參數設定下具有明確穩定的輸出,代表模型包括GM(general motor)模型、Gipps模型和IDM(intelligent driver model)模型。實際交通流中,車輛跟馳行為受駕駛風格、交通環境、車輛類型等因素的影響呈現一定的隨機性和非線性。理論驅動模型結構相對簡單,模型參數較少,使其難以描述實際復雜交通流中的車輛跟馳行為,從而導致對跟馳行為的預測失準或仿真失真。針對這種情況,一種常見的解決方法是采用不同交通流狀態下的實測數據標定跟馳模型,并為其設置分類應用條件,但是交通流狀態劃分方法、跟馳模型參數標定方法、預測結果評價指標等因素均可能影響跟馳模型的應用效果,提高模型應用的復雜度。

與理論驅動跟馳模型相比,近年來有較多研究采用數據驅動的方法構建跟馳模型。數據驅動跟馳模型利用數據科學與機器學習等理論和方法,從真實車輛行駛數據中挖掘跟馳行為特征,利用模型參數多、非線性規律擬合能力強的特點,學習數據中存在的復雜行為規律,使其經常獲得比理論驅動模型更好的跟馳行為預測效果。文獻[2]從模糊邏輯、人工神經網絡、實例學習、支持向量回歸、深度學習等5個方面對數據驅動跟馳模型的研究進行了綜述。文獻[3]將數據驅動跟馳模型分為基于神經網絡、支持向量回歸和K近鄰等傳統機器學習方法的模型和基于深度學習的模型。但是,數據驅動跟馳模型的參數連接關系缺乏明確的交通物理含義,且難以判斷模型輸入是否超出了安全駕駛閾值,這些缺陷可能影響模型預測結果可靠性并危及行車安全。通過近年來多次出現自動駕駛車輛安全事故[4-5],也說明單純依靠數據驅動方式進行車輛跟馳行為建模和應用存在潛在安全風險。

為了綜合利用上述兩類跟馳模型的優點,有學者提出了理論與數據混合驅動的跟馳模型。文獻[6]采用線性函數融合了理論驅動與數據驅動跟馳模型,發現融合模型比非融合模型具有更高的跟馳行為預測精度。文獻[7]采用自適應卡爾曼濾波方法組合了多種跟馳模型,找到了預測精度高的融合跟馳模型。文獻[8]利用最優加權組合理論,建立IDM模型與徑向基函數神經網絡融合的跟馳模型。然而,現有理論與數據混合驅動跟馳模型所采用的融合方法通常直接對兩類模型的輸出進行線性加和,并未對兩類模型的參數和權重進行深度融合,導致兩類模型的優勢未得到充分的發揮和利用。

除了與理論驅動跟馳模型融合之外,另一種提升數據驅動跟馳模型表現的途徑在于合理增加模型變量。微觀駕駛行為可能受到周邊車輛行為、道路設施條件、車內外交通信息等因素的影響[2],然而現有多數數據驅動跟馳模型中納入的變量與理論驅動跟馳模型類似,這可能導致模型欠擬合,因此有必要進一步從車輛軌跡數據中提取更多能夠反映真實駕駛過程中駕駛人觀察信息的變量,并將其引入數據驅動跟馳模型中[3]。

綜上,本文提出了一種基于集成學習框架的理論和數據驅動跟馳模型融合方法。利用集成學習框架可以綜合應用多種同質或異質基學習器的優勢,通過構建多級學習器對理論和數據驅動跟馳模型進行組合、訓練和應用,提高模型的預測精度和泛化能力。同時將跟馳車輛所在隊列狀態及其周邊行駛條件因素引入數據驅動跟馳模型中,以進一步提升模型學習復雜交通條件下車輛跟馳行為的能力。使用真實車輛軌跡數據集對所構建模型進行訓練和測試,來驗證所提出方法的有效性。本文為復雜交通流條件下的車輛跟馳行為建模提供了新的思路,研究成果有助于提升跟馳行為預測和微觀交通仿真精度。

1 數據與變量

1.1 數據

本文使用highD自然駕駛軌跡數據集[9]作為基礎數據。此數據集由無人機在德國高速公路6個路段上空拍攝的十余個小時的視頻中提取的車輛軌跡數據組成,數據字段包括車輛經緯度、所在車道、行駛方向、外形尺寸、類型、速度、加速度、周邊車輛編號等。數據采集地點為平直路段,上下游匝道距離較遠,因此車輛換道現象較少,多數車輛處于跟馳或自由行駛狀態。本文使用IDM模型作為理論驅動跟馳模型的代表,此模型具有明確的物理意義且參數相對較少,廣泛用于多種交通狀態下的跟馳行為建模,以及網聯自動駕駛控制算法中,具有較強的適用性及可拓展性。IDM模型變量包括跟馳車速度、與前導車的間距以及與前導車的速度差等,這些變量值可從數據集中直接計算獲得,同時模型參數將參考數據集中特定字段的統計值設定。數據驅動模型中除了納入上述變量外,其他納入變量的計算相對復雜,詳述如下。

1.2 車輛隊列

在車流密度較高的條件下,同一車道上密集接續行駛的多輛車在運動方式上經常表現出一定的相似性,會從客觀上形成車輛隊列,如圖1所示。過往有學者[10-11]將跟馳車輛前后多車的運動狀態變量納入跟馳模型中。實際上,跟馳駕駛員通常難以直接準確觀察和衡量前后多車運動參數,更合理的行為模式是跟馳駕駛員根據非直接相鄰的前后車輛運動狀態估計其所在隊列整體運動狀態,并基于此調整駕駛行為。因此,本文將跟馳車輛所在隊列的平均運動狀態納入數據驅動跟馳模型中。本文通過設置車輛跟馳狀態判斷條件劃分車輛隊列。篩選highD數據集中換道數為0、有效跟馳時長16 s以上、處于穩定跟馳狀態即跟馳車輛速度與所在車隊的平均速度平均差值不超過2 m/s的車輛軌跡,然后根據數據字段中的跟馳車輛編號確定其是否歸入車輛隊列。一共得到1 241個車輛隊列,共7 306條車輛軌跡,所有車隊中車輛的平均間距和平均車速分別為34.304 m和21.479 m/s,平均車頭時距為1.6 s,最大加速度為5.02 m/s2,最大減速度為-4.46 m/s2。描述車輛隊列平均運動狀態的變量包括車輛隊列中的平均間距、平均車頭時距和平均碰撞時間(time to collision)。設定t時刻第i個隊列平均運動狀態變量Pi(t)為

(1)

圖1 車輛隊列及相關變量

1.3 周邊行駛條件

除了本車道前后車輛的影響外,過往實證和仿真研究[12-13]均發現跟馳車輛相鄰車道的臨近車輛也可能影響跟馳車輛的駕駛行為,影響因素包括車輛側向間距、駕駛員換道超車意圖等。為了描述車輛隊列中跟馳車輛的周邊行駛條件,定義t時刻隊列i內部第j輛跟馳車周圍行駛條件的變量Fi,j(t)表達式為

(2)

圖2 周邊車輛及相關變量

2 集成學習框架下的跟馳行為建模

2.1 stacking集成學習方法

集成學習是一種通過構建和結合多個學習器,降低單一學習器靈敏度不同帶來的誤差,提高模型泛化能力、魯棒性和預測精度的機器學習方法。常見的集成學習方法包括自助聚合(bagging)法、提升(boosting)法、堆疊(stacking)法。由于bagging法和boosting法主要用于同質學習器的集成,而理論和數據驅動跟馳模型的建模機制區別明顯,因此本文引入面向異質學習器的stacking法,將跟馳行為建模劃分成兩個階段,針對不同階段的建模需求分別構建一級學習器和二級學習器,對理論和數據驅動跟馳模型進行集成與融合。首先,將數據集劃分成3個子集,分別是訓練集、驗證集和測試集。接著,將理論驅動模型和數據驅動模型作為兩個一級學習算法,使用訓練集對其進行訓練,即標定理論驅動模型的參數和訓練數據驅動模型的網絡權重,構成一級學習器。然后,使用驗證集作為一級學習器的輸入,將獲得的輸出與驗證集中的數據標簽組合,生成一個新的數據集。接著,使用新數據集訓練二級學習算法,獲得二級學習器的網絡權重和模型參數。最后,將測試集作為訓練后的一級和二級學習器的輸入,對比測試集成跟馳模型的預測效果。此方法的偽代碼如下所示。流程如圖3所示。

圖3 集成學習框架下的跟馳行為建模方法

定義:數據集Dr={(xr,m,yr,m)}(r=1~3),其中D1、D2和D3分別為訓練集、驗證集和測試集,樣本編號m=1~Mr,其中M1、M2和M3分別為子集D1、D2和D3的樣本數量,xr,m和yr,m分別為不同子集中樣本的數值與標簽;新的訓練集D′2=?;一級學習算法ζ1、ζ2,一級學習器θ1、θ2;二級學習算法μ,二級學習器β。

步驟:

forq=1,2 do:

訓練θq:θq=ζq(D1)

end for

form=1,…,M2do:

forq=1,2 do:

end for

end for

訓練β:β=μ(D′2)

輸出:集成模型H(x3m):H(x3m)=β(θ1(x3,m),θ2(x3,m))

其中,一級學習算法的設置詳見2.2節和2.3節。為了對一級學習器的輸出特征進行再學習,在二級學習算法中可以采用線性或非線性方法對一級學習器的輸出進行再學習。本文選擇了表1所示的11種線性和非線性方法作為二級學習算法,將通過對比測試選擇性能最佳的二級學習算法。

表1 二級學習算法分類

2.2 理論驅動跟馳模型

本文選擇IDM模型作為stacking集成學習框架下的一級學習算法之一。IDM模型描述了跟馳車的加速度與速度、與前導車的間距以及速度差的關系。將IDM模型應用于本文研究場景中,可得t時刻隊列i內部第j輛跟馳車的加速度為

(3)

式(3)的前半部分為第j輛跟馳車的自由加速度,其與最大加速度amax、期望速度ve以及t時刻車速vi,j(t)有關,其中δ為加速度指數。式(3)的后半部分為跟馳車的減速策略,當跟馳車與前導車間距過小時,該策略被觸發,其中di,j,j-1(t)為t時刻第j輛跟馳車與其前導車之間的距離,d*(t)為t時刻的期望最小間距,可表示為

(4)

式中:hσ為安全車頭時距,dmin為擁堵間距,b為駕駛員期望減速度,Δvi,j,j-1(t)為t時刻第j輛跟馳車與其前導車之間的速度差。參考1.2節所述所納入車輛運動狀態信息。其中,amax為5 m/s2,ve為30 m/s,δ為4,hσ為1.5 s,dmin為2 m,b為4.5 m/s2。

2.3 數據驅動跟馳模型

由于跟馳駕駛員往往依賴歷史駕駛行為和過去一段時間內的交通狀態進行行駛決策,即其決策行為存在記憶效應,因此本文選擇長短時記憶(long-short term memory,LSTM)網絡[24]和門控循環單元(gate recurrent unit,GRU)網絡[25]對跟馳行為進行建模,并將其作為stacking集成學習框架下的另一種一級學習算法。LSTM網絡在其單元之間傳遞信息時,分別使用單元狀態和隱藏狀態存儲長期記憶和短期記憶。GRU網絡可看作是LSTM網絡的一種變體,其結構比LSTM網絡簡單,不包含單元狀態,使用隱藏狀態傳遞信息。圖4所示為數據驅動跟馳模型的結構。模型訓練中采用均方誤差(mean-square error,MSE)作為回歸損失函數,Sigmoid作為激活函數,Adam作為優化算法。

圖4 數據驅動跟馳模型的結構

定義t時刻影響第i個車輛隊列中第j輛跟馳車輛行為的因素組合Wi,j(t)為

Wi,j(t)=[Pi(t),Fi,j(t),Gi,j-1,j(t)]

(5)

式中:Pi(t)為車輛隊列影響因素(見式(1)),Fi,j(t)為周圍駕駛環境影響因素(見式(2)),Gi,j-1,j(t)為第j輛車跟馳車與其前導車之間的時空關系,定義為

Gi,j-1,j(t)=[di,j-1,j(t),Δvi,j-1,j(t),vi,j(t),ai,j(t)]

(6)

Wi,j(t-NT)]

(7)

式中:N為所分析歷史時段內時間節點數量,T為此時段內相鄰時間節點的間隔,s為此時段內第s個歷史時刻。

2.4 評價指標

使用3種評價指標測試所構建跟馳模型的性能,分別是對稱平均絕對百分比誤差(symmetric mean absolute percentage error,SMAPE)、平均絕對誤差(mean absolute error,MAE)和平均絕對相對誤差(mean absolute relative error,MARE),這些指標常用與評價跟馳模型對實際車輛軌跡的預測精度[3,6,26],分別為

(8)

(9)

(10)

3 計算結果與分析

3.1 一級學習器

通過兩組試驗確定作為一級學習器的數據驅動跟馳模型的網絡結構和訓練過程的學習率,并采用一組試驗對比理論驅動模型和數據驅動模型的性能。

1)網絡結構。LSTM網絡和GRU網絡包含有輸入層、隱藏層和輸出層,其中輸入層和輸出層的維數分別根據跟馳模型中所納入的影響因素數量和模型輸出的預測值數量確定。本文為這兩種網絡設置了單一隱藏層,以避免傳統遞歸式結構網絡可能發生的梯度彌散問題。表2報告了采用不同隱藏層神經元數量的數據驅動跟馳模型性能,可以發現,采用結構1、2、3的模型隱藏層神經元個數過少,導致學習效果不如采用結構4、5的模型。由于增加隱藏層神經元個數會延長模型解算時間,綜合對比采用結構4、5、6的模型性能,最終選定結構5為最優模型結構。

表2 不同結構數據驅動模型性能

2)學習率。學習率是訓練數據驅動模型的重要參數。表3中報告了不同學習率下具有最優結構的模型的性能??梢园l現,由于學習率過高使得算法很難收斂到最低點,采用學習率1、2的模型誤差較大。與之相比,采用學習率3、4的模型誤差明顯降低。由于采用學習率4的模型訓練時間較久,且學習效果與采用學習率3的模型接近,因此選擇學習率3為最優學習率。

表3 不同學習率下數據驅動模型性能

3)對比模型。上述試驗結果表明,使用網絡結構5且設置學習率為0.001時,數據驅動模型能夠獲得最佳跟馳行為預測精度。采用相同的數據對IDM模型進行標定和測試,發現IDM模型的跟馳行為預測精度為SMAPE=0.740%,MAE=0.427,MARE=0.020。對比二者模型性能可以發現,具有最優網絡結構和學習率的數據驅動跟馳模型的預測精度優于IDM模型。

3.2 融合模型

對于在stacking集成學習框架下獲得的兩個融合跟馳模型IDM-LSTM-stacking和IDM-GRU-stacking,表4給出了采用均值法、泰爾森估算和隨機采樣一致性線性回歸3種線性二級學習算法后的模型預測結果。為了便于對比,表中同時給出了單獨使用IDM模型和數據驅動模型的預測結果??梢园l現,IDM模型的預測誤差大于GRU和LSTM模型的預測誤差,而IDM-LSTM-stacking和IDM-GRU-stacking模型的誤差在理論驅動模型和數據驅動模型之間。這說明采用表中3種線性二級學習算法的模型并未能很好地對一級學習器的輸出特征進行再學習,而其效果類似于對理論和數據驅動模型的輸出進行了折中。

表4 3類跟馳模型性能

表5中給出了采用表1中8種非線性方法作為二級學習算法的融合跟馳模型的預測精度。對比表4中的結果可以發現,對于同樣的輸入數據,采用非線性二級學習算法的模型預測精度明顯比IDM模型和采用線性二級學習算法的模型更高,也高于單純的數據驅動模型。對于IDM-LSTM-stacking模型來說,采用非線性方法6即GBRT回歸法的模型預測精度最高;對于IDM-GRU-stacking模型來說,采用非線性方法4即隨機森林回歸法的模型預測精度最高。上述結果說明,兩種一級學習器即理論驅動跟馳模型和數據驅動跟馳模型的輸出特征存在著復雜的非線性關系,需要采用非線性二級學習算法才能更好地對它們的輸出特征進行再學習。

表5 采用非線性二級學習算法的跟馳模型性能

圖5對比了IDM模型、GRU模型、LSTM模型、采用隨機森林回歸方法的IDM-GRU-stacking模型和采用GBRT回歸方法的IDM-LSTM-stacking模型預測的車輛軌跡和真實車輛的軌跡??梢园l現,采用隨機森林回歸方法的IDM-GRU-stacking模型和采用GBRT回歸方法的IDM-LSTM-stacking模型比IDM模型、GRU模型和LSTM模型的軌跡預測精度高。

為了對比驗證所構建集成學習跟馳模型穩定性及其對宏觀交通流狀態的影響,設計了如下數值模擬實驗。假定由100輛跟馳車組成的車隊在長度為2 000 m的三車道環路的中間車道上行駛,三車道環路的左右兩側車道交通流隨機生成。跟馳車隊的初始狀態為穩定均衡狀態,即車輛等間距分布,任意兩車初始車頭間距為20 m,所有車輛的車身長度為5 m,初始速度21.466 m/s,初始加速度為0 m/s2,其他仿真條件參考文中理論和數據驅動跟馳模型設置。實驗中,在t=300 s時向第一輛車施加擾動,令該車速度降為初始速度的一半即10.733 m/s,同時位置向前移動14 m。

圖6為數值模擬實驗結果,圖中第一列為各模型輸出的車隊行駛軌跡,此列各子圖中豎線標記出擾動的施加時刻,第二列為各模型輸出的車速變化熱力圖。從圖6中可以看出,施加擾動后GRU模型輸出的跟馳車隊行駛軌跡出現了明顯紊亂,每輛車的速度隨時間變化出現了顯著波動,說明此跟馳模型的穩定性不佳;與GRU模型相比,IDM模型和LSTM模型輸出的速度值雖然存在周期性波動,但是各車速度變化幅度相對較小,說明其穩定性優于GRU模型;與上述3個模型相比,施加擾動后IDM-LSTM-stacking模型和IDM-GRU-stacking輸出的跟馳車隊行駛軌跡更為平滑,且每輛車的速度并未呈現出周期性波動,其中IDM-GRU-stacking模型輸出的各車速度雖然在個別時間點上會發生較大變化,但是速度波動能夠很快平抑,而IDM-LSTM-stacking模型輸出的速度波動隨著時間變化逐步消失,車隊恢復到穩定跟馳狀態,即車隊內車輛速度與車隊平均速度的平均差值維持在0.6 m/s以內。

圖6 環路仿真實驗結果

4 結 論

1)為了提高考慮車輛隊列和周邊車輛干擾條件下車輛跟馳行為預測精度,提出了一種stacking集成學習框架下的跟馳模型融合方法,將代表理論驅動的IDM跟馳模型和數據驅動的LSTM和GRU跟馳模型作為一級學習算法,再使用特定的二級學習算法對一級學習器的輸出特征進行再學習,構建出融合跟馳模型IDM-LSTM-stacking模型和IDM-GRU-stacking模型。

2)基于實測數據的模型性能測試結果表明,考慮了車輛隊列和周圍駕駛條件因素的LSTM和GRU跟馳模型比IDM模型的預測精度高;采用非線性二級學習算法的融合跟馳模型的預測精度高于采用線性二級學習算法的融合模型以及數據驅動模型。其中,采用GBRT回歸的IDM-LSTM-stacking模型和采用隨機森林回歸的IDM-GRU-stacking模型能夠獲得最高的預測精度?;跀抵捣抡娴哪P头€定性測試結果表明,施加擾動后IDM模型和LSTM模型的穩定性優于GRU模型,IDM-LSTM-stacking模型和IDM-GRU-stacking模型的穩定性優于IDM模型、LSTM模型和GRU模型。

3)除了本文所考慮的因素以外,車輛跟馳行為還可能受到包括駕駛員心理在內的其他因素的影響,后續研究中可進一步將其納入跟馳模型中,另外本文所提出的集成學習方法也可應用于其他微觀駕駛行為建模中,以提高復雜交通條件下的車輛軌跡預測精度和微觀交通流仿真精度。

猜你喜歡
隊列驅動車輛
基于模糊PI控制的驅動防滑仿真系統分析
屈宏斌:未來五年,雙輪驅動,砥礪前行
隊列里的小秘密
基于多隊列切換的SDN擁塞控制*
軌旁ATC系統門控柜接收/驅動板改造
在隊列里
車輛
豐田加速駛入自動駕駛隊列
冬天路滑 遠離車輛
車輛出沒,請注意
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合