?

考慮交通狀態影響的服務區凝聚層次聚類入區判別模型

2024-03-14 11:43張婷婷姚成北曹鵬超
關鍵詞:門架平均速度交通流

章 玉,張婷婷,姚成北,曹鵬超

(1. 中鐵長江交通設計集團有限公司,重慶 401121; 2. 重慶交通大學 交通運輸學院,重慶 400074)

0 引 言

高速公路服務區是駕乘人員的重要休息場所,是高速公路品質服務的重要窗口。準確分析服務區車輛駛入情況有利于服務區布局選址、建設規模、設施配置的合理規劃,還有利于管理部門對停車資源、汽油儲量、餐飲服務的精準調控,進而提高服務區運營管理水平,提供更高效、優質的服務。目前,國內外學者針對服務區駛入率已開展不少研究,根據其研究方法可大致分為3類。

第1類是基于歷年駛入率或推薦值展開研究。如劉亞非等[1]將數理統計的方法與彈性系數法相結合,構建了服務區駛入率預測模型;劉長明等[2]結合國內服務區建設現有標準和現狀調研法,提出了服務區規模測算技術方法。該類方法簡單且適用范圍廣,但駛入率會隨著道路等級、駕駛時長、服務區規模等因素發生改變,基于歷年數據或推薦值不能較好地反映實際停歇需求,服務區駛入率測算精度較低。

第2類是基于駛入率生成機理展開研究。如王建偉等[3]將物理學勢能理論與服務區駛入率測度方法相結合,提出了服務區駛入率測度模型;李霞等[4]從不同車型的停歇需求入手,通過分析客車、貨車連續行駛時間分布規律,提出了基于車輛連續行駛時間的駛入率計算方法。與傳統數學模型相比,基于機器學習的駛入率預測模型不受固定模型限制,可有效降低影響因素隨機性對預測精度的干擾。如SHEN Xiaoyan等[5]結合小波神經網絡的廣泛映射能力和遺傳算法的全局搜索能力,構建了服務區駛入率預測模型;劉嘉等[6]從斷面交通量、服務區區位和人體生理需求等多維特征對BP神經網絡模型進行訓練、學習,進而預測駛入率。然而,該類方法在建模過程中需考慮駛入率與多種影響因素之間的非線性映射關系,計算指標較多且數據依賴程度高,由于我國大部分服務區缺乏交通信息采集設備,在現實中難以得到廣泛應用。

第3類是基于數據挖掘分析技術展開研究。隨著高速公路ETC系統全面落實以及智能交通技術發展,從ETC數據中提取和分析交通特征規律已成為可能。如CAI Qiqin等[7]結合ETC收費數據,在詳細分析影響服務區駛入率的主要因素的基礎上,構建了VR-XGBoost駛入率預測模型;劉光雄[8]通過深入挖掘ETC門架數據的特征,提出基于最優平均速度劃分的服務區駛入率測算模型。該類方法結合高速公路收費數據庫,構建基于數據驅動的服務區駛入率測算模型,可保障服務區駛入率測算的實時性和精確度。然而,該類方法大多以高速公路交通狀態是自由流為前提,尚未探討非自由流條件下車輛駛入服務區情況,具有一定的局限性。LIAO Lüchao等[9]基于ETC門架數據探討了服務區駛入率與高速公路運行狀態識別之間的影響關系;劉群等[10]在高速公路交通量預測研究中指出,早晚高峰預測誤差均比平峰狀態誤差大。以上研究表明,考慮交通運行狀態的潛在影響對提高服務區入區判別精確度是有必要的。

針對該問題,筆者從新的角度出發,結合狀態識別研究成果[11]進一步探索自由流與非自由流條件下的車輛行駛特性和規律。以ETC門架數據為數據源,將高速公路運行狀態識別與服務區入區判別結合,在研究車輛進入服務區路段交通流特征基礎上,引入層次聚類判斷交通運行狀態進而構建高速公路車輛進入服務區的入區判別模型,并結合不同運行狀態下入區臨界條件進行驗證分析。

1 數據源及特征分析

1.1 數據源

研究數據來源于高速公路ETC門架系統通行和收費數據,通過高速公路互通立交間建設的ETC門架通信設施實現對通行車輛路徑的精準采集。在高速公路收費未全國聯網前,收費數據通常以收費站為節點,兩個收費站之間路段為最小單元[12]。在距離較長的收費站路段中不能精準判別交通狀態。全國高速公路收費聯網后,車輛每經過一個門架就會采集一條通行信息,并產生一條完整的OD行駛軌跡,與傳統高速公路收費數據相比可更精確地描述OD對交通運行狀態。ETC門架通行數據字段類型包含車牌號、計費車型代碼、門架編號、通過時間、上一門架編號、通過上一門架時間等,關鍵字段如表1。

表1 ETC門架數據關鍵字段Table 1 Key fields of ETC gantry data

1.2 行程時間特征

門架路段行程時間是指車輛通過兩個相鄰門架所需時間,反映高速公路車輛運行狀況和車輛通行的連續性。鄰近服務區門架路段和服務區門架路段位置關系如圖1。根據ETC門架通行數據與收費站明細數據獲取車輛行程時間,對鄰近服務區門架路段和服務區門架路段車輛連續8 d的行程時間分布如圖2。分析發現,鄰近服務區門架路段的車輛行程時間整體趨于穩定且分布較為均衡;服務區門架路段的車輛行程時間分布更分散且呈現出明顯的周期相似性。一方面,由于駕駛員存在不同停歇需求,如餐飲、加油、休息或者其他活動,進入服務區車輛的行程時間遠大于主線行駛車輛;另一方面,在服務區門架路段某一時期可能存在交通擁堵狀態,從而導致行程時間高于正常值。

圖1 服務區門架路段位置關系Fig. 1 Location diagram of gantry section in service area

圖2 門架路段行程時間對比Fig. 2 Comparison diagram of travel time of gantry section

1.3 行程速度特征

基于車輛通過相鄰門架的時間和門架距離可獲取車輛在該門架路段的行程速度。對鄰近服務區門架路段與服務區門架路段的行程速度按每5 km/h間隔進行分布統計,如圖3。在鄰近服務區路段,客、貨車速度占比分布呈正態分布,行程速度低于40 km/h的客、貨車占比分別為0.18%、0.31%。在服務區路段,客、貨車速度占比呈“高峰+低峰”的雙峰分布,客車高峰區間基本處于60~120 km/h,低峰區間基本處于0~60 km/h;貨車高峰區間基本處于40~100 km/h,低峰區間基本處于0~40 km/h。與鄰近服務區路段相比,客、貨車行程速度低于40 km/h的占比區間明顯增加,分別為8.19%、18.70%。

圖3 門架路段行程速度分布直方圖Fig. 3 Histogram of travel velocity distribution in gantry section

2 凝聚層次聚類入區判別模型

2.1 判別思路

結合車輛在門架路段行程時間和行程速度特征分析發現,鄰近服務區路段和服務區路段的行程速度差異主要體現在是否存在低速區間,而導致低速區間產生的主要因素除了車輛駛入服務區之外,還可能是交通流處于擁堵狀態?;诖?為了降低交通擁堵狀態對判別結果的干擾,首先對鄰近服務區門架路段的交通狀態進行識別,利用滑動窗口技術計算狀態評價指標,結合三相交通流理論分析門架路段的交通流穩定性,通過凝聚層次聚類確定交通流狀態變化的臨界條件;其次基于車輛在高速公路行駛速度的一致性,借助服務區鄰近路段交通狀態判別條件判斷服務區路段交通狀態;然后根據上、下游路段交通狀態類型及服務區與車輛行駛路徑,分別對速度變化程度量化建模,分析車輛進入服務區路段前后行程速度的變化程度,利用凝聚層次聚類明確不同運行狀態的入區判定條件,技術路線如圖4。

圖4 服務區入區判別流程Fig. 4 Flow chart of service area entry discrimination

2.2 判別模型

2.2.1 計算交通狀態評價指標

ETC收費數據只能精確到車輛通過相鄰門架區段的時間,意味著只能獲得車輛的行程速度,無法獲得瞬時車速。用區間速度本身描述門架路段內車流狀態變化,精度將有所限制,而平均速度差分量為單位時間內的平均速度與上一單位時間內的平均速度之差,其常用來描述具有時序特性的交通狀態變化情況,可通過縮小時間粒度彌補區間平均速度的限制[13]。平均速度差分量標準差在一定程度上可以反映交通相離散度變化趨勢,當車輛處于自由流狀態,車輛駕駛最為隨機,速度變化離散程度最高,平均速度差分量的標準差最大;當車輛進入擁擠狀態時,速度變化程度隨著密度增大逐漸減小,離散程度開始減弱,平均速度差分量標準差隨之減弱,車輛車速進入較為平穩的狀態[14]。因此,除了選取交通流3個參數(流量、速度、密度)外,還選取平均速度差分量和平均速度差分量標準差作為交通狀態評價指標,計算方法如式(1)~ 式(3):

(1)

(2)

(3)

通過分析客、貨車平均速度差分量的離散度和交通密度的關系(圖5)發現,客車的速度差分量波動幅度比貨車大,更能體現路段運行狀態變化趨勢,因此選取客車平均速度差分量的標準差作為交通流狀態識別指標。

圖5 密度-平均速度差分量關系Fig. 5 Relationship of density and mean velocity difference component

2.2.2 運行狀態識別

考慮到交通流的演變過程包含大量隨機因素,用傳統的線性解析模型難以明確車輛是否駛入服務區的界限,而機器學習不受固定模型限制,具備良好的非線性映射能力,可降低交通流變化的隨機性對狀態判別造成的干擾。因此,提出一種基于凝聚層次聚類劃分交通流狀態,確定相位臨界點和服務區入區臨界條件的方法。

凝聚層次聚類基本原理是通過計算簇與簇之間的距離確定相似度,將距離最小的兩個簇合并為新簇,不斷重復上述過程,直至達到預期簇。在眾多相似性度量方法中,選取常用的歐氏距離計算簇內樣本點的聚合程度,用離差平均和法衡量簇與簇之間的聚合程度,其計算過程如式(4)、式(5):

(4)

(5)

以交通密度作為研究序列,利用滑動窗口技術,在時間序列數據中通過“滑動窗口”截取序列片段,將若干個滑動窗口的密度上限值及其對應的標準差作為狀態識別的判別指標。根據凝聚層次聚類相關公式,將判別指標的距離矩陣作為聚類輸入變量,聚類結果中臨界密度K′即為時序數據的“躍遷點”。

2.2.3 入區車輛判別

基于車輛在服務區路段與鄰近服務區路段行程速度概率分布的特點,通過關聯車輛在上、下游路段的交通運行狀態,分析車輛行駛狀態和行程速度變化的關系,降低交通擁堵運行狀態對服務區判別結果的干擾。根據交通流所屬路段空間位置及狀態識別階段確定的臨界密度K′,將上、下游路段的交通運行狀態劃分為以下4種類型,如式(6):

(6)

式中:Kre-up為相對上游路段車輛的交通密度;Kre-down為相對下游路段車輛的交通密度。狀態1表示車輛從相對上游路段到相對下游路段交通流狀態由暢通保持暢通狀態;狀態2表示交通流狀態由暢通轉換為擁堵狀態;狀態3表示交通流狀態由擁堵保持擁堵狀態;狀態4表示交通流狀態由擁堵轉換暢通狀態。

車輛速度變化程度用服務區鄰近門架路段區間平均速度與服務區門架路段區間平均速度比值表示,根據車輛行駛路徑不同,速度變化程度需采取不同量化方法。結合服務區與高速公路匝道空間位置,車輛行駛路徑可分為3種(圖6)。圖6中:路徑1表示行駛車輛通過服務區上、下游路段;路徑2表示車輛通過服務區上游路段在服務區路段下道;路徑3表示車輛在服務區路段上道并通過服務區下游路段。路徑1~3采用式(7)進行計算:

(7)

圖6 高速公路車輛行駛路徑示意Fig. 6 Schematic diagram of vehicle driving path on highway

式中:f(n)為第n輛車區間平均速度的比值;fR1or2(n)為通過路徑1或路徑2的速度比值;fR3(n)為通過路徑3的速度比值;vup(n)為第n輛車通過鄰近上游門架路段的區間平均速度;vser(n)為第n輛車通過服務區門架路段的區間平均速度;vdown(n)為第n輛車通過鄰近下游門架路段的區間平均速度。

以服務區路段區間速度vser(n)和速度比值f(n)作為輸入變量,結合凝聚層次聚類對4種類型交通流分別進行聚類分析,得到不同運行狀態下的臨界速度v′ser和臨界速度比值f′作為入區判別臨界條件。當車輛行程速度vser(n)低于臨界速度v′ser并且速度比值f(n)大于f′時,判定車輛駛入服務區,否則判定為沒有駛入服務區。

3 分析與驗證

以包茂高速大觀服務區出城方向為例進行驗證分析,大觀服務區位于大觀收費站下游,如圖7。

圖7 實例分析研究對象Fig. 7 The research object of the case study

首先,選取連續8 d的ETC門架和收費數據,對原始數據進行清洗、處理和加工,形成完整的車輛行駛路徑,以5 min為單位時間計算客、貨車區間平均速度及速度差分量、交通量、交通密度等交通狀態評價指標。在計算交通狀態評價指標時,根據門架數據和收費數據中車輛進出收費站的時間節點,應考慮高速公路上、下匝道車流對主線車流的影響,有助于更全面地體現交通流動和密度變化,從而提高模型判別精度和實際應用價值。通過滑動窗口技術,計算密度區間樣本量的標準差,利用凝聚層次聚類明確不同交通流狀態的臨界點,結果如圖8。由圖8可知,簇1與簇2的密度分界點為23 pcu/km。整體來看,標準差隨著密度增加呈降低趨勢,當達到一定程度后出現小幅度的震蕩,說明在該點附近發生了狀態躍遷。因此,文中以K′=23 pcu/km為臨界條件,K<23 pcu/km為暢通狀態,K≥23 pcu/km為擁堵狀態。

圖8 狀態識別聚類結果Fig. 8 Clustering results of state identification

基于交通狀態評價指標,生成密度-速度時變曲線驗證交通狀態識別結果有效性,以2021年8月13日數據為例,結果如圖9。當0 pcu/km

圖9 密度-速度時變曲線Fig. 9 Time varying curve of density-velocity

然后,結合狀態識別確定的臨界密度明確車輛在上、下游路段的行駛狀態,基于4種狀態交通流的行程速度生成概率密度擬合曲線,如圖10。對比分析鄰近服務區門架路段與服務區門架路段發現,在鄰近服務區門架路段不同交通狀態的車輛行程速度差異明顯,其中狀態1的行程速度最高,狀態4的行程速度最低,客車的行程速度受交通狀態影響較大;在服務區門架路段,由于部分車輛駕駛行為發生改變,各類交通流的行程速度均呈“雙峰”分布,但在低谷臨界處其分布形態并不一致,說明車輛運行狀態對基于速度變化的入區判別條件有不同程度的影響。

(a) 鄰近服務區門架路段

其次,對不同運行狀態下的交通流進行層次聚類確定判別條件,以狀態1為例,其聚類結果如圖11,得到客、貨車入區判別條件如表2。

圖11 入區判別聚類結果Fig. 11 Clustering results of entering service area identification

表2 客車、貨車入區判別條件Table 2 Identification conditions for passenger cars and trucks entering the service area

最后,根據判別條件對ETC通行數據進行入區判別,并利用服務區卡口數據進行入區模型驗證,比較考慮車流運行狀態與不考慮車流運行狀態情況下服務區入區判別的準確率,對比結果如圖12。由圖12可知:在暢通狀態下,兩種判別模型駛入量誤差均較小;在擁堵狀態下,不考慮車流運行狀態的駛入量遠大于卡口數據駛入量。選取相對誤差作為誤差評價指標,在不考慮車流運行狀態情況下,全日客、貨車的絕對誤差分別為4.4%、11.1%;考慮車流運行狀態下客、貨車的相對誤差分別為1.5%、7.0%;客、貨車判別模型精度分別提高了2.9%和4.1%。

圖12 服務區入區判別交通量驗證Fig. 12 Verification of traffic volume entering the service area

4 結 論

結合ETC門架數據,充分挖掘有效信息,提出一種低成本、高精度、全覆蓋的服務區入區判別模型,在對比分析服務區門架路段與鄰近門架路段行程時間和行程速度分布特征的基礎上,利用凝聚層次聚類構建了包含交通狀態識別和入區狀態識別兩個階段的服務區入區判別模型。實例分析表明,考慮車流運行狀態的判別模型可有效提高在交通擁堵狀態下入區判別結果精度,有利于提升高速公路管理與服務水平,在一定程度上可替代服務區卡口設施的作用,具有較好的經濟性。主要結論如下:

1)服務區門架路段與鄰近門架路段行程速度概率分布存在明顯差異性。鄰近門架路段行程速度概率分布曲線呈現“單峰”正態分布,行程速度低于40 km/h的客、貨車占比分別為0.18%、0.31%。服務區門架路段行程速度概率分布曲線呈現“雙峰”正態分布,行程速度低于40 km/h的客、貨車占比提高至8.19%、18.70%。

2)針對高速公路收費數據在OD行程時間粒度的局限性,提出了適于區間平均速度劃分交通狀態的判別指標“平均速度差分量”,通過對比分析客車和貨車平均速度差分量離散程度發現,客車平均速度差分量更能體現高速公路交通狀態變化。

3)關聯車輛在上、下游路段的交通運行狀態并劃分為4種狀態類型,對比車輛在服務區門架路段和鄰近門架路段行程速度的概率密度分布發現,4種狀態的擬合曲線在臨界處存在不同程度的形態差異,這說明不同運行狀態下,基于速度變化劃分的入區判別條件不同。

4)運用凝聚層次聚類分別對考慮車流運行狀態與不考慮車流運行狀態的交通流進行了聚類分析,并對聚類結果進行驗證。結果表明,在考慮車流運行狀態情況下,客車和貨車判別模型精度分別提高了2.9%和4.1%,具有更優的判別效果。

限于數據研究周期較短,在后續研究中將延長數據周期,探討在工作日與非工作日、節假日與非節假日場景下不同車流運行狀態的速度分布特征,進一步優化入區判別模型參數,使判別結果達到更高的準確性。

猜你喜歡
門架平均速度交通流
“運動的快慢”“測量平均速度”知識鞏固
基于新能源技術的高速公路ETC門架供電系統
ETC門架防雷技術淺析
探究物體的平均速度
把脈平均速度的測量
交通流隨機行為的研究進展
路內停車對交通流延誤影響的定量分析
3200/1600t溜尾門架
測平均速度演示儀
具有負壓力的Aw-Rascle交通流的Riemann問題
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合