?

基于增量學習的車聯網惡意位置攻擊檢測研究

2024-03-12 09:18江榮旺龍草芳
信息安全研究 2024年3期
關鍵詞:增量聯網矩陣

江榮旺 魏 爽 龍草芳 楊 明

(三亞學院 海南三亞 572022)

(容淳銘院士工作站 海南三亞 572022)

車聯網是一個由車輛自身狀態和環境信息組成的龐大交互網絡.車輛間傳遞信息的真實性和有效性可能觸發其他車輛采取行動,避免災難性后果.當前車聯網惡意行為檢測的研究表明,攻擊者的惡意行為往往受到不同原因的驅動[1].這些惡意行為將嚴重降低車聯網的性能,帶來巨大的安全隱患.因此,研究者們對減少車輛惡意行為進行了廣泛的研究.密碼學能夠保證消息的完整性,但不能保證消息的真實性和實時性.對此許多研究提出了惡意攻擊檢測.由于惡意攻擊類型眾多,沒有一種方法可以應對所有攻擊.而本文主要針對的是惡意攻擊中的惡意位置攻擊.車輛惡意位置攻擊是指黑客通過操縱車輛定位系統,故意篡改車輛的位置信息,使其顯示在錯誤的位置或者隱藏真實的位置,從而引發安全隱患和潛在的危害.車輛惡意位置攻擊會引起交通混亂、車輛安全系統失效等危害,嚴重的會造成生命財產損失.目前,很多惡意位置攻擊檢測基于機器學習算法或深度學習算法.雖然這些方法簡單易懂,但是存在精度不夠、實時性差、擴展性不足等問題[2].針對上述問題,本文提出了一種基于嶺回歸和增量學習的車輛惡意位置攻擊檢測方案.該方案在不斷增加數據的情況下不斷更新舊模型,保證模型的適應性和可用性,減少時間和空間資源消耗.基于嶺回歸和增量學習的車輛惡意位置攻擊檢測研究的意義和價值主要體現在以下方面:

1) 提高車聯網安全性.惡意位置攻擊可能導致交通混亂、車輛安全系統失效等嚴重后果.通過研究車輛惡意位置攻擊檢測方案,可以有效識別和防止此類攻擊,提高車聯網的整體安全性.

2) 減少惡意位置攻擊帶來的損失.惡意位置攻擊可能對交通運行和車輛安全造成損失.通過有效檢測減少和防止惡意位置攻擊的發生,從而降低潛在的經濟和人身損失.

3) 增強惡意攻擊檢測技術.當前的惡意攻擊檢測方法存在一些問題.本文提出的基于嶺回歸和增量學習的檢測方案,通過更新舊模型和靈活適應新數據,可以提高精度、實時性和擴展性,為惡意攻擊檢測技術的發展作出貢獻.

本文的主要貢獻如下:

1) 創新性地將嶺回歸和增量學習算法應用于車輛惡意位置攻擊檢測中,提出了一種新的檢測模型,用于實時、準確檢測車輛惡意位置攻擊;

2) 拓展了增量學習算法的應用場景,對增量學習算法的研究起到推動作用;

3) 為車聯網惡意攻擊檢測提出新的思路,推動了車聯網的落地應用.

1 相關工作

車聯網提高了道路安全和效率.車輛之間交換數據的正確性對于保證車聯網的正常運行至關重要,因此車聯網需要惡意攻擊檢測來保證車聯網數據的正確性.一般車輛惡意攻擊檢測的方法包括機器學習算法和深度學習算法2種.

許多研究根據不同的機器學習算法特征構建不同的檢測系統,用于檢測車聯網場景下的惡意行為:文獻[3]最早提出將機器學習應用于車聯網惡意位置攻擊檢測研究;文獻[4]提出一種基于多種機器學習算法集成的方法來檢測車聯網中的惡意行為,該方法可以利用不同分類器的優點,將單個分類器的結果合并為一個最終結果,從而達到更高的檢測精度;文獻[5]分析了檢測車聯網中惡意行為的監督學習算法,比較了監督學習算法的性能,并識別了監督學習算法的局限性,此外,文獻[5]還提出一種新的以數據為中心的有監督的機器學習惡意位置攻擊檢測模型,對攻擊類型進行分類,以支持驗證性對策.雖然這些基于機器學習算法的方法簡單易懂,但都存在實時性差和檢測精度有限等問題.

深度學習在惡意位置攻擊檢測問題上表現比機器學習技術好得多:文獻[6]將堆疊式去噪自編碼器與一種改進的稠密軌跡相結合,提出一種新的惡意位置攻擊檢測方法;文獻[7]提出一種有效的基于卷積神經網絡(CNN)的惡意位置攻擊檢測方法,該方法利用卷積神經網絡的結構和基于馬氏距離的損失函數來提取和估計車聯網流量,最后利用強化學習實現惡意位置攻擊檢測;文獻[8]提出一種將CNN和卡爾曼濾波器相結合的方法,在連通和自動車輛中檢測異常并識別異常車輛.然而,深度學習的方法存在以下問題:1)實時性差;2)可擴展性差;3)資源要求高.這使得目前已有的基于深度學習的車輛惡意位置攻擊檢測方案不太可行,缺乏實用價值.

針對上述問題本文提出一種基于增量學習和嶺回歸算法相結合的方法.增量學習是指一個學習系統能不斷地從新樣本中學習新的知識,并能保存大部分以前已經學習到的知識[9].增量學習能夠解決車聯網中車輛每時每刻都在產生新數據的建模問題.而嶺回歸是一種專用于共線性數據分析的有偏估計回歸方法.嶺回歸是一種經典的線性回歸方法,它通過加入L2正則化項來解決普通最小二乘法中存在的過擬合問題.在車輛惡意位置攻擊檢測中,嶺回歸算法可以用于建立檢測模型,預測車輛的位置信息,并判斷是否存在惡意攻擊.首先,嶺回歸算法能夠很好地處理特征間的多重共線性問題.在車輛惡意位置攻擊檢測中,可能存在多個相關的特征,而這些特征之間存在較強的相關性.嶺回歸通過引入正則化項能夠有效地降低特征之間的共線性,并提高模型的穩定性和可靠性.其次,嶺回歸算法能夠減小模型的方差,降低過擬合的風險.在車輛惡意位置攻擊檢測中,如果模型過于復雜可能會導致對樣本數據過擬合,進而影響模型的泛化能力.嶺回歸通過控制正則化參數可以有效地限制模型的復雜度,減小過擬合的風險,并提高模型在未知數據上的預測能力.此外,嶺回歸算法具有較好的數學性質和計算效率.相較于其他復雜的回歸方法,嶺回歸算法的求解過程相對簡單,可以通過解析解或迭代優化算法快速求解.這使得嶺回歸算法在處理大規模車輛數據時具有一定的優勢.

本文通過將增量學習和嶺回歸相結合,可以有效解決車聯網惡意位置攻擊檢測中模型擴展性差、檢測資源要求高等問題.

2 系統模型

本文將基于增量學習算法的惡意位置攻擊檢測方案設計為4個步驟:1)從車輛在車聯網中傳輸的消息中提取特征;2)利用算法挖掘不同屬性之間的關系并訓練網絡;3)建立惡意位置攻擊檢測模型并應用于車聯網場景;4)在系統中采集一定量的新數據后對模型進行更新.圖1示出惡意位置攻擊檢測系統框架.惡意位置攻擊檢測系統部署在車輛、移動設備和邊緣服務器中.采集周圍車輛信息,識別危險源后發出預警信號.

圖1 惡意位置攻擊檢測系統框架

圖2示出所提出的惡意位置攻擊檢測模型的框圖.該模型由4個模塊組成:1)數據采集與共享模塊;2)特征提取模塊;3)檢測模型建立及決策模塊;4)模型更新模塊.數據采集共享模塊負責車輛數據信息的采集和共享.特征提取模塊的功能包括從采集到的信息中提取特征,對提取的特征進行歸一化處理,并用2維向量對消息的真實性標簽進行歸一化處理.檢測模型建立和決策模塊訓練基于地理位置信息,并實時檢測車輛發送的消息的真實性.模型更新模塊的功能是當系統中采集到的新數據積累到一定數量后,利用新數據和增量學習算法對模型進行自動更新.

圖2 惡意位置攻擊檢測模型架構

2.1 數據采集與共享模塊

每個車輛從自己的消息日志和傳感器單元(如GPS定位傳感器、運動傳感器等)獲取歷史軌跡數據和相應的上下文信息,包括車速、加速度等信息方向和位置.車輛信息采集完成后采用廣播的方式與周圍其他車輛共享信息.在此過程中,每輛車與其他車輛通信的同時,從相鄰車輛收集移動性信息,如廣播速度和傳輸時延等.

2.2 特征提取模塊

在此階段,基于前一階段采集到的車輛信息,提取如表1所示的6個重要特征(包括車輛狀態和通信狀態),特征1~4表示車輛的行駛狀態,特征5和6表示車輛之間的通信狀態.

表1 車輛關鍵特征

獲取上述6類特征后,將最終的車輛特征記為矩陣X,為p×6個元素的矩陣(有p行6列),其中p為樣本總數,6為樣本特征的維數.具體如式(1)所示:

(1)

對于一個亂碼的真實性標簽的標準化,用一個2維向量(y1,y2)表示消息的真實性.在表示真消息的標簽中,y1=1,y2=0,而在表示假消息的標簽中,y1=0,y2=1,即真消息和假消息的標簽分別標準化為向量(1,0)和0,1).最后,將所有樣本的真偽標簽記為p×2的矩陣Y.

2.3 檢測模型的建立和決策模塊

車聯網中的錯誤行為檢測是一個有監督學習分類問題.分類器通過使用提取的特征和標記訓練模型,這些標記分為有惡意行為和沒有惡意行為.在檢測模型的建立和決策模塊主要工作是訓練分類器,用于檢測車輛的惡意位置攻擊.

如圖3所示,檢測模型的建立和決策模塊由3部分組成:1)映射特征(從原始輸入的映射);2)增強節點(映射特征的映射);3)輸出節點(映射特征和增強節點的聯合映射).

圖3 檢測模型的建立和決策模塊

首先,通過6維輸入、隨機權重Wai、隨機偏移βai和線性函數φi,得到s組(s的值可以根據具體情況指定)的映射特征,如式(2)所示:

Zi=φi(XWai+βai),i=1,2,…,s,

(2)

其中Wai為6×e矩陣,e為一組特征節點的節點數.為了獲得更好的功能,通常使用線性稀疏自編碼器對Wai進行微調.βai是一個隨機偏移值,Wai和βai的值一般服從(0,1)之間的隨機分布.φi是一個線性函數,可以針對不同的映射特征組選擇不同的函數.

得到的映射特征Zi是一個p×e矩陣.然后,將上述過程迭代s次得到s組特征節點,Zs∈[Z1…Zs]表示從原始輸入中得到的所有映射特征,即p×(e×s)矩陣.

然后,通過Zs、隨機權重Wbj、隨機偏差βbj和非線性函數φi計算t組的增強節點,如式(3)所示:

Hj=ξj(ZsWbj+βbj),j=1,…,t,

(3)

其中Wbj是e×(s×f)的矩陣,f是1組增強節點的節點數.βbj是一個隨機偏移值,Wbj和βbj的值一般服從(0,1)之間的隨機分布.ξj是一個非線性函數,對于不同的增強節點組可以選擇不同的函數.得到的增強節點Hj是p×f的矩陣.然后,對上述過程進行t次迭代,得到第t組增強節點,Ht≡[H1…Ht]表示從映射特征中得到的所有增強節點,其矩陣為p×(f×t).

將映射特征Zs和增強節點Ht按列合并成矩陣Q.Q=[Zs|Ht]是p×(e×s+f×t)的矩陣,作為輸出層的輸入.學習參數W是連接Zs和Ht輸出節點的權值,基于增量學習模型的檢測模型表示為式(4)所示:

Y=[Zs|Ht]W=QW,

(4)

Q+代表Q的偽逆,可以通過使用嶺回歸方法計算得出:

(5)

其中I是(e×s+f×t)的單位矩陣,通常是γ→0.由于輸出矩陣Y已知,因此可以直接利用Q的偽逆Q+得到:

W=Q+Y.

(6)

當需要對檢測到的消息進行真實性預測時,首先要根據式(1)從待檢測消息中提取并標準化特征.最終的特征記為q×6矩陣X,其中q為待檢測消息的個數,6為特征的維數.然后,將X送入檢測模型,根據式(2)和式(3)計算出映射特征Zs和增強節點Ht,其中Zs是q×(e×s)的矩陣,Ht是q×(f×t)的矩陣.最后,利用權值W得到預測值Y′:

Y′=[Zs′|Ht′]W,

(7)

其中Y′為q×2矩陣,矩陣Y′的每一行對應一個檢測結果.每個檢測結果用2維向量(y1,y2)表示.如果y1>y2,則該消息是真實消息;否則,該消息是虛假消息.

算法1給出基于增量學習模型的車輛惡意位置攻擊檢測的算法步驟.

算法1.基于增量學習檢測算法.

輸入:6維原始特征;

輸出:預測Y*.

步驟1.根據式(1)獲取z-score標準化特征;

步驟2.分別根據式(2)和式(3)計算Z和H;

步驟3.根據式(5)和式(6)計算基于增量學習模型的權重W;

步驟4.根據式(2)、式(3)和式(7)計算預測標簽Y*.

2.4 模型更新模塊

(8)

(9)

其中H是a×(f×t)的矩陣.

Ynew=QnewWnew.

(10)

將式(10)用偽逆矩陣表示,可以得到新的權重:

(11)

在式(11)中:

(12)

(13)

(14)

經過式(11)操作后得到了一個新的連接權值Wnew,它是(e×s+f×t)×2的矩陣,并完成了模型更新.更新車輛惡意位置攻擊檢測模型的算法步驟如算法2所示.

算法2.更新車輛異常行為檢測模型的算法.

輸入:提取的6維新特征;

輸出:權重Wnew.

步驟1.根據式(1)獲取z-score標準化特征;

步驟2.分別根據式(8)和式(9)計算Z和H;

步驟3.根據式(11)~(14)計算基于增量學習模型的權重Wnew.

可以看出,在更新模型權重時只需要對新數據進行偽逆運算,其他部分只涉及矩陣基本運算;因此,舊的檢測模型可以快速更新.隨著數據的增加,可以連續執行更新過程,而無需重建整個網絡.

3 實驗結果及性能分析

針對所提出的模型,本文采用以下3個真實數據集進行性能評估:1)VeReMi數據集是在2018年提出的可擴展、公開可用的數據集,主要包括模擬每輛車的消息日志和指定攻擊者行為的地面真實文件;2)NGSIM是由FHWA收集的公開數據集,提供了南行美國101號公路等地區每輛車輛軌跡數據(每1/10s精確定位);3)PeMS是一個包含車輛里程、行駛時間和從高速公路性能測量系統通過傳感器收集的實時交通數據生成的性能度量數據集.

本文研究從每個數據集中隨機選擇了2萬個樣本作為訓練集來訓練提出的異常行為識別模型,另外再選取1.55萬個獨立于訓練集的樣本作為測試集來評估模型的性能.本文學習模型的結構設置為s=10和t=20,總共有6×10個映射特征和6×20個增強節點.φi是ReLU激活函數,ξj是Sigmoid激活函數.本文使用10折交叉驗證方法用于調整不同算法的模型最佳超參數設置.然后,使用整個訓練集來訓練每種算法的最佳模型,并使用測試集評估這些模型.評估指標主有要加權準確率、加權F1-score、訓練時間和推理時間.準確率是正確預測的總數與實例總數的比率.F1-score是精確度和召回率的調和平均數.訓練時間是每種算法完成模型訓練所需的總時間.推理時間是經過訓練的模型在測試集上進行預測所需的時間,為每種分類算法的性能提供效率度量.實驗重復3次以避免偶然因素,給出平均結果.表2的實驗結果示出增量學習算法與其他算法的性能比較:

一方面,在與傳統機器學習方法的比較中,增量學習在綜合性能方面表現更佳.以VeReMi數據集為例,與傳統機器學習方法相比,基于增量學習模型的準確率平均提高了3.52%,F1-score平均提高了3.44%.同樣地,針對NGSIM數據集,基于增量學習模型的準確率和F1-score平均提高8.54%和8.75%,而對于PeMS數據集,基于增量學習模型的準確率和F1-score平均提高9.60%和9.47%.盡管基于增量學習模型的訓練時間(分別為數據集的2.339s,1.781s和1.615s)高于大多數傳統機器學習方法,但也處于一個特別低的水平.此外,基于增量學習模型僅需要0.127s,0.169s和0.146s即可完成3個數據集的1.55萬個樣本的預測,這表明基于增量學習模型完全能夠進行實時檢測任務.

另一方面,與深度學習方法相比,基于增量學習模型在訓練時間和推理時間方面具有明顯優勢.與深度學習方法相比,在3個數據集上,基于增量學習模型的訓練速度平均提高970,1475和1098倍,推理速度平均提高733,568和437倍.此外,基于增量學習模型的性能也優于大多數深度學習方法.具體而言,與深度學習方法相比,基于增量學習模型的平均準確率和F1-score在VeReMi數據集上分別提高0.33%和0.33%,在NGSIM數據集上分別提高2.88%和3.05%,在PeMS數據集上分別提高1.20%和1.09%.

此外,還測試了帶有新添加樣本的模型更新模塊.設定初始網絡是在VeReMi數據集中隨機選擇5000個樣本進行訓練.模型更新閾值a設為3000,這意味著應用增量算法來動態添加3000個樣本以更新模型.基于增量學習模型的結構仍然設置為s=10和t=20,總共有6×10個映射特征和6×20個增強節點.表3示出每次更新模型所需的準確率、F1-score和時間:

表3 樣本數量與模型性能指標隨訓練次數的變化情況

實驗證明,使用新添加的數據更新現有模型非常有效.一方面,每添加3000個新樣本,模型的準確率和F1-score逐漸增加.在5次更新后模型的準確率達到90.4%,F1-score達到91.1%,非常接近直接用2萬個樣本訓練的模型準確率(90.6%)和F1-score(91.4%).另一方面,每次更新所花費的時間約為2s,因此模型可以高效地進行更新.因此,已知該模型具有良好的可擴展性,可以在不重新構建整個網絡的情況下及時反映系統的真實性和完整性.

4 結論與未來工作

隨著車聯網的不斷發展,車輛惡意位置攻擊檢測仍然是一個具有挑戰性的話題.本文提出了一種基于增量學習方法的快速漸進式惡意位置攻擊檢測模型.在3個真實數據集上的實驗中,通過與各種其他機器學習和深度學習模型進行比較得知,基于增量學習的惡意位置攻擊檢測模型的準確性高于傳統機器學習方法,并且與深度學習方法相似,而基于增量學習的惡意位置攻擊檢測模型的計算速度遠快于深度學習模型.另一方面,本文測試了所提出模型的更新模塊,并通過逐步向模型添加新數據來分析模型的更新效率和準確性變化.實驗證明,本文所提出的方法可以快速構建高精度的車輛惡意位置攻擊實時檢測模型,并能有效且高效地執行具有強健性和可擴展性的實際應用.在此研究中,本文僅考慮在增量學習中使用一些簡單的車輛狀態和環境狀態信息來檢測車輛的惡意位置攻擊.下一步將探索將增量學習模型與更復雜的多模態數據(如聲音和圖像信息)相結合的算法,以實現車聯網中的惡意位置攻擊檢測.

猜你喜歡
增量聯網矩陣
“身聯網”等五則
提質和增量之間的“辯證”
“價增量減”型應用題點撥
搶占物聯網
初等行變換與初等列變換并用求逆矩陣
基于均衡增量近鄰查詢的位置隱私保護方法
矩陣
矩陣
矩陣
德州儀器(TI)發布了一對32位增量-累加模數轉換器(ADC):ADS1262和ADS126
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合