?

基于經驗約束規則和證據理論的入室盜竊案件嫌疑人異常軌跡檢測

2022-12-09 04:54張新宇顧海碩
關鍵詞:入室時空嫌疑人

張新宇, 陳 鵬, 顧海碩

(中國人民公安大學信息網絡安全學院,北京 100038)

0 引言

時空軌跡數據是描述主體時空行為的重要手段,特別是在犯罪學中,時空軌跡數據能夠精確的刻畫犯罪人員在作案前后的空間行為,因此,利用人群的時空軌跡數據能夠有效地挖掘和分析出潛在的犯罪人員,對相關決策以及偵查破案等都具有很大的參考價值[1-2]。近年來,時空軌跡分析已經在海洋地理[3-4]、交通運輸[5-6]、城市熱點分析[7-8]、新冠肺炎疫情防控[9-10]等領域廣泛應用并取得了顯著成果,但是在公共安全領域,利用時空軌跡數據挖掘和分析犯罪人的時空行為模式,特別是發現軌跡數據中隱藏的異常行為模式還處在一個相對較少被觸及的階段。事實上,目前針對特定軌跡或異常軌跡的挖掘已經開展了一些相應的工作,如文獻[11]提出一種基于長短期記憶網絡的異常軌跡挖掘模型,有效識別了異常車輛軌跡;文獻[12]利用ST-DBSCAN算法和重點部位觀測點法標定軌跡數據,并進行動態軌跡序列化建模進行了社區治安高危人員異常軌跡識別。此外,文獻[13]提出了一種時空軌跡的熱點區域提取算法應用于交通管理,能夠高效地提取熱點區域。

與車輛等主體的異常出行軌跡相比,犯罪嫌疑人異?;顒訒r可以選擇不同類型的交通工具,停留地點也根據潛在作案地點轉換。因此,其軌跡往往具有多模態、不確定性等特點,給軌跡數據分析帶來了較大的困難。然而,在一些特殊類型的犯罪活動中,犯罪嫌疑人仍然具有一定規律的時空行為模式。以系列入室盜竊案件的嫌疑人主體為例,該類人群屬于職業化犯罪群體,有著其獨特的行為模式,如在時空行為模式中常常會表現出事前“踩點”、事中“蹲點”、事后快速逃離作案現場等特點,而且往往會選擇在一些特殊時間段作案[14-15]。因此,這些典型的犯罪嫌疑人的行為特征是進行時空軌跡數據分析的關鍵要素,為深入挖掘潛在犯罪嫌疑人異常軌跡提供了可能。

Dempster-Shafer(D-S)證據理論用于處理不確定信息,推理時不需要先驗概率和條件概率,并依靠證據的積累不斷減少假設集的范圍,具有表達“不確定”的能力,利用其組合規則可以在多證據下進行異常檢測[16-18]。為此,本文擬利用入室盜竊案件嫌疑人的時空行為模式制定相應的經驗規則,基于D-S證據理論來構建一種通過有效挖掘海量時空坐標點軌跡數據來發現潛在犯罪嫌疑人的分析方法,并以實際數據的案例來印證該方法的有效性。

1 基于證據理論的異常檢測

1.1 D-S證據理論

D-S證據理論中的辨識框架Θ包含了所有可能的判別假設,各假設之間獨立且互斥,其子集共有2Θ個[16]。本文用N={正常}、U={異常}兩種形式表示軌跡是否異常,則辨識框架Θ={U,N}有4種子集,分別為{U}、{N}、{U,N}和?。對?X?Θ,存在基本概率分配(Basic Probability Assignment,BPA)函數m(X),表示證據對假設X的信任程度,m(X)滿足m(?)=0且BPA可通過知識經驗給出,根據BPA可計算證據對某命題X的信任函數Bel(X)和似然函數Pl(X):

式中,Bel(X)為包含在X中的所有子集的BPA之和,表示證據對X為真的信任程度,Pl(X)表示證據對X不為假的信任程度。Bel(X)和Pl(X)分別表示證據對假設X為真的信任程度的下限和上限,[Bel(X),Pl(X)]稱為信任度區間[16-21]。

本文在進行異常軌跡檢測前,首先進行時空距離約束,排除沒有作案可能性的主體;之后選取主體在案發前后是否在案件現場周邊出現(即是否存在“踩點”行為)、案發時是否圍繞案件現場徘徊(即是否存在“蹲點”行為)、案發后是否出行速度加快(即是否快速逃離作案現場)等3個指標作為證據判別軌跡的異常程度。

1.2 時空距離條件約束

每個案件都有其時間和空間坐標,落在案件點Ci一定時空范圍外的坐標軌跡點在作案可能性上基本為零,為此,引入時空距離向量Vst=(S,T)表示時空坐標點Pi與案件的空間距離和時間距離。其中S與T的計算公式如下:

根據時空可達性,定義S和T的臨界值,若Ci與Pi的時空距離超過臨界值,則該Pi的作案嫌疑基本為零。設符合該條件的主體Bi形成的集合為Dst。

1.3 案發前后時空位置條件約束

根據犯罪的時空臨近重復性原理[19-20],系列入室盜竊案件的嫌疑人在作案前大部分會有“踩點”行為,以搜索合適的犯罪目標,而在案件發生后一段時間,嫌疑人一般會選擇返回作案現場附近再次尋找作案機會。根據Bi∈Dst,設條件CLb為Bi在案發前出現,CLa為在案發后出現,擴大空間S的范圍為ds。設案發時間為t0,則案發前的時間距離為tb,案發后的時間距離為ta,此時Pi與Ci的時空距離條件應滿足:(ds,-|t0-ta|)<Vst<(ds,|tb-t0|)。若案發前后均出現,認為滿足經驗條件CL。

1.4 案發期間時空位置條件約束

對有著一定犯罪經驗的嫌疑人,其在到達犯罪現場后往往因為目標有人看守并不會立即得手,在這種情況下嫌疑人一般會在目標附近徘徊等待目標看守離開,即“蹲點”行為。從時空軌跡上就會表現出圍繞作案現場的高密度軌跡,即案發時間前后在案件周圍大量聚集形成的軌跡點團簇。對此,可利用ST-DBSCAN算法進行聚類分析[21-23],以“時間鄰域”和“空間鄰域”作為參數,假設存在某集合D={X1,X2,…Xn},設空間距離為Eps1,時間距離為Eps2,閾值點數目為Minpts,若案件點在周圍空間距離Eps1和時間距離Eps2以內出現最少Minpts的軌跡點,則可認為出現了異常高密度軌跡,滿足經驗條件CU。

1.5 案發前后主體速度條件約束

入室盜竊犯罪嫌疑人在得手后通常迅速離開作案現場以躲避偵查。根據Bi∈Dst,可進行速度分析。設案發前主體Bi的移動速度為v1,案發后移動速度為v2,根據其經緯度信息調用OSRM路徑規劃服務,計算案發前后各10分鐘內的移動距離進而計算時間,比較v1與v2的大小。若存在v2>v1,則認為其滿足經驗條件Cs。

1.6 異常指數

本文以案發前后出現CL、速度異常變化Cs和案發期間軌跡異常CU作為主要證據分別檢驗每條軌跡為異常的信任程度,其中時空距離約束條件為判別的前提,檢驗流程如圖1所示。Dempster組合規則根據多證據的基本信度分配從而得到綜合的BPA函數,考慮到“Zadeh”悖論,設置m{U,N}為0.05。Bel(U)表示認為軌跡屬于異常的信任程度,Bel(U)值越大越異常;Pl(U)表示不認為軌跡為異常的程度,Pl(U)值越小越正常[24]。根據偵查知識經驗,Bel(U)>70%的軌跡可認為異常,而Pl(U)<70%的軌跡可認為正常。

圖1 算法流程

2 實驗和分析

2.1 數據與預處理

本文選取北京市2007~2012年入室盜竊案件數據和同期部分人群的時空坐標點軌跡數據集為例進行分析。其中案件數據共125 654條,軌跡數據共有182個主體的18 669條。兩類數據均來自于北京市公安局。兩種數據中都包含時間信息和經緯度點,分別對數據進行清洗、去重、格式轉換等預處理后,部分案件點和軌跡信息的空間可視化效果如圖2所示,其中線表示軌跡,標記點為案發點。

圖2 入室盜竊案件與軌跡數據示例

2.2 時空距離約束分析

首先,根據異常軌跡研判的基礎條件進行異常軌跡篩選。限定時間范圍為案發前后各90分鐘以內,空間范圍為案件現場方圓100米以內,進行時空匹配,分析結果如表1所示,前三列表示每年發生的入室盜竊案件數目和待分析的軌跡總數目,時空約束案件數目表示經過時空距離限定后有異常軌跡經過的案件數目,時空約束軌跡數目表示在案件時空距離之內的軌跡量,約束案件占比為時空約束案件數目與案件總數目的比值。在182個主體的18 669條軌跡中,發現201個案件與60個主體的222條軌跡存在顯性關聯。為此構成主體集合B={B1,B2,…Bi,…B60}。其中,“案件-主體-軌跡”存在多種關聯關系,既包含有某個主體的一條軌跡與一個案件產生關聯,也包括某個主體的多條軌跡與多個案件產生關聯,以及多個主體的軌跡與一個案件相關等。經統計,60個主體所涉及的案次共計232次。

表1 時空距離條件約束結果

2.3 證據指標

證據指標將直接影響最終的判別結果,所以依據每個特征的異常頻率考慮每個證據指標的設置,同時如表2所示,根據統計基本信息R和實戰經驗設置不同條件的可疑程度C。其中,案發前后時空位置條件約束中,tb設為3天,ta設為1天,ds為100米;案發期間時空位置條件約束中,空間距離Eps1設為100米,時間距離Eps2設為30分鐘,閾值點數目Minpts設為ln(n),n為分析對象主體的軌跡點數量。

表2 實驗數據統計

由表2得出,在案件現場位置前3天和后1天出現的軌跡數量比例為4.7%;速度變化異常的主體占比24.6%;而形成案發期間案件現場“異常高密度軌跡團簇”的主體占比極小,僅有3.4%。需要說明的是,在分析CU時,案件周邊的軌跡密度可能有3種情況,如圖3所示。其中,第一種為主體Bi恰好在案發時“經過”案件現場;第二種為主體Bi長時間滯留在案件現場附近,但與案件位置沒有交集;第三種為主體Bi的軌跡在案件現場周邊高度集中,且與案件位置出現重合現象,即疑似徘徊“蹲點”。因此,在利用ST-DBSCAN算法獲得異常高密度軌跡點后還需要再進一步進行人工研判,符合條件的歸納為CU。

圖3 案件現場周邊異常軌跡的3種行為

2.4 檢測結果與分析

本文以CL、CS、CU為主要判斷證據,分別設置其特征值,根據實戰經驗以及統計數據設定初始BPA如表3所示。

表3 BPA函數初始值設定

根據Bel(U)和Pl(U)的值為不同主體劃分不同程度的等級,檢測結果及分類等級如表4所示。

表4 檢測結果及分類等級

其中,可疑程度為A級的案件與軌跡相對時空關系如圖4所示,其中平面坐標分別為緯度和經度,縱向坐標為時間,單位為秒,可見異常軌跡點與案件位置的相對關系并不顯著,Bel(U)近似為0;可疑程度為D級的案件與軌跡時空關系如圖5所示,異常軌跡點與案件位置在案發期間和案發后出現兩次軌跡重合,Bel(U)為82%;而可疑程度為E級的案件與軌跡時空關系如圖6所示,整體呈現出圍繞案發位置頻繁活動的現象,Bel(U)的值為92%。

圖4 A級案件與軌跡時空關系示例

圖5 D級案件與軌跡時空關系示例

圖6 E級案件與軌跡時空關系示例

對預處理過后的222條軌跡,受限于每個案件有其獨有的時空位置,再利用嫌疑人作案特點進行深入挖掘,且本文定量分析了嫌疑程度,為決策者提供了偵查依據,節省了較大的人力和物力,在傳統的時空碰撞基礎上進一步減小了排查范圍。

3 結語

對于海量軌跡數據而言,每個入室盜竊案發點的時空位置不同,但嫌疑人活動有其一定的特征。本文針對系列入室盜竊案件嫌疑人的行為特征,在時空距離約束的基礎上提出了一種基于證據理論和在案發前后與案發期間主體位置以及速度變化是否異常的檢測方法,通過異常度區間[Bel,Pl]對每條軌跡進行檢驗從而圈定異常的活動主體。實驗結果表明,該方法檢測入室盜竊異常軌跡效果較好,并且可以減少正常軌跡構成的“噪聲”,給出相應的可疑性等級,對案件研判具有一定的輔助決策作用。后續工作可結合案件本身特征、團伙作案下的同行主體分析等更多元的活動特征等行為證據檢測異常軌跡。

猜你喜歡
入室時空嫌疑人
跨越時空的相遇
入室盜竊案
入室盜竊案
疑點重重
入室盜竊案
鏡中的時空穿梭
玩一次時空大“穿越”
光從哪里來
定位嫌疑人
20年了,我還是嫌疑人嗎?
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合