?

基于機器學習的數據情報偵查預測研究

2023-03-04 06:18薛亞龍劉梓濘
湖南警察學院學報 2023年5期
關鍵詞:情勢偵查人員異構

薛亞龍,劉梓濘

(寧夏警官職業學院,寧夏 銀川 750021)

隨著各種多源異構數據呈指數級的迅猛增長,數據情報偵查預測中存在挖掘過擬合現象嚴重、因果關聯效應偏差高、數據犯罪模式更迭快等突出問題,給算法時代的數據情報偵查預測帶來了巨大困境?;诖?,引入基于機器學習的數據情報偵查預測研究范式,不僅能夠提升打擊數據犯罪情勢生存與態勢發展的偵查效果,而且還能夠增強擠壓數據犯罪情勢滋生的“土壤”空間,轉型和創新打擊數據犯罪情勢的新型數據情報偵查途徑,從而實現機器學習循證數據情報偵查預測的價值效果。

一、機器學習數據情報偵查預測的轉型價值

機器學習數據情報偵查預測主要是通過采取支持向量機、人工神經網絡等機器學習算法①參見范昊、李珊珊、熱孜亞·艾海提:《機器學習算法在我國情報學研究中的應用與影響——基于CSSCI 期刊論文的視角》,載《圖書情報知識》2022 年第5 期,第96-108 頁。,深度挖掘多源異構數據與數據犯罪情勢之間潛在的關聯規則,幫助解決多源異構數據與數據犯罪小概率事件、數據犯罪情勢因果解釋與情報偵查預測、數據運算挖掘精度擴張與情報偵查預測級聯需求等突出問題。誠然,與傳統數據情報偵查預測相比較而言,機器學習數據情報偵查預測為算法時代的現代數據情報偵查提供了新的轉型價值。

(一)情報預測路徑:從偵查假設向客觀數據轉型

傳統數據情報偵查預測往往始于偵查假設,主要是在偵查因果解釋理論的指導下先提出偵查假設,然后采取隨機抽樣措施獲取所需數據并進行偵查假設的驗證等②參見薛亞龍、羅珂巖、馬麒:《數據情報偵查的循證決策方法》,載《中國刑警學院學報》2022 年第3 期,第24-34 頁。??梢?,傳統數據情報偵查預測是一種自上而下的邏輯論證過程。偵查假設驗證主要適用于特定時空的數據犯罪情勢,往往難以被應用于數據情報偵查預測的全過程。然而,機器學習數據情報偵查預測是以客觀數據為開始,不再側重于追求獲取各種模糊或不確定的因果關系和反復論證的偵查假設,而是主要利用機器學習算法對多源異構數據直接進行聚類挖掘、模式識別等。這不僅能夠幫助偵查人員發現和掌握數據犯罪情勢的生存態勢規律,而且還能夠幫助其預測不同偵查中主體的發展需求。顯然,機器學習數據情報偵查預測是一種以,“匯集數據—挖掘數據—構建模型—結果預測”為模式的挖掘流程。誠然,機器學習數據情報偵查預測的路徑轉型從根本上改變了傳統數據情報偵查預測所追求的偵查因果解釋。這不僅有利于能夠獲得更多不同數據犯罪情勢之間的關聯規則和強化對多源異構數據運算挖掘的可控性,而且還有利于最大限度地避免和降低偵查人員主觀方面因素的影響。

(二)情報預測數據:從主觀設計向全量真實轉型

傳統數據情報偵查預測的主要困境在于匯集數據時存在不透明、不完備、不公開等現象,部分還存在清洗集成難、規約融合復雜等突出問題。然而,機器學習數據情報偵查預測確有望能夠避免和減少這些困境難題。首先,多源異構數據是“客觀數據”而非“被主觀設計的數據”。傳統數據情報偵查預測在數據匯集方式上屬于典型的主觀設計,尤其在偵查因果解釋理論指導下促使偵查人員所匯集的數據具有一定的選擇性、目的性、裁剪性,造成這種“被主觀設計的數據”嚴重影響了應用效果的客觀性和真實性。而機器學習數據情報偵查預測所使用的多源異構數據主要是在不介入、不干預的前提下對各種數據犯罪情勢生存態勢的客觀記錄和匯集,從根本上保障了多源異構數據被匯集的客觀真實。其次,多源異構數據是“全量數據”而非“抽樣數據”。多源異構數據主要是接近各種不同數據犯罪情勢的全量數據,與傳統數據情報偵查預測的抽樣數據相比較而言,“全量數據”能夠消除或降低因傳統抽樣數據而引起的統計誤差、結果失真等異?,F象。再次,多源異構數據是“厚數據”而非“淺數據”。多源異構數據不僅包括結構型數據、非結構型數據、異構型數據等傳統型數據,而且還包括定類型數據、定序型數據、定比型數據等新型數據。顯然,多源異構數據屬于內涵豐富的“厚數據”。最后,多源異構數據是“開放數據”而非“孤島數據”。從來源渠道和類別形態而言,多源異構數據具有很強的共享性、開放性、融合性。這不僅有利于偵查人員實現后續運算挖掘的過程重現和結果引用,而且還有利于其對多源異構數據進行運算平臺設計、挖掘流程構建等,從而提升機器學習數據情報偵查預測的優質性。

(三)情報預測分法:從傳統回歸向機器學習轉型

傳統數據情報偵查預測主要是將數據犯罪情勢中的因變量和自變量通過降維進行回歸簡化挖掘,往往存在不同偵查中主體被過度降維簡化的現象,造成所獲取的數據情報偵查預測存在效果偏差或結果失真等現象。然而,機器學習數據情報偵查預測能夠充分發揮機器學習算法的價值優勢,通過模擬偵查人員的數據情報偵查思維和認知策略,實現對多源異構數據運算挖掘的自我“訓練”和“學習”,極大提升了機器學習數據情報偵查預測的精準性。同時,機器學習數據情報偵查預測還有利于偵查人員實現對數據犯罪情勢中“犯罪因果推斷”的預測?!胺词聦嵰蚬笔峭茢嗤诰驍祿缸锴閯葜懈髯兞恐g關聯規則的重要依據,如果在數據情報偵查預測中“反事實”與“事實”兩者存在明顯的差異性,那么就說明數據犯罪情勢中結果變量與條件變量之間存在關聯規則。因此,機器學習數據情報偵查預測就能夠通過機器學習算法對“全量數據”進行挖掘和構建“反事實因果”推斷的關聯平臺,從而提升對數據犯罪情勢中因變量與自變量因果關聯預測的客觀性。

(四)情報預測模式:從單一模式向多元融合模式轉型

首先,機器學習數據情報偵查預測能夠將傳統的統計分析與支持向量機等機器學習算法進行融合。傳統的統計分析預測模式有利于偵查人員采取線性的統計挖掘模型對偵查假設展開驗證,而機器學習算法則有利于偵查人員對數據犯罪情勢中具有相關性、描述性等非線性關聯規則進行運算挖掘,有助于互補實現對數據犯罪情勢發展規律的整體預測。其次,將大數據與小數據有機融合。偵查人員通過利用海量大數據的系列性特征來實現對數據犯罪情勢的關聯規則構建,更加側重于從整體性、全局性、宏觀性的預測研判。最后,將犯罪因果推斷與數據關聯挖掘融合。犯罪因果推斷與數據關聯挖掘是開展機器學習數據情報偵查預測的基礎,傳統數據情報偵查預測側重于對犯罪因果推斷的分析③參見王夢瑤、陳剛:《大數據時代犯罪與偵查動態發展研究》,載《山東警察學院學報》2017 年第2 期,第74-80 頁。,而機器學習數據情報偵查預測不僅側重于對數據犯罪情勢的數據關聯挖掘,而且還兼顧對犯罪因果推斷的分析研判。

二、機器學習數據情報偵查預測的框架與模式

為增強實現機器學習數據情報偵查預測的轉型價值,依據機器學習的運算優勢和數據情報偵查預測的特殊價值需求,提出機器學習數據情報偵查預測的框架與模式。這不僅能夠提升對多源異構數據情報運算挖掘的客觀性和精準性,而且還能夠消除和減少數據情報偵查預測的偏差率。

(一)機器學習數據情報偵查預測的框架

機器學習數據情報偵查預測的框架不僅能滿足機器學習數據情報偵查預測轉型價值的整體、全局性要求,而且還是構建機器學習數據情報偵查預測模式的支撐和保障?;诖?,可將機器學習數據情報偵查預測的框架自下而上具體分為預處理和融合、流程模型構建等三個模塊(見圖1)。

圖1 機器學習數據情報偵查預測的框架圖

1.預處理和融合。預處理和融合主要包括兩個方面:一方面,多源異構數據的預處理。多源異構數據的預處理主要是指對多源異構數據進行數據清洗、數據集成、數據變換以及數據規約等處理,其中數據清洗主要是對多源異構數據中的異常數據和缺失數據進行處理,數據集成主要用于過濾識別多源異構數據中的冗余數據、重復數據等,數據變換主要是對各多源異構數據進行數據管理的規范化處理,而數據規約則是指對多源異構數據所進行的數據屬性約減。另一方面,多源異構數據的融合。多源異構數據的融合主要是指采取數據聚類、數據關聯、數據回歸等機器學習算法對經過預處理后的多源異構數據進行數據頻繁項目集合構建④參見張明寶、秦琪:《大數據環境下基于分工協作的情報系統構建方法研究》,載《情報雜志》2022 年第2 期,第29-34 頁。。

2.流程模型構建。為了提升挖掘多源異構數據與數據犯罪情勢之間潛在關聯規則的精確性,可將機器學習數據情報偵查預測的流程模型構建為數據情報偵查預測偏好選擇流程模型和數據犯罪情勢生存與態勢發展預測流程模型兩部分。

一方面,數據情報偵查預測偏好選擇流程模型。偵查人員借助于監督學習的機器學習算法從異構多源數據的結構屬性、犯罪嫌疑人的數據心理畫像、數據犯罪情勢的歷史規律等方面提取具有典型的規律特征,再利用數據倉庫中的多源異構數據與其進行融合映射,以此來構建數據情報偵查預測的偏好選擇流程模型。同時,根據案情需要更新的預置數據情報偵查預測價值需求,偵查人員可將其及時融入數據情報偵查預測偏好選擇流程模型中,進而幫助其改善數據情報偵查預測的預置價值需求與數據犯罪情勢發展之間的結構失衡性。

另一方面,數據犯罪情勢生存與態勢發展預測流程模型。偵查人員可利用機器學習算法對多源異構數據中各數據路徑、數據連邊、數據加權權重等進行深度挖掘,幫助其及時掌握多源異構數據的不同結構特征。將多源異構數據中不同結構特征提取出來形成機器學習運算挖掘的關鍵性序列特征,從而揭示不同數據犯罪情勢生存與態勢發展的趨勢規律。同時,為增強構建數據犯罪情勢生存與態勢發展預測流程模型的客觀性,偵查人員還可將多源異構數據的生命周期、數據犯罪情勢的耗散、運算挖掘的加權權重等相關因素加入其中,幫助其構建更加具有正向同配屬性關系的預測流程模型。

3.流程模型評估體系。流程模型評估體系主要是指偵查人員利用機器學習算法來評估數據情報偵查預測在實踐中的運行效果,也是對機器學習算法優勢與數據情報偵查預測價值需求互相融合的必要反饋。只有經過評估之后,才能夠準確判斷流程模型構建、機器學習算法選擇、數據犯罪情勢的關聯規則構建等是否符合機器學習數據情報偵查預測的價值需求。誠然,流程模型評估體系的核心是利用機器學習算法在數據運算挖掘、數據模型構建等方面的運算優勢,檢驗數據情報偵查預測偏好選擇流程模型和數據犯罪情勢生存與態勢發展預測流程模型構建等的準確性,再利用監督學習和強化學習等機器學習算法檢驗評估數據情報偵查預置價值需求的合理性等。

(二)機器學習數據情報偵查預測的模式

為緩解數據情報偵查預測的決策僵局和提高數據情報挖掘的差分隱私,可將機器學習數據情報偵查預測的模式自上而下構建為數據情報偵查預測偏好選擇模式、數據犯罪情勢生存與態勢發展規律模式、數據運算挖掘選擇模式三個部分(見圖2)。

第一,數據情報偵查預測偏好選擇模式。數據情報偵查預測偏好選擇模式主要是以數據情報偵查預測的預置價值需求為切入點,依據不同數據犯罪情勢之間的關聯規則,識別和提取不同數據情報偵查預測的預置價值需求、時空序列矩陣、函數權重系數以及因果關聯概率等數據序列特征。同時,偵查人員還可及時挖掘獲取不同數據情報偵查預測的益損決策矩陣、損失規避與偏好反轉、多屬性權重概率等深層次的隱性目標,進而幫助其實現預測價值需求觸發概率、數據情報偵查情勢發展態勢、情報關聯規則模型構建等偏好選擇的應用效果⑤參見薛亞龍、劉梓濘:《基于前景理論的數據情報偵查決策研究》,載《中國人民警察大學學報》2022 年第10 期,第5-11+18 頁。。顯然,數據情報偵查預測偏好選擇模式重點是關注如何運算挖掘數據情報偵查預測的各種顯性或潛在的預置價值需求,然后利用不同機器學習算法構建科學準確的偏好選擇模式。

第二,數據犯罪情勢生存與態勢發展規律模式。數據犯罪情勢生存與態勢發展規律模式主要是以數據犯罪情勢為邏輯起點,以結構型數據、非結構型數據、異構型數據等傳統型數據和定類型數據、定序型數據、定比型數據等新型類數據的多源異構數據為基礎,運算挖掘數據犯罪主體、數據犯罪時空、數據犯罪熱點矩陣以及數據犯罪關聯聚類規則和數據犯罪因果映射等數據犯罪情勢的生存與態勢發展規律。偵查人員借助不同機器學習算法的運算優勢,深入挖掘多源異構數據與數據犯罪情勢之間潛在的各種關聯規則,再利用機器學習算法構建數據犯罪情勢生存與態勢發展的預測流程模型,從而幫助其挖掘數據犯罪情勢的觸發概率、數據犯罪情勢的輻射蔓延以及數據犯罪情勢發展的不平衡結構等發展規律。

第三,數據運算挖掘選擇模式。數據運算挖掘選擇模式主要是針對不同數據情報偵查預測的預置價值需求,抽象出需要運用不同機器學習算法進行解決的運算問題,進而幫助偵查人員選擇和確定最佳的機器學習運算挖掘算法。首先,按照流程模型構建的框架要求選擇相適應的機器學習算法。其中,無監督學習的機器學習算法包括分層聚類算法、K 均值算法、離群異值分解算法等,而監督學習的機器學習算法則主要有人工神經網絡、決策樹算法、貝葉斯分類算法等⑥參見商城、康沛林、劉智攀:《基于機器學習勢函數的原子模擬軟件的開發及應用》,載《硅酸鹽學報》2023 年第2 期,第476-487 頁。。其次,根據選擇的機器學習算法對多源異構數據展開運算挖掘,重點挖掘數據距離、數據連邊、數據路徑以及數據加權權重等數據序列特征,并形成數據運算挖掘所需的數據訓練集。再次,利用機器學習算法分別對數據情報偵查預測偏好選擇流程、數據犯罪情勢生存與態勢發展預測流程以及流程模型評估等進行運算訓練,直到所有運算訓練全部符合機器學習數據情報偵查預測的評價指標參數為止。最后,依據機器學習對數據訓練集的運算結果,構建機器學習算法的數據測試集,并將其運算結果應用于數據情報偵查預測即可。

三、機器學習數據情報偵查預測的評價指標

由于易受到多源異構數據的類別形態、機器學習算法的選取優勢、數據情報偵查預測的預置價值需求等主客觀條件的影響,為增強機器學習數據情報偵查預測的客觀性和精確性,迫切需要構建機器學習數據情報偵查預測的評價指標。這不僅對構建機器學習數據情報偵查預測的框架與模式具有修正的檢驗作用,而且還對探討機器學習數據情報偵查預測的應用方法具有驗證的反饋價值。

(一)敏感度分析評價指標

敏感度分析評價指標主要應用于對機器學習數據情報偵查預測的結果解釋,是被建立在機器學習數據情報偵查預測框架與模式的局部變量測量或局部梯度評估之中。如果偵查人員挖掘獲取數據情報偵查預測的梯度值越接近關聯規則的指標系數,那么所獲得結果就越符合數據情報偵查預測的價值需求,并且還能解釋機器學習算法中梯度函數、變量函數以及解釋函數等之間的敏感度。同時,偵查人員還可引入基于貝葉斯分類器的敏感度分析評價指標。在貝葉斯分類器的敏感度分析評價指標中,解釋函數與解釋向量的運算維度都是相同的,且數據分類器還將多源異構數據劃分為不同的挖掘變量。其中,解釋向量在每個多源異構數據上都被預定義為獨立的向量場,該向量場代表數據情報偵查預測的不同預置價值需求,從而幫助偵查人員解釋機器學習數據情報偵查預測的運行結果。

(二)模型評價指標

模型評價指標主要包括數據情報偵查預測的查準率、查全率、靈敏率以及特效率和整體準確率所構成的混淆評價矩陣⑦參見衛安妮、趙寧、張志堅:《基于機器學習對串聯排隊系統等待時間的預測》,載《西南師范大學學報(自然科學版)》2022 年第12 期,第11-21 頁。。在模型評價指標中,機器學習數據情報偵查預測的查準率與查全率、靈敏率與特效率均屬于反向異配屬性關系。為提高模型評價指標的精準性,偵查人員可將機器學習數據情報偵查預測的查全率和查準率分別設為橫軸、縱軸,然后結合數據犯罪情勢生存與態勢發展預測流程模型的查準率與查全率、靈敏率與特效率所占比,運算機器學習數據情報偵查預測的查準率與查全率曲線,即P-R 曲線。然而,在實際的模型評價過程中,機器學習數據情報偵查預測的應變量評價指標會產生一個預測概率系數,需將其與提前預置的分類閾值進行比較。如果預測概率系數大于預置的分類閾值,那么說明所獲數據情報偵查預測的結果為正例現象;反之,則屬于反例現象。

(三)風險預測指數評價指標

為實現機器學習數據情報偵查預測的定性與定量評價分析,偵查人員可將風險預測指數評價指標表示為,其中Wb表示機器學習數據情報偵查預測的穩定基準值,t表示采取機器學習算法挖掘數據情報偵查預測的收斂耗時,Wtotal表示機器學習數據情報偵查預測的輸出指數,M 表示機器學習數據情報偵查預測的預置價值需求。同時,為強化風險預測指數評價指標的精確性,偵查人員還可利用機器學習算法對風險預測指數評價指標的獲取過程進行迭代運算,從而獲得風險預測指數評價指標的加權權重系數。顯然,偵查人員可根據機器學習數據情報偵查預測中存在的不同風險預測類別,通過運算風險預測指數評價指標的加權權重系數,便可獲得具有精確性的風險預測指數評價指標。

(四)回歸模型性能評價指標

其一,將機器學習數據情報偵查預測的閾值分為預測值和真實值兩部分,并利用不同機器學習算法對選擇決定系數、平均絕對誤差、開方均方誤差等評價系數進行運算挖掘。其二,預置性能評價指標系數。將選擇決定系數的最大閾值設為1,越接近1 就說明機器學習數據情報偵查預測的質量和可信度越優。例如,支持向量回歸和人工神經網絡算法的選擇決定系數均在0.9 以上,就說明二者的性能可信度高,且二者的MAE 值、RMSE 值等評價指標也很優越。如果在回歸模型性能評價指標中MAE 值、RMSE 值的閾值偏差越小,那么就說明機器學習數據情報偵查預測的運行結果越接近于應然價值。顯然,回歸模型性能評價指標具有很強的擬合性。這不僅有利于增強機器學習數據情報偵查預測的精確度,而且還有利于提升其算法預測的高可信度。

四、機器學習數據情報偵查預測的應用方法

機器學習數據情報偵查預測的實質是通過機器學習算法挖掘多源異構數據與數據犯罪情勢之間潛在的各種關聯規則,幫助偵查人員精準掌握數據犯罪情勢生存與態勢發展的趨勢規律,從而實現機器學習算法引導數據情報偵查預測的一種新型數據情報偵查方法。這不僅能夠幫助偵查人員降低對多源異構數據情報挖掘研判的過擬合現象,增強挖掘數據犯罪情勢關聯數理關系的精確性,而且還能夠幫助其降低數據情報偵查預測的偏差率和提升機器學習循證數據情報偵查預測的魯棒性,創新和拓展打擊數據犯罪情勢的全鏈條偵查模式。

(一)深度神經網絡算法

深度神經網絡算法主要是依據不同數據的層次序列特征,運算挖掘各數據個體所對應神經網絡模型的加權權重和閾值指標,從而獲得兩者之間親和濃度的一種機器學習算法⑧參見劉繼承、吳昊、王文偉,等:《結合深度神經網絡的特征選擇算法研究》,載《武漢理工大學學報(信息與管理工程版)》2023 年第1 期,第49-53+60 頁。。

首先,獲取數據慣性權值和形成預測抗體群。偵查人員需利用粒子群的更新運算方式預置多源異構數據的數據慣性權值和數據情報偵查預測的粒子維度,形成數據情報偵查預測的抗體群。其次,計算預測親和濃度。采取預測刪除和預測增值的方式對預測抗體群進行迭代處理,再利用粒子群優化算法挖掘獲取不同數據情報偵查預測的親和濃度。再次,高變異克隆處理。偵查人員可采用抗體復制和高親和力的方法對數據情報偵查預測的粒子個體進行高維變異處理,再利用人工免疫算法對其變異程度的系數進行運算挖掘,進而獲取不同數據情報偵查預測的正負高斯函數。最后,獲取最佳預測效益值。對不同數據情報偵查預測的正負高斯函數進行全局性的搜索和降維排序,如果輸出的結果為全局性最佳數據情報偵查預測,那么結束運算;反之,則需要從重新計算預測親和濃度,直至所有多源異構數據被迭代運算結束為止。顯然,深度神經網絡算法不僅能夠幫助偵查人員充分挖掘不同多源異構數據的數據慣性權值,而且還能夠幫助其快速獲取不同數據情報偵查預測的前景效益值,從而提升機器學習數據情報偵查預測的收斂速度。

(二)融合蟻群算法

融合蟻群算法主要是通過選取確定需要進行挖掘的目標數據,利用數據主成分算法對目標數據進行數據區域屬性的關聯聚類,進而挖掘獲取不同目標數據之間關聯規則的一種分布式機器學習算法。

第一,構建數據倉庫。先對各種多源異構數據采取數據集成和數據規約等預處理,根據數據頻繁項目的聚類屬性將其存儲到數據倉庫中。第二,數據主成分運算。偵查人員可利用SPSS 軟件對數據倉庫中不同目標數據進行數據主成分挖掘分析,重點關注重復數據、冗余數據、離群數據等異常數據的成分構成⑨參見張怡平、金文玲、董晨昱,等:《用于高維時序數據預測的非同步尺度主成分分析》,載《山西大學學報(自然科學版)》2023 年第2 期,第321-325 頁。。鑒于不同多源數據在類別形態等方面的差異性,偵查人員需將其進行融合轉換,使其形成統一標準的數據規約格式,然后再采取數據主成分的運算挖掘。第三,測算關聯目標路徑閾值。偵查人員需先構建一個多源異構數據與數據犯罪情勢之間的關聯規則庫,以其坐標中心為數據情報偵查預測的關聯目標,挖掘不同多源異構數據與關聯目標之間的路徑閾值。第四,預設數據蟻群系數閾值。為提升融合蟻群算法挖掘數據情報偵查預測的精確性,需將數據蟻群系數a 和b 的閾值區間設定為[0,1]。第五,獲取預測選擇概率。偵查人員需將多源異構數據的親和濃度設為1,利用蟻群算法中螞蟻覓食的原理挖掘最佳數據情報偵查預測的選擇概率⑩參見圣文順、徐愛萍、徐劉晶:《基于蟻群算法與遺傳算法的TSP 路徑規劃仿真》,載《計算機仿真》2022 年第12期,第398-402+412 頁。,增強機器學習數據情報偵查預測運行效果的正向同配屬性。第六,預測評估與修正。偵查人員可利用XpertRule Miner 軟件對獲取的數據情報偵查預測結果進行評估與修正,如果結果為正向同配屬性關系,那么就說明符合機器學習數據情報偵查預測的價值需求;反之,則需返回至第二步重新運算挖掘,直至所有多源異構數據被迭代運算結束為止。

(三)AHP 權重決策樹算法

AHP 權重決策樹算法主要是依據不同數據迭代運算關聯的決策樹結構性規則,通過運算分析不同數據之間的關聯挖掘矩陣,從而獲取全局最佳數據決策優解的一種權向量機器學習算法?參見高虹雷、門昌騫、王文劍:《多核貝葉斯優化的模型決策樹算法》,載《國防科技大學學報》2022 年第3 期,第67-76 頁。。

第一,預置預測層次目標。偵查人員需將機器學習數據情報偵查預測的預置價值需求進行目標分解,使其形成數據情報偵查預測的層次目標。第二,構建預測層級體系。為使運算挖掘結果與預測的層次目標具有正向同配的屬性關系,依據多源異構數據與數據犯罪情勢之間的關聯規則,需將預測的層次目標再分解為不同的層級體系。第三,構建預測的挖掘矩陣。依據數據情報偵查預測層次目標和層級體系的不同價值作用,偵查人員需將兩者進行分別評價賦分,并構建以多源異構數據為核心的數據情報偵查預測挖掘矩陣。第四,優化AHP 權重參數。在對多源異構數據進行決策樹生成和決策樹修剪過程中?參見于安池、儲茂祥、楊永輝,等:《具有強化學習策略的決策樹算法》,載《合肥工業大學學報(自然科學版)》2021 年第5 期,第616-620 頁。,往往會出現數據情報偵查預測的局部最優解現象。第五,獲取預測的判斷矩陣。依據優化后的AHP 權重參數,偵查人員可利用函數公式對不同多源異構數據進行聚類挖掘,進而獲取不同數據情報偵查預測的判斷矩陣。第六,檢驗和優化預測結果。一方面,檢驗數據情報偵查預測結果與其預置價值需求之間的關系,重點檢驗兩者是否存在正向同配屬性關系;另一方面,將數據情報偵查預測結果與數據犯罪情勢關聯規則、數據情報偵查預測判斷矩陣等進行比較,如果存在局部偏差或全局差異,那么就需要及時進行修正和優化。

(四)圖卷積網絡多源算法

圖卷積網絡多源算法主要是通過對多源異構數據中不同數據節點相似度進行卷積運算挖掘的一種網絡機器學習算法,具有運算魯棒性強、挖掘收斂速度快等價值優勢。

第一,數據預處理。偵查人員需先對多源異構數據采取數據集成和數據規約等預處理,使其形成數據頻繁項目集合的標準RDF 格式。第二,構建數據運算挖掘拓撲圖。以數據頻繁項目集合的標準RDF 格式為基礎,偵查人員可利用多源稀疏數據矩陣來挖掘多源異構數據中不同數據節點之間的加權權重系數,進而構建具有正向型屬性的數據運算挖掘拓撲圖。第三,計算數據實例化張量。對已構建的多源異構數據運算挖掘拓撲圖采取實例化張量計算,計算重點包括數據節點相似度、數據節點矩陣、數據節點標簽等。第四,構建圖卷積網絡多源算法模型。為避免出現局部最優解、數據過擬合等異?,F象,偵查人員選取LeakyRelu 算法對多源異構數據進行非線性運算挖掘,再利用Softmax 函數公式對其進行圖卷積網絡多源算法模型構建,進而提升圖卷積網絡多源算法挖掘的客觀性。第五,構建數據訓練集。依據多源異構數據實例化張量的計算結果,將其輸入到已構建的圖卷積網絡多源算法模型中,并以其相鄰矩陣和特征矩陣為主要依據構建數據頻繁項目聚類集,所獲結果即為所需的數據訓練集。第六,運算數據測試集。依據數據情報偵查預測的相鄰矩陣和特征矩陣結果,偵查人員需要將各種多源異構數據分別代入數據測試集進行運算挖掘,重點挖掘不同多源異構數據與數據犯罪情勢之間潛在的關聯規則,輸出結果即為數據情報偵查預測的挖掘結果。

(五)量子機器進化算法

量子機器進化算法主要是利用量子比特算法挖掘分析不同多源異構數據之間的概率幅閾值,使其相互之間能夠被快速地疊加融合,從而解決關聯規則構建復雜、模糊優勢關系差值少等的一種綜合性機器學習算法。

(六)異構傳感融合目標算法

異構傳感融合目標算法主要是通過提取數據空間特征、數據閾值變換特征等多源異構數據的目標序列特征,從而挖掘和揭示不同多源異構數據目標特征本質屬性的一種融合性機器學習算法。

首先,多源異構數據融合。多源異構數據融合包括多源異構數據的目標特性融合和目標狀態融合兩部分?參見趙春霞、趙營穎、宋學坤:《基于頻繁項集的多源異構數據并行聚類算法》,載《濟南大學學報(自然科學版)》2022 年第4 期,第440-443+451 頁。,偵查人員需先采取數據集成和數據規約等數據預處理技術對多源異構數據進行數據清洗,再利用數據傳感跟蹤技術挖掘不同多源異構數據之間的目標特性和目標狀態,并將兩者按照數據傳感跟蹤關聯規則進行交互融合?參見劉運:《基于循環神經網絡的多源異構大數據融合模型構建》,載《內蒙古民族大學學報(自然科學版)》2021 年第3 期,第204-210 頁。。其次,提取數據目標序列特征。偵查人員可采取直方圖頻譜、傅里葉頻譜、圖像灰度頻譜等數據目標特征技術,運算挖掘不同多源異構數據之間的數據識別目標特征和數據閾值變換特征等數據目標序列特征?參見隗寒冰、白林:《基于多源異構信息融合的智能汽車目標檢測算法》,載《重慶交通大學學報(自然科學版)》2021 年第8 期,第140-149 頁。,促使每一個不同數據目標序列特征都至少包含一個與其他數據目標序列特征存在本質差異的描述屬性。再次,計算數據情報偵查預測權重概率。偵查人員可采取目標沖突閾值來對不同數據情報偵查預測的權重概率進行檢驗評估,如果二者之間的權重概率目標沖突閾值差異較大,那么差異較大的一方為最佳數據情報偵查預測;如果二者之間權重概率的目標沖突閾值相同或接近,那么則需采取關聯聚類的權重沖突融合處理即可。最后,數據情報偵查預測修正。為確保數據情報偵查預測結果的精確性,必然需要對其進行反復的檢驗和修正。偵查人員對利用異構傳感融合目標算法挖掘獲取的不同數據情報偵查預測經過運行檢驗,重點對多源異構數據融合、數據目標序列特征挖掘、數據情報偵查預測權重概率等進行檢驗和修正,進而確保機器學習數據情報偵查預測的客觀性和準確性。因此,異構傳感融合目標算法不僅能夠幫助偵查人員縮短機器學習數據情報偵查預測預置價值與運行效果之間的差異性,而且還能夠全面提升機器學習數據情報偵查預測的精確性和魯棒性。

猜你喜歡
情勢偵查人員異構
試論同課異構之“同”與“異”
芻議合同法的情勢變更原則的適用條件
偵查人員出庭作證問題研究
異構醇醚在超濃縮洗衣液中的應用探索
我國偵查人員出庭作證制度的構建
芻議合同法的情勢變更原則的適用條件
偵查人員出庭作證的困境及完善策略
overlay SDN實現異構兼容的關鍵技術
LTE異構網技術與組網研究
新刑訴法視角下偵查人員出庭作證問題研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合