?

基于原型與主動學習的天波雷達干擾檢測方法

2023-12-18 08:20唐洪濤羅忠濤李史燦
雷達科學與技術 2023年6期
關鍵詞:圖庫置信度原型

唐洪濤,羅忠濤,李史燦,曹 健

(1.重慶郵電大學通信與信息工程學院,重慶 400065;2.南京電子技術研究所,江蘇南京 210013)

0 引 言

天波超視距雷達(Over-the-Horizon Radar,OTHR)利用電離層反射高頻電磁波,可以探測到視距以外的目標,有效作用距離可達3 500 km[1]。由于其工作頻段(3~30 MHz)常有突發性干擾,天波雷達一直面臨干擾分析與處理問題。外部干擾可對距離-多普勒(Range-Doppler,RD)圖造成不同形態的污染,其中最為典型和嚴重的是瞬態干擾與射頻干擾,因為它們能污染整幅RD 圖,嚴重降低天波雷達的目標檢測能力。

傳統干擾檢測主要是基于統計信號處理方法,研究重點在于干擾特性所在的時頻域[2-4],而非與目標檢測直接相關的RD 圖。羅忠濤等人于2021 年提出將干擾檢測問題轉換為RD 圖分類的新思路,研究了基于RD 圖的瞬態干擾和射頻干擾識別方法[5-6]。最近,東松林等人使用深度學習模型框架實現基于RD圖像的射頻干擾識別[7]。不同于在傳統信號域做干擾檢測,基于RD 圖識別干擾可以只篩選嚴重干擾,忽略對目標檢測不構成威脅的微弱干擾。

不過,現有的干擾檢測方法對于OTHR實際運用仍有待改進。1)利用實測數據的未標記RD 圖,應能有效提升干擾檢測性能,但檢測方法應該如何設計;2)現有的RD 圖訓練集及實測圖集難免存在冗余樣本,既會降低算法運行速度,又影響干擾檢測精度。為此,本文引入原型數據與主動學習策略,為OTHR優化設計RD圖干擾檢測方法。

主動學習策略通過引入專家知識,利用待測樣本價值來提升分類性能[8]。主動學習策略會查詢難以判決的測試樣本,交由專家標記后再加入訓練樣本集。龍軍等人根據獲取測試樣本的形式不同,將主動學習算法分為基于池或基于流的兩種類型[9],前者的選擇引擎是從未標記樣本集合中查詢要標注的樣本;后者的選擇引擎則按先后次序查詢未標記樣本并決定是否標注。本文通過分析OTHR工作場景,認為基于流的主動學習策略適合檢測干擾。

考慮樣本冗余問題,本文采用原型學習方法來精簡訓練集?!霸汀北硎緲颖究臻g中具有代表性的數據點[10],原型選擇的目標是從原始訓練集中選擇一個具有代表性的集合,其規模比原始訓練集更小,但測試分類精度相近甚至更高[11]。原型選擇方法可分為剪輯法、壓縮法以及混合法。壓縮方法通過去除冗余樣本保留原型數據集[12];剪輯方法旨在濾除內部噪聲,平滑分類邊界[13];混合法通常使用剪輯法濾除噪聲樣本,然后使用壓縮法保留代表性的實例[14]。本文針對OTHR 工作場景,研究基于壓縮法的數據流原型學習過程,實現逐個樣本的原型學習與更新。最后,結合原型數據與主動學習策略,設計天波雷達干擾檢測方法。

1 問題描述

現有基于RD 圖識別的天波雷達干擾檢測方法,采用基于監督學習的圖像分類原理,主要有“RD 灰度圖生成-紋理特征提取-模式識別算法分類”三步。干擾檢測器的設計思路是:使用干擾信號建模的仿真RD 圖像組成訓練圖庫,使用紋理特征算子提取不同干擾類別的紋理特征,再使用支持向量機等模式識別算法,組建成RD 圖像分類器,完成干擾檢測任務。目前,在現有RD圖庫中該分類器的干擾檢測準確率可以達到90%以上[15]。

不過,考慮將上述方法用于OTHR工作場景的實測數據處理,發現了新的問題。首先,實測RD圖尺寸多變,而原有仿真RD 圖尺寸固定。原有仿真圖像的尺寸為一般數據,分辨率為256×256。但是,實測RD 圖像尺寸變化多樣,可能為長條形,分辨率更低,如圖1所示。使用原有方法對此類實測圖的檢測準確率達不到預期效果,為此需設計更貼合實際OTHR工作場景的檢測算法。

圖1 仿真與實測RD灰度圖

其次,現有方法是基于監督學習,結合OTHR實際工作可以采用新的方法。1)為減少錯誤檢測,希望用實測圖補足訓練集。將難以判決的樣本交給專家標注并加入到訓練集,是提高干擾檢測準確率的重要思路。2)訓練圖庫樣本存在冗余問題,主動學習樣本也會引起冗余,冗余樣本的存在會直接影響檢測效率。

為此,本文結合原型數據與主動學習策略設計干擾檢測方法。首先,引入原型數據學習方法,去除訓練集中冗余樣本,并在主動學習過程中進行原型學習與更新。其次,引入基于流的主動學習策略進行干擾檢測工作?;诹鞯膶W習策略不對未標記樣本作排序比較,而是對流入樣本逐一作評估,將滿足條件的樣本進行專家標注。

2 原型數據集學習與更新

RD 圖集由訓練集與測試集兩部分組成,其標簽分為有/無干擾兩種。訓練集可采用仿真圖庫,其生成是基于信號模型的仿真數據。無干擾建模為復高斯白噪聲,干擾信號模型及圖庫建設方法可見文獻[5]與文獻[15]。實測數據則來源于某OTHR實驗數據。

通過信號模型和參數調整,仿真圖庫的樣本數量已近2 000,且明顯存在圖片冗余。實測圖像數據是不斷積累的過程,雷達只要工作就能搜集。因此,圖庫精簡是很有必要的。

2.1 原型數據集介紹

原型數據學習的主要原理是基于數據密度與初始半徑生成原型數據,其學習過程是無參數、無迭代過程且完全由數據驅動的[16]。當給定訓練集有C個類別時,與之相應的就會產生C個原型數據集,每個原型數據集由同一類別的圖像特征構成。不同類別的原型數據集之間互不影響,且能獨立完成數據更新。針對本文任務,干擾情況分為有、無兩類,故C=2。圖2展示了RD圖庫的原型數據學習方法。

圖2 訓練集原型數據學習

圖2的干擾樣本原型集中,每個圓圈表示一個數據云,紅點表示流入的特征向量。以(c,n)表示第c類別的第n個數據云,每個數據云的數據結構包括:一個具有代表性的原型數據Pc,n;數據云中心pc,n,即數據云中所有特征向量的均值;數據云半徑rc,n,由初始半徑與云中數據密度所決定;數據云中的數據數目Sc,n。

2.2 原型數據結構生成

本節介紹單個原型數據集學習過程,共分3步。各原型數據集之間彼此獨立。

步驟1:參數初始化

第c個原型數據集由c類訓練樣本中第1 幅圖像Ic,1進行初始化,由xc,1表示圖像Ic,1的特征向量,維數為d,首先對全局特征向量進行向量歸一化,即

向量歸一化操作有助于克服“維度災難”,因為兩個歸一化數據之間的歐氏距離可以轉換為向量之間的余弦不相似度[17]。

然后對系統的元參數初始化,即

其中:k為目前已流入的實例數;μc為第c類中所有樣本的特征平均值;Nc為已識別的原型數量;r0是一個較小的值來穩定新形成數據云的初始狀態,本文使用定義數據云邊緣相似度。

數據云非常類似于集群,但它是非參數的,沒有預先確定的規則形狀,而是直接表示觀測數據樣本的局部集成性質。數據云中原型數據Pc,n是特征空間中數據局部密度的峰值。

步驟2:準備工作

將新到達的第c類第k個訓練圖像表示為Ic,k,首先對其特征向量進行向量歸一化則全局均值μc更新為

隨后計算所有現有原型Pc,n及新圖像Ic,k的數據密度,分別是

步驟3:更新原型及其參數

本階段更新系統結構和元參數以適應新到達的圖像。檢查密度條件判斷Ic,k是否成為一個新的原型,密度判別條件為

若滿足密度判別條件,則圖像Ic,k被設置為一個新的原型,并初始化為一個新的數據云,有

若不滿足密度判別條件,需判斷是否建立新的原型。查找距離圖像Ic,k的最近原型,為

使用鄰域條件判斷Ic,k是否位于Pc,n的影響區域。鄰域判別條件為

若滿足條件式(8),則Ic,k歸為原型Pc,n所屬的數據云,其數據結構更新如下:

然后,重復步驟2,讀取下一幅圖像。在所有訓練樣本處理完畢后,生成原型數據集。

原型數據集生成過程如圖3 所示。在本文方法中,不僅原始訓練集會作原型學習,主動學習過程中加入的測試樣本及其標簽也會加入原型學習,因此原型數據集及其參數會隨著學習過程持續更新。

圖3 原型數據集生成與更新算法(算法1)

3 主動學習策略與干擾檢測方法

3.1 基于原型數據的圖像分類準則

RD 圖庫中標簽為有/無干擾兩種類別,經訓練階段生成彼此獨立的兩個原型數據集,使用原型數據集對待測圖像進行逐個測試?;谠蛿祿腞D 圖像分類過程如圖4 所示,分為圖像處理與圖像分類兩個階段。

圖4 基于原型數據的RD圖像分類過程

1)圖像處理

本階段首先完成圖像預處理工作。信號模型所仿真RD圖尺寸為256×256,但實測RD圖尺寸比例有所差別,導致原有分類器精度急劇降低[15]。為使實測RD 圖特征更接近于仿真RD 圖,將不同尺寸大小的實測RD 圖復制拼接,達到仿真RD 圖尺寸大小。RD 圖干擾分類的根本依據在于紋理特征不同,將不同尺寸大小的實測RD 圖進行復制拼接對整幅RD 圖像的紋理特征形態影響較小,進而對干擾檢測的影響可忽略不計。

因為RD圖像有/無干擾時具有不同紋理,因此紋理特征可用于分類器設計。已有工作經驗發現,局部二值模式(Local Binary Pattern, LBP)特征算子對RD圖干擾檢測具有較好效果[6]。因本文研究重點在于分類算法的設計,所以采用表現較優異的LBP 特征算子完成特征提取,其參數圓形領域半徑R設為1,領域內像素點個數Q設為8。設待測圖像I經圖像處理過程后,得到對應的特征向量x。

2)圖像分類

特征向量x針對每類原型數據集,生成對應的置信度分數,再比較各類置信度分數,判決得出預測標簽。

圖像I的特征向量x在第c類原型數據集中的置信度分數λc(I)計算式為

因此,在RD 圖測試過程中每幅圖像I可以得到一個置信度分數向量:λ1×2(I)=[λ1(I),λ2(I)],對置信度分數向量作比較,得到預測標簽。

簡言之,預測標簽為測試圖像在不同原型數據集中最高置信度分數對應的類別。

3.2 基于原型數據與主動學習的干擾檢測方法

主動學習側重于查詢信息量大的樣本,將測試樣本中容易判錯的實例交由專家標注,即通過一個互動交互過程引入額外專家知識[18]。本文將基于原型數據集,采用置信度衡量來檢測干擾,并引入主動學習策略,查詢信息量大的測試樣本作人工標記后再加入訓練集。

本文采用基于流數據的主動學習方法,源于對OTHR 實際工作考慮。天波雷達常常是每隔數秒接收1幀,每幀可有數十幅RD圖像,干擾隨時可能出現在任意一幀,具有很大的隨機性。因此,基于流的主動學習可以直接處理當前幀當前圖像,無需等待后續數據跟進,適合OTHR 的實時處理需要。

本文設計的主動學習分類器的工作思路是:針對每幀各幅RD 圖像,查詢是否滿足學習條件;如是,則將其加入緩沖池,專家每隔K幀對緩沖池樣本作人工標注,并對其結果進行原型學習與更新;否則,對該幅圖像進行標簽預測。

設U為測試樣本集,P為待標記樣本緩沖池,k為當前測試圖像幀序號,基于流的主動學習步驟如下:

步驟1:以第k幀第m張圖像Ukm為當前待測圖像,提取其特征x,根據公式(10)計算置信度分數λ1(Ukm),λ2(Ukm)。

步驟2:判斷置信度分數是否滿足判別公式

式中γ是一個超參數,γ>1。置信度分數相差越小,表示該圖像不確信程度越高,信息量越大。若待測圖像滿足置信度判別條件,則加入到緩沖池P中;否則讀取下一幅圖像,并返回步驟1。

步驟3:查詢當前檢測幀數k是否為K的整數倍。如是,則將緩沖池P樣本集交由專家標注,并作原型學習,之后將緩沖池清零。否則,讀取下幅圖像,并返回步驟1。

最終,基于原型數據集與主動學習的干擾檢測流程如圖5 所示。首先對原始訓練集作原型學習,生成原型數據集,再基于原型數據進行測試集的主動學習與干擾檢測工作。由式(12)判斷待測圖像是否值得學習;不學習的待測圖直接根據式(11)作干擾檢測標簽預測;要學習的圖像經過人工標記后進行原型數據學習更新。

圖5 基于原型數據與主動學習的干擾檢測流程

4 仿真對比

4.1 數據集介紹

本文實驗的RD 圖庫由訓練圖庫與測試圖庫兩部分組成,樣本數量如表1 所示。其中,訓練圖庫采用仿真RD 圖,實測圖庫采用OTHR 的1 658幀實測RD圖。

表1 RD圖庫樣本數量

4.2 實驗設計與結果

對于天波雷達來說,錯誤檢測可能是干擾的漏檢或虛警。本文以干擾檢測準確率與檢測概率作為性能評價標準。

檢測準確率反映全體樣本分類精度,定義為:正確分類樣本數除以測試樣本總數。

檢測概率針對每個類別單獨計算,定義為:某類別正確分類數除以該類別測試樣本總數。

為驗證原型和主動學習方法的有效性,本文采用相同特征算子參數、訓練集與測試集,對5 種干擾檢測方案作對比分析。

本文方法:作原型學習,且引入主動學習策略,即本文所設計基于原型與主動學習的干擾檢測方法,其中參數設置為γ=1.01,K=100。

最近鄰監督(簡稱“近鄰監督”)方法:基于初始訓練集,直接使用最近鄰算法做干擾檢測工作[15]。

原型監督(簡稱“原型監督”)方法:對初始訓練集作原型學習,但不作主動學習,對測試圖作干擾檢測。

原型半監督(簡稱“原型半監督”)方法,對初始訓練集和學習樣本作原型學習與半監督學習,半監督學習策略是將式(12)的條件更改為λ1(Ukm)/λ2(Ukm)>γ'或λ2(Ukm)/λ1(Ukm)>γ',其中超參數γ'設為1.1。

原型隨機采樣(簡稱“原型隨機”)方法:依然采用原型學習,在干擾檢測過程中隨機抽選部分圖像加入緩沖池,最終所選樣本數與本文主動學習樣本數相接近,每隔K幀作人工標記并加入訓練集,K值設為100。本實驗可驗證本文主動學習策略對干擾檢測的性能提升程度。

圖6 展示了5 種方案工作累計的檢測準確率與檢測概率,表2比較了它們的兩類樣本學習數量與訓練樣本量(原型數據保留量)。

表2 5種方法的學習樣本量與訓練集樣本量

圖6 干擾檢測準確率與檢測概率

4.3 結果分析

分析圖6與表2數據,可知:

1)原型監督與近鄰監督方法相比,原型學習將訓練樣本量由1 968 縮減至463,同時檢測準確率由87.96%提升至89.97%。說明了原型學習方法在減少訓練集冗余樣本上的有效性。

2)與原型監督相比,原型半監督方法雖然自主學習了部分高置信度樣本,但檢測準確率與檢測概率無明顯改變。

3)與近鄰監督方法相比,本文方法在測試過程中學習2 243 個未標記樣本,但最終訓練集原型量為847,仍小于近鄰監督方法的訓練集樣本量。并且,檢測準確率由87.96%提升至97.42%,干擾檢測概率由76.43%提升至89.31%,無干擾類別檢測概率由91.18%提升至99.34%。

4)與原型監督方法對比,本文方法通過主動學習,只多了384 個原型保留量,但檢測準確率和干擾檢測概率均有大幅提升,無干擾類別檢測概率有小幅提升。

5)原型隨機標記方法也能提高檢測準確率和干擾檢測概率,但是效果不如本文方法。這說明,在干擾檢測工作中,樣本越是難以判決,所含信息量越大,人工標記帶來的幫助越大。

綜上所述,本文引入主動學習方法,通過人機交互過程提升干擾檢測準確率,并使用原型學習方法保證訓練集的精簡性。在天波雷達實際工作中,雷達工作者可在累積標注一定數量的實測樣本后停止標記,因為此時的算法模型已具備較優的檢測性能。

5 結束語

RD 圖像識別是天波雷達檢測干擾的一個新思路。為了使天波雷達能夠有效利用實測RD 圖像,本文結合原型數據設計了一種具有主動學習能力的干擾檢測方法。原型數據學習不僅能夠大幅減少原有仿真訓練集樣本量,而且在主動學習過程中進行持續更新,最終保持一個較小的訓練原型數量。實測數據的實驗表明,本文引入原型和主動學習策略后,所設計干擾檢測方法相比傳統最近鄰監督學習方法,檢測準確率提升約10%,其中干擾檢測概率提升約13%,無干擾檢測概率提升約8%。本文方法可對RD 圖像進行逐幀逐樣本檢測,適用于天波雷達的實際工作場景。

猜你喜歡
圖庫置信度原型
金山農民畫矢量圖庫的建設與應用
硼鋁復合材料硼含量置信度臨界安全分析研究
包裹的一切
《哈姆雷特》的《圣經》敘事原型考證
正負關聯規則兩級置信度閾值設置方法
視圖庫在AI浪潮里的發展應用
Photoshop CC圖庫面板的正確打開方法
論《西藏隱秘歲月》的原型復現
原型理論分析“門”
置信度條件下軸承壽命的可靠度分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合