覃偉榮,勞燕玲
(北部灣大學資源與環境學院,廣西 欽州 535011)
隨著遙感衛星技術的不斷發展,一方面增加了遙感衛星傳感器以及遙感數據類型,另一方面導致數據量急劇增加,對遙感數據的管理以及存儲等帶來了巨大的挑戰[1,2]。同時,由于遙感數據自身具有時空等多維度特征,越來越多的遙感應用開始關注遙感數據集的時間分析和管理,在現有微型數據中心環境下,數據的獲取以及分析存在效率低下等問題,所以對異構遙感數據有效檢測成為當前研究的關鍵問題。
相關專家對此進行了大量研究,并給出了一些較好的研究成果,李新鵬等人[3]通過歷史數據組建多個子森林異常檢測器,同時組建森林異常檢測器,將數據輸入到檢測器中完成數據異常檢測。胡姣姣等人[4]通過抽樣法對不平衡時間數據實施預處理,將經過處理后的時間序列數據轉換為尺度和時間一致的片段,同時將數據輸入到卷積神經網絡模型中完成異常檢測。閆媞錦等人[5]通過含有可訓練遲滯項的門控循環單元對缺失和非規則采樣的時序數據實施建模,采用極值論中的自適應閾值確定合適閾值,最終達到異常檢測的目的。在以上幾種方法的基礎上,提出一種基于3D關聯規則深度學習的異構遙感數據檢測方法。經實驗測試結果證明,所提方法可以有效提升檢測結果,降低檢測時間。
小波變換可以將遙感數據分解為低頻和高頻信息,為了更好地保護遙感數據的細節特征,提出一種基于雙樹復小波的四階偏微分方程數據去噪模型[6,7],模型中兩個關鍵的去噪部分為:
1)對于含有噪聲的原始遙感數據,需要實施二維雙樹復小波分解,分解出包含大量噪聲的高低頻子帶,經過去噪處理的高低頻子帶采用雙樹復小波重構,最終得到去噪后的遙感數據。
2)對復高頻子帶的實部和虛部分別使用四階偏微分模型完成去噪。
在去噪模型中,通過Q-Shift濾波組對含有噪聲的遙感數據實施一維雙樹復小波多尺度分解,分解后灰度梯度比較低的信息即為背景信息,而分解后含有大量噪聲的高頻子帶則為噪聲或者邊緣信息。
雙樹復小波分解的詳細操作步驟如圖1所示。
圖1 雙樹復小波分解流程圖
偏微方程的求解思路主要采用有限差分法完成數值計算,有限差分法的基本操作思路為:
通過一定的步長根據時間和空間完成格網劃分,同時將連續的偏微分方程采用差分近似代替導數的方式劃分為多個代數方程,同時求解代數方程組,獲取各個網格節點的取值。
有限差分法的詳細操作步驟如下所示:
1)將時間和空間區域離散化處理;
2)將各個網格上的導數通過像素灰度值計算,將計算得到的差分作為近似替換;
3)根據推導出的迭代公式,設定最佳迭代次數,同時采用梯度下降法求解[8,9],其中梯度下降流可以表示為式(1)的形式
(1)
式中,p(x,y,z)代表歐拉方程;q代表時間變量;h代表最佳迭代次數。
為了對方程離散化處理,主要借助有限差分法實現。在遙感數據中心點,可以獲取對應的二階差分?h(i,j),具體的計算式為
?h(i,j)=(vxx)i,j+(vyy)i,j
(2)
其中
(3)
式中,(vxx)i,j和(vyy)i,j代表二階差分因子。
將雙樹復小波分解和四分偏微分方程兩者相結合完成遙感數據去噪,詳細的操作流程如圖2所示。
圖2 遙感數據去噪流程圖
1)初始化遙感數據,確定迭代離散化時間和空間步長,設定迭代次數。
2)對含有噪聲的遙感數據實施分解。
3)保留小波系數的低頻部分,獲取二階差分。
4)通過遙感數據的實際情況和噪聲水平選取合適的梯度閾值。
5)計算擴散函數的二階差分。
6)獲取去噪后的高頻小波系數。
7)重構去噪后的高低頻分量,獲取去噪后的遙感數據。
在遙感數據去噪的基礎上,挖掘其屬性特征。選取遙感數據中的多個屬性特征,主要包含波段、紋理以及形狀等條件屬性特征。以下分別對基元特征參數展開詳細描述:
1)相似度:
主要用來衡量灰度共生矩陣元素在行或者列方向的相似矩陣,可以有效反映局部灰度值的相關性。相似度Cor的具體計算式如下所示
(4)
式中,q(i,j)代表矩陣元素值;uxuy代表局部灰度相關性;β1和β2代表度量矩陣的取值。
2)矩形度:
矩形度Compact主要用來描述目標圖像面積和包圍該圖像的最小矩形面積之比,詳細的計算式如下
(5)
式中,Mmerge代表對象的像元數量;nmerge和hmerge代表不同類型的對象像元。
另外,在計算的過程中,還需要使用最小外接矩形(MER),詳細的計算步驟為:
1)追蹤不同基元的四鄰域輪廓,獲取封閉區域;同時計算各個外接矩形面積,存儲各個存儲的長寬以及面積等信息。
2)重復步驟1),同時實施多次旋轉。
3)當完成旋轉之后,計算封閉區域的矩形面積,得到封閉區域的最小外接矩形,同時獲取對應的頂點坐標。
4)根據步驟3)獲取MER的頂點坐標,同時得到矩形的相關形狀特征。
形狀指數主要用來描述對象邊的平滑度ShapeIndex,如式(6)所示
(6)
通過3D關聯規則深度學習主要包含兩個方面的內容,尋找全部的頻繁項集以及通過頻繁項集獲取強關聯規則。其中,強關聯規則需要滿足最小支持度和最小置信度規則。
基于3D關聯規則深度學習的操作步驟如下所示:
1)預處理和挖掘任務存在關聯的遙感數據,對問題具體分析并實施相應操作,構建結構化的數
2)對于數據庫,需要求解全部滿足最小支持度的項目集,即頻繁項目集。
3)形成滿足最小置信度的關聯規則,進而構建規則集。
4)分析并解釋典型的關聯規則。
由于遙感數據量比較大且屬性維數比較多,選擇合適的3D關聯規則深度學習算法是十分重要的。
通過3D關聯規則深度學習算法分別統計式(4)-式(6)所描述的每個屬性特征的期望信息和熵,進而獲取異構遙感數據屬性特征,如式(7)所示
(7)
式中,H(i,j)代表經過挖掘獲取的異構遙感數據屬性特征;Ent(H1)和Ent(H2)代表特征挖掘效率。
以通過3D關聯規則深度學習得到的異構遙感數據屬性特征挖掘結果為基礎,采用計算機視覺常用的詞包模型進一步實施異構遙感數據檢測。過程如下所示:
1)將最優尺度作為判定依據,分割遙感數據,最終獲取對應的數據對象;
2)獲取每一個分割對象的低層特征[10],得到研究對象的底層特征描述符;
3)分別對分割對象的特征描述子進行編碼量化[11]和聚類操作,將處理結果匯聚成特征字典;
4)通過判定依據,獲取與研究對象距離較近的單個異構遙感數據,分別統計每個異構遙感數據出現的次數,進而得到各個研究對象對應的異構遙感數據,統一用詞包表述。
設定遙感數據集可以分割為L個數據集lm,采用聚類獲取r個聚類中心,獲取字典B,將不同的B作為視覺單詞,則有
B={b1,b2,…,bn}
(8)
計算全部異構遙感數據屬性特征和視覺單詞之間的歐式距離,同時將全部距離排序,選取距離最近的單詞,將歐式距離表示為of,則對應的權重計算式為
(9)
式中,?i,j代表權重值。
由于詞包模型忽略了遙感數據之間的空間關系,因此,還需要引入空間關系,對詞包模型進行改進。在原始坐標信息內加入擴展特征,同時組建特征和空間位置共同影響的概率語義模型。為此,提出一種基于金字塔的多尺度詞包模型,借助加權連接方法級聯處理不同尺度下的單詞,詳細的操作步驟為:
1)分割原始遙感數據,獲取多個分割數據集,構建標記矩陣遙感數據集合[12]。分別對原始遙感數據和標記矩陣遙感數據集合展開上下采樣處理,以此為依據組建尺度金字塔。
2)組建視覺詞匯字段,同時計算對應尺度下的異構遙感直方圖。
3)將全部異構遙感直方圖連接,構建聯合直方圖,最終得到對應的權重值。
以下采用基于多尺度詞包模型檢測異構遙感數據,詳細的操作步驟為:
1)通過幾何校正和輻射校正處理遙感數據[13]。
2)采用改進后的詞包模型確定遙感數據的最優分割尺度,同時分割處理遙感數據,獲取分割對象。
3)組建尺度金字塔影像,設定分割對象數量和金字塔層數[14,15],采用鄰域窗口提取分割對象全部像素點的低層次特征,同時設定視覺單詞數量,構建視覺詞典。
4)根據視覺詞典,分別對不同對象展開投影映射,形成視覺直方圖,同時將其加權連接,獲取多尺度直方圖。
5)將全部特征映射到高維單詞空間,最終實現異構遙感數據檢測。
為了驗證所提基于3D關聯規則深度學習的異構遙感數據檢測方法的有效性,進行實驗驗證。
實驗主要選取精確率Precinion、召回率TPR、誤報率FPR以及漏報率MAR作為測試指標,詳細的計算式如下
(10)
(11)
(12)
(13)
式中,TP代表檢測異常且實際異常的樣本數量;TN代表檢測正常且實際正常的樣本數量;FP代表檢測異常且實際正常的樣本數量;FN代表檢測正常且實際異常的樣本數量。
各個方法的檢測性能表示為圖3的形式。
圖3 不同方法的檢測性能測試結果對比分析
分析圖3中的實驗數據可知,由于所提方法對遙感數據實施了濾波處理,將數據中的噪聲濾除,可以有效提升檢測結果的準確性。
以下實驗還進一步分析了各個方法在不同抽樣次數下的異構遙感數據檢測時間變化情況,實驗結果如表1所示。
表1 不同抽樣次數下各個方法的異構遙感數據檢測時間結果對比
分析表1中的實驗數據可知,所提方法可以以更快的速度完成異構遙感數據檢測,其檢測時間最低值與最高值分別為0.52s和1.24s,說明其具有較高的檢測效率。
針對傳統方法存在的一些問題,設計并提出一種基于3D關聯規則深度學習的異構遙感數據檢測方法。經實驗測試證明,所提方法可以有效提升檢測結果的準確性,同時還可以有效降低異構遙感數據檢測時間,獲取更加滿意的檢測結果。由于時間等多方面因素的限制,所提方法仍然需要展開更深層次的研究,確保其各項性能均得到有效提升,例如檢測費用等。