?

基于弧度特征的火箭時序數據相似性評估

2024-03-20 04:31徐海洲李林峰周淦孟令剛
電子技術應用 2024年2期
關鍵詞:弧度度量火箭

曾 騰,徐海洲,李林峰,周淦,孟令剛

(1.華北計算機系統工程研究所,北京 100083;2.西安電子科技大學 計算機科學與技術學院,陜西 西安 710071;3.西安郵電大學 計算機學院,陜西 西安 710061)

0 引言

隨著現代火箭技術的不斷發展與航天發射密度的不斷提高,對火箭飛行狀態快速分析評定,及時發現異常,展開故障診斷已成為航天測試發射領域的迫切需求。遙測參數,作為反映火箭系統工作狀態的重要監控指標,是火箭狀態快速評定的重要依據。然而,現行的遙測數據分析技術多以包絡閾值分析技術結合專家經驗進行。如周輝峰[1]等人提出基于中值濾波的雙邊多點閾值和符號判斷相結合的判讀方法,用于處理遙測參數中的臺階參數、脈沖參數;李鑫[2]等人提出基于雙因子等價權函數的抗差自適應估計算法,對歷史數據進行統計,實現參數的估計和標準差的確定,進而展開遙測緩變參數自動判讀;王義新[3]等人通過建立遙測大數據處理專家系統,利用固化的工程經驗模擬專家思維,對遙測數據進行快速推理診斷。這類方法對數據利用效率較低、特征挖掘不夠深入,時常發生漏判和誤判,難以滿足快評需求。

近年來,時間序列相似性評估在火箭分析中開始得到應用[4-5]。一種常用的分析模式是,將待分析火箭時序數據與執行同任務的火箭歷史數據計算相似度,并為所分析參數設置閾值,將相似度超出閾值的序列判定為異常。異常檢測能力很大程度上取決于度量性能。

時間動態規整(Dynamic Time Warping,DTW)[6]算法因其能比較不等長時間序列,應對時間序列的相位偏移、振幅變化等情況,在現有時序相似性判別方法中最具代表性。然而由于該算法一味追求所對齊時刻的數值相近,容易產生病態對齊現象,將不相似的局部特征對齊,不利于時間序列相似度評估。

針對病態對齊現象,主要有兩個改進思路,一是為DTW 設置限制匹配條件。如CDTW[7]和SparseDTW[8]等算法通過限制DTW 計算區域,將對齊路徑盡量約束在對角線附近;WDTW 算法[9]對匹配相位差進行懲罰;LDTW[10]、FDTW[11]等算法利用限制時間序列之間的對齊路徑長度來抑制病態對齊。為DTW 設置限制匹配條件通常能提高算法精度,但僅從宏觀層面進行約束,難以深入利用數據特征,對度量精度的提升效果有限。

第二種思路是嘗試向DTW 算法中引入形狀類特征,以求更準確地捕捉時間序列之間的局部相似性,獲得數據點的更優匹配。相關算法包括利用一階導數的DDTW 算法[12]、結合一階導數特征和原序列特征的DDDTW算法[13]、考慮時間序列復雜程度的CID 算法[14]、引入數據點鄰域形狀特征的shapeDTW 算法[15]等。但這些算法要么只適用于某一類時序數據集,不具備通用性,要么計算過于耗時,難以應用到實際任務中。此外,對于怎樣的形狀特征最有利于提升度量精度,目前尚未有定論。

為提升度量精度,本文提出一種基于弧度特征的時間序列相似度度量方法RDTW,將原始序列轉化為表征時間序列相鄰數據點連成線段與橫軸之間的夾角的弧度序列,對原始時間序列及弧度序列分別進行相似性計算,并通過設置權重綜合考慮兩種序列所蘊含信息。隨后,以時間序列分類作為應用實例,將RDTW 算法引入KNN 分類中,以評估該度量算法的度量性能。所提出方法可為火箭關聯分析、異常檢測、故障診斷等應用提供有力支持。

1 經典動態時間規整算法

1.1 DTW 算法原理

設有兩個長度分別為n和m的時間序列,Q={q1,q2,…,qn},C={c1,c2,…,cm}。為將兩條時間序列對齊,通常會構造一個n×m的距離矩陣。矩陣中每一個位置(i,j)表示將當前時間序列Q中的點qi和時間序列C中點cj對齊所需要的距離。選取距離矩陣中一連串連續元素,使得兩條時間序列的每個點都能與另一序列上的點建立對應關系,得到一條彎曲路徑。DTW 算法旨在尋求一條最佳彎曲路徑,使得路徑經過的各矩陣元素累計距離和最小。

假設兩條時間序列的最佳彎曲路徑為W={w1,w2,…,wk,…,wK},max (n,m) ≤K≤n+m-1,則DTW距離可按下式計算:

確定彎曲路徑時需滿足3 個約束條件:

(1)邊界條件:w1=(1,1),wk=(n,m);

(2)單調性: 給定wk=(i,j),wk-1=(i′,j′),則有|i-i′ |≤1,|j-j′| ≤1;

(3)連續性: 給定wk=(i,j),wk-1=(i′,j′),則有|i-i′| ≥0,|j-j′| ≥0。

實際過程中,為使累計距離值最小,通常采用動態規劃的方式計算,其公式為:

其中,i∈(1,n],j∈(1,m],且DTW(i,j)表示序列Q前i個點和序列C前j個點之間的最小累積規整距離。DTW(m,n) 即為兩個時間序列之間的動態時間規整距離。

1.2 CDTW 算法原理

傳統DTW 算法需計算兩條時間序列上每個時刻點到另一序列的所有點的距離,但其中存在許多不必要計算。實際生活中,大多數時間序列的最佳對齊路徑都出現在距離矩陣的對角線附近,對所有窗格進行計算不僅極大地增加了算法耗時,同時也可能促進病態對齊現象的產生,導致算法精度下降[16]?;诖朔N考慮,研究者提出CDTW 算法,在求解DTW 距離時只對距離矩陣上限定區域內的窗格進行計算,以求同時達到提升算法效率和精度的目的[17]。常用的限制方法主要有兩種,分別是Sakoe-Chiba band[7]和Itakura parallelogram[18],其示意圖如圖1 所示。由于Sakoe-Chiba band 實現更為簡單,在實際中應用得更為廣泛。

圖1 Sakoe-Chiba band(A) 和Itakura parallelogram(B)

2 基于弧度的相似性計算方法

2.1 時間序列的弧度

定義1時間序列的弧度。時間序列的弧度是指時間序列中相鄰兩點構成的直線與時間軸的夾角弧度,其計算公式如下所示:

其中,n為時間序列的長度,通常取?t=1。當時刻值增加時,弧度取正值;反之,弧度取負值。

根據定義1,對于任意一條長度為n的時間序列Si={(s1,t1),(s2,t2),…,(sn,tn)},通過計算相鄰兩點之間的弧 度,可轉化 為對應 的弧度序列=

2.2 基于弧度的距離

定義2一種基于弧度的距離度量。對于兩條時間序列q和c,其基于弧度的距離按以下公式計算得出:

其中,q′和c′分別是時間序列q和c按照定義1 中式(3)轉換得到的弧度序列;α為平衡原始序列距離和弧度距離的超參數,是[0,1]區間的某一實數。等式右邊所采用的距離度量被稱作基礎距離,該距離可以是任意一種距離度量,通常是DTW 距離或其變種距離。

2.3 基于KNN 算法的改進弧度距離

為評估算法度量精度,將所提出的距離度量應用于KNN 算法,通過分類精度的大小評估度量性能優劣。

鑒于火箭時序數據,尤其是緩變參數數據相鄰時刻的變化值往往很小,在定義2 所定義距離的計算過程中,由于火箭數據原始時間序列和弧度序列數據的量級存在著極大差異,這種由量級造成的不平衡性可能會造成在實際加權時,由原始序列計算出的距離幾乎總是對最終距離貢獻最大的部分,而弧度序列的貢獻則被湮滅。

為使兩種距離在同等層面上進行權衡,結合KNN 算法特性,本文提出一種改進弧度距離計算方式。

定義3一種基于KNN 算法的改進弧度距離度量。給定一個查詢序列q和一個具有m條時間序列的參考時序數據集C,序列q與數據集C中任意一條序列cj的距離由以下公式計算得出:

其中,rankC(q,cj)是序列q和數據集C中所有序列之間的距離中從小到大的排名值。同理可得rankC(q′)。通過該式計算出序列q與C中所有序列的距離,其中最小值所對應的參考序列標簽為算法對序列q的分類標簽。

通過定義3 的計算方式,既保留了查詢序列與各參考序列之間的距離大小關系,又能公平權衡兩種距離對最終結果的影響,從而解決量級造成的數據不平衡問題。

2.4 基于弧度距離的RDTW 算法

在定義3 所提出的基于KNN 算法的改進弧度距離度量的基礎上,提出RDTW 算法。相比原始DTW 算法,RDTW 算法主要有以下幾點改進:

(1)引入弧度特征,將定義3 給出的弧度距離計算方法用于KNN 計算,為每一個參考序列匹配一個分類標簽,得到分類標簽序列。

(2)為提升計算速度和提高度量精度,在求取距離排名的過程中采用CDTW 算法計算每個查詢序列和參考序列之間的距離值。

(3)為捕捉局部形狀特征,借鑒shapeDTW 算法[15]的方式,采用數據點鄰域信息進行距離計算。

(4)對于算法所用到的所有超參數,通過在訓練集上進行留一法交叉驗證結合貝葉斯優化的方式統一訓練。

(5)考慮到有些參數只適合利用原始數據特征或弧度特征進行距離度量,同時使用兩種特征會使度量精度下降,在求解定義3 所定義距離時,對于每條查詢序列,分別維護其與所有參考序列利用原始序列數據和弧度數據進行度量得到的最小值,將最小值對應的參考序列標簽作為該查詢序列僅利用一種特征進行運算獲得的標簽。從而可以獲得單用原始特征、弧度特征和綜合利用兩種特征分類的3 個標簽序列。最后,利用3 個標簽序列評估分類精度,取分類精度的最大值作為算法的最終精度。

算法整體流程圖如圖2 所示。

圖2 RDTW 算法流程圖

3 實驗

3.1 數據集篩選

根據火箭時序數據特征,從UCR 公開數據集[19]中選取9 個具有相似特征的數據集進行算法驗證[20]。其中Sony1、Sony2、ItalyPowerDemand、TwoLeadECG 4 個 數據集與火箭數據中的角度序列類似;Fish、DiatomSizeReduction、TwoLeadECG 3 個數據集與火箭數據中的轉速序列類似;FaceUCR、MedicalImages 以及 FaceFour 3 個數據集與火箭數據中的電流序列類似。9 個數據集的基本信息如表1 所示。數據本身不帶有缺失值,且已經過Z-score 標準化處理。

表1 選取數據集基本信息

3.2 分類結果

利用本文提出RDTW 算法對所選用的9 個時間序列數據集進行分類性能評估。所選用數據集不進行任何額外預處理。采用了歐氏距離ED、DTW 距離、傳統CDTW 距離及shapeDTW 距離等4 種常用距離評估算法作為對比算法。其分類結果如表2 所示。

表2 9 個數據集的分類結果對比

圖3 展示了RDTW 相對于其他測評方法的精度對比圖??梢钥吹?,RDTW 算法在所有數據集上的表現都優于傳統的歐氏距離、CDTW 算法和FDTW 算法,并在九成數據集上優于shapeDTW,特別是在Fish 和TwoLead-ECG 兩個數據集上,提升效果非常顯著。說明弧度特征的引入極大地提升了度量的精度。

圖3 RDTW 與其他算法的分類錯誤率對比

各方法相對于RDTW 在所有數據集上的平均相對錯誤率如表3 所示。所提出算法相對于其他算法,分類性能均獲得了大幅提升,提升幅度在26.04%以上。

表3 各方法的平均相對錯誤率 (%)

3.3 運行時間對比

火箭時序分析對算法的運算效率具有較高的要求,但由于DTW 算法本身具有O(N2)的時間復雜度,運算效率較慢,這使得許多DTW 改進算法不適合應用于火箭時序數據分析。

表4 對比了5 種方法對9 個數據集分類所花費的時間。5 種方法中,歐氏距離耗時最少,其次是CDTW,但兩者分類錯誤率較高。FDTW 和shapeDTW 為提高分類精度,過多地犧牲了運算時間。相比之下,本文提出的RDTW 算法在提升分類精度的同時,對運算效率的犧牲相對較少,綜合看來效果較好。

表4 9 個數據集的分類耗時對比

4 結論

本文提出一種基于弧度特征的時間序列相似度度量方法RDTW,通過綜合利用時序數據的原始序列特征和弧度特征,以求獲得更為準確的相似度度量。為將算法應用到火箭時序數據分析中,從開源UCR 數據庫中選擇了與火箭時序數據特征較為相似的9 個數據集,并利用時間序列分類任務作為評估實例,進行了實驗驗證。將提出的RDTW 與歐氏距離、CDTW、FDTW、shapeDTW 4 個算法進行了對比。對比結果顯示,RDTW 算法既能提升算法的分類精度,又不會造成運算效率的過多犧牲,在絕大多數數據集上能取得較為滿意的效果。

在未來的研究中,對于算法中所涉及的超參數,尤其是鄰域大小的自適應選取是進一步提升分類精度、降低運行時間的一大關鍵。此外,作為一種評估時間序列相似度的算法,該算法可應用到火箭時序數據分析的各種任務,為火箭關聯分析、異常檢測、故障診斷等方面提供有力支持。

猜你喜歡
弧度度量火箭
鮑文慧《度量空間之一》
模糊度量空間的強嵌入
迷向表示分為6個不可約直和的旗流形上不變愛因斯坦度量
不自由
南瓜
希臘:日落最美的弧度
透視奇妙的火箭
地質異常的奇異性度量與隱伏源致礦異常識別
超酷的火箭
弧度制的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合