?

基于優化小波分量的高鐵橋墩沉降異常探測方法

2024-04-15 09:11支君豪龔循強魯鐵定汪宏宇
測繪工程 2024年1期
關鍵詞:模擬實驗準則分量

支君豪,龔循強,楊 忠,魯鐵定,汪宏宇,羅 升

(1.東華理工大學 測繪與空間信息工程學院,南昌 330013;2.東華理工大學 自然資源部環鄱陽湖區域礦山環境監測與治理重點實驗室,南昌 330013;3.南昌鐵路勘測設計院有限責任公司,南昌 330002)

至2020年底,我國高速鐵路已經達到了3.8萬km的總里程數,位居世界第一[1]。在高鐵橋墩的施工過程中,受線路周邊地質等環境影響,可能會引起高鐵橋墩發生異常沉降,從而對高鐵運營和維護造成較大的影響,甚至威脅到人民生命和財產安全[2]。為了確保高鐵的施工和運營安全,防止安全事故發生,保障人民生命和財產安全,有必要針對高鐵橋墩沉降觀測數據中的異常值進行探測和處理[3]。異常值,也稱為離群點,指的是樣本中的一些數值明顯偏離其余數值的樣本點,也可以理解為與大多數數據的分布不一致的數據點[4]。對于高鐵橋墩沉降異常值,主要包括人為因素等干擾產生的觀測粗差和高鐵橋墩受外界因素影響突發形變引起的真實異常值[5]。對于觀測粗差將進行剔除,而對于真實異常值則需要根據施工情況進行實地復查等處理。

目前,常規的基于統計學異常值探測方法包括拉依達準則(3σ)法、四分位距(inter-quartile range,IQR)法和中值絕對偏差(median absolute deviation,MAD)法。其中,拉依達準則法在觀測次數足夠大的前提下,當觀測數據服從正態分布時,分別計算觀測時間序列數據的平均值和標準差,進而通過判定準則確定異常值,然而異常值的存在會造成觀測時間序列數據的平均值和標準差發生偏離,從而導致異常值探測效果不理想[6]。吳浩等提出了一種改進型3σ粗差探測方法,利用小波分解出的高頻系數計算得到觀測數據的中誤差估值σ,結合3σ來評判該點異常的可能性[7]。IQR法是一種簡便的統計分析方法,其中位數和四分位距不易受異常值影響,通過穩健Z得分探測觀測時間序列數據中的異常值,但當觀測時間序列數據離散程度較大時,其四分位間距也會隨之增大,導致對偏離程度較小的異常值探測效果減弱[8]。MAD法是一種具有魯棒性的穩健統計方法,假定觀測時間序列數據服從正態分布,通過利用數據中的中位數進行計算,中位數比標準差和平均值更能適應數據中異常值的影響,然而MAD法的參數是通過經驗值設置,參數選取較大或較小都會導致探測效果不理想[9-12]。

然而,傳統異常值探測方法均存在沒有充分挖掘原始時間序列數據的內在發展規律等不足。王威等提出了一種基于小波分析的衛星鐘差數據預處理方法,通過對小波分解得到的高頻分量和低頻分量進行預處理,從而提高異常值探測效果[10]。因此,為有效探測出高鐵橋墩沉降監測數據中的異常值,文中提出一種基于優化小波分量的高鐵橋墩沉降異常探測方法,通過模擬實驗以及工程實例實驗,對比分析傳統方法和其他組合方法,驗證文中方法的有效性和準確性。

1 原理理論與方法

在拉依達準則法的基礎上,文中通過對傳統異常值探測方法及其它組合方法進行對比研究。下面簡要介紹拉依達準則、四分位距法和中值絕對偏差法異常值探測方法原理。

1.1 拉依達準則

(1)

根據貝塞爾公式求得其標準差s為:

(2)

式中:n為觀測樣本數量。

1.2 四分位距法

假設存在一組離散的觀測時間序列樣本Xn={x1,x2,x3,…,xi,…,xn},將其從小到大依次排序后,根據觀測數據中值M和IQR對觀測時間序列數據分布進行分析[12]。IQR代表高四分位數和低四分位數之差,計算方法為:

IQR=Q3-Q1.

(3)

式中:Q3、Q1分別為高四分位數和低四分位數。

穩健Zi得分統計量表示為:

(4)

式中:M為觀測時間序列數據中位數,SIQR表示為標準化IQR,SIQR=0.741 3×IQR。

當Zi>3時,則認為xi為異常值,反之則認為xi正常。

1.3 中值絕對偏差

假設存在一組觀測時間序列樣本,Xn={x1,x2,x3,…,xi,…,xn},并服從正態分布,MAD表示為:

MAD=b|xi-median(x)|median.

(5)

式中:b為一個常數,通常取1.482 6[13-14],median(x)為觀測時間序列樣本x中位數。

觀測序列每一個數據對應的Z得分為:

(6)

當Zi>5時,則認為xi為異常值,反之則認為xi正常[10]。

1.4 基于優化小波分量的高鐵橋墩沉降異常探測方法

小波分析獨特的多分辨率分析性質,使其在信號處理、圖像處理與傳輸等方面應用廣泛。小波分析能夠對原始信號進行分解從而得到低頻近似分量和高頻細節分量,從而分離出有效信息和干擾信息,進而進行信號分析[15-16]。其中低頻近似分量中主要包含了原始數據的內在發展趨勢等特性,而高頻細節分量包含原始信號中的瞬態等特性[17-19]。

小波函數是小波分析中的重點環節,小波函數是一種能夠迅速衰減到零的一類函數。存在信號f(t)∈L2(R),其連續小波變換(continue wavelet transform,CWT)表示為:

(7)

然而對原始數據進行小波分解會出現低頻信號存在噪聲和高頻信號有效信息提取不充分的問題。因此,為解決此類問題,文中基于小波分析的優勢,提出一種利用優化小波分量結合改進拉依達準則法進行異常值探測。圖1為沉降異常值探測技術路線,具體步驟如下:

圖1 本文所提方法技術路線

1)選擇合適的小波基函數和分解層數對原始數據Xn進行小波分解。db5小波基具有較好的正則性和緊支撐性,且能夠有效分離有用信息和噪聲信息,因此本文選擇db5小波基進行實驗。選擇過高或過低的分解層數都不利于小波進行信號重構,因此需要確定有效的分解尺度[20]。在確定分解尺度的過程中,采用均方根誤差(RMSE)作為判斷標準,RMSE表示為:

(8)

2)利用小波分解獲取第1、2層高頻分量系數,計算中誤差估計σ為:

(9)

3)優化小波分量。在對沉降數據進行小波分解得到低頻近似分量系數ai和高頻細節分量系數dj后,以低頻近似分量系數的中位數m作為判別系數,表示為m=median|ai|,當|ai|>m/3時,則認為該點為異常值,取低頻系數中位數對其進行填補;在高頻細節分量系數中,計算每一層方差σj=median{|di|/0.674 5},當|dj|>3σj時,則認為該點為異常值,并取該層高頻系數中位數對其進行填補。

(10)

2 實驗設計

2.1 模擬實驗設計

為了驗證文中所提出方法的有效性,通過模擬實驗構造高鐵橋墩沉降觀測數據。在模擬實驗中,首先隨機生成100組服從正態分布N(0,σ2I)的數據作為原始觀測數據,其中σ=0.3,I為單位矩陣。其中模擬實驗數據由MATLAB軟件生成,如圖2所示。

圖2 模擬的原始觀測數據

根據異常值在觀測數據中的數量通常不超過10%的原則[21],文中采用兩種方式進行模擬實驗:①固定異常值數量為5(即異常值數量占總觀測值的5%),系統地改變異常值大小;②固定異常值大小為7σ,系統地改變每次觀測量中異常值的數量。為保證模擬實驗的可靠性,文中將1 000次重復實驗的結果取平均作為最終結果。

2.2 工程實例

文中選取常益長高鐵項目沅江特大橋某橋梁墩沉降觀測數據作為研究對象。由于沅江特大橋橋梁主跨施工區域水文和地質條件十分復雜,導致獲得的觀測數據序列不可避免地包含異常值。選取該點位觀測日期為2020年11月至2021年2月共87期沉降數據,觀測時間間隔為1 d。如圖3所示。

圖3 原始觀測數據

3 實驗結果與分析

采用模擬數據和真實數據進行實驗,通過對比IQR法、MAD法、拉依達準則法(3σ)、小波分析-IQR法(WT-IQR)、小波分析-MAD法(WT-MAD)、小波分析-拉依達準則法(WT-3σ)、小波分析-中誤差估計-拉依達準則法(WT-3σ-ME)和優化小波分量-中誤差估計-3σ法(Proposed)對異常值探測效果進行對比和分析。

3.1 模擬實驗結果與分析

首先通過模擬實驗討論文中所提方法的有效性。采用文中提出的方法對模擬數據進行異常值探測,并將其與傳統異常值探測方法和其它組合方法進行比較。

3.1.1 模擬實驗1的結果與分析:異常值大小不同的影響

圖4表示在異常值大小不同時不同方法探測得到的異常值數量。從圖4中可以看出,隨著異常值逐漸增大,所有方法探測出的異常值數量都呈現上升趨勢。在探測異常值數量的效果方面,文中方法能夠在異常值大小為6σ以上的異常值探測效率接近100%,而其他方法在異常值大小為8σ以上或更大范圍的探測效率接近100%,這表明文中所提出的方法在異常值探測效果方面均優于其他方法。在異常值大小從3σ增加到7σ時,由于受到異常值的影響,使得原始數據的中誤差偏大,從而造成拉依達準則對偏離相對較小的異常值探測效果不理想;IQR法主要是從時間序列整體發散程度來探查其極端異常值,但忽視了原始數據的潛在發展規律,從而導致對偏離相對較小的異常值不夠敏感。文中所提方法是在小波分析的基礎上對小波分量進行優化處理,從而能夠更加準確地提取原始數據變形趨勢,且由小波分解的高頻細節分量所計算的中誤差估計值不易受異常值影響,相比于傳統小波分析組合方法更能體現實際觀測精度,從而提高異常值探測的精確度和準確度。

圖4 模擬實驗中異常值大小不同時探測到的異常值數量

3.1.2 模擬實驗2的結果與分析:異常值數量不同的影響

圖5表示在每一模擬實驗觀測量中的異常值數量從1增加至10時,文中所提方法和對比方法所探測到的異常值數量。從圖5能夠看出文中所提出的方法和IQR法以及MAD法都能夠有效探測出大部分異常值,但文中所提出的方法在探測數量方面優于IQR法和MAD法。小波分析-IQR法(WT-IQR)、小波分析-MAD法(WT-MAD)和小波分析-拉依達準則法(WT-3σ)在異常值數量從1增加至5時,3種方法探測的異常值數量逐漸增加,但探測效果并不理想,而當異常值數量從5增加至10時,3種方法的異常值探測數量卻逐漸減少;而小波分析-中誤差估計-拉依達準則法(WT-3σ-ME)在異常值數量從1增加至9時,探測出的異常值數量逐漸增加,而當異常值的數量從9增加至10時,探測出的異常值數量逐漸減少,這是因為這4種方法在對原始數據進行小波分析后得到的低頻分量存在噪聲和高頻分量未被利用的有效信息。而拉依達準則法在異常值數量從1增加至7時,探測出的異常值數量逐漸增加,但對異常值也不夠敏感且在異常值數量從7增加至10時,探測出的異常值數量逐漸減少,這是因為隨著異常值數量的增加,異常值會對原始數據的中誤差產生較大偏離從而導致探測效果不理想。

圖5 模擬實驗中異常值數量不同時探測到的異常值數量

3.2 工程實例結果與分析

從圖2可以看出,原始觀測數據中的異常值的范圍較大,分布相對較為離散。文中分別采用IQR法、MAD法、拉依達準則法、小波分析-IQR法(WT-IQR)、小波分析-MAD法(WT-MAD)、小波分析-拉依達準則法(WT-3σ)、小波分析-中誤差估計-拉依達準則法(WT-3σ-ME)和優化小波分量-中誤差估計-拉依達準則法(Proposed)對圖2所示的觀測時間序列數據進行異常值探測,與模擬實驗相同,采用db5小波基進行實驗,根據式(7)求得最佳小波分解層數均為2,探測結果如表1所示。圖6為文中方法在沉降觀測數據中的異常值探測結果。

表1 工程實例的異常值探測數量及中誤差估計值

圖6 文中方法沉降觀測數據異常值探測結果

從表1可以看出,IQR法、MAD法、WT-IQR法和WT-MAD法并不能夠探測出原始數據中存在的異常值,3σ法、WT-3σ法以及WT-3σ-ME法僅探測出一個異常值,而文中所提出的方法能夠有效探測出更多的異常值。從圖6可以看出,文中方法對偏離程度較小的異常值也能夠進行有效探測。為了進一步驗證文中探測方法的有效性,分別計算了3σ法、WT-3σ法、WT-3σ-ME以及文中方法的中誤差估計值。在探測出的異常值數量方面,文中方法探測出的異常值數量優于其它方法;在計算的中誤差估計值方面,文中方法計算得到的中誤差估計值優于傳統方法及其它小波組合方法,相比于其它方法的中誤差值降低了12.09%,降低了殘差受異常值干擾而不能正確得到中誤差估計值的影響,說明文中方法更加穩健,進一步表明采用文中方法進行異常值探測更加有效。

4 結 論

由于高鐵橋墩沉降觀測條件的不穩定性和復雜性,可能會遇到沉降觀測數據中存在部分異常數據的情況,然而常規的基于統計學的異常值探測方法探測結果并不理想。為了解決這一問題,提出了一種基于優化小波分量的高鐵橋墩沉降異常探測方法。通過模擬實驗和工程實例進行對比和分析,結果表明文中所提出的方法在保證能夠有效探測出異常值的同時,對偏離程度較小的異常值探測效果明顯,相比于單一方法具有較大的優勢,能夠更好適應高鐵橋墩沉降觀測項目需求,具有一定的實際應用價值。

猜你喜歡
模擬實驗準則分量
帽子的分量
具非線性中立項的二階延遲微分方程的Philos型準則
斷塊油藏注采耦合物理模擬實驗
論《哈姆雷特》中良心的分量
分量
輸氣管道砂沖蝕的模擬實驗
基于Canny振蕩抑制準則的改進匹配濾波器
射孔井水力壓裂模擬實驗相似準則推導
一圖讀懂《中國共產黨廉潔自律準則》
彈道修正模擬實驗裝置的研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合