?

基于三步搜索法的LSSVM在GPS高程擬合中的應用

2022-07-12 13:59
測繪標準化 2022年2期
關鍵詞:中心點適應度步長

朱 華

(南京安廈房屋安全鑒定檢測事務所有限公司 江蘇南京 210029)

GNSS技術在工程測量中被廣泛應用,然而GNSS采用的是大地高,與我國規定的正常高之間存在高程異常,可以通過高程擬合來實現兩者的轉換。

最小二乘支持向量機(LSSVM)是一種數據分類和回歸工具[1],基于結構風險最小化原則,將最小二乘估計引入支持向量機中,采用等式約束代替不等式約束,訓練過程轉化為求解線性方程組,避開了二次歸化問題,求解速度加快,不需要指定逼近精度[2-3]。

LSSVM參數的取值在很大程度上決定了模型的學習和泛化能力,目前還沒有切實可行的參數調節方法。

本文采用三步搜索法對LSSVM參數進行優化選擇,并用參考文獻[3]的GPS觀測數據,對適應度函數采用學習樣本、測試樣本和總樣本均方誤差的擬合效果進行分析比較。

1 LSSVM機及三步搜索法

1.1 LSSVM

給定M個訓練樣本的集合{xi,yi}(i=1,2,…,M),xi∈Rn,yi∈R。根據結構風險最小化原則,回歸問題可表示為約束優化問題。

(1)

式中:權矢量w∈Rn,φ(x)是將x從輸入空間映射到高維特征空間的函數,誤差項ε∈R,C為正則化參數,b為偏差量,s、t、y是約束條件。

引入Lagrange乘子αi,將式(1)轉化為無約束目標函數:

(2)

結合式(1)中的約束條件對式(2)進行優化,可得

(3)

式中:α=(α1α2…αM)T,Ω=[φ(x1)φ(x2) …φ(xM)]T,Y=(y1y2…yM)T,I=(1 1 … 1)T。

通過引入滿足Mercer條件的核函數K(x,xi),代替非線性擬合的ΩΩT內積運算,得到最小二乘支持向量機的回歸函數:

(4)

1.2 三步搜索法

LSSVM核函數選擇徑向基核函數時,正則化參數C和核函數寬度σ的取值在很大程度上決定了模型的學習和泛化能力。

確定C和σ的取值范圍,若C和σ的取值點分別有NC和Nσ個,采用完全搜索法則需要計算NC×Nσ次。而相對于完全搜索法,三步搜索法計算簡單,性能良好,能有效降低計算次數,縮短建模時間。采用三步搜索法首先需要確定步長。在由C和σ構成的二維平面中,通常設定三步的步長之和為平面邊長的一半。三步搜索法的操作步驟如下:

第一步:首先找到中心點及其周圍8個點,然后計算每個點的適應值,選擇適應值最小的點作為新中心點;

第二步:將步長減小一半,計算新中心點周圍8個點的適應值,然后選擇適應值最小的點作為下一個新的中心點;

第三步:重復第二步,直至步長小于一個單位。

若學習精度沒達到所需要求,則返回第一步繼續尋找;若達到精度要求,則作為選擇的參數對[5-6]。

2 實例應用

本文采用文獻[3]中的GPS觀測數據進行建模分析,對擬合后的結果選用內、外符合精度作為評價指標。

(5)

式中:u1、u2為內、外符合精度,v1、v2為訓練樣本和測試樣本高程異常擬合殘差,n1、n2為訓練樣本和測試樣本個數。

在進行GPS高程擬合前,為避免所用數據的數值較大對擬合結果產生影響,需要對數據進行預處理[7]。LSSVM參數在尋優時,適應度函數[8]選擇學習樣本均方誤差可能會存在過擬合的情況,使得預測效果不理想。本文采用三步搜索法尋找最優參數組合,適應度函數分別選擇學習樣本、測試樣本和總樣本均方誤差,并對其擬合效果進行分析比較。

為了計算方便,通過多次試驗確定C和σ的取值范圍分別為[100,1 500]和[0.5,1.9],則:

第一步:中心點為(800,1.2),步長為(400,0.4),計算中心點及其周圍8個點的適應值,選擇適應值最小的點作為新的中心點。

第二步:將步長減小一半為(200,0.2),計算新中心點周圍8個點的適應值,選擇適應值最小的點作為下一個新的中心點。

第三步:將步長減小為(100,0.1)(步長小于一個單位),計算新的中心點周圍8個點的適應值,適應值最小的點即為最終選擇的點。

采用三步搜索法最終獲得C和σ的最優組合分別為(1 500,0.5)、(1 500,1.2)和(700,0.9)。

圖1是在尋找最優參數時訓練樣本和測試樣本的高程異常擬合殘差圖,表1是選擇的幾種適應度函數模型的擬合精度。

圖1 訓練樣本和測試樣本的高程異常擬合殘差

表1 幾種適應度函數模型的擬合精度單位:cmTab.1 Fitting Accuracy of Models in Several Fitness Functions 適應度函數學習樣本測試樣本總樣本內符合精度0.070.440.36外符合精度1.010.700.74

從圖1和表1可以看出,適應度函數采用學習樣本均方誤差,訓練樣本可能存在過擬合的情況,測試樣本部分點的高程異常擬合值較大,擬合效果不佳;采用測試樣本和總樣本均方誤差時,訓練樣本和測試樣本的高程異常擬合值都比較穩定、一致,擬合效果要優于采用學習樣本均方誤差,擬合精度相對更高,能夠達到四等水準測量的精度要求,可以滿足一般的工程測量的要求。

3 結 語

GNSS高程擬合在工程測量中有著廣泛的應用,最小二乘支持向量機在GNSS高程擬合中有著一定的優勢。最小二乘支持向量機參數尋優采用三步搜索法,相對于完全搜索,計算簡單,能有效降低計算次數,縮短建模時間。通過采用GPS數據對擬合效果進行比較,適應度函數選擇測試樣本和總樣本均方誤差的擬合效果要優于選擇學習樣本均方誤差。但是如何對最小二乘支持向量機參數進行優化選擇仍需要進一步研究。

猜你喜歡
中心點適應度步長
Scratch 3.9更新了什么?
董事長發開脫聲明,無助消除步長困境
如何設置造型中心點?
步長制藥50億元商譽肥了誰?
步長制藥50億元商譽肥了誰?
起底步長制藥
磨課,一段痛苦與快樂交織的過程
啟發式搜索算法進行樂曲編輯的基本原理分析
尋找視覺中心點
基于人群搜索算法的上市公司的Z—Score模型財務預警研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合