?

基于車載LiDAR點云的桿狀地物分類研究

2019-09-21 07:46董亞涵李永強李鵬鵬范輝龍
測繪工程 2019年6期
關鍵詞:訓練樣本投影精度

董亞涵,李永強,李鵬鵬,范輝龍

(河南理工大學 測繪與國土信息工程學院,河南 焦作 454003)

桿狀地物是城市道路場景中最為常見的公共設施,包括路燈、電線桿、廣告牌及交通標示牌等,傳統的桿狀地物分類方法通常是使用全站儀、RTK等測量儀器對桿狀地物位置進行實測后再進行編號標記,并結合AutoCAD及其他軟件進行繪圖,但由于傳統方法采集的數據不完整、精度不高且人為干預嚴重,難以為智慧城市、道路建模及無人駕駛等新技術提供數據支持,車載LiDAR(Light Detection And Ranging)作為測繪領域的前沿技術之一,為城市空間信息的精確獲取提供了強大的技術支持[1-2]。車載LiDAR在車輛行駛過程中獲取道路兩側地物詳盡的三維空間點云信息,相比于傳統桿狀地物測量方法具有明顯優勢,桿狀地物的空間信息精確地表達在車載LiDAR點云數據中,為桿狀地物的自動分類提供數據條件。

目前,針對點云中的桿狀地物的分類提取研究,學者們開展了一系列工作并取得很多成果[3-18],但也存在各種局限性的問題,如只實現了行道樹的特征矩陣構建與識別,對于相似性高的桿狀地物如路燈與廣告牌的分類并未涉及,本文通過提取桿狀地物多種特征構建特征矩陣,并采用SVM分類算法建立分類模型,實現對車載點云數據中多種典型桿狀地物的分類。

1 點云特征矩陣構建

1.1 頂部與桿部分離

桿狀地物通常包括頂部和桿部兩部分,如圖1所示,行道樹樹冠與樹干(圖1(a))、路燈燈頭與燈桿(圖1(b))、標示牌牌與桿(圖1(c)),電線桿包含兩種:一種包含頭部(圖1(d)),一種不包含頂部(圖1(e)),虛線框中為桿狀地物頂部。相比于桿部,桿狀地物頂部包含了更多特征,因此,先對桿狀地物進行頂部與桿部分離,對于不包含頂部的電線桿,取其與電線連接處作為頂部。文獻[19]采用自低而上的格網增長法進行行道樹的冠干分離,但由于路燈廣告牌等地物沒有明顯的格網增加難以建立分割閾值,本文將對格網數目增加的判斷修改為對點云跨度的變化判斷[3],即對單個桿狀地物從底部開始向上以0.2 m距離間隔進行搜索,當點云跨度超過閾值,則判斷搜索到了頭與桿部的分界。

圖1 5種典型桿狀地物

1.2 特征矩陣提取

點云基本特征包括X,Y,Z空間信息、GPS時間信息、回波強度等,但單個點云的基本信息難以為分類提供有效支持。因此,本文通過計算點云組的特征向量、點云密度、頂部與桿部投影面積比值、擬合后總殘差及擬合中誤差構建特征矩陣。

不同桿狀地物頂部形態不同,根據PCA(Principal Component Analysis)理論,對取出的桿狀地物頂部點云數據構成的X,Y,Z矩陣進行奇異值分解,將原始坐標軸變換至桿狀地物頂部點云主成分方向,并提取出頂部點云3個方向的特征值m1,m2,m3。由于不同種類地物3個方向特征值具有不同量綱,因此,對3個方向點云特征值進行數據歸一化處理統一量綱,并將歸一化后的特征向量a1,a2,a3,歸入特征矩陣F。

(1)

不同桿狀地物頂部點云在進行主成分變換后,空間3個主平面上的點云密度表現不同,因此,將桿狀地物頂部分點云分別向3個主平面進行投影,建立寬度為0.2 m的格網,對投影點云進行格網投影,統計格網數計算投影面積,計算點云總數與3個投影面的比值,求得桿狀地物在3個主平面的點云密度Dm1,Dm2,Dm3作為3個特征值,圖2中,圖2(a)為標示牌原始點云視圖,圖2(b)為經PCA坐標變換后的點云視圖,圖2(c)、(d)、(e)分別為頂部點云向3個主方向的投影。

圖2 頂部點云坐標變化及投影示意圖

不同桿狀地物由于頂部大小與跨度均有差異,而桿部投影均為圓或半圓形,因此以頂部投影與桿部投影比值作為識別點云的特征。通過與計算點云密度相同的方法計算桿狀地物頂部與桿部在XOY平面上的投影面積,計算頂部投影Sup與底部投影SDown的比值R,并將R作為特征值輸入矩陣F。

不同桿狀地物頭部的擬合表面不同,因此,選擇一個相同擬合表面計算出不同桿狀地物對同一擬合表面的適應程度差異,為兼顧計算精度與算法運算速度,本文采用RANSAC平面擬合,具體步驟如下:

1)隨機選擇3個點構建初平面;

2)計算3個點所構造的平面方程Ax+By+Cz+D=0;

3)將單個桿狀地物頂部點云帶入平面擬合方程計算中誤差;

4)統計所有滿足中誤差閾值的點作為內點(liner),統計內點個數;

5)調整平面方程系數,進行1~4步的迭代,直至找到最佳模型,使得內點個數最多完成迭代。

通過計算擬合后每個桿狀地物與擬合平面的總殘差以及均方根誤差,即擬合后保留的內點到擬合平面的水平距離的平方δ和與均方根誤差σ,其中n為擬合后保留的內點個數,將每個頂部點云擬合后的總殘差δ與殘差均方根誤差σ帶入特征矩陣,至此完成特征矩陣構建,即F=[a1,a2,a3,Dm1,Dm2,Dm3,R,δ,σ]。

(2)

2 SVM分類

2.1 SVM分類模型

SVM分類算法是一種基于統計的有導式機器學習算法,由Vladimir N和Alexey Ya于1963年提出,被認為是機器學習眾多分類算法中分類效果與魯棒性最好方法之一。SVM常用于兩類樣本的分類問題,對于線性可分型樣本集,即通過一條直線(2維)或平面(3維)便可將兩類數據分開,SVM將建立一個平面,將兩類地物完全分割,并且保證平面距離樣本集的幾何邊界最大,該平面即為超平面,對于線性不可分樣本集,SVM通過核函數將樣本集映射至高維空間,并在高維空間中構建超平面。

假設有樣本集(xi,yi),i=1,2,3,…,l;y∈(-1,1),且樣本集線性可分,則分界的超平面與支持向量距離為1/‖w‖,w={w1,w2…w3},求取劃分兩數據集的判決函數可表示為

yi(wi·xi+b)≥1,i=1,2,…,l.

(3)

實際應用中,線性不可分情況較多,為線性不可分樣本構建超平面時,需引入懲罰因子C與非負松弛變量ζ,即允許變量在一定范圍內違反超平面約束,約束尺度由懲罰因子C決定,因此,超平面優化問題可表示為

(4)

(5)

利用拉格朗日方程將式(5)進行對偶化,引入核函數K,將低維樣本集映射至高維空間,并降低內積計算時的復雜度,結果可表示為

K(xi,xj)=φ(xi)·φ(xj),

(6)

i=1,2…,l.

(7)

根據式(7)可得判決函數:

f(x)=sgn(w*·φ(x)+b*)=

2.2 技術流程

依靠原始車載LiDAR點云數據無法建立SVM模型進行分類,需對獲取的數據進行預處理、目標地物提取、特征獲取以及樣本訓練后,才能建立分類模型。由于本文只涉及桿狀地物分類,因此將使用提取后的桿狀地物作為樣本,并將相同樣本統一存放,不涉及濾波及桿狀地物提取工作,本研究工作流程(見圖3)如下:

1)對提取后的點云樣本進行頂部與桿部分離,為建立特征矩陣Feature提供基礎;

2)對樣本數據集進行特征提取,并將提取的特征值存入特征矩陣;

3)將不同桿狀地物附加標簽(行道樹-1,路燈-2,廣告-3,電線桿-4);

4)對數據進行歸一化處理統一量綱,并對樣本集進行交叉驗證以確定最優懲罰系數C值與核函數參數g值;

5)創建SVM模型,選取測試集驗證模型分類精度。

圖3 技術流程

3 實驗分析

3.1 實驗區選取

本實驗采用SSW車載LiDAR系統進行數據獲取,點云掃描間隔0.02 m,數據集采用本研究團隊已建立的數據集,其中包括路燈、行道樹、廣告牌、電線桿等桿狀地物共計1 000個,并以此作為樣本訓練集。并提取北京市昌平區(試驗區1)以及河南省焦作市(試驗區2)兩段道路數據中的400根桿狀地物作為測試集(見圖4),其中,行道樹、路燈各150根,廣告牌、電線桿各50根,試驗區1為往返掃描,桿狀地物點云數據較為完整,試驗區2為單側掃描,桿狀地物點云部分缺失,掃描車靠道路右側行駛,道路右側的數據質量優于道路左側,測試集概況如表1所示。

圖4 試驗區點云

表1 試驗數據概況

3.2 參數尋優與精度對比

桿狀地物分類算法在Maltab2012a環境下實現,采用庫函數libSVM作為算法實現工具,并使用徑向基函數(RBF)作為SVM分類核函數,采用9個特征值構成的特征矩陣F作為訓練集特征方程,使用mapminmax函數,對特征值進行歸一化處理,并對測試集采用5對折交叉驗證得到最優C值19.108,與g值5.278,建立SVM支持向量機分類模型,對測試集進行分類判別,計算模型分類精度與時間消耗。

為驗證文中所述算法的正確性,選取文獻[14]中采用的反射強度結合桿狀地物空間與形態特征的分類方法與本文方法進行分類精度對比,并與不同數目訓練樣本以及不同數量特征向量構建的SVM模型進行對比,用于驗證訓練樣本時多特征向量與足夠訓練樣本的必要性。

對400個已提取的桿狀地物采用文獻[14]中提到的分類方法進行分類,根據4類桿狀地物特征分別設置閾值進行反射強度濾波、點云數量濾波、海拔濾波、高度濾波以及形態濾波對桿狀地物點云進行分類。分類結果如表2所示,采用點云特征并通過先驗知識人為設置閾值對測試集進行分類時,特征突出的桿狀地物識別效果較好,部分桿狀地物由于點云缺失或形態與其他同類別地物差異較大,采用閾值判斷難以有效識別,因而導致錯分與漏分,相比下,對SVM模型進行訓練時,訓練集樣本中包含各類形態的桿狀地物,對特殊形態的桿狀地物具有良好的包容性,因此分類時表現較好,各類地物分類精度均較高,圖(5)為測試集分類后結果,其中圖5(a)、圖5(b)分別為試驗區一、試驗區二使用SVM模型分類后效果,圖5(c)為虛線框中SVM模型分類效果,圖5(d)為虛線框中特征分類后效果,圖中紅色為識別的路燈點云,藍色為行道樹點云,綠色為廣告牌點云,黑色為無法分類點云。

表2 兩種方法分類精度對比

圖5 分類后點云

采用不同數量的訓練樣本構建SVM模型,將訓練樣本集分為3類,樣本數量分別為200,400和800。3種不同模型對同一測試集進行測試,實驗結果與相關參數如表3所示,由實驗結果可知,模型分類精度隨訓練樣本數量增大而提高,究其原因,訓練集數量較小時,數據所包含的數據類型較少,而桿狀地物種類豐富,車載LiDAR工作時受掃描角度與周圍環境限制,對不同桿狀地物的掃描覆蓋率也有不同,因此,少量數據集難以體現桿狀地物全部特征,從而造成分類精度降低。

表3 不同樣本數構造的3種模型分類精度對比

采用相同訓練樣本不同數量特征值進行對比試驗,將訓練樣本分為3類,類別1特征矩陣構造為F=[Dm1,Dm2,Dm3,R,δ,σ];類別2特征矩陣構造為F=[a1,a2,a3,R,δ,σ];類別3特征矩陣構造為F=[a1,a2,a3,Dm1,Dm2,Dm3],訓練樣本數均為桿狀地物1 000根,不同訓練樣本所消耗時間及分類精確度如表4所示,由實驗結果可知,各組分類精度差別不大,減少特征矩陣中的特征數量,會降低SVM模型對測試集的分類精度,原因在于,部分桿狀地物單個或多個特征相似,當選取特征不足時,難以構建優越的SVM模型對桿狀地物進行種類識別,但識別率均高于幾何特征分類桿狀地物。

表4 不同特征矩陣構造的3種模型分類精度對比

4 結束語

本文以車載LiDAR點云作為原始數據,將桿狀地物拆分為頂部與桿部兩部分,對桿狀地物點云進行9種特征獲取并構建特征矩陣,以此為基礎,采用SVM訓練樣本構建分類模型,實驗證明,構建的SVM模型對桿狀地物分類精度可達94.7%,精確度高于使用先驗知識設置閾值的方法對桿狀地物進行分類?;赟VM的桿狀地物分類方法,有效避免了分類時的人為干預與閾值預設,適應性好、分類精度高,對提高點云自動化分類精度與效率具有較高的研究價值,但使用SVM模型進行桿狀地物分類時,要求桿狀地物具有較高孤立性,對于組合地物則無法正常提取特征與分類,因此對于組合地物的分割問題將成為今后研究的重點。

猜你喜歡
訓練樣本投影精度
熱連軋機組粗軋機精度控制
解變分不等式的一種二次投影算法
基于最大相關熵的簇稀疏仿射投影算法
人工智能
超高精度計時器——原子鐘
找投影
分析誤差提精度
找投影
基于DSPIC33F微處理器的采集精度的提高
寬帶光譜成像系統最優訓練樣本選擇方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合