?

基于GNSS數據的多源地質空間數據庫更新模型效率分析

2022-05-11 00:32曹佳敏盧春陽
測繪技術裝備 2022年1期
關鍵詞:空間數據坐標系關聯

曹佳敏,盧春陽

(浙江省測繪科學技術研究院,浙江杭州 310000)

1 引 言

空間數據庫模型是連接現實世界與空間實體的載體,主要是為了描述空間數據的組織關系,以便相關工作者掌握更多信息[1]。多源地質空間數據庫存儲著不同尺度以及不同格式的地質數據,包括地質礦產數據、地球化學數據以及地球物理數據等多源地質空間數據[2]。美國、加拿大和英國等一些經濟較為發達的西方國家對多源地質數據庫的研究起步較早,如美國地質調查局早在1960年就已經開始建設多源地質數據庫。我國的地質資料數據庫建設始于20世紀80年代中后期,雖然起步較晚,但在生態保護、資源審計、旅游資源調查等多個領域已取得了較大進展[3]。根據相關研究資料記載,目前對多源地質空間數據庫更新模型與GNSS數據相融合的研究還不夠全面,需要進一步探討?;谏鲜霰尘?,本文提出基于GNSS數據的多源地質空間數據庫更新模型,首先設定兩個空間直角坐標系,將地質空間數據進行空間坐標轉換;其次,根據轉換結果,劃分多源地質空間數據集,并利用似真函數、支持函數與信任函數之間的關聯,提取多源地質空間數據關聯規則,基于GNSS數據構建數據庫更新模型;最后進行該模型的效率分析,驗證基于GNSS數據的多源地質空間數據庫的更新效率。

2 基于GNSS數據的多源地質空間數據庫更新模型

2.1 空間坐標轉換

由于地質空間的特殊性,需要進行空間內坐標轉換。根據建立坐標系的平行及重合條件,所建立的大地空間直角坐標系的各軸之間都是相互平行的關系[4]。在滿足兩個坐標系只有坐標原點不同的前提下,僅通過平移方式就能完成坐標轉換[5]。設定O—ABC與O—A′B′C′為兩個空間直角坐標系,兩坐標系各軸之間相互平行,且坐標原點不重合。設定地面上任意一點J,則兩坐標的形式表現為:

(1)

式中:p表示的是坐標系O—ABC的原點相對于坐標系O—A′B′C′原點的位置矢量,也就是空間內的3個平移轉換參數。選取向量ΔA表示原始坐標系的坐標點與目標坐標系的相對位置向量,設定AZ、AW分別表示待求點在目標坐標系和原始坐標系的位置向量,如圖1 所示。

圖1 坐標轉換示意圖Fig.1 Diagram of coordinate transformation

從圖1 可以看出,其坐標歐拉角與尺度因子的相對位置關系可表示為:

Aw=ΔA+(1+n)S1(SA)S2(SB)S3(SC)AZ

(2)

式中,ΔA表示兩個坐標系之間的相對位置向量,SA、SB、SC表示坐標系的歐拉角,n表示尺度因子。在公式(2)成立的基礎上,則得到用K和L所表示的單位矩陣,根據兩個坐標系的歐拉角變換關系,轉換公式(2),得到:

Aw=ΔA+AZ+LAZ+nAZ

(3)

在進行空間數據生產、更新和應用時存在諸多影響因素,涉及空間基準與數學基礎的差異,經過一系列計算,完成空間坐標轉換[6]。

2.2 提取多源地質空間數據關聯規則

多源地質空間數據庫是獲取其關聯規則的主要研究對象,數據管理是關鍵部分[7]。針對地質空間的多源性特點,將多源地質空間的數據集按照數據集、要素類、要素集以及要素子集進行類型劃分[8]。在多源地質空間數據庫中,根據挖掘任務提取地質空間數據挖掘的目標數據集,縮小處理范圍,提高挖掘效率[9]。在進行數據處理之前,需要對目標數據進行限制或者加以條件約束。設定A={a1,a2,…,am}是項的集合,另設任務相關的數據P為數據中要素的集合,其中每個R是項的集合,使R∈A;設Q是一個項集,要素集R包含Q,當且僅當Q∈R。設定關聯規則Q∈A,其中Q∈A,B∈A,并且Q∩B=?。數據關聯規則的評價標準主要是支持度與可信度,其中,超過最低支持度閾值和最低可靠度閾值的規則稱為強關聯規則。用D(Q)表示數據中出現要素Q的概率,D(B/Q)表示地質空間D的數據中出現要素B的概率,公式表達如下:

Support(Q→B)=D(Q∪B)Confidence(Q→B)=D(B/Q)

(4)

根據交易集的要素特征,挖掘空間關聯規則主要就是其支持度與信任度分別大于給定的最小支持度與最小信任度關聯度原則[10]。其中,最小支持度表示項目的要素集在數學意義上的重要性,最小置信度表示關聯規則的最低可靠性[11]??臻g數據庫與其他數據庫的相同點是:都可以進行空間數據規則挖掘,但空間數據具有一定的空間特征,因此,需要更深入挖掘。首先,將空間數據進行組織劃分,用不同的要素表達不同的數據特征[12];其次,根據數據集所包含的空間對象的條件或者決策屬性,進行離散化處理和關聯規則提取,表達方式如下:

D1∧D2∧…∧Dn→L1∧L2∧…∧Lm(r%,e%)

(5)

式中:r%表示關聯規則的支持度,D1,…,Dn表示空間數據的距離要素,e%為關聯規則的置信度,L1,…,Lm表示空間數據的方位要素。

這種提取方式適用于多源地質空間的多維關聯規則,通過設定一種具有逐層搜索的迭代方法,求得空間數據的支持函數和似真函數與支持函數在信任函數上的關系。設定一個非空集合2β,任意命題K在問題域中屬于冪集 ,則其基本概率表示為j2β→[0,1] ,其中,j為基本概率分配函數,并滿足j(?)=0的條件,得出支持函數的表達公式為:

(6)

式中:j(K)表示命題K發生的信任程度,利用空間數據的證據體得到其信任函數的表達公式,用Bel(K)表示,即變量對命題K的支持程度與全部信任程度。似真函數的表達公式為:

Wl(K)=1-Bel(Kc) ?K?β

(7)

式中:Wl(K)表示可能屬于命題K的程度。根據上述公式,得出三者的關系,如圖2所示。

圖2 信任函數關系圖Fig.2 Diagram of trust function

從圖2可以看出,似真函數和支持函數與信任函數之間的關聯,支持函數越大就表示獲取該區域的數據關聯規則越容易,反之則越難。至此,完成了多源地質空間數據關聯規則的獲取。

2.3 基于GNSS數據構建數據庫更新模型

空間數據庫的更新是將保存的某一時間點數據作為歷史數據,以變化信息的方式更新數據庫。更新過程是在原始數據庫中增加實體的過程,在保存歷史數據、維護數據層關系以及保證數據質量的基礎上,進行空間數據庫更新模型構建[13]。根據多源數據庫的更新操作對象不同,多源地質空間數據更新可分為區域空間的實體整體更新與局部更新兩種方式[14]。整體更新主要是采用數據集之間疊加的方式;局部更新主要是通過交互式空間實體圖形變更來實現。二者的區別是局部更新的操作對象為單個實體,而整體更新的操作對象為多個實體[15]??臻g關系分析與處理是實現空間數據庫更新的關鍵,因此,需要將空間分析技術作為空間數據庫更新模型的構建基礎。同時,還需要考慮實際情況中的各實體之間的平面相鄰、平面相離以及空間覆蓋等情況。其中,由于覆蓋情況比較復雜,需要對覆蓋區進行具體研究。

設定線段HM和JM為原線段UP前進方向的左右兩條覆蓋區線段,原線段的起點U和終點P的坐標分別為(Ua,Pa)、(Ub,Pb),覆蓋區半徑為r,則線段UP的左覆蓋區線段HM的端點坐標為(Uc,Pc)、(Ud,Pd),當Ub-Ua≠0時,l為線段UP的斜率,其計算公式如下:

(8)

當Pa-Pb>0,l>0或者Pa-Pb<0時,計算不同線段的斜率,得到線段覆蓋區斜率,為空間數據庫更新奠定數據基礎。多源地質空間數據庫的生產與更新主要是對同一地區但來源不同的空間數據進行有效處理,保證這些數據的屬性以及幾何位置層面都有對應的關系?;谏鲜雒枋雠c計算,空間數據庫更新模型構建完成。

3 試驗研究

3.1 地質空間數據組織關系分析

多源地質空間數據庫中,通常都需要對相關信息進行定義與屬性設置,包括數據的生產日期、數據名稱等。數據屬性越豐富,能提供的信息就越多,數據更新的速度就越快。某地質空間地層的數據屬性如表1所示。

表1 地層屬性結構Tab.1 Stratumattributestructure字段名稱項目允許空字段描述Object-ciNumber(22)not實體Length-nlNumber3(17)not長度Name-klNumber1(19)null名字Shape-aqNumber4vnot形狀Perimeter-s1Double-fnull周長Shape-lenNumber6(e)null長度Area-3Double-hnull區域

表1提供的地層屬性結構信息,主要負責用戶的數據信息查詢以及空間數據組織關系分析。根據相應地質礦產數據、地球物理數據、地球化學數據以及遙感影像數據的數據集、要素集和要素子集得到多源地質空間數據組織關系,如表2所示。

表2 多源地質空間數據關系組織Tab.2 Relationshiporganizationofmulti sourcegeospatialdata數據集項目數據子集數量要素類數量地質礦產數據1∶100000地質礦產數據e-081212219帶1∶200000地質礦產數據e-11101311∶150000地質礦產數據e-041711722帶1∶150000地質礦產數據e-1391121∶100000地質礦產數據e-17378地球物理數據1∶100000航磁數據n-11131∶200000航磁數據n-215121∶150000航磁數據n-33118地球化學數據1∶100000地球化學數據y-0624231∶100000地球化學數據y-064161∶100000地球化學數據y-0647遙感影像數據EYMA數據223ASTERI數據712HYPEEIOD數據3617GIS-8數據423

根據表2可以得出整體性的數據庫更新模型的數據組織關系,應用上述信息進行模型更新效率測試。

3.2 數據庫更新模型效率分析

選取野外調查、遙感調查兩種傳統數據庫更新模型,對此次構建的更新模型在不同比例尺地質空間的更新速度進行測試,并得出圖3所示測試結果。

圖3 數據庫更新速度測試結果Fig.3 Results from database updating speed test

根據圖3的數據模型更新速度測試結果,得出不同比例尺地質空間內3種更新模型的更新速度均值,如表3所示。

表3 三種模型更新速度均值Tab.3 Averageupdatingspeedofthethreemodels比例尺傳統更新模型1/s傳統更新模型2/s基于GNSS數據的更新模型/s1∶500000.31600.38230.19871∶1000005.26434.40173.31591∶20000042.114737.480627.4401

從表3可知,基于GNSS數據所構建的數據庫更新模型在三種不同的比例尺地質空間的更新速度均高于兩種傳統數據庫更新模型的速度。當比例尺為1∶50 000時,基于GNSS數據的更新模型比傳統模型1高于0.117 3 s,比傳統模型2高于0.183 6 s;當比例尺為1∶100 000時,基于GNSS數據的更新模型比傳統模型1高于1.948 4 s,比傳統模型2高于1.085 8 s;當比例尺為1∶200 000時,基于GNSS數據的更新模型比傳統模型1高于14.674 6 s,比傳統模型2高10.040 5 s。由上述內容可知,融合了GNSS數據的數據庫更新模型的更新效率更高。

4 結束語

根據實驗測試結果可知,本研究設計的數據庫更新模型的數據更新速度快,更適用于研究多源地質空間數據庫更新。其結果在一定程度上推動了數據庫更新領域的發展,同時為學術界開展相關研究奠定了理論和實踐基礎。但是,由于研究條件有限,多源地質空間數據庫更新模型的精度還有待研究,未來需要進一步探討與完善模型精度。

猜你喜歡
空間數據坐標系關聯
獨立坐標系橢球變換與坐標換算
極坐標系中的奇妙曲線
GIS空間數據與地圖制圖融合技術
“一帶一路”遞進,關聯民生更緊
奇趣搭配
三角函數的坐標系模型
求坐標系內三角形的面積
智趣
試論棋例裁決難點——無關聯①
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合