?

浙江省在線標準地址庫自動化質檢研究與設計

2024-02-22 06:53吳夏倩潘慧婕沈鉅龍盧春陽
地理空間信息 2024年1期
關鍵詞:壓蓋建筑物網格

聞 達,吳夏倩,潘慧婕,周 煜,沈鉅龍,盧春陽

(1.浙江省測繪科學技術研究院,浙江 杭州 311100)

浙江省“基層治理四平臺”數字化建設,提出了建立完善日常工作中涉及的基礎信息維護與更新、網格繪制等標準制度,明確將地址數據采集更新納入網格員工作內容,并要求各類重點場所信息與建筑物地址編碼進行關聯。地址是最常用的社會公共信息,不僅與人們的日常生活息息相關,而且是政府行政、經濟建設、社會治理重要的基礎信息資源[1]。在信息化體系中,地址是不可或缺的重要節點和橋梁,但因其普遍性和復雜性,導致標準地址的建設與應用面臨諸多難題[2]。目前,浙江省地址數據存在來源部門多、標準不一、覆蓋區域不全等問題,從而導致社會治理信息落圖和分析研判困難。本文基于標準地址庫質量評定方法,將質檢工作量大、缺少自動化檢查工具等難題作為切入點,利用FME 技術和Python 的空間地理信息接口設計了相關的質檢模塊,可根據地址庫數據質檢要求,自動檢查地址數據的規范性、完整性、唯一性、準確性等,進而提升數據質量、提高質檢效率。

1 質檢內容概述

標準地址庫質檢包括概要檢查和抽樣詳查,概要檢查是對全域數據進行統籌檢查,包括坐標系、字段、格式等數據的邏輯一致性、規范性;抽樣檢查是對指定范圍內的數據進行詳細檢查,包括數據采集全面性、數據唯一性、定位準確性、類型正確性、屬性完整性等。

1.1 標準地址概述

地址是現代社會經濟發展過程中所必需的戰略性基礎信息資源,對于國家和地區發展具有重要意義[3]。地址數據是基礎地理數據重要的組成部分,是人們最常用的地理信息數據之一[4],可為社會公眾的工作和生活提供詳實的檢索、定位信息,為公眾的出行、旅游、購物等活動提供方便[5]。標準地址是指具有統一規范表達形式和統一編碼的位置信息描述,用于標識和定位人們生產、生活所處的位置。根據粒度標準地址可分為門址、樓址和戶室地址,門址是指具有獨立門牌號碼的小區、院落和沿街商鋪等地址;樓址是指獨立的建筑物地址,一個樓址對應一個相對獨立的建筑物;戶室地址是建筑物內帶獨立編號的一套或一間戶室的地址。標準地址由行政區劃、基本區域限定物、院門、院內區域限定物、建筑物、單元戶室6 部分組成。標準地址庫是組織、管理、融合和分析地表海量地址時空信息的數據庫基礎,也是描述、構建和認知地址空間,進而解決標準地址編碼問題的時空平臺[6],承擔著整合信息資源、支撐技術應用的職能,可為政府各職能部門和社會公眾提供可靠、高效、準確的地理位置定位服務[7]。

1.2 質檢規則設計

根據標準地址庫質量評定方法,結合實際地址庫質檢工作要求,質檢規則規定了地址數據的邏輯一致性、采集全面性、數據唯一性、定位準確性、屬性正確性、屬性完整性、屬性規范性和數據提交的規范性等。詳細質檢規則設計見表1。

表1 質檢規則設計

1.3 技術路線設計

標準地址庫質檢的技術路線:①基于FME工具搭建質檢轉換器模型,分別采用直連和本地讀取的方式讀取在線云數據庫和離線數據庫,并利用空間分析工具判斷門樓址、戶室地址與建筑物的定位、距離、壓蓋等關系;②利用屬性判斷工具檢查數據是否完整、準確、遺漏;③輸出檢查成果報告和成果定位數據,作業人員及時進行修改,修改完成后再次提交質檢,直至質檢通過,得到最終的地址庫成果。

2 質檢研究設計

本文根據技術路線,從數據源的讀取設計入手,針對空間和屬性的質檢要求設計每個功能模塊,完成地址庫數據質檢研究設計。

2.1 多源數據讀取設計

地址庫的數據主要包括政法委提交的離線數據和在線云數據庫,離線數據為GDB格式庫體數據,在線云數據庫為MySQL 地址庫,二者類型、格式、字段、數據訪問限制各不相同。對于相同的質檢規則,需滿足不同用戶對數據訪問和抽取的要求。離線GDB地址庫是標準格式版地址庫數據,屬于線下提交成果,用于在線數據庫的增量更新和質檢中的數據詳查(表2)。

表2 標準格式GDB數據庫表結構(以戶室地址為例)

在線MySQL云數據庫是存儲在浙江省政務云上的數據庫,其表結構更加復雜,部分數據庫表結構見表3。在數據源讀取上,通過配置數據庫IP地址、端口以及數據庫的用戶名和密碼,實現對數據庫鏈接和要素圖層的獲?。▓D1),主要用于質檢中的數據整體抽樣概查。

圖1 MySQL數據庫鏈接界面

表3 MySQL數據庫表結構(部分)

2.2 空間關系質檢設計

地址庫的空間關系質檢主要是檢查地址數據的定位準確性,包括地址點與建筑物面的空間關系、與統一網格面的空間關系以及地址點相互之間的重疊關系。

地址點與建筑物面的空間關系,一方面檢查落在建筑物面的門、樓址點,規定門址不能落在建筑物面內,樓址必須落在建筑物面內,通過PointOnAr?eaOverlayer 工具可判斷點與面的壓蓋關系,屬于地下停車場的樓址點可不在面內,因此進一步過濾名稱,將不在面內且名稱中不包含“地下”的樓址點輸出;另一方面,檢查落在建筑物面的樓址點位置與建筑物面中心點的距離是否符合要求,設置閾值進行檢查,仍采用點面壓蓋工具篩選落在面內的點,并通過Matcher 匹配工具過濾“一面多點”的情況,利用CenterPointReplacer 提取面的中心點,利用構線工具LineBuilder 連接地址點和面的中心點,計算投影長度,設置長度閾值,將與面中心點距離大于閾值的點輸出。

地址與統一網格面的空間關系,包括地址點是否落在對應的網格面內、 地址中的網格代碼(GRID_CODE)與網格數據的代碼(ADCODE)是否一致以及行政區劃字段是否一致。通過點面壓蓋工具判斷地址點與網格面的關系,并設置屬性聚合,將網格面的代碼賦值到地址點的列表中(圖2),最后判斷其代碼的一致性。行政區劃字段一致性判斷同理。

地址點相互之間的重疊關系包括門樓址的自重疊、樓址與戶室地址的重疊以及門址與樓址的重疊,其中門樓址的自重疊通過PointOnPointOverlayer工具判斷點與點之間是否壓蓋,判斷Overlaps 壓蓋值是否為1,輸出壓蓋點;樓址與戶室地址、門址的重疊檢查均通過地理緩沖工具GeographicBufferer對樓址點作一個細微的緩沖面,將戶室地址和門址點分別與樓址緩沖面進行壓蓋分析,相交的地址點則與樓址點重疊。

2.3 屬性關系質檢設計

地址庫的屬性關系質檢主要是針對數據的唯一性以及屬性的完整性、正確性和規范性,包括地址的名稱和唯一碼是否唯一、戶室匹配樓址字段是否相同、是否存在異常字符、關鍵字段是否為空等。地址名稱和唯一碼的唯一性檢查,利用匹配工具,對名稱字段和唯一碼字段進行匹配,輸出相同名稱或唯一碼的地址(圖3)。戶室匹配樓址字段檢查,利用屬性融合工具FeatureMerger 將樓址的UUID 與戶室地址的LID 進行關聯,以戶室地址為節點進行輸出;對于掛接到戶室地址上的樓址字段,比對其本身的地址字段,檢查戶室地址的地址字段是否完全包含樓址的地址字段。

圖2 網格屬性聚合賦值

圖3 名稱唯一性檢查

3 結 語

標準地址庫在線數據自動化質檢改變了數據的檢查方式,節約了人力和時間成本,同時支持數據在線、離線兩種質檢模式,解決了多源數據中數據不統一、標準不統一的問題,提高了數據質量,解決了數據遺漏、分類錯誤、空間匹配錯誤、地址錯位、分節錯誤等問題。隨著標準地址庫質量的提升,將進一步促進基層社會治理科學化、精細化、智能化水平。

猜你喜歡
壓蓋建筑物網格
用全等三角形破解網格題
基于ANSYS的油膜軸承壓蓋外輪廓改進分析研究
淺談分體式壓蓋在核桃殼攪拌器上的嘗試
鄰近既有建筑物全套管回轉鉆機拔樁技術
反射的橢圓隨機偏微分方程的網格逼近
描寫建筑物的詞語
重疊網格裝配中的一種改進ADT搜索方法
往復式活塞隔膜泵油缸及油缸壓蓋剛度分析
基于曲面展開的自由曲面網格劃分
火柴游戲
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合