?

大數據視角下的一體化測繪地理信息監管和服務體系
——以廣東省為例

2021-06-23 08:31劉龍威
熱帶地貌 2021年2期
關鍵詞:圖譜廣東省測繪

姜 洋,劉龍威

(1.廣東省國土資源技術中心,廣州510075;2.廣東省國土資源測繪院,廣州510663;3.自然資源部華南熱帶亞熱帶自然資源監測重點實驗室,廣州510663;4.廣東省自然資源科技協同創新中心,廣州510663)

0 引言

根據中國地理信息產業發展狀況報告顯示,截至2020年末,我國地理信息產業從業單位數量超過13.8 萬家,2020年總產值達到6 890 億元,產業展現出蓬勃的發展活力[1]。作為一項基礎性事業,測繪地理信息行業在國家安全、社會現代化治理、國民經濟建設乃至疫情防控等諸多領域有著不可或缺的重要作用。在中央“放管服”的政策背景下,廣東省多措并舉優化地理信息產業營商環境,通過測繪資質管理制度改革、下放資質審批權限、推動“多測合一”“聯合測繪”改革等促進產業發展;“十四五”期間,廣東省自然資源廳計劃實施系列重大基礎測繪工程,全面提升基礎測繪服務和保障能力,更好地支撐自然資源管理和各行業需求,更好地服務生態文明建設和經濟社會發展。面對一系列改革和發展需要,亟需測繪管理部門從安全、保密、發展和服務等多維角度,以現代化管理手段對測繪地理信息行業進行有效監管并提供精細精準服務。本文從大數據視角出發,以廣東省實踐為例,探討大數據技術在一體化測繪地理信息監管和服務體系建設中的作用和實現方法,并呈現相關應用案例。

1 管理需求分析

對于管理機構而言,一體化測繪地理信息監管和服務的目的是為了提升管理機構自身的現代化管理治理能力,高效精準引導和服務產業發展。當前制約監管和服務能力提升,既有測繪行政監管力量相對不足,亦有信息化監管數據不足、技術手段不足等問題[2]。提升測繪地理信息監管和服務能力可從兩個方面破局:一是如何不斷建設并持續完善集成一體、動態維護的測繪監管與服務大數據本底庫,本底庫不僅要涵蓋各類專題業務數據,更要囊括行政管理過程與結果數據,構建監管和服務多維大數據知識圖譜;二是如何建設協同性高、智能性好的一體化監管和服務平臺,通過深挖數據、事項、過程等之間的關系,發揮大數據驅動效應,提升監管力和服務力。這兩方面是相輔相成的,其中大數據是監管和服務體系的血肉,支撐體系的豐度,是業務分析和管理、智能應用的基礎;平臺是監管和服務體系的骨架,支撐體系的強度,幫助挖掘數據背后的業務邏輯、知識邏輯,展示數據呈現趨勢。探索一種可行的,集采集、處理、維護、更新和挖掘一體的大數據技術方法,進而構建基于數據驅動的一體化測繪地理信息監管和服務體系,對于提升監管和服務能力而言至關重要。

2 大數據技術方法

本文從大數據收集與處理支流程、維護更新支流程、挖掘與應用支流程三個方面探討測繪地理信息監管與服務建設流程。利用接口調用、ETL等技術,對多源異構數據進行抽取、規范、集成和存儲,并動態維護和更新,同時建立知識圖譜,在多元化信息服務技術、智能化表單構建技術、基于地理商業智能技術的多維統計分析與決策技術[3]基礎上,開展數據深度挖掘與應用。主要技術流程圖如圖1所示。

圖1 大數據主要技術流程圖

2.1 大數據收集與處理

從大數據角度而言,數據來源越廣、類型越多、數量越多、周期越長,后續大數據挖掘與應用效果就越好,但由此帶來的多源異構和質量不等問題也對數據處理提出了挑戰。

以廣東省為例,所采取的數據收集方式包括上報式收集、接口式獲取、已有系統數據庫抽取、紙質資料轉換等多種方式,收集結構化、半結構化、非結構化的海量數據(所收集的數據類型和關系圖譜如圖2所示);數據來源有各級測繪行政管理部門、檔案管理部門、企事業單位、信用管理部門等,存在數據結構差異較大、屬性精度缺失、數據沖突、空間基準不統一、部分類型數據豐度不足、內容完整性正確性和邏輯一致性有待檢驗等問題。為此,需對所收集數據進行結構分析、內容梳理和數據清洗,統一結構和內容范式,從數據庫角度構建不同類型數據的關聯關系,進而完成數據本底庫建設。

圖2 數據關系圖(局部)

2.2 大數據維護與更新

數據維護與更新是大數據技術體系的重要一環,良好的基礎維護和動態更新能賦予數據更旺盛的生命力,不斷補足當前數據體系存在的短板。數據維護更新,一是通過業務應用新增內生數據,并下沉更新到本底庫;二是通過采集外生數據,進行標準化處理和校驗后,融合更新現有數據庫。

采集外生數據時,應充分利用自動、分布的采集方式,以提高數據獲取效率和數據豐度。以業務和信用數據更新為例,若無強制行政命令,企業未必會自主、如實、完整填報本企業的業務和信用信息,此時利用互聯網爬蟲技術通過從信用中國、政府采招網等相關網站爬取數據到統一模板,進行數據驗核與更新,不斷提升數據真實度和豐度,就顯得尤為重要。外生數據融合是數據更新體系中技術難度較高的環節,應在對數據結構和內容含義有深刻理解基礎上,建立清晰的數據驗核、匹配、更新與銷毀、訪問控制等更新規則,并對更新過程實施數據庫審計,確保數據倉庫安全。

2.3 大數據挖掘與服務

只有對海量復雜數據進行挖掘、分析、多維解構,構建數據知識圖譜,才能發揮大數據多維連接、感知問題、解決問題、呈現知識以及預測預警的應用功能。構建知識圖譜是數據挖掘的關鍵一環,知識圖譜核心是構建大數據語義知識網絡[4],從測繪大數據特征出發,通過梳理不同數據的語義關系、空間關系、時間關系,以標記分類[5][6]等抽取語義關系,以空間拓撲結合語義抽取方式建立空間關系,以人工提取結合語義抽取方式建立時間關系。測繪地理信息行業有其特殊管理要求,僅從數據提取知識難以構建具有足夠豐度的知識圖譜,對此應結合《測繪法》《測繪資質管理規定》《測繪地理信息管理工作國家秘密范圍的規定》等測繪法律法規以及廣東省有關測繪政策、技術管理辦法,構建專家知識庫,進而建立融合三大類關系和專家知識的知識圖譜。知識圖譜構建技術流程見圖3。

圖3 知識圖譜構建技術流程圖

應用是對大數據以具有規律性、直觀化的方式呈現,讓大數據的挖掘結論更易于感知和傳達。以數據表單的基礎關聯關系為索引,可實現簡單的可視化展示、基礎統計分析和淺層次預報預警等基礎應用。要實現深層次多維度的可視化展示、智能問答、決策分析、推理預測、預報預警等應用,則需要基于知識圖譜,利用基于知識庫問答、統計方法、神經網絡方法等大數據挖掘方法,實現知識的關聯分析、聚類分析等功能[4],進而為相關深層次展示、決策、預測等應用服務。

3 工程實踐

3.1 實踐基本情況

廣東省搭建了融合大數據和信息系統為一體的省級一體化測繪地理信息監管和服務平臺(以下簡稱平臺),平臺充分利用大數據、數據自動化采集以及電子證照、廣東省統一身份認證、分級權限控制等多種技術手段,面向監管端(行政管理部門)和服務端(公眾用戶)提供了基礎管理、預測分析、智能決策等多種應用服務。

3.2 應用案例

3.2.1 基礎應用 圍繞廣東省測繪監管和服務需求,平臺實現了包括基礎統計分析、可視化分析、業務管理、公眾服務等多種基礎應用。比如:以測繪監管為例,質量監督檢查在服務“雙隨機一公開”檢查中起著重要的作用。依托豐富詳實的資質單位和業務數據,監管人員可通過平臺直觀掌握各規模以上測繪單位項目實施情況,針對性開展質量監督檢查、填報檢查結果信息(見圖4);監管部門通過平臺動態掌握全省規模以上測繪單位總體質量情況、測繪項目實施情況,通過平臺發現預警信息,針對性制定相應行政管理措施;測繪單位根據監管結果改問題、補短板,不斷提升企業綜合能力。

圖4 質量監督檢查統計

基礎測繪在支撐經濟社會發展、支撐自然資源管理工作中有著不可或缺的重要作用,其成果服務范圍大、應用領域廣。在對相關數據全面梳理整合集成的基礎上,平臺實現了基礎測繪任務下達、進度管理(見圖5)、質量監督、歷史任務檢索,以及成果目錄采集、公開、分發的全生命周期管理,較好地實現了基礎測繪任務科學管理和成果推廣應用。

圖5 基礎測繪進度統計

聯合測繪是測繪地理信息行業深化“放管服”改革的一項重要舉措,自然資源管理部門高度重視聯合測繪推進工作。平臺通過統計分析對各地上報的聯合測繪業務信息(見圖6)與工程建設項目信息等信息源進行動態比對分析,直觀展示聯合測繪業務實施情況,發現業務異?;驁绦衅x并進行預警提示,為管理部門加強監管提供堅實數據支撐和便捷管理手段。

圖6 聯合測繪業務信息統計

3.2.2 進階應用

對數據進行聯動分析,挖掘其關聯規則和隱藏的知識,增強應用交互性,實現更深層次應用。

(1)在知識檢索方面,利用基于知識圖譜數據庫的問答系統,解析自然語言問句,提高知識檢索的交互性、智能性和精準度。

(2)在管理決策方面,廣東省要求同一種數據通過共享可以滿足不同部門、不同業務的需求,無需重復采集、采購和生產[7]。通過與省政數局“項目管理平臺”對接,實現地理空間數據項目的協同管控,通過對同類型項目、同類型測繪成果、相同業務申請等進行重復性檢測和預警,對已有項目成果利用程度進行分析,輔助項目立項決策,有助于避免重復建設造成財政資金浪費。

(3)在監管方面,通過聯合測繪資質單位信息與測繪業務信息等多類信息,分析黑名單作業、無資質/超資質作業、低價惡性競爭等情況,對在廣東省進行測繪活動的行為進行監管,構建信用名單,評價產業發展健康度,促進產業健康發展。同時相關信用信息可以作為資質復審換證、業務核準等業務的參考憑證。

3.3 應用展望

受多種原因所限,目前數據庫建設、挖掘和應用還存在不足。辟如數據豐度不夠飽滿、知識圖譜不夠立體全面、挖掘算法不夠全面先進、推理和問答功能不夠精準和完善、平臺交互性不夠強,等等。對此,需要圍繞管理需求和公眾服務需求,持續深入解構數據內在關聯和豐富含義、完善知識圖譜,不斷開發或引入大數據挖掘算法,進而逐步改進或實現智能問答、智能審批、企業/項目信息溯源、成果應用決策分析、成果使用安全保密預警、項目重復建設預警、產業(企業/項目)風險預測預警、技術發展預測、產業發展趨勢評估等深層次應用。

4 結束語

目前,圍繞測繪現代化管理和服務需求,廣東實踐從數據和系統兩個維度出發,建設形成了一套符合廣東省情的一體化測繪地理信息監管和服務平臺,利用豐富的數據、先進的系統,較好實現了一體化的測繪單位、項目、成果的精準監管,以及面向管理者與公眾用戶的精細服務。從大數據視角來看,豐富詳實的數據是應用的根本基礎,基于大數據驅動的“數據+平臺”模式,能有效提高監管和服務的規范化、智能化、協同性、精準性。受多種因素所限,廣東實踐在大數據處理和應用方面仍有較大提升空間,特別是在研究數據自動驗核和知識判斷方法、構建內容飽滿和邏輯清晰的知識圖譜、開發和引入先進挖掘算法以進一步挖潛應用場景、提升智能決策預測水平,加強公眾服務方面仍需進一步提高。

猜你喜歡
圖譜廣東省測繪
繪一張成長圖譜
廣東省校外培訓風險防范提示
廣東省鑄造行業協會十周年會慶暨第四屆理事會就職典禮成功舉行
浙江省第一測繪院
工程測繪中GNSS測繪技術的應用
04 無人機測繪應用創新受青睞
補腎強身片UPLC指紋圖譜
無人機在地形測繪中的應用
主動對接你思維的知識圖譜
雜草圖譜
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合