?

基于ARCGIS的人口數據庫建立

2014-08-22 08:52邵林杉
科技視界 2014年21期
關鍵詞:屬性數據空間數據人口

邵林杉

(貴州省地質礦產勘查開發局 測繪院,貴州 貴陽550018)

0 前言

人口信息是國家的基礎信息之一,而我國是一個人口眾多的國家,目前人口統計局的工作重點和難點已經逐步聚焦在如何有效管理和利用日益增多的統計數據上。傳統的人口管理信息已無法滿足信息時代經濟快速發展的需要,開發GIS人口資源數據庫管理系統勢在必行[1]。GIS先進的空間數據庫管理和強大的空間數據分析功能,可以輕松地實現多元異構數據的有機融合,快速完成大量統計數據的空間分析,并以地圖語言的形式表達最終的分析與計算結果[2]。

1 利用GIS建立人口數據庫的優勢

將GIS應用于人口信息數據庫的優勢主要體現在兩個方面:①GIS為人口信息提供了數據采集和管理的平臺。GIS可以實現空間圖形信息與屬性信息的一體化管理,建立空間與屬性的有機聯系,通過地圖圖元的空間唯一位置將分析模型相關的所有數據有機串聯起來。②G1S為人口信息分析模型提供了模型集成平臺。GIS具有強大空間數據管理和查詢分析功能。同時,這些功能也能方便地與其他人口分析模型進行集成,進而解決各種實際應用,GIS的開放結構也使得系統擴展其他模型非常方便[3]。

2 建立人口數據庫的技術方法

人口空間數據庫是連接人口統計數據和地理基礎數據,并實現兩者信息相匹配的復雜數據庫系統。從內容上可將其劃分為兩類:空間數據庫和屬性數據庫??臻g數據庫是由具有基礎性和空間分布特征的矢量和柵格數據組成的圖形數據庫(內容包括行政區劃、土地利用、水系、道路等);屬性數據庫主要由來源和數據質量相對可靠的社會統計信息構成[4]。

2.1 數據采集階段進行數據源數據的收集、選取和分類

在這期間要確保數據的準確性、完整性和時效性??梢赃M行抽樣對地區的人口數據進行校正,可以將縣總人口數與縣域范圍內的鄉鎮總人口數進行比較、將省總人口與省域范圍內的縣人口總數比較、全國人口與各省總人口數進行比較等[5]。

2.2 數據的預處理階段

包括矢量化地圖,柵格地形圖處理,遙感影像處理例如進行遙感影像解譯提取出居民地、水系、交通、地形要素,生成點居民地層、面居民地層、面狀河流湖泊層、公路層、鐵路層、鄉鎮居民點層;人口普查屬性數據表建立例如對地區的人口密度進行地理編碼,就是指定人口數據與它的地理位置關聯起來,實現人口密度數據與實際空間位置的統一[6]。

2.3 人口統計模型的設計與建立

一般包括三個部分:數據存儲、數據管理和數據訪問。數據存儲,即將數據以某種格式記錄在計算內部或外部介質上。其存儲方式與數據文件的組織密度相關,關鍵在于建立記錄的邏輯順序,即確定存儲的地址,以便提高存取的速度;另外要確定在數據管理系統中存儲和檢索數據的基本結構。數據管理,需要管理的數據包括空間幾何體數據、非空間屬性數據??刹捎梦募芾砼c關系數據庫管理相結合的數據管理方案,同時使用文件和關系數據庫來管理GIS數據。數據的訪問一般根據用戶的要求進行選擇查看并應用。

2.4 數據入庫

基于后臺關系型數據庫管理系統Oracle和數據庫引擎ArcSDE,運用GIS特有的空間數據和屬性數據管理能力,將相關的窄間數據和屬性數據進行匹配、疊加等一系列處理,生成地區人口空間、屬性一體化數據庫。

圖1 空間數據庫要素組織圖

在服務器端ArcSDE連接到Oracle以后,根據人口統計數據模型,創建各種要素集和要素類,以及關聯關系和拓撲關系規則,就可以利用ArcGISDesktop中的功能模塊ArcCatalog提供的向導,根據人口統計模型結構,創建要素集、要素、屬性表、關聯類等;再分別導人空間數據和屬性數據,實現人口數據庫的數據入庫和數據統一管理,并且提供各種常用的城市人口空間信息查詢、分析、專題地圖和圖表制作的功能。

3 以重慶市為例建立人口數據庫

3.1 數據的準備

所需數據基本分為兩類:空間數據和屬性數據??臻g數據主要包括重慶市1:10000的行政區劃圖、城市道路圖、地形圖、河流等矢量圖;還包括帶有明顯空間位置的地理信息遙感影像數據資料圖。屬性數據包括人口專題屬性數據(主要包括統計年鑒、各街道辦事處的人口調研數據等描述性的屬性信息)。

3.2 數據的預處理

重慶市人口GIS空間數據主要由地理底圖數據、點文件、線文件、面文件組成,其中地理底圖數據包含一些最基本的信息,如道路、建筑物等;各城市位置的空間數據形成點文件;省界、市界等的空間數據形成線文件;省、市、流域等的空間數據形成面文件,將這些文件進行合理的保存和安排(如圖1)。然后將空間數據和屬性數據相連,比如行政區的面文件和其人口數據相連例如,用ID公共字段連接空間信息和屬性信息。且在空間信息關聯的過程中,有時要關聯的擴展屬性表不止一個,所以必須充分考慮空間要素與擴展屬性信息的相關性,盡量避免產生數據結構的冗余性。比如重慶市的行政區劃名稱、代碼、編號、面積等具有持久性的信息存放在一個文件中。另外,人口數量、受教育程度、性別比例、農業或者非農業人口、民族、信仰等具有變動特征的信息存放在另一個文件中,并通過關鍵字段相連(如圖2)。

4 核心技術以及存在問題

4.1 數據庫的設計

如果將與人口有關的屬性數據和空間數據都存儲在數據庫中,則數據量龐大,數據的存儲、修改、讀取困難,也影響計算機的運行速度,所以要考慮的問題首先是需要考慮哪些與人口相關的因素入庫。人口空間分布受多種因素的影響,其中比較主要的幾個因素是氣候、地貌、交通、水系、土地利用、城市規模等。重慶市人口數據的空間分布研究,最重要的是要研究城市與鄉村人口分布的地理規律特征和區域特點,針對不同地區,對影響人口分布的各因素分別進行分析,確定影響人口分布的主導因子。

圖2 重慶市人口數據庫建立流程圖

4.2 數據庫的數據存儲

面對龐大的數據量如何選擇有效的方法對數據進行存儲,方便數據的修改和讀取也是難題之一。需要建立一個空間索引,建立一個檢索模型,通過城市區域坐標建立R樹索引——快速檢索幾何數據管理表。當數據庫的客戶端調用的時候通過檢索行政區劃的省—市—區(縣)——鄉得到需要的數據。

5 結語

Geodatabase作為面向對象的GIS數據模型,將空間數據和屬性數據有效地融合起來,對于處理復雜的地理空間對象有極大的優越性。在此基礎上建立的人口統計數據模型。以地理空間數據和人口屬性數據為主要研究內容,探討如何更好地將空間地理信息和人口普查信息有效地集成起來,建立面向對象的人口空間數據庫,便于人口信息的各種空間檢索和分析處理,對人口信息資源進行充分開發與應用,對于加強人口信息管理、科學決策可起到積極作用。存在的不足是可能由于數據量巨大而是操作速度變慢,在以后的學習中還將進行深入研究。

[1]李恒凱,陳優良,李亮.基于GIS的江西省人口信息分析系統開發[J].人民黃河,2011,32(8):88-92.

[2]王均,陳向東.兩漢時期人口數據庫建設與應用探討[J].測繪科學,2001,26(3):43-48.

[3]劉艷萍,劉五周.基于ArcGIS的河南省人口資源數據庫設計與實現[J].科學時代,2010,21:232-235.

[4]白潔,陳 曦,楊遼,李江宏.梁承東基于GIS的面向對象人口空間數據庫設計[J].蘭州大學學報,2009,45(4):13-19.

[5]陸偉東.同治以前陜甘回民聚落分布與數據庫建設[J].西北民族研究,2012,(4):37-45.

[6]李明玉,黃虎國,金愛芬.GIS的人口信息空間可視化技術在專題地圖制作過程中的作用[J].東疆學刊,2007,24(3):102-106.

猜你喜歡
屬性數據空間數據人口
《世界人口日》
人口轉型為何在加速 精讀
基于GIS的房產測繪管理信息系統架構研究
1723 萬人,我國人口數據下滑引關注
元數據驅動的多中心空間數據同步方法研究
網絡中多敏感屬性數據發布隱私保護研究
基于文件系統的分布式海量空間數據高效存儲與組織研究
客戶端空間數據緩存策略
多源空間數據同名實體幾何匹配方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合