?

地理學對大數據技術的響應與思考

2020-01-06 20:58張雪清
科學技術創新 2020年21期
關鍵詞:數據量學科研究

馬 玲 葉 勝 張雪清

(1、深圳市易簡空間技術有限公司,廣東 深圳518000 2、重慶市地理信息和遙感應用中心,重慶400000 3、中冶賽迪重慶信息技術有限公司,重慶400000)

1 概述

隨著人類科學技術的快速發展,計算機和信息通訊技術的繁榮帶來了各種以電子形式存儲的數據量也呈指數式迅速增長,根據IDC(Internet Data Center)的統計,人類社會的數據量以每年50%的速度增長,每兩年增長一倍多。所謂大數據,是指“用目前數據庫管理和傳統數據處理方法難以獲取、管理和處理的巨大復雜的數據集合”?!按髷祿笔抢^“云計算”之后互聯網時代掀起的又一個熱潮。

2“大數據”熱潮下地理學的機遇

2.1“地理大數據”的定義與特征

人類信息技術的井噴式發展使得全球每18 個月新增的數據量是人類有史以來全部數據量的總和,到2020 年全球數據量將達到40ZB,并且這些數據中的95%是不精確的和非結構化的,同時具有典型的5V(Volume、Varity、Velocity、Veracity 和Value)特征,我們根據這些數據統稱為“大數據”。地理學科所面對的是復雜的地球系統,因此地理信息是天然的大數據。上至衛星遙感對地觀測數據、下至航空傳感器數據、以及我們常見的統計、環境、土地等領域的數據都屬于地理數據,因此地理信息技術數據源之多,數據量之大是不言而喻的。

2.2 大數據時代地理學的機遇

大數據在一定程度上克服了傳統地理數據時空屬性缺失和不連續的不足,也為創新地理學研究的議題提供了機遇。大數據細化了時空尺度,人類活動的三維空間具有時空三維屬性的變化,并且這種變化是每時每刻在發生的,意味著地理數據的細化是同步于時間發展的,因此移動的個體或群體所產生的地理信息位置和屬性變化更為明顯,地理大數據在這個尺度上促進了地理計算與城市計算和社會計算的交叉和融合,符合人文地理學“計量轉向”與“社會轉向”的發展規律。大數據提供的豐富且詳細的信息,使得社會學家全面、精細化分析各類社會科學問題提供了契機,而社科學家在越來越多地理空間屬性信息的支持下,研究結果也越加具有實證性。大數據對人文地理學的影響也是自然地理學的影響。在優化區域布局、防災減災、城市精細化管理、智慧城市等方面綜合多維的國情地理數據影響甚大。這些大數據,對人文地理學研究內容與研究范式提供了巨大突破創新的機會。

地理學+大數據技術已經成為了地理空間分析的前沿,是當前地理學研究的重要新方向。美國NASA 已經利用地理大數據開展了氣候變化的深入模式探究,結合GIS 研究建筑物的氣候變化反應和規劃,為全球數據應用提供了范式。

3“大數據”時代下地理學的反思

3.1 數據決定論的反思

Anderson 在《Wired Magzine》的一篇評述中強調“大數據”可能帶來理論的終結和傳統科學方法的過時,因為僅僅依靠“大數據”就足以直觀地了解所發生的各種現象,簡單的數字就能表達一切。盡管這種言論有很多漏洞,但卻引發了眾多關于“大數據”在研究過程中所起作用的討論。不可否認的是大數據作為一種新的技術為地理學研究提供了新的數據類型和新的研究范式,但需要深思的是需要回歸到數據本身,數據本身不是知識,在大數據時代,科學研究也應該需要進行過濾和篩選,從眾多的數字背后探究深入的社會機理和有效信息,而這個過程重點強調人的作用而不是數據本身的作用。

從數據知識以至經驗的過程需要地理學者的挖掘和提煉,重點把握尺度效應,不應在大數據時代下忽視了小數據的價值,正如地理學尺度永遠不能細化至極致,研究人員在收集數據時需要尋求合適的尺度,小空間的尺度數據有助于把握地理細節,對大數據分析下的時空趨勢進行更好的輔政與說明。這一過程不僅需要地理大數據的空間可視化同時需要更深層次地挖掘現象背后的空間規律。

3.2 大數據驅動地理研究的反思

在大數據的沖擊下,當今地理學學科內部出現了一種破碎化和離心化的趨勢,正如有學者的批判:自然地理破碎化、人文地理經濟化、地理信息科學信息技術化。傳統地理學的“區域性”和“綜合性”的傳統學科特色與優勢遭受挑戰。地理學要“回歸”到哪里?地理學有自己的共同體共識,第一是研究取向上對“地”的重視,第二是研究方式上對地的重視,即強調實地取證與調查,堅持一切從實際出發和唯物主義觀點。目前在地理大數據的研究中和對大量數據操作的過分關注而忽略了典型代表的選擇等,這樣會導致出各種偏差。利用地理數據進行預測也需要進一步的理論支撐,因為大數據源于過去數據的積累,在未來與現在具有相似情景的條件下,則可通過算法預測未來。然而地表過程和人類社會過程是一個動態非線性的過程,一旦未來某段時間內的系統動力發生改變,那大數據對未來的預測也需要改變。

地理大數據狂熱的背后依然擺脫不了多數成果探索性階段的現實。例如谷歌流感趨勢預測失效案例。與傳統地理學注重野外實證和嚴謹科學驗證數據相比,絕大多數的“大數據”是有偏數據,這些數據受環境和人群的影響和干擾較大。由于原始樣本的偏差、預處理方法是否恰當等多方面因素,地理學者對收集來的大數據的質量無法進行系統性評估,大數據是一個新呈現出來的新鮮事物,研究案例可供借鑒研究的少之又少,條件也不夠充足,所以研究問題片面不夠具體,所以研究的結果大多數都不夠足以讓人信服,因此大數據驅動地理研究仍然需要更加嚴謹和魯棒的算法。地理學者能夠做的不應該是面對數據的狂歡,也不應該趨向于計算機科學對大數據技術算法的深化,而是應該扎根學科特色,回歸人地關系主題,扎根現實、回歸研究本質,冷靜客觀對地理大數據的使用條件進行科學的評估。同時地理學是一門實證主義較強的學科,在社會發達地區,地理大數據的豐富可以對地理環境進行表達,而對于自然區域,也存在數據盲區。在這個過程中,基于訪談、野外調查等途徑獲得的小數據的價值依然不可忽略。

3.3 大數據對傳統地理學的沖擊反思

新事物的產生總是具有強大的生命力,在以矛盾具有兩面性的思想指導下地理學者不應該過分抬高大數據對地理學發展的作用,不能妄自菲薄,全盤否定傳統地理科學的研究意義和研究方法。在新技術對傳統學科的沖擊中只有通過辯證法的思維看待問題,抓住問題的本質,方能發揚本學科特色。地理學的發展依靠數據,數據的壟斷會產生“數據鴻溝”,對于地理學而言,數據是血液,只有與相應的社會部門或公司協商,或借助計算機科學的數據挖掘技術,才能多方面獲取多尺度數據。在獲取數據之后,在數據分析上依然不能固步自封,應認識到與其他學科分析方法上的一些差距,加強學科融合和學科交流合作,地理大數據的交叉學科特性也將成為未來地理學數據研究的新趨勢。

4 結論與討論

首先值得深思的是地理大數據應回歸到數據本身,地理學需要從眾多的數字背后探究深入的社會機理和有效信息,而這個過程重點強調人的作用而不是數據本身的作用。同時地理學要回歸到對“地”的重視,強調實地取證與調查,扎根現實、回歸研究本質,冷靜客觀對地理大數據的使用條件進行科學的評估。最后面對大數據的沖擊,傳統地理學應認識到自身的缺陷,加強學科特色融合。在新時代背景下,地理學勿固步自封,積極面對機遇與挑戰,融合交叉學科,回歸人地關系主題,切實給人們帶來更多的地理信息服務。

猜你喜歡
數據量學科研究
【學科新書導覽】
FMS與YBT相關性的實證研究
遼代千人邑研究述論
基于大數據量的初至層析成像算法優化
土木工程學科簡介
高刷新率不容易顯示器需求與接口標準帶寬
寬帶信號采集與大數據量傳輸系統設計與研究
視錯覺在平面設計中的應用與研究
EMA伺服控制系統研究
“超學科”來啦
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合