?

基于CiteSpace知識圖譜的水文大數據研究進展

2024-03-26 09:52孟露楊海波
人民珠江 2024年2期
關鍵詞:可視化分析知識圖譜

孟露 楊海波

摘要:水文大數據相關研究是近些年水文領域的研究重點和核心問題,同時也是提高水文事務處理效率和增強水文規律真實性及可信性的重要內容?,F將從中國知網(CNKI)收錄的264篇文獻和Web of Science(WOS)收錄的219篇文獻作為樣本數據,利用CiteSpace軟件對其進行研究人員、研究機構及熱點分析,深入探索該領域研究的發展趨勢。研究表明:從發文量總體來看,國內和國際發文量均呈現上升趨勢。從研究人員和研究機構來看,國內學者和機構間呈現“大分散,小聚集”的現象。從研究熱點來看,以“智慧水文” “預警系統” “Big data testing”等為突現關鍵詞意味著該領域的研究重點逐漸向技術化、數字化方向演進,無論在國內還是國際,現代的水文監測技術與水文學方法相對于傳統的技術和方法,均具有更高的準確性和穩定性,可以更充分地滿足實際應用需求,將水文和大數據相結合逐漸成為了該領域的研究趨勢。

關鍵詞:CiteSpace;知識圖譜;水文大數據;可視化分析

中圖分類號:P333文獻標識碼:A文章編號:1001-9235(2024)02-0038-07

Research Progress of Hydrological Big Data Based on CiteSpace Knowledge Graph

MENG Lu,YANG Haibo*

(School of Water Conservancy and Civil Engineering,Zhengzhou University,Zhengzhou 450001,China)

Abstract:Research related to hydrological big data has been a focal point and core issue in the field of hydrology in recent years.It is also an important component for improving the efficiency of hydrological affairs processing and enhancing the authenticity and credibility of hydrological patterns.This study utilized a sample dataset comprising 264 papers collected from China Knowledge Infrastructure (CNKI) and 219 papers collected from Web of Science (WOS).Using CiteSpace software,this paper analyzed the researchers,institutions, and research hotspots and explored the development trend of research in this field in depth.The findings indicate that,overall,both Chinese and international publications show an increasing trend.Regarding researchers and research institutions,there is a phenomenon of “large scattering and small gathering” among Chinese scholars and institutions.Examining research hotspots reveals that keywords such as “intelligent hydrology,”“early warning system,”“big data testing” signify that the focus of research in this field is gradually shifting towards technological and digital directions.Whether domestically or internationally,modern hydrological monitoring technologies and hydrological methods,in comparison to traditional technologies and methods,demonstrate higher accuracy and stability.They can more fully meet the practical application requirements,and the combination of hydrology and big data has gradually become a research trend in this field.

Keywords:CiteSpace;knowledge graph;hydrological big data;visual analysis

隨著物聯網技術的普及,大數據、云計算和人工智能技術的逐步成熟,中國水利信息化發展進入智慧水利的新階段[1。在當前大數據環境下,水文相關部門主要依靠自動測報系統中的傳感器設備來采集雨量、流量以及水位等水文信息;在水文水情數據信息采集的基礎上,需借助大數據技術根據實際需求對數據進行分析和處理,并進一步對采集的數據進行存儲2。水文作為水利行業的重要基礎工作,是智慧水利的重要組成部分,也是大數據技術發展、智能化建設的基礎內容之一3。因此通過檢索“水文大數據”相關領域論文,從而對該領域進行研究和討論很有必要。

在水文大數據研究方面做出成就的研究人員數不勝數[4-6,但由于各位學者的研究區域不同、數據來源不同、環境不斷變化等情況,盡管眾多學者都對該研究方向提出了自己獨到且有科學性的見解:針對流域水文模型的本質和特征,詮釋了“分解”與“繼承”的科學思維在流域水文模型建模中的作用并做出了反復論證和思考[7-9;針對現有水文氣象條件對流域具體情況進行分析,并利用大數據分析方法對洪水過程做出預報10;針對軟件開發、模型組合生成以及遙感數據的應用現狀進行分析,指出水利云平臺開發過程的各種研究問題11;面向具體水文應用的水溫時空數據挖掘模型,研究人員也為相關決策提供了信息支撐12。為進一步加深對水文大數據研究過程、研究成果以及研究具體問題的理解和認識,本文將針對以上幾個方面進行較為概括且全面的研究成果梳理與相關數據分析。

通過文獻計量學方法開展的相關研究涉及面較廣,可以較系統地分析各個領域的研究進展和趨勢。如在對流域產匯流方面進行文獻計量分析時,結果表明產匯流模擬和暴雨洪水管理模型(SWMM)等的運用是當前的研究熱點[13;在對美國農業部水土保持局(SCS)模型在中國流域的研究現狀進行分析時,研究表明其與其他模型的耦合應用以及遙感技術的應用為該領域的研究重點[14。近些年來,該領域的研究內容正在向地質災害方向過渡,且在今后的巖溶水文地質研究中應加強與各國社會經濟等建設的內在聯系,共同促進可持續發展[15-16。關于水文大數據的文獻定量并不多見。因此,本文利用CiteSpace軟件對來自中國知網(CNKI)和Web of Science(WOS)平臺的文獻進行整理和分析,以知識圖譜的形式將“水文大數據”領域的研究作者、機構和熱點問題表示出來,使結果更加可視化。

1 數據與方法

1.1 數據來源

本文將對國內和國際期刊文獻分別進行文獻計量和篩選分析。首先從CNKI平臺進行檢索,以“水文”和“大數據”為檢索主題的關鍵詞,以2002年1月1日至2022年12月1日為檢索的時間范圍,剔除相關性較差的結果后得到有效文獻共計264篇;然后以Web of Science為平臺進行檢索,以“Hydrology”和“Big data”為檢索關鍵詞,以2002年1月1日至2022年12月1日為檢索時間范圍,通過分析檢索結果的主要內容及發表刊物,剔除與本文研究領域相關性較差的結果,得到有效文獻共計219篇。

1.2 研究方法

知識圖譜是顯示知識發展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯系。概括來說,就是把眾多有關圖形分析學科的理論和方法與計量學的方法相結合,以可視化圖譜的形式將知識的發展趨勢和熱點等內容直觀地表示出來[17??梢暬治鼍褪菍⒑A繑祿M行關聯分析,由于這些數據中存在分散和結構不統一的情況,通常會輔以人工操作,借助功能強大的可視化數據分析平臺將海量數據進行分析和整理,并做出完整的包含分析過程和數據圖表。本文采用的CiteSpace軟件是一款信息可視化軟件,主要用于分析可視共被引網絡,幫助探測知識領域中潛在的新趨勢[18,此次篩選為“Keyword”網絡節點,時間切片為1 a,運用CiteSpace軟件對“水文大數據”相關文獻中的關鍵詞進行聚類分析,經裁剪后可得到所選文獻中主要關鍵詞共現聚類圖[19。

2 主要研究力量分析

水文是關乎水利和國民經濟建設與發展重要的基礎工作。水文大數據被廣泛應用于防汛抗旱、水利工程規劃設計、水資源管理與開發利用、水環境保護、水科學研究及其他國民經濟建設。隨著科學技術的發展和人們生活水平的提高,大數據技術逐漸應用于水資源保護領域,無論是水文要素的監測還是水利工程的建設與平臺搭建,均離不開大數據技術的支撐。本文主要從發文趨勢、主要作者和研究機構3個方面概括性分析以“水文大數據”為研究主題的文章總體情況,如此分析更有利于了解這類文章的研究熱點和發展趨勢。

2.1 發文趨勢分析

圖1展示了該領域相關文獻的發表量情況。國內期刊論文中最早的有關“水文大數據”主題的論文發表于2008年,該文展示了在水文大數據驅動下的關于洪水預報模型方面的關鍵技術及應用,創新性地提出了在洪水預報方面一項新的科技成果。從2014年開始,國內期刊論文中“水文大數據”主題相關論文的發表量逐漸增多,并于2021年發表65篇相關論文,達到峰值。在WOS核心文獻集論文中,最早的相關論文是于2002年發表的2篇論文,這些文章討論并分析了長時間的高水位導致的棲息地環境質量的惡化、土壤濕度圖像的統計與分析等相關內容[20-21。從2002—2015年WOS數據庫相關主題的發文量比較穩定但數量較低。近些年發文量有較大增加,而圖中所展示2022年發文量下降,是由于所篩選的時間范圍截至到2022年12月1日,并未覆蓋2022年全年,此外由于2022年新冠疫情嚴重,受其影響學科研究有所下滑。圖1所示發文量的微小波動不足以闡明該領域具體的研究方向和變化趨勢,從整體來看,該領域的研究呈現上升趨勢。

綜合兩平臺的發文量數據進行分析,近幾年“水文大數據”主題的相關論文發表量增多較快,這說明水文大數據已開始被國內和國際相關機構注意并深入研究,逐漸成為這一方面的研究重點和熱點主題。近些年關于保護生態環境的關鍵詞頻繁出現于國內和國際人們的視野里面,所以水資源環境方面也逐漸得到重視。在大數據平臺的支撐下,水文行業高速進步,構建了許多科技平臺以供各種水文要素的監測和水生態環境的保護等的應用。水文大數據的應用需要跨領域的協同合作和數據共享,因此建立開放、高效的數據共享平臺和機制,對于推動水文大數據的應用具有重要意義。當前,全球已經涌現出許多開放式數據共享平臺,未來的研究將更加注重數據共享和協同創新。

2.2 研究作者分析

圖2可以直觀地表達國內和國際對于該研究主題發表過論文的作者情況。其中節點直徑越大代表該作者發表的相關論文越多,而節點之間的連線代表作者之間具有合作關系,節點和線條的顏色對應作者發表論文的時間[22。圖2a表明國內期刊論文作者間合作相對集中,發文量較多的作者是高露雄[23-25(10篇)、王立海[23-24(18篇)、張健[26-27(7篇)、劉榮華[28-29(25篇)和余國鋒[30(3篇)。其中高露雄研究員來自長江水利委員會水文水資源勘測局,與王立海所在的研究院有合著關系,主要研究內容為長江流域水文大數據平臺的架構以及GIS在水文方面的應用[23;圖2b所示,國際作者間合著關系相較于中國更為繁多,WOS文獻數據庫作者中發文量較多的是Tyralis(20篇)和Papacharalampous[31(20篇),其中Tyralis的主要研究方向為水文過程中出現的Hurst現象、貝葉斯統計及隨機水文學的應用[31。針對以上結論,隨著技術的不斷發展和應用場景的不斷擴展,水文大數據相關領域將會迎來更多的機遇和挑戰,加強各研究團隊之間的交流與合作有利于更快地推動該領域的研究發展,促進更多創新性成果的研究和發現。

2.3 研究機構分析

圖3a表明在國內主要發文機構中,發文量最多的是河海大學水文水資源學院,是在該領域較早進行開展相關研究的發文機構。圖3b可以發現,中國科學院(CAS)在國際上的發文機構間的合作較多,形成了較密集的聯系網,其主要研究方向為SWAT模型、分布式水文模型等結合大數據技術在流域中的應用等[32-36。與WOS期刊進行對比可以發現,加強合作和聯系有助于推進國內相關研究的發展,各研究機構應促進知識交融,通過相互交流可以發現更多學術上的新思想,進行更深度的探討。

3 主要研究熱點分析

3.1 關鍵詞聚類分析

圖4a中可以看出國內期刊可以分為“大數據” “智慧水文” “防汛抗旱” “預警系統” “水文數據共享”等幾個聚類,圖4b表明國際上的期刊可以分為“Deep learning” “Hydrological series” “Big data testing”等幾個聚類。其中“大數據技術”可以充分利用和融合多來源、多類型、多尺度的數據,突破傳統方式難以處理的管理瓶頸,獲得更高準確度的問題分析以及趨勢分析結果,從而促使對目標項目決策的制定[37,大數據分析技術已經在許多領域成功應用并取得了很大的效益,獲取了許多應用傳統手段難以獲取的信息,解決了應用傳統手段難以解決的問題[38;“智慧水文”是近些年提出的一個新興詞匯,是指應用云計算、物聯網、大數據、移動互聯網等新一代信息技術,對各種水文研究對象及水利活動進行透徹感知、全面互聯、智能應用等的現代化新模式[39-41;“Deep learning”即深度學習,作為人工智能的一個分支,現已被充分利用于水文水情預報、洪水預警、水質檢測、地形探測等智慧水利的工作中[42-43。

研究表明國內各研究機構將研究熱點放在技術與實際應用相結合的方面,依靠各種傳感器采集雨量及水位等水文信息,借助大數據技術根據具體情況對數據進行分析、處理以及存儲工作[44-45,與傳統的水文信息處理方式相比,這種方式更能體現水情信息的時效性和準確性;而國際上在該領域的研究重點側重于機器學習方面,更傾向于研究河流運動和各種水文現象的規律等方面。如某個預測地下水位變化的研究模型,將復雜網絡理論和水文學方法結合,構建一種地下水位變化預測模型,分析不同水文因素對地下水位變化的影響,通過科學的計算方法表明該模型預測的地下水位的變化趨勢,則該模型比傳統的統計模型具有更高的準確性和穩定性[46。

3.2 關鍵詞突現分析

圖5表明從突發時間來看,“水文模型”與“數據安全”等研究熱點在水文大數據主題相關的國內期刊中突發起始時間最早,“Digital elevation model”等研究熱點在國際期刊中突發起始時間最早,說明這些模型的構建在當時該領域已得到各位學者和研究機構的重視,并開始將研究重心往水文大數據模型架構的方向轉移;從突發強度來看,“物聯網”“智慧水利”等在水文大數據主題相關的國內期刊中突發強度較大,“Machine learning”在國際期刊中突發強度最大,這說明科學技術與水文的結合成為了當時各地研究機構的研究熱點問題,并逐漸將水文監測技術平臺與網絡和大數據等技術聯系起來,從而投入真正的生產生活中;從持續周期來看,“洪水預報”“防汛抗旱”等與防御洪水和預警預報等有關的關鍵詞在國內期刊中持續時間較長,“Digital elevation model” “Machine learning” “Artificial intelligence”等與大數據技術相關的關鍵詞在國際期刊中的凸顯持續時間較長,其涌現率一直持續至今,說明在水文領域內這些相關的技術為當前研究的主要發展趨勢,是近些年該領域重點聚焦的熱點前沿。人工智能、機器學習和深度學習等技術的應用,在水文大數據領域中的應用具有重要意義。這些技術可以自動分析、識別和提取水文數據的特征和規律,有效提高水文數據的預測和決策能力。未來的研究將會更加注重智能算法和模型的開發和應用。

4 結論

通過知識圖譜的可視化展示,可以得知國內和國際代表文獻中的研究人員、機構及熱點問題,較為直觀地了解到以上內容,同時對于水文大數據領域前沿的研究動態也有了進一步的認識。利用CiteSpace軟件進行數據分析和繪圖,對2002年1月1日—2022年12月1日與水文大數據研究領域相關的國內和國際代表文獻進行了文獻計量學分析,并得出了如下結論。

a)從發文量和發表趨勢進行分析,國內和國際期刊的發文量在整體上都呈現上升趨勢,近些年國內相關期刊發文量相較于國際增長更快,從某一程度上反映了水文大數據領域的研究熱度正持續上升。

b)從發文作者和研究機構方面分析,各研究機構和學者的合作均呈現“小聚集、大分散”現象,高露雄、王立海等多位研究人員以及河海大學和中國科學院等研究機構組成了國內和國際水文大數據領域研究的主要核心力量。根據圖2、3分析可知,加強作者和研究機構之間的聯系有助于推動該領域的研究進程,加強彼此思想上的碰撞,掀起更深層次的研究浪潮。

c)從關鍵詞聚類共現的方面分析,國內研究重點放在了大數據技術與水文信息的結合應用方面,如洪水預報、防汛抗旱等,與傳統的技術相比保證了水文信息的時效性和準確性;國際則側重于研究河流、湖泊等的運動規律及水文信息的收集方面如各種結合大數據技術后應用的水文模型,與傳統模型相比保證了水文信息的準確性和穩定性。

d)從關鍵詞突現時間分析來看,對各種水文模型的研究是最先出現的熱點問題,但近年來研究熱點逐漸偏向應用角度,如“防汛抗旱” “洪水預報” “Soil moisture”等,即將各項先進技術與水文領域的各項實際應用相結合。

隨著大數據技術的發展,水文大數據的研究也更加普遍。在各種因素的影響下,水文現象呈現不穩定的變化規律,水文大數據領域的研究應進一步得到關注,這也是新時代水資源可持續發展和生態系統水資源保護的研究熱點和重點所在。

參考文獻:

[1]蔡陽.智慧水利建設現狀分析與發展思考[J].水利信息化,2018(4):1-6.

[2]黃興春,邱鵬,黎春蕾,等.大數據技術對重慶水文發展的啟示[C]//2019(第七屆)中國水利信息化技術論壇論文集.河海大學:北京沃特咨詢有限公司,2019:116-119.

[3]張蕓.5G賦能智慧水文建設分析與建議[J].河北水利,2022(11):34-35.

[4]張建云,劉九夫,金君良.關于智慧水利的認識與思考[J].水利水運工程學報,2019(6):1-7.

[5]邱超,王威.基于云計算架構的水文大數據云平臺建設[J].人民長江,2018,49(5):31-35.

[6]曾金鳳.東江源區智慧水文的設計與實現[J].人民珠江,2018,39(3):11-15.

[7]芮孝芳.水文學與“大數據”[J].水利水電科技進展,2016,36(3):1-4.

[8]芮孝芳.論流域水文模型[J].水利水電科技進展,2017,37(4):1-7,58.

[9]芮孝芳.對流域水文模型的再認識[J].水利水電科技進展,2018,38(2):1-7.

[10]王麗娟.基于大數據分析方法的漢江流域安康段洪水預報研究[D].昆明:云南師范大學,2019.

[11]袁定波,艾萍,熊傳圣.水文時空數據挖掘方法及其應用評述[J].水利信息化,2018(1):14-17,22.

[12]林林.水利云平臺若干技術問題研究[D].北京:中國水利水電科學研究院,2016.

[13]胡金輝,孫穎娜,王寧,等.基于文獻計量學對流域產匯流研究的熱點分析[J].人民珠江,2021,42(9):41-46,104.

[14]唐中楠,楊國麗,李軍,等.基于文獻計量學的中國流域SCS模型研究現狀分析[J].人民長江,2021,52(10):95-100,106.

[15]李偉,石超.水文地質的研究進展與研究趨勢:基于CiteSpace的可視化分析[J].甘肅地質,2022,31(3):39-45.

[16]郭永麗,章程,吳慶,等.基于文獻計量學分析巖溶水文地質學研究熱點[J].中國巖溶,2020,39(6):817-828.

[17]秦長江,侯漢清.知識圖譜:信息管理與知識管理的新領域[J].大學圖書館學報,2009,27(1):30-37,96.

[18]劉光陽.CiteSpace國內應用的傳播軌跡:基于2006—2015年跨庫數據的統計與可視化分析[J].圖書情報知識,2017(2):60-74.

[19]陳悅,陳超美,劉則淵,等.CiteSpace知識圖譜的方法論功能[J].科學學研究,2015,33(2):242-253.

[20]OLDAK A,PACHEPSKY Y,JACKSON T J,et al.Statistical properties of soil moisture images revisited[J].Journal of Hydrology,2002,255:12-24.

[21]BENNETTS R E,KITCHENS W M,DREITZ V J.Influence of an extreme high water event on survival,reproduction,and distribution of snail kites in Florida,USA[J].Wetlands,2002,22:366-373.

[22]吳丹,向筱茜.中國水資源利用與經濟發展協調評價可視化分析[J].人民珠江,2022,43(12):82-91.

[23]高露雄,王立海.大數據背景下長江水文數據開放平臺設計研究[J].水利信息化,2021(6):88-92.

[24]王立海,肖志遠,高露雄.長江水文移動應用服務系統設計與實現[J].水利信息化,2014(5):26-30.

[25]高露雄,肖志遠.GIS在堰塞湖應急水文容積曲線計算中的應用[J].人民長江,2015,46(S1):51-53,63.

[26]徐勝,王琳,鄭文,等.黃淮流域天氣雷達應用系統介紹與應用分析[J].水文,2013,33(3):47-51.

[27]范輝,吳志勇,張健.VIC模型匯流方案的改進[J].水文,2012,32(5):7-11,86.

[28]劉榮華,孫朝興,田濟揚,等.山洪災害監測預報預警云平臺及應用[J].中國防汛抗旱,2022,32(1):63-69,95.

[29]李銳,劉榮華,田濟揚,等 山洪災害預警信息靶向服務系統設計及應用[J].水利水電技術,2021,52(7):33-43.

[30]余國鋒,袁亮,任波,等.底板突水災害大數據預測預警平臺[J].煤炭學報,2021,46(11):3502-3514.

[31]PAPACHARALAMPOUS G,TYRALIS H.Time Series Features for Supporting Hydrometeorological Explorations and Predictions in Ungauged Locations Using Large Datasets [J].Water,2022,14(10):2073-4441.

[32]孔繁翔,胡維平,范成新,等.太湖流域水污染控制與生態修復的研究與戰略思考[J].湖泊科學,2006(3):193-198.

[33]宋曉猛,張建云,占車生,等.氣候變化和人類活動對水文循環影響研究進展[J].水利學報,2013,44(7):779-790.

[34]劉昌明,李道峰,田英,等.基于DEM的分布式水文模型在大尺度流域應用研究[J].地理科學進展,2003(5):437-445,541-542.

[35]王中根,劉昌明,黃友波.SWAT模型的原理、結構及應用研究[J].地理科學進展,2003(1):79-86.

[36]石培禮,李文華.森林植被變化對水文過程和徑流的影響效應[J].自然資源學報,2001(5):481-487.

[37]劉晉高,方神光,許劼婧,等.基于河湖長制的河湖岸線智慧監管方案設計:以珠江三角洲河網區為例[J].人民珠江,2019,40(9):121-127.

[38]李冬杰,王愛娜,肖鳳林,等.大數據和云技術在省級山洪監測預警中的應用[J].水利信息化,2016(4):10-14.

[39]程海云.推進新時代長江水文高質量發展體系建設構想[J].人民長江,2023,54(1):88-97.

[40]毛興華.水文信息化思路與總體框架設計探討[J].水利信息化,2021(5):69-72.

[41]王培,王美玲,曹曉寧.江蘇水文自動測報系統智慧化運維研究與設計[J].水利信息化,2019(3):1-3,9.

[42]孫濤,王雷,付文博,等.深度學習在水利行業上的應用綜述[J].中國農村水利水電,2018(12):90-93,100.

[43]MARCAIS J,DE DREUZY J-R.Prospective Interest of Deep Learning for Hydrological Inference[J].Groundwater,2017,55(5):688-692.

[44]翟思貝,范海玲,楊波.基于水文大數據分析技術的洪澇災害預警系統設計[J].水利技術監督,2022(5):53-56,74.

[45]謝宇揚.云平臺下的水文監測數據共享模式研究[D].西安:西安科技大學,2019.

[46]李嬌,等.基于復雜網絡的地下水位變化預測模型研究[J].水利科技進展,2019,39(4):1-8.

(責任編輯:程 茜)

猜你喜歡
可視化分析知識圖譜
高校學生管理法治化研究:基于CiteSpace的可視化分析
我國職業教育師資研究熱點可視化分析
聲波吹灰技術在SCR中的應用研究
可視化分析技術在網絡輿情研究中的應用
國內圖書館嵌入式服務研究主題分析
國內外政府信息公開研究的脈絡、流派與趨勢
基于知識圖譜的產業集群創新績效可視化分析
基于知識圖譜的產業集群創新績效可視化分析
基于知識圖譜的智慧教育研究熱點與趨勢分析
從《ET&S》與《電化教育研究》對比分析中管窺教育技術發展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合