?

中國湖泊科學數據共享的路徑和方法

2024-01-11 10:40馬榮華許金朵侯渲王貞
關鍵詞:中國科學院湖泊數據中心

馬榮華,許金朵,侯渲,王貞

1.中國科學院南京地理與湖泊研究所,南京 210008

2.國家地球系統科學數據中心湖泊–流域分中心,南京 210008

引 言

科學數據是科研人員從事基礎應用研究過程中產生的數據,或者通過野外調查、野外試驗、野外觀測、室內實驗、檢測檢驗等方式取得的、用于科學研究的原始數據及其衍生數據,包括實驗記錄手稿、電子表格或文本、電子圖片或視頻、軟件代碼等??茖W數據是科研人員的生命線。不同的科研活動,會產生不同類型、不同數量的科研數據??蒲袛祿袝r候是巨大的,稱為海量數據,后來又稱為大數據(mega data)。

大數據的概念起源于美國,由思科、甲骨文、IBM 等公司發起并發展。全球頂級期刊《Nature》在2008 年9 月推出了“Big Data”???,其主旨就是為了研討大數據發展對生物醫學、環境科學、互聯網技術以及超級計算等多個科技領域所帶來的挑戰[1]。2009 年開始,“大數據”成為互聯網信息技術行業的熱門詞匯,用于指代超出了常規機器或者軟硬件工具捕捉、管理和處理能力,而在一定時間范圍內難以處理的數據集合[2]。2011 年2 月,《Science》推出“Dealing with Data”??痆3],通過社會調查的方式,第一次綜合分析了大數據對人們生活造成的影響,詳細描述了人類面臨的“數據困境”。2012 年開始,大數據成為全球科學研究的新熱點。大數據具有如下5V 特征[4]:(1)體量大(Volume),即從GB、TB 級躍升到PB 乃至EB 級別;(2)類型多(Variety),包括結構化數據、半結構化數據和非結構化數據,如我們日常生活中所產生的視頻監控數據、流媒體數據、射頻識別RFID 數據、感應數據等[5],超過80%都是典型的非結構化數據;(3)價值大(Value),單條數據并無太多價值,但由巨量的數據匯聚所形成的數據集中蘊含著巨大的價值[6];(4)變化快(Velocity),這是大數據區分于傳統數據挖掘最顯著的特征;物聯網分分秒秒都在采集數據,微博內容時時刻刻都在更新,處理速度達到每小時10 TB 或更高;(5)準確性好(Veracity),數據準確性好、可信賴度高,即數據質量高。因此,對于大數據的處理和分析更加艱巨、更加復雜,大數據很難由單臺計算機處理,須采用分布式計算架構,依賴云計算的分布式處理、分布式數據庫、云存儲和/或虛擬化技術[7]。

進入大數據時代,國家高度重視數據共享工作。為進一步加強和規范科學數據管理,以保障科學數據安全,提高開放共享水平,更好支撐國家科技創新、經濟社會發展和國家安全[8],國務院于2018 年3 月印發施行了我國首部針對科學數據管理與共享的法律規范《科學數據管理辦法》(國辦發〔2018〕17 號),明確提出了“分級管理、安全可控、充分利用”的原則;2019 年2 月,中國科學院在落實國家《科學數據管理辦法》的基礎上,印發了《中國科學院科學數據管理與開放共享辦法(試行)》(科發辦字〔2019〕11 號)[9];2019 年6 月,科技部和有關部門在前期工作的基礎上,組建了20 個國家科學數據中心;2022 年12 月19 日,《中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見》(即“數據二十條”)[10]對外公布。

湖泊是由湖盆、湖水和水中所含物質以及水生生物組成的自然綜合體,是組成地球表層系統的重要單元之一,是包括大氣圈、生物圈、巖石圈、陸地水圈等在內的地球表層各圈層相互作用的聯結點,是流域生物地球化學要素循環的中心樞紐和物質能量的匯,是流域生態環境變化的指示器[11];湖泊生態系統對全球變化的響應顯著。湖泊科學數據作為支撐國家科技創新和經濟社會發展的重要基礎性戰略資源之一,湖泊科學數據采集能力也隨著我國科技創新能力和投入不斷增強而持續提升,具有大數據5V 的顯著特征,大數據為湖泊科學研究提供了一種新途徑、一個新思路。湖泊科學數據共享逐漸成為我國國家科技創新體系建設的重要內容,也是大數據時代科技創新和經濟社會發展的重要基礎。

1 湖泊數據生產渠道

科學數據作為科技創新的基石,湖泊科學數據驅動湖泊科學研究的創新,而湖泊科學數據主要來源于野外考察調查,數據獲取費時費力,長時間序列的觀測數據獲取主要依賴于固定的野外觀測站點,特別是進入國家序列的野外科學研究觀測臺站(太湖湖泊生態系統國家野外科學觀測研究站(“太湖站”)、東湖湖泊生態系統國家野外科學觀測研究站(“東湖站”)、梁子湖湖泊生態系統國家野外科學觀測研究站(“梁子湖站”)、洞庭湖湖泊濕地生態系統國家野外科學觀測研究站(“洞庭湖站”)、興凱湖湖泊濕地生態系統國家野外科學觀測研究站(“興凱湖站”)、鄱陽湖湖泊濕地綜合研究站(“鄱陽湖站”)),能夠穩定、持續開展監測任務,并將監測數據進行了不同程度的開放共享。其中太湖站、東湖站、梁子湖站通過國家生態系統觀測研究網絡科技資源服務系統(http://www.cnern.org.cn/)共享了2004–2016 年的常規站點監測數據,共享的數據類型包括了氣象、湖泊浮游植物、湖泊底棲動物、湖泊大型水生植物、湖泊微生物、湖泊浮游植物葉綠素、湖泊浮游植物初級生產力、湖泊水物理、湖泊水化學、湖泊沉積物等數據資源。共享方式以協議共享為主,即需要用戶提出申請野外臺站進行審批同意后數據方可下載使用,部分氣象數據可直接下載使用。洞庭湖站、興凱湖站以及鄱陽湖站通過國家生態科學數據中心(http://www.nesdc.org.cn/)發布了洞庭湖2012–2016 年洲灘土壤元素含量、南荻生態系統通量和常規氣象數據,興凱湖2011–2018 年水體物理和化學指標監測數據以及“浮毯”沼澤植物組成動態數據,鄱陽湖2013–2018 年水環境監測數據以及水體富營養化指標空間分布數據,共享方式為直接下載。

目前,我國上述6 個國家級野外觀測臺站的數據開放程度最高,但數據共享的時效也不同程度地存在滯后。據不完全統計,其他我國水域野外科學觀測站點還有:撫仙湖高原深水湖泊研究站(中國科學院南京地理與湖泊研究所)、呼倫湖生態系統定位觀測研究站(中國科學院南京地理與湖泊研究所)、天目湖流域生態觀測研究站(中國科學院南京地理與湖泊研究所)、博斯騰湖濕地生態系統觀測點(中國科學院南京地理與湖泊研究所)、青海湖高原湖泊濕地生態環境科學觀測野外臺站(中國科學院水生生物研究所)、南水北調東線湖泊生態系統湖北省野外科學觀測研究站(中國科學院水生生物研究所)、三峽水庫香溪河生態系統實驗站(中國科學院水生生物研究所)、查干湖生態系統定位觀測研究站(中國科學院東北地理與農業生態研究所)、洪湖濕地生態系統湖北省野外科學觀測研究站(中國科學院測量與地球物理研究所)、紅楓湖湖泊生態系統研究站(中國科學院地球化學研究所)、滇池湖泊生態系統云南省野外觀測研究站(昆明市滇池高原湖泊研究院)、內蒙古烏梁素海濕地生態系統國家定位觀測研究站(內蒙古農業大學)、華北淺水湖泊濕地生態系統野外科學觀測研究站(河北大學)、丹江口濕地生態系統野外科學觀測研究站(中國科學院武漢植物園)等。這些臺站所積累的科學觀測數據暫未對外提供公開開放共享。

除了野外科學研究觀測臺站外,湖泊科學數據的積累還來源于大量的科研項目的觀測數據、調查數據、實驗數據以及計算模擬分析數據等[12],科研項目類型包括國家重點研發計劃、國家科技基礎資源調查專項、國家重大專項“水體污染控制與治理科技重大專項(水專項)”、中國科學院先導專項、國家重點基礎研究發展計劃(973 計劃)、國家自然科學基金等項目。

由于受到人力、物力、財力、天氣和水文條件的限制,常規人工監測難以進行長時間追蹤和監測,只能了解監測斷面上的水質或水環境狀況。盡管這些數據具有局部和典型樣點的代表意義,但對于整個水體而言,數據的代表性并不充分,無法滿足實時、大尺度的監測評價需求[13]。遙感技術具有大范圍、快速實時、周期性的特點,彌補了傳統人工觀測手段的不足,被廣泛應用于湖泊水體邊界、藻類水華、水生植被以及水質衛星遙感監測產品的生產[14]。目前基于衛星遙感手段生產典型的、廣泛應用的數據集/庫主要有:(1)覆蓋全球140 萬個表面積至少為10 公頃湖泊或水庫矢量邊界的HydroLAKES 數據庫[15];(2)1984–2019 年間全球340 萬個面積≥0.03 km2的全球湖泊邊界數據集GLAKES[16];(3)全球面積大于0.1 km2的248 243 個湖泊(面積總量占全球湖泊面積的57.1%)的藻華爆發頻率及爆發面積數據集[17];(4)全球10 km2以上約14 700 個自然湖泊2003–2020 年水位-水量變化的空間分布數據集[18];(5)全國1 km2以上2660 個湖泊近四十年(1986–2020)長時序的透明度數據集[19]。

除此以外,國際上對觀測數據的管理與共享,建立了許多部門和行業數據中心來為公眾提供數據共享[20]。如世界數據中心(World Data Center,WDC)、地球觀測組織(Group on Earth Observations,GEO)、全球陸地觀測系統(Earth observation system,GTOS)、地球觀測數據網(The Canadian Earth Observation Network,GeoNET)、世界溫室氣體數據中心(World Data Centre for Greenhouse Gases,WDCGG)、德國遙感數據中心(the German Remote Sensing Data Center,DFD),旨在促進與推動國際科學數據的共享。

2 湖泊數據類型及格式

湖泊科學是一門研究地球表層系統重要單元的交叉學科[21],湖泊科學數據覆蓋的學科范圍廣,包括了自然地理、水物理、水化學、水文學、氣象學、沉積學、環境科學、生態學等多個學科方向。數據類型及數據格式復雜多樣,既有觀測類表格文本型數據、空間矢量柵格數據,也包含了特定觀測儀器產生的特定格式,數據格式涵蓋了xls、txt、doc、shp、tif、hdf、img 等(表1)。

表1 湖泊數據類型Table 1 Types of lake data

面對多源異構、復雜多樣的湖泊數據,其整編需要建立一套標準的規范體系。為提高野外調查數據的規范性,保障監測數據質量,使調查數據具有可比性,編著了《湖泊調查技術規程》[22](2015),對湖泊調查、樣品采集、分析測試方法進行了標準規范的統一,包括湖泊水質調查規程、湖泊水量調查規程、湖泊生物資源調查規程、湖泊沉積物量調查規程、湖泊沉積物質量調查規程、湖泊衛星遙感調查技術規程以及湖泊數據整編技術規程。在湖泊數據的整編方面,對湖泊編碼的規范、湖泊數據加工處理的規范,以及湖泊水質、水量、生物資源、沉積物、衛星遙感監測等各類數據的集成、加工、整編、入庫進行了統一的規定。

中國科學院南京地理與湖泊研究所是我國唯一以湖泊–流域為研究對象的國家級科研機構,通過對湖泊科學數據進行了系統的加工整理,構建了湖泊科學數據分類體系,以此為基礎建設了中國湖泊科學數據庫(http://www.lakesci.csdb.cn/)、湖泊–流域科學數據共享平臺(http://lake.geodata.cn/)。

3 湖泊科學數據的共享現狀

目前,在全球科學家的共同努力下,湖泊科學數據的開放共享已初具規模:(1)世界湖泊網:世界湖泊網(http://www.worldlakes.org/)[23]是1998 年建立的美國非營利組織,共享世界8000 多個湖泊的位置、海拔、深度、水量等信息;(2)WDS(World Data System)成員PANGAEA:PANGEA[24]是世界數據中心WDS 的成員,收集、發布、共享和出版地球和環境領域科學數據,共收錄了800 個湖泊和河流相關數據集;(3)中國湖泊科學數據庫(http://www.lakesci.csdb.cn)[25]:由中國科學院南京地理與湖泊研究所建設,發布了全國1 km2以上2693 個湖泊空間位置、大小、形狀以及湖泊相關的水系、流域信息、典型湖泊的水質觀測、藍藻水華監測數據;(4)湖泊–流域科學數據共享平臺(http://lake.geodata.cn)[26]:國家地球系統科學數據中心的湖泊–流域分中心,面向湖泊科學領域收集、整編、發布和共享數據,目前收集國內湖泊科學領域約60%數據,發布數據集891 個,數據資源量累計30 TB;(5)中國科學院南京地理與湖泊研究所科學數據中心:中國科學院南京地理與湖泊研究所科學數據中心(http://data.niglas.ac.cn)[27]是中國科學院科學數據中心,收集研究所科研項目和論文關聯數據,目前已發布數據集568 個,數據資源量約10 TB。另外,國家生態系統觀測網絡(http://cnern.ac.cn/index.action)也發布了部分湖泊觀測數據。

BIM技術能夠提高成本核算的速度:數據分析速度較快,匯總能力較強,工作效率較高。BIM技術能夠增強成本核算的準確性,采用先進技術進行成本核算,減少成功核算過程中的失誤(見圖30)。

4 湖泊數據共享的路徑和方法

為進一步加強科學數據管理,保障科學數據安全,提高科學數據開放共享水平[8],2018 年,科技部和財政部共同研究制定了《國家科技資源共享服務平臺管理辦法》[28],隨后國務院辦公廳印發了《科學數據管理辦法》[8](國辦發[2018] 17 號)。為落實上述兩個《辦法》,科技部與財政部以“完善科技資源共享服務體系,推動科技資源向社會開放共享”為建設目標,于2019 年在原有的國家科技資源共享服務平臺基礎上進行優化調整,建設了包含高能物理、基因組、對地觀測、地球系統、人口健康、農業、林業、氣象、海洋等在內的20 個國家科學數據中心[29]。中國科學院為落實國家《科學數據管理辦法》,為了進一步加強中國科學院科學數據管理,保障科學數據安全,提高科學數據開放共享水平,于2019 年2 月印發了《中國科學院科學數據管理與開放共享辦法(試行)》[9],提出了科研項目數據匯交的要求,加強科研論文關聯數據匯交管理,明確科學數據開放共享的原則和主體責任,并隨之開展了中國科學院科學數據中心體系建設,由1 個總中心、18 個學科中心和12 個所級中心三類組成,實現中國科學院科學數據的常態化、規范化匯聚管理與安全開放共享。2021 年,又印發了《中國科學院科學數據中心管理暫行辦法》(科發辦字[2021]61 號),并發布《中國科學院科學數據工作要點》[30]。國家相關部門和中國科學院對科學數據管理與共享空前重視。

為保障國家科學數據安全,防止數據流失,把我國的關鍵科學數據“牢牢掌握在手中”,國家層面針對重大項目制定了系列數據匯交管理辦法[31]。早在2008 年,科技部就頒布了《國家重點基礎研究發展計劃資源環境領域項目數據匯交暫行辦法》,啟動了“973”計劃資源環境領域項目數據匯交工作,實現了已結題的103 項“973”計劃資源環境領域項目數據匯交清單發布[32],其中包含湖泊科學相關的項目6 項,共匯交數據集285 個[33]。2014 年5 月,科技部發布了《科技基礎性工作專項項目科學數據匯交管理辦法(試行)》[34];截至2019 年底,已完成1999–2015 年結題驗收的科技基礎性工作專項項目的數據匯交,共計331 項,占所有立項項目的76.1%,對外發布共享的湖泊科學相關的科技基礎工作專項項目6 項[35],共匯交64 個數據集。2017 年5 月,科技部印發《國家重點研發計劃管理暫行辦法》[36]。2019 年12 月,科技部辦公廳印發《科技計劃項目科學數據匯交工作方案(試行)》(國科辦基〔2019〕104 號),明確了科學數據匯交原則、關聯主體與職責、主要內容與流程,加快推進科技計劃項目科學數據匯交。中國科學院為進一步優化和完善中國科學院戰略性先導科技專項的管理,促進重大成果產出,2022 年9 月,中國科學院在國家相關法規、辦法的基礎上,結合先導專項實際情況,印發了《中國科學院戰略性先導科技專項科學數據匯交管理實施細則(試行)》(科發規字〔2022〕47 號)[37],指導先導專項有效、保質地完成數據匯交工作,使中國科學院科學數據作為國家戰略性資源得以安全保存和利用。

為加強和規范科學數據管理,保障科學數據的安全,防止數據資源流失,中國科學院還將目光投向了期刊論文關聯數據。2021 年,中國科學院傳播局印發《中國科學院科學傳播局關于進一步加強和規范論文關聯數據管理的通知》(傳播字〔2021〕2 號);2022 年印發《中國科學院科學傳播局關于從嚴監管論文關聯數據匯交工作的通知》(傳播字〔2022〕3 號),從嚴監管論文關聯數據匯交工作,開展院內論文關聯數據的匯交工作。此項舉措保障了院內科研論文關聯數據的匯交共享。

在湖泊科學數據的共享路徑與方法上,中國科學院南京地理與湖泊研究所湖泊–流域科學數據中心(以下簡稱“數據中心”),致力于湖泊科學數據的收集、集成、整編、加工整理與共享。為促進湖泊科學數據的共享,節約項目經費使用,中國科學院南京地理與湖泊研究所制定了研究所內數據購買報銷制度。截至目前,此項措施收集積累衛星遙感影像、土地利用、社會經濟、水文氣象、水質等數據量共81 GB。購買的數據面向所內人員免費開放共享,此項舉措節約了科研人員的大量科研經費。此外,數據中心制定了所內自主設立課題數據匯交制度,鼓勵研究所自主設立課題的項目數據匯交。數據中心制定了系列的規章制度來保障中心的可持續運行,在共享服務方面,采取數據分級分類共享策略。

數據中心以湖泊–流域科學數據共享平臺為依托,整合的數據資源按照數據類型、共享權限等劃分等級,依據一定的共享策略提供共享服務,采取相應的服務模式保證服務質量,使共享資源的服務長期穩定運行(圖1)。

圖1 我國湖泊科學數據共享路徑和方法Figure 1 Shared strategies and methodologies of lake science data

(1)共享權限分級

湖泊科學共享權限分級形式包括數據密級分級共享、用戶積分共享以及數據提供者審核共享三種形式。

①按照數據密級分級共享:劃分為秘密數據、次密數據和公開數據。

③數據提供者審核共享:數據提供者向平臺匯交數據,數據申請者在數據共享使用時,需要提出申請,數據提供者同意后,平臺可向申請者發放數據,提供共享服務。

(2)服務流程

湖泊科學數據共享的服務流程有以下幾種模式:①離線服務共享;②在線服務的數據密級和積分策略共享;③在線服務的數據提供者審批共享。

①離線服務共享:用戶離線填寫數據使用申請,通過離線的形式郵寄到數據中心,由數據中心服務人員受理,根據用戶申請的數據范圍和類型來判斷分發數據的方式。如果申請的數據是公共類型的數據,則采用離線的方式,通過郵寄等分發給用戶;如果該數據的使用需要獲取數據擁有者的同意,則由平臺服務人員聯系數據擁有者,咨詢數據擁有者意見,征得同意后,采用離線的方式和用戶簽署數據保密協議,平臺服務人員收到數據申請者簽署后的保密協議后,再將數據離線分發給用戶;如果數據屬于密級數據,則和用戶離線簽署數據保密協議,按照國家密級數據使用的相關規定,指導用戶使用。

②數據密級和積分策略共享:數據用戶提出數據使用申請,數據中心收到使用申請后,根據數據的可公開性進行審核,公開共享數據可通過國家地球系統科學數據中心湖泊–流域分中心(http://lake.geodata.cn)或中國科學院南京地理與湖泊研究所科學數據中心(http://lake.data.ac.cn)進行申請獲??;若是非公開數據,數據中心判斷根據用戶積分情況進行審核。

③數據提供者審批共享:對該類共享條件的數據,數據中心將湖泊科學數據的審核權限轉交至數據提供者,根據數據提供者的審核意見來提供數據。

通過這3 種共享服務方式,保障了密級數據資源的安全、數據提供者的知識產權以及處理權,使數據申請者最大程度獲益,同時也激勵數據申請者轉變為數據提供者,擴大數據資源積累。

(3)質量控制

湖泊科學數據共享數據,遵守“FAIR”原則,即可發現(Findable)、可訪問(Accessible)、可互操作(Interoperable)和可重復(Reproducible)。共享數據的質量,采取一體化流程進行質控,貫穿整個數據生命周期。原始數據知識產權歸屬數據提供者,原始數據質量由數據提供者負責。數據中心在數據發布共享的過程中,數據進行二次校驗。第一次由數據中心對數據進行質量校驗,發現異常值和數據生產者進行確認;第二次發布數據前邀請業內專家對數據質量把關,對存在問題的數據反饋給數據生產者進行修改校正。共享發布的過程中,數據質量采取“五位一體”的原則,即每個發布的數據集要具有數據說明文檔、數據縮略圖、元數據、數據樣例,以及數據實體。

(4)共享成效

數據中心自2011 年至2023 年9 月以來,通過上述的共享方式與共享流程,面向國內外用戶共提供了12 941 次共享服務(圖2),開展典型服務82 項,專題服務92 項;服務各類科研項目3640項,其中國家重大項目1035 項,國家自然科學基金1343 項,省部級項目與國際合作項目1262 項;支撐發表SCI/EI 等各類論文共1788 篇,支撐授權軟著49 項,發明專利37 項,共享成效顯著。

圖2 數據中心2011–2023 年日常服務情況Figure 2 Daily shared-service of data center from 2011 to 2023

5 中國湖泊科學數據共享保障

國務院辦公廳在2018 年3 月17 日印發了《科學數據管理辦法》,其目的就是為了進一步規范科學數據管理,提高科學數據共享的水平[8]。對促進科學數據共享工作具有開創性意義;2019 年2 月,中國科學院在此基礎之上印發了《中國科學院科學數據管理與開放共享辦法(試行)》,為科學數據開放共享提供規范制度的同時,也對科學數據安全進行保護,加強科學數據管理,是中國科學院實施國家大數據戰略的重要舉措[9]。

中國科學院南京地理與湖泊研究所為保障湖泊科學數據的共享與使用,制定了系列的規章制度,包括《湖泊數據整編規程》《中國湖泊沉積物底質調查數據整編技術規程》《中國湖泊衛星遙感調查技術規程》《湖泊–流域科學數據元數據規范V1.0》《湖泊–流域科學數據整編技術規范V1.0》《湖泊–流域科學數據質量控制規范(試行稿)》和《湖泊–流域科學數據整合集成方案》。制定了一系列數據管理與數據共享的規范制度:《中國科學院南京地理與湖泊研究所科學數據管理辦法(試行)》《湖泊–流域科學數據共享條例》《湖泊–流域數據共享平臺數據共享積分政策(試行)》《湖泊–流域科學數據保密協議》《湖泊–流域科學數據轉讓保密協議》《中國科學院南京地理與湖泊研究所科研項目數據匯交管理辦法》和《中國科學院南京地理與湖泊研究所期刊論文數據匯交方案》。

6 湖泊科學數據共享存在的問題

中國湖泊科學數據資源數據共享服務雖取得了一定的成效,但是仍然存在一些問題和困難:①國內從事湖泊科學研究機構眾多,湖泊科學數據資源分散,不同單位(大學、科研院所、政府事業單位)、不同部門(院系、處室)、不同科研團隊、不同臺站,信息孤島以及數據壁壘問題,難以短時間內容消除;②有價值的核心科學數據資源大多掌握在科研人員手中,這些數據是科研人員的核心競爭力,導致共享意愿不強烈;③在饋贈數據提供者方面,目前主要以論文標注、致謝等方式,導致了推廣及傳播效果不是很顯著。

7 展望

隨著大數據時代的到來,信息化已進入了新階段,數據密集型科研已經成為大數據時代科學發展的新模式,科學數據開放共享已成科技界的普遍共識[38]。黨中央、國務院高度重視數字經濟發展,“推動大數據技術產業創新發展、構建以數據為關鍵要素的數字經濟、運用大數據提升國家治理現代化水平、運用大數據促進保障和改善民生、切實保障國家數據安全”的戰略,是我國構筑大數據時代國家綜合競爭新優勢的必由之路。未來很長的一段時間內,湖泊科學數據共享要在下面幾個方面持續發展:

(1)成立湖泊數據共享聯盟,建立同盟機制,最大限度地聚合湖泊學科數據資源,建立長時間序列的、要素信息完整的數據集;確立湖泊科學數據資產地位、定量價值地位,打破行業、部門之間的數據壁壘,助力湖泊數據融入應用場景,釋放湖泊數據資源真正價值;

(2)構建集成由數據資源、開源平臺、API、數據基礎設施、數據挖掘與分析、數據應用等板塊構成的湖泊大數據生態系統;持續構建可伸縮的湖泊生態環境治理保護的計算體系結構,提高湖泊數據處理和再分析能力;建立完善的湖泊數據安全機制,實現湖泊數據要素安全流通,釋放科學數據資源價值。

(3)國家層面,大力推進數據共享事業的發展,形成數據共享的濃厚氛圍和利劍行動,推進人大立法,制定實施《中華人民共和國數據共享法》。

致 謝

本研究得到中國科學院“十四五”網絡安全和信息化專項(CAS-WX2022SDC-SJ05,CASWX2021SF-0306)資助。

作者分工職責

馬榮華(1972—),男,山東臨沂人,研究員,研究方向湖泊環境遙感與數據共享。主要承擔工作:論文框架構建、主體撰寫以及文章校驗。

許金朵(1982—),女,江蘇徐州人,高級工程師,研究方向數據庫建設、數據共享。主要承擔工作:文章修改與校對。

侯渲(1998—),男,甘肅天水人,工程師,研究方向數據庫建設、數據共享。主要承擔工作:負責相關規章制度的整理與校對。

王貞(1983—),女,河南安陽人,工程師,研究方向湖泊水文。主要承擔工作:文章的修改與校對。

猜你喜歡
中國科學院湖泊數據中心
《中國科學院院刊》新媒體
酒泉云計算大數據中心
中國科學院院士
——李振聲
祝賀戴永久編委當選中國科學院院
你相信嗎?湖泊也可以“生死輪回”
民航綠色云數據中心PUE控制
“害羞”的湖泊
奇異的湖泊
《中國科學院院刊》創刊30周年
基于云計算的交通運輸數據中心實現與應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合