?

科研數據存檔工作探析

2021-08-11 18:25于喆杜靜高祥剛
檔案管理 2021年4期
關鍵詞:數據質量檔案管理

于喆 杜靜 高祥剛

摘 要:本文以海洋漁業類科研院所為例,對其科研項目結題驗收后所產生的科研數據存檔的問題進行了探討。

關鍵詞:數據存檔;科研數據;科研項目檔案;數據質量;檔案管理

科研數據是重要的無形資產,應當得到規范的管理。數據存檔(Data Archiving)是將不再經常使用的數據,遷移到一個單獨的存儲介質或系統中來進行長期保存的過程。[1]

海洋和漁業類的科研院所涉及學科和專業廣泛,包括海洋科學、海洋化學、物理海洋、海洋生物、地理信息、漁業資源、水產養殖、海洋經濟等等,因此其在科學研究和業務工作中產生的數據也是包羅萬象。本文以此類科研院所作為典型案例對科研數據的存檔工作進行了探討和分析。

在傳統的科研項目檔案管理工作中,項目在結題驗收后,其相應的立項文件、合同、技術報告、驗收報告等一系列的紙質材料原件都將整理存檔,而項目中產生的數據往往被忽略。數據作為科研項目的重要產出,對項目的工作、結論等起著重要的支撐作用,應得到規范的保存,以便后期相關科研工作的追溯查閱。

圍繞科研項目工作中產生的數據及其衍生數據為項目承擔單位的重要成果,應作為無形資產妥善存儲。國務院辦公廳于2018年印發了《科學數據管理辦法》的通知(國辦發〔2018〕17號),對加強和規范科學數據的管理作出了重要的指導意見,科研項目的檔案管理工作也應當與時俱進,在原始材料存檔的同時,做好科研數據存檔工作。[2]

1 國內外相關工作的開展情況

包括科研數據存檔在內的科研數據管理工作需要管理制度先行、信息技術支撐、多方人員參與,才能順利完成。美國的頂尖科研機構和管理機構,如,美國國家衛生研究院(NIH),美國科學基金會(NSF),美國國家海洋和大氣管理局(NOAA),自2003年開始,就相繼制定了科研項目中科學數據管理的相關制度,并在項目申請階段就要求提交一份詳細的數據管理報告。隨后,各頂尖高校自2008年開始,均制定了科學數據管理的相關規定,采用了如DMP、DMP TOOL、DMP Online等開源軟件來實現數據的管理,科研人員、教職工、學生等多方參與的同時管理團隊也提供各類咨詢和服務。[3]

在我國的一些重點高校,相關的工作已經開展,一般由圖書館的“知識中心”作為牽頭部門,高校的信息中心作為技術支持、相關院系作為數據的提供方來完成(圖1),北京大學圖書館對社會研究、地球物理、大氣科學、計算機科學等10余個學科的科研數據不僅實現了歸類存儲,而且已經有序地面向社會共享(https://opendata.pku.edu.cn)。[4]

然而,在我國的一些中小型的科研院所未必有圖書館或文獻中心這樣的部門,同時科研數據是重要的科研成果產出,可歸為科研成果管理的一部分,結題項目數據的保存,可歸為數據檔案管理工作的范疇,如圖2,由科研管理部門牽頭組織,科研數據由各業務部門在結題時或周期性的在檔案管理部門的科研數據管理系統存檔,由信息中心作技術支撐。[5]

2 數據分類和特性

海洋漁業類的科研院所涉及的數據類型較廣,主要包含:水文數據、水產養殖數據、資源調查數據、地理信息和遙感數據、生物基因數據、海洋漁業經濟數據、調查類影像數據等,單個數據文件所占計算機的存儲的空間從幾KB(如數據表格)到幾GB(基因序列數據)不等。[6]對于科學數據并未作出詳細的保密等級分類,一般根據科研項目委托方的要求進行處理,除委托方要求銷毀的數據或機密數據外,均應存檔。數據的存檔與紙質原件的存檔有著很大的不同,應采用妥善的信息技術手段完成。[7]

科研項目完成后,數據的存檔和管理方式有多種:個人計算機、檔案室光盤、本地NAS、專線私有云等。

表1為各存儲方式表現指標的對照參考,普通光盤在妥善保存的情況下其數據可保存10年以上,如需查詢需提出申請去檔案室借閱,整個過程不易監管,便利性差。個人計算機的硬盤(包括移動硬盤)斷電的情況下數據最多保存5年,硬盤的物理特性導致其極易損壞,局域網NAS的磁盤陣列由于不斷電和不間斷的維護可以長期保存,建立數據管理系統后可根據角色分配權限,并授權數據的訪問和使用。專線私有云的服務器可采用多種介質存儲,對于數據檔案存儲多采用藍光光盤,實現大容量、低功耗的長期存儲。

表1中的經濟成本主要指電力、維護、人員等綜合經濟成本。光盤跟隨項目紙質材料存檔成本很低,項目組自行以磁盤存檔成本會較高,且各項目組分散存儲自行管理顯然資源利用率更低。

近些年,涌現了阿里云、E華錄、浪潮等網絡資源供應商。在有資質的專業運營商的支持下建立私有云的方式存儲管理數據,要比本地自行建設的成本更低,同時專線的私有云與互聯網物理隔絕可保證安全性。[8]

3 科研數據管理系統信息技術部署方案

科研數據管理系統(Science Data Management System)架構圖如圖3所示。系統運行在私有云(Virtual Private Cloud)中,連接有數據庫,存儲介質采用藍光存儲系統,保障其長期和低成本的存儲??蒲腥藛T通過本地局域網的緩存系統中轉向私有云內的SDMS匯交數據,同時SDMS也提供數據目錄清單查閱,用戶向管理人員申請即可授權獲取查閱數據。[9]

最簡單的數據管理系統可以FTP服務的方式呈現,也可使用國外高校開發的開源工具如DMP(Data ManagementPlatform)或者自行研發。對于高敏感數據,可設置保密工作室、無盤工作站等手段來進行數據訪問,避免數據泄露。[10]

4 科研數據存檔工作的協調和推進

科研數據存檔工作,需要管理部門、信息技術支持部門、科研業務部門多方參與。牽頭部門要充分考慮本單位的實際情況,制定完善的管理制度,向科研業務部門解釋清楚此項工作的目的和意義,避免誤解。[11]此項工作要與科研績效掛鉤,使科研項目的結題要與數據的存檔同步完成,避免科研部門的消極應付情況發生。管理部門和項目組應建立完善的數據質量評價體系,對數據在產生、流轉、傳輸、存檔的過程中起到監督作用。檔案管理員應轉變思維,理解新時代檔案的新定義。

猜你喜歡
數據質量檔案管理
如何規范檔案管理
檔案管理中的電子檔案管理
檔案管理與企業內部控制關系的思考
電子商務平臺數據質量控制系統及仿真模型分析
強化統計執法提高數據質量
淺析統計數據質量
金融統計數據質量管理的國際借鑒與中國實踐
淺談統計數據質量控制
論科研項目檔案管理
加強工程項目檔案管理的有效途徑
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合