?

我國科研機構科研數據管理現狀調研*

2019-01-15 11:12邢文明楊玲
數字圖書館論壇 2018年12期
關鍵詞:數據管理科研人員政策

邢文明 楊玲

(湘潭大學公共管理學院,湘潭 411105)

隨著大數據時代和數據密集型研究范式的到來,科研數據的開放與共享在國內外受到越來越廣泛的重視。相關研究顯示,盡管科研數據共享的價值已被普遍接受,且圖書館等服務機構積極倡導并為科研人員管理與共享科研數據提供指導與幫助,但相對于其他因素,科研數據政策在推動科研數據管理與共享中的作用更直接且更有效[1]。英國、美國、澳大利亞等均已制定了涵蓋國家/政府、科研資助機構、科研教育機構、數據存儲/共享中心、學術出版機構等不同層面的科研數據政策體系[2]。其中,科研機構(主要包括高校和科研院所)作為科學研究的主體,是科研數據產出的主要陣地,其科研數據政策的制定更是至關重要[3-4]。我國于2018年3月頒布實施的《科學數據管理辦法》[5]將“建立健全本單位科學數據相關管理制度”作為科研院所、高等院校和企業等法人單位的重要職責之一??梢?,制定本單位的科研數據政策以促進和規范科研數據的管理與共享,將成為我國科研機構的重要職責和迫切任務。而政策的制定離不開對科研數據管理與共享現狀的調研,本文對我國科研人員管理與共享科研數據的現狀進行調研,以期為我國科研教育機構制定科研數據政策提供參考。

1 研究綜述

了解科研人員管理與共享科研數據的現狀,特別是存在的問題與困難,在此基礎上提供有針對性的幫助與引導,是推動數據共享和充分發揮科研數據價值的必然路徑。目前,國內外已有一些機構和學者對科研數據的管理與共享進行調研,視角主要集中在兩個方面:一是科研機構為更好地推動科研數據的管理與共享而開展的摸底調研。如英國聯合信息系統委員會(Joint Information Systems Committee,JISC)資助了一項旨在了解英國科研機構的科研數據管理與保存現狀以更好地促進科研數據共享的研究,分別對牛津大學(University of Oxford)、南安普頓大學(University of Southampton)[6]、諾丁漢大學(University of Nottingham)[7]、??巳卮髮W(University of Exeter)[8]等學校的科研數據管理與保存現狀進行調研,在此基礎上提出數據資產審計框架(data audit framework),為科研機構識別和評估所擁有的科研數據及推動科研數據的管理、保存與共享提供可操作流程[9]。二是科研數據服務機構為更好地開展服務而進行的科研數據管理與共享需求調研。如加拿大皇后大學圖書館2016年對本校工程與科學領域的科研數據管理現狀進行了調研[10];美國北卡羅來納教堂山分校2012年對全校研究人員進行調查,以了解研究人員管理和共享科研數據現狀、存在的問題及需求等[11];美國國家醫學圖書館2017年對醫學領域的研究人員進行調查,以了解他們對科研數據管理的需求[12]。國內的胡永生等[13]、洪程等[14]分別對武漢地區高??蒲腥藛T和東南大學碩博士研究生的科學數據管理現狀與需求進行調查,為高校圖書館開展科學數據管理服務提供參考。然而,國內外針對科研數據政策制定需求的研究尚不多見。筆者在參考相關研究成果的基礎上,對我國科研人員管理與共享科研數據的現狀進行調研,以期為我國科研機構制定科研數據政策提供參考和依據。

2 研究設計

2.1 問卷設計

本文借鑒丁寧等[15]提出的科研數據生命周期管理模型,主要從數據的收集與獲取、數據的管理與保存、數據的共享等角度進行問卷設計,具體內容參考英國《數據資產審計框架方法報告》[16]中的相關問題,以及文獻[11,13-14]的調查內容。問卷初稿形成后,進行了一次小規模的預調查以收集相關意見,并對問卷進行修正和完善。問卷主要包括5個方面的內容:①調查對象的基本信息,包括性別、年齡、學科、身份等;②科研人員在科研過程中收集或獲取數據的途徑、方式及遇到的困難;③科研人員對科研數據管理與保存的現狀及存在的困難,包括科研過程中對數據的管理方式、是否使用專門的數據管理工具/軟件、數據保存與管理的滿意度、項目結束后數據的保存方式及時長、是否發生過重要數據丟失或損毀及其原因等;④調查科研數據共享現狀及對科研數據共享的態度;⑤對科研數據管理與共享政策的認知與態度。

2.2 調查對象與方法

為適應不同情況,筆者分別設計了網絡版和紙質版的調查問卷。紙質問卷主要針對武漢地區的科研人員,包括高校教師、科研機構專職研究人員、圖書館員、博士生和研究生等;網絡版問卷通過電子郵件、QQ群、微信群等多種途徑對不同背景和學科的科研人員進行調查。在進行紙質問卷調查時,筆者還通過聊天的方式對科研人員進行非正式訪談,進一步了解其管理、保存和共享科研數據的相關情況。

本調查問卷是在深入分析科研人員管理與共享科研數據現狀的基礎上編制,并聘請多位相關專家反復提出修改意見,同時在正式調查前進行小范圍測試并再次修改完善,在一定程度上保證了調查問卷的效度。本次調查時間為2018年5月10日—6月3日,獲得有效紙質問卷171份、網絡問卷240份,共計有效問卷411份。

3 調查結果

3.1 調查對象的特征分析

調查結果顯示,調查對象中,以博士和碩士為代表的學生科研群體所占比例最大(56.69%),其次是教師和專職研究人員(33.00%)。從年齡層次看,中青年科研人員所占比例最大(超過70.00%),其次是青少年科研人員(29.44%),這兩類人群接受能力強,富于創造性,是從事科研的主力;從學科背景看,主要集中在工、理、農、管理和醫學等領域。

3.2 科研人員獲取科研數據的方式及困難

3.2.1 科研數據獲取方式分析

從圖1可看出,科研人員獲取科研數據的方式主要有實驗室試驗、網絡采集、社會調查、實地觀測、建?;蚰M等,而通過購買和他人提供的相對較少。

圖1 科研人員獲取科研數據的方式

進一步分析發現,不同學科和領域的科研人員獲取科研數據的方式有所不同,理、工、農、醫領域以實驗室試驗為主,輔以實地觀測、建?;蚰M、網絡采集,而經濟學、法學、教育學、文學、管理學等人文社科領域主要通過社會調查和網絡采集的方式獲取科研數據。

3.2.2 科研數據獲取存在的困難

我國科研人員獲取科研數據遇到的困難主要有收集到的數據不符合要求(56.93%)、數據收集或獲取成本高(53.77%)、難以找到所需數據(35.77%)。每個領域中調查對象選擇“數據收集或獲取成本高”的比例都較高,這在一定程度上反映出科研數據共享的重要性和迫切性。

另外,經濟學研究人員選擇“所需數據涉及隱私或國家機密”的比例最高,表明我國政府和公共部門的數據公開水平有待提高。

3.3 科研人員管理科研數據的方式及困難

3.3.1 科研數據管理方式與管理工具分析

為了解我國科研數據的管理現狀,對科研人員管理科研數據的方式進行了調查,獲知參與課題的某位老師或學生集中管理、項目組參與人員共同管理、項目負責人集中管理是3種主要的方式。由此可見,我國科研人員具有一定的數據管理意識,但主要以科研項目/團隊為單位,沒有形成統一的模式,處于自發狀態。

為了解科研人員管理科研數據的現狀與水平,筆者調查了他們是否使用專門的數據管理工具/軟件,發現大多數(78%)受訪者沒有使用專門的數據管理工具/軟件,僅有8%的調查者表示使用過。統計發現,使用較多的工具主要有SPSS(5人)、Excel(4人)、SQLServer(4人)、Mysql(3人)、Access(3人)。

3.3.2 科研數據管理存在的困難

了解科研人員管理科研數據存在的困難有助于在制定政策時提高針對性,同時也有助于圖書館等相關部門有針對性地開展相關服務,更好地幫助科研人員管理和共享科研數據。

科研人員管理科研數據存在的困難主要有缺乏有效的數據管理工具/軟件(60.83%)、需要花費大量的時間和精力(54.26%)、不知道如何為數據創建索引或元數據(31.87%)。結合上文對科研人員使用科研數據管理工具/軟件的調查,說明大多數科研人員缺少管理科研數據的必要技能。因而,在制定相關政策時,應充分考慮科研人員可能面臨的困難,為他們管理、利用和共享科研數據提供指導與幫助,以更好地促進科研數據的管理與共享。同時,圖書館等相關服務部門也應積極為科研人員管理科研數據提供指導和幫助。

3.4 科研數據的保存與安全問題

3.4.1 項目結束后科研數據的保存方式與保存時間

科研項目結束后,應及時將收集或產生的相關數據資料進行整理和保存,以便共享和再利用。調查發現,科研項目結束后科研數據的保存人員主要有項目負責人(59.12%)、多個項目組成員(42.82%)、某項目成員(28.95%)。筆者在調研中了解到不少碩士和博士在項目結束時會將所收集或產生的科研數據副本提交給導師或師兄(通常是子課題的負責人或研究團隊負責人),由他們進行集中保管或提交給項目負責人。

調查發現,個人電腦、光盤/移動硬盤、機構電腦/存儲器/機構庫是科研人員保存數據最主要的方式;此外,也有部分科研人員選擇保存在紙質載體和網絡硬盤上。

調查結果顯示,我國科研數據的保管主要以個人為主(超過80%),這給數據的共享與安全帶來不利影響:一是數據分散在個人手中,不利于數據的共享;二是分散保管容易造成數據的丟失和損毀,數據的安全面臨風險。

關于項目結束后科研數據保留多長時間,絕大部分被調查者選擇了“永久保存”和“視情況而定”。國外相關研究也表明,科研數據的保存期限不能一概而論,應根據不同學科領域的特點、科研資助者的要求和數據的重要程度具體來定[6]。

3.4.2 科研數據的安全狀況

確保數據的安全是實現科研數據共享的前提和保障。為了解科研數據的安全狀況,筆者調查了科研人員是否發生過重要科研數據丟失或損毀的情況,發現近70%的科研人員發生過(包括偶爾發生和經常發生)重要科研數據丟失或損毀的情況??梢娢覈蒲袛祿陌踩珷顩r不容樂觀,說明加強科研數據的保存與管理以確??蒲袛祿踩谋匾院途o迫性。

進一步了解科研數據丟失或損毀的原因,發現存儲設備故障和誤操作/誤刪除是造成科研數據丟失或損毀的兩類主要原因。此外,造成數據丟失或損毀的其他原因還有存儲設備丟失或被盜、數據轉換或導入時發生故障。筆者認為,無論何種原因,都可以通過相應的安全保護措施(如定期備份)加以避免和預防。因而,有必要盡快采取確保數據安全的措施及建立相關機制。

3.5 科研人員共享科研數據的現狀及動機

3.5.1 科研人員共享科研數據的現狀

科研數據的獲取與再利用是共享的重要方式。調查結果顯示,近80%的被調查者都有從其他途徑獲得科研數據的經歷,說明科研數據共享是科研過程中較普遍的現象,也說明科研人員對科研數據共享有較廣泛的需求。

調查對象獲得科研數據的途徑依次是:①導師/師兄/師姐/學長等;②數據共享中心/網站;③有合作關系的同行;④研究團隊成員;⑤其他研究團隊;⑥師弟/師妹/學弟/學妹/學生等;⑦同事;⑧政府部門。說明我國科研人員獲取和共享科研數據的途徑以人際關系為主,并主要集中于與自己關系密切或有合作關系的團隊及同行。通過數據共享中心/網站獲取科研數據的比例位居第二,說明公共數據共享中心/網站是科研人員獲取科研數據非常重要的途徑,也是非常有發展潛力的途徑。

科研數據共享既包括向其他人提供科研數據,也包括從其他途徑獲得科研數據。調查發現,60%的調查對象曾經向其他人提供過科研數據,其中一半以上(57%)都是無償提供。說明我國科研人員有較好的共享精神。

對于曾向他人提供過科研數據的科研人員,問卷進一步調查其共享數據的對象。結果顯示,分享最多的對象依次是:①導師/師兄/師姐/學長等;②研究團隊成員;③師弟/師妹/學弟/學妹/學生等;④有合作關系的同行;⑤同事;⑥其他??梢?,科研人員傾向于向與自己關系密切且有科研合作關系的人員提供科研數據。

盡管大多數科研人員都有過共享科研數據的經歷,但共享科研數據限于師生或有合作關系的同行,共享范圍有限。調查結果顯示,影響或阻礙科研數據廣泛共享的原因依次是:①數據涉及保密,按規定不能公開;②擔心數據被不正當使用;③數據來之不易,不愿意無條件共享。

可見,除數據涉密外,科研人員對數據被不正當使用有著較大的擔心,不愿意無條件共享辛苦收集或產生的數據。這表明,需要完善數據共享的利益平衡機制、構建有利于彼此互信的共享機制,以消除科研人員的擔心和疑慮,才能推動和促進科研數據共享。

3.5.2 科研人員共享科研數據的動機

調查發現,科研人員分享數據的動機依次是:互助互惠;相信對方不會不當使用或傳播數據;這些數據對自身已沒有太大用處,但對別人會很有幫助??梢?,互助互惠原則是科研人員共享科研數據最主要的原因。此外,調查結果也顯示,對共享對象的信任也是科研數據共享的重要因素。這說明在制定科研數據政策時,要重視構建使科研人員彼此互信的共享機制,這樣才能更好地促進數據共享。

3.6 對科研數據政策的態度

調查對象中選擇“贊成”和“非常贊成”的人員共占76%,選擇“無所謂”的占16%,而選擇“不贊成”和“非常不贊成”的共占8%。這說明大部分科研人員認可科研數據共享的益處,支持制定相關政策。

3.7 科研數據所有權的歸屬

39%的調查對象認為數據的所有權屬于科研人員,34%的調查對象認為數據的所有權屬于科研機構,15%的調查對象則認為所有權屬于科研資助者??梢?,科研人員對于科研數據所有權的意見并不一致,這與國外相關調查結果基本一致[6]。國外高??蒲袛祿叩南嚓P研究表明,大多數政策都規定科研數據的所有權歸機構,少數高校將所有權歸研究人員;但同時指出,科研人員離開學校時,數據的所有權歸學校,原始數據應保留在原單位[17-19]。

3.8 對科研數據政策的擔心或顧慮

科研人員對政策的擔心或顧慮,主要有以下6個方面。①削弱科研競爭力。②增加新的負擔。一是擔心政策實施后需要花費較多時間和精力進行數據的管理與保存,給自己帶來負擔;二是擔心政策實施后會增加課題結題難度。③數據的知識產權和所有權如何界定,與之相關的利益能否得到保障。④權利與義務能否平衡,如何保證共享與使用過程中的公平規范。⑤數據的安全。⑥政策的執行和落實問題。一是政策執行不力或缺少相應的保障措施,最終形同虛設;二是執行政策時一刀切或被異化(如數據提交給科研管理部門后,被個人侵吞、壟斷或轉讓牟利等),而達不到預期效果。

問題①②反映了部分科研人員對科研數據共享持消極態度,擔心政策的實施會給自己帶來麻煩或不利影響。從個體角度看,科研數據的管理與保存的確會給科研人員增加一定的負擔,但從長遠和全局看,科研數據的管理、保存與共享最終會利人利己。因此,對這類人群應加以引導教育,一方面使他們明白科研數據共享的巨大效益;另一方面也使他們認識到,由國家或各級政府資助產生的研究成果,都屬于公共財富,應無限制地向公眾開放,而不能據為私有。

問題③④是由于科研人員對科研數據政策缺乏了解而產生的疑慮和擔心,也說明完善的利益平衡機制是政策制定的核心與重點。而問題⑤⑥反映出部分科研人員對政策執行過程或相關保障措施的擔心,科研機構在制定和實施科研數據政策時應嚴謹周密,廣泛參考國內外有益經驗并構建完善的保障措施,確保政策的實施效果。

4 結論與建議

調查表明,實驗室試驗、網絡采集、社會調查、實地觀測是我國科研人員獲取科研數據的主要途徑。其中,理、工、農、醫領域的科研數據獲取以試驗為主,輔以實地觀測和建模/模擬,而人文社科領域主要通過調查和網絡采集的方式獲取科研數據。我國科研人員缺少科研數據管理的專業知識與技能,不少人員不知道如何為數據創建索引或元數據,大多數人員發生過重要科研數據丟失或損毀的情況,數據管理的技能亟待提升。雖然大多數科研人員都有過科研數據共享經歷,但主要集中于與自己關系密切或有合作關系的團隊及同行,共享范圍不夠廣泛?;ブセ菔强蒲腥藛T共享科研數據的主要動因,而信任是實現共享的根本保障。大多數科研人員對科研數據政策持支持態度,但也存在一些顧慮。據此,提出建議如下。

4.1 科研機構應盡快制定和實施科研數據政策

認識到數據共享的重要性并不足以促使科研人員主動進行科研數據的管理與共享,科研數據的共享面臨諸多挑戰。本文調查顯示,部分科研人員不愿意無償共享科研數據,或不愿意為科研數據的管理與保存付出額外成本,或擔心數據丟失、泄露自己的核心競爭力、被不正當使用等。相關研究指出,在科研數據共享中,政策法規的作用不可替代,對于推動科研數據管理與共享從共識變為現實及可持續發展起著關鍵的作用[20]。英國、美國、澳大利亞等國家的高校大都通過制定科研數據政策以規范和促進科研數據的管理與共享[21],因而,我國高校應盡快制定科研數據政策,以更好地保障科研數據共享的發展。

4.2 構建利益平衡和信任機制是政策的核心要素

明確的產權歸屬和利益平衡機制是保障科研數據共享的前提與基礎[22]。調查發現,一方面,部分科研人員擔心科研數據管理與保存帶來的負擔而對科研數據政策持消極態度;另一方面,科研人員對于自己付出較大努力獲得的數據不愿意無條件共享。而相關研究表明,適當的回報(共享者在需要的時候也可獲得他人的科研數據)和認可(如使用者的致謝或引用等)是促進科研數據共享的重要因素[23]。本文調查表明,信任也是實現科研數據共享的重要因素,這也被相關研究所證實[24]。因此,我國科研機構在制定和實施科研數據政策時,一是可以對科研人員管理與保存科研數據予以適當資助,以補償科研人員所付出的時間、精力和其他成本;二是要求科研數據的使用者對使用數據進行引用和致謝以鼓勵共享的積極性;三是建立穩健的基礎設施和完善的數據安全制度,確保數據不被竊取和丟失,以消除科研人員對于數據安全的擔憂。

4.3 為科研人員管理與共享科研數據提供指導與幫助

政策并非萬能,要保證科研數據共享的順利進行,相應的服務和基礎設施必不可少[25]。調查發現,我國科研人員缺少科研數據管理的技能,數據管理現狀不樂觀。同時,科研數據分散保存在個人手中,既不利于共享,也使數據的安全面臨風險。對此,可以借鑒國外的經驗,由圖書館或專門的科研數據服務機構為科研人員提供培訓、咨詢、指導與幫助等服務[26],幫助他們更好地管理、保存和共享科研數據,推動數據的共享。

4.4 建立科研數據存儲與共享中心

除為科研人員管理與共享科研數據提供指導與幫助外,科研數據共享還離不開相關基礎設施與機制的保障。調查表明,由于缺少科研數據存儲與共享的公共基礎設施,我國科研數據大多分散保存在個人手中,既不利于共享,也存在較大安全風險。而國外不少科研機構的政策都指出科研數據必須保存在本校的相關設施中[4],或保存在受認可的本國/國際數據服務中心[19]。我國的《科學數據辦法》也將科學數據中心建設作為各責任機構的重要工作。因而,有條件的機構應盡可能建立本機構的數據共享中心,國家應建設以學科領域為核心的數據共享中心,為資源不足的機構的研究者提供數據存儲與共享服務。

4.5 推動形成科研數據出版與引用機制

科研數據的出版與引用是實現數據共享的重要途徑之一。本文調查表明,利益平衡機制和信任是確??蒲袛祿蚕淼年P鍵要素??蒲袛祿霭嫱ㄟ^公開發表的形式對數據進行公布,供數據使用者進行參考和引用,有助于借助傳統文獻交流機制繞開數據共享的信任“陷阱”。同時,科研數據的發表,有助于數據作為科研成果得到承認,而數據的引用或致謝也是對數據生產者的認可和回報,將有助于科研數據共享的發展。當前,我國專門的科研數據期刊還較少,亟待在借鑒國內外經驗的基礎上完善我國的科研數據出版與引用機制。

本文通過調查的方式,對我國科研人員獲取、管理、保存和共享科研數據的現狀及對科研數據政策的態度與認知進行調研,以期為我國科研機構制定和實施科研數據政策提供決策依據和參考。然而,科研數據政策的制定與實施是一項復雜的系統工程,涉及多方利益主體和多種因素,僅通過一次調查難以發現所有問題,本文的調查僅是一種嘗試,未來有待在調查的深度和廣度上加以擴展,為我國科研機構數據政策的制定提供多方位的參考。

猜你喜歡
數據管理科研人員政策
科技部等五部門聯合發文開展減輕青年科研人員負擔專項行動
政策
政策
企業級BOM數據管理概要
科研人員揭示油桃果實表皮不長毛的奧秘
定制化汽車制造的數據管理分析
科研人員破譯黑豬肉特征風味物質
海洋環境數據管理優化與實踐
CTCS-2級報文數據管理需求分析和實現
廣東公安科研人員風采
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合