?

美國高校圖書館數據管理計劃服務及啟示*

2019-01-15 11:12王思明
數字圖書館論壇 2018年12期
關鍵詞:數據管理要素計劃

王思明

(東北師范大學信息科學與技術學院,長春 130117)

作為人類發現、探索、解釋自然與社會的忠實記錄,科學數據逐漸獲得與傳統文獻相同的學術地位[1]。作為科研活動所必需的基礎性生產資料,它是學術記錄的重要組成部分,是支撐研究結論的重要事實或結果??茖W數據日益被組織成為可發現的、可獲取的、可互操作的、可重用的資源[2]。2010年初,美國國家自然科學基金會(National Science Foundation,NSF)發布了項目管理指南[3],規定2011年1月18日起所有提交至NSF的申請項目必須以附件形式提交一份不超過2頁紙的數據管理計劃(data management plan,DMP)。美國國立衛生研究院(National Institute of Health,NIH)同樣在其資助指南中指出,任何在1年內直接資助費用超過50萬美元的研究項目必須提供一份數據共享計劃,對項目的研究數據進行明確的描述與管理,用以保證數據的共享與重用[4]。2018年5月,SPARC Europe(歐洲學術出版與學術資源聯盟)與國際數字監護中心(Digital Curation Center,DCC)合作,發布了《開放數據驅動因素研究報告》[5],報告中明確指出積極建立數據管理計劃是推動開放數據驅動發展的第二大因素。

數據管理計劃作為研究人員記錄他們描述、存儲、保護,以及共享其科學數據的計劃和措施,不僅有助于圖書館的科學數據管理團隊了解研究人員的數據管理實踐,發現科學數據管理服務的需求,也能促進圖書館的科學數據管理團隊與本校內部的相關利益機構之間建立合作網絡,保證科學數據管理服務的有效推進[6]。鑒于此,本文對國外高校圖書館的數據管理計劃服務實踐進行梳理,進而為國內高校圖書館開展數據管理計劃服務提出建議。

1 美國高校圖書館開展數據管理計劃服務的現狀

根據美國U.S.News《美國新聞和世界報道》2018年發布的美國大學綜合排名[7],選取排名前10的國立大學,即對普林斯頓大學(Princeton University)[8]、哈佛大學(Harvard University)[9]、哥倫比亞大學(Columbia University)、麻省理工學院(Massachusetts Institute of Technology)[10]、芝加哥大學(University of Chicago)[11]、耶魯大學(Yale University)[12]、斯坦福大學(Stanford University)[13]、杜克大學(Duke University)[14]、賓夕法尼亞大學(University of Pennsylvania)[15]、約翰·霍普金斯大學(Johns Hopkins University)[16]進行調研。發現哥倫比亞大學圖書館尚未開展數據管理計劃服務,故本文以其余的9所高校圖書館的DMP服務為研究對象。

1.1 概念界定

最初的數據管理計劃來源于聯邦資助機構、非營利的資助機構和一些企業資助者對于資助申請人提交一份“數據管理計劃”文件的要求。為滿足這些機構的要求,高校圖書館開展數據管理計劃的服務工作。有關數據管理計劃的定義,9所高校圖書館都引用典型研究資助機構的概念來說明,如NSF及NEH(National Endowment for the Humanities)有關數據管理計劃的解釋。其中,NSF將數據管理計劃定義為數據共享的擴展,并進一步將數據管理計劃描述為一個不超過2頁的文檔,用來描述如何管理和存儲來自研究的所有數據;NEH將數據管理計劃描述為數據共享政策方案,同時提供數據共享指南來幫助研究人員對于數據管理計劃撰寫。圖書館通過給出這些機構對于數據管理計劃的明確概念,來幫助研究人員更好地理解研究數據及數據管理計劃的重要性。同時,為進一步加深研究人員對于數據管理計劃的理解,9所高校圖書館均選用DMPTool進行解釋。

1.2 服務動因

隨著技術的進步,數字文件的共享變得更加容易,資金提供者(公共和私人)和期刊越來越需要數據共享以實現研究的可再現性和透明度。數據管理已經成為研究人員需要遵循的重要實踐,各個高校圖書館也逐漸將數據管理計劃服務引入其整體服務體系。其中,麻省理工學院圖書館將數據管理計劃服務引入數據管理服務體系,并明確指出數據管理計劃在提升研究人員的研究影響力、節省研究團隊的時間、允許自身和其他人在理解和使用研究數據等方面具有明顯的作用;芝加哥大學圖書館將數據管理計劃作為其研究管理服務的首要環節,并表明對于研究人員而言,一個有效的數據管理計劃不僅能夠防止錯誤進而提升研究分析的質量,還能夠防止數據丟失。本文將數據管理計劃服務的動因歸結為:①滿足資助機構、期刊等數據共享的要求;②保證項目研究的連續性;③降低數據的丟失、被盜、錯誤使用的風險,確保數據的完整;④易于數據的長期存檔及保存;⑤節省研究團隊的時間和資源,有助于預防錯誤,以提高分析的質量;⑥允許在學科內與跨學科之間共享數據,增加原始數據的價值;⑦促進研究數據的可發現、可獲取、可復制及可驗證;⑧保存和共享數據以幫助自己的研究獲得認可,增加研究結果的可靠性;⑨鼓勵數據引用以增加研究的影響。

1.3 協作機構及服務對象

通過調研圖書館開展服務的協作單位及服務對象,發現9所高校圖書館各具特色,見表1。

表1 國外數據管理計劃服務概況

1.3.1 協作機構

9所高校圖書館在開展數據管理計劃服務時都會選擇與本校其他部門合作,其中研究辦公室、計算機中心、數據存儲庫等機構是普遍的合作單位。圖書館的主要職能是提供撰寫數據管理計劃各內容要素相關資源、解答疑問、相關技能培訓等活動。多部門合作的數據管理計劃服務成功彌補了圖書館能力不夠的問題,也保障了服務的深入性、專業性、全面性。

1.3.2 服務對象

高校圖書館開展的數據管理計劃主要服務的對象還是研究人員,其中不僅包含獨立的研究人員也包含某個研究團隊。麻省理工學院圖書館的服務對象較為廣泛,除本校的研究人員、研究團隊外,還包括圖書館員及數據專家。但9所高校圖書館中明確將學生作為服務對象的情況較少,僅有耶魯大學、麻省理工大學圖書館及斯坦福大學圖書館有所涉及。

1.4 服務內容

1.4.1 服務定位

調研發現,9所高校圖書館的數據管理計劃服務都處于圖書館研究數據管理下,并被定位在整體研究數據管理首位,同數據捕獲及格式轉化、數據的描述與記錄、數據共享與存儲、數據引用研究等數據管理服務模塊組成基礎服務層?;A服務層、相關資源層及培訓指導層上下配合,形成體系化的流程(見圖1)。

圖1 9所高校圖書館研究數據管理服務體系

1.4.2 組成要素及相關資源

數據管理計劃服務,關鍵要點就是要先明確數據管理計劃中的要素類型,以幫助研究人員明確主要的方向。在要素類型的選定上,9所高校圖書館通過提供通用文檔,給出研究人員編寫DMP過程時可能需要考慮的要素。調研發現,高校圖書館對于要素的選定較多集中在定義研究團隊成員的角色和職責、數據類型和格式、捕獲方法和文件命名(元數據)、道德與知識產權(保護及隱私)、數據訪問、共享和重用、短期存儲和數據管理、數據歸檔及長期保存等要素類型上,同時圖書館會通過相應資源鏈接的方式幫助研究人員理解并撰寫數據管理計劃中的每一項內容。

數據管理計劃組成要素的相關支撐資源主要包括3種類型。

(1)研究授予機構或研究資助機構的數據管理/數據共享要素類型要求。如,NIH和、NSF、National Oceanic and Atmospheric Administration等,這種資源鏈接主要是幫助研究人員保證自身撰寫的要素內容符合研究資助機構的總體要求。

(2)數據管理計劃參考樣本。如DMPTool、New England Collaborative、DataONE等中所給出的數據管理計劃的樣例,給出參考模板以指導研究人員解決在實際撰寫中的困擾及問題。

(3)單一學科的在線數據存儲庫、期刊等的數據共享、數據管理要求。如大氣研究數據中心、生物學數據中心、氣候數據中心等,這種資源的目的是進一步確保研究人員所撰寫的每個要素內容符合本學科數據庫、期刊的實際共享要求。事先讓研究人員了解日后可能存儲數據的數據中心的要求,以幫助研究人員真正地作到數據的長期保存與共享。

1.4.3 服務評價

目前9所高校圖書館對于數據管理計劃服務模塊的評價尚未規范化。如杜克大學圖書館通過提供研究數據管理顧問的方式,對服務對象撰寫的數據管理計劃進行實時評價與審查。約翰·霍普斯金大學圖書館和芝加哥大學圖書館通過審核研究人員撰寫的數據管理計劃方式開展評價而通過提供標準化的文檔幫助研究人員實現自我評價,是多數高校圖書館的主要方式。但這些評價活動都過于零散,且主要由服務對象自主選擇,并不能達到預期的評價效果。

1.4.4 培訓與指導

目前圖書館開展的與數據管理計劃服務有關的培訓與指導大體可以分3種,即數據管理需求評估、數據管理計劃撰寫實際問題解決、數據存儲庫的選擇與使用。

(1)數據管理需求評估。圖書館幫助研究人員評估項目、實驗室及自身研究過程中的數據管理需求,通過需求的評估來指導具體的服務活動。

(2)數據管理計劃撰寫實際問題解決。圖書館在這方面提供的培訓與指導的內容較為廣泛,不僅包括數據管理、文檔組織、數據引用、數據共享等問題,還包括DMPTool等工具使用問題。但它并不是僅包含以上內容,用戶還可以根據自己在實際中遇到的問題提出咨詢。

(3)數據存儲庫的選擇與使用。部門高校圖書館會設置自己的數據存儲庫,以輔助研究人員的數據存儲管理與共享,如斯坦福大學圖書館、杜克大學圖書館。所以高校圖書館還會提供對于數據存儲庫的使用方面的指導與培訓,以解決在數據保存與共享方面遇到的問題。

以上3種培訓與指導,主要是通過提供專門的數據管理人員郵箱咨詢及定期小組研討會方式進行。

1.4.5 總結與對比

9所高校圖書館數據管理計劃服務內容可總結為相關服務模塊、組成要素、資源鏈接、評估、培訓與指導五大方面,現將各個高校在五個方面具體服務開展情況進行總結(見表2)。

表2 美國9所高校圖書館數據管理計劃服務的服務內容

對于服務內容,主要從數據管理計劃配合服務建設及其具體內容建設兩個角度進行總結與分析。首先,在提供與數據管理計劃服務相配合的模塊服務上,數據記錄與描述、數據保存備份與數據安全、數據共享與重用3個主要方面成為9所高校圖書館數據管理計劃主要關注的內容。而在數據獲取及類型、數據引用、數據長期歸檔方面關注度較低,尤其是在數據獲取及數據類型描述上極少提及。其次,在數據管理計劃自身的服務內容上,在明確數據管理計劃組成要素、提供數據管理計劃撰寫需要的資源鏈接兩大服務內容上,9家圖書館的開展情況差距不大。就數據管理計劃評價服務活動而言,可以明顯看出開展情況較差,僅斯坦福大學、杜克大學、約翰·霍普金斯大學3所大學涉及。在相關的培訓與指導工作上,都主要集中在要素的撰寫及數據存儲上,而對于用戶的數據管理需求評估關注度較低。

目前在數據管理計劃服務的建設方面,約翰·霍普金斯大學、斯坦福大學的圖書館建設較好,不僅內容全面而且涉及數據管理計劃的各個方面,值得我國高校圖書館學習與借鑒。

2 美國高校圖書館數據管理計劃服務對我國的啟示

國外高校圖書館數據管理計劃服務的調查研究,對我國高校圖書館數據管理計劃服務的開展具有重要意義。

2.1 明確服務提供主體

數據管理計劃服務活動中,圖書館作為高校數據管理計劃服務的主要提供者和主導者,應該采用多部門、多組織合作的組織形式,組建多元化的服務團隊。開展數據管理計劃服務不僅需要圖書館中的各部門配合,同時還需要與學校其他相關組織合作,如計算機中心、研究中心/研究辦、信息安全中心、數據存儲中心等。其中,計算機中心可以提供元數據描述、數據格式轉化等技術咨詢服務,研究中心可以在數據共享與重用方面提供協助。各個部門與組織共同參與到科學數據管理計劃服務中,通過資源共享、信息及技術支持,獲得最優的協作服務效果,形成多職能和多元化的服務團隊,以更好地滿足服務對象各階段的需求,構建富有生命力的團隊。

2.2 內容框架

隨著研究的進行及用戶需求變化,數據管理計劃服務的內容與標準也會相應變化,這是一個動態過程。從明確數據管理需求到計劃的完成及評價,服務標準由低層次到高層次,服務方式從簡單到復雜。就我國高校圖書館而言,筆者認為可與目前高校圖書館的科研服務相結合,將內容框架定位為四個方面:一是將數據管理計劃服務納入目前的科學數據管理服務體系;二是明確我國的數據管理計劃組成要素;三是選擇體系化、系統化的服務模式,保證各個要素之間的配合;四是數據管理計劃的評價。

2.2.1 將數據管理計劃服務納入高??茖W數據管理服務體系

目前國內高校圖書館已經明確開展與科學數據管理相關的系列服務,如北京大學圖書館、復旦大學圖書館、武漢大學圖書館、上海外國語大學圖書館,另有部分高校圖書館雖然在網站中沒有明確標示,但會在科研支撐模塊中提供一些數據支持服務[17]。圖書館在后續的數據管理計劃服務開展上,可與現有的科學支持服務結合,嘗試用數據管理計劃來串聯現有的科研服務。但要特別關注用戶對于數據管理計劃的認識與了解,要幫助用戶明晰數據管理計劃的重要性。調查顯示,目前國內高校圖書館雖然已經開始關注學生、研究人員及數據館員[18]的科學數據素養教育及培訓,但在具體的實踐活動方面還很缺乏,因此高校圖書館亟需提高學生及研究人員等在構建數據管理計劃方面的積極性,提高其數據管理的能力與效率。

2.2.2 明確數據管理計劃組成要素

根據目前國內高校圖書館科研數據管理活動開展情況和服務需求,將數據管理計劃服務的基本組成要素設定為數據獲取、數據描述、倫理與知識產權、數據共享與重用、數據引用、數據保存6個基本組成要素。6個要素緊緊圍繞科研全周期,全面地涉及了科研活動的各個階段,保證了數據管理計劃服務的整體性、系統性。

(1)數據獲取。詳細描述如何生成或獲取數據,包括明確規定數據采集的步驟,并概述相關主體的角色和職責;數據的類型,包括觀察數據、實驗數據、模擬數據或派生/編譯數據。

(2)數據描述。上下文細節記錄與描述(元數據);數據的處理和文件的組織,包括數據處理的方式、版本控制、文件格式、文件命名及組織格式。

(3)倫理與知識產權。數據保護、機密數據的保護、可共享數據的處理、數據知識產權與版權。

(4)數據共享與重用。數據管理的相關責任主體;自由的訪問、重用、重新分配數據的說明;文件的可用性,包括文件的命名、特定軟件包的支持;敏感數據的處理;數據重用說明與指導;數據的知識產權說明。

(5)數據引用。引用格式的選擇;提供永久標識符;盡可能在最詳細的級別引用數據集,并提供適當的版本;盡量保證所引用的數據集與論文的鏈接。

(6)數據保存與數據安全。需要短期保存的數據的方式、存儲周期;長期保存方式(存儲庫的選擇)、存儲周期;數據安全(敏感數據的安全性);支持數據使用的軟件或工具的存檔。

2.2.3 構建體系化的數據管理計劃服務模式

構建體系化的服務模式也能幫助活動中的參與主體明確自身的責任與任務,防止角色混亂,保障服務的順利開展。筆者結合對9所高校圖書館的數據管理計劃服務的案例研究,構建數據管理計劃服務模式(見圖2)。

圖2 數據管理計劃服務模式

在數據管理計劃服務部分,筆者將服務模式設定為兩個層次,中心層為數據管理計劃的6個主要組成部分,與其對應的是相關資源保障層,主要目的是保障6個要素階段的順利完成。其中可能包含的資源支持有數據獲取階段的數據命名、格式轉化、版本控制等;數據描述階段的元數據描述、文件記錄等;倫理與知識產權階段的產權保障、數據安全等;數據共享與重用階段的數據存儲、數據共享方式等;數據引用階段的引用指導、引用方式選擇等;數據保存階段的存儲庫選擇、短期及長期歸檔等。

2.2.4 重點關注數據管理的評估體系

本文特別針對基礎服務層構建了計劃評估體系,具體分為兩個環節,第一環節是數據管理計劃各個階段的實時評估,目的是明確服務對象在各個階段的需求,使服務更有針對性,進而保障數據管理計劃的順利完成;第二環節是終期管理計劃效果的評估,特指所有用戶已經完成的數據管理計劃的評估,目的是通過完成的數據管理計劃文檔來進一步識別數據管理計劃整體服務的缺失,并發現用戶在數據管理方面尚存問題,為圖書館后續的培訓及指導提供支持。

3 結語

隨著我國對科學數據共享、重用和科研創新能力日益重視,高校有必要拓展圖書館服務的功能和形式,構建體系化、多元化的科學數據管理服務。本文對美國高校圖書館數據管理計劃服務的服務概況、服務內容、具體流程進行探討,希望對我國高校圖書館開展科學數據管理計劃服務有一定的啟示。

本文雖然對數據管理計劃的基本組成要素進行了設定,但因為各個高校學科體系不同,導致各個專業的科學數據具有差異性,由于數據管理計劃的基本組成要素可能存在不同,因此高校圖書館要結合自身服務用戶特點,構建切合用戶需求的數據管理計劃支持服務。

猜你喜歡
數據管理要素計劃
企業級BOM數據管理概要
定制化汽車制造的數據管理分析
海洋環境數據管理優化與實踐
CTCS-2級報文數據管理需求分析和實現
掌握這6點要素,讓肥水更高效
觀賞植物的色彩要素在家居設計中的應用
論美術中“七大要素”的辯證關系
暑假計劃
學做假期計劃
學做假期計劃
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合