?

面向研究需求的數據服務體系構建與思考

2020-09-03 14:00劉茲恒涂志芳
山東圖書館學刊 2020年4期
關鍵詞:數據服務數據管理圖書館

劉茲恒 涂志芳

(1北京大學信息管理系,北京 100871;2中國科學院文獻情報中心,北京 100190)

在大數據與數字化環境下,數據資源是圖書館資源的必然拓展,數據服務是圖書館服務的合理延伸。目前,研究數據管理是數據服務的重要部分和熱點領域,研究數據管理已經在世界范圍內大部分國家和地區的圖書館中以不同形式、不同層次、不同水平開展。多份調查報告指出,圖書館的研究數據管理服務以管理/咨詢型服務為主,技術/實踐解決方案較少[1-3]。從宏觀層面看,研究數據管理及相關的一系列活動有賴于數據政策與標準的制定與實施、數據基礎設施建設、數據共享文化及整體的學術生態環境等的支撐;從微觀層面看,研究數據管理與圖書館的資金、技術、人才、業務重點、發展規劃等密切相關,因此目前條件下圖書館若要參與研究數據管理的全過程并發揮主要作用存在一定的困難。

但這并不意味著,圖書館完全束手無策。事實上,圖書館的“數據服務”并不局限于研究數據管理,圖書館還可以從更廣泛的角度提供數據服務,如開放數據導航、數據分析、軟件工具培訓、數據產品推廣等,國內也已有圖書館正在探索數據服務(如北京大學圖書館)。

不可否認,部分“強勢”圖書館因有強大的條件支撐其進行數據服務的探索甚至“試錯”,而對部分“弱勢”圖書館來說,技術、空間、資金、人員等的投入都是有限的,數據服務探索及“試錯”的成本壓力巨大。因此在開展新的數據服務之前,借鑒較為成熟的、具有較強的可行性和可操作性的方案或路徑顯得尤其重要。

本文擬以研究人員的數據服務需求為出發點,從理論支持、實踐部署兩個維度對“從零開始”的圖書館數據服務體系構建路徑加以剖析,先從理論層面論證數據服務的可行性、分析數據服務體系可能的戰略定位,再從實踐層面探索數據資源集成與呈現方式,數據服務內容與形式(弱化研究數據管理在數據服務體系中的地位),最后從人才建設、空間建設和經費預算方面為數據服務體系的建設提供條件保障。本文呈現的數據服務體系構建路徑的初衷在于,盡可能描述一個可操作的路徑并希望對我國圖書館探索數據服務或可持續地提供數據服務起到操作層面的參考和借鑒。

1 相關研究與實踐回顧

目前,國內外圖書館數據服務相關研究與實踐已經漸趨豐富而多樣,學者們對數據服務的必要性與重要性、數據服務模型與生態圈、數據服務內容與實施路徑、數據服務館員素養與技能、數據服務實踐案例等進行了諸多的分析與思考。整體來看,國外以實踐層面的數據服務探索為主,輔之以相關討論和研究;國內則以理論層面的數據服務探索和對國外數據服務實踐研究居多,數據服務實踐僅在少部分圖書館中進行。

在數據服務研究方面,因國外數據服務實踐漸趨普遍,研究者對較宏觀層面的數據服務的研究反而相對較少,其關注點多聚焦于研究數據管理、數據出版、數據評審、數據引用等具體方面。例如,M S Nelson認為聯結數據是邁向圖書館新興服務領域的第一步,這要求圖書館員更新舊技能并學習新技能,識別并捕獲研究人員和學生的需求并提供服務[4];CTenopir等對圖書館員進行研究數據服務的準備(認為已具備數據服務相關知識、技能的居多)、態度(認為重要的居多)、動力(責任、興趣等)等進行調查分析[5]。更明顯的是,國外圖書館界比較注重對圖書館數據服務實踐現狀的調查反饋,如2012年6月美國大學與研究圖書館協會(Association of College & Research Library,ACRL)對美國、加拿大的學術圖書館進行調查并發布《學術圖書館與研究數據服務:當前實踐與未來計劃》[2],2016年12月歐洲研究圖書館協會(LIBER)對館長進行調查并發布《歐洲學術圖書館研究數據服務》[3],根據調查可知:(1)已經提供或計劃提供研究數據服務的圖書館越來越多,圖書館高度認同研究數據服務的重要性,也盡可能為數據服務館員提供專業培訓、職業發展的機會;(2)圖書館提供的研究數據服務以咨詢類居多,技術/實踐類較少;(3)圖書館與其他校內單元、研究機構合作廣泛提供研究數據服務;(4)圖書館應積極爭取數據服務相關的機會和主動權(如制定研究數據政策),也需要跨越學科邊界提供更多元的服務并服務更廣泛的研究群體。

國內學者對數據服務進行了多維度的研究,其中多為理論性的思考與探索,具有較強的指導意義和啟發作用。主要包括:(1)較早期的研究者把數據服務視為圖書館服務(尤其是參考咨詢)的新領域加以討論[6-7];(2)對北美、歐洲等的國外學術圖書館數據服務整體實踐進展[8-10]、實踐個案[11]或數據服務的某一方面(如元數據[12])進行研究;(3)對圖書館數據服務模型、生態圈等的理論性探索[13-14],從中可知理論基礎與基礎設施、數據資源與服務能力、技術支撐與應用平臺等是數據服務體系必不可少的要素;(4)對圖書館數據服務內容與實施路徑的探索,數據服務包括數據開發與推廣、檢索與發現、管理與監護、存儲與關聯、咨詢與分析、技術支持等內容[15-17],可采取“集成展現”“嵌入學科”等的服務方式;(5)對數據服務館員服務模式與技能培訓的關注,包括數據館員崗位設置、數據素養及其培養機制等[18-19]。

在數據服務實踐方面,加拿大高校圖書館數據服務體系具有代表性,如溫莎大學圖書館數據服務體系包含以統計數據、社會科學數據、數據課程等為主的數據資源,按照學科領域及數據功用進行數據分類組織,覆蓋數據軟件支持、研究數據管理、數據課程指南及地理空間專題等數據服務[20];麥克馬斯特大學圖書館主要提供微數據(原始數據)和綜合數據/統計(加工處理過的數據)兩種數據資源,并集成了數據相關的視頻課程、數據發現與利用指南、數據與數據產品引用指南等幫助性資源,同時還設立了研究數據中心與數據分析支持中心并提供研究數據管理、數據分析、地圖與地理空間數據等服務[21]。北京大學圖書館主導的“北京大學開放研究數據平臺”[22]、武漢大學圖書館主導的“武漢大學科研數據管理”服務平臺[23]、復旦大學圖書館參與的“復旦大學社會科學數據研究中心”[24]、中國科學院計算機網絡信息中心主導的“中國科學院數據云”[25]等是國內相對成熟的數據服務平臺,這些平臺在數據收集、存儲、發布與利用及社會調查等方面進行了有益的探索并積累了經驗,當然這些較大型圖書館的數據服務平臺也有賴于其充分的政策、資金、技術力量的支撐。

總之,目前關于圖書館數據服務的研究與實踐已經初具成效,但仍有不足之處和提升空間,如數據服務“從無到有”的實踐路徑、數據服務的持續性與拓展性等并不明確,而數據服務體系構建是對有規劃的、可持續的、高質量的數據服務的思考和保障,對學術圖書館(尤其是中小型)更好地融入數字學術環境、適應數據密集型研究范式、提供基于資源的和面向需求的數據服務具有指導意義。

2 數據服務體系之理論支持

2.1 數據服務的可行性論證

2.1.1 國內外對標圖書館數據服務現狀

首先可以通過實地參觀、調研及網絡調研等方式,了解與本圖書館對標的國內外圖書館及信息服務機構的數據服務現狀,以此作為論證本館數據服務可行性的重要參考。如中國科學院文獻情報中心作為大型的學術(專業)圖書館,調研了與之對標的美國、加拿大、香港等地區數所高校圖書館的數字學術服務(包括研究數據管理)、數據服務(不局限于研究數據管理),以及德國國家科技圖書館、美國國家農業圖書館、北京大學圖書館等的數據服務情況。其中國外尤以加拿大麥克馬斯特大學、約克大學、溫莎大學圖書館數據服務體系中的數據資源集成與組織、數據服務內容與形式最具參考價值;而國內北京大學圖書館已率先開展數據服務,其組織建設的北京大學開放研究數據平臺已積累一批科研數據并提供服務,其聯合北京大學信息管理系、南海大數據研究院、國家信息中心大數據發展部、北京市信息資源管理中心等單位舉辦的“首屆全國高校數據驅動創新研究大賽”一經推出反響熱烈,在巧妙嵌入數據培訓的同時還“順便”為平臺征集了一批新的數據[26]。

2.1.2 目標用戶需求及特點分析

用戶需求是數據服務的根本動力和依據,圖書館數據服務體系構建首先應明確服務對象并盡可能了解用戶特點及需求。其中關于數據服務與用戶需求的關系,一方面圖書館可通過問卷、訪談、留言等形式調查用戶的數據服務需求;另一方面圖書館可在已掌握資源的基礎上提供數據服務,并吸引用戶關注,刺激用戶需求。例如中國科學院文獻情報中心的數據服務對象為中國科學院的研究人員及學生,其各研究所覆蓋物理、化學、數學、力學、聲學、電子學、環境學、地理、材料、地質等幾乎所有的自然科學,因此應以自然科學與工程、生命科學等領域的數據服務為主,輔之以人文社會科學領域的數據服務。

2.1.3 服務能力自我評估

顯然,圖書館想要提供數據服務的前提是有能力提供數據服務,因此對服務能力進行自我評估則顯得必要且重要。通常而言,服務能力取決于政策、資源、空間、人才、資金、技術等多方因素,且是可以改變的狀態和不斷提升的動態。因此,在圖書館面向母體機構、資助機構爭取數據服務支持時,還可強調圖書館數據服務的意愿與態度,闡明圖書館為適應新環境、滿足新需求、開展新服務而不斷發展進步的動力,充分論證圖書館有能力、有潛力提供數據服務。

2.2 數據服務體系的功能定位分析

數據服務在不同圖書館中有不同的功能側重和重要程度,因此分析數據服務的定位、明確數據服務的重點是構建數據服務體系的重要環節。例如,中國科學院文獻情報中心考慮了空間布局、部門分工、轉型方向等實情之后,將數據服務體系定位為“作為數據資源集成中心”“作為數據服務提供中心”“作為用戶數字化體驗空間”三大功能中心。

2.2.1 作為數據資源集成中心

數據資源是數據服務的基礎,同時資源本身也是一種服務(資源即服務)。具備“數據資源集成”功能的數據服務體系須考慮數據資源如何集成這一核心問題,即數據資源如何獲取、如何組織、如何呈現、如何提供等,并且還需考慮知識產權、數據許可等相關問題或注意事項。數據資源獲取途徑可包括:

①館藏印本數據資源及其數字化版本;

②購買的綜合性數據庫數據資源;

③購買的數據/統計類數據庫資源;

④開放獲取數據資源;

⑤研究人員/團隊/機構托管、提交的數據資源;

⑥合作共享、相互交換的數據資源;

⑦其他。

2.2.2 作為數據服務提供中心

用戶服務是貫穿數據服務體系建設始終的核心使命,圖書館應盡可能為用戶提供多樣化的數據服務,包括但不限于:

①集成數據視頻課程資源;

②進行數據資源宣傳推廣;

③提供數據分析與可視化工具及其他設施設備;

④開展數據工具培訓;

⑤定期發布數據分析產品;

⑥面向研究人員的最新數據資源推送服務;

⑦面向課題組、研究團隊的特定領域數據專題服務;

⑧輔助數據管理服務;

⑨建設數據服務空間。

2.2.3 作為用戶數字化體驗空間

物理空間并非數據服務體系之必需,各圖書館可根據業務發展需求考慮是否將物理空間納入數據服務體系之中。一般來說,數據服務體系中的物理空間也是城市間、機構里的公共文化空間和數字體驗空間,預期可承擔的功能包括但不限于:

①作為用戶利用數據資源的物理空間;

②作為館員提供數據服務的物理空間;

③作為讀者數字化閱讀、體驗、協作、研討的開放空間;

④作為知識產權咨詢服務實體空間;

⑤其他。

3 數據服務體系之資源集成

3.1 數據資源來源與獲取途徑

立足當前國內學術圖書館的發展實情及研究人員、研究機構的數據共享現狀,國內圖書館可行的數據資源來源與獲取主要有三種途徑(還有其他途徑):

一是本館購買或者可共享到的商業性數據資源,包括館藏印本類數據資源及其數字化版本(如地圖集)、綜合性數據庫中的數據資源(如中國知網)、數據/統計類數據庫資源(如中經網統計數據庫)等,圖書館在其中承擔數據庫評估、購買、維護等的職責。

二是遵循特定許可方式的國內外開放獲取數據,其中國內可包括中國國家科技基礎條件平臺系列科學數據共享平臺[27],中國科學院各學科領域的數據型數據庫[28],其他各類數據開放共享平臺,機構知識庫中的數據資源(如中國科學院文獻情報中心機構知識庫)、國家及地方統計局統計數據等;國外可包括開放獲取數據知識庫(如figSahre、Dryad、Zenodo、Genbank、ICPSR),開放獲取數據期刊(如Biodiversity Data Journal、Open Health Data等),世界主要國家統計局,國際組織開放數據平臺(如聯合國統計司、世界銀行、國際貨幣基金組織)等。

三是研究人員及研究機構托管、提交、合作共享的研究數據,如前文所述的北京大學開放研究數據平臺、復旦大學社會科學數據研究中心等平臺所獲取的數據。

3.2 數據資源分類組織與揭示

數據資源揭示與呈現的深度、層次及形式直接影響著數據服務質量和用戶體驗效果,因此在獲取了一定數量和質量的數據資源的基礎上則須對數據進行分類組織和揭示以便用戶獲取。目前,圖書館數據資源揭示主要有4種通行做法:(1)按照數據資源所屬國別或區域、所屬學科、數據資源類型等進行分類導航和揭示,為每一類數據資源設置資源原址的鏈接,如加拿大溫莎大學圖書館、麥克馬斯特大學圖書館、約克大學圖書館;(2)將館藏數據資源納入圖書館檢索(發現)系統,如加拿大聯邦科學圖書館[29];(3)建立專門的數據資源檢索系統,如澳大利亞聯邦科學與工業研究組織圖書館數據門戶[30];(4)收割開放獲取數據資源的元數據,并將其整合到資源發現系統之中,如清華大學圖書館將“research datasets”的檢索整合到“水木搜索”,用戶可檢索海量的數據資源并鏈接到在線資源原地址。

3.3 數據服務用戶端平臺搭建

根據前文所述數據資源組織與呈現方式,其中第一種需要合適的用戶前端平臺,如網頁或網站;而第二、第四種方式只需在管理后端進行集成,對元數據管理、技術開發等有較高要求;第三種需要建立專門的數據服務系統(可參考檢索、發現系統的架構),同時需要搭建用戶前端和管理后端。比較而言,第一種方式較為方便快捷,適合數據服務尚處于探索、萌芽、嘗試的階段,中國科學院文獻情報中心在數據服務初期階段選擇的是第一種數據資源組織與呈現方式,并以網頁作為用戶服務界面,該頁面包括數據服務項目、數據資源(按學科分類、按來源分類)及鏈接跳轉(效果示意見圖1),數據利用工具推薦(見圖2)及服務聯系人信息等。

圖1 數據資源組織效果示意圖

圖2 用戶端頁面數字科研工具推薦

4 數據服務體系之多元服務

具體的服務內容是數據服務體系中最具伸縮性和拓展性的部分,也是最具創新性、多元化特點的部分。面向研究需求的數據服務應充分考慮研究過程中各環節可能對數據的需求,因此宜以科學研究生命周期(見圖3)為參考對數據服務進行設計,具體服務內容、服務形式因館而異。

圖3 科學研究生命周期[14]

4.1 研究構想階段的數據服務

研究構想階段可能需要廣泛查閱領域內的經典文獻、熱點文獻與最新資源,也需要靈感的碰撞和思想的火花,還需要對未來可能遇到的研究困難與障礙等進行預期甚至預警。因此圖書館宜在本階段扮演“孵化器”的角色,提供以預期用戶需求為導向的數據服務,包括但不限于:①數據政策與指南的制定或推介;②數據相關幫助性視頻教程的集成與推薦;③數據資源宣傳推廣;④數據資源通報與推送;⑤數字學術、軟件工具相關研討培訓等。以數據資源宣傳推廣為例,圖書館可通過微信公眾號、微博、校內論壇、機構郵箱推送等渠道,以圖文、視頻等形式對前文所述的各類數據資源進行系列化、專題化的推介。

4.2 研究過程中的數據服務

在研究人員的研究過程中,圖書館能夠發揮的實質性作用相對而言比較有限,本階段圖書館宜扮演“后勤保障”的角色,為研究人員排除研究中可能遇到的各種“管理性”“事務性”的麻煩和困擾??商峁┑臄祿瞻ǖ幌抻冢孩贁祿治黾翱梢暬?;②研究數據管理;③數據論文寫作支持;④數據期刊投稿指南等。以數據期刊投稿指南為例,圖書館應廣泛調研國內外公開出版的數據期刊(如國外的Scientific Data、國內的《中國科學數據》等),為用戶提供這些數據期刊的網站鏈接、編委會成員、審稿周期、版面費用、投稿格式、同行評審、被收錄情況等信息摘錄以便參考。

4.3 成果發表與共享階段的數據服務

成果發表與共享是研究完成并取得階段性成就的環節,也是絕大部分研究人員“最在乎”的環節,圖書館宜在本階段扮演“維權者”的角色,幫助作者充分享受與維護其各類研究成果與產出的正當權益。本階段可提供的數據服務包括但不限于:①數據托管;②數據出版(尤其是DOI分配);③知名期刊數據附件提交政策要求;④數據知識產權咨詢等。以數據知識產權咨詢為例,圖書館可調研不同類型的開放數據許可協議并進行總結和推薦(如CCBY、ODC-BY等),向用戶介紹DOI分配代理機構、DOI在數據領域的應用,提供獲得數據DOI的途徑。

4.4 成果保存與利用階段的數據服務

學術成果保存與利用是有益于其他研究人員、社會公眾甚至子孫后代的行為,是學術研究價值的終極體現。因此,圖書館宜在本階段扮演“監護人”的角色,為學術成果的保存、利用、宣傳、推廣甚至轉化提供力所能及的服務。本階段可提供的數據服務包括但不限于:①數據長期保存;②數據與數據產品引用規范推介;③面向研究團隊的特定領域數據成果專題服務(如動物、植物圖片數據專題展示);④研究成果科普、展覽及推廣等。以數據與數據產品引用規范推介為例,圖書館應廣泛調研國內外數據引用的標準規范與實踐案例,如對“數據引用原則聯合聲明”[31]、DataCite[32]、我國最新發布的《信息技術科學數據引用》(GB/T 35294-2017)國家標準[33]等進行推介,并根據用戶的實際需求推薦合適的數據引用方案。

5 數據服務體系之條件保障

5.1 數據服務人才建設

設立數據服務相關崗位是數據服務的必然要求,因此數據服務人才建設、數據服務館員素養與技能備受關注。目前而言,館員招聘及交流培訓是最為行之有效的人才建設方式。

5.1.1 數據服務館員招聘

畢業生招聘是圖書館界一項常規的活動,招聘具備相關學科背景且已經掌握一定的數據服務相關專業知識與技能的高校畢業生是最高效的人才“培養”方式之一。例如在2018年度招聘季,中國科學院文獻情報中心、北京大學圖書館相繼發布了“數字科研服務館員”“數據服務館員”的招聘啟事,并預計從事數據服務相關工作[34][35]。

5.1.2 數據服務館員學習、交流與培訓

學習、交流與培訓是提高數據服務館員專業知識與技能的重要途徑,是培養已知的和潛在的數據服務館員的有效方式。近年來,除國際交流與合作外,我國圖書情報界也舉辦了諸多相關研討與培訓,如北京大學圖書館舉辦的“數字人文論壇”[36-37]、中國圖書館學會專業圖書館分會舉辦的2017年“數據館員培訓班”[38]、中國科學院文獻情報中心舉辦的“中國開放獲取推介周”[39]以及“科研數據管理與服務培訓班”[40]、“Research data management in practices研討班”[41]等,吸引了大批館員及其他信息服務專業人員的積極參與。

5.2 數據服務空間建設

物理空間并非數據服務體系之必需,各圖書館可根據業務發展規劃、需求考慮是否將物理空間納入數據服務體系,事實上空間本身也是一種服務(“空間即服務”)。在具體的空間設計方面,數據服務應秉承以用戶為中心、科學與人文相融合等理念,進行功能劃區、家具布置、設施設備安裝等,如中國科學院文獻情報中心的數據服務空間包括:①計算機與網絡服務區;②數字閱讀與數字體驗區;③開放式用戶數據查詢與利用區;④小型封閉式研討區;⑤紙質科學人文通識閱覽區;⑥小型綜合咨詢臺等功能劃區。

5.3 數據服務經費預算

經費預算是數據服務體系建設成本投入的直觀體現,也是相關戰略決策的重要參考,關乎數據服務體系構想能否落地實施。通常而言,數據服務可能的經費投入包括:(1)軟硬件設施的配備與維護費用,如計算機配置、正版軟件購買、投影及打印掃描設備購買等;(2)資源集成與呈現的平臺搭建費用,如網頁制作成本、網站建設成本等;(3)研討培訓相關的場地與師資費用,如外聘的培訓講師報酬、專家咨詢費等;(4)空間再造成本,如空間設計、家具購買等;(5)額外的人力資源成本,如兼職學生的勞務費用等。

6 結語

近年來,數據服務正在成為圖書館服務的新領域,尤其研究數據管理成為其中的熱門方向。然而,縱觀研究數據管理全景,圖書館研究數據管理服務仍以咨詢型服務為主而技術及實踐支撐類服務較少,圖書館在其中起輔助而非主導作用,相當一部分圖書館在可預見的未來一段時期內開展實質性的研究數據管理服務還將存在較大的現實困難。

在不斷適應新的學術環境和社會需求、尋求新的發展機遇和業務生長點的背景下,圖書館跳出研究數據管理的局限而探求更廣泛的數據服務也是一種可行的思路。但不管怎樣,圖書館的數據服務是一個趨勢,對于大部分學術圖書館而言,及早“試水”是有必要的。

猜你喜歡
數據服務數據管理圖書館
地理空間大數據服務自然資源調查監測的方向分析
企業級BOM數據管理概要
定制化汽車制造的數據管理分析
海洋環境數據管理優化與實踐
基于數據中臺的數據服務建設規范研究
CTCS-2級報文數據管理需求分析和實現
圖書館
數據服務依賴圖模型及自動組合方法研究
如何運用稅收大數據服務供給側結構性改革
去圖書館
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合