?

高校圖書館和公共圖書館開放數據服務比較研究*
——以北京大學圖書館和上海圖書館為例

2019-05-14 11:54錢思晨岑炅蓮
圖書館研究與工作 2019年5期
關鍵詞:數據服務館藏圖書館

錢思晨 岑炅蓮 張 宇

(1.廣西民族大學管理學院 廣西南寧 530006)

(2.華東理工大學科技信息研究所 上海 200237)

1 引言

隨著信息技術的發展,大數據已成為圖書館服務模式變革、服務創新、提高服務水平不可或缺的資源,圖書館相關服務也圍繞著“數據”開展,提供開放數據服務,以促進數據資源的開發利用。國外圖書館開放數據服務實踐起步較早,主要集中于高校圖書館和公共圖書館。2013年11月,德國數字圖書館就利用API接口向公眾提供開放數據服務[1];美國高校圖書館面向科研工作提供科學數據服務,包括科學數據的開放共享服務[2];加拿大圖書館則積極參與政府開放數據,提供政府開放數據服務[3]。目前,國內相關研究大多圍繞圖書館開展數據服務工作理論探討層面[4-7],在實踐領域北京大學圖書館(以下簡稱“北大圖書館”)和上海圖書館(以下簡稱“上圖”)起步較早,開放數據服務功能比較完善,在高校圖書館和公共圖書館中具有較為明顯的代表性。因此,本文選取北大圖書館和上圖進行開放數據服務實踐的比較,以期為圖書館開放數據服務實踐提供建議。

2 研究設計

本文選取的高校圖書館和公共圖書館案例分別為北大圖書館和上圖。北大圖書館于2014年初啟動了研究數據管理項目,通過數據管理需求調查、試驗平臺搭建、技術標準調研、完成平臺評估選型,于2015年12月正式上線運行北京大學開放研究數據平臺。上圖開放數據平臺于2016年1月與上圖家譜知識服務平臺同期上線,此后不斷增添盛宣懷檔案數據庫、名人手稿檔案庫、人名規范庫等數據庫,形成了服務于數字人文研究的綜合性開放數據服務平臺。

本文結合圖書館信息服務構成要素[8],并參考相關研究的分析思路[9-11],選取組織架構、資源建設、服務內容、技術支撐、推廣應用5個方面作為北大圖書館和上圖開放數據服務的比較維度,涵蓋開放數據服務的主體、資源、內容、技術及推廣要素。通過對北大圖書館開放研究數據平臺和上圖開放數據平臺進行網絡調查,收集5個比較維度的信息,結合相關文獻資料,運用比較研究方法對高校圖書館和公共圖書館開放數據服務功能進行分析研究,在歸納總結的基礎上對圖書館開放數據服務提出建議。

3 調查與發現

3.1 組織架構

圖書館開放數據服務離不開技術、管理以及數據資源的整合。從實踐中看,北大圖書館以項目合作的方式推動開放研究數據平臺建設,通過與國家自然科學基金-北京大學管理科學數據中心的戰略合作,由管理科學數據中心進行數據資源的收集、清理、規范化和分析以及平臺測試及反饋,由北大圖書館在面向北京大學師生數據管理需求調查的基礎上,進行平臺需求和功能設計、技術平臺的搭建以及數據的存儲、分類、管理和服務[12]。北大圖書館開放數據服務的組織架構如圖1所示。

圖1 北京大學圖書館開放數據服務組織架構圖

上圖開放數據服務組織架構如圖2所示,其開放數據平臺則由上圖獨立設計開發,平臺所需的技術、管理和數據資源等均由上圖提供支持,在具體的建設模式上,與北大圖書館有顯著差異。上圖開放數據平臺是一個綜合性平臺,平臺依托于家譜知識服務平臺、盛宣懷檔案知識庫等多個數據庫,各個數據庫既相互獨立,又統一于開放數據平臺上。在平臺建設思路上,上圖采取分步推進的方式;家譜知識服務平臺分為一期和二期工程;歷史文獻眾包平臺也分為一期和二期工程[13],多個數據庫均是分批、分步建立的。

圖2 上海圖書館開放數據服務組織架構圖

3.2 資源建設

3.2.1 資源建設方式

北大圖書館開放數據服務資源主要來源于北大管理科學數據中心,同時北大圖書館也與北大中國調查數據資料庫、中國家庭追蹤調查(CFPS)、中國健康與養老追蹤調查(CHARLS)、北京大學中國國情研究中心、北京大學健康老齡與發展研究中心等十多個項目或機構合作,采取資源共建共享的方式進行開放數據資源建設。除此之外,數據還可由學者提交和共享,主要采取兩種提交方式,一是學者自行提交和發布;二是學者提供原始數據或記錄,由平臺提供“數據監護”服務,并且學者在數據發布后還可通過平臺查看數據使用情況。

上圖開放數據平臺數據資源來自于其館藏資源數字化,資源建設主要采取自建方式,由圖書館或外包機構對館藏資源進行數字化,并對數字化的館藏資源進行元數據編目,通過數據收集、清洗、加工、轉換等步驟,將館藏資源內容轉化成規范化、結構化的數據[14]。在上圖舉辦的開放數據應用開發競賽中,上圖也聯合CADAL項目管理中心、哈佛大學計量社會學系和復旦大學圖書館等機構向參賽者提供了豐富的開放數據資源[15],但其平臺上開放的數據仍是上圖館藏資源。

3.2.2 資源類型和格式

資源類型與格式是影響開放數據資源利用的重要因素之一。北大開放研究數據平臺所開放的數據資源是狹義的數據資源,即數字符號以及數字符號的知識背景信息。而上圖所開放的數據資源則是廣義的數據資源,既包括數字符號及其知識背景信息,也包括數字化圖片、文字、影像資源等。這與兩者數據資源來源途徑有緊密聯系,北大圖書館數據資源主要來自于調查和科研中產生的數據,而上圖數據資源則主要來自于其館藏文獻資源數字化。

在資源格式方面,北大圖書館開放數據資源格式為常見的pdf、docx、xlsx、tab等格式,以文件的形式提供數據資源檢索和下載。上圖開放數據如《中國家譜總目》的數據保存于Excel列表中,館藏的家譜數據采取MARC格式存儲于SQL Server數據庫中[16],在開放利用過程中則是基于已有的館藏元數據生成RDF格式數據,以保證開放數據資源可以順利地開發利用。

3.3 服務內容

在開放數據服務內容比較方面,本文參考相關研究[9,17],從管理服務、檢索服務、獲取服務、分析服務、開發服務、咨詢服務6個方面進行比較。管理服務即平臺對開放數據資源提供定期維護管理,并且對用戶共享的數據提供相關存儲和管理服務。檢索服務即平臺提供開放數據資源進行整合和關聯,提供快速、便捷的檢索服務。獲取服務即平臺提供多種開放數據資源獲取的方式和途徑,以保證用戶開放數據資源的有效獲取。分析服務即利用計算機技術和可視化技術,提供開放數據的統計分析和可視化分析服務。開發服務即提供開放數據開發流程指南或手冊,并提供相關開發工具服務。咨詢服務即平臺開辟專門的咨詢和交流社區,方便平臺與用戶的溝通交流。通過網絡調查,對北大圖書館和上圖開放數據服務內容進行比較(見表1)。

表1 北京大學圖書館與上海圖書館開放數據服務內容比較

北大圖書館提供數據提交和發布服務,并且對用戶提交的數據進行組織、管理和維護,以保證數據的可持續利用。上圖則沒有用戶數據提交和發布服務,更沒有用戶數據管理服務。在檢索服務方面,上圖所涉及的數據資源庫眾多,并且這些資源庫存儲的對象差異很大,因而無法提供統一的集成式檢索服務。北大圖書館的檢索服務則類似于普通的信息檢索,并未對其中的數據進行關聯,因而檢索結果關聯性不大。在資源獲取方面,北大圖書館面向科研工作者提供數據資源的直接下載服務,上圖則不能直接下載,只可采取網頁瀏覽和接口調用的方式進行開發利用。同樣因兩所圖書館開放數據對象的不同,在分析服務方面也存在較大差異:北大圖書館提供統計分析等在線可視化分析服務功能,上圖提供的是知識圖譜可視化服務。在開發服務方面,上圖提供開發工具、API接口以實現開放數據的增值性開發利用,北大圖書館則無此服務。在咨詢服務方面,北大圖書館提供了郵件咨詢方式,上圖網頁上則沒有相關咨詢服務功能。

3.4 技術支撐

北大開放研究數據平臺以哈佛大學開源平臺Dataverse為基礎進行開發,該平臺最初是哈佛大學定量社會科學研究所數據科學團隊研發的研究數據管理系統,主要面向學者、研究機構、期刊雜志、學會等提供研究數據的管理、發布和訪問服務[12],其主要功能包括數據管理、用戶管理、權限管理、檢索服務、API接口、在線分析、持久標識符注冊管理等[18]。從技術支撐來看,北大開放研究數據平臺更像是面向科研人員的機構知識庫,并沒有突出大數據環境下開放數據開發利用的特征。

上圖開放數據平臺采用Open Link Software公司的開源系統Virtuoso來存儲RDF數據,同時利用關系數據庫來存儲系統的流程控制、業務邏輯、用戶訪問數據。在開發方面,采用語義萬維網的相關技術,如RDF數據查詢語言SPARQL和Jena開發框架,實現對RDF數據的查詢和增刪改操作[19]。上圖所采用的Virtuoso系統是一款語義倉儲,該系統用本體作為語義模式,并且可以對這些數據進行推理,其數據模式更加靈活和通用,這使其能夠快速地解釋和適應新的本體和元數據模式[20]。

從兩所圖書館開放數據平臺采用的系統差異可以發現,上圖在開放數據服務方面側重于數據內容的展現、開發和利用,通過支持倉儲的數據庫來實現開放數據內容的知識表達。而北大圖書館則側重于數據本身的管理,因而其采用的Dataverse系統支持數據管理、用戶管理、權限管理等多種功能,通過這些功能可以保證數據的完整性、原始性和規范性,從某種方面而言,這也體現出科研學術的嚴肅性。

3.5 推廣應用

開放數據服務價值的實現離不開推廣應用,北大圖書館和上圖均通過“以賽促用”的方式進行開放數據平臺和服務的宣傳推廣。兩館近三年舉辦的開放數據比賽活動如表2所示。早在2016年4月,上圖就開展了開放數據應用開發競賽,這是我國首個家譜開放數據應用開發競賽。競賽活動迄今已舉辦三屆,主要通過開發上圖館藏家譜知識庫數據形成移動應用產品,在比賽過程中,上圖還為參賽團隊開展館藏數據接口方面的解讀及培訓,最終的參賽作品還通過網絡媒體、分享會等形式進行展示和交流[21-22]。北大圖書館在2017年11月聯合北京大學信息管理系、南海大數據應用研究院等單位共同舉辦首屆全國高校數據驅動創新研究大賽,參賽對象為全國高校本科、碩士、博士在讀學生,并且要求參賽者必須基于數據進行研究,數據可以是北大圖書館開放數據平臺上的數據,也可以是自己調查收集的數據,在提交研究論文的同時,也必須提供所使用研究數據。在比賽過程中,北大圖書館也通過網絡直播的方式開展數據挖掘與分析方面的培訓,參賽作品為研究論文,并在賽后推薦發表或轉寫為數據新聞等[23]。

表2 北京大學圖書館與上海圖書館開放數據比賽活動一覽表

開放數據應用開發比賽極大地提高了圖書館開放數據服務的影響力,也促進了圖書館開放數據的利用程度。相對于北大圖書館的比賽,上圖的比賽覆蓋面更廣、社會性更高、開發利用程度也更深,而北大圖書館的數據驅動創新研究大賽也在全國引起了關注,同時各參賽者提交的研究數據也提高了平臺的數據增量。

4 總結及建議

通過比較分析發現,作為國內領先的圖書館開放數據服務提供單位,北大圖書館和上圖在開放數據服務方面存在顯著差異。以北大圖書館為典型的高校圖書館側重于研究數據的存儲和管理,以上圖為典型的公共圖書館則側重于開放數據的開發利用。而造成這些差異的因素主要包括圖書館類型、服務對象和服務目標等。

高校圖書館面向本校師生提供學科服務,因而北大圖書館開放數據服務主要圍繞數據存儲和管理開展,以便更好地服務學科建設和科學研究。而公共圖書館是一個地區的文化、信息服務中心,引導著大眾閱讀的方向和品位[24],其服務對象面向社會大眾。因此,公共圖書館不僅僅是一個圖書館,還是一個文化象征。上圖開放數據服務圍繞著數字人文項目開展,是人文社科研究在大數據時代的深化和發展,也是對文化傳播方式的創新。此外,兩館在數據資源配置方面也存在差異,這種差異除了高校圖書館和公共圖書館功能定位的不同之外,還有國家資金投入、時空差異等影響因素。

雖然高校圖書館和公共圖書館在開放數據服務上存在一定差異性,但兩者在開放數據服務功能方面都存在不足,都有可以相互借鑒學習之處??偨Y而言,圖書館可從需求、資源、機構和服務四方面不斷優化開放數據服務。

4.1 明確用戶需求,以用戶需求為服務導向

北大圖書館在開放數據平臺建設中,充分調查和分析本校師生的數據服務需求,在明確用戶需求的基礎上構建了開放數據平臺,這對開放數據資源建設、服務設計等都具有重要的指導作用。因此圖書館在提供開放數據服務時,可以借鑒北大圖書館的經驗,首先應充分分析用戶的開放數據需求,通過問卷、訪談等形式進行用戶需求調查,結合本館的實際情況,以用戶需求為服務導向進行開放數據服務,公共圖書館在用戶需求調查時還應注意服務對象的廣泛性和社會性,真正彰顯公共圖書館的公共性、文化性特征和以人為本的服務理念。

4.2 完善基礎設施,促進數據資源集成共享

大數據時代,數據資源的整合集成是數據實現價值的前提,而相關的基礎設施則是數據資源集成共享、開放利用的基礎,這些基礎設施包括數據庫系統、數據共享系統、數據開放平臺等。上圖在系統平臺建設過程中,分批、分步建設館藏數據庫系統、數據開放平臺,不斷完善系統平臺的各項功能和服務,除此之外,還構建了基于歷史人物的本體,實現了數據資源的規范化、格式化。因此,圖書館可借鑒上圖的經驗,完善數據開放平臺的基礎設施建設,將館藏數據資源整合集成,避免數據資源的分散,并且設計構建符合本館實際情況的元數據標準,促進館藏數據資源的集成共享,以充分滿足用戶的需求,促進數據資源的增值性開發。

4.3 加強機構合作,提高開放數據服務能力

圖書館開放數據服務離不開技術、資金和管理的投入,僅僅依靠圖書館一家單位提供開放數據服務難免力不從心。北大圖書館在開放數據服務中與多個機構進行了戰略合作,這些機構主要為科研機構;在開放數據創新大賽中,北大圖書館又與科研機構、高等院校、企業單位等機構合作,優化了技術、資金、數據等資源的配置,大大提高了圖書館開放數據的服務能力。這為公共圖書館提供了很好的參考經驗,公共圖書館不僅可以進行圖書館館際合作,在數據資源方面可以與檔案館、博物館等文博機構合作,在技術方面還可以與高等院校合作,整合共享圖書館檔案館博物館的數據資源、高等院校的技術資源,提高圖書館開放數據服務能力。

4.4 整合服務功能,構建開放數據服務體系

開放數據服務并非單純將數據資源開放共享即可,而是涉及整個數據生命周期活動,因此北大圖書館、上圖在開放數據服務實踐中,除了提供數據開放服務,還提供相應配套的開發工具、分析工具培訓,并通過比賽活動進行開放數據的宣傳推廣和應用開發,擴大了圖書館在大數據時代的影響力,同時也提高了圖書館數據資源的開發利用程度。因此,圖書館開展開放數據服務,在以用戶需求為導向的前提下,應整合服務功能,開展多層次的服務,為數據的開放共享、分析處理、開發應用等各個環節提供必要的服務支持,構建以實現數據價值為目標、滿足用戶需求為導向的開放數據服務體系。

猜你喜歡
數據服務館藏圖書館
大數據時代高校圖書館數據服務的困境及優化路徑
地理空間大數據服務自然資源調查監測的方向分析
基于數據中臺的數據服務建設規范研究
館藏幾件殘損《佚目》書畫瑣記
云南省檔案館館藏《東巴經》
博物館的生存之道:館藏能否變賣?
圖書館
數據服務依賴圖模型及自動組合方法研究
介紹兩件館藏青銅器
去圖書館
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合