?

數字學術與公眾科學:數字圖書館新生態

2017-03-25 17:34謝蓉劉煒
大學圖書館學報 2017年1期
關鍵詞:數字人文數字圖書館

謝蓉+劉煒

摘要圖書館數字技術應用向縱深發展,正呈現三個新的發展方向:一是從數字化到數據化;二是云端化和大數據之后帶來的智慧化;三是全方位的網絡眾包和大眾參與。在上海剛閉幕的第十三屆數字圖書館前沿問題研討班(ADLS 2016)上,首次提出“數字學術和公眾科學”的主題,連同數據化和智慧化,這三方面的趨勢正帶來數字圖書館的新變化和新生態。

關鍵詞數字圖書館 數字學術 公眾科學 數字人文

圖書館數字技術應用向縱深發展,已呈現三個新的發展方向:①從數字化到數據化,館藏對象深入到數據層面正在成為圖書館新的業務趨勢;②云端化和大數據之后必然帶來的智慧化;③普遍2.0之后造成全方位的網絡眾包和大眾參與。這是在上海剛結束的第十三屆數字圖書館前沿問題高級研討班(ADLS 2016)傳達出的訊息。

本屆論壇以“數字學術與公眾科學:數字圖書館新生態”為主題,重點探討了“數字學術與數字人文”“公民科學與大眾參與”“關聯數據與語義技術”和“開放數據和開放知識”等四個分主題,這些主題為首倡于1994年的“數字圖書館”概念帶來了新的內容和新的熱點,給當今處于“復合型圖書館”階段的圖書館實踐帶來新的動力,并指明了發展方向。在短短兩天的研討時間里,會議容納了26個發言,晚餐期間還舉辦了頭腦風暴和專家問答,密集的概念轟炸和觀點碰撞讓與會者大呼過癮,原計劃150人的研討班吸引了240余位關注前沿的同行與會。

1從數字化到數據化:數字圖書館向知識服務邁進

“僅僅數字化是不夠的,數字圖書館應該將工作的中心轉向‘數據化,數字圖書館的下一步是建設數據圖書館?!眮碜约又莶死髮W東亞圖書館的林海青先生如是說。本屆論壇開篇的第一個主旨報告——張曉林研究員的“超越數字圖書館:基于數據與分析的知識服務”就對這一觀點直接做出了呼應。

所謂數據化,是指以數據為基本單元組織信息并提供服務的方式,區別于傳統的以文獻(包括網頁、電子書這類數字文獻)為基本單元的方式,這里的“數據”,是指在萬維網上能夠獨立存在,或經過一定格式的數據編碼,使計算機程序能夠處理或“讀懂”其含義的數據,并非我們通常所說的只能通過人來理解和處理的數據。數據化的主要特點是資源對象的細粒度化和語義化,以及其格式是對于內容的描述而不只是形式或結構上的描述,順應了萬維網從Web of Document向Web of Data的發展趨勢。本次會議清華同方公司介紹了他們在碎片化和精準化知識協同服務方面的最新進展,也恰好印證了這一趨勢。

圖書館的數字資源管理問題還沒有得到很好解決,仿佛一夜之間,大家都開始談論數據服務,業界有人詬病這又是一輪炒概念、趕時髦現象。然而我們認為這是一個必然趨勢,因為這一趨勢并非來自于圖書情報行業本身,而是來自我們所處的環境和我們所服務的對象。整個科學研究都在向“數據驅動的研究”發展,正呈現“所有的科學都在變成數據科學”這一無法回避的現象。隨著近年來數字科研(eScience)和數字人文(Digital Humanities)的興起,大量的科學研究都在變身為數據密集型研究,產生形形色色的“數字×××學”或“計算×××學”,例如“數字文學”“計算語言學”“計算歷史學”“計算生物學”等等,提供基本研究方法和工具的“數據科學”應運而生而且得到快速發展。這一現象被美國計算機科學家、圖靈獎的獲得者吉姆·格雷(JimGray)總結為科學研究的“第四范式”。

圖書館開展數據服務起因于歐美各國近年來對政府基金項目申報要求提交數據管理計劃的規定,許多大學和研究機構都要求圖書館員在科研人員申報項目時提供必要的幫助,以符合編制數據管理計劃的要求。部分研究型圖書館走得更遠,直接參與了其所屬機構數據管理系統的研發、管理和運營。復旦大學張計龍副館長專門討論了在構建科研大數據管理平臺方面的做法和思考,并特別介紹了美國科研數據行業對“數據科學家”的迫切需求和眾多iSchool紛紛開設專業培訓,對數據化趨勢起到了推波助瀾的作用。上海外國語大學任樹懷館長也介紹了以大學發展戰略為指導構建數字學術服務平臺的心得。

數字人文是目前圖書館為數字學術開展服務的一個重點領域。早期的谷歌等公司轉換的數字圖書資源被并入Hathitrust和美國國家公共數字圖書館(DPLA)等新的數字圖書館服務體系中,其它圖書館和博物館、美術館、檔案館等人類文化記憶機構也紛紛成立數字人文研究中心,由于它們擁有海量特色館藏,經“文本化”和“數據化”之后,目前已成為各相關領域數字人文研究不可或缺的基礎設施。數字人文研究和服務在我國剛剛興起,本次會議分別有武漢大學王曉光的“面向數字人文的文化遺產圖像深度語義組織研究”,北京大學朱本軍的“數字人文:圖書館實踐的新方向”、廣西民族大學歐陽劍的“面向數字人文的數據融合研究”、上海圖書館夏翠娟的“以數據服務為基礎的數字人文平臺建設方案研究”等報告。他們分別結合各自的項目,生動地介紹了一批成果,另有來自北京水晶石公司的VR技術總監魏記先生專門就數據模型化和可視化做了報告,都展示了目前國內數字人文研究和應用的較高水平。

然而從行業層面來看,圖書館開展數據服務并未成為其理所當然的業務。要確立在數據管理方面的地位,體現圖書館在傳統文獻、數字資源之外,對于數據管理也能做出獨一無二的貢獻,還需要更多的圖書館做出更大的努力。

2從自動化到智慧化:實現隨時隨地無所不在的嵌入式服務

智慧圖書館的含義通常有兩個:一是指采用無線射頻(RFID)或其它自動感知等物聯網技術之后實現圖書館服務的自助化(無人化)和智能化,通常是指實體圖書館的智慧化;二是通過“大數據分析”,使大數據變成“聰明數據(Smart Data)”,發揮大數據的價值,使圖書館提供更加個性化的服務。數據分析既可以應用于優化傳統服務,也可以用于優化數字服務,因此可以認為這是復合型圖書館的智慧化。而本次會議還涉及另一種“智慧”:通過對資源內容進行語義標注,使其“自帶智慧”,變成“聰明內容(Smart Content)”,這才是真正意義上的數字圖書館智慧化。

來自上海交通大學的孫翌介紹了一個典型的實體圖書館智慧型發展之路(他稱為“智能圖書館”),綜合采用了多種技術,包括自動感知和數據分析處理等,是第一類智慧圖書館的升級版。阿法迪公司的雷向欣博士也提供了一個結合用戶行為數據分析的智慧圖書館解決方案,打破了人們對該公司只作RFID硬件技術供應商的固有認識,具有很強的可操作性。重慶大學楊新涯館長展示了一個新上線的圖書館門戶系統,不僅有許多2.0功能,而且融合了大量的數據分析,能夠提供多種聚類、推薦,這可算作第二類智慧圖書館系統。來自美國肯特州立大學的曾蕾教授分享了一個智慧數據應用于人文研究的案例,可以為圖書館行業所借鑒。

關聯數據作為語義萬維網的一種簡化實現,是目前最常見的和最簡單的“聰明內容”,已開始在科學數據管理、STM(科學、技術、醫學)出版、政府信息公開和企業數據管理等領域得到了普遍關注和初步應用,被認為是互聯網Web 3.0的發展方向。本次會議有多篇關聯數據技術和應用方面的報告,可以說是國內關聯數據領域最新成果的一次大檢閱。林海青提出關聯數據是對網絡上的信息進行規范控制的最好方法,鄭巧英利用元數據和本體技術對多種類型資源的資源深度整合提出了方案,胡小菁詳細介紹了圖書館第一個應用關聯數據作為書目數據格式的最新進展,夏翠娟則提供了一個研究型圖書館開發數字人文關聯數據應用的完整案例,陳濤博士專門針對政府開放數據提出了關聯數據的解決方案,張永娟對涉及“聰明內容”的語義出版現狀進行了概述。

會議最有意義的內容之一應該算是曾蕾和范煒所做的關于“關聯數據能力指標(C14LD)”的介紹。這是一個國際專家小組最新的工作成果,把學習關聯數據有關的知識分解為具有層次的各種指標,參照“成就標準網絡(Achievement StandardsNetwork,ASN)”中的《圖書館能力指標》①,將所有相關知識點進行分類發布,這樣就可以指導人們進行對照學習,或評估自己在關聯數據方面已經具備的知識和能力。發布C14LD的網站目前已移交由都柏林核心元數據組織(DCMI)進行維護,能力指標文檔的中文翻譯也已在官網上發布。本屆會議的一個重要成果是將由上海圖書館建立和維護一個中文版C14LD網站,與英文版網站一樣,支持能力指標的進一步修訂擴充,以及將更多的中文關聯數據資源關聯上去,供人們學習和參考。

“聰明內容”不僅是有語義的內容,而且是“有情境(Context)”和“可行動(Actionable)”的內容。上海圖書館劉煒副館長在閉幕報告中展望了機器智能時代圖書館數據服務的挑戰,認為當前語義技術的應用還只是“智慧圖書館”萬里長征的第一步,將來經由深度學習而來的機器自動標引和知識組織能力將完全能夠取代人類,知識組織的大量勞動密集型工作可以交給機器來完成,但是如果我們現在不能給機器提供足夠深度學習的算法和模型,即提供情境描述的結構和行動模式的話,機器是不可能進行深度學習的。這也是目前利用語義技術模擬真實世界的最重要的意義所在。

3從專業化到公眾化:以社群力量推動數字學術

Web 2.0之后,網絡不僅是傳播信息的渠道,而且是人際交互的平臺;不僅是探索知識的寶庫,而且發展成連接萬物、實現知識創造的虛擬空間。

據估計,美國人每天花在社交網絡臉書的時間大約有40億分鐘,相當于7500人年。他們不論做什么,有意義還是無意義,他們的行為模式本身,就具有巨大的商業價值,都是對臉書的貢獻。目前我國已有7.1億網民,其中手機網民6.56億,他們每周上網時間大約為26.5小時,如果能把他們的時間組織和利用起來,或者在滿足他們上網目的的同時順便實現一些其他目標,則將產生巨大的財富。實際上已經有了大量這樣的案例,美國社交網絡專家克萊·基舍(Clay Shirky)將這一現象稱為“認知盈余”。

將人們的“認知盈余”應用于科研領域,就形成了所謂“公眾科學”。公眾科學(Citizen Science),又稱公民科學、大眾科學、群智科學(Crowd Science)、社區科學(Community Science)、公眾參與式科學研究(Public Participation in Scientific Research),它是指公眾作為研究者參與到科學活動中的過程。高深的科研工作往往被認為是一種高度的專業化工作,必須經過長期嚴格的訓練才能進行,而現在轉變為人人能參與,并不是說科研事業本身降低了難度,而只是其方式過程發生了改變,降低了參與門檻而已?;跀祿目蒲羞^程在基于網絡的管理平臺上,有可能剝離許多數據采集、處理、分析、歸納整理的步驟,把人類擅長的“勞動密集型”工作通過分發眾包,從而實現大眾參與并推進科研創造。南京理工大學的趙宇翔教授對公民科學現象有著深刻的理解,他總結公眾科學通常有如下特點:①群體性;②協作或競爭性;③任務眾包;④開放性等。公眾廣泛的參與也是數字學術的一個特征。

當一部分“數字公民”徜徉于虛擬世界不亦樂乎的時候,不能忘記還有相當數量的“網絡棄民”游離于數字世界之外,或者沖浪技術不夠高超而遭遇不公,甚至網絡“欺凌”。秦健教授對于數字公民現象進行了全面的闡釋,并把數字公民所需具備的能力總結區分為九個方面,分別是:信息查找能力、電子商務能力、交流能力、數字素養、數字禮節、數字法律、數字權利與責任、數字健康與數字安全等,她特別指出傳統社會中的相關做法和規則在數字世界可能完全失效,需要建立新的行為準則和道德規范,尤其要關注其中的一些負面影響。

公眾科學和數字公民是當前數字學術發展的一種新現象、新趨勢,圖書館不可能游離于整個數字學術大環境之外,它們與圖書館當前的發展有著密切的關系。首先,圖書館已經開始利用眾包方式來豐富和改善自己的資源系統,特別是一些數字人文系統;其次,越來越多的圖書館通過學科館員、數據館員等崗位直接參與到科研過程中去;第三,圖書館的資源管理門戶向知識服務平臺進化,本身提供了很多2.0交互功能和社交化功能,提供公眾交互的可能;最后,圖書館作為一個公立機構能夠對科研道德和學術規范起到一定的保護、正誤、??焙腿ビ炞饔?,這其實也是圖書館長期以來作為一種規范控制機構的功能延伸。

秦健教授給大家展示了數字學術的完整圖景,她認為數字學術是利用數字化工具手段和數據進行知識生產和知識擴散的完整過程,伴隨了學術研究生命周期全過程。她列舉了目前常用的數字學術工具,如Zotero、Evernote、Dropbox、Diigo、Google Drive和Scoop.it等,這些工具都具有很強的社交性,說明數字學術使學術的參與性大大增強,促進數字公民的增長,帶來群眾智慧。未來重大的科學進展有可能是成千上萬人共同努力的結果,有學者笑談,可能會有成千上萬的數字公民因為參與了民眾科學的項目,而同時獲得諾貝爾獎。

無論如何,數字學術將是未來科學研究的一般形態,它具有對象的數據化、過程的網絡化、組織的虛擬化、參與的公眾化、成果的開放化、出版的語義化和交流的智慧化等特點。但它也不是沒有負面效應,例如民科和反智現象等,這些現象只能在同樣的數字學術環境中,通過加強交流、消除信息的不對稱性等方式加以克服。

臉書和微信這樣的平臺正在發展成為人們須臾不可或缺的“社會機器”,人們在其中的創造成為生活的一部分,而科學研究也將如此。張曉林在報告中指出,未來的科學研究、內容出版,知識服務等將會由一種線上線下交織的“社會機器”來提供,人的活動只是其中的一部分,這是完全有可能的。

4結語

數字圖書館雖已經歷20多年的發展,但會議所反映出的趨勢表明,其創造力遠未停止。數據化和智慧化兩個趨勢并非本次論壇首次提出,但其最新進展和新的內涵在會上得到了充分詮釋;數字學術和公眾科學是本次論壇首次提出的主題,雖然其與圖書館的關系尚不十分明朗,但卻是圖書館所依賴的知識環境的重大變化,必然會影響到圖書館的管理與服務。這三方面的趨勢是互相促進和緊密交織的:數據化是數字學術的重要原因,也是智慧化的前提和基礎;公眾科學是數字學術發展的一個民主化結果,順應了網絡化發展低門檻化和人人參與的潮流,其實每一項信息科技的發展都是這種趨勢的助推器;智慧化是當今網絡技術進步的一個總趨勢。這三方面趨勢正在帶來數字圖書館新的變化甚至新生態,這也是本次會議的中英文主題:數字圖書館新生態和重塑數字圖書館(Reborn Digital Libraries)的用意所在。

管理學大師彼得·德魯克(Peter F.Drucker)說過,“預測未來的最好方法就是創造它”。論壇的成功舉辦,說明數字圖書館這一開拓了20多年的領域并未過時,已召開了13屆的數字圖書館前沿論壇也常開常新。圖書館行業新生事物依舊層出不窮,雖然一些人已產生審美疲勞,但“革命者”永遠年輕。

猜你喜歡
數字人文數字圖書館
數字人文2011—2016年研究綜述
數字人文時代公共圖書館經典閱讀推廣研究
數字人文目標下圖書館信息服務模式研究
高校圖書館的未來發展模式芻議
淺析“互聯網+”時代的圖書館管理
基于云計算的數字圖書館建設與服務模式研究
芻議數字圖書館計算機網絡的安全技術及其防護策略
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合