?

面向高校教師的圖書館“大數據素養”教育策略研究

2017-08-25 00:44何勝周兵李仁璞熊太純郭丹
現代情報 2017年7期
關鍵詞:高校圖書館大數據

何勝+周兵+李仁璞+熊太純+郭丹

[摘要]大數據背景下,高校圖書館如何充分利用自身海量的數據資源提升教師的數據素養水平,是該領域面臨的挑戰性問題。首先綜述了數據素養研究現狀,結合大數據特征討論“大數據素養”的內涵并給出其定義;接著依據高校教師的特點,提出以圖書館大數據平臺為依托,在大數據意識培養、大數據能力提高和大數據倫理內化三個層面上對應開展教育培訓,實踐服務和虛擬互動三方面服務的“大數據素養”教育策略?;趫D書館大數據平臺的方案能夠有效地將大數據技術深入融合到數據素養教育中,幫助高校教師盡快適應當前大數據技術變革的要求。

[關鍵詞]數據素養教育;大數據;高校圖書館;大數據倫理

十八屆五中全會提出實施國家大數據戰略,極大地推動了大數據在高等教育領域的應用研究。高校圖書館擁有豐富的數據和人力資源,是教育大數據應用的主要陣地。近年來,基于數據素養理論和高校圖書館資源,提高教師數據素養的相關研究,學界已經積累了一些研究成果。然而在大數據環境下,如何從海量資源中收集數據,發現知識,從而輔助教學活動,提高科研效率,完善自身專業發展,已成為當前教師數據素養教育面臨的主要問題,相關的研究還比較零散,并缺乏系統的解決方案。

本文在綜述數據素養研究的基礎上,提出“大數據素養”的概念并探討其內涵;針對高校教師“大數據素養”教育面臨的問題,提出一種基于圖書館大數據平臺的解決方案。

1研究現狀分析

1.1數據素養概念和數據素養教育

國外學界將數據素養稱為數據信息素養(Datainformation Literacy,DIL)。David Herzog認為DIL過程包括數據獲取、評估、分析及可視化;Adam Beauchamp則將DIL簡述為闡釋、評價和傳播信息的能力;JacobCarlson認為數據素養教育應涵蓋以下能力:數據采集、轉換、重用、分析和可視化能力,并應注意數據倫理規范;Tibor Koltay認為數據素養是關于獲取數據、并能進行批判式的評價和利用的能力;Qin Jian強調數據素養教育過程中需要提升對科學數據的理解、利用和管理等能力。國內方面,黃如花等深入分析英美等國的研究現狀后認為數據素養應包括數據意識、數據能力和數據倫理三方面內容;孟祥保討論了科學數據素養(Science DataLiteracy)的3個層次,即具有數據意識,具備數據知識與技能,了解數據管理政策法規、數據倫理。

從以上分析可以看出,國內外學者對數據素養教育的概念及內涵解析并不完全一致,但基本上都涵蓋數據意識、數據能力和數據倫理這三個方面的內容,并認為數據能力是關鍵要素。

1.2圖書館支持下的數據素養教育研究

由于圖書館擁有大量數據資源且數據服務人才高度集中,因而成為開展數據素養教育的主要機構。國外學界關注圖書館支持下的高校師生數據素養教育的實證研究。美國大學與圖書館研究協會(The Association of Collegeand Research Libraries,ACRL)認為,圖書館員有必要與高校教師開展合作,為DIL培育開發新的具有粘合力的課程;針對教師DIL的提高問題,加州大學洛杉磯分校的社會學系教師與圖書館員合作開展實踐研究:教師負責科學方法論、專業知識教學,館員負責數據采集、存儲和管理的實用性技能教學,共同提高師生的數據素養。國內方面,張晨認為高校師生的數據素養教育將成為大數據時代圖書館的主要職能之一,并研究了數據素養教育的內容與方式;基于網絡文獻調查法等手段,黃如花等提出數據素養教育應結合圖書館資源平臺,采取包括初級、進階和高級三個階段的分層次循序漸進的方式開展。鄧李君等認為高校圖書館在數據管理、資源整合、數據描述、數據保存等方面具有較強的優勢,專業講座、個性化培養等方式是提升高校教師數據素養的有效方式。

國外學者著重探討以高校教師和圖書館員相互合作的方式開展師生數據素養教育;國內方面力圖跟蹤國外研究進行理論探討的同時,基于圖情領域方法提出數據素養教育的具體措施。但是國內外研究存在如下問題:第一,偏重討論有限數據規模下的數據素養教育,在如何結合大數據特征,針對高校教師提升“大數據素養”以適應大數據技術變革要求的角度,缺乏系統研究;第二,認可圖書館數據和智力資源對數據素養教育的優勢,但是將教師和學生的數據素養放在一起討論。由于高校教師和學生分屬兩個不同特性的群體,在素養教育方面的知識儲備和能力水平存在不小的差異,有必要將二者分開加以討論,才能使數據素養教育方案更有針對性;第三,對“大數據素養”教育的討論大多還停留在方法概述和概念解析階段,缺乏有效的設計方案。

綜合以上分析,本文結合大數據理念和以往學界對數據素養的研究成果,首先分析“大數據素養”的內涵并探索性提出“大數據素養”的定義,在此基礎上提出以高校教師為主體對象,涵蓋大數據意識培養,大數據能力提高,大數據倫理內化三個方面內容的基于圖書館大數據平臺的應對策略。

2“大數據素養”定義

“大數據素養”是全新的概念,現有文獻一般討論或解析大數據背景下的數據素養的內涵,尚未有文獻直接給出“大數據素養”的定義??紤]到大數據雖然具有鮮明的特征,但其本質仍然是數據,也具有一般數據的基礎屬性,因而學界專家以往所提出的數據素養概念和內涵,對海量數據情景下的數據素養研究具有重要啟發意義,所以可將數據素養的主要內涵“數據意識、數據能力和數據倫理”擴展為“大數據意識、大數據能力和大數據倫理”,同時結合大數據的“數據量大、多樣性、增長快以及高價值”的4V特征賦予“大數據素養”新的意義。

本文借鑒國內外學者對數據素養的研究成果,著重從技術和應具備的能力角度,對“大數據素養”的概念做如下表述:“大數據素養”就是具備大數據意識,擁有運用數據處理和分析工具收集、整合、分析多樣化的海量數據資源,獲取并應用高價值知識的能力,以及具備應付大數據倫理失范問題的道德規范和法律知識的倫理修養。

2.1大數據意識

如圖1左側框中所示,大數據意識包括資源意識、技術意識和安全意識。

1)資源意識。大數據是重要資源。云計算、物聯網、互聯網產生的海量數據,其中蘊含巨大價值,是重要的資源,需要通過信息技術或工具挖掘。高校圖書館資源包括:各種紙質資源,音視頻等電子資源,各類數據庫以及系統產生的日志數據等,這些數據需要整合并存儲到有統一結構的數據庫,是開展“大數據素養”教育的主要資源。

2)技術意識。大數據處理需要技術支持。由于海量、多樣且高速增長的數據主要依賴技術手段收集、存儲、分配、管理和分析,對所采用的工具及使用方法應有深入了解。學科服務是高校圖書館的主要任務,要求精準、快速提供檢索服務和知識問答,涉及的技術包括:語義網,數據導航、云計算等。

3)安全意識。大數據安全刻不容緩。安全意識包括風險意識和法律意識。由于大數據的開放性,大到國家安全,小至個人隱私都面臨泄漏的風險;因大量數據被盜竊和篡改、甚至被出賣而導致的損失,應有依據相關法律自我保護的意識。高校圖書館數據庫中個人資料等數據,從訪問日志挖掘出來的讀者偏好等都屬于個人隱私,應有清醒的安全保護意識。

2.2大數據能力

大數據能力包括大數據采集能力、分析能力和應用能力。

1)采集能力。從海量、多樣的數據資源中采集數據,經過清洗后整合形成統一的結構化數據庫??梢詰贸槿∫灰晦D換一一裝載(Extraction-Transformation-Loading,ETL)技術,將高校圖書館的各類資源采集并融合,構建統一的語義網知識庫。

2)分析能力?;谒鶚嫿ǖ慕Y構化數據庫,恰當運用數據挖掘工具,包括各種分析算法和工具軟件,進行快速、精準的知識檢索,實現個性化推薦等。

3)應用能力。應用數據導航和可視化等工具實現學科知識導航,應用社會網絡和語義網絡分析工具分析學科發展趨勢,提供智能決策等。

2.3大數據倫理

從思想和實踐層面上,將大數據倫理概括為道德規范和行為準則兩個方面。

1)道德規范。海量、多樣、快速、高價值特點,融合自由、合作、分享等時代精神,使得大數據具有極高的開放性,由此引起的安全和隱私保護問題,需要從思想上內化為使用者的道德規范,其中包括道德觀念、道德準則、道德行為、道德評價等方面。

2)行為準則。在數據采集、數據取舍、數據使用過程中,有關大數據預測和預防性保護、數據獨裁與唯數據論、人性自由與外部約束等倫理問題,需要在實踐應用中對使用者行為加以約束,如采取技術保障手段和制定法律條文等。

從以上的分析還可以看出,大數據意識是認識層面,要求認識到大數據的價值,以及數據管理不善可能帶來的危害;大數據能力是核心內容,是數據素養提升的關鍵要素;大數據倫理在具備基本的數據意識和擁有一定的數據能力的基礎上,使用者應持有的道德規范和應遵循的行為準則,是大數據素養的高級階段。

3高校教師“大數據素養”教育策略

依據百度百科的描述,策略是指“不同的條件下,為達到不同的結果所采用的方式、方法、媒體的總和”,本文策略研究聚焦于當前大數據環境下,針對大數據素養教育所要達到的要求,圖書館在提升高校教師大數據素養方面應采取的方法和手段。

本文提出一種基于圖書館大數據系統平臺開展數據素養教育的方案。因為大數據平臺能快速地整合海量的教育資源,以培訓方式提高教師的大數據意識;能有效地基于平臺中集成的工具軟件進行自我實踐,從而提升教師大數據技術能力;能持久地與圖書館館員互動,長期獲取大數據倫理知識并逐步內化為個體特質。另外,相比于其他受教育的主體,高校教師一般具有較高的知識水平和較強的動手實踐能力,經過培訓后,能夠較快地適應大數據平臺的各種互動方式。

3.1圖書館大數據服務平臺

圖書館大數據平臺架構一般由數據采集、數據存儲和數據服務幾個部分組成,為了實時處理海量數據,一般采取云計算分布式計算平臺;為實現學科知識庫精準檢索和提供個性化服務,可采用語義網技術構建大規模知識庫。這是一種以大數據素養教育為目標的大數據平臺(如圖2所示)。該框架包括數據采集與清洗,數據存儲和圖書館大數據服務與應用三個部分。

數據采集與清洗。相關技術采用Hadoop的云平臺及分布式數據庫技術(MySQL和MongoDB)。應用語義網和本體技術,從互聯網、物聯網資源(包括博客,微博,微信公眾號,新聞網站和論壇以及語義網知識庫等),圖書館資源(包括學科專業數據庫,書目庫,專利庫,OA資源等)中抽取教育資源、學科數據等,并進行數據清洗。

數據存儲。采用D2R Server、D2RQ等工具對不同的數據集關聯,構建教育資源、圖書館關聯數據,語義網學科知識庫和互動交流基礎數據庫,并存儲于云平臺上的MySQL數據庫或MongoDB數據庫。

圖書館大數據服務和應用。開發Web應用系統,并通過數據庫訪問接口獲取數據,應用數據挖掘和機器學習技術,獲取高價值知識,提供面向教師的教育培訓,實踐服務和虛擬互動等應用。

3.2大數據素養教育策略

如圖2所示,結合大數據意識培養,能力提高和倫理內化的目標,分別采取教育培訓、實踐服務和虛擬互動的形式開展“大數據素養”教育。以下主要從教育方式和內容兩個角度,結合圖書館大數據平臺,面向高校教師討論大數據素養教育策略。

3.2.1大數據意識培養

教育形式。在圖書館大數據平臺上,以在線課程與講座視頻為主,通過在線課程、MOOC,微課,視頻點播等不同媒體,開展一般性內容的基礎講座和個性化內容的專業講座,為教師提供大數據意識的培養。大數據平臺的優勢在于,海量的存儲空間能存儲巨量的課程資源,高速的云計算平臺能使課程和各種視頻的播放非常流暢快捷。

教育內容。①資源意識。識別大數據資源的類型,了解自己領域相關的科研和教育資源獲取方法;②技術意識。認識大數據處理和分析的一系列的方法和技術的背景,以及不同技術的適用范圍;③安全意識。認識到各種教學和科研資源(包括版權)使用規范以及個人隱私保護的意義。

3.2.2大數據能力提高

教育形式。通過對圖書館數據資源的收集、整合和分析等實踐活動,以及使用平臺所提供的知識檢索、個性化服務和數據導航等服務,密切與平臺互動以提高自身技術能力。大數據平臺的優勢在于,高校教師可以自設情境,自行實踐包括知識檢索,體驗知識問答和個性化推薦等技術和服務;能充分體驗到大數據平臺中精準的知識檢索,豐富的導航與可視化效果。

教育內容。①采集能力。對不同類型格式數據的收集入庫,數據格式的相互轉換,數據存儲以及應用相關工具將不同類型的數據庫整合成統一結構化數據庫的能力。②分析能力。應用平臺提供的軟件工具和搜索引擎檢索學科知識,實踐個性化定制知識,體驗個性化推薦服務;應用可視化工具創建數據導航和知識地圖,顯示數據演變過程和知識脈絡關系等。③應用能力。根據數據導航,知識地圖以及個性化推薦的結果,理解知識來源、知識流動和知識匯聚的脈絡,跟蹤科研動態,預測學科發展前沿。

3.2.3大數據倫理內化

教育形式。通過建立在大數據平臺上的各類虛擬社區和互動論壇(如新聞社區,BBS論壇等),在圖書館館員的主導下,開展互動交流:包括教師之間互動、教師和館員的網絡互動等,并通過社交網絡分析工具對交流內容進行分析,以發現熱點主題并跟蹤熱點內容。大數據平臺的優勢在于,應用語義網檢索工具能快速精準獲取互聯網上的相關資料,及時提供到論壇,供教師學習和參考;應用平臺上的大規模網絡實時分析工具快速發現論壇新的熱點話題并加以引導。

教育內容。①道德規范。從海量數據資源中提取有關大數據道德規范的文檔,視頻,熱點評論等資料,并與教師互動。②行為準則。提取有關國家數據管理政策法規、數據倫理等知識,分享并討論,幫助教師逐步內化為具有自我約束力的個體行為規范。

4結束語

本文探討的“大數據素養”的內涵是以意識為基礎,以能力為核心,倫理為升華的有機整體,因而針對性提出先培訓意識,再實踐能力,最后內化為倫理的大數據素養的養成思路。

“大數據素養”有著豐富的內涵和深刻的含義,考慮到大數據應用非常依賴信息技術手段,本文提出的“大數據素養”的定義,偏重從技術和應具備的能力角度解析和探討?;谄渌暯堑挠懻?,是本文后續研究重點關注的內容。

猜你喜歡
高校圖書館大數據
大數據環境下基于移動客戶端的傳統媒體轉型思路
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合