?

數據挖掘在高校圖書館個性化推薦服務中的應用

2020-04-14 04:54赴興華
電腦知識與技術 2020年4期

赴興華

摘要:文章以數據挖掘在高校圖書館個性化推薦服務中的應用為研究對象,首先對據挖掘應用于高校圖書館個性化推薦服務中的必要性進行了探討分析,隨后討論了數據挖掘技術在高校圖書館個性化服務推薦中的應用,最后提出了數據挖 掘技術在高校圖書館個性化服務推薦中的應用實現方案,以供參考。

關鍵詞:數據挖掘技術;高校圖書館;性化推薦服務;應用

中圖分類號:TP311

文獻標識碼:A

文章編號:1009-3044(2020)04-0005-02

收稿日期:2019-11-25

在信息化環境下,人們獲取信息的方式與途徑越來越多,對于高校圖書館運營帶來了一定的沖擊與影響,需要高校圖書館提供個性化閱推薦服務,不斷提升自身的服務水平。在這一過程中,數據挖掘技術發揮著重要作用。因此需要加強對數據挖掘在高校圖書館個性化推薦服務中的應用分析,對于推動高校圖書館實現可持續發展具有重要的意義。

1?數據挖掘應用于高校圖書館個性化推薦服務中的必要性

首先,數據挖掘能夠有效提升高校圖書館藏書資源的利用率。隨著信息技術廣泛應用于圖書館數字化建設,使得圖書館藏書資源由紙質化逐漸向數字化方向轉變。一方面這種轉變為數據挖掘技術在圖書館個性化推薦服務中提供了良好的應用條件,另一方面也極大提升了人們利用圖書館藏書資源的效率,以往學生或教師到圖書館查閱書籍資料,需要人工查找、翻閱,費時費力,如今能夠直接在線搜索圖書館數字化資源,使得圖書館藏書資源得到了更好的應用,有效提升了圖書館資源的利用率。

另一方面,面對高校圖書館用戶信息需求日益多樣化現狀,必然需要應用數據挖掘技術才能更好地實現高校圖書館個性化推薦服務。如今隨著高校數字化圖書館逐漸建設完善,在圖書館服務需求方面,主要呈現岀以下變化:一是用戶主體變得多樣化,信息化環境下,高校圖書館服務用戶主體范圍進一步擴大,不僅包括本校教師學生,還包括一些校外的用戶;二是隨著用戶主體增加,相應信息服務需求也日益豐富;三是在上述情況之下,需要高校圖書館為用戶群體提供多樣化的服務形式與方式,因此為實現上述目標,必然需要應用大數據挖掘技術。

2?數據挖掘技術在高校圖書館個性化服務推薦中的應用

2.1?以關聯規則為基礎的推薦算法

在數據挖掘技術之中,關聯推薦算法是其中重要的組成部分,該算法在各個領域之中均有著廣泛的應用,其中最經典的是在零售領域中,對用戶購物車分析應用。在高校圖書館個性化推薦服務中,通過應用關聯規則推薦算法,能夠根據用戶查詢文獻的頻率、數量、文獻類別等數據信息,從中推算出用戶查閱文獻的規律,并在用戶進行文獻瀏覽、下載時,由系統自動向用戶推薦類似的文獻,更好地滿足用戶查閱需求。

2.2?以查詢內容為基礎的推薦算法

以查詢內容為基礎的推薦算法,即是結合用戶查詢的文獻內容,尋找用戶所查詢的文獻之間的相似性,并尋找用戶已經評分文獻內容,以此為依據,建立用戶檔案模型,然后從諸多文獻之中,選擇與用戶檔案模型比較類似的文獻,將其中一些評分較高的優質文獻推薦給用戶。

2.3?協同過濾推薦算法

一是圍繞用戶的協同過濾推薦。在實際應用時,首先以用戶對文獻的評價日志為依據,完成用戶間相似度計算,并根據計算結果,選擇出與目標用戶最相似的幾鄰居用戶,然后參照鄰居用戶搜索內容喜好,完成向目標用戶的推薦。

二是圍繞物品的協同過濾推薦。該算法主要以用戶使用過的不同物品間相似度為依據,來完成推薦預測。應用到圖書館個性化推薦中,便是圍繞用戶已評價的文獻和待評價文獻,查找兩者之間具有哪些相似之處,并以此為依據,完成文獻可聚類,可有效提升文獻推薦的準確度,更加符合用戶心意。

三是圍繞模型的協同過濾推薦。這種推薦應用模式主要是對用戶以往的文獻查詢數據進行學習,并建立一個用戶模型,從中分析用戶搜索規律與個人喜好,具體可借助概率模型、貝葉斯網絡等數據挖掘技術,來完成用戶文獻推薦。

3?數據挖掘技術在高校圖書館個性化服務推薦中的應用實現方案

3.1?搭建云計算環境

由于高校圖書館大數據具有4V特征,即容量大(Volume)、速度快(Velocity)、多樣化(Variety);四是真實性高(Veracity)。因此在進行云環境搭建時,可選擇“成衫。叩”云環境平臺。該平臺釆用的系統為“HDFS”分布式文件系統,能夠實現穩定可靠的數據云存儲,并且平臺之中融入了既a以內存計算技術與MapReduce映射制約技術,因此有著非常高的數據處性能。并且該軟件是開源軟件,不需要花費資金購買,能夠有效實現成本節約。

3.2?具體實現方案設計

首先是線上部分。在數據收集上,利用“HDFS”分布式文件系統完成高校圖書館大數據存儲。利用HBase數據庫管理系統,能夠對不同類型的圖書館大數據進行讀寫和隨機訪問。個性化服務算法應用,離不開用戶行為數據支持,因此需要收集用戶訪問日志。在前端應用方面,前端主要負責各種網頁或推薦請求接受,在經過初步處理后,會傳遞給后端引擎進行處理,在受到處理結果后,及時返回給用戶。在云平臺關聯數據技術的幫助下,通過利用海量語義網知識庫檢索,從而能夠為用戶提供實時性、交互性個性化服務。

然后是線下部分:一是角色建模,這種建模具體分為兩部分,一是用戶建模,通過收集用戶行為信息,完成用戶模型的建立,并根據用戶模型,來分析用戶喜好;二是文獻建模,主要是以文獻領域屬性、用戶訪問文獻數據信息為依據,完成文獻模型建立。在上述兩種模型建立中,都能夠依托于“MapReduce”計算框架來實現。并且在HBase數據庫管理系統的幫助下,能夠實現對模型的分布式存儲和檢索。在上述模型構建的基礎之上,通過利用各種推薦算法,能夠有效幫助用戶找到自身需要的文獻,提升個性化服務土建質量?!癕ahout”是Hadoop與MapReduce計算框架的可擴展軟件包,它在高校圖書館大數據處理上,有著卓越的能力。通過利用該擴展軟件,能夠促使高校圖書館個性化服務特點得以有效凸顯。

最后是選擇個性化推薦服務算法。在選擇個性化推薦服務算法前,應注意做好用戶常見內容特征與常見行為特征的分析。然后以此為依據,完成相應性化推薦服務算法選擇。例如在選擇協同過濾推薦算法時,需要結合實際,從準確性、高效性、穩定性三個角度,分析用戶過濾推薦與物品過濾推薦在高校圖書館個性化服務中的適用性。一是在準確性上,相對于購物網站用戶,高校校圖書館用戶整體來說更加易區分,因此釆用基于用戶的協同過濾算法,可有效提升高校圖書館個性化推薦的準確性。二是在高效性方面,高效性主要體現在物品相似度計算與用戶相似度計算效率方面,當用戶數量遠遠大于物品數量時,與用戶相似度計算相比,物品的相似度計算消耗資源更小,因此基于物品的協同過濾效率更高效果更好;若物品數量遠遠大于用戶數量,那么基于用戶的協同過濾計算效率更高,效果更好。而在高校圖書館中,物品指的是文獻,顯然文獻數量要遠遠比用戶數量高,因此釆用基于用戶協同過濾算法取得的效果更佳。三是在穩定性方面,主要取決于用戶集合與物品集合哪一個更穩定,若用戶集合穩定,則選擇基于用戶的過濾推薦算法,反之,選擇基于物品的過濾算法,而在高校圖書館中,用戶與物品每到新的學年便會更新,因此上述兩種算法各有優勢。

4?總結

綜上所述,在信息時代下,高校圖書館在為用戶提供個性化推薦服務過程中,應充分認識到大數據挖掘技術在其中運用的必要性,并立足于大數據各個環節,做好挖掘技術分析,通過建立一個完整的、數據挖掘技術在高校圖書館個性化服務推薦中的應用實現方案,促使大數據技術作用價值得以充分發揮,推動高校圖書館建設實現更好的發展。

參考文獻:

[1] 郭淑紅,徐玉梅,劉釗.基于數據挖掘的高校圖書館個性化圖書推薦服務研究[J].電子世界,2017(4):44-45.

[2] 柳益君,何勝,馮新翎,等.大數據挖掘在高校圖書館個性化服務中應用研究[J].圖書館工作與研究,2017,1(5):23-29.

[3] 周婕,章增安,劉海濤.基于大數據的高校圖書館個性化推薦書目生成研究[J].晉圖學刊,2017(5):29-33.

[通聯編輯:章雅琪]

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合