?

基于用戶畫像的閱讀推薦研究

2024-02-24 23:53王雯霞許丹鞠昕蓉
河南圖書館學刊 2024年1期
關鍵詞:用戶畫像個性化服務

王雯霞 許丹 鞠昕蓉

收稿日期:2023-12-01

作者簡介:王雯霞(1990—? ),中國醫科大學圖書館館員;許丹(1985—? ),中國醫科大學圖書館副研究館員;鞠昕蓉(1996—? ),中國醫科大學圖書館助理館員。

* 本文系2021年度遼寧省社會科學規劃基金項目“基于Faculty Opinions最新評分的生物醫學科技論文多元評價指標體系建立研究”的階段性研究成果之一,項目編號:L21BTQ009。

摘? 要:文章以中國醫科大學2020年入學的本科生為樣本對象,運用RFM模型提取特征變量,結合K-means算法將其劃分為三類,構建了借閱觀望型、理性閱讀型、重要發展型三種類型的用戶畫像,并依據不同類型的用戶畫像提出了相應的服務對策,以期滿足不同類型用戶的需求,提升圖書館服務水平。

關鍵詞:用戶畫像;閱讀推薦;個性化服務

中圖分類號:G250.7??? 文獻標識碼:A??? 文章編號:1003-1588(2024)01-0081-03

1? 相關研究

用戶畫像技術最早由交互設計之父Alan Cooper提出,首先應用在軟件工程領域,能夠將抽象信息描述成具象實體。在圖書館的各項服務中,用戶畫像技術為參考咨詢服務、視覺搜索服務等業務提供理論支撐[1,2]。例如,Al Shboul等針對雅爾穆克大學的人文學者進行深入分析,利用用戶畫像清晰描繪學者們的信息尋求行為,以便圖書館為其提供更適合和滿意的服務[3];Mao J等發現將標簽共現網絡應用于用戶畫像分析既能提供更準確的個性化推薦,又能預測用戶的檢索行為[4]。在閱讀推薦方面,趙巖構建了基于用戶畫像的智慧閱讀推薦系統,從理論層面詳細闡述了系統推薦流程[5];李曉敏等從用戶自然屬性、興趣屬性、社交屬性出發,實現基于相似讀者和相似圖書的虛擬圖書推薦[6];解娜結合讀者的位置信息和圖書訪問行為數據為其提供周邊好書推薦服務[7];盛琳涵從讀者、資源、情境等維度構建了閱讀推廣模式[8]。梳理現有研究結果發現數據支撐下的閱讀推薦服務實證研究較少,筆者以中國醫科大學圖書館讀者借閱數據為實例,嘗試以用戶畫像理論方法構建不同類別用戶畫像,在此基礎上開展閱讀推薦,以期提高圖書館服務水平。

2? 理論基礎與數據收集

2.1? RFM模型

RFM模型最早由Arthur Hughes提出,其基本思路是通過近度R、頻度F、值度M三個行為指標劃分不同類型的用戶[9]。為評估圖書受歡迎程度,張海、李杭等將RFM模型指標定義為圖書最近被借閱時間(R)、被借閱次數(F)、被借閱總時間(M)[10,11]。在此基礎上,陳宇奇等引入圖書首次借閱間隔時長(Beginning)指標,構建了BRFM模型[12];樂承毅等將續借行為也考慮在內,構建了改進版的RFM模型[13]。筆者借鑒上述研究中的RFM模型指標含義,以進一步細分讀者類型為目標,根據讀者借閱行為數據的差異性重新調整了RFM模型的指標含義,即調整后的近度R表示在觀測時期內每位讀者最近一次借閱圖書時間與觀測截止時間的間隔,以天為時間單位;頻度F表示在觀測時期內每位讀者累計借閱圖書的總次數;值度M表示每位讀者借閱圖書間隔天數的平均值。

2.2? 數據收集與處理

本研究的樣本對象是中國醫科大學2020年入學的本科生,對有近三年圖書借閱記錄的大學生進行深入分析具有一定的可行性和必要性。筆者以1,968位本科生讀者的姓名和學號為檢索點,通過中國醫科大學圖書館的圖書管理系統獲取其圖書借閱情況,共獲得14,921條相關記錄,數據收集時間為2023年3月2日。

利用圖書管理系統采集借閱信息比較繁雜,需要分兩步完成數據處理:第一步是刪除正在借閱的圖書,這部分圖書尚未歸還,無法進一步分析其借閱行為特點。經過數據篩選,共有526本圖書是外借狀態,留存的已歸還圖書借閱記錄為14,395條。第二步是提取特征變量,根據RFM模型的指標含義,累計借書次數(頻度F)能夠通過借書日期和應還日期計算出圖書的借閱間隔天數,而通過不同讀者的借書記錄能夠分析出每位讀者最近一次借閱時間間隔(近度R)和借閱時間間隔平均值(值度M)。

3? 用戶畫像的構建與展示

3.1? 特征變量描述

聚類分析是基于距離測度將樣本對象按照特征變量進行分類的統計方法,由于距離測度對特征變量有一定的要求,因此在特征變量聚類前需要檢驗其分布狀態與獨立性。筆者利用SPSS軟件對樣本對象的指標數據進行統計性描述和K-S檢驗,得出近度R和頻度F的標準差分別為18和26.3,值度M具有較大的標準差,數值為35.8,結合指標含義可發現部分讀者的圖書借閱時間間隔均值為0。同時,顯著性sig均小于0.05,說明近度R、頻度F、值度M三個特征變量都不呈正態分布。

合理的特征變量指標還需具備較低的相關性,以避免同類變量導致的重復計算,從而影響聚類分析的最終結果。本研究采用Spearman相關分析方法,得出頻度F和值度M呈現微弱正相關,相關系數為0.198,近度R與頻度F、值度M的相關系數分別為0.331、0.262,具有一定的獨立性。

3.2? 樣本對象劃分

兩步聚類法根據BIC或AIC等指標自動確定最佳聚類個數,能夠靈活展示不同分組數量的聚類質量[14]。本次分類依次選擇聚類數為3~5,利用SPSS軟件實現兩步聚類并觀測聚類效果:當分組數量高于3時,兩步聚類的聚類質量比“尚好”的標準高一些,約為0.55;當分組數量為3時,聚類質量約為0.65,說明聚類結果可信。筆者據此將1,968名樣本對象劃分為三類,再結合K-means算法對其進一步聚類,聚類結果見表1。表1顯示,群體一頻度F、近度R、值度M的最終聚類中心都為0,人數為587人;群體二頻度F、近度R、值度M的最終聚類中心分別為14、14、29.55,人數最多,共有1,292人;群體三頻度F、近度R、值度M的最終聚類中心分別為6、131、219.35,共有89人,人數最少。

3.3? 用戶畫像構建

1,968位讀者的圖書借閱記錄共有14,395條,根據三類群體的聚類結果進行劃分:群體一借閱圖書0本,群體二借閱圖書13,515本,群體三借閱圖書880本。為進一步區分群體二和群體三的借閱行為差異性,筆者從索書號中提取圖書分類號,將群體二和群體三按照圖書借閱次數進行排序,排序結果顯示兩類群體前9名的圖書分類號完全相同,能夠體現群體差異的是第10名和第11名,群體二的第10名和第11名是D類、Q類,而群體三的第10名和第11名是Q類和F類。根據所借圖書題名,筆者利用Python分詞工具包制作了兩類群體的圖書詞云圖:群體二的詞云圖中的顯著關鍵詞是系統解剖學、生理學、筆記、圖譜、大學英語、組織學、胚胎學等;群體三的詞云圖中的顯著關鍵詞是學習指導、彩色圖譜、婦產科、病理學、等級考試等。

4? 用戶畫像描述及閱讀推薦

4.1? 借閱觀望型

群體一的頻度F、近度R、值度M都為0,說明該群體自入校以來就沒有借閱過任何圖書,可將其歸屬為借閱觀望型。借閱觀望型讀者在某種程度上是圖書借閱的潛力軍,圖書館針對他們開展借閱服務大有可為,一方面要針對這一類型讀者的專業特性進行點對點資源推薦;另一方面要優化圖書借閱流程,拓寬讀者薦書渠道,加大館藏資源宣傳推介力度,吸引借閱觀望型讀者的目光,激發他們的閱讀熱情。

4.2? 理性閱讀型

群體二的近度R為14、值度M為29.55,說明該群體自入校以來平均每個月借閱一次圖書,最近一次借閱時間是在半個月前。群體二的詞云圖顯示了英語四級和習題集等關鍵詞,說明該群體閱讀目的明確,可將其歸屬為理性閱讀型。理性閱讀群體的圖書借閱積極性和活躍度較高,圖書館可為其聚集志同道合的同伴,為他們提供相應的交流討論空間,既可以相同專業進行聚合,也可依據讀者相似度算法進行聚合[15]。在閱讀推薦方面,圖書館應側重專業圖書的新書推薦,尤其是各種題集、筆記,為讀者提供獲取最新輔助資料的渠道,同時加強讀者信息素養培養,提升其資源查找和獲取能力。

4.3? 重要發展型

群體三的近度R為131、值度M為219.35,說明該群體自入校以來平均每學期借閱一次圖書,最近一次借閱時間約在4個月前。群體三有過借閱歷史,但活躍度明顯低于群體二,具有發展潛力,可以將其歸屬為重要發展型。重要發展型群體人數只有89人,該群體詞云圖中的關鍵詞“學習指導”異常明顯,說明該群體在學習指導方面亟須得到幫助?;诖?,圖書館一方面要針對這一群體提供更精準的閱讀指導,提升讀者閱讀能力和學習能力;另一方面要利用圖書相似性算法挖掘館藏同類資源,打造專業性強的系列閱讀指導服務體系,提升自身服務能力。此外,群體三的圖譜需求量明顯高于群體二,圖書館可為其推薦圖譜電子書以及包含圖譜的各種數據庫,同時舉辦專項圖譜深度講座,滿足其閱讀需求。

參考文獻:

[1]? 程秀峰,周瑋珽,張小龍,等.基于用戶畫像的圖書館智慧參考咨詢服務模式研究[J].圖書館學研究,2021(2):86-93.

[2]? 曾子明,孫守強.基于用戶畫像的智慧圖書館個性化移動視覺搜索研究[J].圖書與情報,2020(4):84-91.

[3]Al Shboul,Abrizah A.Modes of information seeking: developing personas of humanities scholars[J].Information Development,2016(5):1786-1805.

[4]Mao J,Lu K,Li G,et al.Profiling users with tag networks in diffusion-based personalized recommendation[J].Journal of Information Science,2016(5):711-722.

[5]? 趙巖.基于用戶畫像的數字圖書館智慧閱讀推薦系統研究[J].圖書館學刊,2018(7):121-124.

[6]? 李曉敏,熊回香,杜瑾,等.智慧圖書館中基于用戶畫像的圖書推薦研究[J].情報科學,2021(7):15-21.

[7]? 解娜.基于用戶畫像的讀者周邊好書推薦服務研究[J].情報探索,2020(8):104-108.

[8]? 盛琳涵.基于用戶畫像的經典閱讀推廣模式構建:以高校圖書館為例[J].河南圖書館學刊,2022(10):2-4.

[9]Hughes A.Strategic database marketing[M].Chicago:Probus Publishing,1994:302-318.

[10]? 張海營.基于RFM模型的圖書館圖書評價系統研究[J].圖書館,2012(3):60-62.

[11]? 李杭.RFM模型在圖書質量評價系統中的應用[J].農業圖書情報學刊,2014(2):54-57.

[12]? 陳宇奇,施國良,張瀟瀟,等.基于修正RFM模型的高校圖書館熱門圖書評價體系及影響因素研究[J].圖書館學研究,2020(10):58-68.

[13]? 樂承毅,王曦.基于改進RFM聚類的高校圖書館用戶畫像研究[J].圖書館理論與實踐,2020(2):75-79.

[14]? 汪存友,余嘉元.SPSS兩階聚類法如何自動確定聚類數[J].中國衛生統計,2010(2):202-203.

[15]? 鄭祥云,陳志剛,黃瑞,等.基于主題模型的個性化圖書推薦算法[J].計算機應用,2015(9):2569-2573.

(編校:徐黎娟)

猜你喜歡
用戶畫像個性化服務
貝葉斯網絡在用戶畫像構建中的研究
把聲音的魅力發揮到極致
淺析移動時代的圖書館發展策略
互聯網思維下數字圖書館個性化服務建設研究
需求理論在高校圖書館就業服務中的應用研究
移動用戶畫像構建研究
基于微博的大數據用戶畫像與精準營銷
山西自駕游發展的問題與對策研究
新形勢下飯店服務業發展存在的問題及對策建議
移動互聯網下手機用戶使用行為特征的研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合