于玉龍+王秀芳
【摘要】 協同過濾被廣泛應用到個性化推薦中,本文針對傳統協同過濾推薦算法準確度不高的問題進行研究,將用戶之間共同評分的物品數量作為相似度計算的重要指標,并引入信任度對用戶評分進行修正,提高推薦準確度。
【關鍵詞】 協同過濾 信任度 相似度 電影推薦
一、引言
隨著互聯網的發展,人們很難再海量的數據中快速找到自己需要的資源,很多網站想挖掘用戶的偏好向用戶推薦他們感興趣的物品,協同過濾是最常用的推薦技術[1]。推薦技術主要有基于物品的推薦與基于用戶的推薦及混合推薦三種。許多研究人員提出了不同的算法來提高推薦可靠性,如采用不同聚類方法的協同過濾[2]。本文采用基于用戶的推薦方法,最后實驗表明改進后的方法比傳統協同過濾算法更可靠。
二、傳統協同過濾推薦算法
傳統的協同過濾的一般過程是根據用戶評分對用戶進行相似度的計算,根據相似度找到用戶的鄰居用戶,然后由鄰居用戶的喜好來預測評分進行推薦[3]。
用戶相似度的計算是產生鄰居用戶并根據鄰居用戶進行個性化推薦的重要步驟,Person相似度算法是常用的相似度計算方法。設用戶u和v共同評分過的物品集合為Iuv,則相似性sim(u,v)為:
3.1相似度的修正
3.2引入信任度
傳統的協同過濾算法在預測用戶關于物品的評分時,只考慮了兩個用戶間的相似度,而忽視了該評分或該用戶是否可信。景民昌等人提出“專家信任度”的概念[4],用來衡量用戶向其他用戶提供可靠信息的能力。用戶u關于物品i的評價可信度為
4.1數據集和評價標準
本文采用MovieLens站點提供的ml-100k公開數據集,對提出的算法優化并傳統的協同過濾算法進行了對比實驗。該數據集包含了943個用戶對1682部電影的100000條評分,評分范圍是1到5分。
進行實驗時,將實驗數據的20%用戶劃為測試集,其它80%用戶為訓練集。利用訓練集用戶對測試集用戶進行推薦。
采用均方根誤差RMSE(Root Mean Squared Error) 來衡量預測結果與用戶真實評分之間的誤差。
4.2實驗結果
本文通過實驗來比較傳統協同過濾算法與綜合改進的協同過濾算法的性能,在鄰居數為50的情況下,傳統協同過濾算法得到的RMSE為1.15,改進的算法RMSE為0.93,改進的協同過濾方法有較小的誤差。由此可知,與傳統的相似性度量方法相比,本文提出的改進可以顯著地提高推薦系統的推薦質量。
五、結語
本文介紹了協同過濾的基本原理,提出了一種改進的協同過濾算法,一定程度上提高了推薦準確度和可靠性,但實驗中仍存在一些問題,有待進一步研究。
參 考 文 獻
[1] 項亮. 推薦系統實踐[M]. 北京: 人民郵電出版社, 2012: 3-4.
[2] 王國霞, 劉賀平.個性化推薦系統綜述[J]. 計算機工程與應用, 2012, 48(7): 66-76.
[3] 鄧愛林,朱揚勇,施伯樂.基于項目評分預測的協同過濾推薦算法[J].軟件學報,2003,14(9):1621-1628.
[4] 景民昌, 唐弟官,于迎輝.基于專家信任優先的協同過濾推薦算法[J],圖書情報工作, 2012.56(11): 105-108.