?

基于個性化圖書推薦的協同過濾算法

2017-03-22 22:06黃浩
電子技術與軟件工程 2017年3期

黃浩

摘 要本文對基于個性化圖書推薦的協同過濾算法的設計方案進行實驗,目的是為證實在真實用戶的多標準評估過程中怎樣產生數據集,從而找到一種科學的算法。并通過圖書推薦的應用案例來說明算法,以驗證其是否有效。

【關鍵詞】個性化圖書推薦 協同過濾算法 鄰居選擇

面對巨大的網絡數據庫,個性化推薦可以及時的追蹤用戶需求而針對性的優化信息服務的內容與手段,其能幫用戶有效處理過載的信息。如今推薦系統已發展成能夠產生個性化推薦亦或是引導用戶通過個性化的形式到很大的空間中去選擇自己的目標商品。本文為研究基于個性化圖書推薦的協同過濾算法,通過模擬實驗分析多標準推薦系統若干設計方案的有效性。

1 多標準協同過濾

所謂推薦系統就是幫客戶找到其感興趣或符合其需求的信息的手段,它主要是兩個方面,一是預測某特定用戶是不是喜歡某一特定項目,二是識別某個用戶所感興趣的項目。推薦問題可以作下述定義:c是全部用戶的集合,s是所推薦的全部可能的項目,uc(s)是一功效函數uc(s):c×s→R+,用來評價將項目s推薦給用戶c是否適宜。假設該函數對整個c×s空間未知,僅在其部分子集中已知,需各用戶c∈C可以預測S中項目s的功效函數uc(s),在S中,uc(s)未知,也就是∨c∈C,s=maxuc(s)。在大部分推薦系統內,函數uc(s)一般都只考慮項目的某一屬性。

協同推薦是在某一用戶被推薦以往與其有同樣興趣愛好的人感興趣的項目,而協同過濾是基于有類似愛好的其他人的推薦去預測客戶對新項目的興趣。單屬性協同過濾把問題空間定義成“用戶-項目矩陣-評分矩陣”。而協同過濾的目標即為基于以往其他用戶對此項目的評價,針對某一特定用戶,預測其功效。

2 SVD因式分解以實現協同過濾

在設計實現推薦系統,選擇推薦算法時,大多考慮協同過濾的使用,但是CF中經常使用的兩種方法包括:neighbor-based方法和因式分解。作為一個搜索推薦系統,百度關鍵詞系統中也使用了CF為用戶推薦流量,考慮到可解釋性。但因式分解會從全局考慮用戶投票的影響,所以理論和實踐上效果都會更好。

2.1 根據優先權的相似性算法

該算法與活動用戶的屬性wai(i=1,…,n)相比較看有類似的優先權。即推薦基于用戶的意見,當選擇某一項目時,分配類似的權重給每一評估標準。相似性計算就是測量用戶a和用戶c之間的屬性矢量距離。相似性計算有以下2種。

(1)歐氏距離計算:

(2)余弦相似性:

鄰居的形成通過2種手段,即相關權重閾值以及最大鄰居數。為準確預測,并結合評分有3種辦法。

(1)簡單數學均值:

(2)加權平均值:

(3)均值離差:

2.2 SVD在推薦系統中的應用與實現

其中n表示用戶數目,m表示物品數目,I[i][j]是用來表示用戶i有沒有對物品j評過分,因為我們只需要評過分的那些越接近越好,沒評過的就不需要考慮,Vij表示訓練數據中給出的評分,也就是實際評分,p(Ui,Mj)表示我們對用戶i對物品j的評分的預測,結果根據兩向量點乘得到,兩面的兩項主要是為了防止過擬合,之所以都加了系數1/2是為了等會求導方便。

具體公式為:

3 實驗設計分析

針對此實驗,考慮具有一定相似性計算的3個方案,即歐氏距離、余弦相似性以及皮爾遜相關。尚未考慮部分特定的方法針對特性加權,將該因素設置成1,鄰居的形成應用到2個方法,也就是相關加權閾值以及最大近鄰,最終結合評分設計3個方案。文章的目的是建設數字圖書館,宗旨是幫助用戶尋找其所感興趣的圖書。用戶經過注冊后能夠登錄該系統,登錄后需應用有關的評價標準。模擬系統用于形成一組200用戶,200項目以及750評價的集合,這當中600評價用作該算法的訓練集,其余150評價用作測試集。以上評價在模擬里進行處理時,會以80%→20%的比例分配至訓練集以及測試集中。對實驗的分析時,應用2個性能評價辦法。第一是準確度,第二是覆蓋率,與其他算法對比,本文的算法在MAE指標上比以前的算法提高9.8%,時間復雜度降低19.7%,有效提高了圖書推薦的準確率。

4 結語

文章用一組合成的數據集合,指出對個性化圖書推進這個特定的應用,以及2種協同過濾算法的設計實驗方案。此合成數據集合的多標準評估用某一合適的模擬產生,基于如此的數據集合的實驗測試僅可用于初始評估,一旦能夠得到真實用戶的評估,就要重復進行實驗。接下來的研究應是探索具有適應性的推薦系統,如此系統會動態的選擇適宜的推薦算法抑或是按照評估數據集合的特性變化。

參考文獻

[1]張迎峰.面向數字圖書館的個性化推薦算法研究[D].合肥:中國科學技術大學,2011.

[2]安德智,劉光明,章恒.基于協同過濾的圖書推薦模型[J].圖書情報工作,2011,55(1):35-38.

[3]張海榮,朱信忠,趙建民,等.一種優化的基于用戶聚類的過濾推薦策略[J].計算機系統應用,2008(11):95-97.

[4]余力,劉魯.電子商務個性化推薦研究[J].計算機集成制造系統,2004.10,10(10):1306-1313.

[5]曾艷,麥永浩.基于內容預測和項目評分的協同過濾推薦[J].計算機應用,2004.1,24(01):111-113.

[6]張怡文,岳麗華,張義飛. 基于共同用戶和相似標簽的好友推薦方法[J].計算機應用,2013,33(08):2273-2275.

[7]楊濤,曹樹金.圖書館用戶的個性化服務需求實證研究[J].大學圖書館學報,2011(02):76-85.

[8]許文青,林雙平.融合熱門度因子基于標簽的個性化圖書推薦算法[J].圖書情報研究,2015(03):82-86.

作者單位

廣西經貿高級技工學校 廣西壯族自治區梧州市蒼梧縣 543199

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合