?

基于興趣點的多維度推薦算法研究

2020-04-14 04:54田春波
電腦知識與技術 2020年4期
關鍵詞:興趣點個性化推薦社交網絡

田春波

摘要:隨著移動互聯網技術的迅猛發展,人們更喜歡通過手機等移動設備在社交產品上分享自己的行為足跡或者對商品服務的評價。大多數的互聯網產品利用用戶的用戶的興趣點等行為信息為依據為用戶推薦下一個潛在偏好的興趣點。本文顯示介紹典型的興趣點推薦算法以及相關優缺點。針對這些算法考慮單一屬性的問題分析基于興趣點的多維度推薦研究。

關鍵詞:興趣點;多維度推薦;社交網絡;用戶偏好;個性化推薦

中圖分類號:TP393

文獻標識碼:A

文章編號:1009-3044(2020)04-0171-02

收稿日期:2019-10-15

Research on Multi-dimensional Recommendation Algorithm Based on Interest Points

TIAN Chun-bo

(School of Computer Science,Southwest Petroleum University,Chengdu 610500,Sichuan)

Abstract:with the rapid development of mobile Internet technology,people prefer to share their behavior footprints or evaluation of goods and services on social products through mobile devices such as mobile phones.Most Internet products use users' behavior information such as interest points to recommend the next potential interest point for users.This paper shows the typical algorithm of interest point recommendation and its advantages and disadvantages.In view of these algorithms considering a single attribute,this paper analyzes multi-dimensional recommendation research Based on interest points.

Key words:interest points;multi-dimensional recommendation;social network;user preferences;personalized recommendation

隨著人民生活水平和物質文化的提高,人們的興趣點(如餐廳、購物中心娛樂廣場等)更加豐富。在此背景下,基于地理位置的社交網絡成為研究的重點內容,并廣泛應用于互聯網產品中,比如餓了嗎、美團、Twitter等。

用戶-興趣點的關聯在實際商業應用有著特殊的指導意義。既可以通過推薦及時告知用戶偏好的興趣點,又可以通過用戶共同興趣點加強彼此的聯系。也能輔助興趣點改進自己的營業策略,吸引用戶,實現二者的雙贏[1]。

1 典型興趣點推薦算法

1.1 基于協同過濾的推薦

基于協同過濾的推薦方法是通過關注類似用戶的行為[2],進而發現用戶潛在的偏好。即通過評分數據,在計算出的詳細鄰居集合中尋找用戶潛在偏好。算法過程:

(1)創建用戶-興趣點評分矩陣

興趣點pj在用戶-興趣點的評分,表示發現用戶對興趣的概率,來預測用戶在未訪問過的興趣點處簽到或訪問的可能性。計算公式:

(2)相似度計算

相似度計算求最近鄰集合。根據相似度找出相似的用戶相似度計算方式有距離計算和向量計算等。對于Ri(ri1,ri2,…,rin)和Rij(rj1,rj2,…,rjn)兩個向量表示用戶對n個不同興趣點的評分,則相似度計算公式:

皮爾森相似度:

余弦相似度:

歐式距離:

SRC相似度:

該推薦算法會隨著用戶簽到行為數據增多,準確度會得到明顯提升,但是,這種方法只考慮到用戶的歷史行為,而不考慮用戶自身的內容和屬性,對于復雜的非結構化對象,比如視頻、音樂、圖片等特征抽取相對來說是比較困難的;而且基于協同過濾的推薦算法天然存在著冷啟動和矩陣稀疏的問題[3]。

1.2 基于內容推薦算法

基于內容的推薦算法是最早應用的推薦算法。它的基本原理[4]是將用戶的興趣偏好通過挖掘內容(提取關鍵詞的方式)變成一系列標簽;然后計算每個用戶的興趣標簽與每個興趣點的相似度,為用戶推薦相似度高的新的興趣點。

基于內容的興趣點推薦需要使用自然語言技術提取內容特征的關鍵詞[5],并且根據關鍵詞向量計算權重;這里使用TF-IDF算法,TF代表詞頻,IDE代表逆向文頻率。計算權重公式:

計算相似度。使用上述介紹的相似度計算方法計算關鍵詞的相似度。

基于內容的推薦算法的優勢在于[6]算法很好的穩定性,結果易解釋,能夠產生比較新的推薦。但是該算法比較以來大量的文本內容,并且對文本中的內容特征需要良好的結構性;其次對于很多場景下比如多媒體內容的無法進行特征提取;

2 多維度聯合推薦

多維度聯合推薦[7](Multi-dimmensional Koint Recommendation Algorithm,MJRA)針對上述算法片面考慮單一或某些維度而提出的一種融合空間、時間流行度、類別和社會維度的多維度個性化推薦。

算法步驟如下:

1)將用戶簽到數據按照位置進行過濾,減少噪音;

2)對提取的用戶-興趣點矩陣進行矩陣分解并引入時間衰減函數,體現用戶偏好關于時間的變化趨勢。時間衰減函數:

基于流行度推薦。興趣點的流行程度代表了興趣點的受歡迎程度8,選取興趣點v的總訪客量v(0)和興趣點t的總簽到.數t(o)作為流行度特征。公式:

綜合時間和流行度維度,得出預測用戶興趣點的主觀評價;主觀評價公式:

3)構建類別社交網絡矩陣。使用PageRank算法計算好友關于不同領域的權威程度,將結果引入基于社交網絡的協同過濾算法,預測用于關于興趣點的客觀評價??陀^公式:

4)對得出的客觀和主管評分采用線性組合的方式進行融合,最終使用Top-N推薦評分最高的給用戶。

在測試中作者提出的算法實驗結果與協同過濾、LFBCA和USG,準確率提高15%,召回率提高10%,提升效率顯著。

3 總結

本文主要介紹基于LBSN的概念以及相關的算法技術,但是它們都存在著各種各樣的缺點。最后考慮到為了提升推薦準確率的問題,需要考慮其他數據維度的因素,例如上下文信息、長期與短期興趣等,需要以后重點研究。

參考文獻:

[1]王石巖.面向LBSN的多維度因素融合興趣點推薦機制研究[D].上海:華東師范大學,2017.

[2]湯文哲.基于深度學習的個性化推薦系統研究[D].福州:福州大學,2017.

[3]馬宏偉,張光衛,李鵬.協同過濾推薦算法綜述[D].小型微型計算機系統,2009,30(7):1282-1288.

[4]王亮.基于主題模型的文本挖掘的研究[D].大連:大連理工大學,2015.

[5]李昆侖,萬品哲,張德智.基于改進用戶相似性度量和評分預測的協同過濾推薦算法[J].小型微型計算機系統,2018,39(3):567-571.

[6]劉袁柳.面向LBSN的興趣點和用戶推薦方法研究[D].蘇州:蘇州大學,2015.

[7]韓笑峰.LBSN中的多維度興趣點推薦[D].太原:太原理工大學,2018.

[8]宋文君,郭強,劉建國.一種改進的混合推薦算法[0]上海理工大學學報,2015,37(4):327-331.

[通聯編輯:唐一東]

猜你喜歡
興趣點個性化推薦社交網絡
興趣:玩球的起點
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合