?

基于標簽的個性化信息推薦系統動力學模型與仿真

2016-08-23 09:58武慧娟孫鴻飛崔金棟
現代情報 2016年3期
關鍵詞:用戶群標簽動力學

武慧娟 秦 雯 孫鴻飛,2 崔金棟

(1.東北電力大學經濟管理學院,吉林 吉林 132012;2.吉林大學管理學院,吉林 長春 130022)

?

·理論探索·

基于標簽的個性化信息推薦系統動力學模型與仿真

武慧娟1秦 雯1孫鴻飛1,2崔金棟1

(1.東北電力大學經濟管理學院,吉林 吉林 132012;2.吉林大學管理學院,吉林 長春 130022)

基于系統與控制理論,通過分析標簽系統中標簽、用戶、資源的關系,運用系統動力學的方法分析個性化信息推薦的過程及影響因素,在此基礎上構建信息推薦的系統動力學模型,并采用vensim PLE軟件對模型進行仿真,最后通過對模型的有效性驗證分析,揭示了信息推薦的特性及機理,為進一步研究基于標簽的個性化信息推薦動態演變提供研究思路。

標簽;個性化;信息推薦;系統動力學;模型;仿真

1 問題的提出

個性化信息推薦是根據不同用戶的信息需求、偏好或行為模式,將用戶感興趣的信息、服務等推薦給用戶的個性化信息服務[1]。1999年,Smyth,B最早提出通過用戶偏好分析和信息過濾技術來生成基于用戶個性化瀏覽偏好的觀看電視指南[2]。但是較正式明確提出基于標簽的個性化信息推薦概念的是2007年Jaeschke Robert將資源以標簽的方式標注,以FolkRank為基礎,通過比較協作化推薦和基于圖的推薦,驗證了基于圖的推薦的優越性[3]。

此后,國內外許多學者對基于標簽的個性化信息推薦從復雜網絡、概念語義等角度進行了多方面的深度研究[4-6],但學者們關注較多的是標簽系統的靜態結構方面,而對基于標簽的個性化信息推薦動態演變過程方面探討的較少,對此,筆者用系統動力學方法對個性化信息推薦的過程進行建模仿真,為推薦策略提供理論依據。

系統動力學[7](system dynamics,SD)的概念最早由Forrester提出,適用于模擬研究高度非線性、高階次、多變量、多重反饋、復雜時變的大系統決策問題的處理,它采用定性與定量相結合、系統綜合推理的方法,能夠在非完備信息狀態下分析求解復雜問題,其建模過程是一個學習、調查、研究的過程,系統性和動態性是SD模型區別于傳統的靜態決策方法的兩大主要特點。

基于標簽的個性化信息推薦系統動力學建模首先需要建立因果關系圖,確定影響信息推薦的各個關鍵因素,同時構建存量流量圖,明確各種狀態變量、輔助變量和常量的含義;然后確定個性化信息推薦模型中各變量的方程式,即各種狀態變量、輔助變量和常量之間的關系;最后進行模型的有效性測度、靈敏性測度等,具體分析模型的結構和行為。

2 個性化信息推薦系統的因果關系分析

基于標簽的個性化信息推薦主要研究的內容是信息在用戶之間流動的過程,由于它遵循信息擴散和轉移的基本規律,并且信息總量具有不斷增長的耗散特征,因此,可以用系統動力學來研究它的演變過程[8-9]。

2.1 個性化信息推薦過程

在利用協同過濾算法提出基于標簽的個性化信息推薦算法的基礎上[10],筆者進一步將個性化信息推薦具體分為4個階段,其中包括2個反饋回路,具體如圖1所示。

圖1 個性化信息推薦過程

第一個階段是數據挖掘,通過對標簽系統中的用戶、資源、標簽進行兩兩關系分析,挖掘用戶的行為,進一步提取用戶的偏好,并進入第二個階段,即構建用戶偏好模型,具體用向量Pij=TUi、Rj來表示用戶的偏好,然后進入第三個階段,即相似度比較,利用余弦相似度比較用戶的偏好,將相同偏好的用戶形成一個集合,針對該類用戶集,提取用戶標注過的資源,形成資源集Pm,再次利用余弦相似度比較每個用戶偏好和每個資源集的相似度Pij=Pm,對每個用戶的假設推薦資源進行排序,進行優先推薦。其中反饋1的作用是在相似度比較的過程中,如果相似度值低于既定的閥值,那么要對用戶的偏好進行檢查、過濾、調整。反饋2的作用是個性化信息推薦如果沒有達到用戶的滿意度閥值,那么要對用戶的行為進行再次分析、挖掘,重新構建用戶偏好模型。

2.2 個性化信息推薦因果關系分析

系統動力學主要利用反饋循環機制研究系統的內部結構,從而研究系統的行為模式與特性,為決策的制定尋找依據。筆者在綜合國內外研究人員分析信息推薦的影響因素的基礎上[11-14],認為影響個性化信息推薦的主要因素有用戶標注行為、用戶群的粒度、用戶群中的資源,具體如圖2所示,進一步通過系統動力學模擬,標明個性化信息推薦過程中的重要因素。

其中,個人意向、社群影響、系統內置的標注行為選擇算法正向影響用戶標注行為[15],用戶偏好由于時間的因素,會發生漂移現象,所以會負向延長影響用戶偏好,因果關系圖中主要的反饋回路為:

(1)用戶A標注行為→+用戶群的粒度→+用戶群中的資源→+用戶偏好和推薦資源的相似度→+個性化信息推薦→+用戶A標注行為

圖2 個性化信息推薦的因果關系

(2)用戶A標注行為→+用戶A偏好→+用戶偏好和推薦資源的相似度→+個性化信息推薦→+用戶A標注行為

(3)用戶A標注行為→+用戶群的粒度→+用戶A偏好→+用戶A標注行為

(4)用戶A偏好→+用戶偏好和推薦資源的相似度→+個性化信息推薦→+用戶A偏好

(5)用戶A標注行為→+用戶A偏好→+用戶A標注行為

(6)用戶A標注行為→+用戶群的粒度→+用戶群中的資源→+用戶偏好和推薦資源的相似度→+個性化信息推薦→+用戶A偏好→+用戶A標注行為

2.3 個性化信息推薦的存量流量圖

存量流量圖是在因果關系圖的基礎上進一步區分變量的性質,更加清晰的反映系統要素之間的邏輯關系,明確系統的反饋形式和控制規律。個性化信息推薦模型的基本假設:用戶標注行為和用戶偏好會不斷上升但是不會永無止境的上升,由于偏好的漂移現象,用戶的偏好隨著時間會發生變化,那么針對新的偏好又會有新型的標注行為,所以用戶標注行為和用戶偏好會假設有一個閥值限制。

圖3中共有2個狀態變量(用戶A的資源、用戶群中的資源)、5個流率變量(用戶A資源的增加、用戶A資源的減少、資源的增加率、資源的失效、推薦的資源量)、4個輔助變量(用戶A標注行為增加、用戶的偏好和推薦的資源的相似度、資源缺口、用戶采納情境)、10個常量(個人意向、社群影響、系統內置的標簽選擇算法、用戶A偏好的漂移速率、用戶A偏好的穩定率、同類型資源的增加率、同類型資源的失效率、資源復雜度、文化程度、信任程度),下面分別對重要的輔助變量和常量進行介紹。

圖3 個性化信息推薦的存量流量圖

用戶A標注行為影響率:由于不同用戶對信息的需求、情境、偏好等的不同,所以文獻[15]認為用戶標注行為會受到三方面的影響,分別是個人意向,即用戶會基于過去的標注行為來使用標簽;社群影響,即用戶的標注行為會受到其他用戶的影響;系統內置的標簽選擇算法。所以用戶的標注行為存在很大的不確定性,它的增加率是隨機產生且不斷發生變化的。

用戶偏好和推薦資源的相似度:采用余弦相似度的方法來計算用戶的偏好和推薦資源的相似度,分別看作是向量空間中的兩個向量,可以通過計算兩個向量的夾角的余弦來衡量相互之間的相似度,夾角越小,相似度越高。例如將某用戶的用戶興趣轉化為向量p,另一用戶的用戶興趣轉化為向量r,則通過下面的公式進行計算[10]:

(1)

其中d,p分別為即將要推薦給用戶的資源向量d和用戶偏好向量p,Rk和Uk分別表示用戶的資源向量d和用戶偏好向量p的第k個特征項的權重,similarity值越大表明二者內容越相近,設定一個閾值θ,設定為0.6,當similarity>0.7時,就可以將資源推薦給用戶,或者將排名最前的n項資源進行推薦。

資源缺口:根據用戶群中用戶A已掌握的資源與用戶群共有的資源相比較,求出該用戶的資源缺口,它作為將向用戶推薦的資源的一個參考值。

用戶采納情境:由于受到資源復雜度、文化差距、信任程度等因素的影響,用戶對系統推薦的資源采納情況會不相同,資源越復雜,用戶采納系統推薦的可能性就越大;用戶的文化水平越高,分析、推斷信息的能力就越強,從而采納系統推薦的可能性就越低;用戶對系統越信任,就越容易采納系統推薦的信息。

3 個性化信息推薦的系統動力學模型設計

個性化信息推薦的存量流量圖中各狀態變量和輔助變量的動態方程詳細情況如下:

用戶A的資源=INTEG(推薦的資源量+用戶A資源的增加-用戶A資源的減少,5)

用戶A資源的增加=用戶A的資源*用戶A偏好的顯著性*用戶A標注行為影響率

用戶A資源的減少=用戶A的資源*用戶A偏好的漂移速率

用戶群中的資源=INTEG(資源的增加-資源的失效,15)

資源的增加=用戶群中的資源*同類型資源的增加率

資源的失效=用戶群中的資源*同類型資源的失效率

資源缺口=用戶群的資源-用戶A的資源

推薦的資源量=DELAY1I(IF THEN ELSE(用戶偏好和推薦資源的相似度<0.7,資源缺口*用戶采納情境,0),5,0)。當用戶偏好和推薦資源的相似度超過0.7時,將向用戶推薦該資源,同時,由于圖2中整體個性化信息推薦的過程中存在一定的延遲,所以,使用一階延遲函數來反映這個過程,延遲5個單位才開始信息的推薦,初始推薦的資源量設為0。

用戶A偏好的偏移速率=DELAY1I(0.001*Time,50,0)

用戶群偏好的偏移速率=DELAY1I(0.001*Time,55,0 )。當時間超過50周時,用戶A的偏好才會發生偏移,所以,使用一階延遲函數來反映這個過程,初始的速率設為0。同理,用戶群的偏好在55周后才發生偏移,它比單個用戶偏好偏移的時間要晚。

用戶群偏好的顯著性=WITH LOOK UP(用戶群的粒度,[(0,0)-(60,0.1)],(0,0),(10,0.01),(20,0.06),(30,0.08),(40,0.09),(50,0.087),(60,0.079))

用戶A偏好的顯著性=WITH LOOK UP(time,([(0,0)-(60,0.1)],(0,0),(10,0.02),(20,0.066),(30,0.088),(40,0.098),(50,0.096),(60,0.09))

用戶采納情境=IF THEN ELSE(信任程度*資源復雜度>文化差距,信任程度*資源復雜度-文化差距,0)。為了便于模擬,設定信任程度、資源復雜度與用戶采納情境正相關,文化差距與用戶采納情境負相關。

4 個性化信息推薦的系統動力學模型測試

系統動力學認為,系統結構決定系統的行為,而典型的結構產生典型的行為,如內在規律性的行為等。仿真模型在Vensim PLE平臺上構建并仿真運行。設定仿真時間為60周,時間步長為0.125,用戶群中的資源初始值設為15,用戶A的資源初始值設為5,用戶偏好和推薦資源的相似度為0.8,調節信任程度、資源復雜度、文化差距的值,使用戶采納情境為0.1,個人意向、社群影響、系統內置的標簽選擇算法、用戶偏好和推薦資源的相似度分別在[0,1]之間取值,最后仿真運行的結果如圖4所示。

圖4 個性化信息推薦仿真運行結果

從模擬的結果可以看出:(1)用戶群和用戶A的資源在模擬時間內都出現了快速增長的趨勢,并且用戶群的資源增長要比用戶A的資源增長快的多。(2)資源的缺口和推薦的資源量的變化趨勢相似,由于在用戶偏好和推薦資源的相似度一定的情況下,用戶采納情境為0.1,較低,所以推薦的資源量隨著資源的缺口增加而增加。(3)保持當前的參數不變,提高用戶采納情境分別到0.4和0.7,命名為方案Current2和Current3,得到模擬結果如圖5所示。

圖5 個性化信息推薦仿真測度

從圖5可以看出,當用戶偏好和推薦資源的相似度為0.8保持不變時,提高用戶采納情境,在相同的模擬時間內,Current2、Current3與Current1相比,資源缺口和推薦的資源量都與與原圖形總體趨勢保持一致,都隨時間不短上升。其中,當用戶采納情境在區間[0~1]內逐漸變化時,資源缺口會先快速降低,然后緩慢降低;推薦的資源量會先快速增加,然后趨于平穩,最后由于資源缺口的降低,所以推薦的資源量也隨之降低??傮w上,推薦的資源量會隨著資源的缺口變化而變化,但是兩者會相互抑制,當推薦的資源量變大時,資源缺口就會降低。

5 結束語

在分析個性化信息推薦過程及影響因素的基礎上,建立基于標簽的個性化信息推薦的系統動力學模型,分析了模型的有效性和主要影響參數的靈敏度,揭示了系統與用戶間信息推薦的特性及機理,為研究個性化信息推薦提供了一個有效的方法。由于真實的個性化信息推薦是一個復雜、抽象的演化過程,因此模型存在一定的局限性,如模型中各影響因素的考慮不太全面,變量及方程的設定都采取了簡化等,所以,筆者下一步的工作是深入研究更為復雜的個性化信息推薦模型。

[1]Zhou T,Ren J,Medo M,et al.Bipartite network projection and personal recommendation[EB/OL].http:∥pre.aps.org/abstract/PRE/v76/i4/e046115,2013-02-05.

[2]Smyth B,Cotter P.Surfing the digital wave[EB/O L].http:∥link.springer.com/chapter/10.1007%2F3-540-48508-241?LI=true#page-2,2013-02-05.

[3]Jaeschke Robert,Marinho Leandro,Hotho Andreas.Tag recommendations in Folksonomies[EB/OL].http:∥www.kde.cs.uni-kassel.de/stumme/papers/2007/jaeschke07tagrecom-mendationsKDML.pdf,2013-02-05.

[4]Zhang Zi-Ke,Zhou Tao,Zhang Yi-Cheng.Personalized recommendation via integrated diffuseion on user-item-tag tripartite graphs[J].Physica A,2010,389(1):179-186.

[5]Shang Ming-Sheng,ZhangZi-Ke,Zhou,Tao.Collaborative filtering with diffusion based similarity on tripartite graphs[J].Physica A,2010,389(6):1259-1264.

[6]Godoy D,Amandi A.Hybrid Content and Tag based Profiles for Recommendation in Collaborative Tagging Systems[EB/OL].http:∥dblab.cs.nccu.edu.tw/presentation/.980525/9 80525.pdf,2012-08-22.

[7]FORRESTER J W.Industrial dynamics:a major break throughfor decision makers[J].Harvard Business Review,1958,36(4):37-66.

[8]王其飗.系統動力學[M].北京:清華大學出版社,1994.

[9]鐘永光.系統動力學[M].北京:科學出版社,2009.

[10]田瑩穎.基于社會化標簽系統的個性化信息推薦探討[J].圖書情報工作,2010,54(1):50-53.

[11]Chuang MC,Chang CC,Hsu SH.Perceptual factors underlying user preferences toward product form of mobile phones[J].International Journal of Industrial Ergonomics,2001,27(4):247-258.

[12]Frias-Martinez Enrique,Chen Sherry Y,Macredie Robert D,et al.The role of human factors in stereotyping behavior and perception of digital library users:a robust clustering approach[J].User Modeling and User-adapted Intera Ction,2007,17(3):305-337.

[13]余力,劉魯,李雪峰.用戶多興趣下的個性化推薦算法研究[J].計算機集成制造系統,2004,10(12):1610-1615.

[14]鄧勝利,鮑唯.社交網站用戶交互學習行為影響因素的實證分析[J].情報理論與實踐,2012,35(3):57-61.

[15]ShiladSen.Tagging,Communities,Vocabulary,Evolution[EB/OL].http:∥portal.acm.org/citation.cfm?doid=1180875.1180904,2012-02-28.

(本文責任編輯:孫國雷)

System Dynamics Model and Simulation Based on the Tag of Personalized Information Recommendation

Wu Huijuan1Qin Wen1Sun Hongfei1,2Cui Jindong1

(1.School of Economy Management,Northeast Dianli University,Jilin 132012,China;2.School of Management,Jilin University,Changchun 130022,China)

Based on the system and control theory,the paper analyzed the relationship between tag,user,and resource in the label system,using system dynamics method to analyze the process of personalized information recommendation and the influencing factors,and constructed system dynamics simulation model on the information recommendation using the vensim PLE software,finaly this paper revealed the characteristics and mechanism of information recommendation for further research on the dynamic evolution on the tag of personalized information recommendation,through the verification of model in validity.

label;personalized;information recommendation;system dynamics;model;simulation

2015-12-09

教育部人文社會科學規劃項目“社會化標注系統中個性化信息推薦多維度融合與優化研究”(項目編號:15YJC870024)、“基于微本體架構的微博信息管理機理研究”(項目編號:14YJA870001);東北電力大學博士科研啟動基金項目“協同視角下社會化標注系統中資源深度聚合模式研究”(項目編號:BSJXM-201420)。

武慧娟(1979-),女,副教授,博士,研究方向:信息資源管理,發表論文10余篇,出版專著1部。

10.3969/j.issn.1008-0821.2016.03.002

G203

A

1008-0821(2016)03-0012-05

猜你喜歡
用戶群標簽動力學
具有Markov切換的非線性隨機SIQS傳染病模型的動力學行為
從資源出發的面向用戶群的高校圖書館資源推薦模型分析
無懼標簽 Alfa Romeo Giulia 200HP
不害怕撕掉標簽的人,都活出了真正的漂亮
標簽化傷害了誰
基于多進制查詢樹的多標簽識別方法
基于隨機-動力學模型的非均勻推移質擴散
公共圖書館的用戶群和服務人員的分析
TNAE的合成和熱分解動力學
C36團簇生長動力學及自由能
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合