?

基于強化學習的推薦算法綜述

2020-02-25 07:36白玉馬然

福建質量管理 2020年19期

關鍵詞：海量缺點物品

白玉馬然

(北京物資學院北京 101149)

一、目前推薦的研究現狀與問題

面對互聯網上眼花繚亂的海量信息，通常會讓用戶感到無所適從，每個用戶都希望通過互聯網快速的得到有用的信息?；谑袌龅男枨?，許多算法都被采用。比如深度學習以及隱語義方法[1]。但傳統的推薦算法有許多缺點，比如內容過于相似等等。因此，為了解決此類問題，產生了強化學習算法。

二、強化學習與推薦算法研究

(一)協同過濾算法

在中國有句古話叫“物以類聚，人以群分”，就很好的詮釋了協同過濾[2-3]的基本思想。比如，你現在想買一本書，但你不知道買哪一本，你就會去問和你興趣類似的人，將他喜歡的書籍推薦給你。

(二)基于內容的推薦

基于內容的算法[4-5]應用的時間最早。從字面理解就是，依照用戶的喜好來尋找興趣相似的用戶，將物品作為推薦。例如：在京東購物的小伙伴都知道，每當你瀏覽完一個界面時，重新在打開瀏覽時，都會出現“猜你喜歡”欄目。它會根據你之前購買的物品，來為你推薦你可能喜歡的物品。

(三)強化學習

強化學習[6-7]與監督學習的區別是，沒有已經準備好的訓練數據輸出值，強化學習只有獎勵值。與非監督學習的區別，在非監督學習中即沒有輸出值也沒有獎勵值，只有數據特征，而強化學習有獎勵值。強化學習的特點是沒有監督數據，只有獎勵信號、獎勵信號不一定是實時的、時間序列是一個很重要的因素。強化學習在推薦系統中的算法有DQN算法、A2C算法以及DDPG和PPO算法。

三、小結

當今時代，面對海量的信息，人們要想快速找到自己所需要的信息，是離不開推薦算法的?；诒疚?，主要講述了傳統的推薦算法以及新興的強化學習算法。無論哪一種，都有自己的優點以及缺點。在合適的應用場景選擇合適的推薦算法尤為重要。

猜你喜歡

海量缺點物品

一種傅里葉域海量數據高速譜聚類方法

北京航空航天大學學報(2022年8期)2022-08-31

小學生學習指導(低年級)(2022年5期)2022-05-31

“雙十一”，你搶到了想要的物品嗎?

瘋狂英語·初中天地(2021年11期)2021-02-16

海量快遞垃圾正在“圍城”——“綠色快遞”勢在必行

當代陜西(2019年14期)2019-08-26

誰動了凡·高的物品

少年漫畫(藝術創想)(2019年2期)2019-06-06

跟蹤導練（五）2

時代英語·高一(2019年1期)2019-03-13

一個圖形所蘊含的“海量”巧題

中學數學雜志(初中版)(2016年5期)2016-11-01

小天使·一年級語數英綜合(2015年8期)2015-07-06

一種海量衛星導航軌跡點地圖匹配方法

導航定位學報(2015年2期)2015-06-05

缺點背后的陽光

小學生作文·小學中高年級適用(2014年4期)2014-08-18

福建質量管理2020年19期

福建質量管理的其它文章: 電力建設施工合同管理難點分析; 國有企業混合所有制改革的問題及其對策研究; 基于新技術下的跨境物流聯盟分析; 淺析酒店成本控制; 跨國公司綠色管理體系的構建研究; 炭業科技有限公司的存貨管理研究
——以H公司為例

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合