?

基于用戶畫像的目標信息高精度推送仿真

2023-09-20 10:36涂劍峰林立鑫劉承啟
計算機仿真 2023年8期
關鍵詞:畫像特征向量向量

涂劍峰,林立鑫,劉承啟

(1.江西科技學院信息工程學院,江西 南昌 330098;2. 江西科技學院網絡信息中心,江西 南昌 330098;3. 南昌大學信息技術辦公室,江西 南昌 330031)

1 引言

在信息雜亂的網絡數據庫中,用戶想要遵循自身需求檢索興趣話題并對其深入分析,不僅會受到數據庫內泛濫信息的影響,出現目標信息挖掘不徹底或推送信息與目標信息不相符等問題??紤]到網絡用戶的切身需求,各種電商、社交、媒體、APP等信息技術服務企業陸續推出針對用戶的智能服務[1-2],但就目前各企業的信息推送服務而言,網絡用戶對其推送的信息內容并未持有較高的滿意度,導致這一問題的主要原因包括但不限于用戶行為了解不透徹、查詢信息數據庫排版不精簡及用戶所有瀏覽頁面掌握不全面。為了將信息精準、有序的推送到用戶面前,國內外相關人員展開對信息精準推送方法的研究。

喻迎春等人[3]提出基于微信的氣象災害預警信息精準智能推送技術,通過設計智能推送平臺,將實時發布的預警信息作為支撐平臺業務運行的網格化靶點。通過讀取用戶位置信息,實現信息精準推送模型的建立,該方法存在用戶滿意度差的問題。張然等人[4]提出科技期刊郵件推送的用戶調研與策略分析方法,通過在人群中派發問卷報告對網絡用戶的實際需求實例調研,并將實例調研結果作為案例分析對象,深入探討用戶推送需求,實現信息精準推送模型的建立。張青等人[5]提出基于BBCAL模型的法條自動推送方法,通過在用戶訴求中捕捉專業性術語特征并將其投入到BiLSTM模型中,以此獲取其更深層次的含義。將專業性術語特征的深層次含義與當前任務最相關信息同時輸入BERT模型中,實現信息精準推送模型的建立,上述方法存在推送精度不高的問題。

為了解決上述方法中存在的問題,提出基于用戶畫像的信息精準推送模型。

2 建立用戶畫像

用戶畫像[6]又稱戶畫像,指的是以不同方式勾畫用戶角色、闡明用戶需求、聯系用戶興趣的一種有效工具??紤]到用戶行為[7]的抽象性,用戶畫像需要從社會屬性、專業背景、日常習慣等多方位收集,將用戶動態信息與靜態信息結構化。由此可知,建立用戶畫像,需要從采集用戶信息和處理用戶信息兩個方面入手。

1)采集用戶信息

用戶信息的采集是建立用戶畫像的關鍵步驟。鑒于用戶信息的多樣性和用戶基數的龐大規模,用戶信息的采集工作并不局限在單一數據來源,而是擴展至關聯程度和統一程度較為緊密的多樣數據來源。視二者為融合用戶信息的高質量數據,對二者展開空間全方位、時間全過程的采集工作。由于用戶喜好傾向存在時間差異,因此將用戶動態行為數據具體分為顯性可變數據(當前喜好傾向)和隱性可變數據(以往喜好傾向),以此消除時間誤差所導致的喜好傾向異質化現象。數據來源如下圖1所示。

圖1 數據來源

空間全方位采集公式如下:

(1)

式中,αi表示信息缺省值;αj表示用戶初始化興趣集;q表示用戶瀏覽的頁面文本;xij表示用戶歷史行為;f1表示網站訪問數據量;xi表示用戶重返網站次數占總訪問次數的比值;f2表示動態本體權重;xj表示靜態本體權重。

時間全進程采集公式如下:

(2)

式中,y2表示用戶心理趨勢;n表示搜索引擎響應時長;σ表示數據源獨立性;mi表示用戶數據分析的信用度;Io表示用戶反饋產生的互動數據流;Δs表示用戶行為內在變化;s2表示用戶行為發展規律。

2)處理用戶信息

經過采集的用戶信息存在分量較高的高斯白噪聲[8],不能作為樣本數據建立信息精準推送模型。為了獲得更為精確的推送結果,在建立信息精準推送模型前,優先利用DVMD去噪算法消除用戶信息噪聲。

不同于傳統去噪算法,DVMD在解決約束變分問題[9-10]上具有較為獨特的優勢。通過分解數據分量,并度量各分量瞬時頻率,以捕捉藏匿在用戶信息間的噪聲信號。在成功識別噪聲信號后,DVMD引入狄拉克函數編寫卷積符號標注藏匿噪聲的數據段,并在不改變用戶信息能量密度及周期常量的前提下,通過模態分量的疊加重構剔除用戶信息噪聲,獲取不存在高頻噪聲分量和數值突變點的清晰數據。數據分量分解公式如下:

(3)

瞬時頻率度量公式如下:

(4)

狄拉克函數的表達式如下:

N=z′×Δ(τ)

(5)

式中,z′表示用戶行為接觸點;Δ(τ)表示卷積符號的先驗參數。

模態分量疊加重構公式如下:

(6)

式中,g表示初始噪聲幅值;j表示去噪實例的信號理論值;O表示噪聲信號波形;b表示噪聲信號頻譜;im表示重構指征;υ表示自適應模態分量疊加準則。

將經過降噪處理的用戶信息已完全具備形象化特征,不僅充分貼近用戶實際生活,還自成標簽,屬于信息推送服務中應用價值較高的用戶畫像。

3 信息精準推送模型

信息精準推送模型的宗旨在于依靠信息技術向目標用戶源源不斷地推送符合用戶畫像的實時信息,以此達到鞏固用戶流量、加強用戶關系、防止用戶流失的目的。由于信息精準推送模型通過追蹤用戶畫像提供的用戶行為傾向獲取隱藏的未知線索,因此信息精準推送模型主要采用支持向量機(SVM)[11]組建。支持向量機是目前世界范圍內解決預測問題評分最高的分類方法,該方法在改進傳統預測方法的基礎上,以主、客觀設定補償的方式填充稀疏性問題中的單位平均值與中間值,以此進一步提升預測結果的精確度。將支持向量機應用在個性化的信息推送問題上,其核心思路圍繞用戶興趣領域中推薦價值最高的信息類別展開。

除預測推送信息外,模型還離不開服務體系的層次化模塊。在數據驅動環境下引入Storm[12]、Storm steaming實時計算框架作為信息精準推送模型的外骨骼,信息精準推送模型如下圖2所示。

如上圖2可見,信息精準推送模型包括四個模塊,即數據來源層、精準應用層、用戶數據倉庫和數據處理層。其中,用戶數據倉庫作為模型核心結構,起到真正意義上的精準信息推送作用。模型提取用戶畫像關鍵詞[13]獲取用戶畫像針對不同詞匯的特征向量,將特征向量輸入支持向量機中,就用戶的不同喜好傾向開啟分類。支持向量機在過濾掉推送價值較低的信息類別后,輸出針對目標用戶的推送價值較高的信息類別,實現信息精準推送。

基于用戶畫像的關鍵詞特征向量提取過程如下:根據統計學方法[14]可知來自單一數據來源和多數據來源的用戶畫像在表征問題特征上并不具備正相關性,因此低頻出現的詞匯與高頻出現的詞匯之間并沒有明顯的維度差異,這意味著隨機出現的詞匯既是用戶畫像的一部分,又存在脫離實際情況的概率。關鍵詞的提取工作相當于給每個詞匯追索一串字符,讓其擁有與自身使用頻率相匹配的權重值。經過權重值標注的用戶畫像不再以執行文本的形式出現在用戶畫像中,而是以特征向量的形式,時刻準備與其它具有標志意義的特征向量展開碰撞。統計學方法的表達式如下:

(7)

式中,ρij表示用戶數量;s*表示用戶近期檢索的歷史記錄;ζ表示空缺值;ri表示非空缺值;rj表示特征詞集合。

詞匯使用頻率的計算公式如下:

(8)

權重值匹配公式如下:

(9)

式中,w′表示基寬向量;φ表示用戶畫像的不均勻性;B表示預測集容量。

不同詞匯特征向量的表達式如下:

C=Yln2+qs

(10)

式中,Y表示特征向量的維度;2表示網頁瀏覽記錄;qs表示鄰接特征向量在維度上的互相對應關系。

支持向量機是建立在超平面配置補空間[15]基礎上的分類算法,主要分類對象是現實中非線性分布的樣本數據。在信息精準推送模型內部,基于用戶畫像的關鍵詞特征向量作為樣本數據與支持向量機結合。支持向量機的表達式如下:

(11)

式中,tij表示決策平面;ds表示類別屬性;F表示樣本數據。經過反復聚類迭代,模型輸出特征向量分類結果,實現信息精準推送。

4 實驗與分析

為了驗證基于用戶畫像的信息精準推送模型的整體有效性,需要對其測試。

4.1 用戶滿意度

采用所提方法、基于微信的氣象災害預警信息精準智能推送技術(文獻[3]方法)和科技期刊郵件推送的用戶調研與策略分析方法(文獻[4]方法)向3名試驗人員發送9條內容各異的推送信息,并記錄每名試驗人員對各推送內容的滿意程度(滿意/不滿意)。其中一名試驗人員的滿意度記錄流程如下圖3所示。

圖3 用戶滿意度記錄流程

規定用戶滿意的推送內容為1分,不滿意的推送內容為0分。依照圖3繪制3名試驗人員基于推送內容的滿意度調查報告。滿意度調查報告如下表1所示。

根據表1中記錄的滿意度調查數據,可以計算出不同方法的用戶滿意度。用戶滿意度計算公式如下:

(12)

式中,r表示滿意數值;c表示不滿意數值。

將不同方法的滿意度調查數據帶入上述公式中,可知所提方法的滿意度約等于85%,文獻[3]方法的滿意度67%,文獻[4]方法的滿意度約等于70%。由此可知,采用所提方法獲取的推送信息更貼近用戶興趣方向,真正做到了以用戶興趣為導向,為用戶提供個性化需求定制服務。因為所提方法在建立信息精準推送模型的過程中,以單一數據來源和多數據來源的用戶畫像為樣本數據,提取其關鍵詞特征向量并輸入支持向量機中。經上述對比可知,所提方法在用戶滿意度方面明顯優于其它兩種方法。

4.2 回歸圖

為了進一步驗證所提方法的實用性,采用所提方法、文獻[3]方法和文獻[4]方法向1名試驗人員發送5條內容各異的推送信息。將不同方法獲取的推送信息視為預測值,用戶理想信息視為實際值,繪制三維空間中預測值與實際值的回歸圖。不同方法的回歸圖如下圖4所示。

圖4 不同方法的回歸圖

如上圖4可見,采用所提方法獲取的推送信息與用戶理想信息的擬合度較高,說明所提方法的推送精度較高。采用文獻[3]方法和文獻[4]方法獲取的推送信息與用戶理想信息的擬合度較低,且回歸圖中預測值與實際值距離回歸平面較遠,說明文獻[3]方法和文獻[4]方法的推送精度較低。經上述對比,進一步驗證了所提方法的實用性。

5 結束語

用戶畫像被廣泛應用于個性化推薦服務、用戶行為分析和知識問答領域,成為當下社會的熱議話題。為了發現廣大用戶潛在需求,并精準匹配相對應的信息資源,提出基于用戶畫像的信息精準推送模型。通過獲取實際生活中的用戶信息,采用DVMD去噪方法,消除用戶信息中的噪聲,獲取更為清晰的優化信息。將與支持向量機Storm、Storm steaming實時計算框架結合,建立信息精準推送模型。實驗表明所提方法用戶滿意度高,且推送精準度高。在未來研究工作中,對信息精準推送過程實時監控,是研究人員下一步工作的重點。

猜你喜歡
畫像特征向量向量
二年制職教本科線性代數課程的幾何化教學設計——以特征值和特征向量為例
威猛的畫像
向量的分解
克羅內克積的特征向量
聚焦“向量與三角”創新題
“00后”畫像
畫像
一類特殊矩陣特征向量的求法
EXCEL表格計算判斷矩陣近似特征向量在AHP法檢驗上的應用
向量垂直在解析幾何中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合