宋召豪,陳亞軍*,萬 偉
(西華師范大學 計算機學院,四川 南充 637009)
本文首次以協同過濾思想為基礎,利用圖濾波器操作發揮相似節點對目標節點的增益效果,很大程度上緩解了用戶-項目二部圖所具有的稀疏性.
用戶集表示為U,項目集表示為I,用戶和項目的數量表示為N=|U|+|I|.在協同過濾中,評級矩陣為R∈|U|×|I|,其中如果用戶i和項目j具有交互,則rij=1.考慮到用戶、項目和評級矩陣R,協同過濾方法旨在學習得分函數s(u,i,R),以對未來用戶可能感興趣的候選項目進行排名.對于基于神經網絡的協同過濾,通常將使用用戶和項目的可學習嵌入表,并用E(0)∈N×d表示.
為了利用基于圖的方法進行協同過濾,通常需要基于R的用戶-項目二部圖的鄰接矩陣:
(1)
式中A∈N×N.為了確保訓練的穩定性,大多數方法采用歸一化鄰接矩陣式中D是對角矩陣,表示節點i的程度.每個用戶和每個項目都進一步分配了與其唯一ID對應的可學習嵌入和然后,基于圖神經網絡的方法將通過相鄰節點上的傳播來合并高階信息,通常每一層的表示被連接為最終的節點表示[4].例如,代表性方法LightGCN[5]的傳播可以表述為:式中k表示第k層圖神經網絡,最終的節點嵌入是通過不同層中嵌入的加權平均值獲得:平滑的嵌入表E可以進一步用于計算不同用戶-項目交互的推薦分數.
GCFG模型主要包含了嵌入初始化、基于Jacobi多項式的相似信息過濾、基于注意力的節點表示動態自適應融合和評分預測四個部分.單層GCFG模型結構如圖1所示.
圖1 單層GCFG模型結構
在GCFG模型中,初始化的過程是通過Xavier均勻初始化來完成的.Xavier均勻初始化是一種常用的權重初始化方法,用于避免神經網絡訓練過程中的梯度消失和梯度爆炸問題.
鄉村的監測預警設備配置按照“七個一”標準建設,即:每個鄉鎮有1個自動監測站,每座?。?)型以上水庫有1個自動水位雨量站,每座有防洪任務的?。?)型水庫有 1個自動水位雨量站,每個村有1個簡易雨量站和手搖報警器,每個山洪易發溪河兩岸的村有1個簡易水位站,每個村有1套預警廣播和1個避災點。另外,2012年福建省利用山洪災害防治縣級非工程措施項目契機,在全省所有自然村全面配置了6.8萬面防汛預警銅鑼,并建立鑼長制,專人鳴鑼。
為了解決傳統GNN方法只強調低頻信號,沒有明顯抑制中頻信號,同時不對高頻分量產生負響應的局限性以及沒有充分利用節點的相似信息等問題,考慮使用一種近似圖信號濾波器的替代方法.這種方法可以通過尋找一組正交的多項式基函數來實現,在保證收斂性的同時,在節點的表示中考慮相似性信息,提供足夠的表達能力以適應不同用戶-項目圖的濾波需求,其中Jacobi多項式是一種常見的選擇[7].
低頻和高頻信號易于擬合,因此不使用任何激活函數,節點表示是通過對不同階的嵌入進行平均來獲得:
(2)
對于中頻分量,典型的設計是αI-UgK(Λ)UT,α是控制中頻信號影響的系數.帶通濾波器的表示公式為:
(3)
最終的節點表示是它們的串聯:
(4)
實驗數據選取Gowalla(99.92%數據稀疏性)數據集和Alibaba-iFashion(99.99%數據稀疏性)數據集.實驗中,隨機抽取每個用戶的80%交互進行訓練,10%的交互進行驗證,剩余的 10% 交互用于測試.同時,為每個正實例采樣一個負項以形成訓練集.
實驗使用Recall@K和NDCG@K,這是協同過濾的兩個廣泛使用的指標來評估頂級推薦的性能.設置K值為10、20、50,以K=20為標準.更高的Recall@K和NDCG@K意味著更好的性能.取測試集中所有用戶的平均值為評價指標.
實驗數據集的批量大小設置為4096,嵌入大小設置為64.使用耐心為5個epoch的提前停止來防止過度擬合.對于GCFG,a和b在[-1.0,2.0]中進行了調整,步長為 0.5,學習率固定為0.001,λ固定為1e-6.實驗基于24GB RTX 4090 GPU.
為了驗證模型的有效性,與其他模型,如BPR、NGCF[9]、DGCF[10]、LightGCN、GTN[11]進行比較分析,在相同實驗環境下,結果如表1所示.
表1 協同過濾方法實驗對比結果
從表1可以看出,GCFG模型在更加稀疏的Alibaba-iFashion數據集上明顯比在Gowalla數據集上的表現突出,這表明該模型更加擅長處理稀疏數據.在現實世界用戶互動較少的客觀情況下,該模型展現出了處理冷啟動用戶的能力.
在兩個數據集上進行了消融實驗以探究模型的有效性,結果如表2所示.
表2 GCFG模型消融實驗
實驗研究了GCFG的兩種變體的性能:沒有相似節點的增益作用(GCFG/-s);沒有基于注意力機制的節點動態自適應融合(GCFG/-a).從表中可以看出兩個組件都是有效的,缺乏任何組件的GCFG將具有性能退化.
本文依據協同過濾思想,將相似信息嵌入節點表示中,充分發揮相似節點對目標節點的增益作用,有效建模用戶偏好和項目吸引力,緩解圖的稀疏性問題.同時引入注意力機制,自適應地調整權重,動態融合不同節點表示.實驗證明了模型的有效性和緩解冷啟動問題的潛力.