?

基于MOOC的智能信息推薦模型構建仿真

2023-09-20 11:22馬蓮姑黃壽孟紀春林趙安學
計算機仿真 2023年8期
關鍵詞:本體聚類概念

馬蓮姑,黃壽孟,紀春林,趙安學*

(1. 瓊臺師范學院信息科學技術學院,海南 ???571100;2. 三亞學院信息與智能工程學院,海南 三亞 572022;3. 陜西理工大學教育科學學院,陜西 漢中 723000)

1 引言

慕課(MassiveOpenOnlineCourse,MOOC)是受到眾多教師以及學生認可的學習方式,MOOC在教學改革中占據重要地位。MOOC屬于在線學習方式,具有不受時間以及地點限制的優勢[1]。網絡中包含眾多不同企業以及高校開發的MOOC平臺,海量MOOC信息存在于MOOC平臺中。眾多MOOC平臺中的課程存在較高的重復性,學生選擇MOOC時,無法明確選取合適的慕MOOC,MOOC的智能信息推薦是目前在線網絡學習領域急需解決的重要問題[2]。目前網絡中各大MOOC學習平臺具有極高的計算能力以及存儲能力,利用高效的推薦算法實現MOOC平臺的智能信息推薦,利用聚類算法挖掘網絡中存在的海量課程,實現MOOC知識數據庫的有效優化。學生可以快速獲取所需MOOC課程中的知識點,便于快速提升學習成績,令MOOC利用率有所提升。學生的學習效率有所提升[3,4],同樣提升了MOOC平臺的教學質量,推動MOOC教學平臺進一步發展。

目前針對MOOC研究較多,郭軍[5]以及戴亞平[6]等人分別將大數據技術應用于MOOC平臺中以及研究學生使用MOOC平臺時的聽課行為,對MOOC平臺具有了初步研究。

目前針對MOOC平臺的智能信息推薦研究還行相對較少。本文構建基于MOOC的智能信息推薦模型,將高效的智能信息推薦模型應用于MOOC平臺中,通過仿真軟件對所構建模型仿真,通過仿真結果驗證所構建模型具有較高的智能信息推薦有效性,將所構建模型應用于MOOC平臺中,可為用戶推薦所需要課程,提升學生的學習效率,令MOOC平臺發揮最大功能。

2 MOOC的智能信息推薦模型構建

2.1 MOOC平臺信息聚類

利用基于本體的概念相似度計算方法實現MOOC平臺中海量課程信息的聚類。MOOC平臺中的用戶數據包含所訂閱、收藏的課程以及課程視頻學習數據、瀏覽記錄等數據,以上數據分別屬于用戶的直接數據以及隱式行為數據。MOOC平臺信息聚類需要將以上數據有效聚類[7],利用完成聚類后的數據提取興趣點特征向量,為智能信息推薦模型提供良好的數據基礎。

利用有向樹建立本體的層次結構,本體的概念相似度計算過程如下:

1)語義距離

用Dis(Gc1,Gc2)表示待聚類領域本體中的概念Gc1與概念Gc2間的語義距離。設置所建立本體層次數內具有最短概念路徑的有向邊數量,作為領域本體的語義距離。當概念Gc1與Gc2概念為相同語義時,二者相似度為1,此時Dis(Gc1,Gc2)=0。

2)層次差

用|hc1-hc2|表示概念Gc1與概念Gc2的層次差,概念Gc1與概念Gc2的相應層次深度利用hc1與hc2表示。本體樹的層次深度有所提升時,所劃分的本體樹節點更加具體。設兩個概念的語義距離相同[8],二者的層次之和有所提升時,相似度隨之增加;二者的層次之差有所增加時,相似度

3)語義重合度

用E(Gc1)∩E(Gc2)表示本體層次樹中概念Gc1與概念Gc2的語義重合度。兩個概念在所設置的本體層次樹內選取根節點作為出發點,出發過程中共同經過的節點占全部節點的比例即概念Gc1與概念Gc2的語義重合度。

充分考慮以上概念,利用本體層次樹方法獲取概念Gc1與概念Gc2相似度表達式如下

(1)

式中,β表示調節因子。

MOOC平臺信息聚類具體過程如下:

選取原始MOOC平臺信息集以及聚類數量作為聚類輸入,將完成聚類的MOOC平臺信息集作為聚類輸出。

1)劃分MOOC平臺信息集;

2)建立MOOC平臺信息集內不同概念的向量空間;

3)隨機選取K個概念作為初始聚類的聚類中心;

4)計算全部概念與K個聚類中心的相似度,將MOOC平臺信息集內與聚類中心相似度較高的概念劃分至該類別中,利用式(1)計算MOOC平臺信息集內的概念與聚類中心的相似度;

5)更新完成聚類的聚類中心;

6)重復迭代以上過程,直至聚類中心為固定狀態,終止聚類。

通過以上過程,利用MOOC平臺信息內不同概念的相似度,聚類主體相同或相近的信息,實現MOOC平臺內海量信息的有效聚類,得到信息聚類結果。

2.2 提取特征向量

深度神經網絡提取興趣點特征向量主要包括以下步驟:

1)卷積層

利用xi=[w1,w2,…,wn]表示隨機興趣點評論信息集合,將集合xi內的單詞wi依據先后順序。利用詞向量模型映射至詞向量wi∈p×1,將集合轉換至詞向量矩陣B∈p×l。該矩陣具有詞序不變特征[9],矩陣表達式如下

(2)

其中,p表示單詞wi的嵌入維度;l表示集合xi的長度;wi表示集合xi內i處單詞的詞向量。

(3)

通過重復卷積操作獲取上下文特征cj∈l-wd+1表達式如下

(4)

2)池化層

MOOC平臺內不同興趣點的潛在特征利用所提取的上下文特征向量內的最大特征向量體現[10,11]。用lj表示隨機興趣點評論信息xi的上下文特征,可得公式如下

(5)

3)輸出層

上文所獲取的特征向量,需映射至差異維度的向量空間中,利用不同的向量空間體現不同任務。MOOC平臺智能信息推薦應用時,設置特征向量lj映射至kd維向量空間中表達式如下

r=tanh(Zf2{tanh(Zf1lj+bf1)}+bf2)

(6)

以上公式中,r∈kd,Zf1∈f×nc,Zf2∈kd×f,bf1∈f,bf2∈kd,其中Zf1、Zf2與bf1、bf2分別表示映射矩陣以及偏移向量。

通過以上過程實現MOOC平臺基于聚類信息的上下文特征提取??偨Y以上過程,利用深度神經網絡學習興趣點[12],所提取興趣點特征向量的目標函數如下

(7)

2.3 協同過濾圖模型

(8)

興趣點特征空間向量tI表達式如下

(9)

獲取協同過濾圖模型應用于智能信息推薦的表達式如下

(10)

(11)

式中,rmi表示用戶m對課程i的感興趣程度。

(12)

式中,smi表示用戶m對課程i的相似度。

通過以上步驟實現MOOC平臺的智能信息推薦。

3 仿真測試

選取Matlab 2020b0軟件作為驗證所構建模型推薦性能的仿真軟件,由某MOOC平臺的用戶操作日志以及選課記錄構成數據集,利用Matlab 7.0軟件將該數據集應用于某MOOC平臺中。分析數據集內數據,數據集內包含用戶數量為185645名,包含課程數量為52門。分析該MOOC平臺可知,約10000名用戶選擇課程為2-4門,一半以上的用戶僅選擇1門課程。52門課程中,部分課程開課時的學生用戶人數高達12542名,某課程開課時,聽課人數僅為13人。該MOOC平臺用戶選取課程時,具有較高的稀疏性,高效的智能信息推薦模型可有效改善MOOC平臺的課程選取稀疏性。

康乾南巡不僅將江南景觀仿建至北方,也將北方的建筑風格、造園藝術等元素帶到了江南。這一點突出表現在揚州五亭橋、白塔的建筑上。

統計采用本文模型為用戶提供智能信息推薦后,該MOOC平臺聽課人數變化情況,統計結果如圖1所示。

圖1 課程對應選課人數

采用本文模型前,MOOC平臺中的課程選課人數存在過高或者過低情況,本文模型可有效改善課程選取稀疏性過高的缺陷。采用本文模型后,不同課程選取人數均處于5000人-6000人之間,提升了MOOC平臺的選課均衡性。將本文模型應用于MOOC平臺中,可有效改善課程選擇過于稀疏的問題,課程對應選課人數有了明顯改善。采用本文模型實現課程的智能信息推薦后,用戶對于課程的選取較為均衡,有效避免MOOC平臺選課稀疏性的缺陷。本文模型所獲取的推薦結果可提升用戶對于課程知識的獲取情況,學習可依據自身興趣選取感興趣課程,通過良好的學習模式提升學生的學習興趣。

統計所提取不同用戶興趣點特征情況下,本文模型為用戶所推薦課程。本文模型為用戶推薦課程結果如表1所示。

表1 本文模型推薦結果

表1仿真結果可以看出,本文方法可充分挖掘不同用戶的興趣點,為用戶推薦用戶所需課程,實現智能信息的有效推薦。例如用戶興趣點為航空航天時,本文模型為該用戶推薦了航空航天技術概論、應用物理學等相關課程。本文模型可為用戶推薦與用戶興趣點極為相符的課程,具有較高的推薦有效性。

仿真過程中,設用戶點擊本文模型的推薦列表中的鏈接,表示用戶對智能推薦信息具有較高的感興趣程度,此時本文模型為智能信息推薦成功狀態。選取平均排序倒數作為本文模型智能信息推薦準確率的度量指標。平均排序倒數表達式如下

(13)

式(13)中,N與aij分別表示測試樣本數量以及i次推薦結果中,用戶首先點擊鏈接j的信息。用戶所點擊信息排序越前,所獲取的平均排序倒數值越高,此時該模型具有優越的智能信息推薦效果。

不同用戶會話數量時,本文模型的平均排序倒數結果如圖2所示。

圖2 平均排序倒數

圖2仿真結果可以看出,不同用戶會話規模時,本文方法的平均排序倒數均為0.7以上,有效驗證本文模型具有較高的智能信息推薦準確率。本文模型可有效獲取用戶的興趣點變化情況,用戶在不同的MOOC平臺使用日期時,均可獲取良好的智能信息推薦效果,驗證本文模型具有較高的推薦有效性,所獲取推薦結果與用戶需求極為接近。

選取折現累積收益(discounted cumulative gain,DCG)作為評估所構建智能信息推薦模型推薦性能的另一重要指標。折現累積收益是評估推薦模型排序結果質量的重要指標,該指標表達式如下

(14)

式(14)中,b(1+j)與rel(j)分別表示折扣因子以及第j個鏈接的相關度,n表示推薦鏈接在推薦結果中的排序結果。

采用本文模型為用戶推薦課程,不同課程類型時,本文模型的DCG指標結果如圖3所示。

圖3 DCG指標統計結果

圖3仿真結果可以看出,MOOC平臺為單用戶模式以及多用戶模式時,本文模型獲取的智能信息推薦結果均具有較高的質量。本文模型在單用戶模式以及多用戶模式下均具有較高的智能信息推薦性能,可應用于MOOC平臺智能信息推薦中。本文模型具有優異的推薦性能的主要原因是:本文模型利用基于本體的概念相似度計算方法實現MOOC平臺中海量信息的有效聚類,利用特征提取方法提取完成信息聚類后數據特征,利用所提取特征實現智能信息的有效推薦,提升本文模型的智能信息推薦性能。將本文模型應用于MOOC平臺中,可有效依據用戶興趣點為用戶推薦與用戶最相符的課程推薦結果,推薦有效性高。

4 結論

MOOC平臺伴隨大數據時代的到來,對智能信息推薦的要求更高。用戶興趣點存在較高的動態性,智能推薦模型的實時性極為重要。

通過所構建模型實現MOOC平臺的智能信息推薦,利用智能信息推薦結果提升學生的學習效率。所構建模型可有效解決以往智能信息推薦模型具有的數據稀疏性過高的缺陷,具有較高的智能信息推薦準確率。且該模型可依據用戶興趣點推薦用戶感興趣信息,不僅可應用于MOOC平臺中,同樣可應用于其它需要推薦的平臺中。仿真測試結果驗證所研究模型具有較高的智能信息推薦有效性,可滿足用戶的課程推薦需求。

猜你喜歡
本體聚類概念
Birdie Cup Coffee豐盛里概念店
幾樣概念店
學習集合概念『四步走』
聚焦集合的概念及應用
基于DBSACN聚類算法的XML文檔聚類
基于高斯混合聚類的陣列干涉SAR三維成像
基于本體的機械產品工藝知識表示
《我應該感到自豪才對》的本體性教學內容及啟示
一種層次初始的聚類個數自適應的聚類方法研究
自適應確定K-means算法的聚類數:以遙感圖像聚類為例
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合