?

基于知識圖譜的學習資源推薦算法研究

2023-07-20 03:13劉旭暉
無線互聯科技 2023年9期
關鍵詞:學習資源知識圖譜算法

劉旭暉

摘要:互聯網的發展帶動教育逐步走向信息化,如何將信息化高效融入教育是現代教育一項重要的研究內容。信息時代背景下,學習者在使用網絡資源時,容易產生信息過載的問題,使學習者無法準確地獲取想要的內容。文章提出了基于知識圖譜的學習資源推薦算法,該算法利用信息技術對學習資源進行精準定位,找到學習者和資源之間的匹配關系,快速地篩選出最有價值的學習資源,避免學習者產生信息認知迷航。

關鍵詞:知識圖譜;學習資源;算法

中圖分類號:TP391

文獻標志碼:A

0 引言

隨著互聯網技術及信息技術的發展,大數據時代來臨,社會中的信息量呈爆發式增長。信息時代下,學習者在使用網絡資源的過程中,面對大量的數據信息,易產生信息過載、認知迷航等問題,使學習者無法準確地獲取想要的知識內容。針對這個問題,研究者們提出了個性化推薦系統,該系統通常是根據用戶的歷史交互信息等,獲取潛在的興趣偏好來推送相關內容。然而,基于協同過濾的推薦算法僅根據對用戶項目交互信息的分析構建用戶-項目評分矩陣,來完成后續算法進行興趣推薦,這往往存在數據的稀疏性問題和冷啟動問題1。面對海量的知識信息,學習者如何利用信息技術對學習資源進行精準定位,找到學習者和資源之間的匹配關系,快速地篩選出最有價值的學習資源,避免學習者產生信息認知迷航、冷啟動等亟待解決的問題。

1 相關理論及技術

1.1 學習資源推薦

學習資源推薦主要分兩個步驟完成:先是建立學習者模型和資源推薦模型,然后通過合適的推薦算法對兩個模型進行匹配,以完成學習者獲取學習資源2。目前的學習資源推薦策略主要包括基于內容的推薦、基于深度學習的推薦、協同過濾推薦、基于網絡結構的推薦和基于關聯規則的推薦等。這些推薦算法均存在數據的稀疏性問題或冷啟動問題,造成問題的原因是算法忽視了知識的邏輯性。

1.2 知識圖譜

近年來,越來越多的應用程序把數據結構設計為知識圖譜(Knowledge Graph, KG)的形式,這種形式包含實體與實體之間的鏈接,建立項目與屬性之間的聯系,其目的是提高推薦系統傳遞給用戶信息的準確率,縮小用戶的選擇范圍,以便用戶做出更快、更優的選擇,從而提高用戶的信任度2。在結構方面,知識圖譜是由節點、邊兩大要素構成,每條知識有兩種表示方式,可以表示成<實體, 實體關系, 實體>,也可以表示為<實體, 屬性, 屬性值>的三元組, 然后將所有數據組織成一張有向圖的學習資源。推薦方法基本上分為兩大類:基于本體的推薦生成和基于開放鏈接數據的推薦生成。知識圖譜的技術研究主要分為知識抽取、知識融合、知識推理、知識圖譜應用4個階段3?,F階段,在基于知識圖譜的學習資源推薦算法中,擁有比較豐富的知識關系和語義信息的圖譜容易受到研究者的青睞4。

2 基于知識圖譜的學習資源推薦算法分析

傳統的學習資源推薦算法,對于知識邏輯的認知存在一定欠缺,也忽視了邏輯的重要性,而本文提出的推薦算法將知識圖譜的相關信息融入算法,不僅能夠實現對學習者所需學習資源進行關注,還能充分考慮到學習者所需的其他相關知識內容,使推薦算法具有更強的邏輯性。這種算法對推薦系統中的“冷啟動”問題也做出了相應的改進。

2.1 用戶興趣和資源相似度的計算方式

用戶興趣和資源相似度包含的范圍比較廣泛,同時也涉及許多具體的算法。本文將不同用戶的興趣特點作為關鍵詞,能夠使各項數據更加集中,將用戶特征更為明顯地體現出來。

由于數據集的限制,因此使用詞向量計算文本的相似度,即用戶興趣與資源的相似度。相似度定義如下:

U,u,N(u),|N(u)|分別表示用戶集合、目標用戶、當前用戶使用過的歷史資源集合用戶歷史學習資源集合的數。通過上述公式可以計算用戶興趣與資源的相似度,可以看出,當相似度的值越高,學習資源與用戶的學習需求、學習興趣等的匹配度越高,該資源就越值得向用戶推薦。

2.2 知識連接度

在對用戶進行學習資源推薦的過程中,應當盡量選擇符合用戶特點和用戶需求的資源,這類學習資源既包括具體的知識點,又包括用戶自身對知識點的認知情況,這些知識點之間的連接越緊密就越值得被推薦。

在知識圖譜中,通常用k1和k2對任意知識點進行表示,k1和k2之間的最短距離則為ShortestPath(k2,k1),公式定義為:

知識點k2到k1的知識連接度的公式定義為:

從上述公式可以看出,當路徑越小時,知識連接越緊密,同時知識點的連接度就比較大。

2.3 需求分析

(1)數據采集、處理與存儲。想要為用戶提供更加精確的學習資源推薦就應當提高數據采集、處理和儲存的能力。系統需要對用戶進行采集的信息有課程知識圖譜、課程資源數據、交互數據等;通過系統對數據的處理分析可以使學習資源的推薦變得更加精確化。

(2)用戶管理功能。用戶管理主要針對的是用戶個人信息部分的管理,因此系統需要為用戶提供注冊、登錄、注銷等功能,從而形成用戶單獨的學習資源庫,并保障用戶信息安全。

(3)資源展示功能。用戶在學習的過程中,除了對當前所學知識進行關注外,還存在對其他相關學習資源與信息進行獲取的需求,因此系統應當實現對學習資源的展示,為用戶提供更多的選擇,例如通過主頁展示熱門資源、通過推薦頁展示個性化資源等。

2.4 初學者推薦算法的策略

上述算法主要針對系統的老用戶,這類用戶在系統內已經存在相關的歷史數據信息,因此可以直接應用用戶數據來完成學習資源的推薦。然而還有許多第一次使用系統的新用戶,系統無法提供任何有效數據,這就涉及“冷啟動”的問題。在“冷啟動”的情況下,系統沒有辦法直接對用戶的知識水平、知識需求、興趣愛好等做出有效的分析與判斷,因此需要進一步提出新用戶的推薦策略5。

本研究對于“冷啟動”問題的處理是通過用戶自主提供和選擇的信息來完成學習資源的合理推薦。當初學者輸入關鍵詞后,知識圖譜就能夠完成匹配度的計算,以關鍵詞為中心向其他知識內容進行擴散。由于從關鍵詞擴散的知識點內容比較廣泛、資源比較繁多,系統可以從擴散的知識點中選擇重點知識,建立該用戶的知識庫,再將與知識庫資源相似度較高的知識點進行針對性推薦。初學者推薦模型流程如圖1所示。

3 試驗與分析

本研究的推薦算法選取機器學習方面的資源-用戶數據,這是由于開始建立的算法基礎是創建在機器學習知識的圖譜上。在實施過程中會產生實體識別誤差和實體誤差,這對于推薦的準確度會產生一定的影響。因此,選取的數據應該是在構建知識圖譜數據庫集過程中就已構建好的資源知識庫。

3.1 數據預處理

本實驗的數據來源于某圖書城,數據集包含標簽為“建筑電氣”的全部圖書信息的用戶數據,選取的有效數據集包含:198本圖書,8 569個學習者,12 851條學習者-圖書的行為數據。數據的稀疏度可以計算為:

1-1251/(8 569×198)=0.992 4

從上式計算結果來看,所產生的數據非常的稀疏。

3.2 試驗過程

(1)在知識圖譜的構建過程中,要建立資源知識庫,每一個資源都維系著一個知識點的列表。

(2)形成學習者認知知識庫,該庫實際上是根據學習者的歷史行為,由歷史資源列表中每一個資源所包含的知識面實體和知識點實體形成的集合。

(3)采用合適的知識圖譜推薦算法計算各種資源和學習者之間的連接度,選取連接度最高的多個資源,將其組成推薦列表推薦給學習者。

3.3 試驗結果與分析

在推薦算法模型的建立過程中,使用參數s進行加權融合,1>s>0,參數s也表示了學習者興趣相似度和知識連接度的重要程度。本研究通過多次試驗確定了s的取值,如圖2所示為推薦系統在不同的s值下的表現情況。

試驗數據表明當K=5時,效果最好。當K=10,K=20,K=50時,推薦系統的性能會隨著不同的s值先增加后下降,當s值在0.6~0.8時值最高。當0.2>s>0.1以及0.8>s>0.6,推薦系統性能都達到了最優。在數據集中包含所有標簽為“建筑電氣”的數據集,當下較為受歡迎的書籍有相關設計及電氣工程施工類的,這類書籍的知識內容較多、知識面廣,但是不是特別深入。高職學生在學習該領域的知識時會選擇這類圖書作為啟蒙學習資源,因此這類資源推薦文本的相似度比重就非常高。這也正好驗證了,當0.2>s>0.1時,推薦系統的推薦效果較好的原因。通過綜合對比,最終確定了s值為0.7時達到最優,推薦的準確率最高。

當s值為0.7時,通過對推薦準確率、召回率和覆蓋率試驗數據結果進行分析,采用傳統的基于用戶的協同過濾和基于物品的協同過濾與本文提出的推薦算法的協同過濾結果進行對比,本文提出的基于知識圖譜的協同過濾推薦算法在推薦效果上比另外兩種推薦算法要好。而且相對于學習資源和學習者興趣的相似度,各個知識之間的連接度對推薦學習資源都具有更好的效果,這也充分說明了學習資源的推薦中一項重要的內容是根據知識之間的關系,這也是研究者關注的重點內容。

4 結語

互聯網的快速發展推動了教育逐步走向信息化,學習者在使用學習資源的過程中,容易產生信息過載的現象,學習資源推薦技術是解決這一問題的有效途徑?;谥R圖譜的學習資源推薦算法,本研究傾向于考慮知識點之間的關系,不但考慮學習者愛好學習什么,而且充分考慮學習者可能接觸到什么知識,該算法不依賴學習資源的交互。隨著推薦技術研究的不斷深入,各類推薦算法爭奇斗艷,推薦算法將更加優化,以提高推薦的精準性。

參考文獻

[1]譚樂平,楊夏.基于知識圖譜下的艦船電子信息協同推薦算法[J].艦船科學技術,2020(14):166-168.

[2]李其娜.基于知識圖譜的《數據結構》個性化習題推薦系統研究與實現[D].桂林:廣西師范大學,2020.

[3]張迪.基于知識圖譜的教學資源推薦方法研究[D].武漢:華中師范大學,2019.

[4]王冬青,殷紅巖.基于知識圖譜的個性化習題推薦系統設計研究[J].中國教育信息化,2019(17):81-86.

[5]常亮,張偉濤,古天龍,等.知識圖譜的推薦系統綜述[J].智能系統學報,2019(2):207-216.

(編輯 沈 強)

Research on learning resource recommendation algorithm based on knowledge graph

Liu Xuhui

(Hunan Urban Construction College, Xiangtan 411101,China)

Abstract: With the development of the internet, education is gradually moving towards informationization. How to integrate informationization into education efficiently is an important research content of modern education. Under the background of the network era, learners are prone to problems such as information overload and massive content in the process of using network resources, which makes learners unable to accurately obtain the knowledge content they want. This paper proposes a learning resource recommendation algorithm based on knowledge graph, which uses information technology to accurately locate learning resources, find the matching relationship between learners and resources, and quickly screen out the most valuable learning resources to avoid the learners information cognitive trek.

Key words: knowledge map; learning resources; algorithm

猜你喜歡
學習資源知識圖譜算法
基于MapReduce的改進Eclat算法
Travellng thg World Full—time for Rree
進位加法的兩種算法
基于新技術環境下的自主學習
中等職業教育中教育技術的應用研究
從《ET&S》與《電化教育研究》對比分析中管窺教育技術發展
一種改進的整周模糊度去相關算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合