?

我國學習資源個性化推薦研究進展

2015-03-02 03:13潘澄,陳宏
現代教育科學 2015年2期
關鍵詞:個性化學習者資源

作者簡介:潘澄(1987- ),男,浙江工業大學教育科學與技術學院碩士研究生。研究方向:教學信息化;

陳宏(1984- ),男,浙江工業大學教育科學與技術學院,講師。研究方向:教學信息化。

基金項目:本文系全國教育科學規劃課題教育部重點項目“工作過程導向的項目課程教學設計及其網絡學習環境研究”的研究成果之一,項目編號:DCA090318。

在互聯網技術飛速發展的今天,互聯網的應用變得越來越廣?;ヂ摼W在改變人們生活方式的同時,也給教育帶了巨大的變革,以數字化、媒體化等為特點的信息技術在教育領域得到廣泛應用,網絡已然成為人們獲取知識和信息的重要途徑之一。越來越多的人開始使用網絡進行學習,因為網絡教育打破了傳統教育時間、空間上的限制,給教學過程帶來了很大的便利,網絡提供了大量的學習資源,這些豐富的資源把教師和學生緊緊聯系在一起。教師可以使用豐富的教育資源進行授課,學生則可以減輕課業負擔,網絡教育正逐漸變成一種新型的教育模式。但與此同時,孫榮通過分析全國20所985高校的情況發現,隨著學校教育信息化改革的深入,各校均催生了數量可觀的網絡學習資源,但卻沒有有效的整合管理,使學習者在海量的教育資源中查找所需的學習資源也變得越來越困難,大大降低學習者的學習興趣。 ①

為了解決學習資源查找困難的問題,學習資源的個性化推薦技術應運而生。資源的個性化推薦,是指通過數據挖掘、分析學習者的個性化特征,發現學習者的需求,自動地向學習者提供其可能感興趣的教育資源,學習者無需過多地參與推薦的過程,使學習者在使用資源時更加便捷,大大縮短了學習者尋找教育資源的時間,減少了學習者尋找所需資源所付出的代價。我國《教育信息化十年發展規劃(2011- 2020)》中指出,要加快推進信息技術與教學融合,提高教學信息化水平,探索建立以學習者為中心的教學新模式。教育資源的個性化推薦技術作為一項智能化信息技術,能夠有效解決海量數據所帶來的資源查找困難問題,使學習者對資源的被動接收,逐漸轉變為資源對學習者的主動推送,近年來已經越來越受到研究人員的關注,正在成為教育信息化和人工智能方面重要的課題和研究熱點。本文以學習資源、教育資源、個性化、推薦等為主題,對2004年至2014年這十年間發表的核心期刊文獻進行檢索,對推薦過程中的三個要素用戶研究、對象研究及推薦策略研究進行總結分析,以期讓相關研究人員對學習資源推薦技術有更深入的了解,對之后的研究起到借鑒作用。

一、用戶研究

推薦技術中對用戶的研究主要是針對用戶建模方面,用戶建模是個性化推薦的一個重要核心,用戶模型的好壞會直接影響到個性化推薦的質量。用戶模型是一個用來描述用戶需求的模型,是為了讓計算機系統知道用戶需要什么樣的學習資源,或者用戶可能對什么樣的學習資源感興趣。為了能夠準確地描述用戶的需求信息,就需要從用戶的信息中設法提取出用戶的需求特征,其中包括用戶的顯式信息和用戶的隱式信息兩個方面。

(一)用戶顯示信息

用戶的顯式信息又可以分為用戶基本信息和用戶交互信息兩類?;拘畔⑹俏覀冏顬槌R姷?,通常是一些能夠說明學習者基本情況的特征,如興趣、愛好、專業、教育經歷等等,特點在于直觀且方便收集,得到的信息也會相對比較全面,但是此類信息通常存在很大相似性,區分度不夠,很難得到較好的個性化推薦。而用戶交互信息是學習者在使用學習平臺中主動給出的信息,如對學習資源的評分、評價等等。如2008年,陳悅通過收集學習者對使用過的學習資源進行評分,來構建學習者基于興趣的特征向量,并以此對學習者進行分組,實現同組內端對端的學習資源個性化推薦。 ②2010年,姜強等人利用felder- silverman學習風格量表獲得學習者學習風格,并利用累計計分估算學習者認知水平,將兩者相結合來描述學習者模型,實現個性化的推薦。 ③隨著測評技術的發展,熊玉珍2012年通過分析學習者漢語測評數據,來構建漢語學習者模型,從而制定個性化的學習目標、學習內容、學習資源及學習路徑,來滿足漢語學習者的個性化需求。 ④這一類的方式能夠相對準確體現學習者的需求,結果也相對可靠,但是實行起來可能相對效果不佳,一方面大部分學習者不愿花費時間去做測試,用以表達自身的興趣偏好,另一方面,學習者的興趣可能隨時間變化, ⑤使得該方法沒有很好的實時性。因此也有人提出,在學習者興趣模型中加入時間因素,讓興趣權重因時態變化而變化,來提高模型的時效性。 ⑥

(二)用戶隱式信息

隱式信息的獲取是通過學習系統或平臺追蹤學習者的行為,來分析和推測學習者的興趣偏好,如瀏覽頁面、停留時間、搜索查詢、點擊鼠標及文本標記等等。王志梅等人在2006年提出為學習者構建學習狀態評估矩陣,通過分析學習狀態來發現相似學習者,并分配至同一學習社區進行交流及資源推薦。 ⑦2008年,孫超等提出利用agent收集和分析學習者的學習行為,生成學習者的興趣模型。 ⑧2009年,劉志勇等通過學習者瀏覽行為和評價信息進行語義相似度分析,尋找近鄰學習伙伴,同時引入學習對象的概念,降低計算的復雜度。 ⑨2013年,王萍等在語義分析的基礎上引入本體概念,對學習者進行建模,提高學習資源推薦效果。 ⑩隱式的信息搜集,其優點在于不需要學習者的參與,不會影響學習者的學習活動,能夠較為客觀地反映學習者的偏好信息,但一些不良的操作習慣也容易使學習者的偏好分析出現偏差, ?同時,學習行為的跟蹤也要適度,否則容易引起學習者的反感,從而放棄對推薦系統的使用。

二、對象研究

所謂對象研究,指的是針對推薦內容的研究。因推薦技術應用到不同領域,所針對的推薦對象會有所不同,則對象的特征也會不盡相同,所以對推薦對象進行建模,準確地描述推薦對象也是推薦技術中重要的組成部分。在教育領域,存在著文本、音頻、動畫、視頻等等多種形式的推薦對象。為了較好地描述對象特征,就需要將這些對象區分開來建?!,F今比較流行的方式有兩種:一是將對象內容進行分析,二是將對象進行分類。

(一)對象內容分析

內容分析方法是通過對對象的內容進行特征分析,提取出有用的特征信息。通常對于文本類型的對象,會采用內容分析的方法來提取該對象的特征信息形成特征向量,因此常常會涉及到相關文本處理技術。2014年,徐守坤等人將本體概念引入到學習資源的描述中,通過語義推理改善中文多詞一義、一詞多義等問題。 ?張海東等人利用空間向量和馬爾科夫鏈構建學習資源模型,并利用TF- IDF算法提取學習資源的特征內容,來優化學習資源模型。 ?提取文本對象特征信息的技術相對較為成熟,但網絡上的學習資源往往并不只是文本資源。

(二)對象內容分類

另一種方式是通過內容分類來提取對象的特征信息,通常用在一些非文本類的資源,如視頻、動畫等,以便將同類的資源推薦給感興趣的學習者。具體類別的生成可以是人為預先進行定義,也可以通過聚類算法自動生成。王萍在2008年,在分析社會化標簽系統中的e- learning標簽數據集的基礎上,通過社會化標簽來發現學習資源的相似性,為學習者提供推薦。 ?2014年,白雪等人通過使用社會化標簽對網絡學習平臺上的教育資源進行管理,并以此構建推薦模型。 ?葉海智等人使用K-均值聚類方法對學習資源進行分類,從而篩選出優質的學習資源。 ?因此,這一類方法的精度很大程度上取決于聚類的優劣。 ?要做到既不推薦學習者過于類似的學習資源,也不讓學習者瀏覽過于不相關的學習資源,是該類研究的一個難點。

三、推薦策略研究

推薦策略研究主要是圍繞個性化的推薦過程中的推薦算法或推薦策略,是整個推薦系統的關鍵所在。自個性化推薦概念被提出以來,一直是國內外研究人員爭相研究的重要課題,因此也形成了一些主流的推薦算法,如基于內容的推薦、基于關聯規則的推薦、基于知識的推薦、基于效用的推薦、協同過濾推薦及組合推薦等等。

(一)基于內容的推薦

基于內容的推薦技術是比較早被提出來的一種推薦技術,它同時也是信息過濾技術的一個發展?;趦热莸耐扑]技術,是利用資源本身的特征屬性對資源進行建模,然后通過兩個方面向用戶進行推薦。首先,是通過對用戶信息模型和資源特征模型進行對比匹配,根據相似度來向用戶進行推薦;另一方面,通過將資源特征模型進行對比分類,將用戶已經評分或評價的同類資源推薦給用戶。2007年,李永等人采用矢量空間模型來描述用戶興趣模型和資源模型,通過余弦相似度來計算資源的推薦度。 ?

基于內容的推薦技術的優點在于,不依賴學習者行為信息,新的學習者在沒有任何評價的情況下,也可以向其推薦資源,同時,一些沒有學習者評分或評價的資源也可以在匹配的情況下得到推薦。因此,也可以看出基于內容的推薦方法有著推薦結果直觀的特點, ?容易向學習者解釋為什么向其推薦該資源,增強學習體驗。但該推薦技術也存在著局限性,因為其對資源特征的建模,是通過對資源進行內容分析、特征詞信息抽取等來完成,不容易推薦新穎的資源, ?同時,其推薦文本資源就比較容易,但音頻、視頻等這類多媒體資源就很難抽取特征信息,較難產生精確的推薦。

(二)基于知識的推薦

基于知識的推薦在一定程度上可以當成是一種推理方法,即使用功能知識進行推理的過程。所謂功能知識,就是某個資源如何滿足特定用戶需要的知識?;谥R的推薦,是通過任意能夠支持推理的知識來進行分析推薦,這些知識并不一定是用戶的偏好信息,也可以是用戶規范化的查詢,或者是詳細的用戶需求等。2005年,郝興偉通過知識點圖來管理教育資源,并由此構建推薦模型。 ?2006年,盧修遠等通過概念圖映射網絡課件與學習資源庫的基礎上,利用agent實現基于知識的學習資源推薦。 ?劉先鋒等人在2009年提出基于Bayesian知識推理網的學習資源推薦,通過Bayesian網推薦給學習者最合適的學習資源和教學方法。 ?

基于知識的推薦能夠把學習者對資源的需求映射在資源上,能夠同時考慮一些非資源屬性,從而更好地對資源進行篩選,得到更精準的推薦。但知識容易存在領域的局限性, ?且這些知識并不容易挖掘。隨著時間的變化,學習者的需求可能會發生一些變化,但知識結構是靜態的,從而會導致推薦也是靜態的。

(三)基于關聯規則的推薦

關聯規則算法是數據挖掘領域中的一類重要算法,是描述兩個或者多個屬性之間某種潛在的特征關系規則。早在1993年,R .Agrawal等人首次提出了挖掘顧客交易數據中項目集間的關聯規則問題,目的是要挖掘出用戶的行為規則,即顧客購買某種商品的同時會傾向購買另外一種商品。關聯規則的推薦大致分為兩個步驟,第一步,是挖掘及制定一系列的規則,然后利用規則來分析計算資源間的關聯性;第二步,是通過分析用戶的行為及偏好,然后根據事先制定的規則向學習者進行推薦。2007年,王燕等利用Apriori算法在數字圖書館中構建推薦系統,通過關聯規則的方式挖掘頻繁項集進行學習資源的推薦。 ?陳祖琴等人在傳統關聯規則挖掘算法的基礎上,提出加權形式的關聯規則挖掘技術,來得出一種適用于推薦相關文獻的算法。 ?

關聯規則推薦技術的優點在于,不需要領域的相關知識,也可以挖掘出學習者新的或者潛在的興趣點。但該技術也存在著一些問題,比如當資源名存在同義性的時候,規則就很難區分判斷; ?隨著時間推移,關聯規則會變得越來越多, ?也就會變得越來越難以維護;關聯規則是通過大量的挖掘數據中的共同行為,然后設置學習者所能接受的最低閾值來制定規則,這在一定程度上也降低了個性化的程度。

(四)基于效用的推薦

基于效用的推薦是建立在用戶使用資源的效用情況下進行的,因此,用戶信息模型及資源模型很大程度上是由所使用的效用函數來決定的,其核心問題是如何為每一位用戶創建一個效用函數。該方式在電子商務網站應用較多,在教育領域應用相對較少,究其原因可能是因為商品擁有較多的內在屬性及外部屬性, ?能夠更好的創建效用函數。

基于效用的推薦技術優點在于把資源的非自身屬性,比如資源上傳者的可靠性、審核者的可靠性等等,也納入到效用函數的參數中,使系統在做決策時考慮更多的因素,提高效用計算能力,從而提高推薦的質量,使推薦更具個性化。也正是因為效用函數的設計要考慮用戶、資源的特征屬性及非資源自身的屬性,導致效用函數并不具有通用性,所以基于效用的推薦通常也只適合某個特定的環境。

(五)基于協同過濾的推薦

協同過濾推薦是現今研究較多的個性化推薦算法。協同過濾技術主要分為兩類:一類是基于用戶的過濾,另一類是基于項目的過濾。在協同過濾技術中,用戶被要求對使用過的資源進行評價,然后系統收集用戶的評價信息。根據系統收集到的用戶評價信息,可以形成一個m×n的用戶—資源矩陣,其中m代表用戶總數,n代表資源總數。通過這個矩陣就可以進行相似用戶或相似項目的計算,從而尋找到該用戶的近鄰伙伴集合或鄰居項目集合,再從近鄰伙伴或項目的信息中得出對當前用戶的推薦資源。2006年,黃曉斌分析了協同過濾技術的原理及特點,并論述了協同過濾技術在數字圖書館中應用的必要性。 ?孫守義在2007年,通過協同推薦技術挖掘圖書館用戶的大量借閱記錄,來向學習者進行圖書資源推薦。 ?2012年,王永固等人將協同過濾推薦技術應用到在線學習中,并在傳統協同過濾技術的基礎上加入隱式評分機制來改善協同過濾的冷啟動問題。 ?

協同過濾推薦的好處在于學習者不依賴于資源的內容及其形式,這一特點讓該技術有很好的普適性,對音頻、視頻這類較難抽取出特征信息的資源也能有較好的推薦效果。協同過濾技術是在分享鄰居學習者經驗的基礎上進行推薦,容易發現學習者的潛在的新興趣點。雖然隨著時間的推移,學習者評價數量的上升,可以不斷提高系統的性能,但同時也會存在算法復雜度大幅上升的問題,也可以看出該算法比較依賴學習者數據,所以會存在評價稀疏問題及新的學習者推薦難的問題。 ?

(六)其他推薦策略

前面提到的各種推薦技術在實際應用中都會在不同程度上存在著一定的不足,為了彌補這些缺陷,研究人員漸漸開始使用混合推薦技術。所謂混合推薦也稱組合推薦,指的是為了獲得較好的推薦結果,根據實際情況將不同的推薦技術組合起來使用。結合的方式通常有三類:針對不同的學習者使用不同的推薦策略;針對不同的學習資源使用不同的推薦策略;針對所有學習者和所有學習資源,使用混合的推薦策略來進行推薦。最典型的就是將協同過濾推薦技術與內容推薦技術進行組合,利用內容推薦來改善協同過濾技術的冷啟動問題,如楊麗娜等人以協同過濾推薦為主,內容推薦為輔來構建虛擬學習社區的資源推薦,來提高社區資源的使用效果和效率; ?在后繼的提升數字學習資源推薦效果研究中,對個體學習者和群體學習者使用不同的推薦策略,并引入意見領袖概念,向社區學習者推送資源。 ?2013年,劉旭東等人為了能從多角度向學習者推薦學習資源,在協同過濾技術的基礎上配合使用周排行、眾數法推薦策略,來提高學習資源個性化推薦的精度和效率。 ?2014年,孫眾等人在探索數字化教材推送策略中,通過教師引導推薦、系統自動推薦和學習者定制資源三個方式相結合,來設計資源推薦模型。 ?

當然,也有很多研究人員不滿足現有的一些推薦技術,探索研究更好的推薦技術。如,袁靜等人通過學習者情景信息和學習資源情景信息, ?來改善學習者體驗,提高推薦精確性。2014年,楊超提出基于粒子群優化算法的學習資源推薦策略,幫助學生從海量的學習資源中挑選合適自己的學習資源。 ?唐瑤等人從聯通主義的角度分析,提出利用人的智慧進行內容的策展,方便學習者獲得優質學習資源,緩和信息過載問題。 ?

四、熱點及展望

本文對學習資源推薦技術在國內的研究進行回顧,并總結了學習資源推薦技術的最新研究進展,重點分析了各學習資源推薦策略的特點、優勢及不足。希望本文的研究工作能促進學習資源推薦技術的研究人員對推薦系統各個技術的優劣有個更深入的了解,并根據實際情況,選擇合適的策略進行進一步研究。

隨著大數據時代的到來,學習資源推薦技術也在飛速的發展,也出現了一些值得關注的熱點問題,以及未來可能成為研究熱點的問題。這些問題的解決對學習資源推薦技術的研究具有非常重要的意義。主要有以下三個方面:

1.混合推薦策略。通過分析發現,當前學習資源推薦技術的研究主要集中在推薦策略的研究上,而近幾年,因為單一推薦策略應用存在一定局限性,研究人員紛紛開始設計混合推薦策略來改善推薦效果,因此,混合推薦策略已逐漸成為當前研究的一個熱點。

2.學習者隱私保護。學習資源推薦技術的本質是通過挖掘學習者現有的一些個人資料,使用習慣等等方面的信息來挖掘學習者的興趣、偏好信息。雖然學習者希望得到合適的推薦,但保護個人隱私必然是前提。所以,推薦系統要做到在保護學習者個人隱私的前提下,盡可能少地利用隱私信息來給出準確、有效的推薦。

3.推薦系統安全。隨著推薦技術應用變得廣泛,也不乏出現一些惡意的用戶,通過捏造與實際不符的評價信息來故意推舉或者打壓某些資源,對推薦系統進行誤導,我們稱之為推薦攻擊。而針對推薦攻擊的預防、檢測方面的研究還非常之少。

注釋:

①孫榮,孟凡立,張慰.論數字校園環境下高校教學資源的整合運行策略[J].現代教育技術,2012,05:46- 51.

②陳悅.基于興趣特征向量的端對端仿真學習社區研究[J].計算機仿真,2008,08:283- 286.

③姜強,趙蔚,杜欣等.基于用戶模型的個性化本體學習資源推薦研究[J].中國電化教育,2010,05:106- 111.

④熊玉珍.基于測評的漢語個性化學習環境的構建[J].電化教育研究,2012,03:69- 71+87.

⑤涂金龍,涂風華.一種綜合標簽和時間因素的個性化推薦方法[J].計算機應用研究,2013,04:1044- 1047+1054.

⑥荊永君,李兆君,李昕.基礎教育資源網中個性化資源推薦服務研究[J].中國電化教育,2009,08:102- 105.

⑦王志梅,楊帆.基于相似學習者發現的資源推薦系統[J].浙江大學學報(工學版),2006,10:1688- 1691+1791.

⑧孫超,蔣波.基于Agent和推薦技術的網絡教學模型研究[J].鄭州大學學報(理學版),2008,03:84- 87.

⑨劉志勇,劉磊,劉萍萍等.一種基于語義網的個性化學習資源推薦算法[J].吉林大學學報(工學版),2009,S2:391- 395.

⑩王萍,劉玲.基于PaaS云模式的學習推薦系統研究[J].中國教育信息化,2013,03:78- 81.

?趙捧未,李春燕,竇永香.語義對等網環境下基于節點知識地圖的用戶模型構建[J].情報理論與實踐,2012,02: 104- 108.

?徐守坤,孫德超,石林等.基于語義推理的學習資源推薦[J].計算機工程與設計,2014,04:1496- 1501.

?張海東,倪晚成,趙美靜等.面向基礎教育階段的教學資源推薦系統[J].計算機應用,2014,11:3353- 3356+3364.

?王萍.基于自由分類法的elearning標簽研究[J].中國遠程教育,2008,10:65- 70.

?白雪,趙蔚,姜強等.基于標簽的教育資源管理與推薦模型構建——來自社會化標注網站的啟示[J].現代教育技術, 2014,05:96- 102.

?葉海智,程清杰,黃宏濤.K-均值算法支持的優質網絡學習資源篩選方法研究[J].中國遠程教育,2014,10:62- 66+96.

?王艷,景韶光,李雪耀等.基于分類方法的內容過濾推薦技術[J].情報雜志,2005,08:59- 60+62.

?李永,徐德智,張勇等.VRE中基于內容過濾的論文推薦算法[J].計算機應用研究,2007,09:58- 60+89.

?李忠俊,周啟海,帥青紅.一種基于內容和協同過濾同構化整合的推薦系統模型[J].計算機科學,2009,12:142- 145.

?姜書浩,薛福亮.一種利用協同過濾預測和模糊相似性改進的基于內容的推薦方法[J].現代圖書情報技術,2014,02: 41- 47.

?郝興偉,蘇雪.E- learning中的個性化服務研究[J].山東大學學報(理學版),2005,02:67- 71+91.

?盧修元,周竹榮,奚曉霞.基于WC- C- R學習資源推薦的研究[J].計算機工程與設計,2006,23:4461- 4464.

?劉先鋒,丁繼紅,朱清華.Bayesian網知識推理在ITS學習推薦中的應用研究[J].計算機工程與應用,2009,01:220- 223.

?謝芳,王波.基于關聯規則個性化推薦的改進算法[J].計算機應用,2006,S2:149- 151.

?王燕,溫有奎.基于關聯規則的推薦系統在數字圖書館中的應用[J].情報科學,2007,06:877- 880.

?陳祖琴,張惠玲,葛繼科等.基于加權關聯規則挖掘的相關文獻推薦[J].現代圖書情報技術,2007,10:57- 61.

?張佳樂,梁吉業,龐繼芳等.基于行為和評

(下轉37頁)

猜你喜歡
個性化學習者資源
基礎教育資源展示
你是哪種類型的學習者
一樣的資源,不一樣的收獲
堅持個性化的寫作
十二星座是什么類型的學習者
青年干部要當好新思想的學習者、宣講者、踐行者
資源回收
新聞的個性化寫作
資源再生 歡迎訂閱
上汽大通:C2B個性化定制未來
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合