?

基于機器學習的大學生網絡學習分析

2023-06-25 07:42劉冬鄰
現代信息科技 2023年7期
關鍵詞:網絡教學平臺

摘? 要:針對依靠大學網絡教學平臺的相關學習大數據,為教育管理者提供決策依據,為師生提供教學效果評估的需求,研究利用網絡教學平臺中的課程數據、學習過程數據、科目成績等數據,采用不同的數據處理和數據分析方法,對大學生網絡學習進行學習效果相關性分析、用戶聚類分析和學習效果預測。通過研究得到了大學生網絡學習效果的主要影響因素,不同類型學生的網絡學習行為特點,以及對大學生網絡學習效果進行預測的模型。

關鍵詞:網絡教學平臺;網絡學習分析;學習效果評估;高校決策

中圖分類號:TP311? ? 文獻標識碼:A? ? 文章編號:2096-4706(2023)07-0186-04

Abstract: Aiming at related learning big data which relies on university network teaching platform, the need of providing decision basis for education managers and evaluation of teaching effects for teachers and students, this paper studies to use the course data, learning process data, subject grades and other data in the online teaching platform, uses different data processing and data analysis methods, so as to analyze the correlation of learning effect, user clustering and predict the learning effect for college students' online learning. Through this research, the main influencing factors of college students' online learning effect, the characteristics of different types of students' online learning behavior, and the model for predicting college students' online learning effect are obtained.

Keywords: online teaching platform; online learning analysis; evaluation of learning effect; university and college decision-making

0? 引? 言

近年,高校教育信息化建設進入了發展的快車道,各種網絡教學平臺紛紛在大學落地,學校通過購買和鼓勵教師自建等方式,在平臺上建設了大量的專業學科課程,有選修、必修以及用于學生自主學習的各種學習課程和資源[1]。網絡教學平臺給大學生提供了一種不受時間、空間限制的學習模式。傳統教學形式的教學內容、教學過程等都由教師決定,教師可以通過統一的考試,對教學效果進行事后評估。網絡學習的學習形式,使學生成為學習的主體,教師很難及時、全面掌握學生的學習動態;更不能通過預測學生的學習效果進而改進課程內容設計、教學規劃、指導學生學習;學生也無法通過學習效果預測改進自己的學習安排和學習投入,從而改善學習效果預期[2]。

基于這些問題,本文以某高校MOOC網絡教學平臺中的“大學計算機基礎”課程為例,利用平臺中該門課程的數據、學生學習該課程的詳細過程數據、平臺使用日志數據、教務系統中的考試成績數據、機考系統中的具體考試數據等,研究使用基于機器學習和統計分析方法及數據可視化技術,對大學生網絡學習進行分析:分析各種學習行為與學習效果的相關性;對同一門課程的學習用戶,基于學習行為和學習效果進行聚類,分析每一類學生的學習特征;通過機器學習的CART決策樹算法,建立用戶分類決策樹模型并使用該模型對學生學習效果進行預測評估[3]。

1? 分析問題與分析目標

1.1? 基于網絡教學平臺的網絡學習

20世紀末,隨著Internet技術的發展和應用,網絡學習E-learning也迅速發展起來,此時的網絡學習指利用互聯網絡、學習內容網站、信息搜索引擎、遠程學習交流等技術的一種學習方式[4]。隨后,大規模開放在線課程慕課(Massive Open Online Course, MOOC)興起并迅速發展起來,國內大學也紛紛加入MOOC項目的建設。各網絡教學系統供應商也推出了各種MOOC網絡教學平臺如:中國大學MOOC,網易公開課——名校網課在線學習,超星學習通等網絡教學平臺。這些大學網絡教學平臺相較于傳統的授課和學習模式有如下幾個新特點[5]:

1)無時空限制:任何學生都可以在學校的網絡教學平臺上,選擇自己感興趣的課程學習;只要能上網,學習的時間和空間也不受任何限制。

2)自主學習:學生根據自己的興趣和實際情況,可以自由選擇學習內容、學習重點、學習資源,自由參與討論和問答,自主決定學習開始、結束時間,學習進度和復習鞏固的安排等。

3)靈活交互:學生和老師之間可以實時同步交互,也可以離線后以問答留言形式進行交互。

4)教學形式多樣:教師可以利用教學平臺,采用近似與傳統授課的模式直接進行網絡直播教學,也可以將授課錄制好,再結合其他課程資源做成網絡課程供學生使用。

1.2? 存在的問題

和傳統課堂授課相比,網絡學習的學習過程都是基于網絡在網絡教學平臺上完成的,是以學生為中心進行的,對學生的自主性和自覺性依賴更多,給網絡學習的管理和網絡學習效果的保證帶來了如下挑戰[6]:

1)學習效果無法保障:傳統教學過程中,教師通過在固定時間、地點進行集體教學,可以對學生的學習過程進行直接的觀察和監督;在網絡學習過程中,完全依賴學生的自覺性,老師無法掌握和監督學生在學習過程中的學習行為,學生的學習效果無法得到保障。

2)學習評價困難:傳統的教學中,教師通過學生平時的考勤、學習表現、作業完成、期末考試等綜合考核,可以得到比較客觀的評價結果;網絡學習雖然也有這些評價項和評價手段,但卻無法對學生的學習過程進行客觀、準確的評價、分析。

3)無法指導教學改革:由于無法對學生的學習效果和學習過程進行客觀評價,因此不能指導教學管理和教學改革,無法反饋給師生指導他們教與學的改進。

1.3? 網絡學習分析目標

基于以上存在的網絡學習當中的問題和網絡學習分析需求,結合網絡學習分析可得的數據源,本文基于大學網絡教學平臺進行的網絡學習分析的目標是:分析不同的網絡學習行為對課程學習效果的影響;基于網絡學習行為進行網絡學習用戶聚類分析,分析不同用戶類型的學習特征;構建用戶學習效果分類決策樹模型并用于對用戶的網絡學習效果進行預測。

2? 網絡學習分析數據與分析模型

2.1? 分析數據

分析數據主要包括:課程數據、學生學習課程的過程數據、平臺使用日志數據、機考系統中的具體考試數據等。

1)平臺使用:登錄平臺學習次數、瀏覽課程次數、學習課程外其他資源情況等。

2)課程學習:課程學習次數、視頻觀看次數、觀看時長、課程章節任務點及完成數等。

3)學習交互:課程評價次數、討論參與次數、提問次數、問題及結果查看情況等。

4)作業:課程作業數、作業完成及相應得分情況。

5)考核:課程單元測試、半期及期末考試。

2.2? 系統分析模型

針對網絡學習分析的分析對象、分析目的,從網絡教學平臺及相關系統數據源按照以上分析數據需求,進行數據采集、預處理并進行集成,選取需要的分析數據進行相關性分析,網絡學習用戶聚類分析,建立用戶學習行為分類決策樹并對用戶學習效果進行預測,指導師生的教與學。建立網絡學習分析模型如圖1所示。

3? 分析方法與過程

3.1? 相關性分析

通過對不同數據特征間的關系進行分析,發現針對分析目標的關鍵影響因素。這些方法有的可以快速發現特征之間的關系,如正相關、負相關或不相關;有的可以對特征間關系的強弱進行度量,如完全相關或不完全相關等;有的方法可以將數據間的關系轉化為模型,進而通過模型進行預測。

簡單直觀的相關性分析方法是將數據進行可視化處理,但這種方法在分析過程和解釋上過于復雜,在處理復雜一點的數據或者相關度較低的數據時就會出現問題。本文采用相關系數方法,針對大學生網絡學習行為的主要特征,計算特征間的相關系數。相關系數是反應特征之間關系密切程度的指標,相關系數的取值區間在1到-1之間。1表示兩個特征完全正相關,-1表示兩個特征完全負相關,0表示不相關,數值越小表示相關關系越弱。相關系數的計算:

3.2? 聚類分析

不同于分類算法要使用有類型標記的樣本組成的訓練樣本集,聚類算法是一種非監督學習算法。聚類分析是在沒有給定劃分類別的情況下,根據樣本的相似度或樣本間距離等方式進行分組的一種方法。分組的原則是組內樣本間相似性盡可能大,組間樣本間的差異盡可能大。聚類方法可分為基于劃分的聚類方法、基于密度的聚類方法、層次聚類方法、基于模型的方法等[7]。本文根據所分析的數據類型、數據量和分析任務,采用基于劃分的K-means聚類方法。

3.3? 決策樹分類預測

分類是為一個沒有添加類別標注的樣本預測其類標簽。分類器是一個模型或函數,對于給定的待分類樣本,能夠預測其類標簽。我們可以使用帶有正確類標簽的樣本即訓練集,建立這樣的分類模型。建立模型后,我們就能使用模型對給定的樣本進行自動分類預測。常用的分類模型有:決策樹、樸素貝葉斯概率型分類器、支持向量機、人工神經網絡等。

其中,決策樹算法產生的模型容易理解;可以方便地用圖形描述;計算量相對小,速度快。決策樹有ID3算法、C4.5算法和CART算法(Classification And Regression Tree,分類回歸樹)[8],本文即采用CART方法。

4? 大學生網絡學習分析

4.1? 學習效果相關性分析

本文在對“大學計算機基礎”這門課程的課程及學習數據進行探索分析后發現,老師們既有通過平臺進行網上直播或錄播形式進行教學,也有僅僅制作課程章節資料,提供給學生自主學習的。收集到的各個年級、各不同院系、班級的課程學習數據完整度、完成度都不一致,所以為了進行大范圍的學習效果評估、預測,我們選取了任務完成數、視頻觀看時長、學習次數、期末考試成績進行相關性分析,得到特征相關性矩陣如表1所示。

從特征系數矩陣看,任務完成數與期末成績的關系最大,其次是視頻觀看時長。因此,老師可以將重要內容用視頻等形式去呈現,同時加強對學生完成情況進行監督,從而改善學習效果。

4.2? 網絡學習用戶聚類分析

選取2020級本科新生學習數據,經過數據清洗和預處理后,采用K-means聚類方法,基于選取的主要網絡學習特征,對用戶進行聚類分析。通過將K設置為2、3、4、5、6分別進行聚類,并對聚類結果進行對比發現當K設置為3時,分類效果最佳。3個類別的用戶特征概率密度函數圖如圖2、圖3、圖4所示。

從概率密度圖2可知,類別1的同學基本都完成了30次的任務點學習,視頻觀看時長主要集中在120~300分鐘之間,學習次數在20~60次,少數超過60次,學習情況整體較好,基本完成學習任務。

從圖3分析:類別2的同學任務完成情況較差,絕大多數只完成了幾次,甚至沒有較完整的參與學習;視頻觀看時長很少超過150分鐘,多在100分鐘以下;學習次數主要分布在20次以下區間,很少超過50次,可知該部分同學平時學習任務完成情況較差,視頻觀看效果不佳,存在較大刷視頻的可能。

對某類用戶可以繼續結合其數據分布,如成績分布,對其學習行為進行分析。以用戶類別3為例,通過圖4能直觀分析出:該類用戶基本都完成了所有30個課程章節的學習;視頻觀看時長主要集中在200~450分鐘;學習次數也較多集中在50~100次,可以得出該部分學生的學習完成情況較好。針對該類學生的學習成績進行可視化分布分析如圖5所示。該類學生成績主要集中在80分以上分數段,這部分學生該門課程學習情況較好,學習效果也好。針對其他類型學生可以繼續進行這樣直觀的分析,得到更多有用的決策信息,從而輔助教學改進,指導教學改革。

4.3? 學習行為決策樹分類預測

利用CART決策樹算法進行分類預測,通過實驗比較,將決策樹深度設置為3,使用機器學習決策樹算法對2020級學生學習數據和期末成績等數據進行學習,得到網絡學習分析決策樹如圖6所示。在此基礎上,可以通過進一步的剪枝,簡化決策樹,使我們的決策規則更清晰,比如當學習次數少于85次,視頻觀看少于200分鐘時,期末考試不通過的概率就非常大,可以剪掉相應后續節點劃分,直接在此生成“需要加油”的葉節點。

對2021級學生的“大學計算機基礎”課程學習數據進行預處理,將最后考試結果離散化為能通過考試的和“需要加油”的兩類同學,利用已建立的決策樹分類模型進行期末考試結果預測,預測準確度達到91.2%。

5? 結? 論

本文利用大學網絡教學平臺的使用日志數據和大學生學習數據,選擇不同的分析方法和技術,進行了相關性分析、聚類以及決策樹分類預測。分析結果準確度高,能直觀反饋給不同的用戶使用:能幫助老師改進課程內容的建設和教學任務的安排、實施;能對學生學習結果進行預警評估,提高期末考試合格率;能為教學管理者提供豐富的教學質量管理和教學模式改革的決策依據。

今后可以繼續完善數據的記錄、收集,提高數據質量;針對不同分析需求將各種分析功能模塊化;提高分析模型準確度和模型泛化能力。

參考文獻:

[1] 劉冬鄰.高??蒲匈Y源的個性化融合推薦 [J].重慶大學學報,2022,45(7):122-130.

[2] 李衡.地方高校網絡教學平臺面臨的應用問題及對策 [J].教育與職業,2015(33):93-94.

[3] 韓錫斌,黃月,馬婧,等.學習分析的系統化綜述:回顧、辨析及前瞻 [J].清華大學教育研究,2017,38(3):41-51+124.

[4] 趙興龍.翻轉課堂中知識內化過程及教學模式設計 [J].現代遠程教育研究,2014(2):55-61.

[5] 趙磊,朱泓,吳卓平.中國高校MOOC建設情況及制度環境研究 [J].中國遠程教育,2019(10):64-73+91.

[6] 安穎.MOOC在中國高校發展的現狀、問題與對策 [J].高教探索,2015(9):38-41.

[7] 王改花,傅鋼善.數據挖掘視角下網絡學習者行為特征聚類分析 [J].現代遠程教育研究,2018(4):106-112.

[8] 范潔,楊岳湘,溫璞.C4.5算法在在線學習行為評估系統中的應用 [J].計算機工程與設計,2006(6):946-948.

作者簡介:劉冬鄰(1979—),男,漢族,重慶人,高級實驗師,工學碩士,主要研究方向:數據挖掘、機器學習。

猜你喜歡
網絡教學平臺
護理專業《醫學免疫學與病原生物學》THEOL網絡教學平臺構建初探
基于網絡教學平臺的對話式課堂建構與教學實踐
試論高校網絡教學平臺建設的研究與實踐
《電子商務網站實務》精品課程建設探討
基于網絡教學平臺的大學計算機教學改革探討
對信息時代高職高專外語課堂教學模式的探索
利用翻轉課堂促進高職英語教學初探
職業學校應用網絡教學平臺對提高教學質量的研究
分析如何構建基于現代學徒制和網絡教學平臺的中醫針灸人才培養模式
基于Moodle的國家開放大學網絡教學平臺探討與研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合