?

大數據挖掘班級薄弱點的軟件實現

2020-08-31 18:11嚴劍陳粵暉韓建保姚穎筠
學習周報·教與學 2020年30期
關鍵詞:平均分數據挖掘精準

嚴劍 陳粵暉 韓建保 姚穎筠

一、大數據數據挖掘班級薄弱點的可行性和必要性

我市10多年來在高三模擬考試運用網絡化閱卷,大大提高了閱卷效率。但針對海量的閱卷數據還處于粗略統計層面,每次考后很少有針對班級甚至個人進行精準診斷分析,數據利用率比較低,非??上?,為此我們課題組對此進行深入研究。

尤其是針對高三學生考試存在的薄弱點進行針對性的教學,的確能快速有效地提高學生的學習效率和學習成績。而如何快速精準地找到班級學生的薄弱點,則成為我們普通教師教學工作中的一個難題。

我們已經有了海量的閱卷數據,通過對每一位學生、每一學科、甚至于每一道考題進行挖掘,可以對全市每一個班級(學校)的成績數據進行精準分析量化診斷出每個班級乃至每位學生的薄弱點,供各科任課教師有針對性地查漏補缺、因材施教。因此,我市開發出一個有針對學生知識薄弱點的分析系統勢在必行。

二、“網絡閱卷知識薄弱點分析系統”開發環境及系統功能介紹

考慮到目前大多數教育工作者已經能夠較熟練運用Excel。因此,本系統的開發選用了Excel+VBA環境開發,目前已完成以班級(學校)為單位進行診斷,其針對性較強,功能相對簡潔。其Excel界面結構如圖1所示:

三、算法原理

“薄弱點”并不是指班級(學校)的學生得分率低的知識點,因為得分率低未必是學生水平低,很有可能是題目難度大。因此,我們在所有知識點中找出“應該得分而未能得到”或者“應該得到某個分數但明顯低于該得分”的部分,這就是薄弱點。按照該班級(學校)、學生能力水平(可簡化為“總分”)對應全部學生應該獲取的得分率明顯低于其總體水平,這說明它的出現與該學生的實際水平有較大差距,屬于可糾正的范疇。經過長期大量的探討研究和數據分析,初步確定了各校各班薄弱點數據的計算方法如下:以某校某次生物考試成績為例,其公式引用4個數據,a是該校生物的平均分,b 是全市生物的平均分,a/b表示該校生物在全市中的占比;c是該校生物第1題的平均分,d 是全市生物第1 題的平均分,c/d表示該校生物第1題 在全市中的占比;再比較a/b和 c/d,如果(a/b)/(c/d)<=80%就說明第1題是該校明顯薄弱環節。

四、系統實現

(一)原始表格結構

為使系統能滿足各科各類考試成績的錄入需求,經過調查研究,將原始表格表頭設計為“學?!薄鞍嗉墶薄邦}號”“總分”共四大字段。其中“題號”部分統一采用“T1”“T2”…等標號來表示各題。具體狀況如圖2所示:

(二)以“班級情況分析”為例具體代碼實現

(1)為提高程序運行效率,將原始數據導入數組處理。如圖3所示:

(2)先求出全體學生各題總平均分并輸出,如圖4所示:

(3)以學校為單位分類統計各校各題平均分并輸出,如圖5所示:

(4)根據公式以學校為單位計算各校薄弱點數據,具體代碼如圖6所示:

將薄弱點數據以紅色加粗字體顯示,代碼如圖7所示:

最終結果如圖8所示:

同樣的原理,可以實現“班級情況分析”,最終效果如圖9所示:

五、結束語

至此,基本完成了預訂目標,經過多個學科、多次考試試運行,效果良好。滿足了在大數據環境背景下,利用本系統快捷、高效、智能地分析各班各校各科薄弱點的基本要求。解決了一線教育工作者因進行大量而繁重的數據分析處理而帶來的巨大工作負擔和困擾。有效地各科查漏補缺、二次復習做了充分的準備。

參考文獻:

[1]基于大數據與云計算技術的精準教學平臺實踐應用,李岸,謝松興,盤俊春,中國信息技術教育,2019.8

★ 基金項目:江西省教育科學“十三五”規劃課題《基于大數據挖掘的高中學科知識薄弱點診斷分析的應用研究》,課題編號:18ZXZD008

猜你喜歡
平均分數據挖掘精準
精準扶貧美了鄉村
精準扶貧 齊奔小康
平均分一半
數據挖掘綜述
軟件工程領域中的異常數據挖掘算法
基于R的醫學大數據挖掘系統研究
兩種分法
“平均分”教學設計
一本面向中高級讀者的數據挖掘好書
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合