?

大學生圖書館門禁數據與成績關聯分析

2020-04-14 04:54孫可可李忠李海洋李瑩王圓圓
電腦知識與技術 2020年4期
關鍵詞:學生成績Apriori算法

孫可可 李忠 李海洋 李瑩 王圓圓

摘要:為研究大學生學習成績與利用圖書館門禁信息之間的關系,此項研究選取了防災科技學院2017和2018屆學生的成績數據和圖書館門禁信息,并從門禁信息中提取出學生去圖書館學習的時長和次數,利用數據挖掘技術中的Apriori算法,分析學生成績和學生去圖書館學習的次數及時長之間的關聯性。研究結果顯示,學生去圖書館的時間和次數與學生的學習成績的關聯程度比較高。

關鍵詞:學生成績;圖書館門禁;Apriori算法;防災科技學院

中圖分類號:TP391

文獻標識碼:A

文章編號:1009-3044(2020)04-0235-02

收稿日期:2019-10-18

基金項目:中央高?;究蒲袠I務費專項(ZY20180121)

作者簡介:孫可可(1994—),男,安徽臨泉人,碩士研究生,主要研究方向為災害信息處理技術;李忠(通信作者),男,博士,教授,研究方向為數據挖掘、可拓學理論、災害評價等;李海洋,男,安徽合肥人,碩士研究生;李瑩,女,內蒙古通遼人,碩士研究生;王圓圓,女,河南洛陽人。

Correlation Analysis of Library Access Control Data and College Students ' Achievement

SUN Ke-ke,LI Zhong,LI Hai-yang,LI Ying,WANG Yuan-yuan

(Institute of Disaster Prevention,Sanhe 065200,China)

Abstract:To study the relationship between college students' academic achievement and the use of library access control information,this study selected the data from the 2017 and 2018 students ' academic achievement of the Institute of Disaster Prevention library ac-cess control information,and extract the length of time and frequency of the access control information which students went to the library,By using the Apriorialgorithm in data mining technology to analyze the correlation between students achievement and the length of time and frequency which students went to the library for learning.The results of the study show that the length of time and number of students going to the library are highly correlated with the student's academic achievement.

Key words:student achievement;access control information of library;Apriorialgorithm;Institute of Disaster Prevention

伴隨著校園信息化的發展,校園一卡通作為校園信息化的媒介,成為每個學生必不可少的工具,因此校園一卡通積累了大量的學生行為信息數據。利用數據挖掘技術,可能從這些數據中挖掘出有價值的知識,對學生管理、教學等具有指導意義。然而目前這些數據沒有能夠有效地利用,僅僅停留在增刪改查、統計分析和圖表展示等程度,造成數據資源的極大浪費[1]。圖書館是一個學校圖書、資料等文獻的匯集點,是培養人才的重要支撐,是一所學校的學科建設的重要基地。眾所周知,學習成績與學生的生活習慣密不可分。本文希望分析大學生利用圖書館資源的次數與學生成績之間的關系,研究二者之間的關聯性問題,為更好地利用圖書資源、指導學生行為習慣、提高學習成績等提供科學支撐。

1 數據預處理與特征分析

由于所有拿到的數據都是原始數據,而Apriori算法要求數據必須是分類屬性的數據,無法對原數據進行分析,所以對于原始數據進行一定的處理,才能從中找到相應的特征。數據預處理主要包括數據清洗、集成、變換、規約[2]。數據清洗主要是從原始數據中刪除數據缺失嚴重且無法使用的記錄、刪除重復的記錄;數據集成則是把多個數據源或者數據表中的數據合并放到一個一致的數據存儲中;數據變換主要是對數據進行規范化處理,將數據轉換成便于使用的形式;數據規約是在保持原有數據的特征的和原有數據的完整性的基礎上,適當降低數據的規?;蛘呔S度,降低數據存儲成本,減少數據挖掘所需要的時間[3]。

數據質量的高低直接關系到數據挖掘結果的好壞,因此需要對原始數據進行清理、整理、除噪、集成等預處理操作,這是數據挖掘過程的重要環節。本文所選取的數據是防災科技學院2013和2014這兩年人學學生的圖書館進出信息和學習成績信息,計算每個學生每個學年進出圖書館的次數以及在圖書館內的時長(單位:分鐘),以及每學年的成績和總成績。按照成績分為三類學生,分別是:A類為該年級學生成績排名前15%的

學生,C類是該年級學生成績排名最后15%的學生,其余為B類學生。如圖1所示的是一次數據挖掘任務的流程。

猜你喜歡
學生成績Apriori算法
淺析數據挖掘技術在學生管理系統中的應用
基于Hadoop平臺的并行DHP數據分析方法
學生成績管理系統的開發與設計
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合