?

關聯規則數據挖掘在評價系統中的實踐創新研究

2015-01-08 02:15翟霞黃磊
中國科技縱橫 2014年12期
關鍵詞:Apriori算法關聯規則教學評價

翟霞++黃磊

【摘 要】 本文首先介紹了數據挖掘在高校教學評價系統中使用的意義,明確了挖掘模塊的功能定義及挖掘具體的實現方案,然后詳細介紹了關聯規則挖掘在高校評教系統中的使用。全文以哈爾濱華德學院為實例,綜合了教務處、人力資源部、教學質量監督中心等部門的數據記錄形成教學評價初始數據,經過一系列數據預處理操作,形成挖掘對象,通過使用關聯規則的Apriori算法對教師屬性與評教等級進行了挖掘分析,最終得出了有參考價值的挖掘結果。

【關鍵詞】 教學評價 關聯規則 數據預處理 Apriori算法

目前,在高校的教學管理中都引入了教學評價體系,通過記錄相應的評教信息,教務管理部門可以掌握教師的授課效果及學生對課程的滿意程度,并把相應的反饋信息及時的反饋給任課教師,幫助教師提高自身的教學水平[1]。許多高校已經將教學評價加入到教學管理規范的必要環節,將評教結果作為考核教師工作業績的重要參考依據。而對于評教數據的內在關聯學校卻未曾做過深層次的思考。將關聯規則的挖掘應用于教學評價系統之中,可以多角度全方位的分析評價數據,哪些老師受學生歡迎,授課效果好;評教得分較高的教師有哪些共同的特征;影響評教得分的主要因素有哪些等學校教務部門感興趣的信息,都會以直觀易于理解的信息形式展現出來,幫助管理部門完善教學質量監督并作為決策支持的依據。

目前我校已有在線教學評價系統,學生每學期末在規定時間范圍內登錄系統,進行本學期任課教師的評教工作,之后教務處教學質量監督中心會匯總學生的評教數據、專家評教數據及教師互評數據,綜合三方面的整體情況,最終得出教師本學期的測評結果?,F行的教學評價系統基本功能已經具備,只需在其原系統之上,增加數據挖掘模塊,實現關聯規則挖掘,使評教數據在完成基本功能外,可以實現數據分析功能,找出隱含在其中的有價值的信息[2]。實現過程如圖1所示。下面,以哈爾濱華德學院為例,把數據挖掘模塊應用到的評教系統中,幫助教學管理部門進行深層次的數據分析。

數據挖掘所要處理的原始數據通常情況下都是不符合預期要求的,因為在這些數據之中有一部分會含有不規范或冗余的現象[3]。哈爾濱華德學院的教務系統中包含教學評教模塊,其中涵蓋學生、教師和專家近幾年的評價數據,下面將針對學院教務系統中的大量歷史真實數據進行預處理操作[4]。根據現實分析問題的要求,實現哈爾濱華德學院教學評價數據挖掘功能的數據源涉及到多個部門的數據信息,主要有人力資源部門的教師信息表、學工處的學生信息表、教務部門的評教信息表等,為了統一數據格式均以Excel表的形式將其導出保存。初始數據信息表的表結構如表1所示。

教師年齡屬性取值范圍較廣,直接用于挖掘分析會使挖掘結果較分散,使用數據泛化,將年齡概括到更高層次的抽象,分別取值為青年、中年和老年。劃分的具體標準如表2所示。

學生在校成績取值為連續的數值,直接用于挖掘會使得挖掘結果得到的規則較多,不利于分析,所以將成績重新劃分為優秀、良好、合格和較差四個等級,劃分標準如表3所示。

我校教師的額定課時量是192,根據教師擔任的行政職務級別,課時量會適當的縮減,但由于縮減量較小以及劃分等級較多,這里為了便于分析,忽略這種差異。根據額定課時量將課時量字段數據分段劃分標準如表4所示。

教師的科研能力主要從發表論文數量和科研課題來衡量,其中還考慮了論文所屬期刊的等級,省級及一般期刊系數乘1,國家中文核心期刊系數乘2,SCI及EI等重點期刊系數乘4,根據這一原則將教師科研等級劃分標準如表5所示。

綜合上述各屬性數據泛化準則將初始教師評教信息表轉化為易于數據挖掘的新的數據表,Apriori算法要求挖掘數據來自于事物數據庫,因此,將得到的轉化后的數據表再進一步轉化為每條記錄由字符代碼表示的數據表[5],代碼轉換依據表6和7所示。

一般情況下,在經過處理的挖掘對象中并不是所有的特征屬性都有必要參與數據挖掘,因為有一部分屬性自身和挖掘所要分析的問題聯系較弱,而且對挖掘結果的影響也微乎其微,參與挖掘往往影響挖掘效率。這樣,一般采取直接將其刪除的策略。針對本文挖掘研究的分析目標,挖掘前將初始數據信息表中與評價等級關聯較弱的教師編號、性別、是否進修、入學成績四列做刪除處理。本文對教學評價系統中的30600條數據記錄進行了挖掘分析,得到了年齡、職稱、學位、學生在校成績與評教等級之間的關聯關系。

設定最小支持度和最小置信度的閾值分別為12%和55%,得到的挖掘結果中滿足條件的項集如表8所示。

基于以上挖掘結果,我們得出年齡在36-45歲之間或是具有研究生學歷或是職稱為副教授的教師評教等級為優秀的概率較大,現實中這些老師具有豐富的教學經驗和良好的專業素養,深受學生的歡迎;而評教得分較低的大多數來自于35歲以下的教師;成績為優秀的學生所做的評教等級多半為優秀。

以上是單一屬性與評教等級的關聯關系,下面我們來分析評教等級為優秀的教師具有什么樣的特征。首先從初始數據信息表中把評教等級為優秀的記錄抽取出來,大約15000條,忽略學生成績和課時量屬性,設定最小支持度和最小置信度分別為6%和45%,通過Apriori算法最終得到頻繁項集L3,如表9所示。

由以上挖掘結果可以得出,年齡在36-45之間,職稱為副教授,學歷為研究生的教師被評為優秀的概率較大。

參考文獻:

[1]蔣暉等.數據挖掘及其一種關聯規則算法[J].計算機與數字工程,2011,39(6):38-42.

[2]王玉榮.關聯規則挖掘算法在大數據集上的應用研究[D].江南大學碩士論文,2011:58-72.

[3]李云峰,陳建文,程代杰.關聯規則挖掘的研究及對Apriori算法的改進[J].計算機工程與科學,2012,(06):85-87.

[4]LI C,YANG T Q. Effective Mining of Fuzzy Quantitative Weighted Association Rules[C].International Conference on E-Business and E-Government,2010:1418-1421.

[5]李清峰.數據挖掘中關聯規則的一種高效Apriori算法[J].計算機應用與軟件,2009,21(12):84-86.endprint

【摘 要】 本文首先介紹了數據挖掘在高校教學評價系統中使用的意義,明確了挖掘模塊的功能定義及挖掘具體的實現方案,然后詳細介紹了關聯規則挖掘在高校評教系統中的使用。全文以哈爾濱華德學院為實例,綜合了教務處、人力資源部、教學質量監督中心等部門的數據記錄形成教學評價初始數據,經過一系列數據預處理操作,形成挖掘對象,通過使用關聯規則的Apriori算法對教師屬性與評教等級進行了挖掘分析,最終得出了有參考價值的挖掘結果。

【關鍵詞】 教學評價 關聯規則 數據預處理 Apriori算法

目前,在高校的教學管理中都引入了教學評價體系,通過記錄相應的評教信息,教務管理部門可以掌握教師的授課效果及學生對課程的滿意程度,并把相應的反饋信息及時的反饋給任課教師,幫助教師提高自身的教學水平[1]。許多高校已經將教學評價加入到教學管理規范的必要環節,將評教結果作為考核教師工作業績的重要參考依據。而對于評教數據的內在關聯學校卻未曾做過深層次的思考。將關聯規則的挖掘應用于教學評價系統之中,可以多角度全方位的分析評價數據,哪些老師受學生歡迎,授課效果好;評教得分較高的教師有哪些共同的特征;影響評教得分的主要因素有哪些等學校教務部門感興趣的信息,都會以直觀易于理解的信息形式展現出來,幫助管理部門完善教學質量監督并作為決策支持的依據。

目前我校已有在線教學評價系統,學生每學期末在規定時間范圍內登錄系統,進行本學期任課教師的評教工作,之后教務處教學質量監督中心會匯總學生的評教數據、專家評教數據及教師互評數據,綜合三方面的整體情況,最終得出教師本學期的測評結果?,F行的教學評價系統基本功能已經具備,只需在其原系統之上,增加數據挖掘模塊,實現關聯規則挖掘,使評教數據在完成基本功能外,可以實現數據分析功能,找出隱含在其中的有價值的信息[2]。實現過程如圖1所示。下面,以哈爾濱華德學院為例,把數據挖掘模塊應用到的評教系統中,幫助教學管理部門進行深層次的數據分析。

數據挖掘所要處理的原始數據通常情況下都是不符合預期要求的,因為在這些數據之中有一部分會含有不規范或冗余的現象[3]。哈爾濱華德學院的教務系統中包含教學評教模塊,其中涵蓋學生、教師和專家近幾年的評價數據,下面將針對學院教務系統中的大量歷史真實數據進行預處理操作[4]。根據現實分析問題的要求,實現哈爾濱華德學院教學評價數據挖掘功能的數據源涉及到多個部門的數據信息,主要有人力資源部門的教師信息表、學工處的學生信息表、教務部門的評教信息表等,為了統一數據格式均以Excel表的形式將其導出保存。初始數據信息表的表結構如表1所示。

教師年齡屬性取值范圍較廣,直接用于挖掘分析會使挖掘結果較分散,使用數據泛化,將年齡概括到更高層次的抽象,分別取值為青年、中年和老年。劃分的具體標準如表2所示。

學生在校成績取值為連續的數值,直接用于挖掘會使得挖掘結果得到的規則較多,不利于分析,所以將成績重新劃分為優秀、良好、合格和較差四個等級,劃分標準如表3所示。

我校教師的額定課時量是192,根據教師擔任的行政職務級別,課時量會適當的縮減,但由于縮減量較小以及劃分等級較多,這里為了便于分析,忽略這種差異。根據額定課時量將課時量字段數據分段劃分標準如表4所示。

教師的科研能力主要從發表論文數量和科研課題來衡量,其中還考慮了論文所屬期刊的等級,省級及一般期刊系數乘1,國家中文核心期刊系數乘2,SCI及EI等重點期刊系數乘4,根據這一原則將教師科研等級劃分標準如表5所示。

綜合上述各屬性數據泛化準則將初始教師評教信息表轉化為易于數據挖掘的新的數據表,Apriori算法要求挖掘數據來自于事物數據庫,因此,將得到的轉化后的數據表再進一步轉化為每條記錄由字符代碼表示的數據表[5],代碼轉換依據表6和7所示。

一般情況下,在經過處理的挖掘對象中并不是所有的特征屬性都有必要參與數據挖掘,因為有一部分屬性自身和挖掘所要分析的問題聯系較弱,而且對挖掘結果的影響也微乎其微,參與挖掘往往影響挖掘效率。這樣,一般采取直接將其刪除的策略。針對本文挖掘研究的分析目標,挖掘前將初始數據信息表中與評價等級關聯較弱的教師編號、性別、是否進修、入學成績四列做刪除處理。本文對教學評價系統中的30600條數據記錄進行了挖掘分析,得到了年齡、職稱、學位、學生在校成績與評教等級之間的關聯關系。

設定最小支持度和最小置信度的閾值分別為12%和55%,得到的挖掘結果中滿足條件的項集如表8所示。

基于以上挖掘結果,我們得出年齡在36-45歲之間或是具有研究生學歷或是職稱為副教授的教師評教等級為優秀的概率較大,現實中這些老師具有豐富的教學經驗和良好的專業素養,深受學生的歡迎;而評教得分較低的大多數來自于35歲以下的教師;成績為優秀的學生所做的評教等級多半為優秀。

以上是單一屬性與評教等級的關聯關系,下面我們來分析評教等級為優秀的教師具有什么樣的特征。首先從初始數據信息表中把評教等級為優秀的記錄抽取出來,大約15000條,忽略學生成績和課時量屬性,設定最小支持度和最小置信度分別為6%和45%,通過Apriori算法最終得到頻繁項集L3,如表9所示。

由以上挖掘結果可以得出,年齡在36-45之間,職稱為副教授,學歷為研究生的教師被評為優秀的概率較大。

參考文獻:

[1]蔣暉等.數據挖掘及其一種關聯規則算法[J].計算機與數字工程,2011,39(6):38-42.

[2]王玉榮.關聯規則挖掘算法在大數據集上的應用研究[D].江南大學碩士論文,2011:58-72.

[3]李云峰,陳建文,程代杰.關聯規則挖掘的研究及對Apriori算法的改進[J].計算機工程與科學,2012,(06):85-87.

[4]LI C,YANG T Q. Effective Mining of Fuzzy Quantitative Weighted Association Rules[C].International Conference on E-Business and E-Government,2010:1418-1421.

[5]李清峰.數據挖掘中關聯規則的一種高效Apriori算法[J].計算機應用與軟件,2009,21(12):84-86.endprint

【摘 要】 本文首先介紹了數據挖掘在高校教學評價系統中使用的意義,明確了挖掘模塊的功能定義及挖掘具體的實現方案,然后詳細介紹了關聯規則挖掘在高校評教系統中的使用。全文以哈爾濱華德學院為實例,綜合了教務處、人力資源部、教學質量監督中心等部門的數據記錄形成教學評價初始數據,經過一系列數據預處理操作,形成挖掘對象,通過使用關聯規則的Apriori算法對教師屬性與評教等級進行了挖掘分析,最終得出了有參考價值的挖掘結果。

【關鍵詞】 教學評價 關聯規則 數據預處理 Apriori算法

目前,在高校的教學管理中都引入了教學評價體系,通過記錄相應的評教信息,教務管理部門可以掌握教師的授課效果及學生對課程的滿意程度,并把相應的反饋信息及時的反饋給任課教師,幫助教師提高自身的教學水平[1]。許多高校已經將教學評價加入到教學管理規范的必要環節,將評教結果作為考核教師工作業績的重要參考依據。而對于評教數據的內在關聯學校卻未曾做過深層次的思考。將關聯規則的挖掘應用于教學評價系統之中,可以多角度全方位的分析評價數據,哪些老師受學生歡迎,授課效果好;評教得分較高的教師有哪些共同的特征;影響評教得分的主要因素有哪些等學校教務部門感興趣的信息,都會以直觀易于理解的信息形式展現出來,幫助管理部門完善教學質量監督并作為決策支持的依據。

目前我校已有在線教學評價系統,學生每學期末在規定時間范圍內登錄系統,進行本學期任課教師的評教工作,之后教務處教學質量監督中心會匯總學生的評教數據、專家評教數據及教師互評數據,綜合三方面的整體情況,最終得出教師本學期的測評結果?,F行的教學評價系統基本功能已經具備,只需在其原系統之上,增加數據挖掘模塊,實現關聯規則挖掘,使評教數據在完成基本功能外,可以實現數據分析功能,找出隱含在其中的有價值的信息[2]。實現過程如圖1所示。下面,以哈爾濱華德學院為例,把數據挖掘模塊應用到的評教系統中,幫助教學管理部門進行深層次的數據分析。

數據挖掘所要處理的原始數據通常情況下都是不符合預期要求的,因為在這些數據之中有一部分會含有不規范或冗余的現象[3]。哈爾濱華德學院的教務系統中包含教學評教模塊,其中涵蓋學生、教師和專家近幾年的評價數據,下面將針對學院教務系統中的大量歷史真實數據進行預處理操作[4]。根據現實分析問題的要求,實現哈爾濱華德學院教學評價數據挖掘功能的數據源涉及到多個部門的數據信息,主要有人力資源部門的教師信息表、學工處的學生信息表、教務部門的評教信息表等,為了統一數據格式均以Excel表的形式將其導出保存。初始數據信息表的表結構如表1所示。

教師年齡屬性取值范圍較廣,直接用于挖掘分析會使挖掘結果較分散,使用數據泛化,將年齡概括到更高層次的抽象,分別取值為青年、中年和老年。劃分的具體標準如表2所示。

學生在校成績取值為連續的數值,直接用于挖掘會使得挖掘結果得到的規則較多,不利于分析,所以將成績重新劃分為優秀、良好、合格和較差四個等級,劃分標準如表3所示。

我校教師的額定課時量是192,根據教師擔任的行政職務級別,課時量會適當的縮減,但由于縮減量較小以及劃分等級較多,這里為了便于分析,忽略這種差異。根據額定課時量將課時量字段數據分段劃分標準如表4所示。

教師的科研能力主要從發表論文數量和科研課題來衡量,其中還考慮了論文所屬期刊的等級,省級及一般期刊系數乘1,國家中文核心期刊系數乘2,SCI及EI等重點期刊系數乘4,根據這一原則將教師科研等級劃分標準如表5所示。

綜合上述各屬性數據泛化準則將初始教師評教信息表轉化為易于數據挖掘的新的數據表,Apriori算法要求挖掘數據來自于事物數據庫,因此,將得到的轉化后的數據表再進一步轉化為每條記錄由字符代碼表示的數據表[5],代碼轉換依據表6和7所示。

一般情況下,在經過處理的挖掘對象中并不是所有的特征屬性都有必要參與數據挖掘,因為有一部分屬性自身和挖掘所要分析的問題聯系較弱,而且對挖掘結果的影響也微乎其微,參與挖掘往往影響挖掘效率。這樣,一般采取直接將其刪除的策略。針對本文挖掘研究的分析目標,挖掘前將初始數據信息表中與評價等級關聯較弱的教師編號、性別、是否進修、入學成績四列做刪除處理。本文對教學評價系統中的30600條數據記錄進行了挖掘分析,得到了年齡、職稱、學位、學生在校成績與評教等級之間的關聯關系。

設定最小支持度和最小置信度的閾值分別為12%和55%,得到的挖掘結果中滿足條件的項集如表8所示。

基于以上挖掘結果,我們得出年齡在36-45歲之間或是具有研究生學歷或是職稱為副教授的教師評教等級為優秀的概率較大,現實中這些老師具有豐富的教學經驗和良好的專業素養,深受學生的歡迎;而評教得分較低的大多數來自于35歲以下的教師;成績為優秀的學生所做的評教等級多半為優秀。

以上是單一屬性與評教等級的關聯關系,下面我們來分析評教等級為優秀的教師具有什么樣的特征。首先從初始數據信息表中把評教等級為優秀的記錄抽取出來,大約15000條,忽略學生成績和課時量屬性,設定最小支持度和最小置信度分別為6%和45%,通過Apriori算法最終得到頻繁項集L3,如表9所示。

由以上挖掘結果可以得出,年齡在36-45之間,職稱為副教授,學歷為研究生的教師被評為優秀的概率較大。

參考文獻:

[1]蔣暉等.數據挖掘及其一種關聯規則算法[J].計算機與數字工程,2011,39(6):38-42.

[2]王玉榮.關聯規則挖掘算法在大數據集上的應用研究[D].江南大學碩士論文,2011:58-72.

[3]李云峰,陳建文,程代杰.關聯規則挖掘的研究及對Apriori算法的改進[J].計算機工程與科學,2012,(06):85-87.

[4]LI C,YANG T Q. Effective Mining of Fuzzy Quantitative Weighted Association Rules[C].International Conference on E-Business and E-Government,2010:1418-1421.

[5]李清峰.數據挖掘中關聯規則的一種高效Apriori算法[J].計算機應用與軟件,2009,21(12):84-86.endprint

猜你喜歡
Apriori算法關聯規則教學評價
基于Hadoop平臺的并行DHP數據分析方法
對農村小學數學課堂教學評價的認識和看法
網絡環境下高職英語課程多維度評價方式研究
小學數學“反思型” 教學的探索與實踐
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合