?

基于CNN的教學質量評估模型研究

2023-07-04 04:57孟慶祥王帆馮苑君申力盧冰杜娟
高教學刊 2023年37期
關鍵詞:評估方法評價體系深度學習

孟慶祥 王帆 馮苑君 申力 盧冰 杜娟

摘? 要:高校教學質量評估活動開展為廣大教師及時調整教學策略提供針對性建議,有助于提高教學質量。但現行評估方法多為簡單加權平均,人為給定指標權重,常存在主觀性和片面性局限。針對上述現象,該文綜合學生、同行教師、督導員三方評價將教學質量分為優秀、良好、一般和較差4個等級,并采用神經網絡算法,建立基于卷積神經網絡的教學質量評估模型。該文首先研究現行教學質量評估體系優缺點,判斷模型構建可行性,提出基于深度學習的教學質量評估模型構建方法,然后代入現有教學評估數據,比較所得結果與已知事實驗證模型準確性。結果證明,評估模型準確性較高。該研究將有助于建立一個更加科學可靠的教學質量評估標準體系。

關鍵詞:教學質量;深度學習;評估方法;CNN網絡;評價體系

中圖分類號:G642? ? ? ? ?文獻標志碼:A? ? ? ? ? 文章編號:2096-000X(2023)S1-0014-04

Abstract: The development of teaching quality assessment activities in colleges and universities can provide more targeted information for teachers to adjust teaching strategies in a timely manner and do college lecturers a favor to improve teaching quality. Nevertheless, the majority of the current evaluation methods are weighted average algorithms. The weights of each indicator are artificially given empirical values, which often have limitations of subjectivity and one-sidedness. In view of the above phenomenon, this paper not only comprehensively considers the course evaluations of students, peer teachers and supervisors to divide the teaching quality into four grades: excellent, good, average and inferior, but also uses neural network algorithms to establish a teaching quality evaluation model structure based on Convolutional Neural Networks (CNN).This paper studies the pros and cons of the current teaching quality evaluation system, judges the feasibility of building a CNN model, and proposes a construction method for the model of teaching quality evaluation based on deep learning. Subsequently, the data of existing teaching evaluation is substituted into the model for calculation and the obtained results are compared with known facts to verify the accuracy of the model. According to the result, the accuracy of the CNN evaluation model is high, which will help to establish a more scientific and reliable teaching quality evaluation standard system.

Keywords: teaching quality; deep learning; assessment method; CNN network; evaluation system

基金項目:湖北省科技廳省級基金項目“基于全天空成像儀和輻射傳輸模型的太陽能短時預測方法研究”(2019CFB732);武漢大學遙感信息工程學院“三全育人”教改項目“疫情期間遙感大類卓越工程師人才培養改革”(YGJY202210);武漢大學遙感信息工程學院“三全育人”教改項目“探索‘教與學革命’背景下教師教學能力提升優化及制度設計”(YGJY202214);武漢大學遙感信息工程學院“三全育人”教改項目“價值引領式的大學生競賽科研創新育人模式改革路徑探索”(YGJY202114);武漢大學教改項目“學科競賽與大創科研驅動的遙感類綜合創新育人模式研究”(00030791)

第一作者簡介:孟慶祥(1977-),男,漢族,內蒙古烏蘭察布人,博士,講師。研究方向為遙感科學與技術、深度學習、教學研究等。

目前,我國大多高校已建成由督導員、同行教師和教學學生評價共同組成的教學質量評估體系,該體系主要由督導員評價指標調查表、同行教師評價指標調查表和學生評價指標調查表構成。相較于單方面由學生或督導員評價的手段,該體系更客觀,但其最終等級評估結果依賴于加權平均計算,且各權重乃人為給定經驗值,在可靠性上仍有欠缺[1]。此外,受多種不定量因素影響,現行評估方法還存在評分結果與測評結果聯系松散的問題,難以直觀體現最終教學評價分數代表的實際意義,對課程教學改進的指導意義不強[2]。

傳統反向傳播(Back Propagation ,BP) 神經網絡常常需要大量樣本進行訓練,計算量大,不利于推廣應用[3]。而卷積神經網絡(Convolutional Neural Networks, CNN)作為一種特殊的深度前饋神經網絡模型,與生物神經網絡具有高度相似性。卷積網絡由大量獨立神經元構成二維平面,多個二維平面構成單層神經網絡,單層神經網絡相互連結構成[4]。其特殊性主要體現在以下兩點:一是神經元之間采用非全連接,有效降低模型復雜度;二是相同層級中特殊神經元的連接權重相同,減少權值數量[5]。同時,CNN具備準確度高、學習能力強、對噪聲神經有較強的魯棒性和容錯能力等特點[6]。最后,CNN模型還有一個獨具的優點,即廣泛適用性。搭建CNN模型的知識來源不是固定的歷史模型參數,而是對有參考價值的評估樣本的學習結果,并基于習得模型分類規則進行實例分析[7]。這樣的特點使得模型具有很強的時效性,只要收集到最新的評估樣本訓練集,就能通過深度學習得到最新的、最適合的評估系統,適用于當前社會背景。

根據武漢大學2016年教學評估工作數據,本研究基于CNN構造教學質量評估模型,通過學習樣本中學生、教師及督導員課程評價和綜合教學質量的對應關系,得到區分不同教學質量的規則,直觀反映課程教學質量,進而形成一個科學可靠的教學質量評估標準體系。

一? 基于CNN的教學質量評估模型

(一)? 指標體系的建立

指標體系是進行課堂教學評估的前提。為從不同角度評估某課程教學質量,本研究評估指標體系的構建由學生、同行教師及督導員展開。其中,學生是課堂內容的第一接收者,故而學生評價是課程教學質量評估必不可少的部分,但其評價側重于課堂信息的傳遞和課下溝通方式,難以覆蓋教學策略等專業方面;同行教師經驗豐富,對于課程體系和課程目標本身有較透徹的理解,能夠對教學過程中老師使用了何種教學策略、該策略對學生理解課堂知識具有多大影響等方面作出專業評價;督導員更專注于評價課堂教學控制,一般從一些硬性指標,如課堂的紀律、出勤率、課程成績等方面出發完成評價。

綜上,我們將教學質量評估指標細分為三級。

1)一級指標為教學質量綜合評估等級,分為4級:分別為1級(優秀),2級(良好),3級(一般),4級(較差)。

2)二級指標為學生、同行教師及督導員對課堂教學質量的評估結果,分為4級:分別為1級(優秀),2級(良好),3級(一般),4級(較差)。

3)三級指標為學生、同行教師及督導員評價表上的細分項,分為3級:分別為1級(優秀),2級(一般),3級(較差)。

具體指標體系見表1,同級指標間相互獨立沒有聯系。而且,本研究制定該指標體系時注重傳統評價數據的輸入便捷性,三級指標與往常進行課程教學質量評價時數據收集的方式一致,便于我們通過CNN模型劃分教學質量等級。

(二)? CNN分類器

綜合評價模型使用三類人物的評價指標作為分類器的分類特征項,建立CNN分類器以搭建教學質量評估系統如圖1所示。首先由下層分類器確定二級指標X、Y、Z值,然后再基于上層分類器得到一級指標值。其中二級指標能夠幫助課程教師快速鎖定自己在哪個教學環節存在不足,更高效地進行教學計劃調整:如果學生評價對應的二級指標X值較低,則主要需要調整課堂上的信息傳遞方式或課下與學生的溝通方法;如果同行教師的評價等級Y較低,則應考慮授課時教學策略運用是否存在不完善問題,提高備課能力;如果督導員評價等級Z較低,則應關注課堂紀律管理、給分是否合理等方面。

(三)? 訓練樣本的建立

基于CNN分類器的教學質量評估模型的建立需要考慮兩個問題:一是確定網絡結構;二是學習屬性變量的條件概率分布及確定類的先驗概率。因設計教學質量評估指標時已考慮屬性變量間的獨立性,故不再進行結構學習,只需對屬性類條件概率進行估計。

本文中選取的學生評價表、同行教師評價表和督導員評價表,以及教學質量評估等級數據均來自武漢大學2016年教學評估工作。

使用CNN分類器進行等級分類的前提是利用部分已有分類結果的樣本進行先驗概率統計,CNN分類器的準確度和樣本空間大小有關,樣本空間越大其準確性越強。因此,本研究從已有學生、同行教師及督導員的打分結果中隨機選出500份作為樣本,樣本的一級指標和二級指標已知。使用CNN模型進行機器學習,從已有的樣本中總結得出教學質量等級劃分規則,利用計算機習得的分類規則對實例進行教學質量評估。這里需要注意的是,隨機選中的500個樣本不需要全部作為訓練樣本集輸入到CNN分類器中,我們在實驗中隨機取出400個樣本作為訓練集用于擬合模型、調整參數,剩余100個樣本作為驗證分類器正確性的驗證樣本集,以保證所得CNN分類器準確性在應用前已被檢驗。

二? 實例分析

使用武漢大學2016年教學評估工作中提取出的樣本生成CNN分類器,進行神經網絡樣本計算機學習后,進行實例處理,取得結果見表2。

隨后,對未有綜合評價結果的10 000個課程進行教學質量評估。通過問卷調查和網上評價系統等渠道,我們收集了上述課程的三級指標。使用CNN分類器確定二級指標,并將二級指標作為新的屬性特征值輸入得到一級指標,即綜合教學質量等級。結果如圖2所示,其中1級課程占總課程數的5.32%,2級課程占總課程數的27.42%,3級課程占總課程數的60.77%,4級課程占總課程數的6.49%。

將評價結果與現實情況進行對比,可以發現:1級課程多為學生評選出的“最受學生喜愛課程”或被評為“武漢大學精品課程”;4級課程多為新開課程,任教老師的教學策略等有待改善。這一結果與現實的相互印證,代表本研究通過學習樣本得到的基于CNN的教學質量評估模型能有效地、高可用地協助劃分課程等級,進而幫助課程教師針對性地調整教學方法。

而且,通過多次實驗并總結分析所得結果,團隊證明:CNN的分類準確性與提供的特征屬性數成反比,若跳過二級指標的生成環節,將一級指標及三級指標作為分類的特征屬性集合作為樣本輸入,所得模型教學質量等級劃分誤差明顯增大。因此,本研究采用了二級指標,更好地規避了因特征類別數過多而造成誤差呈指數增長的問題,為教學質量評估活動帶來了更高的準確性和實用性。

最后,通過選取特定三級指標項并組合,本模型能夠研究不同課程的附加價值。但應注意樣本價值的確定需要研究人員對于課程內容進行深入研究,而樣本集中的級別定義亦必須相對準確,如此才能保證最后得到的分類器進行等級劃分所得結果是可解釋的、有研究價值的。以課程對于高校教育的科研意義為例。從表1中抽出與課程科研價值密切相關的X14,X18,Y6,Y12,Z2,Z3六個指標,從課內學生論文發表數、參與項目數、老師在該領域的科研成果情況等多個方面入手,評估該課程的科研價值等級,共分為3級:1級(優秀),2級(良好),3級(普通)。使用樣本訓練分類器并進行實例分析,評估所選10門課程的科研價值,統計得到,1級科研價值課程占總數的6.72%,2級科研價值課程占總數的60.39%,3級科研價值課程占總數的32.89%。而在本科人才培養方案中,肩負科研培養重任的專業教育課程占53.57%。兩相對比發現,目前高校具有很高科研價值的課程占比很少,大部分課程與科研有一般聯系或基本無聯系,具有較高科研價值的課程數目達不到預設目標,從而向學校、教師等提示教學現狀的紕漏之處,以促進新的教學策略的制定,進而推動高??蒲邪l展。

三? 結束語

利用本模型進行課程教學質量評估,對比實際與所得的綜合教學質量等級和二級指標值,發現模型能夠較準確地反映課程真實情況,并能夠對課程的附加價值進行評價。CNN不但有嚴格的數學基礎,還具有完備的語義表達能力,充分利用專家知識和數據信息,具有很強的學習、推理能力,能夠比較好地利用先驗知識。但由于CNN模型本身的原理性缺陷,當前文章涉及的分類器存在一定的預測和分類誤差。CNN模型的訓練樣本集的確定也需要研究小組花費較多精力收集樣本課程相關消息,權衡多方面因素,盡可能得到一個有學習價值的訓練樣本集。未來,決策樹方法、層次分析方法等其他分類模型均將被列入考慮范疇中,以設計更優的綜合教學質量評估模型。

參考文獻:

[1] 劉海燕,孫悅,關曉輝,等.基于ICA和CNN算法在教學質量評價中應用的探析[J].科技視界,2013(10):92.

[2] 祝智庭,彭紅超.深度學習:智慧教育的核心支柱[J].中國教育學刊,2017(5):36-45.

[3] 徐欣,徐立鴻.教學質量評價與預測的人工神經網絡方法[J].統計與決策,2009(20):159-160.

[4] 周飛燕,金林鵬,董軍.卷積神經網絡研究綜述[J].計算機學報,2017,40(6):1229-1251.

[5] 曹玉東,劉海燕,賈旭,等.基于深度學習的圖像質量評價方法綜述[J].計算機工程與應用,2021,57(23):27-36.

[6] 趙德安,吳任迪,劉曉洋,等.基于YOLO深度卷積神經網絡的復雜背景下機器人采摘蘋果定位[J].農業工程學報,2019,35(3):164-173.

[7] 王良玉,張明林,祝洪濤,等.人工神經網絡及其在地學中的應用綜述[J].世界核地質科學,2021,38(1):15-26.

猜你喜歡
評估方法評價體系深度學習
淺析電網規劃中的模糊可靠性評估方法
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
爛尾樓資產證券化及定價方法的探討
深度學習算法應用于巖石圖像處理的可行性研究
基于深度卷積網絡的人臉年齡分析算法與實現
評價體系小改革職業技能大提升
自然資源資產離任審計評價體系研究
行政事業單位內部控制存在問題及對策
多元智能理論視角下高職院校體育課程評價體系的研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合