?

提高“生物統計學”教學效果的探索

2020-11-30 03:27孫廷哲
綿陽師范學院學報 2020年11期
關鍵詞:優度生物檢驗

孫廷哲

(安慶師范大學生命科學學院,安徽安慶 246133)

0 引言

“生物統計學”是一門關注數理統計方法在生命科學研究領域的應用,以統計基本原理和方法挖掘生命現象和調查資料信息的學科.隨著二代測序等各種高通量技術的不斷革新和信息化數據的爆發式增長,生命科學研究需要面對愈來愈多的數據,進入了大數據時代.如何從大量數據中提煉有效信息是一個亟待解決的問題.因此,“生物統計學”是生命科學各專業的必修課程,對于培養和提高本科生的科學素養、分析和解決問題的能力具有十分重要的意義.但對于絕大多數生命科學專業的學生而言,“生物統計學”又是一門非常復雜且實踐性較強的學科,具體表現為基礎概念偏多,公式較為復雜且難于記憶;同時生命科學專業學生數學基礎較為薄弱,加之研究生入學考試并不含有數學科目,學生的學習積極性不高,種種因素使得“生物統計學”的教學存在一定的困難.傳統的方法,譬如將“生物統計學”的授課學期安排在大學數學的教學學期之后雖能部分解決數學基礎薄弱的問題,但受到宏觀課程安排限制,不能使得所有專業學生受益.因此,探索生物統計教學的新方法、突破復雜抽象理論的桎梏顯得十分必要.筆者結合課程特點、經過多年“生物統計學”教學實踐和教研室全體教師的共同努力,探索出行之有效的途徑,即在“生物統計學”課堂中融入統計學史教學、問題驅動式教學和加強統計學軟件的運用,進而顯著的提高了學生的學習興趣和知識掌握程度.

1 “生物統計學”理論教學的改革

1.1 在“生物統計學”課程中融入生物統計學史內容

早在19世紀,歐洲科學家即意識到課堂教育中融入數學史的必要性.De Morgan和H.G. Zeuthen都明確指出了數學史教育在實踐教學中的重要意義[1].美國著名數學家D.E. Smith指出:“數學史教育能夠體現出各種研究策略的成功與失敗經驗,使人汲取經驗教訓,進而獲得最優的教學手段”[2].生物統計學作為數學方法在生命科學中應用的一門學科,是一門相對較新的學科分支.因此,將統計學史融入“生物統計學”的教學過程中亦顯得十分必要,能夠在一定程度上激發生命科學相關專業學生的對統計學的興趣.另外,生物統計學史的課堂引入可以彌補單純依賴教材進行教學的不足.受教材編寫和數學基礎限制,高等院校常用《生物統計學》教材嚴重缺乏對生物統計學基本史實的介紹[3, 4], 從而極易造成學生對具體統計方法原理的誤解.以擬合優度檢驗進行教學案例說明.擬合優度檢驗(goodness of fit test)是用來檢驗實際觀測數據與依照某種假設或模型計算出來的理論數之間的一致性,進而判斷該假設或模型是否與觀測數相配合[5].在常用的《生物統計學》教材中,擬合優度檢驗會運用一個χ2公式:

其中A為實際觀測次數,T為理論觀測次數.χ2檢驗的自由度為df.另外,在自由度為1的情形下,需要運用矯正公式.

筆者發現,除記號表示差異外,這一段描述在多數高?!渡锝y計學》教材中基本一致,并認定χ2擬合優度檢驗是由K. Pearson在1900年完整提出來的[5].不過,這段“一致性的描述”本質上是對擬合優度檢驗的一個誤導.歷史上,在1915年,G. U. Yule和M. Greenwood發現,在使用2×2列聯表探索傷寒和霍亂疫苗效果的試驗中,擬合優度檢驗和另一種常用統計學檢驗方法產生了完全相反的結論,從而指出了問題所在,即檢驗自由度(degrees of freedom)問題[6].R. A. Fisher在1922年證明,K. Pearson的擬合優度檢驗自由度過大,必須進行自由度修正[7].雖然K. Pearson在同年進行了反駁[8],但毫無疑問,R. A. Fisher的證明是正確的,χ2檢驗的自由度應由rc修正為 (r-1)(c-1).所以,教材中的擬合優度檢驗χ2公式應當認為是K. Pearson和R. A. Fisher共同成果,而不應該將其簡單認為是前者單獨所有.筆者在授課過程中對這段歷史進行簡單的介紹,從而引導學生正確理解生物統計學檢驗方法的歷史發展過程,也能夠輔助學生對擬合優度檢驗的掌握.

另外,對于一些常見的生物統計學概念,譬如高斯分布(Gauss distribution)并不是由高斯首先發現的,而是由Abraham De Moivre首先寫出公式[9].這些在高等學?!渡锝y計學》教材中被忽略的內容需要由教師進行系統性的介紹,從而引導學生正確理解基本概念.

1.2 問題驅動式教學

A.5處水質監測點6個樣的細菌計數(/mL);B.箱線圖;C.MATLAB方差分析(ANOVA)結果;D.多重比較結果圖1 不同水質監測點大腸桿菌數目的比較Fig.1 Comparison of E. coli in Different Monitoring Spots

強調教學設計,聯系專業實踐,以實際問題為基礎提出教學案例,從而引導學生理解復雜理論.在正常的生產生活中,人類經常與數據打交道.對特定研究對象的測量、記錄和分析過程中會產生大量數據.即使對相同事物進行觀測,由于隨機性的存在,每次的觀測值也會具有一定的差異[4].對于生物學試驗及調查所得的資料,由于使用方法和研究的性狀特性不同,其資料性質也不相同.方差分析是本科生物統計學最重要的內容之一,此方法旨在比較多組數據之間的數據差異,用來解決t檢驗進行多組數據間比較時所造成的提高了犯第一類錯誤概率的問題.在一個多處理試驗中,可以得出一系列不同的觀測值.造成觀測值不同的原因是多方面的,有的是處理不同引起的,稱之為處理效應;有的是試驗過程中偶然性因素和測量誤差所致,這一類稱試驗誤差.方差分析的基本思想是將測量數據的總變異按變異原因不同分解為處理效應和試驗誤差,并做出數量估計.

以一次水質監測數據為例,探討方差分析的應用.共計五處監測點,每監測點取6個樣本,共計30個樣本.此例適用于單因素方差分析,探討不同監測點水樣大腸桿菌數目的差異(圖1A).將數據輸入為MATLAB變量EcoliNum(為6×5矩陣),在命令行中輸入boxplot(EcoliNum), 結果如圖1B所示.我們發現在水質監測點1中的大腸桿菌數目較之其它組有明顯的升高.在命令行中輸入[p,tbl,stats]=anova1(EcoliNum)以進行方差分析,結果如圖1C所示.通過方差分析表,引導學生區分組間和組內的方差和自由度.我們發現p=0.000 1,即拒絕方差分析原假設,認為至少有兩個水質監測點間的大腸桿菌含量存在極顯著差異.繼續進行多重比較,輸入multcompare(stats),結果如圖1D所示.鼠標點擊第1組數據,被點擊組別數據將會變藍,與藍色組有顯著性差異的組將變為紅色,無顯著性差異組為灰色.因此能夠判別第1組和第2-4組數據(紅色)之間存在顯著差異,而第1組和第5組(灰色)之間的差異不顯著(圖1D).用鼠標點擊其它組,通過顏色的判別,即可進行多重比較.此案例通過互動方式,加深了學生對方差分析和多重比較基礎理論的理解,也在一定程度上提高了學生解決實際問題的能力.

2 “生物統計學”實踐教學改革

隨著信息技術的發展,“生物統計學”的教學也應當隨之改進.十三五規劃中指出:“踐行知行合一,將實踐教學作為深化教學改革的關鍵環節”.當下高等院校的“生物統計學”教學中往往機械的對理論進行講解而不重視實踐能力培養,從而使得學生僅僅學到了理論知識點,而不具備知識運用能力[10].所以,注重實踐教育是擺在高等院校生命科學專業“生物統計學”課堂教學的緊要任務.那么,引入軟件演示教學輔助理論分析,對數據進行合理解釋,提高學生實際上機操作時間,這些舉措可以顯著提高學生的動手實踐能力,從而實現學以致用[11].

A.SPSS繪制散點圖;B.MATLAB繪制散點圖圖2 SPSS和MATLAB散點圖比較Fig.2 Comparison of Scatter Plots in SPSS and MATLAB

目前廣泛使用的統計學軟件有SAS,Excel,R和SPSS.Excel的統計分析功能較為簡易,不過Excel表格作為常用的一種數據存儲方式,使用Excel進行數據分析也是一種便捷的方式.SAS是最為專業的統計學軟件,商業軟件SAS統計分析方法全面,但是SAS的統計分析絕大多數需要進行編碼操作,且缺少友好的用戶圖形界面,不易被掌握,所以不利于課堂教學中使用.R語言屬開源性質,具有不斷完善的統計分析包,所以常規數據統計分析可用R語言實現.R語言可實現內部循環,從而可對高通量數據進行模擬分析.但用R語言進行統計分析需編寫代碼,不適用于初學者.SPSS具有友好的用戶圖形界面,分析方法較為全面,無須進行編程,操作簡便易行.因此,在一般的“生物統計學”課堂教學中,SPSS是較為理想的選擇.不過值得注意的是,上述四種統計學軟件的繪圖能力非常薄弱,而統計數據和分析結果的展示又是十分重要的環節.所以,筆者推薦使用MATLAB進行統計分析.MATLAB作為一種高級語言,亦可實現循環操作;其統計工具箱經過不斷完善,已頗具規模,包括了常用的統計分析方法.另外,MATLAB中生物信息學和系統生物學工具箱也包含了豐富的高級統計學方法,可以為生物學研究提供強有力的輔助.以圖1所示的方差分析為例,SPSS進行多重比較需讀取表格輸出中的大量數據;而MATLAB既提供了豐富的數據并記錄于輸出變量中,同時也提供了一種互動的方式,通過鼠標點擊進行組間差異性的統計推斷.因此,MATLAB的統計分析更為多元化.值得注意的是,MATLAB的繪圖能力非常強大,圖譜美觀,可提升對原始數據的展示效果.以散點圖為例,使用SPSS繪制散點圖僅提供了散點位置信息,其同時展示多重信息的能力較弱(圖2A);而使用MATLAB命令scatterhist,既能展示散點位置,也能同時對數據分布特征進行描述.如圖2B中提供了一種變量x和y的核密度估計(kernel density estimation),能夠同時反映數據的分布特征.另外,通過調整scatterhist輸入參數,亦可同時繪制變量箱線圖和直方圖.雖然MATLAB需編寫腳本,但其語法較之R和SAS大為簡化,教師亦可提供編寫好的腳本提供給學生,從而方便學生使用MATLAB進行統計分析.綜上所述,筆者認為針對有興趣的學生,可適當引入MATLAB進行統計學實踐教學,進而為今后的科研工作中使用MATLAB高級分析功能奠定基礎.

3 “生物統計學”教學改革的效果探索

A.不同教學班級成績分布;B.平均分的變化;C.學生評教分數變化圖3 近四個學年“生物統計學”教學效果統計Fig.3 Statistics for Teaching Effects in the Last Four Academic Years

以上提到的三種方法,即統計學史融入、問題驅動式教學和加強統計學軟件應用,對其效果的檢驗需要進行教學實踐.筆者通過近四年來10個教學班級的教學實踐來推斷“生物統計學”教學改革的效果.

2016-2017年和2017-2018學年,筆者共負責6個教學班的“生物統計學”教學工作.在這兩個學年中,筆者按照常規“生物統計學”教學授課方式進行教學,同時嚴格按照教材章節順序介紹生物統計學相關內容.結果顯示,這6個班級的“生物統計學”期末總評分數除2017-2018學年某班級成績顯著降低以外,其余班級分數較為平穩(圖3A).班級的平均成績多維持在接近70分的水平(圖3B).另外,考察學生的評教分數側面反映了學生對課程的興趣.筆者發現隨著時間的推進,學生對“生物統計學”的教學認可度和學習興趣總體上也有逐漸降低的趨勢(圖3C).生命科學相關專業的學生數學基礎較為薄弱,僅具有一般的簡明微積分基礎.而“生物統計學”公式概念較多并具有一定難度,所以學生在學習“生物統計學”過程中容易形成不良情緒,這種情緒會嚴重影響學生對課程的掌握.以上事實促使筆者進行教學模式思考,并嘗試同時引入統計學史教育、問題驅動式教學和豐富軟件運用多種手段.筆者近兩年即2018-2019學年和 2019-2020學年第一學期進行了統計學史融入課堂教學的實踐,同時設計問題,引導學生對實際問題進行思考和分析,指導學生使用SPSS進行數據統計,并引導有興趣的學生使用MATLAB.在保證學生能夠理解的前提下,對相關理論進行推導,同時介紹歷史上的統計學家對相關問題的討論,指出教材中內容介紹的錯誤和局限性;不受限于指定教材的章節安排限制,適當調整章節介紹順序以適合歷史發展規律等.通過近兩年的教學實踐,筆者發現學生的成績有顯著的提高,且平均成績升至80分左右(圖3A和3B,紫色,Kruskal-Wallis檢驗,p=2.355 3×10-24).而進行統計學史融入,進行問題驅動式教學和豐富統計學軟件應用之后,四個班級之間學生成績則沒有顯著差異(圖3A,紫色,p=0.973 0).另外,學生的評教分也具有較為明顯的提升(圖3C),表明學生對教師教學的認可程度和對課程的興趣都具有一定的改善.因此,通過教學實踐,筆者認為統計學史融入、問題驅動式教學和豐富生物統計學軟件的應用可能對提高學生的統計學素養具有積極影響.

4 提高“生物統計學”教學效果方式思考

基于統計學史融入教學、問題驅動式教學和加強統計學軟件應用的“生物統計學”教學方式改革取得了較好的教學效果.問題驅動式案例教學引起了學生普遍的關注,提升了學生學習興趣,舒緩了課程壓力.值得強調的式,國外學者對統計學史融入數學教育進行了深入的探討.雖然統計學史融入的必要性得到了較為廣泛的支持,但如何融入實踐教學中仍然具有一定的討論空間,是不斷發展的一個課題.值得注意的是,統計學史融入課堂教學的教學實驗可以基于情感因素,即在課堂中利用部分時間介紹統計學史和背景;也可以基于認知方面,即通過統計學史融入的案例研究來觀察學生的心智圖像是否得到顯著增強.顯然,前者的教學實驗的數量多于后者,這可能與后者的研究方法較為復雜有關.所以,從情感和認知兩方面研究統計學史的融入效果將會是一個新的挑戰.值得注意的是,筆者關注的是這三種途徑的綜合效果而并未嚴格設計統計學試驗探討其中某種途徑或交互作用的顯著性影響.通過精確的試驗設計,即設置對照組和處理組可能會影響到不同分組內學生對“生物統計學”的學習效果.筆者的最終目的是提升學生對“生物統計學”的學習興趣和知識掌握程度,從而有別于一般的統計學試驗.同時,在學校政策允許的范圍內,適當增加實踐操作技能考核的比重(如增加至總評成績的30%),弱化“生物統計學”理論也是一種潛在的行之有效的教學方法,不僅能夠提升學生的學習興趣,而且能夠強化學生的實踐能力.另外,將“雨課堂”融入“生物統計學”教學也是一種可行的方式.師生通過“雨課堂”APP,在課前-課中-課后的每一個環節開展討論,師生互動不下線,促進教與學的活躍氣氛,提升課堂效率.但“生物統計學”由于具有數學類學科的屬性,注重演化,在板書上進行推導仍然起到關鍵性作用[13].因此,“雨課堂”的引入需要以一種混合的方式,即線上和線下交融的方式進行.將在線教育與課堂教學靈活結合,使在線和傳統教學達到優勢互補.混合式教學在“生物統計學”的應用既能使教師起到監督作用,同時也能夠體現學生的積極性和主動性.這些設想需要在今后的教學實踐中進行嘗試.只有不斷地進行創新改革,才能更好的提升“生物統計學”課程的教學質量,為今后培養專業的具有較強實踐能力的生物統計學人才奠定堅實的基礎.

猜你喜歡
優度生物檢驗
生物多樣性
生物多樣性
上上生物
勘 誤 聲 明
如何正確運用χ2檢驗
——擬合優度檢驗與SAS實現
第12話 完美生物
對起重機“制動下滑量”相關檢驗要求的探討
電梯檢驗中限速器檢驗的常見問題及解決對策探究
基于多級優度評價方法的導彈武器系統效能評估
關于鍋爐檢驗的探討
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合