?

假設檢驗的基本思想和有關概念的教學設計

2022-07-08 13:29魏滿滿李石虎周勤
數學學習與研究 2022年8期
關鍵詞:含金量假設檢驗項鏈

魏滿滿 李石虎 周勤

【摘要】本文主要探究了假設檢驗的基本思想和有關概念的教學設計.首先,通過“女士品茶”的故事引入,提煉出假設檢驗的基本思想;其次,通過分析項鏈含金量這一實際案例總結出假設檢驗的基本步驟,并介紹了假設檢驗的兩類錯誤和p值的概念;最后,融入思政的元素,豐富了課堂教學內容.

【關鍵詞】假設檢驗;教學設計

【基金項目】 江蘇師范大學課程思政專項研究(KCSZY17);江蘇師范大學數學與統計學院思政示范課程(XYKCSZ01)

一、引 言

概率論與數理統計課程是各個高校理工科的基礎必修課,它在理工科及經管類各專業被廣泛應用.假設檢驗是概率論與數理統計中的重要知識點,是統計推斷的主要方法之一,在概率統計的理論研究與實際應用中都占有極其重要的地位.2019年3月18日,在學校思想政治理論課教師座談會上,習近平總書記明確提出[1]:要堅持灌輸性和啟發性相統一,注重啟發性教育,引導學生發現問題、分析問題、思考問題,在不斷啟發中讓學生水到渠成得出結論.近年來,各大高校都十分重視思政建設,通過教師培訓、專家講座、示范課程等多種方式來加深教師對課程思政的理解.教師是高校的“第一主角”,作為專業課教師,也有責任和義務認真挖掘所授課程的“思政元素”.例如,2021年,李晨和陳麗萍[2]在研究概率統計的思政元素時,以概率學者的文化素養和科學治學精神為切入點,通過多個實際案例剖析全概率公式的應用,潛移默化地引入諸多思政元素來激發學生的學習興趣.受此啟發,本文著重從概率論與數理統計課程中 “假設檢驗”這一角度思考,通過教學設計來探索課程思政理念進概率統計課堂的實踐方法,目的就是同大家交流如何上好“假設檢驗”這一知識點的教學課.

首先,我們通過“女士品茶”這一廣為流傳且富有趣味性的故事引入,啟發學生思考,從中提煉出假設檢驗的基本思想.其次,我們通過分析項鏈含金量這一實際案例總結出假設檢驗的基本步驟.接著,我們介紹假設檢驗的兩類錯誤和p值的概念,并介紹假設檢驗的一些應用.最后,我們融入思政的元素,以我國著名數學家嚴加安院士的《悟道詩》為結尾,闡述了概率統計的基本思想,同時激勵學生向老一輩科學家學習,樹立正確的價值觀,從而豐富了課堂教學內容.

二、教學過程

(一)問題引入

首先,我們從一個經典故事出發,來體會假設檢驗的基本思想.

例1[3] ?(女士品茶試驗)故事發生在英國劍橋大學,那是20世紀20年代,一群大學精英們正在品茶.該茶是由牛奶和茶水混合而成的.在品茶過程中,一位女士宣稱:先加入牛奶還是先加入茶,不同的順序會使茶的口感不同.周圍人都認為這位女士簡直是在胡言亂語,這是不可能的??!然而在場的統計學家Fisher卻對這個話題很感興趣,他請人端來10杯調制好的茶讓該女士品嘗,其中有的是先加的牛奶,有的是先加的茶.結果,這位女士正確地鑒別出每一杯茶的制作順序.該如何判斷該女士是否有鑒別能力呢?

Fisher的想法:假設該女士沒有鑒別能力,這個時候她只能靠猜,從而她猜對的概率為1[]2.因此,她能同時判斷出10杯茶的概率為2-10<0.001,這個概率非常非常小,僅僅做一次試驗是幾乎不會發生的,可是,它卻發生了!這表明原假設不恰當,應予以拒絕,認為該女士有鑒別能力!

假設檢驗的基本思想:小概率反證法思想.先提出假設,然后設計試驗,在原假設成立的條件下計算概率,依據小概率原理來判斷是否拒絕原假設.那么多大的概率屬于小概率呢?對于不同的問題,會有不同的標準,在統計學中,這個小概率稱為顯著性水平,常取0.05或0.01.

接下來,我們就通過生活中的一個實際案例來探索一下假設檢驗的奧秘.

(二)實例分析

在生活中,經常會遇到一組數據,我們來看下面的例子.

例2[4] 質檢部門接到投訴后,對某金店進行調查,從標有18K的一批項鏈中抽取20條,測得其含金量如下:

問:如何判斷這批項鏈有沒有達到標準呢?(顯著性水平α=0.05)

分析:觀察表1中的數據,我們可以發現:有的含金量大于18K,有的含金量小于18K,還有的恰好等于18K.那么我們能否直接說和標準值18K有顯著差別呢?根據所學的統計學思想方法,我們已經了解到答案是否定的,因為這里看到的只是樣本數據,我們無法直接做出判斷.那么應該如何判斷呢?

我們的思路如下:

首先,計算出這20條項鏈含金量的平均值為17.8,它與標準值18存在0.2的差值.這0.2的差值是由抽樣引起的誤差,還是有本質的差別?我們利用上述思想來檢驗一下.

令ξ表示這批項鏈的含金量,由中心極限定理可知ξ~·N(μ,σ2),我們要檢驗均值是否為μ=18,具體步驟如下:

1.建立假設.原假設H0:μ=18,表示這批項鏈符合標準;與之對立的備擇假設H1:μ≠18,表示這批項鏈不符合標準.

2.在H0成立時,由Fisher定理可知統計量

T=-μSn[]n~t(n-1)=t(19).

3.由T分布圖像(如圖1)可以看出:T的取值集中在零點附近.這表明:|T|越大,對應的概率就越小.從而存在臨界值C,使得|T|大于或等于C是一個小概率事件,則C要滿足

P(|T|≥C|H0成立)=α,

再由T分布圖像的對稱性可知

C=t0.975(19)≈2.093.

從而,當|T|≥2.093時,非常小的概率事件在此就發生了,只能拒絕原假設H0.

我們將W={(ξ1,ξ2,…,ξn)||T|≥2.093}這一集合稱為拒絕域,如果樣本的觀測值落到W中,則原假設應被拒絕.

4.代入樣本均值和樣本標準差進行計算,得到所觀測的樣本統計量t的值:

|t|=|17.8-18|0.40393[]20≈2.214>2.093,

其落到拒絕域W中,因此原假設被拒絕,故這批項鏈沒有達到標準.

為了更直觀地理解拒絕域的含義,同學們可以參考T分布圖像.

小結 本案例利用假設檢驗思想得出了該金店項鏈的含金量不符合標準的結論,啟發我們對待任何事情都不要抱有僥幸心理,不要弄虛作假,要誠信做人做事,方能贏得大家的信任.項鏈含金量不達標可能只是使消費者金錢方面的利益受損.試想一下:如果是某大型嬰兒奶粉企業檢測出質量不達標的產品呢?再或者是嬰兒霜經檢測含有毒物質呢?抑或是我們服用的某種藥物檢測出有危害健康的成分呢?這些案例都不是捕風捉影,均上過各大網站熱搜,引起了消費者的恐慌.利用假設檢驗這個工具,有助于我們全面地認識這類事件,既可以讓我們避免無謂的損失,又可以幫助我們找到有利的取舍依據.

(三)假設檢驗的基本步驟

通過對上述案例的分析,我們可以歸納出求解假設檢驗的基本步驟:

第一步:從要研究的實際問題引入,先提出一個假設,一般稱之為原假設,記為H0,與其對立的假設稱為備擇假設,記為H1.例如,在上述案例中,原假設為“這批項鏈符合標準”,備擇假設為“這批項鏈不符合標準”.

第二步:依據所研究總體服從的分布,我們來構造合適的檢驗統計量,并通過所學知識來確定統計量服從的分布.

第三步:接下來,我們需要確定檢驗的拒絕域W使得

P((ξ1,ξ2,…,ξn)∈W|H0成立)≤α.

第四步:根據樣本數值計算統計量所對應的觀測值.如果計算所得觀測值落進了W中,則說明原假設不當,應予以拒絕,否則原假設不可以被拒絕.

(四)假設檢驗的兩類錯誤

在“女士品茶”的例子中,如果該女士本來就沒有鑒別能力,但是她運氣好,每次都猜對了,這時候我們的推斷就出錯了.事實上,在假設檢驗問題中,我們由樣本提供的信息來推斷總體信息,由于樣本只包含總體的一部分信息,這就不可能保證從來不會犯錯誤.假設檢驗可能犯的錯誤有如下兩類:

(Ⅰ)是否在 “拒絕假設H0” 時用了“小概率原理”.注意小概率事件并非不可能事件,如果原假設本為真,但由于樣本值落進了拒絕區域內而得出“拒絕”的結論,這里犯的錯誤為棄真錯誤,通常稱為第一類錯誤,記為α,即

P(拒絕H0|H0為真)=α.

(Ⅱ)反之,如果原假設H0本來是不成立的,卻由于樣本值未落進拒絕區域而得出“不能拒絕”的結論.這里的錯誤是納偽錯誤,一般稱為第二類錯誤,記作β,即

P(接受H0|H0不真)=β.

根據檢驗法則知:當H0成立時,拒絕H0的概率小于或等于顯著性水平α,但是顯著性水平α取得越小越好,因為此時拒絕域也會相應地減小,從而導致犯第二類錯誤的概率增大.這是一個矛盾的雙方,類似于區間估計時的做法,我們需要先固定顯著性水平α,再選擇合理的檢驗統計量來適當地減小β的值.

下面我們再結合一個實際例子來理解兩類錯誤:在新冠肺炎疫情發生初期,新聞報道中時常會出現“假陽”的檢測結果.我們可以從假設檢驗的兩類錯誤的角度來理解:事實上,任何檢驗方法都會存在犯錯誤的可能性,理想的試劑應是“假陰”和“假陽”出現的概率都越小越好,但當樣本量有限、檢測技術沒有明顯優化提升時,一類錯誤概率的減少必會導致另一類錯誤概率的增加,因此處理原則是:人為限定犯第一類錯誤的概率α,為降低犯第二類錯誤的概率,我們可以增大樣本容量.所以,從統計學的觀點看,新聞報道中的“假陰”“假陽”患者出現并不奇怪.

啟發:小概率事件雖然在一次試驗中不易發生,但絕非不可能事件,重復次數多了,發生的可能性也就增大了.這說明做任何事情都不要存在投機取巧的心理,俗話說“常在河邊走,哪有不濕鞋”“勿以惡小而為之,勿以善小而不為”.反之,再困難的事情,只要我們持之以恒,總是可以成功的,正所謂“鍥而不舍,金石為開”!

(五)假設檢驗的p值

可以看出,顯著性水平α變小,對應的拒絕域也會變小;當顯著性水平α取得足夠小時,使得樣本值不落在相應的拒絕域中,從而在此顯著性水平α下不能拒絕假設H0.當顯著性水平α由上述足夠小的值不斷增大時,對應的拒絕域也會變大,當顯著性水平α大到一定程度時,便可以使樣本值落入相應的拒絕域中,從而在此顯著性水平α下可以拒絕假設H0.

對于一個確定的樣本值,存在一個實數p(0<p<1),當顯著性水平α=p時可以拒絕H0,而當α<p時原假設H0不可以被拒絕.可見,p是使依據給定樣本數值做出“拒絕H0”的最小的那個顯著性水平,我們稱之為檢驗的p值.

在例2中,我們也可以通過統計軟件計算t統計量的值和p值:

給定顯著性水平α為0.05,由表2可知p值0.039<0.05,原假設應被拒絕,認為項鏈含金量與18K之間有顯著的統計差異,從而得出“項鏈不符合標準”的結論.

(六)課堂小結與思政

本節課我們主要通過“女士品茶”的案例引入假設檢驗的基本思想,通過分析項鏈含金量這一實際案例總結出假設檢驗的基本步驟,也給出了假設檢驗的兩類錯誤和p值的含義,這為接下來進一步學習不同類型的、具體的假設檢驗打下了必要的基礎.

假設檢驗不僅是一種重要的統計方法,更是一種思維方式,告訴我們用數據來說話,理性地看待問題.正因為如此,假設檢驗在我們的現實生活中有著十分重要的應用.比如,專家利用假設檢驗,結合臨床數據分析不同采樣點、人群、年齡的新冠病毒核酸檢測的結果,給有關部門的決策提供參考.假設檢驗的理論方法不僅被廣泛應用于醫學檢驗、生物制藥等諸多領域,在我們的生產生活,特別是工業產品的質量判斷中也有著十分廣泛的應用[5],因為在工廠的實際生產過程中,產品的尺寸總是左右浮動的,存在一定的誤差,那么如何判斷這些誤差是否在允許的范圍內?這就要用到假設檢驗的思想方法.不僅如此,假設檢驗的理論還可應用于文學研究.例如,東南大學韋博成教授在2009年[6]利用假設檢驗的理論方法分析了《紅樓夢》前80回與后40回的某些文風差異,得到的結論是“這兩部分內容在寫作風格方面存在明顯的差異”,給關于《紅樓夢》作者的論斷提供了一個強有力的證據.在現實生活中,數據是無處不在的,學習假設檢驗的思想方法有助于我們正確地挖掘數據背后的規律,做出更客觀的判斷.

如今,我們身處一個大數據時代,通過學習假設檢驗,更重要的是培養透過現象看本質這一統計思維.這里,調查得來的數據是現象,規律是從數據中探索出來的本質屬性.我們需要借助數學模型,并結合統計方法來尋找這其中的規律和隨機性,在潛移默化中培養統計思維.正如我國著名的數學家嚴加安院士在《悟道詩》中所題:隨機非隨意,概率破玄機;無序隱有序,統計解迷離.

注:課后同學們若想進一步了解統計學的發展歷程,可以讀一讀《20世紀統計怎樣變革了科學:女士品茶》[7] 這一科普著作.

【參考文獻】

[1]習近平主持召開學校思想政治理論課教師座談會[N].新華社,2019-03-18,20:57.

[2]李晨,陳麗萍.概率論與數理統計課程教學中思政元素的挖掘與實踐[J].大學教育,2021(9):104-106.

[3]茆詩松,程依明,濮曉龍.概率論與數理統計教程:第3版[M].北京:高等教育出版社,2019.

[4] 朱元澤,李賢彬.概率論與數理統計[M].上海: 上海交通大學出版社,2015.

[5] 喬靜.假設檢驗在工業產品質量判斷中的應用[J].機電信息,2020(27):142-143.

[6] 韋博成.《紅樓夢》前80回與后40回某些文風差異的統計分析(兩個獨立二項總體等價性檢驗的一個應用)[J].應用概率統計,2009(4):441-448.

[7] 薩爾斯伯格.20世紀統計怎樣變革了科學:女士品茶[M].北京:中國統計出版社,2004.

猜你喜歡
含金量假設檢驗項鏈
丟失的項鏈
品牌專家郭守祥:若要品牌強又響必須提高“含金量”
紡織行業最高科技獎提高含金量
環京城的“月季項鏈”來自哪里?
找項鏈
中國經濟增長含金量提升
統計推斷的研究
雙冪變換下正態線性回歸模型參數的假設檢驗
Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
統計學教學中關于假設檢驗問題探討
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合