?

指向統計素養培育的中學數學教學策略

2024-04-25 23:07杜平
現代基礎教育研究 2024年1期
關鍵詞:回歸模型概率統計

杜平

摘 ? 要: 統計素養是中學生數學核心素養的有機組成部分。針對培養學生統計素養的關鍵環節,以案例形式設計了對應的教學策略。首先,建立統計觀念環節,涵蓋了古典概率和非古典概率模型;其次,收集統計數據環節,涵蓋普查獲取數據和抽樣獲取數據;最后,分析統計數據環節,涵蓋線性回歸和非線性回歸。

關鍵詞: 統計素養;數據獲??;概率統計;回歸模型

培養學生統計素養的價值,隨著時代的發展體現得愈益顯著。具備統計素養能夠更好地理解和應用統計數據,統計素養是適應現代社會發展不可或缺的一種素養。時至今日,隨著信息化大數據時代的來臨,統計學知識和統計素養更是在政府部門決策評估、商業貿易、科學技術應用乃至公眾生活中發揮著越來越重要的作用。因此,培養中學生的統計素養,使其學會收集、整理、分析和解讀各種數據,有助于他們養成敏銳的數據意識,從而對他們未來的工作和生活形成至關重要的素質支撐。有鑒于此,統計素養是中學生數學核心素養和綜合能力發展的有機組成部分。本文試圖結合多年的中學數學教學經驗,探討統計素養培育的教學策略。

一、中學數學教學中統計觀念的建立

對隨機現象的觀測和樣本數據的定量分析是認識世界的根本出發點,統計學家博克斯將統計描述為“新知和發現的催化劑”。1 統計素養是世界各國基礎階段數學教學都較為重視的一個面向,其具體內涵指的是學生具備應用統計學知識和技能進行問題解決、數據分析和推理的能力。概言之,統計素養作為一項重要的跨學科能力,是中學生數學核心素養和綜合能力發展的體現。在我國,在統計教學方面的實踐和研究亦早已有之,譬如詹麗等闡述了如何有效提高學生對統計學的理解和應用能力,并提供了一些具體的教學實踐案例,以幫助讀者更好地理解和應用中學統計教學目標。2 但鑒于基礎教學和學生素質的區域性差異,以及不同學校和教師教學策略的不同,采取的方法和方式也不盡相同,唯有進一步對統計學素質培育的教學實踐進行反思性歸納,才能總結出一套行之有效的方法,促進我國中學數學統計素養的培育。

我國今天中學數學教學中統計素質教育的培育,常見的數據獲取方式為必修課程統計教學中實施隨機實驗,并結合案例加以分析,譬如擲硬幣、擲骰子實驗等。

1.擲硬幣實驗

伯努利實驗是課堂上首選的經典隨機實驗,它可以通過拋擲硬幣或擲骰子來實現,該實驗是在古典概率框架下的隨機模型。該實驗可以控制拋擲硬幣的初始高度、速度和環境等因素,堪稱是設計方式獲取數據的典型例子。

擲一枚硬幣——單枚硬幣多次拋擲和多枚硬幣同時拋擲,其結果必然是隨機的,我們可將之定義為相應的隨機變量X,如果正面出現,則X=1;反面出現,則X=0。教師要求學生控制硬幣的初始狀態,重復實驗,每次實驗都是獨立的,將得到簡單樣本X1,…,Xn和相應的觀測值x1,…,xn。由此,可以觀察到正面朝上的頻率,以及頻率隨著實驗次數的變化情況。

擲硬幣實驗教學可以幫助學生理解大數定律和頻率的穩定性,考慮到課堂教學的時間限制,可同時拋擲多枚硬幣,記錄數據。同時,教師可要求學生思考這兩種實驗方式是否等價。樣本會使波動漲落趨緩,學生通過觀測頻率隨樣本容量的增大而帶來的穩定性,能夠更直觀理解大數據時代統計方法的有效性。

2.擲骰子和硬幣的復合實驗

在上面所述的教學案例中,擲硬幣實驗只能構造出符合古典概率模型的樣本空間,但事實上,并非所有的統計情境都符合古典概率模型,因此,需要創建非古典的統計情境。其中一個有效的策略是將兩個隨機實驗復合,從而得到一個非古典概率模型。

拋擲一枚骰子,如果得到的點數為2到6,直接記錄點數;如果得到的點數是1,則拋擲一枚硬幣,當出現正面,則記錄點數1,出現反面,則記錄為點數6。隨機變量X定義為記錄的點數,那么就是通過擲骰子和擲硬幣實驗的復合,設計得到了一個非古典概率模型:出現1的概率將減小,出現6的概率會增大。而其余點數出現的概率不變。實驗的結果同樣可以得到簡單樣本和觀測值:X1,…,Xn與x1,…,xn。通過頻率的統計,學生可將其與理論結果進行比較,由此證實大數定律(頻率可近似估計概率)。同時,可計算點數的樣本均值,并把計算結果和理論計算得到的均值比較,理解一般大數定律的結論(樣本均值可近似估計均值),這也為理解用樣本的數字特征估計整體即矩估計方法做了鋪墊。

結合以上隨機實驗,學生可以學習到如何設計隨機實驗來收集數據,并運用數據分析來推斷概率,估計均值等參數,這對理解統計的思想和方法極有幫助。同時,學生利用計算機來實現隨機現象的模擬再現,為以后的統計學習和應用做充分的準備。而古典概型實驗設計,可以幫助學生理解隨機現象所產生的復雜性:各種不同簡單隨機因素的共同作用會導致出現復雜的現象。如何有效合理獲取數據是中學統計教學中的重要內容,對這些隨機實驗的數據分析探索,也可以幫助學生理解概率統計中的一個基本觀念:概率不是純粹由數學理論確定的量,而是現實世界中的一個物理量,應該通過對隨機現象的觀測來確定概率,統計的應用基礎在于數據的獲取。

二、中學數學教學中統計數據的獲取

現實世界中隨機現象的產生原因極其復雜,很難去人為控制。更有現實意義的數據往往來自對隨機現象的直接觀測。如何在課堂教學中找到這樣的實例?日常生活中可以方便獲取得到的身高、體重等數據,無疑是適切而便捷的實例。譬如在起名字時,名字的字數是否隨機的?名字與地域環境是否有密切的關系?身高統計調查同樣蘊含著很多意義,譬如家族遺傳、飲食習慣或營養水平等。

首先,名字字數。名字字數不是一個敏感性問題,學生很容易在課堂上得到統計數據。定量記錄結果為:如果學生名字是單名,則隨機變量X=1,不是單名,則X=0。這樣就可得到整個班級的樣本和觀測值:X1,…,Xn與x1,…,xn。教師引導學生思考這些問題:名字字數是否隨機的?是否真正存在這樣一個定量描述的概率?如何估計X的概率分布?同時課前可準備一份全年級和全校的學生名冊,進一步比較年級、全校的相應統計數據得到的估計值,以探討樣本容量的影響。數理統計與一般觀念下的統計并不完全等同,頻率的觀念只有針對簡單樣本才是有效的,這是統計理論分析中的一個重要的前提條件。概率理論中的隨機現象除了結果的不可預測之外,還需要觀測過程的可重復性。教師可以鼓勵學生思考隨機現象產生的原因,例如“概率是主觀還是客觀的”等問題。在后續課程中,學生可以直觀深入理解總體和樣本這些統計中基本概念的含義。

針對收集到的學生名字數據,學生在教師的引導下可以思考估計單名的概率問題。在中學統計課堂,根據學生名字的單字和雙字的數據收集,學生得出了一些有關名字分布的統計結果。比較樣本容量對估計的概率的影響,即在提供年級和學校的學生名單中比較所得到的結論。這種以自然方式收集數據的實踐,不僅讓學生參與統計學的學習,而且更好地理解統計學是如何應用于實際生活中。

其次,有關身高分布調查及相關問題。由于受到調查時間、社會資源等因素的限制,取得獨立有效的數據是有一定難度的。例如,從家族中收集的樣本不具有獨立性,會得到不同的概率估計值,因此,教師可引導學生進一步理解簡單樣本的重要性。通過學生的參與和數據收集,我們可以應用統計技術來分析和理解,真實世界中的有些現象和問題無法代表整個中學或整個國家的情況。未來的研究可以擴大樣本規模,并考慮其他因素,如地域、文化背景等,以獲得更全面和準確的結果。

因此,根據學生的實際情況布置適切的統計任務十分關鍵。教師可以要求學生通過調查、觀察或實驗等方式使用簡單抽樣方法收集數據,即從整個群體中隨機選擇一部分樣本進行觀察和測量。學生可以選擇感興趣的主題,并自己設計數據收集方式。結果學生提交了各種各樣的數據收集作業,涵蓋不同的主題和問題。如,有的學生隨機選擇了30名同伴并測量他們的身高,通過計算平均身高、制作直方圖和計算身高的范圍,學生得出了關于班級身高分布的結論。

通過作業收集數據,學生不僅能夠應用統計學技術來分析數據,還能夠培養觀察和實證研究技能。此外,簡單樣本的選擇應當具有代表性,能夠準確反映整個群體的特征。通過使用簡單抽樣方法,學生盡可能地避免選擇偏差,從而使樣本更具代表性。簡單樣本的收集相對容易實施,但要求具有可行性,特別是在中學水平的統計課程中。學生可以通過選擇小規模的樣本,減少數據收集的復雜性和難度,使統計分析更加可行。在數據處理方面,學生可以使用基本的統計技術,如計算平均數、制作簡單圖表等,對收集的數據進行分析和展示。這有助于學生理解統計學的基本概念和數據處理方法。因此,這種實踐有助于學生將統計學應用于實際問題中,并為他們未來的學習和研究打下堅實基礎。

通過對這些數據的搜集調查,我們可以進一步追問身高數據背后的遺傳學問題,即遺傳學中的高爾頓問題:父代和子代的身高之間有什么關系?記父代身高為X,子代的身高Y,通常Y不是X的函數,那么,是否可通過X估計Y的值?

在繪制父代和子代的身高數據散點圖時,學生會遇到這樣的情況:同一個回歸變量的觀測值,會對應不同的響應變量值。由此,引導學生從中領悟回歸模型和確定性函數關系的不同:回歸變量和響應變量不是一種因果關系,對于回歸模型自身而言,哪個量作為回歸變量,哪個作為響應變量都是有意義的,回歸模型要解決的僅僅是兩種現象之間的關聯性?;貧w模型中,回歸和響應變量都是隨機的量,會有波動,觀測到的這種情況正是波動性的體現。在現實世界中,我們會觀測到大量的回歸現象:觀測值有向平均值回歸的趨向。

三、中學數學教學中統計數據的分析

科學研究并不是從結論出發的,而是從觀測到的現象出發,進而對之進行歸納,從中觀察深層次的因素或規律性的東西。數據的收集是和研究的問題相關聯的??茖W研究的一個重要的問題是探索不同現象之間的相互聯系。兩個隨機變量之間是否具有相關性?能否由一個隨機變量的觀測值來估計另一個隨機變量的值?在自然方式獲取數據時,也許并不清晰知道將要探討的具體問題是什么,會有什么樣的結論,所以必須盡可能全面記錄信息數量。對此,教師不妨在教學過程中引入一些學生感興趣的話題,引導學生在這些話題當中發現統計現象,從而進行深入研究。

球隊成績問題無疑是學生熟悉且感興趣的話題。一個常見的現象是,當球隊成績在低谷時更換教練,短期成績也許會有提高,有可能教練確實帶來了新理念,提高了球隊的戰術水平,但也有可能僅僅是回歸現象:球隊低谷時的成績不是其真實平均水平,成績的提高只是向平均水平回歸。是否與更換教練有關,需要長期的觀測和評價,才能確定新教練是否真正提高了球隊水平。學生可以思考其他可能影響球隊成績的因素,并提出假設,進而收集球隊成績和相關因素的數據得出結論。

針對上述問題可以通過繪制散點圖和計算相關系數來分析。在學生前期的數據收集中,得到樣本和觀測值:(X1,Y1),…(Xn,Yn)與(x1,y1),…(xn,yn),當觀測值[(x1,y1),…(xn,yn)]形成的散點圖具有線性函數的形態,可把問題歸結為這樣的問題:確定線性函數Y=aX+b+e作為由X估計Y的函數,這里,稱X為回歸變量,Y為響應變量,e是偏差,理想情況下希望e~N(0,s2)。換言之,當確定了a、b值后,當觀測到回歸變量的值為x時,就以[y=ax+b]作為相應響應變量y觀測值的估計值。

回歸模型僅僅是選擇回歸變量的某個函數來估計響應的響應變量的平均值,而線性回歸僅僅是選擇線性函數ax+b作為估計函數。理解了回歸模型的基本思想,學生可舉一反三,思考線性回歸模型推廣的可能性:是否可以在aH(x)+b中,選擇其他的函數類型,例如H(x)=x2,[x,logx,ex],……,甚至非線性的回歸,eax+b+c等。而選擇哪一類函數,應該根據觀測數據來分析判斷。這樣,學生在運用回歸分析建立模型時,就不會照搬線性回歸模型的公式,而是通過對得到現象觀測的觀測數據分析,真正找到合理的模型。掌握了線性回歸模型的基本方法后,需要解決的問題就成為如何選擇適當的系數a、b,在給定回歸變量后x后,相應響應變量的均值估計ax+b能最好地體現符合已得到的觀測數據。

四、反思總結

上文為建立統計觀念、收集統計數據、分析統計數據這三個培養學生統計素養的關鍵環節,以案例形式設計了對應的教學策略。在建立統計觀念環節,案例包括古典概率和非古典概率模型;收集統計數據環節,案例涵蓋普查獲取數據和抽樣獲取數據;分析統計數據環節,案例分為線性回歸和非線性回歸。

通過對上述高中數學課堂教學中統計素養培育的案例探索和研究,可以發現在統計教學中設計恰當的統計情境,引導學生獲取數據并進行統計分析,對統計素養的培育起關鍵作用。圖1為指向統計素養培育的統計教學策略模型。

為培養學生提出問題、分析問題的能力,教師還可以提出以下教學反思:為什么選擇偏差平方和最???是否有其他選擇的可能性?回歸分析是一個應用廣泛的統計模型,可啟發學生探討諸如價格和銷量之間的關系,學習時間和學習成績之間的關系等問題。針對后者,可提出以下子問題:

1.是否需要分別考慮性別的因素,即男性和女性會有不同的回歸系數?

2.是否可考慮選擇母親作為回歸變量?

3.是否可同時建立選擇父親和母親的作為回歸變量,建立二元線性回歸模型[Y=aX+bZ+c]?

4.是否可由正規方程[y=ax+bz+ci=1nxiyi=i=1nxi(axi+bzi+c)i=1nziyi=i=1nzi(axi+bzi+c)]確定系數?與相應的最小二乘方法[mina,b,ci=1n(yi-axi-bzi-c)2]是否一致?

Middle School Mathematics Teaching Strategies for Cultivating Statistical Literacy

— Taking the Establishment of a Linear Regression Model as an Example

DU Ping

(Shanghai Shibei Middle School, Shanghai,200071)

Abstract: Statistical literacy is an organic component of the core mathematical literacy of middle school students. This study has designed the corresponding teaching strategies in the form of case studies to address the key parts in the cultivation of students statistical literacy. First,statistical concepts was given,covering both classical and non-classical probability models;then,the statistical data was collected, including both census data and sampling data;finally,statistical data was analyzed involving both linear regression and nonlinear regression.

Key words: statistical literacy,data acquisition,probability statistics,regression model

猜你喜歡
回歸模型概率統計
農村秸稈處理方式的影響因素
工科院?!陡怕式y計》課程的幾點教學體會
應用性本科院校概率統計課程教學改革的實踐與思考
國際旅游外匯收入影響因素分析
對概率統計有效教學的幾點認識
概率統計在高中數學中的應用
學生對翻轉課堂綜合評價的調查研究
城市空間用地擴展變化研究與規模預測
電子商務影響因素的計量分析
房地產價格影響因素實證分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合