?

新課標背景下中學生數學建模素養的測評研究*

2024-02-27 04:59李沐慧徐斌艷
全球教育展望 2024年1期
關鍵詞:編碼建模維度

黃 健 李沐慧 徐斌艷

一、 引言

數學建模是聯結現實世界與數學世界的橋梁,也是應用數學解決實際問題的關鍵。自20世紀60年代末以來,許多國家都將“數學建?!毕嚓P要求納入課程標準中。[1]數學建模教學不僅有利于學生更好地運用數學于不同領域,提升應用能力,還有助于學生更好地理解數學本身,促進知識學習。[2]我國的《普通高中數學課程標準(2017年版2020年修訂)》(以下簡稱為“《高中課標》”)將“數學建?!绷袨榱髷祵W核心素養之一并歸入必修課程內容。[3]2022年4月,教育部正式頒布的《義務教育數學課程標準(2022年版)》(以下簡稱為“《義務課標》”)延續了數學建模核心素養導向,并在小學和初中階段分別提出“模型意識”與“模型觀念”的關鍵詞,為數學建模素養培育指明路徑。[4]可見,基礎教育階段的數學建模教學勢在必行,如何貫通義務教育階段與高中階段的數學建模學習與評價是刻不容緩的問題。

“數學建?!币辉~首次出現于我國1996年的基礎教育階段數學教學大綱中,由數學教學長期強調的“解決實際問題”演化而來,二者是一脈相承的。[5]當然,數學建模并不完全等同于解決實際問題或應用題,因此,學生已有的能力基礎必然與當下期待培養的“數學建模素養”目標之間存在差距。正所謂“七次量衣一次裁”,明晰學生基礎與教學目標之間的差距,才能更好地開展教學,更好地連接不同學段的建模素養培育。為此,研究基于《高中課標》和《義務課標》對數學建模素養的界定與要求,構建相應的評價指標體系,在全國范圍開展測試,通過實證調查分析我國初中生數學建模素養水平的現狀,剖析學生數學建模素養發展的優勢與不足,為各個學段數學建模教學提供證據參考,也為未來數學建模的評價貢獻思路。

二、 研究方法

(一) 測評工具的生成

目前,國際上就“數學建?!眱群c周期的描述大致相同。[6]以往研究大多引用布盧姆(Blum)在2007年提出的七階段數學建模周期來解釋與定義數學建模,《高中課標》對數學建模的定義也符合該框架但更加強調數學建模的完整性,關注最終能否解決實際問題[7]。因此,本研究主要參考我國兩版課標中的要求,將數學建模素養定義為:“面對某個綜合性的現實情境,能夠提出合理的數學問題,構建數學模型后進行分析求解,結合現實情境解釋結果并檢驗、優化模型,最終解決問題的能力?!?/p>

徐斌艷等基于國內課標與國際研究基礎構建了一套評估我國中學生數學建模素養的工具,包括一份測試量表與相應的編碼框架,該工具信效度已得到實證數據檢驗。[8]以該研究工具為基礎,結合最新兩版課標的要求和研究問題的需求,對測試工具和編碼框架進行優化:

測試工具方面,參考原測試量表中設計的三道難度遞增的數學建模問題(見附錄“題目一:拉面有多長”“題目二:巨人有多高”“題目三:去哪里加油”),優化了題目的表征形式,增強了問題的真實背景,呼應《高中課標》所強調的“現實問題”。測試題目通過一次專家論證和兩輪實證研究的檢驗與修改,保障了內容效度。

編碼框架方面,根據數學建模的定義,參考國際數學與科學研究趨勢測評研究(Trends in International Mathematics and Science Study,簡稱TIMSS)的雙重計分制,構建了三重編碼體系(見表1)。

表1 數學建模測試的三重編碼體系

第一重編碼是對學生解答問題的過程性評價,關注學生能否順利完成建模的各個環節,共5級編碼。第二重編碼是結果性評價,關注學生數學建模的能力水平,即能夠正確解答到哪一環節,共6級編碼。過程性編碼有助于研究學生數學建模過程中的認知障礙,而結果性編碼可以更加準確地測評學生的數學建模能力。第三重編碼是診斷性編碼,與結果性編碼綁定,用來確定學生數學建模過程中獨特的表征方式、模型選擇、錯誤或誤解等。因此,每個學生對每道數學建模問題的解答都會有3位數字編碼,如編碼M1-42.1,表示第一道數學建模問題解答過程維度達到水平四,能力維度達到水平二,并且屬于能力水平二中的第一種表現類型。

(二) 數據收集與處理

本研究旨在分析我國基礎教育階段中學生的數學建模素養基礎。初中作為承上啟下的時期,具有重要的研究價值,既有利于對初中生建模學習開展針對性查漏補缺,也有助于為高中階段數學建模教學提供指導意見,為小學階段“模型意識”培養指明目標方向。參考國際學生評估項目(The Program for International Student Assessment,簡稱PISA)與TIMSS等國際大型數學學業成就測評項目中樣本的選取標準,研究以八年級學生作為研究主體,選取全國5個城市共15所中學進行調查,采用分層抽樣方法最終得到有效測試卷共1428份(見表2)。

表2 有效問卷數據分布

三名經過編碼培訓的研究者對20%的測試卷進行了雙盲編碼,編碼一致性達88.20%,評分者信度良好。研究使用SPSS軟件對數據進行儲存,基于經典測量理論(Classical Test Theory,簡稱CTT)對數據進行初步分析與信度檢驗。具體而言,對1428份測試量表的6個有序編碼(過程性編碼與結果性編碼)進行克隆巴赫α系數(Cronbach’s α)的檢驗,得到α系數為0.842,說明各編碼具有良好的內部一致性(指向數學建模素養),測試量表整體樣本信度較高。

為了更加綜合地反映學生的數學建模素養表現,克服CTT帶來的工具依賴和樣本依賴問題,本研究使用jMetrik軟件進一步分析數據,結合項目反應理論(Item Response Theory,簡稱IRT)將測試對象與試題放在同一尺度上比較,探究學生整體的數學建模素養水平。研究選擇使用Rasch模型作為擬合標準。選擇該模型是考慮到其本身的簡潔性,更重要的是該方法是模型驅動的而非數據驅動的。將數學建模素養作為一個心理構念進行測量是一項相對較新的工作,在還無法明確洞悉其本質屬性之前,用基于Rasch模型的理論構建進行數據擬合更加嚴謹,得到的結論也更具說服力。

三、 研究結果

(一) 學生數學建模素養水平分析

1. 總體分析

過程性編碼結果如圖1所示。由圖1可見,學生在三道數學建模題目上的數據分布趨勢基本一致。水平零的學生人數占比隨題目難度的增加而遞增,達到水平三的學生人數卻隨題目難度的增加而遞減,幾乎沒有學生達到水平四。由此推測,數學建模任務的難度對學生推進建模過程造成明顯阻礙,而且幾乎所有學生都沒有檢驗模型的意識與行為。

能力編碼的結果如圖2所示??梢园l現,不同于過程性編碼的分布,學生能力維度編碼在不同題目上的表現差異明顯。題目一的能力水平分布出現雙峰現象,有大約一半的學生停留在水平二或以下,另外一半的學生基本可以到達水平四,很少學生會停留在水平三??梢?對于相對簡單的題目一,只要學生能順利構建正確的數學模型達到水平三,那么基本都可以成功求解模型進入水平四。題目二的能力編碼與過程性編碼分布較為相似,大部分學生停留在次高水平。對于難度最大的題目三,大部分學生的能力表現僅停留水平二上,只有不到3%的學生能成功構建正確模型達到水平三,這其中也只有約二十分之一的學生能順利求解出模型。

圖1 三個建模任務的過程性編碼百分比

圖2 三個建模任務的結果性編碼百分比

為綜合分析學生表現,更加系統地了解學生的能力水平,研究基于IRT,以分部評分模型對三道建模問題的能力維度編碼進行Rasch模型擬合,結果顯示擬合度良好(Outfit=0.86)。計算得到題目一到題目三的難度分別為-1.73、0.17、1.55,難度遞增與預設相符。

基于Rasch模型算得1428名學生的能力估計值θ如圖3所示。圖中橫軸的0表示平均水平,不難發現超過半數學生的數學建模能力較低??傮w而言,學生數學建模能力估計值的分布與題目難度的分布是大致匹配的,但由于數學建模題目的數量較少,無法較好地覆蓋所有學生,這也是使用完整數學建模問題進行測量難以避免的局限性。由于數學建模問題的復雜性,在有限的測試時間內,問題的數量通常無法達到較大量。不過,本研究采用了分部評分模型分析數據,使每道題目所體現的信息量更大,有效地改善了上述局限性。相較而言,0—1評分模型中每道題目在懷特圖中都被表征為一個“點”,而本研究中每道題目都是一條“線段”,可以更加全面地覆蓋學生水平,因此模型的匹配度有一定的保障。

圖3 基于Rasch模型的數學建模能力估計值分布

此外,從圖3可見高能力水平學生的建模能力分布出現斷層現象。對此,一種解釋是測試的建模問題數量較少,難以較好地區分出高能力水平的學生群體;另一種解釋是學生本身的數學建模能力水平存在斷層,因為絕大多數學生沒有驗證模型的意識,導致高建模能力水平學生的差異性較難被區分??紤]到局部獨立性的基本假設,本研究沒有將過程維度的編碼混合到能力維度編碼的IRT處理中。若結合過程維度的編碼數據分析,便可以增加高能力水平學生的區分度。例如,從能力估計值相同(θ=1.6059)的300名學生的過程性編碼數據(見表3)中可以發現,雖然他們具有同樣的θ值,但過程維度上的表現卻不盡相同。題目三的區別最為明顯,大部分學生都停留在無法構建正確模型的能力水平上,但過程維度卻出現了約為1:10:19的差距,這樣便可以進一步區分出這批學生的數學建模素養水平。

表3 能力估計值為1.6059的學生過程性編碼分布

2. 性別差異

基于數學建模能力估計值θ,對性別進行獨立樣本t檢驗,發現男女生數學建模能力水平存在顯著性差異(p<0.01),男生能力估計值均值(-0.911)高于女生(-1.341)。但男生能力估計值標準差為2.232,大于女生的1.876,說明女生群體能力分布較為集中,而男生群體差異性相對更大。

為了深入分析性別差異的具體表現,研究對三道測試題目的過程性編碼和結果性編碼分別進行了性別的差異性檢驗。由于編碼類型屬于等級變量,而非連續變量(等距),因此采用非參數的Mann-Whitney檢驗(4人無性別信息),結果顯示:在過程維度上題目二(p=0.005<0.01)與題目三(p=0.000<0.01)均有顯著性差異,而能力維度上僅題目二(p=0.001<0.01)出現了統計意義上的差異。結合算得的秩均值可以發現,在解決簡單數學建模問題(題目一)時,男女生在過程和能力兩個維度上的表現基本一致;在解決復雜數學建模問題(題目三)時,男女生的能力水平雖無顯著性差異,但過程維度數據顯示,男生似乎更能向前推進自己的建模步驟(秩均值更高);在解決中等難度建模問題(題目二)時,男女生在兩個維度上都具有顯著性差異,且男生整體水平略高于女生。

(二) 學生數學建模具體表現分析

從診斷性編碼可以發現學生解決同一題目的表現形式非常豐富。以題目二為例,6個能力水平共出現了19種不同的解答表現,其中達到能力維度水平四的46.92%的學生中便出現了5種不同的表現形式(見表4)。

表4 診斷性編碼及典型實例

雖然診斷性編碼種類豐富,但大部分學生的解答表現還是集中在個別類型上,所建模型與求解方案的一致性較高。如題目二中編碼M2-4.1約占總數的44%,其他編碼占比均小于總數的15%。題目一也有類似現象,有33.5%的被試解答為編碼M1-4.1,其余編碼占比較低。題目三的診斷性編碼相對分散,但還是主要集中在編碼M3-2.2與M3-2.4上。

四、 研究結論與討論

(一) 學生尚不能適應開放且真實的數學建模問題

從數據分析結果可以看出,我國八年級學生數學建模素養的整體水平不高,符合預期假設。目前,《義務課標》頒布不到兩年,初中階段的數學建模教學在實踐中雖有所試驗但尚未普及,學生建?;A較為薄弱也情有可原。此外,有研究表明,我國學生數學建模表現與年級呈明顯正相關,高中階段學生的建模素養會有較大提升。[9]

本研究的另一目的是從測評結果中挖掘學生數學建模能力不足的原因,為下一階段的教學與測評提供有意義的借鑒。過程性編碼分析(見圖1)顯示有9%—30%的學生未能順利達到過程維度的水平一(識別變量,作出假設),這個占比不容忽視。數學建模的第一個環節是理解并簡化問題,識別并確立參數,若該環節出現問題,后續建?;顒颖愦绮诫y行。研究發現,學生簡化、結構化、數學化問題的過程并非線性的,往往先有一個簡單的數學化過程,然后在反復驗證模型與現實之間關系時修改假設并優化建模。[10]未達到水平一的學生完全沒有開始建模的“趨勢”,這或許不是因為他們毫無思路,只是在沒有絕對“正確”的方案之前不敢作答,這一般是學校常規數學訓練所帶來的一種負面效應。數學教學需要培養學生勇于嘗試的能力,即使面對的現實問題再復雜,也能夠通過多種方式簡化假設,將其轉化為可解的數學問題。從國際上來看,德國學生這方面的能力相對突出,而我國學生的表現與法國學生比較接近,在嚴格、規范的數學解題訓練下,面對模糊的現實問題往往有些“舉棋不定”。[11]

(二) 學生缺乏對數學建模過程的完整認知

從數據分析結果中可以發現,能夠推進數學建模過程是提升數學建模素養的基礎。目前中國學生的主要問題之一便是缺乏對數學建模的完整認知,導致建模過程不完整,從而一定程度上影響數學建模素養水平的體現。

數學建模過程有一個完整的周期循環結構,但從測試數據中可以察覺,學生偏向于將三道數學建模問題視為一般的應用題進行單向線性求解。其實,數學建模問題與傳統應用題存在很多差異[12],應用題更多是對具體數學知識的鞏固練習與運用,答案往往比較唯一;數學建模問題恰恰相反,它是從某一現實問題出發去尋找思維體系中可以解決的數學方法與模型,方案與結論都是開放的。因為學生很少接觸這類問題,所以在解題過程中幾乎都忽視了驗證環節,這與其他一些國家的發現相吻合,學生大多不喜歡反思與驗證自己的解答。[13]這種對反思和驗證的忽視與大多數學生不清楚數學建模的完整過程有莫大關系。

(三) 學生建模能力的性別差異受建模過程的推進影響

在分析性別差異時,研究發現男女生建模能力的性別差異受建模過程推進的影響,由此推測信念(或自信心)可能是影響男女生數學建模素養表現的原因之一。從Mann-Whitney差異性檢驗結果可以看出,男生在遇到難題時依舊表現自信,愿意進一步推進建模過程,而女生更容易停留在某些環節上,頓足不前。

具體來看,面對難度最大的題目三,男女生的實際建模能力沒有顯著差異,但男生推進建模的進程顯著多于女生??梢?男生在解決具有不確定因素的難題時更敢于嘗試推進建模,不管解答是否會出現一些錯誤。在面對難度中等的題目二時,數據顯示男生不論在推進建模過程還是建模能力方面都顯著優于女生。由此推測,男女生建模能力水平所呈現的差異一定程度上與自信心相關,即男生在過程維度上更優的表現一定程度上促成了其建模能力水平的高分。綜上,研究得出自信心或許通過影響數學建模過程的推進,進而造成男女生建模能力的差異。

以往研究發現我國男生的學業效能感顯著高于女生[14],在數學學科上往往更加自信,這與本研究結果相似。當然,也有研究得出初中生數學建模能力沒有性別差異[15],因此本研究男女生數學建模素養所表現出來的統計差異原因不可一概而論,具體影響因素還需要更多實證數據的支持。

(四) 學生具備創造性解決數學建模問題的潛力

診斷性編碼分析發現,大部分學生的解答過程比較相近,構造的數學模型和使用的數學方法較為一致。這一方面是因為學生較為熟悉題目一與題目二的問題情境,能從中較快地識別出學過的數學模型(如指數模型等);另一方面,也反映出了學生對建模問題的求解思維相對固化,這大多是常規應用題訓練引起的一種應試表現。

中國學生并不缺乏創造力,從診斷性編碼中可以發現許多別出心裁的數學模型與解題思路。如學生解答題目二時大多利用自身鞋底的長或寬與身高的比值來估計巨人身高,這樣的模型雖然合理,但僅使用鞋底的一個數據(長或寬),勢必造成信息缺失。有學生便巧用面積(或幾何平均數)構建比例模型解決問題,最大限度地利用了數據,這樣的模型構建具有新穎性和靈活性,實在精彩(見表4的M2-4.3)。還有學生不滿足于靜態數據,也不滿足于使用基礎的比例算術方法求解問題,于是構建函數模型去表征巨人的身高,使模型更具普適性(見表4的M2-4.5)。以上學生的方法雖然只占極少的比例,但卻充分展現出他們具有獨特性的創造性思維。本研究的診斷性編碼能夠體現出學生創造性地解決建模問題的具體表現,創新思維在數學建模過程中發揮著重要作用,是數學建模能力表現中不可或缺的部分,研究者與教學者應該給予高度重視和關注。[16]

五、 研究啟示

(一) 對數學建模測評的反思

數學建模作為數學基礎教育階段的一個新窗口,如何對其進行有效測評是亟需解決的研究問題。

1. 過程性評價不容忽視

數學建模評價是多維度的,對一個復雜現實問題的解決不應該只探討其結果的合理性而忽視過程性評價。研究結果發現,在能力維度表現水平相同的情況下,數學建模的過程維度在一定程度上能夠看出學生對數學建模的理解深度,即過程性評價能進一步區分學生的數學建模素養水平?!陡咧姓n標》同樣強調數學建模素養培養需要關注建模過程,提出學生要“知道數學建模的過程包括:提出問題、建立模型、求解模型、檢驗結果、完善模型”。[17]此外,如表3所示,過程維度亦是區分高水平建模素養學生的有力證據。因此,數學建模的過程性評價不容忽視。

2. 測試題難度應恰到好處

編制難度適宜的題目對數學建模評價至關重要,難度適中的問題能更好地測試出學生的真實能力水平。就本研究的測試題目而言,題目一對于中國八年級學生而言較為簡單,模型求解的難度過低。題目三難度較大,只有少數的學生能構建正確模型,其功能主要表現在區分高能力水平學生。題目二最適合八年級學生:一方面,有一半左右的學生能夠達到過程維度的水平三,說明其對學生建模過程的順利推進具有合適的阻力;另一方面,學生在該題上的能力維度編碼分布與過程維度相似,即建模環節難度分配較為均勻且適中,具有良好的區分度。未來的初中生數學建模能力測試可以沿用以上三題,尤其是題目二。若要進一步基于IRT分析建模能力,可以開發更多難度系數略大于題目二的建模問題。題目三具有復雜且真實的情境,可以考慮作為高中生數學建模測試的問題之一。

3. 子能力與完整能力評價相結合

未來測試除了考慮完整的建模任務測試,還可以結合數學建模子能力的測試框架,開發相應的數學建模各項子能力測試。譬如開發聚焦學生簡化問題或驗證模型子能力的題目等,這也是國際數學建模測試研究的另一重要方向。[18]需要強調的是,數學建模是一個完整的過程與能力,測試各子能力水平有助于研究學生的數學建模能力構成,但不能僅僅以各子能力的簡單求和來判斷學生的數學建模能力。

(二) 對數學建模教學的反思

測評不是最終目的,評價應為教學提供啟迪,真正做到新課標要求的“以評促學,以評促教”。未來各學段的數學建模教學可以從以下幾個方面入手。

1. 自信心是數學建模素養發展的敲門磚

各學段數學建模教學都應該重視培養學生解決現實問題的自信心,這一點應該從義務教育階段便開始培養,無論是“模型意識”還是“模型觀念”,都不應該從現實背景中抽象出來,而要讓學生體會數學模型對現實的描述意義,學會用數學的眼光看待世界。因此,教學中應當多為學生提供解決現實問題的機會。此外,教學還要讓學生明白數學建模問題沒有標準答案,要勇于推進自己的建模過程,從而發現不足并不斷循環以求優化。從測評數據中也可以看出過程維度對能力維度的促進作用,尤其是對女生而言,應該更加重視其數學建模自信心的培養。

2. 認識數學建模的整體性是建模教學的首要目標

高中的教學要明確數學建模的內涵,讓學生了解數學建模的基本環節與目的意義。從中學階段開始,教學便可以讓學生逐步接觸完整的數學建模問題,深刻理解數學建模的整體性。這有助于學生區分建模問題與常規應用題,也有助于讓學生更好地開展建?;顒?。教學尤其需要讓學生通曉數學建模的循環過程,知道建模結果需要不斷回歸現實以優化方案,而不是采用簡單的直線型思維,這也將有助于學生未來步入社會更好地解決復雜現實問題。

3. 創造力的培養應與數學建模素養的發展相結合

數學建模教學應該更加關注和鼓勵學生發揮創造力,利用數學建?;顒哟龠M創新思維的培養。[19]創造力是數學建模的必備要素,已有研究表明具有較高創造力水平的學生數學建模能力也較強。[20]從測評數據中可以看出,有不少學生能發掘具有創新性的模型,這正是數學建?;顒铀M囵B的。教學需要讓學生們知道,尋找更加合適、簡潔、高效的模型去解決問題才是數學建模更高的追求。測試結果顯示,中國學生并不缺乏創新思維,只是這些零星點點的創新表現需要教師發現并更好地引導。因此,未來各學段的數學建模評價體系的構建中,創造性是重要的指標之一。

4. 在數學核心素養的高觀點下提升數學建模素養

教學除了聚焦建模內容本身的突破外,還應該關注數學素養的全面提升。新課標所強調的核心素養導向是整體且統一的,縱向上小學、初中、高中的核心素養表現是貫通的,橫向上不同核心素養之間亦相互聯通。[21]從本研究中亦能看出,學生所出現的錯誤不僅受數學建模本身技能的影響,也受到數學運算、邏輯推理、數據分析等素養的影響。因此,數學教學不能厚此薄彼,各項能力的提高、創新意識和應用意識的培養、數學建模素養的發展都是相輔相成的。

六、 附錄:測試工具

題目一:拉面有多長拉面,是中國西北地方風味名吃。拉面師傅將一團和好的面揉搓成一根長條后,手握兩端用力拉長,然后將長條對折,再拉長(每次拉的長度幾乎一樣),再對折,每次對折稱為一扣,如此反復操作,連續拉扣7、8次后便成了許多細細的面條。圖中的師傅拉了7扣,請你估計此時這些拉面加起來共有多長?

題目二:巨人有多高圖片展示的是菲律賓一個體育運動中心的一雙大鞋,吉尼斯世界紀錄稱這雙鞋是世界上最大的鞋,每只鞋長5.29米,寬2.37米。大概多高的巨人適合穿這雙鞋?請說明理由(寫出解題思路或過程)。

題目三:去哪里加油林先生住在上海,他家距離上海最近的加油站10公理,而距離蘇州界內最近的加油站80公里,他開著大眾CC1.8T車到蘇州那個加油站去加油,因為那段時間蘇州汽油的價格是7.61元/升,而在上海汽油是8.04元/升。下表是大眾CC1.8T車的參數。請問,他是否值得前往蘇州那個加油站去加油呢?請寫出你的思路,論證你的回答。

品牌一汽 大眾車長(mm)4799級別中型車車寬(mm)1855發動機1.8L 118kW車高(mm)1417變速箱7檔雙離合變速箱軸距(mm)2712長×寬×高(mm)4799×1855×1417車重(kg)1535車身結構4門 5座 三廂轎車最小離地間隙(mm)—上市年份2012車身結構三廂轎車最高車速(km/h)215車門數40—100加速時間(s)—座位數5工信部油耗(L/100km)7.8郵箱容積(L)70.00官方綜合油耗(L/100km)—行李箱容積(L)532保修政策2年6萬公里行李箱最大容積(L)532

猜你喜歡
編碼建模維度
基于SAR-SIFT和快速稀疏編碼的合成孔徑雷達圖像配準
聯想等效,拓展建?!浴皫щ娦∏蛟诘刃鲋凶鰣A周運動”為例
《全元詩》未編碼疑難字考辨十五則
子帶編碼在圖像壓縮編碼中的應用
淺論詩中“史”識的四個維度
Genome and healthcare
基于PSS/E的風電場建模與動態分析
不對稱半橋變換器的建模與仿真
光的維度
“五個維度”解有機化學推斷題
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合