?

江蘇新高考再選科目賦分方案評析與仿真研究*

2024-01-11 05:55劉明巖
教育與考試 2023年6期
關鍵詞:語數賦分保障機制

仝 虎 劉明巖

自2014 年《國務院關于深化考試招生制度改革的實施意見》[1]頒布至今,已經有29 個?。ㄊ?、自治區)分五批啟動新高考改革。其中第四、第五批改革省份和第三批省市方案基本相同。江蘇省作為第三批新高考改革8 個省市之一,在總結吸取前兩批改革省市經驗的基礎上采用了“3+1+2”模式[2]。新高考改革最大的亮點是取消文理分科,考生可根據自身興趣愛好、個性特長和高校專業對選考科目設置的要求,自主選擇考試科目,在共性基礎上強調體現學生的個性化與差異性。然而,伴隨著科目選擇的自主性增強,新高考在實施過程中也遇到了一些問題,這些問題大多和選考科目賦分方式有關。本文從分析等級賦分方式引發的問題入手,對江蘇再選科目賦分方案及學者們提出的優化改進方案進行評析,并進行數據模擬仿真演算。

一、等級賦分方式問題探究

新高考改革方案中,由于學生可以自主選擇3 門科目并計入高考總分,計分方式成為大家關注的重心和焦點。為實現不同科目間的可比可加,新高考為選考科目設計了等級賦分方案。但自新高考改革試點啟動以來,等級賦分方案開始顯露出自身的局限性。以第一批試點省市為例,等級賦分方案如下:浙江方案對選考科目設置21 等級,賦分區間為[40-100];上海方案設置11 等級,賦分區間為[40-70]。兩地設置的等級間隔均為3 分,各等級人數所占比例的分布有均勻性、對稱性的特征。兩個試點省市在改革方案實施第一年暴露的問題,主要有以下四個。

問題一是選考科目在總分中權重過低。必考科目語數外3 科按原始分計,每門150 分。浙江方案中選考科目分數區間[40-100],分數全距為60 分;上海方案中分數區間[40-70],分數全距只有30 分。朱邦芬院士指出,浙江方案中,物理成績對高考總成績的貢獻率只有60/750=8%,而外語的權重為150/750=20%,二者相差非常之大。上海方案中也存在同樣情況,物理成績對高考總成績的貢獻率只有30/660=4.5%,外語的權重為150/660=22.5%。一門外語考試成績對于升學的貢獻,等于5 門物理,遠遠超過物理、化學、生物等3門科學課程之和[3]。這樣的制度設計導致選考科目地位大大被輕視和弱化。從高校招生的角度來看,一門物理科所攜帶的信號可能還比不過數學英語卷中一道題目來得重要[4]。

問題二是等級劃分和比例設置科學性不足[5]。不同選考科目之間的難易程度有差異,由于選擇的靈活性,考生人數大不相同,考生群體水平大概率存在差異,其考試成績分布必然會不同。而現行的等級分方案,為了破解不同科目的不等值問題,使科目成績具有可比性和可加性,提前對選考科目的原始分強行劃分等級和比例,所有選考科目都依照這個標準執行。這就相當于把所有選考科目成績都轉化成了相同的分布形態,這本身就缺乏合理的科學依據,這種處理方法在擺平各科難度的同時,也抹平了各科考生群體能力的差異[6]。有關研究認為五個等級的劃分是合適的[7],但各等級比例的賦值具有一定的人為性。具體到浙江、上海方案,其等級比例的賦值呈均勻性、對稱性,這符合正態分布的特點。而相關研究顯示,學生成績并非一定服從正態分布,大體上是:對同一考生群體,難度低的科目成績呈負偏態,難度高的科目成績呈正偏態;對相同難度的科目,水平高的考生群體成績呈負偏態,水平低的考生群體呈正偏態[8-9]。這種強制按正態分布賦等級比例的做法并不嚴謹,缺乏科學依據,帶有一定的人為性和隨意性。

問題三是等級邊界相隔3 分的設計充滿隱患。浙江、上海兩地在給各等級賦分時,為了淡化考生“分分計較”的觀念,為每個等級賦了一個固定分數,且相鄰等級間相隔3 分。這種設計存在很大的公平隱患。對于高考這種全民關注的高利害考試,最終以總分來排名錄取,考生必然會分分計較。實際情形中,由于考生數量巨大、成績分布呈現兩邊疏、中間密的特征,在成績分布密集區域,同分會大量出現,1 分可能會超過千人,而處于兩個等級邊界的考生群體,原始成績的1 分之差,卻導致等級成績出現3 分的差距。這個等級成績計入高考總分,必然會導致不公平現象。換言之,選考科目的原始成績少1 分,就很可能需要語數外成績多3 分來彌補。另外,因為考生可以選擇3 門科目,在極端的情況下,這種情形還會被放大。例如:兩個水平相當的考生A 和B,選擇了3 門相同的選考科目,B 的每門科目原始成績都恰好比A 低1 分,且都恰好位于邊界分,3 門選考科目成績都被劃分到低一級的等級,這樣就導致B 的3 門選考科目總成績原始分只比A少3 分,而轉換后的等級分卻比A 少9 分,如此結果顯然是不公平的。

問題四是“物化遇冷”,考生“棄理選文”“避強鄰弱”等功利化選科現象迅速蔓延。這個問題是由前序問題引發而來的,具有因果關系。正如問題二所描述的,在各學科考生成績分布形態相同或相似的情況下,按事先定好的等級和比例標準來切割不同科目考生群體的方法是可行的。但實際情況是,不同選考科目之間的難易程度有差異,選考群體的數量和能力水平也大不相同,所以科目考試成績的分布形態必然會有較大的差異。在這種情況下,不考慮科目實際難度,也不考慮選考群體水平差異,而只追求形式上的可比,仍用固定的等級賦分方式來處理,不但會強行抹平不同科目之間的難度差異,而且會強行抹平不同考生群體水平間的差異。舉例說明,同樣是100 分的試卷,一個大學生得滿分和小學生得滿分代表的難度是不一樣的,大學生不論是從認知水平、理解能力,還是需要掌握知識的難度,與小學生都不能同日而語。但按新高考計分方式,會得出大學生和小學生得分一樣、水平一樣的結果。

這樣的結果,忽略了兩個群體之間存在的差異,忽視了試卷的難度,顯然不合理。由于考生的轉換分數與其在該科目當中的排名相關,兩個人選修了不同的科目,只要在相同的排位水平,不管原始成績是多少,高考的選考科目就會得到相同的分數。在這種計分模式下,學生為了追求自身利益最大化,在選科時大概率不會從自身興趣出發,而是以分數目標為導向,去計算選擇哪個科目對自身更有利。家長、學校為了自身的利益和聲譽也會鼓勵學生去這么做。因此,出現“物化遇冷”“避難選易”“避強鄰弱”等現象也就不足為奇了。據陳愛文、胡銀泉對浙江省選考情況的粗略調查[10],2016 級高中生在2017 年選定選考科目時,某中學近千人中只有7 個學生選考物理;某一級普通高中特色示范學校也只有不到50 人選考物理;某縣所有中學只有不到100 人選考物理;某市2016 級約一萬名學生,只有不到900 名學生選考物理。這些現象雖然仍在動態變化中,但“懼選物理”的情緒由落后地域向發達地域、由二級普通高中特色示范學校向一級普通高中特色示范學??焖俾?。這種選科結果已經嚴重背離高考改革者的初衷,從長遠來看,學生、學校、社會三方無一贏家。

江蘇省作為第三批改革省份采用“3+1+2”模式:必考科目語文、數學、外語每門150 分計入總分;選考科目每門均為100 分,其中首選科目(物理、歷史)以原始分計入總分,再選科目(化學、生物、思想政治、地理)以等級分計入總分,等級分賦分起點為30 分,滿分為100 分。再選科目等級分具體轉換規則和步驟[11]如下:第一步,按照考生原始分從高到低劃定A、B、C、D、E 共五個等級,各等級人數所占比例分別約為15%、35%、35%、13%和2%。第二步,將A 至E 五個等級內的考生原始分,依照等比例轉換法則,分別對應轉換到100~86、85~71、70~56、55~41 和40~30 五個分數段,從而將考生的原始分轉換成為等級分。江蘇省采用的選考科目計分方案已有很大進步:首選科目(物理、歷史)以原始分計入總分,分數全距為100 分,再選科目(化學、生物、思想政治、地理)賦分范圍從30 至100,分數全距為70 分。相比于前期改革省市,江蘇省的選考科目在總分中的比重有所增加;五個等級的比例分布非均勻有負偏態傾向,更加符合考生實際成績分布特征;在原始分轉換成等級分時使用等比例轉換方式規避了等級間隔3 分的隱患。這些都是吸取前期試點經驗進行優化改進的地方,值得充分肯定。江蘇現行的等級計分方案在一定程度上緩解了考生“棄理選文”“避強鄰弱”“田忌賽馬”等功利性選科的問題,但在等級賦分具體操作和執行上,以及在對考生的選考指導方面,還有進一步優化的空間。

二、保障機制的優化改進

針對“棄理選文”“避強鄰弱”等考生功利性選科問題,現有的應對措施主要是政策引導。比如在解決“物理遇冷”問題時,浙江、上海都推出了物理選考科目保障機制,浙江的物理保障基數為6.5 萬人,上海的物理保障基數為1.5 萬人,如果物理選考人數低于保障基數,在計算考生的物理等級分時將用保障基數替代實際選考人數。朱明宇的研究指出物理保障機制存在不足之處[12]:一是閾值人數設定不夠嚴謹,將閾值人數設定為本科理工類專業每年在本省市招生的計劃數不夠嚴謹,因為選擇物理的考生并非全部報考本科理工類專業,并且每年考生人數呈現動態變化,每年的保障人數都無法確定;二是填充基數的方式缺乏科學性,保障機制的修正策略僅參考選考人數,未與考生能力分布建立聯系,注定其必然出現“糾偏失策”;三是將物理保障機制擴展至其他選考科目,普適性存疑。也有學者對不同條件下物理科目保障機制的運行結果模擬研究后指出[13]:在學生群體成績呈正態分布或正偏態分布情況下,保障機制能夠吸引很多學生加入選科;當學生群體成績呈負偏態分布時,保障機制對最優學生和最差學生更為有利,對中等水平或中高水平的學生作用很小。然而需要啟動保障機制的,恰恰是呈負偏態分布的物理科目。這種情況下,保障機制所能起到的作用十分有限,它可以保障一定的考生數量,但無法保障考生質量,無法吸引真正對物理科目有興趣的中高水平考生,卻會吸引一些低水平學生的“投機報考”。

江蘇省的“3+1+2”模式雖然很好地解決了“物理遇冷”問題,選考物理的比例逐年提高,但又出現了化學選考人數下降的問題。針對此問題,江蘇省在參照浙江、上海物理保障機制的基礎上推出了再選科目保障機制[14],使用保障比例替代保障基數。首先在化學科目上執行了保障機制,依據相關學科(專業)對化學科目選考要求和全國高校近5 年面向江蘇的招生計劃數進行測算,以當年高考總實考人數的25%作為化學科目劃分等級比例的基數。再選科目保障機制用保障比例替代保障基數,化靜態保障基數為動態保障基數,規避了靜態保障基數帶來的弊端,比浙江、上海的物理保障機制更進了一步,但其修正策略依然只是填充基數,未與選考科目考生群體能力分布建立聯系,“糾偏失策”的情況依舊可能存在。范美琴在肯定江蘇再選科目保障機制的積極作用的同時指出:“在快速緩解眼前矛盾的同時,還須加強對不同再選科目賦分彈性機制的研究,使得現行賦分辦法對流動現狀下的選考群體有更強的適應性和糾偏功能?!盵15]所以,對再選科目保障機制和等級計分方式進一步改進和完善是今后的方向。

三、等級賦分校準方案評析

針對現行等級賦分方式暴露出來的“理化遇冷”“避難就易”“避強鄰弱”等功利性的選科問題,許多學者從技術角度提出了賦分改進方案。根據出發點不同,主要分為兩類:

第一類是學業質量水平參照劃等法。即制定學科統一標準,以學業水平質量為參照,把現在學業水平考試的常模參照計分方式改為質量水平參照計分方式。諸多專家學者都提到過這個辦法[16-18],這是一勞永逸的理想解決方案,但方案實施難度很大,對改革者的專業要求很高,成本也很高,目前國內時機、條件都不具備。

第二類是對現有等級賦分方式進行校準的方案。根據校準參照不同,又細分為以選考人數為參照、以學業水平合格考試成績為參照、以必考科目成績為參照三種。以下筆者對這三種校準方案做簡要評析。

(一)以選考人數為參照的校準方案

楊燕燕撰文指出新高考選科失衡的主要原因在于現行等級賦分方式是靜態賦分[19],靜態賦分體現在兩方面:(1)固定的等級劃分;(2)各等級既定不變的人數比例。該文認為選考科目學科本身的難度和高校對于學科的限定性要求等因素會影響學生的選科,既然各選考科目實際選考人數和科目難度有關,便可以根據各科目的實際選考人數來衡量學科間不同的難度等級。為此,該文提出“改靜為動”的修正方案,以選考人數為參照來判定科目難度等級并給出科目難度系數,然后根據科目難度系數動態調整各等級的人數比例。筆者認為,“改靜為動”的思路很新穎,讓人眼前一亮,但以選考人數為參照、利用選考人數來判定選考科目的難度差異,既不科學也不穩定。并且,各科選考人數比例是動態的,每年都在變動,有其不穩定性,可以用來定性,但不能用來定量和計算。

(二)以學業水平合格性考試成績為參照的校準方案

一些學者提出以學業水平合格性考試成績為參照,對選考科目等級劃分和成績進行校準修正,具體細節做法又有所不同。比如,周文闊提出利用“合格考樣本”作為參考樣本,計算出相應的合格考“修正分數”,以此對選考科目等級分進行補充和調整[20];張華提出以選考科目的合格考平均成績為參照,計算選考科目的“可比系數”,利用“可比系數”來衡量不同選考科目群體之間的水平差異,以此對考生等級分進行校準[21];李金波提出以學業水平合格考成績為參照,對各等級選考學生的固定比例進行調整,變固定占比為可變占比[22]。這些校準調整方法各不相同,但都以合格考成績為參照,因此歸為一類。誠然,學業水平合格考是所有學生都要參加的考試,但其與高考有著本質的區別:學業水平合格性考試的難度較低,難度系數通??刂圃?.8 左右,而高考屬選拔性考試,難度系數一般在0.6 左右[23],兩者定位不同,并且合格考與高考時間通常不一致。因此,使用合格考成績為參照的各種校準方法并不合適。

(三)以必考科目成績為參照的校準方案

溫忠麟提出一種基于正相關假設理論使用必考科目統考成績對選考科目進行統計校準的方案,有一定現實意義[24],但其計算過程較為復雜;隨后,針對一些問題和質疑,他又發文做了澄清和解釋[25],并提出校準方案的多種簡單變式,使校準方案具備了很強的指導意義和實踐意義。黃恕伯提出依據必考科目成績為選考科目分指標(FZB)的方案[26]有著相似的思路。

筆者認為,以必考科目統考成績為參照對選考科目進行校準的方案是可行的,其科學依據和理論基礎主要有以下兩個:

(1)加德納多元智能理論[27]。哈佛大學認知心理學家加德納提出的多元智能理論認為人類擁有九種智能:語言、數理邏輯、空間想象、身體運動、音樂節奏、人際交往、內省、自然探索和存在感知。根據加德納多元智能理論可以發現,高考必考科目(語文、數學、外語)考查的主要是語言、數理邏輯、空間想象的能力;選考科目(物理、歷史、化學、生物、思想政治、地理)考查的內容也以語言、數理邏輯、空間想象為主。因此,除了音樂、體育、美術以外,可以假設考生的選考科目能力分布與必考科目(語數外作為整體)的能力分布相同或相近。

(2)相關性理論[28]。相關性分析是分析客觀事物之間相關性的數量分析方法,研究兩個變量間的線性相關問題稱為線性相關分析,兩個變量間的相關程度強弱用相關系數r 來描述。r 的取值范圍為[-1,1],r>0 表示兩個變量為正相關,r<0 表示兩個變量為負相關,r 絕對值越大,表示兩變量間的相關程度越密切。在研究兩個變量之間的線性相關程度時通常采用Pearson 相關性分析法。Pearson 方法中相關系數r 的計算方法參見公式1,其中n 為樣本數量,xi、yi分別為兩個變量的取值,表示兩個變量的算術平均值。必考科目成績能對選考科目成績進行校準的相關性理論依據是:對于同一考生群體,選考科目成績與必考科目成績之間呈正相關。當選考科目與必考科目的相關系數r 取值在介于0.3 與0.95 之間,使用必考科目校準選考科目則是可行的,并且在這個范圍內,r 取值越大,校準精度越高[29]。

筆者選取江蘇新高考改革后連續兩年(2021 年、2022 年)的考生高考成績,計算各科目之間的相關性,得到化學、生物、思想政治、地理四門科目與語數外科目之間相關系數表(詳見表1)。由表1 可以看出,再選科目單科與必考科目語數外總分之間相關系數r 的取值在[0.63-0.84],這說明使用語數外總分去校準再選科目成績是合適的,再選科目成績與必考科目成績之間有著正相關聯系和規律:某個再選科目考生群體的整體水平(語數外總分)越高,該科目的整體成績也會越好。

表1 再選科目與必考科目相關系數表

另外,筆者建議采用以語數外總分為參照對現有計分方式進行校準而不采用單科(或語文,或數學,或外語)校準,理由有兩個:第一,根據加德納多元理論,必考單科考查的能力有限,只用某個單科來校準再選科目的話,其校準效度不如語數外總分;第二,表1 數據顯示,再選科目與語數外總分的相關度明顯大于其與語數外單科的相關度。

四、保障機制的仿真研究

不管哪種等級賦分校準方案,其最終目的都是借助某種參照,將賦分策略與選考科目考生群體的實際能力分布建立聯系,通過校準使賦分結果更貼近考生與考生群體的真實能力水平。校準方案恰好可以作為再選科目保障機制的有益補充,使保障機制的修正策略不僅基于選考人數,也能更貼近選考考生群體實際能力水平的分布。通過前文幾種校準方案的分析與比較,以語數外總分為參照的校準方案,具有更強的科學性、有效性和可行性。目前該方案尚停留在理論研究階段,并無實證數據驗證。為了比較再選科目現有等級賦分方案、保障機制方案、以語數外為參照的校準方案之間的差異和優劣,考察驗證保障機制和校準方案的有效性,本文特進行模擬數據演算。

(一)模擬數據準備

筆者參照某年江蘇高考數據用計算機模擬了5 萬條數據作為全體考生數據(詳見表2),模擬數據中1 萬名優秀考生群體選考化學,2 萬名次優考生群體選考生物,3 萬名普通水平考生群體選擇地理,4 萬名較差考生群體選考思想政治。這里的優秀考生群體指的是語數外總分均值較高的選考科目考生群體,較差考生群體指的是語數外總分均值較低的選考科目考生群體。之所以這樣模擬考生數據,一方面是為了體現出不同科目選考群體水平的差異性,另一方面將化學選考比例設置成20%,以模擬啟動化學保障機制,對保障機制啟動后的效果進行仿真研究。本文重點研究化學科目考生在三種賦分方案下的差異。

表2 全體考生模擬數據表

(二)現有賦分方式演算

再選科目現有等級賦分方式計算過程:

步驟1,劃分等級、分配比例。按化學原始分從高到低排序,將化學科目考生劃為A、B、C、D、E 五等,等級比例取值A-15%,B-35%,C-35%,D-13%,E-2%。

步驟2,計算等級人數、切分考生。根據等級比例計算出每個等級對應的考生人數,按照每個等級的考生人數切分考生數據。因為等級邊界通常會存在同分考生,所以此時切分出的各等級考生人數并非最終實際人數,需要進行微調。

步驟3,同分微調。對于邊界同分考生,依據同分考生必須劃分到同一等級的原則,采用“就高不就低”的微調方法,將每個等級的下邊界同分考生都劃到該等級。經過微調后的考生人數才是各等級的實際人數。

步驟4,考生賦分。依據等比例轉換法則,計算每個考生的等級分。等比例轉換計算方法參見公式2,其中t1、t2代表某個等級的上、下邊界等級分,x1、x2代表相應等級的上、下邊界原始分,x 代表該等級某個考生的原始分,t 代表轉換后的相應等級分。在未啟用保障機制情況下,根據現有等級計分方式計算過程,得到化學考生等級賦分數據表(詳見表3)。

表3 化學考生數據表—現有等級賦分方式

依據江蘇省再選科目保障機制規則,模擬考生數據中化學選考人數比例為20%,因而需要啟用化學保障機制。啟用保障機制后,其計算過程和上述步驟一樣,只是要將化學科目考生人數用保障基數代替,保障基數=全體考生人數*保障比例(即:50000*25%=12500)。在啟用保障機制的情況下,經計算得到等級賦分結果參見表4。

表4 化學考生數據表—保障機制方式

(三)語數外總分校準方式演算

參考前文校準方案思路對以語數外總分為參照的校準方式進行細化,細化后的校準方式計算過程分為三個階段:

第一階段,對全體考生數據進行切分:

步驟1,首先將全體考生按語數外總分從高到低排序。

步驟2,對全體考生進行等級劃分,劃分成A、B、C、D、E 五個等級,等級比例取值:A-15%,B-35%,C-35%,D-13%,E-2%,即標準比例。根據全體考生人數和各等級標準比例,計算出各等級標準人數,同時記錄每個等級下邊界的標準累計排位名次。

步驟3,把每個等級下邊界排位名次考生(該等級最后一名考生)的語數外總分作為等級下邊界分S2。每個等級的下邊界分確定后,次一級等級的上邊界分S1同時也被確定下來。

步驟4,重復步驟3,記錄每個等級的上下邊界分(語數外總分S1、S2)。

第二階段,對再選科目考生數據進行切分:

步驟1,對再選科目進行等級劃分,同樣劃分成A、B、C、D、E 五個等級,五個等級對應的等級分區間:A[86-100],B[71-85],C[56-70],D[41-55],E[30-40]。各等級人數及比例待定。

步驟2,根據第一階段得到的各等級上下邊界分(語數外總分S1、S2),去統計每個再選科目(化學、生物、思想政治、地理)考生群體中語數外總分符合對應等級要求的考生人數。

步驟3,根據統計出來的各等級人數,計算出每個再選科目相應等級的考生人數比例,這個比例大概率與標準比例不同,這里的人數、比例信息就體現出不同再選科目考生群體水平的差異性。由于邊界考生同分的問題,這里計算出的考生人數、考生比例并不是最終切分的實際人數、比例,需要進行微調。

步驟4,將再選科目原始分(比如,化學科目用化學原始分,生物科目用生物原始分)從高到低進行排序,根據步驟3 計算出的各等級的考生人數找到每個等級的上下邊界分(再選科目原始分x1、x2),對于邊界同分考生,依據同分考生必須劃分到同一等級的原則,采用“就高不就低”的調整辦法,將每個等級的下邊界同分考生都劃到該等級。如此計算得到的各等級的考生人數和比例才是最終切分后各等級的實際考生人數和比例。

第三階段,對再選科目考生賦分:

根據第二階段切分考生數據后得到各等級的上下邊界分(再選科目原始分x1、x2),對照相應等級既定的上下邊界等級分(t1、t2),使用等比例公式(參見公式2)計算出每個考生的轉換分t,即校準等級分。

以語數外總分為參照校準再選科目等級分的方案關鍵之處有兩點:其一,統計每個再選科目(化學、生物、思想政治、地理)考生群體中語數外總分符合對應等級要求的考生人數;其二,依據此人數去定位相應等級的再選科目原始分,然后根據各等級的邊界分(再選科目原始分x1、x2)去調整再選科目人數。使用細化后的校準方式對考生數據進行演算,結果參見數據表5。

表5 化學考生數據表—校準方式

(四)三種方式比較

筆者將三種賦分方案下化學科目考生的等級劃分和計算結果放在一起形成表6,對數據進行對比分析后,得出以下兩點結論:

表6 化學考生數據表—三種方案對比

第一,比較現有等級賦分方式與保障機制方式,以現有計分方式為參照,考察啟用保障機制前后考生等級變化情況。經過保障機制方式調整,化學科目考生受益群體:E 等級176 人(100%),D 等級1274 人(100%),C 等級考生1269 人(36.78%),B 等級考生326人(9.27%)。根據模擬數據演算結果,在化學保障機制方式下,E、D 等級所有考生都升級至C 級,C 級有很多考生(36.78%)升級至B級,B級只有少數考生(9.27%)升級至A 級。這說明保障機制對低水平考生保障力度要高于對高水平考生的保障力度,江蘇再選科目保障機制可以從加大對高水平考生保障力度的角度進行優化和完善。

第二,比較現有等級賦分方式與語數外總分校準方式,以現有計分方式為參照,考察以語數外總分進行校準前后考生等級變化情況。經過校準后,化學科目受損群體:D 等級考生41 人(3.22%);受益群體:D 等級考生187 人(14.68%),C 等級考生1254 人(36.35%),B 等級考生1442 人(41.04%)。仿真結果顯示,在以語數外總分為參照的校準方式下,中高水平考生群體受益面積很大(C 等級考生36.35%升級至B 等級,B 等級考生41.04%升級至A 等級)。說明該校準方式有利于優等生報考的科目,可以提高高分段考生的等級賦分,這恰好可以作為保障機制的有益補充,引導中高水平考生積極報考難度較大、優等生相對集中而總報考人數較少的化學科目,而這也正是保障機制政策的初衷之所在。

(五)其他科目數據仿真

筆者使用現有賦分方式與以語數外總分為參照的校準方式對其他三門再選科目(生物、思想政治、地理)進行數據仿真演算,得到數據表7。

表7 其他三門科目賦分方式對比表

分析數據表7,以現有計分方式為參照,考察以語數外總分進行校準前后考生等級變化情況,得到以下結果:

1.經校準后,生物科目受益群體:E 等級考生170人(47.22%),D 等級考生970 人(37.31%),C 等級考生1316 人(18.75%),B 等級考生468 人(6.8%)。

2.經校準后,思想政治科目受損群體:D 等級考生700 人(13.58%),C 等級考生3128 人(22.37%),B 等級考生4628 人(33.97%),A 等級考生2848 人(43.41%)。

3.經校準后,地理科目受損群體:A 等級考生762人(15.67%);受益群體:E 等級考生42 人(7.7%)。

根據模擬仿真結果,以語數外總分為參照進行校準后顯示:生物科目所有等級考生都出現升級情況,其中E、D 等級考生升級比例很大(E 等級47.22%,D 等級37.31%),B 等級考生升級比例偏?。?.8%);思想政治科目與生物科目相反,所有等級考生均出現降級情況,其中中上成績考生降級比例最大(A 等級43.41%,B 等級33.79%);地理科目A 等級少部分考生降至B等級(15.67%),E等級少部分考生升級至D等級(7.7%)。仿真結果顯示,以語數外為參照的校準方式有利于生物科目考生,不利于思想政治科目考生。

通過四門再選科目各等級考生比例校準前后對比圖(詳見圖1、圖2),結合再選科目語數外總分均值表(詳見表2)可以看出,校準后再選科目各等級的考生比例趨于合理,更符合各科目考生群體的實際水平層次,可以說,校準前是形式上的公平合理,校準后是實質上的公平合理。

圖1 再選科目各等級考生比例圖-校準前

圖2 再選科目各等級考生比例圖-校準后

五、結語

新高考改革中的等級賦分方案初衷是為了實現選考科目間的可比可加,但這個設計有其內在缺陷,它在試圖擺平各科難度差異的同時也抹平了選考群體能力差異,所以轉換效果出現偏離,從而引發了考生功利性選科的現象發生。本文模擬仿真結果表明,江蘇保障機制方式在引導考生正確選科方面起到了積極的作用,但其對低水平考生的保障力度要大于對高水平考生的保障力度,仍有進一步優化和改進的空間;以語數外總分為參照的校準方式可以作為保障機制的有效補充,校準后的等級轉換分更貼近考生在群體中的真實水平層次,但該校準方式計算過程較為繁瑣,且有不足之處,比如語數外加權分數校準是否比語數外總分校準更加合理等,需要進一步研究和驗證。

綜合考量學術研究與實踐操作,由于語數外總分校準方式只是一種模擬嘗試,且計算過程較為繁瑣,大眾理解方面也有待考量,而江蘇再選科目保障機制方式形式簡單、大眾易于理解,且有實際數據支撐,在引導學生正確選科方面起到了積極的作用,建議目前仍使用保障機制方式,但不要放棄優化改進的空間,積極探索進一步優化改進和完善的辦法。

猜你喜歡
語數賦分保障機制
農業科研系列晉職初審程序電子化方案設計
——業績賦分
教育廳長因決策失誤被責令辭職
關于完善事業單位財政保障機制的探討
小天使·四年級語數英綜合2018年7、8期合刊
小天使·六年級語數英綜合2018年1、2期合刊
小學校內語數社團的調查分析
淺析浙江新高考制度下的等級賦分制
出新不足,守正有余
禁止令適用保障機制和程序的完善
建立大病保障機制正當其時
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合