?

基于評價三角理論的學業質量評價設計

2019-05-29 11:43李連杰單中偉
中國考試 2019年1期
關鍵詞:學業證據概念

王 健 李連杰 單中偉

(北京師范大學,北京 100875)

近年來,中小學生學業質量的測評和國際比較研究備受關注,成為世界各國和教育研究機構的研究熱點領域之一。例如,在PISA和TIMSS等大型學生學業質量評價項目中,各個國家和地區都非常關注學生在數學、科學、閱讀等領域的國際排名。新修訂的普通高中各學科課程標準(2017年版)對學業質量提出要求,并對不同水平作出質量描述;但是如何開展學業質量評價,還需要厘清相關問題,例如,學業質量評價的基本價值取向是什么?如何科學、規范地進行評價整體規劃和設計?這些問題都將影響到學業質量評價的效果,進而影響到教育質量和學生的全面發展。本文從“促進學生學習的評價”立場出發,以評價三角理論作為理論指導,嘗試構建以證據為核心的評價框架,以期為學業質量評價工作的開展提供借鑒。

1 學業質量評價的價值取向

學業質量包含2層含義,第一是構成性概念的層面,是指學生在各類因素影響下,通過課程的學習,所達成的學業表現、品德行為、身心健康等方面的發展水平;第二是關聯性概念的層面,它包括影響學業表現的動機、師生關系、校長領導力等相關因素及其相互關系[1]。

評價是一種工具,可以用于觀察學生的行為,借此獲取相關數據,并對學生的所知和所能進行合理推論[2]42。因此,學業質量評價是一個系統、科學和專業的過程,主要工作是獲取信息,為課程設計、學生的學習、教育政策等方面提供決策參考[3-4]。

縱觀學業質量評價的相關研究,其價值取向大致分為2種:促進學生學習的評價(assessment for learning)和對學生學習結果的評價(assessment of learning),它們既存在基本共性,也有本質上的區別,見表 1[5]。

在當前的學業質量評價中,反映出一些普遍的問題:在評價內容方面,以測查知識為主,較少考查考生的學業能力;在評價方法和技術方面,人為性和主觀性較為明顯,缺乏心理測量學等客觀和科學的程序指導;在評價證據來源方面,大都以考試成績為主,較少考慮學生的學業質量全貌;在評價功能方面,更多的是對學生進行等級評定,缺乏診斷和指導[6]。這些方面反映出當前的學業質量評價多以“評價學生的學習結果”作為主要的價值取向。

隨著教育評價的不斷發展,人們對評價功能有了更加深入的挖掘和全面的認識,使得評價工作逐漸從診斷性向過程性轉化,“促進學生學習的評價”已成為當前的主流趨勢。

2 基于評價三角的學業質量評價設計系統

評價就是利用證據進行推理的過程,這一過程可以用認知(cognition)、觀察(observation)和解讀(interpretation)3個要素構成的三角形來表示,這3個要素構成了三角形的3個角,因此將其形象地稱作“評價三角”[2]44。

認知是一種理論或觀念,用以展示學生在特定學科領域內的所知和所能,例如,學生的錯誤概念、學習發展路徑、學生的學科能力發展水平等。觀察是一種描述或評價任務細目,主要指構成評價本身的多種類型的任務,這些任務要與認知相匹配,例如,要評價學生的高階思維水平,那么評價任務就應該能夠使學生有效地展示出其高階思維水平。解讀是指用以對觀察結果進行分析和推理的所有方法和工具,評價工作者可以據此選擇與評價任務相匹配的分析方法,這一工作同樣也要在認知框架的指導下完成。

在評價三角中,3個構成要素相互一致,認知是評價設計的前提基礎,觀察和解讀都要與之相匹配,而評價結果的解讀會再次印證學生學習特定內容的相關認知。3個要素“三位一體”,可以有效地評價學生的學業質量水平[7]。

我國當前的基礎教育改革強調學生在學習核心概念的同時發展學科能力,最終培養其核心素養?;谶@一教育發展背景,運用評價三角理論,構建中小學生學業質量評價框架,見圖1。在該系統中,將核心素養作為評價的認知基礎,學科能力和核心概念作為評價的重要內容,將證據收集和解讀作為評價設計的基本范式。

表1 2種價值取向的學業質量評價對比表

圖1 基于評價三角理論的學業質量評價設計框架

2.1 核心素養是學業質量評價認知框架的設計依據

當前,國際上的基礎教育課程改革都十分關注學生核心素養的發展,將其作為一項重要的教育目標。核心素養是指與職業上的實力、與人生的成功直接相關的,涵蓋了社會技能與動機、人格特征在內的統整的能力[8]。新修訂的普通高中各學科課程標準(2017年版)凝練了學科核心素養,并將其作為課程目標,如語文學科核心素養包括語言建構與運用、思維發展與提升、審美鑒賞與創造、文化傳承與理解[9];化學學科核心素養包括宏觀辨識與微觀探析、變化觀念與平衡思想、證據推理與模型認知、科學探究與創新意識、科學精神與社會責任[10];生物學科核心素養包括生命觀念、科學思維、科學探究和社會責任[11]。

核心素養與傳統的三維教育目標不同,核心素養是對學生多年學習成果的一種預期,是學生在擁有一定教育經歷之后所具備的關鍵素養和能力。它不僅涉及學科的核心知識、基本技能,以及情感、態度與價值觀,還涉及學生在這3個維度上的整合能力,并將其運用于分析和解決實際問題的能力。換句話說,核心素養既關注學生應該知道什么,更關注他們在現實情境中能夠做什么。培養學生的核心素養,可以為他們能更好地適應日益變化的世界創設良好的開端,同時也為其終身學習和發展,以及社會的良好運作奠定基礎。

核心素養的提出,表明我國的教育隨著時代的發展正在進行不斷的變革。將核心素養制定為課程目標,表明我國在學生培養模式以及輸出人才類型上正在發生變化,教育不再是培養重知識輕能力的學生,而是培養能夠解決實際問題、擁有更強實踐能力以及更能適應社會變化的學生;同時,也意味著教師需要按照更高要求的課程目標進行日常教學,教育評價也有了新的依據。

在教育體系內,課程、教學和評價是3個核心構成要素,見圖2。在這3個要素中,課程是教育體系的軟性實體,課程目標則是通過教師的教和學生的學來落實的,最終的效果可以通過教育評價進行評估。課程、教學與評價3個要素應相互一致、協調運作,才能夠明確教什么、評什么,同時也能夠為學生提供機會,真正地展示其學業成就水平[12]。

圖2 以核心素養為中心的教育體系構成

由于發展學生的核心素養是課程設計和發展的主線,因此,課堂教學以及教育評價都應該與之相呼應。作為評價形式之一的學業質量評價,也應該遵循這一要求,將核心素養作為評價設計的重要依據。

2.2 學科能力和核心概念是學業質量評價的重要內容

核心素養是學業質量評價的重要依據,其落實和達成需要通過學科教學活動來實現。學科能力和核心概念是形成核心素養的基礎,也是學業質量評價的重要內容。

2.2.1 學科能力及其解構

學科能力是指學生順利進行相應學科的認識活動和問題解決活動所必需的、穩定的心理調節機制,包括對活動的定向調節和執行調節機制,其內涵是系統化和結構化的學科知識技能及核心學科活動經驗圖式(穩定的學科經驗結構)[13]。學科能力通??梢苑譃閷W科一般能力和學科特殊能力兩大部分[14]:學科一般能力指的是學生在各學科的學習過程中普遍應該具備的能力,包括觀察能力、抽象概括能力、問題解決能力、探究能力、批判能力等;學科特殊能力指的是學生學習某一具體學科時,由于學科知識邏輯體系存在本質差異而出現的不同能力取向,如語文與外語學科中的語言表達能力和書寫規范能力,數學學科中的數字運算能力和空間想象能力,政治學科中的明辨是非的能力,科學課程中的實驗探究能力,等等。

根據信息加工理論,可以將學生的學習活動概括為3個方面:知識和經驗的輸入——學習理解,知識和經驗的初級輸出——實踐應用,知識和經驗的高級輸出——遷移創新,這就構成了學科能力的整體架構[13]。在實際運用時,還需對學科能力的這3個方面進一步解構,以增強其可操作性和應用價值。對具體的學科能力進行解構時,通常需要考慮相應學科的一般學科能力和特殊學科能力,例如,對生物學科能力進行解構后,其構成要素如表2所示。

表2 生物學科能力構成要素[15]

生物學科能力要素框架遵循學生學習的發展規律,共分為2個模塊:一是輸入模塊,此模塊下的能力要素為“學習理解”,學生通過觀察記憶將知識與先前知識進行整合,并從知識中概括出上位概念,概念彼此連接,形成概念圖,完成知識系統性的學習;二是輸出模塊,此模塊下的能力要素為“實踐應用”和“遷移創新”,其中“實踐應用”為初級輸出,“遷移創新”為高級輸出。學生針對簡單熟悉或復雜陌生情境下的現象或問題,利用已知事實和概念,通過演繹推理、批判性思維解釋個人觀點或提出問題的解決方案。生物學科能力要素框架較為完整地設計出了學生在解決實際問題、實踐創造等方面所需的能力,為學生學業質量水平和教學實踐效果標準的制定提供了立足點。

學科能力是學生培養過程中十分重要的一部分,是學生適應社會發展、進行終身性學習的必要條件。學科能力既是學科教學的目標指向所在,也是學業質量評價的重要內容,因此學科能力的系統化架構對教育評價改革提供了重要依據,這與國際上一些大型的學業質量評價項目(如PISA、TIMSS)具有共性,即將學科能力作為評價的重要內容。

2.2.2 核心概念及其解構

在學生核心素養的發展過程中,內容是重要的學科載體。內容領域可以分為若干核心概念(或概念主題),學生只有在掌握了相關學科的核心概念后,才能為其核心素養的逐步形成和提高奠定基礎。核心概念是位于學科中心的概念性知識,包括重要概念、原理、理論等基本理解和解釋,這些內容能夠展現當代學科圖景,是學科結構的主干部分[16]。

核心概念具有概括性和統攝性,通??梢杂妹~術語或陳述句的形式來表示,例如,“生物體的穩態”是用名詞術語來表示核心概念,“生命個體的結構與功能相適應,各結構協調統一共同完成復雜的生命活動,并通過一定的調節機制保持穩態”則是描述概念內涵的陳述句形式。名詞術語形式的核心概念屬于心理學領域的話語體系,而概念內涵陳述句的形式則是教育學范疇的話語體系。在課程和教學中,這2種概念呈現方式相互融合,通常共同使用。

核心概念不管是用名詞術語的形式來呈現,還是用概念內涵陳述句的形式來展示,在實際的教學和評價中,都需要對這些核心概念進行解構,將其分解成較小的概念,從而使其具有可操作性。對核心概念的解構通常運用“剝洋蔥”的方式,逐層剝開,分解成小的概念要素,例如:PISA在設計過程中,列出了各內容領域所考查的內容要點;美國《下一代科學標準》(The Next Generation Science Standards)列出了各內容領域的核心概念,并進一步呈現了相關的概念要點,這與我國普通高中科學相關課程(物理、化學、生物)標準中的概念呈現方式一致。由此可以看出,可以通過“內容領域—核心概念—概念要點”的方式對核心概念進行解構(見表3),以便于學業質量評價的操作。

表3 “物質科學”領域核心概念的三級解構[17-18]

2.3 學習預期是學業質量評價設計的核心指標

學習預期(intended learning outcomes,ILOs)是指在結束某門課程或某個主題單元的學習后,關于學生應該知道什么和能夠做什么的描述[19]。學習預期與課程目標存在本質性的區別,課程目標通常是較為籠統的描述,學習預期的描述則相對具體,并不特別強調知識的覆蓋面,更加關注學生在素養層面的發展水平。此外,學習預期的描述通常采用具體的行為動詞來展示學生的所知和所能,具有很強的指向性、操作性和可測性。

學習預期的描述需要綜合考慮學科核心素養、學科能力和核心概念。如果只考慮核心素養和學科能力,脫離概念載體,將會導致測評操作不夠精準,使得學生能力與核心素養表現泛化和空洞。如果僅考慮概念載體,學習預期的描述又會變成課程標準中內容標準的復制品,對學業質量評價沒有實質性的指導意義。如何協調這三者之間的關系,成為制訂科學合理的學習預期指標體系最需要解決的問題。

要解決這一問題,在整合核心素養、學科能力和核心概念時需要一個橋梁紐帶,這一紐帶就是針對相應概念主題的典型活動任務。學生在完成特定活動任務過程中所表現出的關鍵能力與核心素養是制訂學習預期指標體系的前提。

典型活動任務不同于課程標準中的內容條目和活動建議,也不是事實的簡單堆積,而是一類具有同一屬性的活動的統稱,涉及解決與學科息息相關的問題。這類活動從表觀上看情境各不相同,活動任務形式多樣,但從本質上講,學生完成這些活動,都需要運用同一心理認知操作和相同的概念屬性。對典型活動任務的理解,關鍵在“典型”二字,不是指“全面”,也不是指“基礎”,而指向于學生完成此類活動任務過程中所表現出的特定學科能力和核心素養。

學習預期指標體系是基于學科典型活動任務制訂的,是學生在經歷一定的學習活動之后在各類活動任務的解決中所表現出來的比較穩定的心理特征和行為特征,這種心理和行為特征指向即是學生應具備的學科核心素養和學科能力。學習預期可比作一架梯子,典型活動任務就是橫梁,隨著活動任務的不斷解決,學科的核心素養和學科能力也在不斷地發展與提高,最終指向學生在學習完某個概念主題或某門課程之后的學習成果。學習預期是反映學生學習質量和成果的重要維度?;趯W生認知發展規律和知識掌握程度,學習預期通常體現為內隱的典型活動任務解決要求與外顯的可操作可測量的核心素養和學科能力。不同年齡階段的學生,對于典型活動任務的理解不同,所能解決的任務類型和程度也存在很大差異,同時所表現出的核心素養和學科能力水平也會有高低之分。

針對不同概念主題的典型活動任務的提煉一般有3個途徑:一是基于課程標準進行提煉。課程標準根據學生認知發展規律規定了學生需掌握的知識,從這些知識中進行抽提概括。二是基于教學實踐經驗進行提煉。豐富的教學經驗為發現學生亟待解決的問題指明方向。三是基于習題作業進行提煉。大量的習題作業中隱含時下熱點與評價的動向,以此為法,將不同概念主題下的典型活動任務概括總結出來,并與核心素養和學科能力進行科學合理的有機整合,形成一套完整的學習預期指標體系。

以生物學科“細胞的結構與功能”主題為例,說明如何基于典型活動任務描述相應的學習預期。首先,分析與該主題有關的典型活動任務,主要包括理解結構與功能是如何相適應的,理解細胞的完整性與系統性是如何體現的,理解細胞失水和吸水的機制及其應用;然后,在此基礎上整合學科核心素養、學科能力,擬定“細胞的結構與功能”主題的學習預期(見表4)。

從以上分析可以看出,學習預期和課程目標共同闡釋了課程標準的要求,學習預期搭建了連通課程標準與教學和評價的橋梁,為實際教學、學生學習以及教育評價提供了強有力的依據。因此,基于學習預期的學業質量評價設計具有很強的操作性,也為評價結果的解讀和反饋提供精準的定位。

2.4 基于證據進行推理是學業質量評價設計的基本范式

設計良好的學業質量評價能夠為了解學生的學習表現提供重要的信息[20]。這些信息是研究人員賴以進行推論和決策的重要依據,即常說的證據。在學業質量評價中,證據是其核心所在。

2.4.1 證據的來源

在學業質量評價中,可以通過多種途徑獲取學生學習表現的證據,紙筆測驗是其中一種,也是獲取證據的重要來源途徑。紙筆測驗具有諸多優點:1)高效:學生可以在相對較短的時間內回答一定數量的試題;2)覆蓋面廣:紙筆測驗能夠覆蓋學科不同領域的重要內容;3)實施和管理較為容易;4)評分客觀便捷:試題的評閱相對簡單,特別是選擇題、判斷題和填空題。但是,紙筆測驗也有不足之處,比如無法提供學生在特定內容領域所知和所能的完整證據,不能反映學生的復雜問題解決能力,無法評價學生的實際動手操作能力等。如果不能獲得關于學生所知和所能的全面和足夠的證據,即使運用再先進的結果分析方法和工具,也不能對學生的學業質量進行推論[21],自然也就不能對政策和經費決策提供支持。隨著評價理論的發展,關于學生學業質量的證據來源也在不斷豐富和擴展,例如實作評價、課堂觀察等。

實作評價(performance assessment)是與紙筆評價相對而言的一種評價方式,評價任務并不要求學生在給定的選項中選擇正確的或合理的,也不要求學生填空或簡答,而是要求學生在真實的情境下完成一項任務,例如解決復雜問題,進行操作或表演,或制作某種作品,然后由評價者根據特定的量規(rubric)對學生的表現或作品進行評定[22]。對于短文寫作、觀點論述等一些常出現在紙筆測驗中的開放性任務,如果是單獨的任務類型,并不要求學生在固定的時間內與其他任務一同完成,那么這類任務可以看作是實作評價任務。由此可以看出,是否用紙筆介質完成任務并不是實作評價和紙筆評價的根本區別。在基礎教育階段,實作評價可以用于各個不同學科學生學業質量評價的證據來源,例如學生在音樂課上的演唱、器樂演奏,美術課上的繪畫,體育課上的籃球投籃,科學課上的實驗操作和科普劇表演,英語課上的語言對話,語文課上的短文寫作,等等。

表4 生物學科“細胞的結構與功能”主題的學習預期

此外,在課堂上也存在大量對學生的學業質量進行評價的機會,即通過課堂觀察,記錄學生在相應內容領域的學習情況,收集相關證據;這些證據包括學生的口頭報告、回答問題、與同伴之間的討論和交流等。通過這些證據,可以記錄和分析學生的思維發展過程。

在學業質量評價中,應通過多種途徑廣泛地收集有關學生所知和所能的各種證據,不管是紙筆測驗,還是實作評價或課堂觀察,只要能獲取與教育目標所指的各類行為有關的有效信息,都可作為獲取證據的可能途徑或來源[23]。

2.4.2 評價任務設計

評價任務是收集證據的重要載體,因此,評價任務的質量直接影響到證據可靠性。這里所說的評價任務既包括紙筆評價中的試題,也包括實作評價中的具體活動或作業等。在設計評價任務時,需要根據評價的認知架構(核心素養)來構建評價藍圖,如表5所示。對學業質量評價有全面和系統的整體規劃,才能保證評價三角中的認知和觀察相互匹配,同時也能保證所收集證據的全面性,有利于評價工作的順利開展和有效實施。

在設計具體的評價任務時,要以核心素養作為出發點,既要考慮到與學習預期的相關性和匹配性,又要保證評價任務的科學性(如試題的難度、區分度、信度、效度等)和規范性;此外,在設計評價任務時,還需要開發相應的評價標準或量規。評價標準或量規也要與核心素養相一致,其客觀性和準確性也是保證評價任務質量的重要因素。

2.4.3 證據的收集與解讀

通過評價任務,可以收集到學生在以下4個方面的證據:有關學科知識掌握的證據,有關學科能力形成的證據,有關學科核心價值觀發展的證據,有關學生學習品質養成的證據[24]。在實際工作中,具體收集哪方面的證據,需要根據學業質量評價的認知框架而定。

完成相關證據收集后,需要對證據按照預先設定的認知框架進行整理和篩選,并對其有效性進行評估。篩選整理完畢后,通常采用經典測量理論對證據進行處理和分析。隨著教育統計與測量理論的發展,概化理論、項目反應理論、認知診斷理論等數據分析方法也常常應用到處理分析中來,以提高證據處理分析的客觀性與科學性。

對證據的解讀則是在上述步驟完成的基礎上進行的,主要包括對統計結果的闡釋和說明,以及基于此作出的可能推論。證據解讀是學生學業質量評價的重要一環,此部分可以運用Bookmark或Angoff等方法對證據進行解讀,以將學生的整體學業質量水平進行劃分和描述[25];還可以在此基礎上針對認知框架中的每個維度進行詳細的水平劃分和描述,例如描述學生在生命觀念、科學思維、科學探究和社會責任等不同生物學科核心素養維度上的表現情況。

此外,針對學業質量評價結果的解讀,還可以深入挖掘結果產生的可能影響因素,如學生的家庭背景、學業負擔、學習動機、可獲得的學習資源、學習投入時間等[26],這也是當前國際上學業質量評價的發展趨勢之一。這種證據的解讀方式能夠從不同的角度闡釋學生的學業質量水平,并對教師的教和學生的學提供宏觀和微觀2個層面的有效反饋信息,符合“促進學生的學習”這一學業質量評價取向。

無論是證據的收集,還是證據的解讀,都需要本著公平的原則來進行,例如:要給所有學生真正展示其學業質量的機會;在設計評價任務時,不能存在性別、種族等方面的偏見;數據分析時要確保分析方法的客觀、公正。全方位的公平性支持是提高學業質量評價的重要保障。

表5 學業質量評價藍圖樣例

3 結束語

學業質量評價是基礎教育的核心任務之一,高質量的評價設計將直接影響到教育教學質量。在開展中小學生學業質量評價時,應以“促進學生的學習”為評價工作的價值取向,在此基礎上進行科學、規范的整體規劃和設計。在設計工作中,以評價三角理論作為指導思想,構建以核心素養為導向的認知框架,通過對學科能力和核心概念的解構,進而整合形成學習預期指標體系,并在此基礎上構建評價藍圖,進行評價任務設計、證據收集和解讀等工作。這一學業質量評價框架可以為具體工作的開展提供借鑒。

作為教育工作者,應該更新評價觀念,注重挖掘評價的多重功能。以終為始,以評反饋教學,以評改進學習,從多個渠道收集反映學生學業質量的證據,將學業質量評價工作嵌合在全部教學工作中,從而使學業質量評價服務于教育目標的達成,最終實現學生的全面發展。

猜你喜歡
學業證據概念
艱苦的學業
Birdie Cup Coffee豐盛里概念店
基于數據挖掘的學業預警模型構建
幾樣概念店
音樂提升學生學業表現
學習集合概念『四步走』
手上的證據
深入概念,活學活用
家庭暴力證據搜集指南
手上的證據
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合