?

新時代我國基礎教育質量評價政策工具使用現狀與優化建議

2023-10-24 06:26劉偉豪陽榮威
基礎教育 2023年2期
關鍵詞:行動者權威工具

劉偉豪,吳 蔚,陽榮威,2,程 昆

(1.湖南大學 教育科學研究院,湖南 長沙 410082;2.湖南省教育質量與評價研究基地,湖南 長沙 410082)

教育評價是關乎教育發展的重要事權,科學的教育評價導向是教育健康有序發展的前提。為扭轉長期以來不科學的教育評價導向,2020年10月,中共中央、國務院印發《深化新時代教育評價改革總體方案》(以下簡稱《總體方案》),這是新中國成立以來首份以教育評價改革為核心指向的綱領性文件,為我國教育評價和教育事業發展提供了重要的理論指導和實踐引領價值,開啟了教育評價系統性改革和高質量發展的新時代?;A教育質量評價是指根據黨和國家有關方針、政策、法令和法規,定期對基礎教育質量進行測量與判斷,利用評價結果改進基礎教育的活動[1],是教育評價的重要組成部分。在構建高質量教育體系的背景下,教育質量評價為基礎教育質量提升描繪了發展基點,是促進基礎教育高質量發展的有效抓手?!犊傮w方案》頒布后,基礎教育質量評價領域相繼出臺了4份貫徹落實教育評價改革精神的文件,基本上形成了新時代基礎教育質量評價政策體系。但政策出臺并不意味著政策目標能夠快速達成,面對教育評價這一歷史性、世界性和實踐性的難題,基礎教育質量評價改革的長效落實任重道遠?!犊傮w方案》實施后,一些地方政府與學校在全面評價學生發展、綜合評估學校質量和有效評估區域教育發展的制度體系等方面取得積極進展,但也存在制度性改革成效不大、改革面臨著許多瓶頸等問題,這與改革的系統推進思路不足和關系協同思維的缺失有緊密聯系[2]。政策工具是政府為實現政策目標而采用的方法和手段,是聯結政策目標、政策執行和政策效果的紐帶。政策工具的選擇和使用在政策價值目標實現過程中起到至關重要的作用[3]。因此,從政策工具視角反思基礎教育質量評價政策不失為一種政策改進的新思路。然而,目前對我國新時代基礎教育質量評價的研究主要集中在評價改革路徑與建議[4]、政策解讀[5]、域外經驗借鑒[6]等方面,未有研究運用規范的政策工具理論對其政策設計進行探討。鑒于此,本研究基于政策工具理論視角,運用內容分析法對我國新時代基礎教育質量評價政策進行審視,剖析政策工具使用的現狀及存在的問題,并提出優化建議,以期為完善基礎教育質量評價政策、改進基礎教育評價實踐提供參考。

一、分析框架與研究設計

(一)分析框架

政策工具分類是政策工具研究的核心議題與分析基礎。施耐德和英格拉姆(Schneider &Ingram)討論“公共政策的研究假設”后將政策工具分類為權威工具、能力工具、激勵工具、象征與勸誡工具、學習工具[7]。這類工具分類的依據在于利用不同因素對個體或集體行為施加影響而使目標群體按照政策意圖實施行動,這與我國基礎教育質量評價現狀的內在維度具有耦合性。當前基礎教育質量評價的利益相關者眾多,政策落實受多重因素牽絆,政策相關群體的行為動機和具體執行面臨復雜深刻的影響因素?;A教育質量評價政策的有效推進需要相關群體的認同、響應和支持,需要我們從“行動主體考察”和“全局群體關照”的視角出發廓清政策理想目標和實際執行之間的規律,從而更好地驅動政策行動者完成政策目標。同時,施耐德和英格拉姆將政策目標和政策行動者的行為動機聯系在一起,從行為規律的原理出發提出了政策行動者的行為假設,提供了一個較為具象化的分析空間,該分類涵蓋了制度深層結構、微觀行動者等多維元素,層次較為豐富,有助于從政策執行者行為規律的視角來理解基礎教育質量評價政策。此外,通過比較可發現,該類政策工具框架中包含的學習工具是其他政策工具分類理論所未涉及的,學習工具對落實基礎教育質量評價改革具有重要意義。當前教育評價場域缺乏對評價對象的主體性關照,如何落實多元主體評價格局(如建立第三方評價機制)成為迫切議題,這些問題都指向了學習型工具所具有的學習探索、自我評價的元素屬性。因此,運用該理論框架來分析基礎教育質量評價政策工具體系具有適用性。這五類政策工具的特點如下:

(1)權威工具指政府在合法權力框架下支配和規范個人或機構行為的強制性規則,表現形式包括要求、規定、許可、禁止等。權威工具假設政策行動者能遵守權威和管制,即使沒有切實的回報,也應按照政策期望和規則來行動。其優點在于收益面廣、約束力強、成本較低、見效快、適用于危機緊急情況,缺點則是靈活性弱、易被功利主義趨附以及易壓抑政策行動者的積極性。

(2)能力工具強調提供資金保障、基礎設施與組織建設、教育、培訓和信息等資源給政策行動者,以提升其識別機會、做出決策和解決問題的能力,表現形式有信息、教育培訓、組織制度建設、其他資源(例如技術支持、資金保障和營造環境氛圍等)。能力工具假設行動者不在意激勵,而需要通過信息、培訓和資源供給來提升執行能力。其優點在于關注可持續發展,缺點在于見效慢、成本高和不確定較強。與激勵工具企圖投入資金產生直接、短期可見的效果相比,能力建設工具更傾向于培養行動者可持續的執行能力,是一種長期投資。

(3)激勵工具指通過正向的回報或者負向的懲罰來誘導政策行動者的工具,表現形式包括正向激勵和負向激勵兩類子工具。其中,正向激勵包括財政補貼、稅收減免、授權和表彰等物質或精神獎勵,負向激勵則是收費、制裁或問責等懲罰措施。需要區分的是,激勵工具中的資金物質獎勵目的是激發政策行動者的動力,這種資金獎勵針對性強但不穩定,而能力建設工具中的資金保障更側重于通過經濟手段培養政策行動者的執行能力,立足于長遠的考慮,具有穩定性和公共利益偏好。該工具假設個體追求效用的最大化,會對正向回報做出反應和選擇,并試圖回避負向的懲罰。其優點在于靈活性強、較高的政治可行性以及易激發政策行動者的積極性,缺點則是可替代性強、試錯成本高、易滋生資金腐敗問題。

(4)象征與勸誡工具指通過價值觀和信念的勸告與引導,使政策行動者做出符合政策目標行為的一種工具,表現形式有象征聲明、基本原理、貼標簽、勸誡等。其中,象征聲明是發出聲明以試圖使人們相信政府提出的行動和目標是重要優先的;基本原理即運用積極的象征(例如自由、平等、價值、效率、秩序等)來闡釋政策的基本內容和原理;貼標簽是使用比喻、象征和標簽來強調正向的政策理念[8]328-330;勸誡即采用說理方式勸服行動者。象征與勸誡工具假設個體的信念與要求一致時,傾向于采取符合政策價值觀的行動。其優點在于適用面廣、成本低、易實施,缺點在于具有自愿性和不穩定性,不適用于危機緊急情況。

(5)學習工具系當目標群體要實際解決問題時遇到不知道或者不確定的情況下使用的工具,表現形式有自我評價、研究探索、協商研討等。學習工具假定政策行動者能夠進行學習,可以從其他有效的工具中進行選擇[9],并能通過探索和協商解決問題[10]。其優點在于集思廣益、益于經驗推廣和制度反思,缺點則是實施難度大和見效較慢。

(二)研究設計

1.研究方法

本研究主要采用內容分析法和數據統計法來分析新時代基礎教育質量評價政策文件。首先,確定相關政策的分析單元,借助Nvivo11軟件對分析單元進行編碼。其次,依據施耐德和英格拉姆政策工具的分析框架,對不同類別的政策工具使用情況進行歸類統計。最后,在量化分析的基礎上剖析新時代基礎教育質量評價政策工具的使用現狀與特征,進而提出優化建議。

2.文本選擇

為保障政策文本分析的代表性和可靠性,本研究選擇政策文件時遵循以下原則:第一,以2020年10月《總體方案》的頒布時間為政策選擇的起點,原因是《總體方案》的頒布開啟了教育評價改革的新時代,“破舊立新”成為教育評價改革的顯著特點,以此為時間節點進行搜索才能準確找到貫徹新時代教育評價改革要求和精神內涵的文件;第二,發文單位為中央機關,包括國務院、教育部等,以確保文件是國家層面的文件;第三,政策文件主題必須是指向基礎教育質量評價的總體文件或是針對學前教育質量評價、義務教育質量評價、高中教育質量評價的專項文件?;谏鲜鲈瓌t,本研究共收集了4份基礎教育質量評價領域貫徹落實《總體方案》的政策文本,分別是《幼兒園保育教育質量評估指南》(教基〔2022〕1號)、《義務教育質量評價指南》(教基〔2021〕3號)、《國家義務教育質量監測方案(2021年修訂版)》(教督〔2021〕2號)、《普通高中學校辦學質量評價指南》(教基〔2021〕9號)。這4份文件涵蓋了基礎教育全階段,且均明確表述了貫徹教育評價改革精神的要求,可為研究提供可靠的樣本支撐。

二、政策文本編碼與內容分析

(一)文本編碼

基于政策文本的反復研讀,結合專家意見,本研究確定以句子為基本單位,結合上下文內容的意群關系,按照“文本編號—章節—條款/句子”的原則進行編碼。為保證研究信度和編碼效度,本研究運用獨立評判法進行對比驗證和集中研討。首先,三名獨立研究者在充分理解政策工具理論與編碼要求后,分別獨立對4份政策文本進行類目編入,得到初步編碼表;并對三份編碼表進行肯德爾檢驗,結果顯示肯德爾和諧系數為0.902,P<0.001,說明三份編碼表具有較高的一致性。其次,對比初步編碼表,查驗編碼不一致的分析單元,共同研討論證達成一致結果后,再次編碼歸類,最終得到政策文本內容編碼表(見表1)。限于篇幅,僅舉部分樣例。

表1 政策文本內容編碼表(部分樣例)

(二)內容分析

根據政策工具理論對4份政策文件的137個編碼分析單元進行歸類統計,得到政策工具使用情況表(見表2)??傮w而言,五種政策工具都有涉及但使用不均衡。

表2 政策工具使用情況表

表2顯示,權威工具使用比例最高(39.41%),但內部結構不均衡,其中大部分為規定工具(30.65%),要求(6.57%)、禁止(1.46%)和許可(0.73%)也均有少量使用。規定是對政策行動者的行為方式做出約束性的規則,如《普通高中學校辦學質量評價指南》中規定“評價周期內要實現對學校辦學質量評價全覆蓋”。這類對教育質量評價做出明確性和指示性規定的表述在4份文件中最為常見?!耙蟆笔菍φ咝袆诱咛岢雒鞔_性的強烈期望,如《幼兒園保育教育質量評估指南》中要求“切實扭轉‘重結果輕過程、重硬件輕內涵、重他評輕自評’等傾向”?!敖埂泵鞔_提出了不被準許和認可的行為,如《幼兒園保育教育質量評估指南》中“嚴禁用直接測查幼兒能力和發展水平的方式評估幼兒園保育教育質量”,它對直接測查的片面方式給予了強烈堅決反對,劃出了基礎教育質量評價的底線范圍?!霸S可”在4份文件中僅出現一次,即《義務教育質量評價指南》中提出“各地可結合本地實際,制定義務教育質量評價實施細則”,這實際上是授予了地方政府制定義務教育質量評價具體細則的權力,為提升質量評價的適配度和靈活性提供了空間。

象征與勸誡工具使用比例(28.47%)僅次于權威工具,但子工具的使用呈現失衡樣態,其中以勸誡(15.33%)和象征聲明(10.95%)居多,含有少量的貼標簽工具(2.19%),基本原理工具未得到使用。勸誡工具試圖勸服行動者采取政策行動,它在4份政策文件中的使用比例僅次于規定工具,說明政府試圖通過引導、呼吁和號召來推動基礎教育質量評價的順利執行。宣告聲明即明確地表達政府優先重要的行動和目標,如《國家義務教育質量監測方案》直接聲明要“落實《深化新時代教育評價改革總體方案》等文件要求,進一步完善國家義務教育質量監測制度,推動落實立德樹人根本任務,促進義務教育質量提升”,開宗明義地指出開展基礎教育質量評價要落實教育評價改革和立德樹人目標的重要事項,以此向公眾滲透政府期望的評價理念及政策意蘊,彰顯出政策制定者對決策啟發法的偏好。貼標簽在政策文件中表現為使用具有比喻性或象征性的詞語或短句,簡明扼要而又意味深長,力求達到規勸和引導的作用,如《普通高中學校辦學質量評價指南》中規勸政策行動者要防止用“一把尺子”衡量不同學校的做法?;驹砉ぞ呤墙柚e極的象征來闡釋政策基本內容和原理,但在4份政策文件中均未有體現。

能力工具的使用比例(22.63%)稍低于象征與權威工具,四種子工具均有使用,其中組織制度建設(9.49%)、信息(5.11%)、教育培訓(5.11%)三種占比較高,其他資源(2.92%)占比最低。組織制度建設意在通過提供組織設施或建立制度體系,培養行動者的政策執行能力,如《國家義務教育質量監測方案》提出“搭建監測學習交流平臺”。信息工具在政策文本中體現為經驗推廣和信息公布,如《普通高中學校辦學質量評價指南》提出“對在評價工作中發現的辦學質量顯著提高的先進典型經驗,要大力宣傳推廣”。教育培訓強調對政策行動者的長期性投資,目的在于加強教育質量評價的人力資源建設,如《幼兒園保育教育質量評估指南》中提到“切實加強評估隊伍建設,建立一支專業化評估隊伍”。其他資源在4份政策文件中各出現一次,主要措施表現為研制評價工具、資金保障和營造政策環境,如《國家義務教育質量監測方案》指出要“組織專家研制測試工具”;但資金保障僅出現在《幼兒園保育教育質量評估指南》和《普通高中學校辦學質量評價指南》中,義務教育質量評價的兩份文件并未提及資金保障。

學習工具的使用處于低頻化,僅為5.11%。自我評價工具意在使目標群體更好地認識自我和自主學習,除《國家義務教育質量監測方案》外,其他三份文件均有使用一次自我評價工具以鼓勵建立自我評價機制,例如《普通高中學校辦學質量評價指南》中明確了“普通高中學校每年要對本校辦學質量進行自評”。我國基礎教育質量評價多以研究探索工具來完善評價方法和評價方式,如《義務教育質量評價指南》要求“積極探索采取政府購買服務方式,培育和委托第三方專業機構開展義務教育質量評價工作”。協商探討主要在政策執行者信息缺乏或觀點不一致時用于討論和協調,以集聚廣開言路、集思廣益帶來的政策勢能,但在文件中未有體現。

激勵工具(4.38%)在4份政策文件中使用最少。除《國家義務教育質量監測方案》未涉及外,激勵工具的兩類子工具在其余三份文件中均有使用。其中,三條正向激勵工具將教育質量評價結果作為獎懲表彰、資源配置、政策支持和校長考核的重要依據,意圖用正向回報激勵行動者積極參與評價活動。三條負向激勵工具要求對履職不到位以及教育質量持續下降等情況進行問責,意圖對落實不力、違規的行為給予懲罰,以此反向倒逼行動者服從政策安排。例如,負向激勵工具出現在《普通高中學校辦學質量評價指南》中,體現為“對履職不到位、違反有關政策規定、學校辦學質量持續下滑的,要及時督促整改,并視情況依法依規追究責任”。

三、研究結論與優化建議

基礎教育質量評價的推進需要完善的政策體系來保障,政策體系建設是不同政策工具交叉協同運用、共同發揮作用的系統工程。不同的政策工具在政策體系建構中發揮著不同的作用,因而需要充分考慮到各種政策工具使用的合理性,任何過度依賴或缺少某些政策工具的使用,均有可能在不同層面和程度上影響政策實施的效果。為了有效推進我國基礎教育質量評價政策體系建設,有必要對其政策工具使用現狀進行審思,并在此基礎上提出優化建議。

(一)我國基礎教育質量評價政策工具使用現狀審思

通過對4份政策文件的內容分析,可發現政策工具使用的組合結構呈現失衡化的樣態。一方面,這種失衡體現在五類政策工具使用頻率有較大差異,權威工具使用次數較多,占比高達39.41%。與此形成鮮明對比的是,激勵工具、學習工具使用不足,占比略高于或低于5%。另一方面,同一類政策工具內部子工具的使用具有失衡偏向,如權威工具的內部結構中,規定子工具約占權威工具總數的77.77%;又如在象征與勸誡工具的內部結構中,勸誡子工具約占象征與勸誡工具總數的53.85%,而基本原理工具未被使用。綜合運用政策工具以取得政策效果的最大化,取決于多種政策工具的協商一致程度[11]。雖然政策工具的理想選擇和最優組合不一定是平均分配,但是理想的政策效果和長效的政策收益需要政策工具之間的相互補充和制衡[12],過度依賴或過少使用都可能影響政策效能的有效發揮。因此,我們有必要對基礎教育質量評價政策工具組合的失衡化樣態進行深入探討。

1.權威工具使用比例較高,難以發揮工具本原效能

權威工具具有收益面廣、約束力強、成本較低、見效快、適用于危機緊急情況等優勢,是政府最偏好也最常用的政策工具類型?;A教育質量評價作為一種診斷方式和改進手段,政府推進其實施不可或缺地會用到權威工具,這能夠保障評價政策貫徹執行,降低政策成本,提高評價改革效率。但對權威工具的使用卻有過度依賴傾向,這將導致權威工具難擔其責,難以發揮本原效能。其因有四:第一,缺乏充足性條件。規?;臋嗤ぞ甙l揮效用需要充分的條件,包括政策目標認識清晰、手段明確,政府各層級、各部門之間目標較一致,且執行機構擁有充分資源[13]。但就當前狀況而言,各地對教育質量監測與評價的認識不清晰、不一致,常出現以“監測”之名行“統考”之實的現象[14],各級政府關于教育評價事權與責任的劃分尚不十分明晰,不同地區教育評價資源的擁有量和開展基礎教育質量保障的能力和水平也具有較大差異[15],基層政府系統開展質量評價的能力還有較大的提升空間,這些條件弱勢的問題易造成政策行動者選擇性執行政策,引起政策失真[16]。第二,弱化政策實施的靈活性。權威工具有靈活性較差的弱勢,過度依賴這一工具造成的劣勢則更為明顯。多樣性是教育的基本特性,教育意涵著教育目標的多重性、短期與長期教育目標的矛盾、天賦和后天努力的交互沖突[17],尊重教育的多樣性內核、實施教育質量多元評價是當前教育評價改革的要務。中央政府下發的基礎教育質量評價文件面向全國,側重于統一標準、總體要求和宏觀目標,難以兼顧到不同地區、不同類型的學校。權威工具的靈活性較弱,針對性相對欠缺,過溢使用易造成對教育特殊性和多樣性的忽視,在評價過程中出現較嚴重的“標準化”“一刀切”問題,導致教育的同質化或趨同化現象[18]。第三,易被功利主義趨附?!犊傮w方案》指出“唯分數”“唯升學”是教育評價的頑瘴痼疾,實際上一些地方的基礎教育評價中時常出現“狀元榜”和“內部排名單”等現象,質量評價成為“唯分數”“唯升學”的“遮羞布”,甚至評價結果變相地成為地方教育行政部門的政績工具,這些都表明評價被功利主義趨附的現象依舊明顯地存在。長期以來,功利主義的文化取向聯結磐互在人們的社會心理意識里,深深嵌入至評價相關者的行為實踐中[19],通過評價為自己謀利更是成為了某些利益主體所追求的目標,當權威工具使用比例過高,質量評價難免被功利主義的頑瘴趨附,不利于深入推進基礎教育質量評價改革。第四,易壓抑政策行動者的積極性。教育組織行為學認為,當高度控制策略被不斷使用,組織成員常常會失去興趣[20]325。這個現象在基礎教育質量評價領域顯而易見?;A教育質量評價政策深深內嵌于我國自上而下的行政管理思維中,政府責令政策行動者直接執行評價任務和服從評價要求,評價執行者和評價對象均處于被動地位,這使評價具有強烈的外部屬性。此時重視的是政府、公眾對教育質量問責的立場和態度,而非評價的質量改進功能。在這種情況下,如若過溢依賴權威工具,易忽視地區教育發展的不平衡性,導致評價執行部門落入程序固化和目標僵化的窠臼中,引發造假、應付式參與評價和考核積極性不高等問題。如在浙江調研座談會中,某市教育部門負責人坦言:“很多學校的綜合素質評價都在造假,這是不爭的事實”[21]。

2.激勵工具使用不足,掣肘評價體系內部動力

激勵工具雖然具有可替代性強、試錯成本高等缺點,但靈活度高、政治可行性強以及易激發政策行動者的積極性等優點也使其在“政策工具箱”中的地位舉足輕重。正向激勵工具主要利用物質獎勵、名譽表彰等手段在短期內激發政策執行者的積極性和主動性,負向激勵工具則主要利用制裁、問責等手段反向倒逼政策行動者遵守政策安排并規范實踐行為,兩者有機結合更有利于提升激勵措施的執行效力。審視現實情況可發現,缺乏內生動力和積極性的現象在教育評價領域長期存在且顯而易見。早在1994年召開的“國家教育評價制度國際研討會”上,有專家就指出“我國教育評價過程中被評價者缺乏評價需要,特別當質量測評或督導往往帶有自上而下、外部強加的行政命令性質,被評價者積極性不高的問題比較常見”[22]。時至今日,整個基礎教育評價制度的內部動力不足、被評價者的主動性和積極性不高的問題依舊難除[23]。例如在現實中,不少中小學校已經適應了長期以來的被動式評價模式,加之缺乏激勵,他們習慣被上級管理部門“推著走”,習慣于自上而下的檢查督導和評價方式。事實上,此類現象與教育評價的激勵機制缺乏有著直接密切的關系。但反觀質量評價政策設計,卻存在激勵工具使用不足的特點,特別是正向激勵工具的低頻化使用,這在不同程度和層面上掣肘著質量評價政策的有效推進和評價體系內部動力的激發,與解決基礎教育質量評價內部活力不足的真問題不匹配。

3.學習工具使用低頻化,制約多重工具效能發揮

學習工具的優點包括集思廣益、益于經驗推廣和制度反思,有利于政策執行者和目標群體加深政策理解。它突破了傳統政策制定“自上而下”的單向模式,為個人和機構建言獻策以及政策相關者進行“互動”提供了機會[24]52,易創設出開放協商、包容共治和改革反思的政策氛圍。但學習工具使用的低頻化,卻使評價政策陷入了以下三方面的困境,制約著學習工具多重效能的發揮。其一,減弱相關群體與政策的聯結度[24]53。學習工具通過研究探索、協商探討等子工具的施行,能夠幫助政策制定者、執行者、目標群體三者之間開展互動對話和溝通協商,有利于增進相關群體對基礎教育質量評價政策內容的學習和認同,促進政策制定者廣泛聽取各方意見,凝聚制度共識。然而使用學習工具的整體頻次較低,將難以使政策相關群體保持積極關注并持久聚焦于政策內容,有礙于政策的深度聯結和多方共識的凝聚,從而進一步降低政策的關涉度和認同度。其二,削弱政策工具組合的平衡性。不同于權威工具的“自上而下”的實施邏輯,學習工具是“自下而上”的實施邏輯[25]50,兩者具有性能上的互補性。長期以來,我國評價權根源于政府的行政權力,加之基礎教育質量評價依賴于使用較多的權威工具來推進評價活動的組織與實施,這導致評價常常缺乏對被評價者的關照和學校等利益相關者的主動參與,難以提升學校認可評價、利用評價的積極性,甚至一些地區還用變相手段將以評價結果向學校教師施壓[26]。在這種依賴權威工具的政策語境中,基礎教育質量評價內部活力不足和評價者積極性不高是一道治理難題。學習工具卻能在不同層面上彌補權威工具在此方面的內源性弱勢和消極影響。一方面,學習工具通過設置自我評價的形式,下放一定的評價權限至評價執行者或評價對象,有利于激發政策相關者群體的教育評價自主性、診斷教育質量的自為性和改進教育質量的內部動因;另一方面,學習工具還能通過研究探索和協商研討等方式,廣泛吸收多方意見和社會關切,這都是對評價執行者和評價對象主體性、能動性的肯定。但學習工具使用甚少,與權威工具之間比例懸殊,兩者難以協同發力,勢必會在不同程度和層面上降低政策工具組合的平衡性。其三,降低自我評價的可能性。當前,我國整個基礎教育評價領域深受以標準化思維、分析式思維和技術化思維為主導的影響,評價與教育相脫節的窘況難以消弭,教育評價對教育性的關注不足,解決這些問題需要在評價標準上重視標準的動態生成,在評價樣態上注重個體的自我評價[27]。然而在學習工具低頻化使用的情況下,政策行動者將難以通過協調、研究探索的方式建立和拓展自我評價的內容范疇和操作路徑,在一定程度上降低了評價標準動態自然生成的閥限,限制了自我評價實現的可能性。

4.政策工具內部結構失衡,消解政策體系的協同性

理想的政策設計應加強政策工具內部結構的協調,在功能上實現互補和配合,形成政策協同效應。若政策工具內部結構出現失衡的情況,將導致政策體系的整體功能受到削弱,難以全面協同地發力。然而,基礎教育質量評價政策卻存在政策工具內部結構失衡的問題,主要體現在以下三個方面:其一,權威工具主要使用了規定工具,卻對許可和禁止這對屬性相反但性能互補的工具使用較少。由于基礎教育質量評價涉及的相關群體較為復雜龐大,其利益訴求廣度和需求深度往往會超越政策制定者的設計預想,現實中易出現訴求溢出和需求異化的現象?;谫Y源有限性和理性經濟人的假設,政策制定者常常會縮小政策相關者的需求范圍,甚至對代價大、成本高的政策決策采取規避傾向。許可與某些禁止或要求特定活動的標準或規則相聯系,旨在通過提高某些遠遠超出行動本身收益的成本去消滅那些行為[28]66。許可和禁止均具有成本低、見效快的特點,這對于限定評價者和被評價者訴求和責任的范圍,以及完善評價標準和建立制度準入機制(例如引入和審批第三方教育評價機構)是一種較好的政策工具選擇。例如,在學生綜合素質評價推進中,不少省市已經投入大量人力、財力建立了綜合素質評價系統平臺,卻出現投入與產出嚴重的“倒掛”現象,陷入效益困境,致使不少地方政府對其有效性產生懷疑,甚至動搖了持續推進綜合素質評價結果使用的信心[29]。在這種情況下,若未劃定綜合素質評價主體的權責范圍,規避責任和刻意降低成本的行為將缺乏強意義上的“禁止”,綜合素質評價難以得到全面長效落實。其二,象征與勸誡工具使用了較多的勸誡工具、象征聲明工具,基本原理工具嚴重缺位?;驹砉ぞ呦颠\用積極的象征來精心闡釋政策的基本內容和原理機制,引導人們正確理解政策,其特點在于并不必然讓一個政策偏好的選擇客觀上與另外的選擇相沖突,進而減少政策的負面性[8]328。當前我國基礎教育質量監測與評價中存在價值不明確、理論基礎不扎實、具體要求不系統、教育方針落實陷入判斷困境等問題[30],人們對基礎教育質量的內涵理解不統一,紛繁復雜甚至錯誤的教育質量觀短時期難以消除,對質量監測評價的理解與實施缺乏理論模型的指導[31];同時,教育評價改革面臨“破五唯”(即破除“唯分數、唯升學、唯文憑、唯論文、唯帽子”現象)“立四新”(即建立“改進結果評價、強化過程評價、探索增值評價、健全綜合評價”四項新舉措)[32]的邏輯轉向,向基礎教育質量評價提出了新要求、新訴求和新關切。舊問題與新挑戰的并存交互對于剛步入深水區的基礎教育質量評價改革來說,亟需基本原理工具的引入和有效應用,以落實《總體方案》“加大對科學教育理念和改革政策的宣傳解讀力度”的要求,進一步增進政策相關群體的理解和認同。其三,能力工具中的其他資源工具使用比例較低,資金保障工具的使用具有片面性?;A教育質量評價政策執行需要人力、技術、財力作為保障和支持,在沒有充足的資源保障與條件供給的情況下,執行主體很難持續、全面有效地推進評價的落實。當前我國基礎教育質量評價還面臨著一系列問題:在評價機構和隊伍建設上,基礎教育質量評價專業性機構較少、評價人才總體較為匱乏[33];在評價技術方法層面,評價方法科學性有待提升,教育質量評價深度融合大數據、云計算等現代技術是實現系統化蛻變的關鍵,需要引入先進的評價技術和科學的評價方法。解決這些問題需要依靠政府和社會提供充足的支持條件,但當前資金保障工具的使用缺乏全面指向性,義務教育質量評價政策文件中未涉及資金保障的說明,這使現實中真正用于質量評價實施的經費難以得到堅實穩定的保障,容易在不同層面上阻滯質量評價的全面落實。

(二)我國基礎教育質量評價政策工具使用的優化建議

新時代推進基礎教育質量教育評價改革深化,應當注重政策工具結構的系統性。在這方面,系統論為我們提供了參考:“結構決定功能,要改變系統,實現不同的功能,必須調整其結構,基本做法是‘穩步推進’,‘穩’住系統平衡,‘推’動結構演進,分層、有序、平衡地進行”[34]。要使政策工具在執行中取得預期成效,需對政策工具不斷進行優化和組合,提升其執行效力。當前,我國教育評價改革步入深水區、攻堅期、克難關,“大破大立、破立并舉”成為基礎教育評價改革的關鍵議題?;貞@一議題,既需要利用政府主導的權威工具為改革落實鋪路架橋,為“破”保駕護航;也需要利用激勵工具、學習工具等其他類型政策工具形成多維施政效力,為“立”開辟戰場。有鑒于此,基礎教育質量評價政策完善需把握好政策工具組合結構的全局性、協同性和平衡性,充實、優化“政策工具箱”。

1.適時適當減少權威工具的使用,合理釋放權威工具的正向效能

為更好地發揮權威工具的本原效能,避免其過溢使用帶來的消極影響,我們既要適當減少權威工具的使用,也要重視權威工具的全面指向性,合理釋放其正向效能,從而實現政策工具優化配置的目標。其一,適時適當地減少權威工具的使用,結構調整不應過于迅猛。政策工具選擇的變量模型認為政府能力(實現政策目標的能力)、社會能力(社會組織或個人的自組織能力和主動參與能力)、社會異質性特性(各方利益訴求的分化程度)是政策工具配置的結構性變量。當政府能力高而社會能力弱時則適合直接型工具,當政府能力高而社會異質性特性強時則適合自愿性工具[35]?;诖?,分析可知,一方面,我國當前政府能力較強,已經建立了國家基礎教育監測評價體系,但社會、個體層面的非政府評價主體的執行能力較差,且參與度較低,適宜使用直接型工具,也即權威工具;另一方面,當前我國教育評價活動具有較強的行政主導性,政策行動者的利益訴求多元分化,適宜使用自愿型工具,即內發自愿執行政策和解決問題的工具。綜上所述,就我國目前基礎教育評價現狀而言,在配置權威工具時,不宜短期內大幅度減少權威工具的使用,否則與評價改革的現況不符,而應根據政府能力、社會能力、社會異質性的現實特性與結構變化,適時適當以梯度式穩步減少,保證一定的政策緩沖時間,避免權威工具的結構調整過于迅猛。其二,重視權威工具的全面指向性,合理釋放權威工具的正向效能。需要注意的是,減少權威工具的使用并不意味著對權威工具的輕視,更不意味著對權威工具正向效能的忽視與遮蔽。在具備相應充足性條件的情況下,權威工具所具有的高效率等正向效能是其他類型政策工具難以達到的。為更好地發揮權威工具的正向效能,一方面,我們需要夯實權威工具使用的條件基礎。即需要強化評價有關部門的溝通互信和協商決策,不斷增強基礎教育質量評價的社會認可度和認同感,凝聚多方共識,并著力培養和提升評價者的評價素養和評價能力,為執行者提供充足的教育培訓、信息指導、技術支持等支持。另一方面,我們需要構建權威工具與其他各類工具的有效銜接機制,提升權威工具的有效性和執行力,削弱權威工具靈活性較弱帶給政策實施的消極影響。以權威工具與激勵工具進行銜接為例,《幼兒園保育教育質量評估指南》提出“將評價結果作為對幼兒園資源配置的重要依據;對違反有關政策規定的幼兒園,要及時督促整改,并視情況依法依規追究責任”。然而,政策文件對獎懲標準的設定較為模糊,且缺乏完善的落實和監督機制,這難以保障激勵成效。在這種情況下,我們可利用權威工具架構激勵措施的獎懲范圍和權限空間,建立激勵措施執行的監督管理體系,評估其是否達到預期的激勵成效,并做出相應的督促或指導,切實形成以評促“建、管、改、強”的效果。

2.提升激勵工具的使用頻次,激發評價體系內部動力

面對如何解決評價體系內部動力和積極性不足的問題,我們可以通過加強激勵工具的使用來予以化解。具體而言,一是要在整個“政策工具箱”中提升激勵工具的使用比例。在施耐德和英格拉姆的政策工具類型中,正向激勵包括財政補貼、授權、稅收減免和表彰等物質或精神獎勵,負向激勵包括收費、制裁或問責等懲罰措施,其中適合我國教育評價現狀的是財政補貼、授權、表彰、制裁、問責。我們要以基礎教育質量評價的具體問題為指向,有針對性地重視對財政補貼、授權、表彰、制裁、問責等子工具的選用。二是要提升激勵工具使用的全面性,促進正向激勵工具和負向激勵工具的協同發力。激勵的雙因素理論指出“滿意的對立面是沒有滿意,沒有滿意并不意味著不滿意;不滿意的對立面是沒有不滿意,沒有不滿意并不意味著滿意”[36]156。這啟示我們,面對負向激勵工具,政策行動者會盡量做到防止違規、防止被問責和被制裁、不落實不力,但防止違規、防止被問責和被制裁、不落實不力并不意味著落實得力,更不意味著能很好地甚至是超越性地完成政策任務。負向激勵可以使政策行動者遵守底線要求,避免政策執行效果過差,正向激勵則可以鼓勵政策行動者做得更好,兩者結合使用有利于全面發揮激勵工具的效力。例如在實踐中,我們可對表現優異的第三方評價機構給予一定的財政補貼;評選出在自我評價當中表現優異的學校,給予合理的經濟獎勵或表彰宣傳;對政策落實不力、違規等行為予以問責或處罰。需要說明的是,正向激勵工具不是對教師教學品質和水平的激勵,也不是對學校教育質量的獎勵,而是對教育質量評價本身的激勵。

3.增強學習工具的使用力度,充分發揮多重工具效能

其一,強化自我評價工具的使用,充分關照評價對象的主體性?;A教育質量評價政策與相關群體的聯結度低,說到底還是缺乏評價對象的深度參與,缺乏對其主體性的觀照,解決這一問題需要增強自我評價工具的使用力度。開展自我評價是當前教育評價改革的重要面向,當前政府已經注意到自我評價工具的運用。如《義務教育質量評價指南》中明確“義務教育質量評價實行縣(市、區)和學校自評;義務教育學校對本校辦學質量進行自評;縣級黨委政府對本縣域義務教育質量和黨委政府履職情況進行自評”。然而,審視政策內容可發現自我評價的詳細標準、制度框架和落實監督等方面尚不完善,這易使自我評價流于形式,實踐中難以得到準確全面的落實。因此,我們需完善自我評價的細則和實施程序,建立相應的配套監督措施,暢通自我評價的信息傳導渠道,保障自我評價結果的準確反饋和有效運用。國際上不乏自我評價的范例。新西蘭教育部頒布《學前教育自我評估指南》,以明確的制度框架指導各級學前教育學校開展自我評價活動,在評價前期,學前教育學校還需向評估機構提交《學前教育機構保證陳述和自我檢查清單》《教育理念和自我評估陳述》,以提前了解自我評價的過程和程序,明確評估重點[37]67。該舉措既給評價對象創設了自我評價的緩沖改進空間,關照了評價對象的主體性,有利于調動參與者的積極性;同時也為外部評價提供了信息資源,使自我評價結果和信息得到充分利用。類似做法值得借鑒。

其二,提升研究探索、協商探討工具的使用,凝聚政策多元共識。教育評價是一項世界性和歷史性的難題,基礎教育質量評價的背后裹挾著理論層面復雜多元的認識論挑戰和實踐操作層面暫付闕如的方法論困難。例如基礎教育質量評價如何廣泛聽取有益意見,凝聚政策共識?基礎教育質量評價改革如何全面落實立德樹人的根本任務?如何實現教育質量的增值評價、過程評價?怎么推進學生的綜合素質評價?如何測量學生的核心素養?如何減少標準化思維、技術化思維對評價的消極影響?如何化解評價與教育相脫節的窘況以及人的主體性被遮蔽的問題?當和這些問題相關的政策用權威工具、象征與勸誡工具簡單地呈現給政策行動者時,政策行動者在缺乏正確認識和有效的方法技術手段的情況下,難以深入開展與教育評價活動本質要求相符合的評價活動。解決上述問題的關鍵一招是增強研究探索、協商探討工具的運用,培養政策行動者的學習能力,增強他們對問題的深入理解以及提出高質量解決方案的能力。具體而言,一是建立政策學習機制。公共政策制定的合理性取決于增進各種公共議事的學習能力[38]32,學習機制建設需要政策制定者根據以往政策結果和信息適當調整政策目的或改進技術[39]。就基礎教育質量評價政策而言,一方面要在政策修訂過程前深入開展調查研究,推行試點工作,總結和積累實踐中涌現的優秀評價經驗和案例,形成“資料庫”;另一方面,要根據前期的總結和積累,在政策文件中羅列需研究探索和學習的事項,適當要求學校呈現評價過程中學習和研究探索的事項、過程與結果,進而增強政策行動者的學習能力和探索意識,促進政策學習實現制度化和長效化。二是研究探索建立第三方評價機制。教育質量評價是一項專業性、科學性的活動,需要專業評價機構的參與?!胺e極探索政府購買服務方式,培育和委托第三方評價機構開展評價”亟需通過研究探索和學習機制來深化拓展第三方評價的理論與實踐研究,建立第三方評價制度框架,提供法律法規的認同和賦權,營造良好的制度環境。國際上不乏優秀案例,芬蘭建立了獨立于政府部門的“芬蘭教育評估中心”,該中心不僅是非官方的教育評價機構,還是評價研發部門,芬蘭政府對教育評價從直接干預轉換為間接、宏觀上的規劃與協調,使評價活動保持了一定的價值中立。此外,芬蘭政府充分利用“芬蘭教育研究所”等市場化層面的第三方機構,使得基礎教育質量評價主體廣泛多元,發揮了重要的溝通、平衡作用。這些第三方評價機構成為芬蘭教育評估的核心抓手,提升了芬蘭基礎教育質量評價的專業化水平和效率[40]26+43。此類經驗值得深入研究和試點探索。三是構建協商探討的評價模式。教育評價不是外在于人的、純客觀的過程,而是參與評價的所有人通過不斷的協商、對話、協調教育價值觀,縮短意見分歧后整合而成的共同看法[41]。我國教育評價政策往往關注政策制定前的廣泛調研和聽取各方意見,卻忽視了政策實施過程中的協商探討。為此,應將協商探討納入到評價政策的全過程中,構建基于評價過程的,包含政策制定者、執行者、評價對象等多元相關者參與的多向探討和互動溝通模式,為他們設置對話和反饋渠道(如座談會、報告會、電話熱線等),進而增進政策聯結度,凝聚多方共識。國際上不乏這樣的做法。新西蘭“教育評估辦公室”每年都會以研討會、座談會等方式,圍繞學前教育評估與教育部、學前教育機構、高等教育機構、社會公眾等進行交流探討,為每一類群體都提供一個共同協調對話的空間,增強了政策信息共享與公眾理解,促進了學前教育評估的專業化交流及結果運用[37]51。類似做法值得借鑒。

4.完善政策工具內部結構,提升政策工具的協同性

調整權威工具、象征與勸誡工具、能力工具的內部結構,優化政策工具的組合,才能更好地提升政策工具的協同效力,促進基礎教育質量評價取得良好的政策效果。為此,可從以下三個方面著手:其一,以因事制宜為導向合理運用許可、禁止工具,完善權威工具內部結構。例如,為了避免評價者失責、僭越權限、多頭重復評價等行為的發生,可恰當運用禁止工具建立權力清單、責任清單、權益清單等,從而限定評價者的權責范圍和被評價者的利益訴求范圍。又如,探索建立第三方評價機制時,可運用許可工具設置第三方評價機構的準入標準與條件、審批程序、市場競爭規則等內容,這既引入了市場機制,有利于促進第三方評價機構市場化競爭與發展,又以較低成本建立了準入門檻,節約了政策成本。其二,加強基本原理工具的使用,增進政策理解度和認同度。一方面可在政策設計中設立清單制度,明確需要宣傳、解讀、闡釋、引導的事項和評價觀念,進一步使政策實施者及社會公眾明白評價的優先重要事項。另一方面,細化基本原理工具的落實機制,在政策制定和實施過程中,充分發揮基本原理的闡釋性功能,運用積極的象征和正面的元素(如學生綜合素質評價具有的優勢和意義)來說明教育質量評價的價值作用,加強評價結果的公開公示和宣傳解讀,引導公眾正確理解評價結果,為政策落實爭取更多的社會支持和輿論氛圍,推動社會大眾形成科學的教育質量觀[42]。其三,推動資金保障工具全方位、精準化運用。具體而言,一是針對基礎教育質量評價特別是義務教育質量評價中的匱乏性條件要素,例如建設評價機構和隊伍、引入先進評價技術方法、研發測評工具等亟需資金支持的方面,提供全方位的精準資金支持。二是進一步明確財政資金的使用程序、范圍,提升資金支持的精準性和穩定性,并建立配套的監督措施,防止資金腐敗問題的滋生。三是要厘清激勵工具的財政物質激勵與能力工具中的資金保障兩者的邊界,促使資金保障工具的精準發力。激勵工具中的財政物質激勵強調短期內對政策行動者的獎勵,針對性強但不穩定;能力建設工具中的資金保障更側重于通過經濟手段培養政策行動者的執行能力,立足于長遠的考慮,具有穩定性和公共利益偏好。在政策制定和實施過程中,應當注重兩者的區別。

四、結語

《總體方案》的頒布開啟了基礎教育質量評價改革的新征程,標志著一場“大仗、硬仗、持久仗”的開始,以基礎教育質量評價為政策抓手驅動教育質量的提升、引導教育質量及其評價觀的改善成為一項重要議題,需要我們以堅定的改革信念、反思性的改革思維、務實的改革精神、穩重的改革步伐,拿出“真招、實招、妙招”,推進基礎教育質量評價政策落實落細,實現基礎教育發展的“再出發”。本研究強調了一種政策工具的視角,一種基于政策工具的關注政策行動者行為規律的視角,為思考基礎教育質量評價政策改進提供了一條進路。雖然對于全口徑的基礎教育質量評價政策系統而言,這種政策工具的分析或許尚不全面和深入,但從這一視角可以窺見基礎教育質量評價政策中一些重要的問題與特征,亦為后續的研究提供了一些思考方向和研究空間。

猜你喜歡
行動者權威工具
與異質性行動者共生演進:基于行動者網絡理論的政策執行研究新路徑
波比的工具
波比的工具
各大權威媒體聚焦流翔高鈣
準備工具:步驟:
跟蹤督察:工作干得實 權威立得起
“巧用”工具
權威發布
敬仰中國大地上的綠色行動者
網絡行動者的新媒體使用特征、影響及媒介民主化
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合