?

自動化行政裁量中算法風險感知的特征與演化研究
——基于網絡輿情的大數據分析

2024-03-05 11:34劉天穎
公共行政評論 2024年1期
關鍵詞:裁量權力公眾

梁 昕 劉天穎

一、引言

近年來,隨著人工智能、大數據等新興技術的快速發展,人類開啟了第四次工業革命,開始邁入智能化時代(姜李丹、薛瀾,2022)。算法已日漸嵌入人類社會的生產和生活中,其影響力的廣度、強度和精度在歷史上都不曾出現(邱澤奇,2022)。在“放管服”改革以及“互聯網+政務服務”的推動下,傳統以人為主導的行政裁量逐漸轉變為基于算法的自動化行政裁量,目前已廣泛應用于行政處罰、行政審批、行政給付和行政評級等領域(劉星,2022)。在此過程中,一方面,政府對算法進行賦權,使算法成為公權力的延伸;另一方面,公民向算法讓渡個人權利,導致了算法權力的擴張,深刻影響著公私“權力-權利”的邊界甚至重塑著國家與社會秩序(肖紅軍,2022)。

算法嵌入行政裁量可以實現技術賦能,顯著提升行政裁量的效率和國家治理效能;然而同時也帶來了前所未有的算法風險,如算法“黑箱”、算法歧視、算法壟斷、算法操縱等(邱澤奇,2022)。特別是在行政裁量情境下,政府和算法的實控者(如地方官員、程序員等)存在委托-代理關系,由于算法“黑箱”問題的存在,信息不對稱較為嚴重,從而引發代理人出于自身利益操縱算法的道德風險問題,并可能給公民政治經濟、人身自由等基本權利帶來較大的風險,甚至危害社會秩序和政治穩定(孟天廣、李珍珍,2022)。

近年來,算法風險治理的相關研究呈急劇上升的趨勢,也取得了一系列研究進展,主要集中在算法權力、算法倫理、算法透明等方面,并提出立法、行政規制、行業公約和社會規范等治理手段(Grimmelikhuijsen,2023;Meijer et al.,2021)。然而,公民作為受算法權力影響的重要主體,關注公民算法風險感知的研究卻較為有限。相關研究也大多采用小范圍調查問卷和心理量表測量結合的方法,對風險感知的影響因素和機制進行探討。尚缺乏基于大數據對公眾算法風險感知的探索,特別是缺乏針對行政裁量情境中,公眾對算法風險感知的異質性特征和動態演化趨勢的研究。網絡空間的公眾輿論是分析公眾認知、態度和情感的重要手段,具有大樣本、動態性和客觀性的優勢,目前已大量應用于公眾認知和情緒的研究中。

2022年,河南部分村鎮銀行儲戶健康碼被賦紅碼(以下簡稱“賦紅碼”事件),人民網針對此事發表《賦“紅”一時爽,后果必須扛》評論,引發了網絡輿論針對算法風險的廣泛探討。本研究基于微博平臺上該事件的發文數據進行挖掘和分析,描述了公眾對于行政裁量中的算法風險感知特征,重點探討了風險感知的時空演化特征、多主體的異質性以及風險溝通中的話語體系差異。通過數據挖掘、自然語言分析、空間分析等多種方法,本文嘗試回答以下兩個研究問題:

第一,公眾對行政裁量中算法風險的感知具有怎樣的時空演化特征?

第二,不同主體在針對算法風險的溝通中呈現何種異質性特征及其動態演化規律?

二、文獻綜述

(一)自動化行政裁量中的算法權力

算法在不同的歷史時期、不同的應用場景中有著不同的含義,在技術、系統、社會等層面也被賦予了不同的理解。從本質上來講,算法是一種求解的邏輯,即“為了解決一個特定問題或者達成一個明確目的所采取的一系列步驟”(Diakopoulos,2015)。在計算機科學領域,算法是一種較為狹義的概念,指利用數學模型與計算機邏輯指令求解最優方案(Gillespie,2014),如決策樹、神經網絡等都是機器學習的經典算法。隨著數字時代的發展,算法概念逐步超越計算機科學的專業術語,拓展到更廣泛的社會領域,泛指人機交互下進行系統決策的一套機制(丁曉東,2020),如自動化判決、輔助決策等。

近年來,隨著移動互聯網、人工智能等新興科技的發展,算法無論是在人群覆蓋的廣度,還是嵌入人類生產生活的深度上,都達到了歷史上前所未有的水平(邱澤奇,2022),逐漸彰顯出“顛覆性的潛力”(凱倫·楊、馬丁·洛奇,2020),深刻影響了人類政治、經濟、社會等各個領域。行政裁量對算法的依賴日益加重,甚至在一定程度上賦權于算法,這樣就產生了“自動化行政裁量”,即以大數據、人工智能等新一代數字技術為支撐,按照一定的算法程序,以半自動化或者全自動化的形式作出行政裁量,又稱為行政裁量數字化(劉星,2022)。行政裁量也由傳統以“人”為中心的規則建構,轉變為依托“算法”進行裁量,形成人機協同的深度融合關系。

目前,自動化行政裁量已廣泛應用于行政處罰、行政審批、行政給付和行政評級等領域。在行政處罰方面,我國在全國范圍內覆蓋了電子交通監控系統,對超速等交通違章實現自動處罰。在行政審批方面,2018年,深圳市推出“無人干預自動審批”行政審批模式,自動核查申請人資料并決定是否通過。在行政給付領域,我國也在貧困資格認定、貧困補助發放等領域進行了大量嘗試。在行政評級方面,2020年,國務院下發《關于依法科學精準做好新冠肺炎疫情防控工作的通知》,鼓勵公眾使用動態健康碼,其基于大數據和算法分析自動判斷健康風險等級,用“紅碼”“黃碼”“綠碼”進行標識。

隨著行政裁量中算法的深度嵌入,大量判斷裁決已交由算法執行,而看似理性中立的計算結果隱藏著規則的施加,算法權力也相伴而生。算法權力是以算法為工具實施的影響力或控制力(陳鵬,2019;趙一丁、陳亮,2021)?,F有文獻對算法權力的形成機制進行了不同角度的探討(張愛軍、王首航,2020)。一種觀點認為,“算法即法律”(Lessig,1999),代碼建構了數字空間的規則,與人類社會的制度具有同樣的規制效應(Micklitz et al.,2021)。而另一種觀點則認為,原生的算法權力僅存在于數字空間中,而通過人類的“賦權”,算法才獲得了影響人類社會的權力。

(二)算法風險

隨著算法權力在行政裁量中的日益擴張,其帶來顯著收益的同時也伴隨著巨大的風險?,F有文獻對算法風險已有不同視角的探討,主要集中在以下三個維度。一是從國家和社會的宏觀角度出發,學者提出了“算法利維坦”的概念(張愛軍,2021)。在人工智能時代,人們日漸依賴算法,如果無法約束算法權力的膨脹,很可能演化成“算法利維坦”,成為絕對權威,使公民、國家、社會的運行制度發生異化。二是從政府與公權力的視角出發,政府賦予算法的權力也可能被算法的代理人用于謀取私利,甚至進行社會控制和政治權力再生產(孟天廣、李珍珍,2022)。由于算法生產的專業性,政府無法直接生產算法,而是通過代理人(包括算法開發者、設計者、部署者和應用者等)進行算法的設計、部署和維護(肖紅軍,2022)。代理人可能有意地操縱算法牟利(張婧飛、姚如許,2022)。然而,由于信息不對稱以及算法“黑箱”問題的存在,政府和公眾不但很難對代理人的行為進行過程監督,甚至對行為結果的監督也非常困難。這個過程就產生了委托-代理關系帶來的道德風險問題。三是從公民個體角度出發,算法權力與公民權利是此消彼長的關系,算法權力的擴張意味著公民權利在一定程度上被侵蝕,給公民的權利保障也帶來了一定的風險。

不同于傳統風險,算法風險具有較強的獨特性,具體表現為以下四個方面。首先是廣泛性,中國互聯網接入人口如果以家庭為單位計算,幾乎全部人口均受到算法的影響。算法風險觸及的廣度是傳統風險不曾出現的(邱澤奇,2022)。其次是深入性,由于算法權力是公權力的延伸,其帶來的影響也可以深入至公民自由權、平等權等人類最基本的權利。以美國“盧米斯”案為例,法官參考COMPAS系統計算的結果判處盧米斯6年有期徒刑,引發了算法是否會干預司法公正的激烈爭論。再次是隱蔽性,由于算法的專業性和信息的嚴重不對稱性,算法的代理人可以非常隱蔽地修改代碼,使算法附加部分代理人的利益。面對算法“黑箱”,政府和公眾都很難實現透視,甚至當算法被篡改時毫無察覺。最后是綜合性,在自動化行政裁量過程中,人和算法是深度綁定交互的共同體,因此當問題和風險產生的時候,很難準確地進行歸因,很難判斷是人的問題、算法的技術問題還是兩者交互產生的問題。由于原因的綜合性和復雜性,算法風險治理往往難以確定責任主體。

有關算法風險影響的研究主要圍繞社會治理、公共部門組織和個人層面三個維度展開。一是從社會治理角度來說,算法風險的產生對社會公平正義產生負面影響。以2016年美國大選為例,社交媒體上傳播的虛假信息成為私人達到政治目的的工具(Ng &Taeihagh,2021),在危害使用者隱私的同時,影響到了社會公平的核心價值。此外,當算法被用于如社會信用評分、犯罪風險評級等對公眾進行評價的系統時,出現的系統信息泄漏、信息錯誤等風險會影響到社會的穩定(Zhang,2020)。二是從公共部門的視角出發,政府采用算法行政裁量產生的偏差會對公共部門的信任造成不可估量的危害。例如,當政府用于檢測福利欺詐的人工智能系統失靈,福利欺詐事件層出不窮時,公眾對政府的信心會受到嚴重打擊(Bodo &Janssen,2022)。三是從個人層面展開討論,算法出現在人員招聘、警務預測等自動化裁量系統中涉及性別、種族等特征的歧視風險,顯著影響到個人的權益。例如,加拿大的犯罪評估方法因為對黑人和土著囚犯的系統性偏見而飽受批評(Zajko,2021)。

(三)算法風險感知及其影響

隨著算法深度嵌入人類社會的生產生活,算法“黑箱”、算法歧視、算法壟斷、算法剝削等(張恩典,2020)各種算法帶來的負面影響屢見報端,使公眾的算法風險感知日漸強烈。傳統風險研究一般認為風險是客觀意義上不利后果與發生概率的乘積,而大量研究也表明,人對風險的認知并不是完全客觀的,也是基于人們的認知、經驗等主觀的建構(Fischhoff et al.,1978)。Slovic(1987)認為,風險感知是人們依靠自身的直覺與經驗對事件產生的負面影響進行判斷與評估,并產生對風險的認知與態度。算法風險感知可定義為公眾因算法技術的應用而感知到的不確定性以及后果嚴重性(劉春年等,2023),包括算法焦慮感知(查道林等,2022)、算法歧視感知(Alon-Barkat &Busuioc 2023)和算法控制感知(裴嘉良等,2021)等多重研究維度。

現有研究已經對算法、大數據、人工智能等新興信息技術的風險感知做出了探索,主要集中于兩個方面。一是風險感知的測量,包括公式化測量、社會文化測量以及心理測量三種方式。其中,心理測量應用最為廣泛,主要通過問卷調查,利用心理學的測量指標來評估公眾對風險的感知(Slovic,1987)。二是風險感知的影響因素。傳統的心理測量范式強調風險感知受到個體屬性和心理因素的影響,包括性別、年齡、受教育程度、個人經歷、心理距離等。在此基礎上,學者們逐漸認識到風險感知不僅受到個人因素的影響,還受到社會環境的影響。由此發展出風險的文化理論,將社會文化因素,如文化背景、價值觀、社會規范、信任等變量納入風險感知的研究之中(Dake,1991)。

公眾風險感知可以在很大程度上影響風險治理的政治、經濟和社會行動,例如公眾對人工智能的風險感知可能影響到技術接納和公眾參與。此外,由于在行政裁量的情境下,算法是公權力的延伸,與政府深度綁定,公眾對算法的風險感知也會發生外溢,進而影響政府信任,從而改變政府-公民的二元關系,是算法風險治理中的重要因素(賈開、薛瀾,2021)。

綜上所述,現有文獻已對行政裁量中的算法權力和算法風險進行了豐富的探討,但仍有以下不足。一是已有文獻對算法風險的探討大多為自上而下的視角,從公民視角出發分析算法風險感知則相對較少;二是公眾算法風險感知研究多采用調查問卷,缺乏基于大樣本數據的探討;三是現有針對算法風險感知的研究大多為靜態截面研究,缺乏對風險感知動態演化以及多主體異質性特征的分析。本文基于大數據的視角,結合機器學習、自然語言處理等算法,可以解釋大樣本下公眾風險感知特征與演化規律,在理論上可以拓展風險感知的研究范式,在實踐上有助于為政府的算法風險治理提供更加精準的模型。

三、研究方法

(一)案例背景

2022年6月13日,有網友在社交平臺反饋稱,多名前往鄭州溝通村鎮銀行的“取款難”儲戶被賦“紅碼”(魏少璞,2022),此事迅速引發輿論關注。2022年6月17日,鄭州市紀委監委啟動調查問責程序。6月22日,鄭州市發布關于部分村鎮銀行儲戶被賦紅碼問題調查問責情況的通報。據統計,共有1317名村鎮銀行儲戶被賦紅碼,其中446人系入鄭掃場所碼被賦紅碼,871人系未在鄭但通過掃他人發送的鄭州場所碼被賦紅碼(彭靜、王欲然,2022)。2022年7月8日,人民網評論文章《又現紅碼,河南怎么了?》再次沖上微博熱搜,一些人在山東、遼寧等地的河南村鎮銀行儲戶再次向媒體反映稱,自己的健康碼再次被遠程賦“紅碼”。當日,鄭州市大數據管理局回應稱,由于系統升級過程中出現技術問題,晚8時已全部恢復正常。2022年7月11日,河南省地方金融監管局公告,對涉事客戶本金開展先行墊付工作。至此,該事件進入尾聲。

本文選取“賦紅碼”事件作為本文研究案例的原因有如下兩點。一方面,該事件中自動化行政裁量直接影響了公民的權利,引發公眾強烈的風險感知,產生了嚴重的社會影響,是一起典型的行政裁量中算法風險的案例;另一方面,“賦紅碼”事件具有廣泛性和持續性的網絡討論高潮,可以基于網絡大數據聚焦該案例進行大樣本、動態性的分析。

(二)數據收集

本研究第一輪數據收集以“健康碼”為關鍵詞爬取了2021年1月1日至2022年12月31日期間發布的微博,共計33890條,并在此基礎上對涉及“賦紅碼”事件的微博進行篩選,因此在第二輪數據收集中,在原始數據的基礎上篩選出與案例高度相關的微博,并同時爬取了每條微博下對應的評論內容。因此,數據包括了與該事件高度相關的微博主帖以及所有相關評論。最終從新浪微博平臺收集有效微博6108條及評論內容共3220條,抓取12項數據特征值,包括:(1)微博內容;(2)微博識別信息:MID、ID等;(3)用戶識別信息:UID、User Name等;(4)用戶特征信息:Province、Description等。

(三)數據挖掘

1.信任度與情感分析

本研究依據微博推薦系統的指標,結合安璐和徐曼婷(2022)的信任度計算公式,將微博內容情感得分和微博評論情感得分同時納入考慮,綜合計算每條微博的綜合情感值。每條微博W獲得的綜合情感得分計算方式如式(1)所示,其中θ1、θ2通過熵值法確定取值。

Trust=θ1trust_m+θ2trust_c

(1)

其中,Trust是單一微博整體信任度,trust_m是單一微博內容信任度,trust_c是該微博對應的評論內容信任度。

trust_m=senti_m×ln(m_like+m_trans)

(2)

trust_c=∑senti_mi×ln(c_likei+e)

(3)

式(2)中,senti_m是該微博內容的情感得分,m_like是該微博內容的點贊數,m_trans是該微博內容的轉發數;式(3)中senti_mi是該微博第i條評論的情感得分,c_likei是該微博第i條評論的點贊數。

需要說明的是,senti_m代表微博用戶對這一話題的情感表達,由于用戶的點贊和轉發代表著更多人對這一情感表達的認可,因此將點贊和轉發兩個因素納入微博內容情感值計算范圍;在社交網絡中,計算綜合情感得分需要同時考慮用戶的微博內容收到來自其他用戶的正面和負面反應的數量(Asim et al.,2019),故而單一微博的評論內容情感值是每條微博的評論區所有正向情感和負向情感之和。

2.空間分析

有研究指出,由于網絡輿論的形成會受到與地理位置相關的文化、認知的影響(羅植等,2012),因此,網絡輿論往往呈現出明顯的區域性特征。本研究采用空間自相關分析(spatial autocorrelation analysis)中的全局空間自相關分析方法,對微博的空間特征進行探究。全局空間自相關分析是對整個區域的空間特征進行描述,通常采用莫蘭指數來測度區域整體上某一屬性的空間聚集程度(諶志群、鞠婷,2020)。計算模型如下:

(4)

3.詞匯分析

第一,詞匯密度。在對文本內容進行分析的時候可以發現,具有一定詞匯存儲量的作者會偏愛使用一些特定詞匯,作者的詞匯量能夠反映在詞匯的出現頻率中,因此,詞匯的分布頻率可以應用到不同類別作者的比較分析中。詞匯密度(lexical density)作為一個語言特征,最早由Ure (1971)提出,詞匯密度是文中的實詞數量與單詞總量的比值。Halliday(1985)在Ure的基礎上提出了新的計算方法,認為詞匯密度是詞項數量與篇章小句總量的比值。

第二,詞匯變化性。詞匯變化性,也稱詞匯多樣性(lexical diversity),是反映篇章作者詞匯豐富性的一個語言特征,通常用來測量篇章詞匯的適用范圍或種類,詞匯變化性越高說明用詞范圍越廣;反之,詞匯變化性越低,說明用詞范圍越窄,篇章詞匯重復率高。本研究采用Dugast提出的更為復雜的Uber index測量方法(張艷、陳紀梁,2012),相比傳統的TTR計算方式更加精確,且不會受到文本長度的影響(Vermeer,2000)。具體的計算公式如下:

(5)

4.內容主題分析

文本分析一直以來都是社會科學領域的重要研究材料,但對于海量微博內容已經無法采取手工編碼的方法,因此本研究采取LDA(Latent Dirichlet Allocation)模型進行內容主題分析(Tolbert et al.,2010)。

四、研究發現及討論

(一)算法權力與算法風險的生成邏輯

基于海量數據和人工智能算法的自動化行政裁量具有傳統方法無可比擬的優勢。從政府視角出發,算法為政府進行技術賦能,顯著地拓展了政府的行政能力。從公民視角出發,基于自動化行政裁量的效率也得到了顯著的提升。例如,在算法輔助下,一半以上的行政許可事項平均時限壓縮超過40%(中國互聯網絡信息中心,2022)。

由于自動化行政裁量的巨大優勢,應用不斷推廣和深入,加強了政府對算法的行政賦權和個人對算法的權利讓渡,在兩者共同作用下產生了算法權力,如圖1中階段一所示。一方面,算法權力來源于公權力的延伸,政府的行政賦權范圍決定了算法權力的大小。以健康碼為例,如果健康風險判斷的算法僅在數字空間完成運算和結果的呈現,并不會對公民個體及社會產生影響。然而,通過地方政府的行政賦權(例如針對不同級別健康碼制定管控措施,使其成為個人獲得出行、復工等資格的必要證明),健康碼的算法便有了直接影響居民行動的權力。另一方面,算法權力也來源于公民權利的讓渡。例如,在健康碼的使用中,公民讓渡了隱私權等,使算法權力進一步擴張,重塑了公私“權力-權利”的邊界(如圖1中實線所示路徑)。

圖1 行政裁量中算法權力與算法風險分析框架

在自動化行政裁量情境下,算法權力由于其人機深度融合的特點,形成了一種新型的行政權力,具有獨特的廣泛性、精準性與責任模糊性等特點。傳統的行政權力有明確的權力邊界,但由于算法“黑箱”問題的存在,政府和算法的代理人之間存在著嚴重的信息不對稱,代理人可能通過干預算法,逾越權力邊界牟利,導致算法權力的異化,進而導致算法風險。傳統行政權力有明確的賦權機制,權責對應,責任主體清晰,但算法問題的歸因十分困難(張婧飛、姚如許,2022)。這使得算法權力的濫用更加隱蔽,也給算法權力的治理帶來更大的挑戰。在“賦紅碼”案例中,部分代理人干預算法,給不符合條件的人群賦紅碼,算法權力的異化造成嚴重不良社會影響,導致了公眾對算法風險的廣泛輿情(如圖1虛線所示路徑)?;诖?,以下通過大數據分析對算法權力及其帶來的新型的風險進行深入的剖析,主要包括空間特征分析、時間特征分析以及多主體異質性分析三部分。

(二)“賦紅碼”事件中公眾輿情的空間特征分析

1.數量與信任值空間特征分析

空間特征分析結果顯示,對該事件討論最集中的區域為河南省、北京市、上海市等。河南省作為事件的發生地,當地的網友對這一事件高度關注。北京作為國家的政治中心,人民網等政府和媒體網絡賬號集中于北京,因此北京地區的微博討論也位居前列。此外,江浙滬沿海地區網友對該事件的關注度也很高,說明東部發達地區的公眾對算法權力和算法風險的關注度較高,也印證了經濟高水平城市在網絡空間上保持較高的優勢度的研究結論(丁志偉等,2022)。

綜合情感值的分析結果顯示,“賦紅碼”事件導致全國幾乎所有省份的民眾都產生了對政府算法權力和算法風險的負面感知,綜合情感值較低,證明當政府算法系統出錯時會對民眾的信任和情感產生較大傷害(Bodo &Janssen,2022)。然而,情感值最低的地區并不是“賦紅碼”事件的發生地河南,而是浙江省和遼寧省,這和涉事人員的地區分布相一致。從《人民日報》公布的數據來看,涉事的儲戶中有446人系入鄭掃場所碼被賦紅碼,871人系未在鄭但通過掃他人發送的鄭州場所碼被賦紅碼。因此,對“賦紅碼”事件產生較為嚴重消極情緒的并非僅是事件的發生地河南的民眾,而且包括諸如浙江省等外地儲戶大量分布的地區。

2.莫蘭指數分析

根據微博數量分布計算莫蘭指數并繪制散點圖,如圖2所示。微博數量分布的莫蘭指數為0.031,結合散點圖分布和莫蘭指數值,表明微博的數量分布在一定程度上具有正向的空間自相關性,存在空間聚集的現象。典型如上海市、山東省和江蘇省整體數量分布呈現出明顯的高高聚集的趨勢,說明東部沿海地區等經濟較為發達的地區網絡使用的聚集性較高(丁志偉等,2022),這也是這些地區對“賦紅碼”事件的關注度更高的原因。新疆維吾爾自治區、西藏自治區、貴州省等地區由于經濟發展、信息化水平等自身條件相對較弱,互聯網綜合設施發展較慢,整體對網絡輿論的關注度較低。北京市和河南省雖然微博數量較大,但聚集效果不夠顯著,是因為其鄰近的山東省、河北省和江蘇省的數量位于100—500條區間,與北京市和河南省1000條左右的數量差距較大,無法形成高高聚集的態勢。

圖2 微博數量的莫蘭散點圖

(三)“賦紅碼”事件中公眾輿情時序演化特征分析

1.演化階段和傳播趨勢

依據“賦紅碼”事件過程中的政府和官方媒體信息發布,以及整個事件不同時期的公眾參與度和傳播效率差異,本研究以2022年6月13日為事件的開始節點,將事件發展劃分為爆發期、第一段高峰期、停滯期、第二段高峰期以及衰亡期五個階段(見圖3),分別觀察在政府或者官方媒體發布信息后,微博相關主題內容的傳播趨勢和傳播效力。

圖3 微博數量和信任度的時間序列折線圖

由于“賦紅碼”事件的爆發期較短,并很快進入了高峰期,因此本研究將兩個階段合并討論。爆發期與第一段高峰期,時間為2022年6月13日至26日,起因是6月13日有網友在微博上對“賦紅碼”事件發文,賦紅碼問題第一次進入微博網友視野,隨即引發大量輿論關注,單日相關微博數量最高達到900條??梢钥闯?,突發事件對形成網絡輿論熱點話題具有顯著的驅動作用(劉自強等,2023),相對應的是這個階段網友對該事件的情感值也達到了最低值,整個輿論對健康碼的自動裁量結果呈現較為負面的反饋。6月22日,鄭州市發布關于部分村鎮銀行儲戶被賦紅碼問題調查問責情況的通報,這樣的官方機構回應更容易刺激網絡輿情話題熱度的快速提升(劉自強等,2023),再次引發了6月23日一波較小的討論波峰。

第二階段為停滯期,時間是2022年6月27日至7月7日,該階段賦紅碼相關微博數量增長緩慢,綜合情感值雖還處于負向的狀態,但相對平穩,民眾并沒有出現極端負面情緒。

第三階段為二次爆發期,時間為2022年7月8日到7月12日。7月8日人民網在微博發布了一篇名為《又現賦紅碼,河南怎么啦?》的帖子,該帖子的轉發量、評論量和點贊量分別達到了5.2萬、1.2萬和12.2萬,官方媒體的回應導致有關“賦紅碼”事件的熱度急劇上升(馬續補等,2020)。雖然微博數量接近于第一階段,但不同的是,此階段公眾的情感值并沒有出現驟然下降。一方面,由于2022年7月8日鄭州市大數據管理局進行了官方回應,稱由于系統升級過程中出現的技術問題,導致健康碼異常,并稱在晚上8時已經恢復正常;另一方面,2022年7月11日,河南省地方金融監管局發布公告表示,會對無法兌付的客戶本金開展先行墊付工作。無論是政府的回應速度還是解決問題的有效性都較第一次爆發期顯著提升,因此公眾的情感波動較小,沒有產生劇烈的下降。

第四階段為衰亡期,時間為2022年7月13日之后。在經過短暫的二次爆發期后,相關微博數量進入平穩狀態,每日數量基本在20條左右徘徊,這一事件的討論熱度逐漸下降。

2.不同階段的主題演化分析

本研究利用LDA算法對“賦紅碼”事件的不同階段進行了主題分析,結果如圖4所示。

圖4 各階段微博內容聚類分析結果

爆發期與第一階段高峰期的輿情可聚類為7個主題。其中,衛健委的調查行為和調查結果受到了最多網友的關注,是對輿情事件較為宏觀的討論(曹樹金、岳文玉,2020)。此外,占比第二高的主題是民眾向政府進行投訴的討論,反映出民眾權利意識的日益增強(張博,2016),通過投訴的方式達到與政府主動交流的目的。

第二階段雖然輿情暫時處于停滯期,但民眾主題的焦點會關注到一些相關的衍生話題,產生漣漪效應(丁樂蓉、李陽,2023)。從側面體現公眾在“賦紅碼”事件后對地方政府基于算法的自動裁量行為產生了消極情感態度,對算法風險的恐懼等負面情緒遠超過對算法帶來便利的正面感知,對政府的自動化裁量行為的評價較為負面。

在第三階段,輿論主要關注的是紅碼再現和系統切換導致紅碼兩個主題,一個是對紅碼再次出現這一現象的討論,關注度最高;一個是對政府回應結果的討論。從兩個討論主題可以看出,在第三階段,地方政府針對“賦紅碼”的回應是非常迅速的,民眾對問題本身的討論和對政府解決方法的討論幾乎在同一時間發生,說明政府風險溝通的及時性和有效性直接影響了輿論傳播的特征。既有研究也指出,政府在面對突發公共事件處理網絡輿論時,及時透明的信息有助于負面輿情的減弱(胡象明、劉騰,2023)。

在第四階段,輿論對“賦紅碼”事件本身的討論占比下降,關注焦點轉移至其他地區的健康碼賦碼使用的討論,說明在輿論衰退期,容易產生與原始事件相關度不大的衍生話題(陳婷等,2016)。但從內容主題來看,公眾認識到算法權力的濫用會侵害公民個人的權利,使公民對自動化裁量持更加謹慎的態度,更關注不同地區的健康碼判定的規范性。

(四)風險溝通中多主體異質性分析

1.不同主體的演化特征分析

本研究選取了新浪微博中的五大類用戶作為研究對象,即普通公眾、意見領袖、行業專家、新聞媒體和政府機構。普通公眾是指非認證的個人微博賬號,包括所有在微博上進行發言的個人網友;意見領袖是指粉絲數量超過1萬人、具有一定關注度和活躍度的個人賬號(欒軼玫、張雅琦,2020);行業專家指微博認證的律師、法官等在某一行業較為權威的個人賬號;新聞媒體是指官方注冊的具有新聞媒體資質的賬號,如人民網、新華網等;政府機構是指政府的官方賬號,如鄭州發布等。普通公眾、意見領袖和行業專家皆為自然人賬號,新聞媒體和政府為機構賬號。

從發文數量上來看(見圖5),所有用戶都對“賦紅碼”事件投入了相當的關注度,不同主體發文量隨著時間總體變化趨勢是一致的。值得注意的是,普通公眾的微博數量最多,單日發博量將近900條,是網絡討論的主體;意見領袖對這一事件的關注度也較高,意見領袖與公眾的關注通常是呈現高度相關性(汪翩翩等,2020)。此外,政府機構作為政府官方發言渠道,會考慮到政府官方發言會對社會公眾產生一定的引導作用(師碩、王國華,2022)。

從情感值變化來看(見圖5),“賦紅碼”事件后各主體均產生了較為負面的感知,特別在第一階段,負面情感的絕對值為前期的5000倍左右。具體來看,事件中負面情感最嚴重的是意見領袖,其負面情感值約為官方媒體的2000倍,是負面情感的主要來源,在輿情演變和治理過程中發揮著重要的輿論引導和推動作用(劉迪、張會來,2020)。普通公眾在事件中的輿論則較為溫和,相比意見領袖,其負面情感的波動并不劇烈。行業專家和新聞媒體則從更專業的角度對“賦紅碼”事件涉及的算法風險進行了探究,呈現出正向的情感值,顯示了主流專家和媒體對政府健康碼的自動化裁量持積極的態度,傳達出此次“賦紅碼”事件歸因于算法代理人的看法,可以通過解決算法應用中的委托-代理問題來進行治理,有助于化解普通公眾的部分負面情緒(趙晨陽等,2021)。

圖5 不同主體的微博數量和綜合情感值的時序演化

2.不同主體的話語特征分析

第一,不同主體的詞匯密度比較。為有效比較各主體的組間差異,本研究對各主體的詞匯總數、頻次、句子總數等方面進行數據測量,進而獲得不同主體的微博文本的詞匯密度。本研究同時采用Ure和Halliday的測量方法,分別計算各行業的詞匯密度,統計數據如表1所示。

表1 不同主體微博內容詞匯密度及多樣性

第二,不同主體的詞匯多樣性比較。從分析結果可以看出,普通公眾的詞匯變化性最大,說明文本內容的異質性最強;政府機構的微博文本內容詞匯變化性最小,說明內容一致性最強,這與不同主體的發言特征相一致。普通公眾對“賦紅碼”事件有著高度異質性的表達,不同的觀點、態度和視角都在網絡空間碰撞,是社交媒體平臺的信息擴散者和討論推動者。政府機構賬號作為政府部門在微博上的直接發言渠道,其微博內容代表政府對“賦紅碼”事件的官方態度,不附加任何的評論和解釋。行業專家、意見領袖和新聞媒體三個主體的異質性介于政府和公眾之間,其中行業專家發表意見的異質性位居第二,體現了專家群體對該事件也呈現出較為異質性的觀點,對行政裁量中的算法權力與算法風險的認識尚不統一。

3.不同主體關注焦點的聚類分析

本研究使用k-means算法對不同主體的微博內容進行聚類分析,獲得主題詞和含有主題詞的觀點,歸納不同主體的輿論焦點(見表2)。各主體共同關注的焦點為“賦紅碼”事件的處理辦法;同時,政府機構和意見領袖共同關注到了算法權力濫用的問題,希望地方政府對公眾有關算法的決策和運用給出具體解釋,政府機構獨特的政治背景和意見領袖自我的觀點輸出都能有效引導輿情發展方向(趙晨陽等,2021);此外,政府機構和新聞媒體聚焦于算法嵌入行政裁量的風險,如健康碼數據庫信息泄漏的問題,意識到“賦紅碼”事件并非孤立的,本質是算法帶來的風險問題;政府機構、新聞媒體與意見領袖的焦點一致性說明了以政府機構和傳統媒體為代表的官方話語,與以普通大眾和精英個體為代表的民間話語逐漸走出了“對抗”角色(何舟、陳先紅,2010),兩種話語空間開始逐漸產生交疊,這一結果也印證了汪翩翩等(2020)的輿情研究。

表2 不同主體輿論焦點的聚類分析

五、研究結論與政策建議

隨著自動化行政裁量的應用越來越廣泛和多元,在政府的行政授權與公民的權利讓渡雙重作用下,導致算法權力擴張、異變、尋租等風險。本文針對具有典型性的“賦紅碼”事件,利用大數據、自然語言處理、空間分析相結合的方法對網絡輿論進行分析,探究公眾在該事件背景下算法風險感知的特征及動態演化的過程。本文主要發現如下。

首先,公眾對算法風險高度敏感。兩次“賦紅碼”事件于網絡曝光后,輿論都在24小時內迅速發酵,關注量劇增。對于可能侵害到自身基本權利的算法風險,公眾展現出高度的敏感性。但兩次“賦紅碼”事件的輿論情感值差異較大,第一次出現了情緒的低谷,而第二次的負面情緒波動相對平穩。細分至不同主體,意見領袖的情感值最為負面,是引領負面情緒的關鍵主體。反之,專家和媒體在過程中則呈現出正面的情感。從空間角度看,網絡輿論具有高度的空間聚集性,除了事件發源地河南,北京和東部沿海等經濟發達地區對該事件的關注度也更聚集。從時間角度看,事件發展可劃分為五個階段,公眾關注的主題也發生了演化。不同主體關注的主題有顯著的差異,普通公眾更加關注事件的問責,政府和媒體則聚焦于權力濫用,意見領袖則關注到地方政府對算法的授權。

其次,對比其他輿論事件產生的風險感知。本研究發現,算法風險與其他輿論事件產生風險感知具有顯著差異。一是覆蓋范圍更廣泛。傳統輿論事件具有顯著的區域聚集效應,一般事件當地輿論較為集中,隨著距離增加呈衰減趨勢(劉耀輝等,2022)。本研究的結果發現,算法風險事件的覆蓋范圍遠超傳統風險事件,并且不隨空間距離衰減。二是影響更深入。算法權力是行政權力的延伸,因此算法風險帶來的權利侵害相比于其他風險具有更大威脅,引發的算法風險感知也更加強烈。三是較強的隱蔽性。面對算法“黑箱”,民眾很難對算法背后機制進行透視。以“賦紅碼”事件為例,許多上訪公民開始在健康碼變紅時并未發現問題,以為是因為軌跡重合存在健康風險。后來輿論曝光才逐漸發現健康碼存在問題,此時該問題已經隱蔽地存在了一段時間。四是風險歸因模糊。傳統行政權力有明確的賦權機制,權責對應,責任主體清晰。而算法權力則因為人機深度綁定,無法準確歸因(Zhai et al.,2023)。以“賦紅碼”事件為例,關于歸因引發大量的輿論爭論。

從“賦紅碼”事件全國微博數據的分析挖掘,我們可以看出,政府在算法風險治理方面依然面臨較大挑戰。首先,行政裁量中算法權力的邊界尚不清晰。算法權力來自于政府的行政賦權與公民的權利讓渡,在這一過程中公私“權力-權利”的邊界被重塑。舊的邊界已被打破,而新的邊界無論是明確的法律法規還是隱性的社會規范都尚未建立,容易出現個人主體性的喪失和正當的法律程序被架空的風險(趙宏,2023)。其次,自動化行政裁量中的委托-代理關系很可能導致道德風險和權力尋租(廖曉明、徐文錦,2021)。而算法“黑箱”問題的存在,加劇了算法代理者的道德風險和權力尋租問題?!百x紅碼”事件就是典型的案例,本應用于防疫的健康碼被地方政府中少數代理人濫用,產生嚴重的負面后果。如果算法的委托-代理問題得不到很好的治理,代理人的道德風險問題仍會不斷重演。最后,關于算法風險的溝通仍需進一步優化。從兩次“賦紅碼”的輿情演化來看,雖然關注度和討論量相接近,但是第一次“賦紅碼”的負面情感波動較為劇烈,而第二次則顯著平緩。因為政府在第二次“賦紅碼”問題出現當天就與公眾進行了風險溝通,公示了問題原因及處理結果。由此可見,政府作為信息的發布者,及時向公眾傳播真實且有效的信息是正確的風險溝通方式,可以提升公眾信任,避免消極態度的產生(丁博巖等,2023)。

本文以“賦紅碼”事件為典型案例,利用微博大數據探索公眾對自動化行政裁量中算法的風險感知,對算法風險的研究方法和系統認知具有理論貢獻。同時,研究結論對行政裁量中的算法風險治理也提出了具體的政策建議,為政府在算法風險治理上提供了一定的數據支持,具有較強的實踐意義。本文的主要局限在于,現有大數據文本分析仍停留在算法風險感知的時間、空間、異質性等特征描述上,而對算法風險的產生機制與治理邏輯無法進行深入的分析。這是本文的不足之處,也是下一步主要的研究工作。

猜你喜歡
裁量權力公眾
公眾號3月熱榜
論行政自由裁量的“解釋性控權”
公眾號9月熱榜
公眾號8月熱榜
Mesenchymal stromal cells as potential immunomodulatory players in severe acute respiratory distress syndrome induced by SARS-CoV-2 infection
公眾號5月熱榜
不如叫《權力的兒戲》
應如何確定行政處罰裁量基準
權力的網絡
與權力走得太近,終走向不歸路
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合