王 震 路增祥
(遼寧科技大學礦業工程學院,遼寧 鞍山 114051)
“生產冒進行為”是指礦山不具備安全生產條件時,生產提前、超能力生產或未按正常流程生產的不安全行為。 這種不安全行為主要產生于礦山企業管理者和生產工人兩大群體中,是在逐利思想驅動下發生的違背礦山正常生產規律與程序的行為。 經營管理層為使企業獲得更大的效益,工人為獲取更多的超產獎勵,難以避免地會產生各種“生產冒進行為”,形成礦山生產過程中的重大潛在風險,進而對礦山生產安全帶來較大威脅。 礦山安全管理者和作業工人心理素質[1]、安全認知水平和自我效能感[2]較低,是導致礦山企業因“生產冒進行為”發生安全事故的重要原因。 因此,分析礦山企業“生產冒進行為”的發生及其演化,研究預防“生產冒進行為”發生的對策,是提升礦山安全生產管理質量的一項重要內容。
不少學者[3-4]從不同角度、采用不同方法,對工人不安全行為產生機理和預防措施等進行了大量研究,并取得了豐碩成果。 如張江石等[5]采用動態演化博弈分析方法構建成本收益矩陣,針對工人脫崗行為和企業監管行為進行了研究,得出了工人脫崗行為產生的原因。 韓帥等[6]采用心理學方法,將前景理論和心理賬戶理論引入到安全行為和監管行為的演化博弈決策中,通過構建前景收益感知矩陣并分析其收斂性,來判斷兩種行為是否處于理想狀態,為工人不安全行為的監管提出了相應策略。 李停軍[7]構建了工人和工人、工人和監管者的博弈模型,在對模型定性、定量分析和求解的基礎上,研究了工人不安全行為的演化規律,為不安全行為防控提供了組合干預原則與方法。 蓋麗麗[8]在建立和分析安全監管人員與工人間動態博弈模型的基礎上,提出了具有累積特征的、以階段性獎懲和安全積分管理為目標的激勵約束機制,以有效控制工人不安全行為發生。 楊雪等[9]通過構建“礦工情緒監管—礦工不安全行為”的動態博弈模型,研究了工人情緒引發的不安全行為所產生的潛在風險與成本,提出了通過人為干預提高工人情緒的監管效率和減少不安全行為的措施。 生產班組是礦山企業生產實施的最小組織單元,班組長同時具有本班組兼職安全員的職責,對本班組的生產組織、實施與安全監管起著重要作用。 班組長的違章指揮是導致班組成員違章作業不可忽視的原因。 為實現對違章行為的有效約束[10],李琰等[11]基于價值感知理論,構建了作業班組工人不安全行為與違章指揮、違章作業的博弈模型,得出了違章指揮和違章作業產生的主要原因。 上述基于博弈理論的不安全行為研究,為分析工人不安全行為產生原因,建立有效的約束機制與激勵措施[12-13]提供了有效方法。
礦山企業生產過程中,在礦產品市場價格波動和企業全員逐利思想的雙重影響下,“生產冒進行為”能夠對企業的安全生產狀態帶來重大影響。 分析與研究礦山“生產冒進行為”產生的原因,對由此引發的礦山安全事故進行有效防控是十分必要的。 因此,本研究基于演化博弈理論,分析礦山“生產冒進行為”在工人群體產生的機理,為進一步研究礦山安全生產風險防控策略提供參考。
“生產冒進行為”產生于礦山經營管理層與生產工人兩大群體。 對于工人而言,主要與工人的心理因素、認知水平和自我效能有關。 當這3 個因素處于較低水平時,可認為工人處于不穩定狀態,也即存在不安全行為產生的風險。 以T(X)表示工人的不穩定狀態函數,則有:
式中,O為工人心理因素水平;S為工人認知水平;Z為自我效能水平。
當工人長期處于不穩定狀態或處于不穩定狀態的工人占工人群體比例較大時,很大程度上會導致不安全行為發生[14]。 因此,若工人處于不穩定狀態時,記T(X)= 0,表示工人的“生產冒進行為”一定會發生;若工人狀態穩定時,記T(X)= 1,表示工人行為安全。 此時,工人的“生產冒進行為”狀態函數γ(x) 可表示為
2.1.1 “博弈”對象主體與假設條件
研究生產工人群體的“生產冒進行為”,涉及到工人“生產冒進行為”的發生與安全監管者對冒進行為的遏制兩個“博弈”對立面。 因此,構建“生產冒進行為”演化博弈模型時,研究對象為工人和安全監管者。 模型建立時,假設服從以下條件:
(1)當工人處于不穩定狀態時,即發生不安全行為。
(2)工人處于不穩定狀態時,安全監管者的管控起到了作用,無需采取其他風險控制措施。
(3)工人和安全監管者均屬于有限理性個人[15],都是為實現自我利益最大化去尋求策略,雙方博弈策略有且僅有[安全行為,“生產冒進行為”]和[不監管,監管]兩種狀態。
2.1.2 博弈雙方策略
根據雙方博弈策略,本研究構建的“工人—安全監管者”博弈樹模型如圖1 所示。
由圖1 可知:安全監管者存在監管和不監管兩種情形,而工人為實現自身利益最大化,可能選擇安全行為或“生產冒進行為”。 因此雙方博弈存在4 種情況,即情況1:[監管,行為安全],對應收益為[W1,V1];情況2:[監管,“生產冒進行為”],對應收益為[W2,V2];情況3:[不監管,行為安全],對應收益為[W3,V3];情況4:[不監管,“生產冒進行為”],其對應收益為[W4,V4]。
2.1.3 模型參數確定
依據礦山企業安全行為監管情況[16],共設定9個主要模型參數,具體含義見表1。
表1 模型參數及其含義Table 1 Model parameters and their meanings
根據表1 給出的9 個模型參數與工人和安全監管者收益情況的關系[17],構建的工人和安全監管者收益矩陣,如表2 所示。
表2 工人和安全監管者收益矩陣Table 2 Matrix for benefits for workers and safety regulators
以Un表示工人的期望收益,其中U1表示工人行為安全的期望收益,U2表示工人“生產冒進行為”的期望收益。 根據表2 中工人行為收益與安全監管者監管策略的關系可知:當工人行為安全時,安全管理人員的監管概率為y,不監管概率為1-y,因此,可得出工人行為安全時的期望收益U1為
當工人進行“生產冒進行為”時,對應于安全監管者的兩種監管策略,可得出工人進行“生產冒進行為”時的期望收益U2為
記工人行為安全的概率為x,“生產冒進行為”概率則為1-x,結合不同狀態下的工人收益U1和U2,可得出工人的平均期望收益A為
由于工人群體是理性的,因此在博弈中,工人會選擇有利于自身的博弈策略。 令工人行為安全的概率變化率為dx/dt,則工人群體收益復制動態方程Ut可表為
記Kn表示安全監管者的期望收益,則安全監管者在監管時的期望收益K1進行如下計算:
不監管時的期望收益K2可通過下式得出:
此時,根據式(7)和式(8)可求得平均期望收益B(式9)和安全監管者的期望收益復制動態方程Kt(式10)。
通過對工人行為和安全監管者監管行為的效益動態分析,可得到工人和安全監管者的總體博弈復制動態方程為
為系統分析工人與安全監管者的博弈演化機理,根據工人期望收益U1和U2以及安全監管者期望收益K1和K2,并結合二者總體博弈復制動態方程,采用系統動力學(SD)軟件,建立了含有2 個水平變量、2 個速度變量和13 個輔助變量的SD 模型,如圖2所示。
圖2 工人不安全行為演化博弈系統動力學模型Fig.2 Dynamic model of evolutionary game system of workers′ unsafe behavior
(1)在滿足博弈過程限制條件的基礎上,選取進行博弈的基礎參數見表3[18]
表3 參數賦值情況Table 3 Parameter assignments
。
(2)假設博弈過程持續100 周,則博弈初始時間為0,終止時間為100。 其中,安全監管者以固定監管頻率4 次/d 對工人進行定期檢查,時間步長為0.031 25。
(3)由于工人和安全監管者均屬于理性個人,故在本研究中,工人行為安全概率和安全監管者監管概率均為0.5。
根據表3 給出的參數賦值,采用系統動力學軟件對8 種博弈狀況進行模擬,分析參數變化對博弈雙方行為選擇的影響。 博弈模型隨P1、P2、P33 個成本參數的變化特征如圖3 所示。
圖3 初始參數和成本參數變化時的演化博弈過程Fig.3 Evolutionary game process during the variation of initial parameters and cost parameters
分析圖3 可知:
(1)當工人為達到穩定狀態所需付出的成本(P1)增加后,工人行為安全概率快速下降,使得“生產冒進行為”增多,安全監管者為遏制生產事故發生,傾向于實施監管行為。
(2)當工人不穩定狀態提高時,安全監管者付出的成本(P2)增加,安全監管者和工人會根據各自收益變化情況進行短暫的動態博弈;當工人行為安全的概率為1 時,安全監管者不進行監管。
(3)當安全監管者加大對不穩定狀態工人的經濟懲罰(P3)時,工人在短期內會減少“生產冒進行為”的發生,隨后由于安全監管者的監管概率下降,工人行為安全的概率也降低。 5 周后,根據收益情況,博弈雙方開始新的博弈。
博弈模型隨G1、G2、G33 個收益參數與風險成本參數L的變化特征如圖4 所示。
圖4 風險成本和收益參數變化的演化博弈過程Fig.4 Evolutionary game process during the variation of risk cost and return parameters
分析圖4 可知:
(1)當工人的不穩定狀態提高,導致事故發生時工人承擔的風險成本(L)增加,使得動態博弈過程變緩,工人的行為選擇和安全管監管者的監管選擇變化周期更長,安全生產狀況更穩定。
(2)當工人處于穩定狀態的收益(G1)提高后,工人為尋求更高的收益,會規避“生產冒進行為”的發生,安全監管者則相應減少監管行為。
(3)當工人處于不穩定狀態的收益(G2)提高時,工人“生產冒進行為”增多,安全監管者傾向于實施監管行為。
(4)當安全監管者不進行監管時的收益值(G3)提高時,工人和安全監管者的行為會呈現明顯的波動變化,二者為達到各自的收益最大化進行反復動態博弈,該種狀態不利于礦山安全生產。
為分析生產過程中不同影響因素對工人安全行為和安全監管者監管行為的影響,本研究引入經濟學中敏感度的概念分析參數的敏感度[19]。 通過改變初始模型的參數賦值,分析不同參數下的工人安全行為和安全監管者監管行為的概率變化情況,從而得出各個因素的影響程度,結果見表4。
表4 各參數對工人行為安全和安全監管者監管行為的影響Table 4 Influence of each parameter on worker behavior safety and supervision behavior of safety regulators
由表4 可知:
(1)各參數對工人行為安全的影響特征表現為:① 工人處于穩定狀態的收益(G1)對工人行為安全的影響最大,其敏感度為1.20,影響最小的是當工人處于不穩定狀態時,安全監管者付出的成本(P2),其敏感度為0.22;② 各參數對工人行為安全的影響程度差別較小,僅當參數G1變化時,所得敏感度大于1。
(2)各參數對安全監管者監管行為的影響特征表現為:① 工人處于穩定狀態的收益(G1)對安全監管者監管行為影響最大,其敏感度為4.91,影響最小的是安全監管者不進行監管時的收益值(G3),其敏感度為0.16;② 各參數對安全監管行為的影響程度差別較顯著。
(3)從敏感度計算結果分析可知:對工人行為安全和安全監管行為影響程度最大的均是工人處于穩定狀態的收益(G1)。 工人層面的模型參數(P1、G1、G2、L)變化對工人行為安全和安全監管者監管行為的影響程度,普遍顯著于安全監管者層面的模型參數(P2、P3、G3)。 因此,為更有效地減少礦山“生產冒進行為”發生,可依據上述規律進行安全管控。
(1)運用演化博弈理論,依據成本效益關系構建了工人行為和安全監管者監管行為的動態博弈矩陣模型。 該模型系統考慮了影響礦山“生產冒進行為”產生的主要因素,便于有效分析其產生機理,從而為礦山生產風險管控提供參考。
(2)運用系統動力學方法,分析了工人行為和安全監管者監管行為的演化博弈過程,得出在一定范圍內,工人行為安全概率和安全監管力度成正相關,但隨著監管力度加大,工人會傾向于實施“生產冒進行為”。 提高安全監管者對不穩定狀態工人的經濟懲罰、增大不穩定狀態導致事故發生時工人承擔的風險成本,有助于放緩工人和安全監管者博弈過程,安全生產狀況更穩定。
(3)采用敏感度理論,對影響工人行為安全和安全監管者監管行為的4 個成本因素和3 個收益因素進行了敏感度分析,得出工人處于穩定狀態的收益對工人行為和安全監管行為的影響程度最大。 因此,礦山企業可根據不同因素的重要度排序,優化獎懲機制,從而降低“生產冒進行為”的發生概率。