?

演化博弈下煤礦污染治理行為的數值仿真

2024-01-08 02:33劉海濤倪東滟
黑龍江科技大學學報 2023年6期
關鍵詞:經濟收益消極煤礦

劉海濤, 倪東滟, 朱 騰

(黑龍江科技大學 礦業工程學院, 哈爾濱 150022)

0 引 言

煤礦資源從上世紀50年代開始就成為我國經濟發展的重要支柱能源,在生產和消費中占據主導地位[1],為我國現代化建設提供保障。由于煤礦開采過程中產生的廢水[2]、廢氣[3]、重金屬[4]等污染問題嚴重影響到生態環境發展,近年來,中央大力推進環境治理政策,并出臺了相關法律條例,提出要堅持生態優先、綠色發展,協同推進經濟高質量發展和生態環境高水平保護[5],另外,黨的二十大報告還重點提到“深入推進能源革命,加強煤炭清潔高效利用”。但仍然存在煤礦企業消極執行、各地政府監管寬松的行為,易對環境造成不可逆的損害,因此,如何促進煤礦企業與政府雙方主體協作治污,形成“政府監督—企業實施”的理想化博弈,推進煤礦周邊環境生態保護和高質量發展具有重要意義。

目前,國內外專家學者已針對煤礦污染治理問題進行了深入研究。張沛沛等[6]基于熵權和障礙度模型,以煤礦區居民滿意度為標準,分析生態破壞治理和環境污染治理,構建績效評價指標,為我國煤礦區生態環境建設提供參考。Wang等[7]選用數據包絡分析(DEA)模型構建評價指標體系,針對煤礦開采與環境治理效率問題,提供科學決策。郭江等[8]結合CVM的理論基礎發現,基于WTA的測算結果能夠充分反映煤炭開采帶來的礦區生態環境外部成本,對礦區環境治理成本規劃提供建議?;谝陨涎芯拷Y果發現,針對我國煤礦污染治理問題分析過程中多采用有影響的第三方為視角,并未從承擔煤礦環境治理責任的主體(政府、煤礦企業)角度出發,導致分析不夠全面。為強調責任主體,本文提出了基于演化博弈下的政、企治污選擇模型,其相關理論已在煤礦應急救援[9]、經濟[10]、新能源[11]、社會科學[12]等方面得到廣泛應用。由于煤礦污染治理中政府和煤礦企業都可作為有限理性的博弈主體,并且雙方會根據影響參數的改變而選擇動態平衡下的利益最大化策略,最終收斂于穩定的理想狀態,因此,運用演化博弈方法構建模型來探究政、企雙方在煤礦污染治理過程中的策略選擇切實可行。

已有文獻對煤礦污染治理中各主體間的博弈行為分析尚不多見,且多是把政府和煤礦企業之間的戰略選擇概括為監管或不監管、執行或不執行,但在當今中央實施的治理政策背景下,政、企已極少出現絕對不監管、不執行的現象了。為此,筆者擬以煤礦企業和政府為雙方博弈的主體,采用演化博弈方法來探討煤礦污染治理協作行為的影響因素并優化關鍵參數,利用數值仿真軟件驗證其優化結果,此外,模型改變了固有的主體理性程度,有利于提高模型構建精度,實現雙方協作的理想演化策略。

1 模型假設

煤礦污染治理的有效推進,需要構建以政府為監管主導、地方煤礦企業為實施主體的規范治理系統。政府和煤礦企業兩者共同作為有限理性的博弈參與方,在整個演化過程中,各自都存在兩種可選策略,并采取隨機配對模式,在非對稱信息條件下反復博弈[13]。鑒于近些年國家大力弘揚“綠水青山就是金山銀山”的治理口號,并針對煤礦開采頒布了各項規定和章程,煤礦企業與政府極少出現絕對不執行、不監管行為,因此,將政府“監管”和“不監管”的可選擇策略調整為“嚴格監管”和“寬松監管”;煤礦企業“執行”和“不執行”的可選擇策略調整為 “積極執行”和“消極執行”,極大提高了模型的理性程度。

政府嚴格監管與否很大程度上影響了煤礦周邊生態環境是否能夠良好發展,雖然政府采取嚴格監管政策時需要支付懲罰煤礦企業排污不規范等行為的人力成本,但其目的是以最低的成本獲取最高的收益,并從源頭出發,降低后續治理環境的難度。對于煤礦企業而言,積極執行合法排污策略會增加開采成本,影響煤礦開采利益,若選擇消極執行,長此以往則會對生態環境造成不可逆的損害,間接影響整個城市的市容形象。雙方主體變量相關參數及定義分別為:CA1表示煤礦企業積極執行污染治理任務付出的成本;CA2表示煤礦企業消極執行污染治理任務付出的成本;CB1表示政府嚴格監管煤礦企業所付出的成本(人力等監管成本);CB2表示煤礦企業消極治污時政府付出的補救治理成本;SA1表示煤礦企業積極執行污染治理任務時的經濟收益;SA2表示煤礦企業消極執行污染治理任務時的經濟收益;SB1表示政府嚴格監管時的經濟收益;SB2表示政府寬松監管時的經濟收益;SB3表示政府嚴格監管時產生的間接效益(公信力提高,市容市貌改善等);SB4表示政府寬松監管時,公眾因不滿而產生的負效益(聲譽受損,公信力降低);B表示煤礦企業積極治污時政府的補貼額度;F表示煤礦企業消極治污時政府對其實施的罰款。

針對上述內容并結合煤礦污染治理的實際情況,提出以下模型假設。

假設1煤礦企業的策略選擇用x∈(0,1)表示,當x=0時,表示煤礦企業選擇“消極執行”行為;當x=1時,表示煤礦企業選擇“積極執行”行為。政府的策略選擇用y∈(0,1)表示,當y=0時,表示政府選擇“寬松監管”行為;當y=1時,表示政府選擇“嚴格監管”行為。

假設2當政府選擇寬松監管策略、煤礦企業選擇消極治污策略時,政府對煤礦企業行為不實施處罰,即不產生罰金,且政府無后續補救的治理成本;當政府選擇寬松監督策略時,煤礦企業即使積極執行治污策略也無補貼。

假設3煤礦企業消極治污時,政府對其實施的罰款小于其正常開采中產生的經濟收益,即F

假設4考慮到煤礦企業消極執行治污政策的實際情況存在,煤礦企業在選擇積極治污策略時,獲得的收益是小于消極治污策略,且獲得的收益略大于成本。

2 構建收益矩陣

為驗證政府、煤礦企業雙方主體選擇策略組合的穩定性,依據上述假設條件,文中采用Friedman提出的方法,利用雅可比矩陣求解并判斷模型的穩定性,并根據其結果分析出雙方主體各策略的影響。政府、煤礦企業的雙方博弈收益矩陣,如表1所示。

表1 政府、煤礦企業的雙方博弈收益矩陣

根據表1,計算雙方主體的期望收益與平均收益,并構建兩者的復雜動態方程。其中煤礦企業采取“積極執行”策略的期望收益UA1為

UA1=y[(SA1-CA1)+B]+(1-y)(SA1-CA1)。

(1)

采取“消極執行”策略的期望收益UA2為

UA2=y[(SA2-CA2)-F]+(1-y)(SA2-CA2)。

(2)

平均收益UA為

UA=xUA1+(1-x)UA2。

(3)

政府采取“嚴格監管”策略的期望收益UB1為

UB1=x[(SB1-CB1)+SB3-B]+(1-x)[(SB1-CB1-CB2)+SB3+F]。

(4)

采取“寬松監管”策略的期望收益UB2為

UB2=x(SB2-SB4)+(1-x)(SB2-SB4)。

(5)

平均收益UB為

UB=yUB1+(1-y)UB2。

(6)

經分析,可得到煤礦企業和政府雙方主體的復制動態方程分別為

(7)

(8)

令F(x)=0、F(y)=0,可求得模型的均衡點分別為A(0,0)、B(0,1)、C(1,0)、D(1,1)以及E[(SB1-CB1-CB2-SB2+SB3+F+SB4)/(B+F),(CA1-SA1-CA2+SA2)/(B+F)]。下文將用α=(SB1-CB1-CB2-SB2+SB3+F+SB4)/(B+F),β=(CA1-CA2-SA1+SA2)/(B+F)表示E點坐標,即E(α,β)。雅可比矩陣J為

根據以上特征值,分別對5個均衡點進行分析。記矩陣的行列式為detJ,detJ=ad-bc,矩陣的跡為trJ,trJ=a+d,并按公式計算各均衡點對應的值。各均衡點的穩定數值表達式,如表2所示。

3 模型分析

根據復制動態方程穩定性原理,煤礦企業選擇穩定策略時需滿足F(x)=0,且F′(x)<0。

圖1 煤礦企業策略選擇動態趨勢

圖2 政府策略選擇動態趨勢

李雅普諾夫第一法則表明,當均衡點的所有特征值均為正(λ>0)時,表示該點為不穩定點。所有特征值有正有負時,表示該點為鞍點。所有特征值均為負(λ<0)時,該點才為穩定點。由于文中討論的是非對稱博弈的策略選擇,根據Ritzberger的研究[14],只需討論純策略均衡的漸近穩定性即可,所以不考慮均衡點E(α,β)的穩定情況。雙方主體的演化穩定性分析,如表3所示。記A點的特征值λA1=SA1-CA1-SA2+CA2,λA2=SB1-CB1-CB2-SB2+SB3+F+SB4;B點的特征值λB1=B+F+λA1,λB2=-λA2;C點的特征值λC1=-λA1,λC2=λC2-B-F;D點的特征值λD1=-B-F-λA1,λD2=-λA2+B-F。

表3 雙方主體的演化穩定性分析

以表3分析的D(1,1)為例,當x∈(0,1),y∈(0,1)時,對雙方博弈主體選擇策略的演化穩定性進行仿真模擬。根據《環境影響評價報告公示》文件,以井田面積約占17.451 km2為例,考慮到煤礦企業附近的直接或間接影響區域,并結合采煤沉陷影響最大范圍,確定將井田邊界向外延伸500 m作為生態評價范圍,面積約為29.02 km2,積極投入生態治理成本占總成本的23.43%,實際經濟收益占135.08%。此外,由2021年煤炭行業最新稅收政策顯示,增值稅一般為13% ,企業所得稅為25%,另有消費稅、資源稅。因此,按照企業支付成本與經濟收益的占比、政府稅收收入比例以及模型構建的要求,將各參數賦值為CA1=23、CA2=28、CB1=10、CB2=15、SA1=35、SA2=36、SB1=25、SB2=20、SB3=14、SB4=14、F=3、B=2滿足表中約束條件。

根據各點的演化路徑圖,可得出當雙方主體的選擇策略最終趨向于D點時演化為帕累托最優解,即此時煤礦企業選擇“積極執行”政策,政府選擇“嚴格監管”政策。

其余三種情況同理可得,下文賦值參數的條件及演化趨勢不做贅述。D點的雙方主體演化路徑圖如圖3所示。

圖3 D點的雙方主體演化路徑

4 數值仿真

4.1 模型均衡點穩定分析

為驗證構建雙方主體博弈模型的穩定性,可通過調整其中一方博弈主體的初始值進行檢驗[13]。已知x、y定義在(0,1)區域內,將兩者按照影響概率劃分為三個標準,從低到高分別設為0.3、0.5、0.7,并探究每級標準下煤礦企業和政府的選擇動態演化過程。因此,本文將選取處于標準值之間的四個參數,即煤礦企業的初始值分別賦值為0.2、0.4、0.6、0.8,政府的初始值y分別賦值為0.8、0.6、0.4、0.2。在不考慮均衡點E(α,β)的情況下,煤礦污染治理過程按照其余均衡點可分為4種情形。

情形1煤礦企業選擇“消極執行”策略、政府選擇“寬松監管”策略為滿足SA1-CA1-SA2+CA2<0,且SB1-CB1-CB2-SB2+SB3+F+SB4<0,將式中的未知參數賦值為CA1=20、CA2=10、CB1=10、CB2=15、SA1=30、SA2=40、SB1=20、SB2=25、SB3=5、SB4=5、F=2、B=2。此時,雙方主體選擇的策略組合穩定,即A(0,0)為ESS。該情形表示,煤礦企業在積極治污獲得的利潤小于消極治污;政府嚴格監管下的利潤與罰金之和小于政府寬松監管的收益,煤礦企業選擇“消極執行”策略;政府選擇“寬松監管”策略。情形1如圖4a所示。

圖4 情形1~4動態演化過程

情形2煤礦企業選擇“消極執行”策略、政府選擇“嚴格監管”策略為滿足B+F+SA1-CA1-SA2+CA2<0,且-SB1+CB1+CB2+SB2-SB3-F-SB4<0,將式中的未知參數賦值為CA1=20、CA2=10、CB1=8、CB2=10、SA1=30、SA2=40、SB1=23、SB2=15、SB3=8、SB4=10、F=2、B=2。此時,雙方主體選擇的策略組合穩定,即B(0,1)為ESS。該情形表示,煤礦企業在積極治污時產生的經濟收益加上治污補貼后仍小于消極治污狀態下企業被扣除罰金后的經濟收益;政府嚴格監管下的經濟收益與繳獲的罰金之和高于寬松監管時,煤礦企業選擇“消極執行”策略;政府選擇“嚴格監管”策略。情形2如圖4b所示。

情形3煤礦企業選擇“積極執行”策略、政府選擇“寬松監管”策略為滿足-SA1+CA1+SA2-CA2<0,且SB1-B-CB1-CB2-SB2+SB3+SB4<0,將式中的未知參數賦值為CA1=23、CA2=28、CB1=10、CB2=15、SA1=35、SA2=36、SB1=20、SB2=25、SB3=5、SB4=5、F=2、B=2。此時,雙方主體選擇的策略組合穩定,即C(1,0)為ESS。該情形表示,煤礦企業在消極治污時獲得的總利潤小于積極治污;政府嚴格監管時除去需支付的補貼后獲得的收益小于寬松監管下扣除負效益之外的收益,煤礦企業選擇“積極執行”策略;政府選擇“寬松監管”策略。情形3如圖4c所示。

情形4煤礦企業選擇“積極執行”策略、政府選擇“嚴格監管”策略為滿足-B-F-SA1+CA1+SA2-CA2<0,且-SB1+B+CB1+CB2+SB2-SB3-SB4<0,將式中的未知參數賦值為CA1=23、CA2=28、CB1=10、CB2=15、SA1=35、SA2=36、SB1=25、SB2=20、SB3=14、SB4=14、F=3、B=2。此時,雙方主體選擇的策略組合穩定,即D(1,1)為ESS。該情形表示,煤礦企業在消極治污時的經濟收益在扣除罰金后小于積極治污時的收益與補貼之和;政府寬松監管時的經濟收益小于嚴格監管下扣除補貼之外的總收益,煤礦企業選擇“積極執行”策略;政府選擇“嚴格監管”策略。情形4如圖4d所示。

4.2 參數優化的演化策略

基于上述4種情形的演化過程,為使模型趨于最優解,將改變有限理性的參數賦值,并研究其變化的影響。其中,CA1、CB1、CB2分別為煤礦企業、政府積極治污時國家政策規定付出的理性成本,故不予考慮;SA1、SA2、SB1、SB2分別為煤礦企業、政府積極或消極治污時所獲收益,該收益與煤礦產量相關,不構成有限理性標準,亦不考慮。因此,在各參數處于定義域內的情況下,對CA2、SB3、SB4、B、F進行優化并做詳細分析。各參數優化見圖5。

圖5 各參數優化曲線

圖5a表示煤礦企業消極治污時自主投入成本CA2大小對模型本身的影響。當煤礦企業消極治理時投入的成本越低,主體轉變策略選擇積極治污的概率P越小,且收斂的速度越快,表示企業已定決策的堅定程度越高。隨著企業自行選擇投入的治理成本CA2由15升至18時,圖中曲線可以明顯看出企業的選擇收斂速度放緩,雖然最終的策略結果沒變,但是決定者在選擇時搖擺的可能性不斷加大。當進一步增大CA2,企業的消極治理成本攀升,很大程度上影響了整個礦山的經濟收益,所以企業在越過一個成本閾值后,最終選擇積極治污策略的概率也從0逐漸上升至均衡解1。當給CA2賦值的參數過大時,煤礦企業選擇積極治污策略的概率會穩定在均衡解1,并且做出選擇的時間越短,速度越快。

圖5b表示當政府嚴格監管產生對自身有積極影響的間接效益SB3時,如政府公信力提高,市容市貌改善等對模型的影響。圖5b中曲線顯示,產生無論大小的間接效益時,政府都會在短時間內大概率選擇嚴格監管煤礦企業的策略來獲取該收益,這就證明公眾對政府的口碑評價、整體城市環境指標等現實因素都是影響政府決策的重要組成部分。然而,當間接收益的整體效益遠遠達不到政府所需要的現實成本時,政府最終還是會選擇寬松監管來維持環境與收益,以此達到雙方的動態平衡。若民眾對政府的嚴格監管行為給出熱烈的支持和反響,那么這些間接收益將會進一步轉化成長期宣傳效益,比如帶動城市旅游經濟、高質量人才引進以及企業投資等,最終促使政府堅定選擇嚴格監管政策。

圖5c表示政府寬松監管時因公眾不滿而產生的負效益SB4,如聲譽受損,公信力降低等等,對政府選擇治理策略的影響。從圖中曲線可以看出,當負效益產生時,無論大小,政府都會在短時間內快速選擇嚴格監管策略,第一時間對涉事煤礦企業采取措施進行調查,盡量將自身損失降到最低。在給參數賦值的過程中,為探究負效益的影響設置了相對較高和較低的兩種參數,但所得結果仍然相同,由此也反映出信息社會公眾影響力的深遠,政府做出的一切選擇都要以人民為宗旨。

圖5d表示煤礦企業積極治污時政府的補貼額度大小B對模型的影響。政府的補貼是針對企業積極治理環境而實施的鼓勵政策,一般來說,補貼額度不會完全覆蓋煤礦企業所需的全部治理成本,所以企業會衡量積極治理成本與補貼金額對整個煤礦收益的影響,最終決定選擇的治理策略。圖中曲線表示,當補貼金額遠小于企業需支付的積極治理成本時,煤礦企業選擇積極執行政策的概率為0;當政府不斷加大投入的補貼金額,企業單位開始松動,做出選擇的時間逐漸增加;當政府投入的補貼達到一定額度時,企業大概率會選擇積極治污,然而一旦政府投入金額超出上限,是否所有主體都愿意支出余下的治理成本,愿意支付的企業能否按照規定合理使用補貼還存疑,因此,圖中會出現概率波動?;诜治隹芍?政府采取的補貼政策在一定程度上對煤礦企業的選擇策略有積極影響,但是只能作為輔助手段來幫助減少政府付出的嚴格監督成本。

圖5e表示煤礦企業消極治污時政府對其實施罰金F的影響。與政府采取的補貼手段一樣,針對煤礦企業消極治污的行為,政府也會采取懲罰策略來監督企業。當所處罰金遠小于企業消極治污所獲得的經濟收益時,煤礦企業會在極短時間內支付罰金,而選擇積極執行治污政策的概率為0;當政府提高罰金標準時,曲線收斂速度明顯放緩,雖然主體仍選擇了消極執行行為,但結果表明罰款影響了企業的判斷;繼續提高罰金標準直至顯著影響企業收益時,主體選擇積極治污策略的概率從0逐漸上升至均衡解1,在此基礎上每提高一次罰金標準,煤礦企業做出選擇的收斂速度就增快一次,直到在短時間內堅定選擇積極執行策略為止。因此,政府在處理煤礦企業環境治理問題上,可以適當提高罰金金額,依據國家法律條例約束規范煤礦企業行為,達到最終目的。

5 結 論

基于煤礦企業治污現狀和當前治理環境的現實問題,本文通過構建“煤礦企業—政府”雙方博弈模型,分析了雙方主體在煤礦污染治理過程中的演化策略,并利用數值仿真軟件對構建的演化博弈模型進行驗證。得出以下主要研究結論。

(1)雙方主體在政府選擇嚴格監管、煤礦企業選擇積極執行污染治理規程的情形下,可達到理想的穩定演化策略。各方主體在某些情況下可以形成另外三種不同的相對穩定策略,但是從保護生態環境建設、構建綠色社會的角度出發,考慮政府支付的成本以及公眾信譽等現實因素的影響,雙方主體最終會選擇理想穩定的演化策略。因此,政府可對消極執行治污策略的煤礦企業實行高額罰金,并在一定范圍內合理增加積極治污主體的補貼,促使煤礦企業積極執行治污策略。此外,政府監管下產生的間接效益或負效益可通過網絡信息快速傳播,利用群眾力量敦促政府嚴格監管煤礦企業。

(2)政府、煤礦企業作為演化策略的雙方主體,同時選擇理想策略的概率與罰金、補貼及間接收益在一定范圍內呈正相關,而與投入的治理成本成反比。增加治理成本可以有效構建綠色生態環境,但當需要投入的成本過大時,整體經濟收益減少,導致雙方選擇理想穩定策略的意愿降低。通過制定彈性環境治理標準促使雙方主體在初期堅定選擇理想策略,才能達到模型的動態平衡。

為使煤礦企業與政府共同選擇良性的環境治理策略,促進博弈雙方達成友好合作,分別對各方主體提出如下建議。

(1)完善政府對煤礦企業污染治理的獎懲機制。根據上述研究可知,政府對煤礦企業在治理過程中實施的獎懲措施可促使煤礦企業選擇積極執行策略,因此,嚴格劃分獎懲標準有利于政府高效監管煤礦企業。例如,根據煤礦企業周邊環境建立等級指標Ⅰ至Ⅴ級,當煤礦環境評估等級為Ⅰ、Ⅱ、Ⅲ級時給予適當補貼;當等級評估為Ⅳ或Ⅴ級時給予相應懲罰,并根據每層治理等級不同,確定最終的補貼和懲罰金額。除此之外,政府可以適當降低積極治污企業的稅收要求,積極引導主體選擇。

(2)落實煤礦企業積極治污的主體責任。研究表明,煤礦企業選擇消極執行治污策略的主要原因是需要投入的資金成本過大,并且治理工作耗時耗力。對此,企業與政府可以通過建立合作、投資等方式對現有治污設備進行升級改造,從根源降低企業長期投入的經濟成本,提高治理效率;另一方面,煤礦企業作為社會經濟的重要組成部分,主動承擔責任,履行必要義務,以積極的行為獲取社會榮譽,從而達成與政府的長期合作,有助于吸引更多高質量人才,保持企業健康發展。

(3)提出“對癥下藥”的治理措施?,F階段煤礦污染主要包括大氣、固體廢棄物以及廢水等,針對不同的污染問題,提出相應的治理政策。例如,應用煤礦地下汽化技術將煤炭轉化為煤氣,從而減少井下有害氣體的排放;將煤矸石、粉煤灰等固體廢棄材料投入公路工程、建筑等行業進行二次利用,降低原材料成本的同時處理大量固體廢棄物;采取過濾、除雜等技術手段凈化礦井廢水,最終應用于礦區生活水循環中。除此之外,植樹造林、退耕還林等手段對凈化礦區空氣、降低施工噪聲以及過濾粉塵都有輔助治理作用。

猜你喜歡
經濟收益消極煤礦
淺析鄉村振興背景下以黨員為中心搭建“城鄉客戶結對幫扶”的意義
職業體育俱樂部體育競爭與經濟效益之間的關系分析
企業財務風險控制研究
大型煤礦自動化控制系統的設計與應用
讓自己發光
上半年確定關閉煤礦名單513處
去年95.6%煤礦實現“零死亡”
家庭教育:你種的是積極樹還是消極樹?
“消極保護”不如“積極改變”
瞬變電磁法在煤礦防治水中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合