?

基于斯坦科爾伯格模型的農產品供應鏈動態博弈問題

2023-01-05 10:05王俊春李凱敏張宇雁
時代經貿 2022年12期
關鍵詞:效用函數情形收益

王俊春 段 丹 李凱敏 張宇雁

(1.保山學院;2.保山技師學院 云南保山 678000)

農民合作社的發展現狀

從圖1和圖2可以看出:2012-2020年,從總量來看,合作社數量和入社農戶數逐年增長并在2018年達到峰值,2019年出現下降后繼續增長;從同比增速來看,合作社數量和入社農戶數,在2015年達到增速峰值后均下降,2019年觸底反彈;從合作社構成來看,農產品類平均占比為86.76%,合作社的經營內容主要是農產品生產和供給。而從政策層面進行梳理可以發現,2015年頒布的《關于深化供銷合作社綜合改革的決定》從創新農業生產服務方式和手段、提升農產品流通服務水平、打造城鄉社區綜合服務平臺、穩步開展農村合作金融服務等方面構建起農民合作社發展的良好政策環境(包括土地、信貸、財政補貼等政策利好),這成為農民合作社發展的重要變量(馮春、楊玄,2020)。2019年,11個部委針對農民合作社進行“空殼社”專項清理,而這一年也出現了合作社發展史中罕見的數量驟減(減少了13755個)。隨后頒布了《供銷合作社促進小農戶和現代農業發展有機銜接工作實施方案》《關于規范發展供銷合作社金融服務的指導意見》《關于推進區域電商發展的實施意見》,從引導小農戶開展合作與聯合、創新合作社組織小農戶機制、增強農村電商服務帶動小農戶能力、提升金融服務小農戶水平等方面進一步優化了農民合作社的發展空間,而對應的在2020年數量和增速均呈現出增長態勢??梢钥闯?,農民合作社的發展與政策變量緊密相關。作為相關政策執行者的地方政府和合作社之間的利益博弈貫穿合作社發展的整個歷程。

圖1 全國農民專業合作社總體情況

圖2 專業合作社、入社農戶數同比增速情況

農產品供應鏈中“地方政府-農民合作社”的動態博弈模型

(一)基本說明

從公共選擇理論的角度假設:第一,農戶對農民合作社服務的需求為“有效需求”;第二,供給層面中中央政府設定為政策制定者,為利益偏好中性,地方政府設定為政策執行者(利益主體),有自身的利益訴求,以專業大戶為主的農民合作社設定為一個利益主體;第三,供給層面的兩個主體:地方政府和合作社都為“理性經濟人”。

(二)模型分析

1.基本假設。根據模型,做出如下假設:第一,有一個地方政府G和兩個合作社B1和B2,不同合作社有不同的經營效率;第二,Bi(i=1,2)作為提供合作社服務的供給主體,總收益包括經營收益和社會收益,且Bi有決定這兩種收益多少的能力和偏好;第三,G有選擇Bi(i=1,2)上繳一定比例的經營收益和社會收益的權力;第四,社會收益和經營收益具有同質性,可以通過貨幣化來衡量;第五,G和Bi(i=1,2)的目標效用函數都遵循邊際收益遞減規律。

2.變量說明。xi:Bi(i=1,2)獲得的經營收益;yi∶Bi(i=1,2)獲得的社會收益;αi:G選擇Bi(i=1,2) 上繳的經營收益比例;1-αi∶G選擇Bi(i=1,2)上繳社會收益的比例,其中變量中的i=1,2。

3.斯坦科爾伯格模型建立及分析。地方政府守信,農民合作社之間形成合作。

先討論第一種情形,G與Bi的動態博弈順序為:Bi(i=1,2)選擇各自的收益水平(經營收益和社會收益)x1,y1和x2,y2;G 選擇Bi(i=1,2)兩種收益的上繳比例α1、1-α1、α2、1-α2,其中,α1為B1的經營收益,1-α1為其社會收益;α2為B2的經營收益,1-α2為其社會收益(張維迎,2019)。

在地方政府和合作社的完全信息動態博弈中,Bi是領先者,G是尾隨者。G并不能先決定Bi(i=1,2)在合作社運營管理過程中的收益水平,而是Bi在實際經營過程中先獲得自身的經營收益和社會收益。而對于Bi,它們達成彼此合作以期獲得總目標效用函數的最大值。均衡解則由兩個條件來決定:第一,給定Bi(i=1,2)收益,G追求收益最大化;第二,G的反應函數既定,Bi(i=1,2)追求收益最大化。而要求解納什均衡,需要解決兩個問題:給定Bi(i=1,2)收益水平(xi,yi,i=1,2)時,G的反應函數的求解;給定G的反應函數,Bi的經濟收益和社會收益為多少。

若 G是“平均主義”的地方政府,即偏好兩個合作社上繳收益相同。對于地方政府G這個利益主體而言,其尋求Bi(i=1,2)上繳的總收益形成的目標效用函數最大化。G的總目標效用函數為:

通過上述分析得出地方政府G的反應函數,現分析Bi的目標效用函數最優化問題。斯坦科爾伯格模型中Bi作為領先者,假設其不合作,尋求各自的收益函數最優化,B1的目標收益函數:

其中,c1(x1),c1(y1) 分別為B1在創造兩種收益所發生的成本,設,其中,a1、b1均為勞動成本系數,而該式遵循邊際成本遞增規律,經整理得:,i∈1,2。同理可得B2的目標效用函數。

若Bi合作,則總目標效用函數為:

結合上述推導,納什均衡上繳比例為:

納什均衡的上繳比例對于地方政府G目標效用函數來說是最優解。對于總的合作社目標效用函數最優化求解,Bi的收益函數及上繳比例受到另一個合作社的影響,因此,均衡解是包含了外部效應的最優解。同時,該種情形下的收益函數不會發生囚徒困境式的“收益損失”,但這種情形不具備客觀現實性,是一種理論分析的最優解。

農民合作社之間不合作,地方政府不守信。Bi(i=1,2) 尋求自身效用函數最優化,不考慮其收益水平的外部性問題,也就是說,合作社Bi=(1,2) 的經營收益和社會收益是會受到另一個合作社Bj(j=1,2)的影響。假設Bi先行動,G后行動。Bi不合作,納什均衡解可定義為:給定Bi的反應函數,G的選擇是最優的;給定地方政府和Bj(j=1,2) 的選擇,Bi(i=1,2,i≠j)的選擇最優。

先求解第二階段博弈納什均衡解:給定α1,α2和x2,y2,B1選擇x1,y1。B1的目標效用函數為:,i∈1,2。計算得:

同理可得B2的目標效用函數。求偏導可得:

將該結果和第一種情形相比較可以發現,“農民合作社之間不合作、地方政府不守信”情形下合作社創造的收益均小于“農民合作社之間合作,地方政府守信”情形的結果。G更偏好較高的收益上繳比例。在G不守信情形下,上繳比例大于參照系的最優納什均衡解,產生這種結果的原因主要包括:該種情形下,Bi的策略選擇不會考慮另一個農民合作社的外部效應,而根據反應函數,Bi之間的收益函數及上繳比例是存在相互影響的;同時,因存在外部效應,Bi都理性地選擇策略,則產生“囚徒困境”式的“收益損失”。

地方政府守信,農民合作社之間不合作。如果地方政府G先行動,選擇Bi(i=1,2)收益的上繳比例α1,α2,并且信守事先簽訂的分享合同;Bi則隨后行動,同時選擇收益水平x1和y1,x2和y2。那么,納什均衡解為:給定合作社反應函數,地方政府G的選擇是最優的;給定G 和第j 個合作社的選擇,第i個合作社的選擇最優。

已知,合作社B1的目標效用函數為:。當Bi相信G信守承諾——上繳比例不發生變化,那么,B1的最優解條件為:,進而可得:x1c=(1-α1)/a1,同理也可得:y1c=α1/b1。同理,合作社B2的最優選擇是:x2c=(1-α2)/a2,y2c=α2/b2。G 的效用函數則為:,αi∈(0,1),i=0,1。因此,可構造拉格朗日函數為:

進而得:

預算約束條件則為:

求解得最優解α1c和α2c,但因涉及三階多項式,得出精確結果較為困難,但就目標而言,無需解出α1和α2具體值,只需比較守信和不守信的不同情形。先比較情形一和情形三,可以發現:x1c<x1b,x2c<x2b,其中,xic是指政府守信情形。同理可得:y1c<y1b,y1c<y1b。因此,地方政府守信情形對應的收益水平小于情形一的收益水平。又α1c<1/2,α2c<1/2,因此,α1c<α1nc,α2c<α2nc。結果為:1/2a1=x1nc<x1c,1/2b1=y1nc<y1c,1/2a2=x2nc<x2c,1/2b1=y1nc<y1c。所以,相較于不守信情形,地方政府G信守承諾,則Bi(i=1,2)創造的經營收益和社會收益更多收益。雖信守承諾情形結果不等同參照系(最優解),但卻是最為接近的收益水平。

綜上分析,可得如下結論:第一,G守信和G不守信兩種情形都會產生“收益損失”;第二,與地方政府G不守信情形相比,守信情形因不存在外部效應,會創造更高收益水平。

進一步討論。地方政府G守信的制度設計部分解決了G不守信情形中的激勵問題,但為什么在現實情形中,G卻選擇不守信呢?主要有兩方面原因:一方面,制度設計中并沒有嚴格規定地方政府在違背事先聲明的分享合同要受到相應的懲罰,而這一制度缺陷給政府背信提供空間;另一方面,G不守信情形下的上繳比例多于G守信情形下的上繳比例,所以,從這點來看,G沒有動力守信,而這點是最為主要的原因。而這種情況,將其稱之為地方政府G 的政策動態非一致性。

假定地方政府G事先選擇一個最優的上繳比例,且這個比例低于守信時的比例,當農民合作社Bi創造自身的收益水平時,地方政府G有動力去改變事先的上繳比例。馬駿認為:“這種政策選擇是動態非一致性的,這樣的策略選擇常常使理性決策的農民合作社Bi難以置信(Jun Ma,1995)?!?/p>

若地方政府和合作社的動態博弈順序為:地方政府G先選擇 Bi(i=1,2)的上繳比例αi;合作社Bi信任G的事先承諾,選擇最優反應函數。Bi的最優反應函數為:。而G的目標效用函數最優解條件為:。當方程式滿足時,G會守信,也就是維持事先選擇的上繳比例αiO,i∈1,2,而這個上繳比例是動態一致性的。但上繳比例低于守信政府G情形的最優政策是否是動態一致性的?結合上述推導,可得到下列等式:

若要該使等式成立,即若滿足動態一致性,下列式子必須成立:α1O=α2O,進而要求a1=a2且b1=b2,也就是說只要存在a1≠a2,b1≠b2情況時,最優政策將是動態非一致性。但根據變量界定,a1,a2,b1,b2是反映合作社服務政策執行過程中發生的勞動成本系數,即反映農民合作社提供的合作服務的效率水平,在客觀現實中,通常Bi(i=1,2)的效率水平是不同的,也就是說:a1≠a2,b1≠b2。所以,地方政府G的最優政策將是動態非一致性的。不守信成為地方政府G在合作社服務供給過程中利益博弈的理性選擇。

農民合作社合作服務政策動態非一致性問題的糾偏策略

(一)地方政府注重自身的良好聲譽,將有利于其選擇守信策略

前文的斯坦科爾伯格模型分析的是一次性博弈,在該博弈過程中,地方政府尋求目標效用函數最大化,農民合作社則相信地方政府有動力改變事先聲明的上繳比例,因此,最優的策略就是“假合作社”“翻牌合作社”“一次性合作社”。但是,假設該動態博弈是無限重復博弈模型,地方政府也注重自身良好聲譽。那么,在無限重復博弈中,地方政府的策略可描述為一系列上繳比例:{α1,α2},農民合作社i的戰略選擇為:{(x1,y1),(x2,y2)}。

假設t表示無限重復博弈的次序中的第t次,其中t=1,2,…,第t-1次的博弈過程可以看作是第t次動態博弈開始之前的一次性博弈,每次的一次性博弈過程中,每個參與者的收益均為現值,設折現率為ξ,且ξ為定值。

設農民合作社在第t階段的收益水平為(xt,yt),地方政府選擇上繳比例為αt。

則農民合作社的策略為:

地方政府的策略為:

農民合作社如果有“地方政府是守信的”預期,那么,合作社創造的收益水平為(xc,yc) ;若有“地方政府是不守信的”預期,合作社創造的收益水平為(xnc,ync)。進一步來看,當地方政府在每次的一次性博弈中都選擇守信策略,那么農民合作社之間也會選擇合作策略,從而創造更高的收益水平。只要地方政府在第t階段偏離了守信策略情形的納什均衡,則農民合作社會在第t+1階段會選擇不合作策略,對應(xnc,ync) 的收益水平。同樣的,地方政府選擇守信策略,上繳比例選擇αc,也是預期到農民合作社都會選擇收益水平(xc,yc),否則,地方政府則會選擇αnc的上繳比例。

若初始值為(x0,y0)=(xc,yc),上繳比例α0=αc。下面將證明滿足地方政府選擇守信策略進而形成雙方合作博弈的條件是存在的。

(二)“仁慈的”地方政府的角色效能將會對合作社產生正向激勵

如果地方政府是“仁慈的”,亦即地方政府不考慮自身效用水平,而是“利他地”考慮到農民合作社的效用水平,因此而推導出的結論也將會大不相同——與“經濟理性人”假設相比。特別地,地方政府選擇不守信策略的情形中,在“仁慈的”地方政府的假設前提下會得到納什均衡解,推導過程如下所示。

設地方政府尋求兩個農民合作社效用函數最大化,則地方政府的目標效用函數為:

地方政府的最優解:

同理可得:

假設兩個農民合作社之間是不合作的,則其面臨的情形與上述情形一樣,亦即合作社i(i∈1,2)都尋求自身效用函數最大化。依據反應函數,農民合作社1的效用函數為:,推導可得:。

可以看出,上述結果相當于地方政府一次性收繳了一部分收益。在這種一次性收繳部分收益的制度設計中,地方政府的問題就變成選擇兩筆一次性收繳部分收益尋求效用最大化:

其中,Ti(i∈1,2) 表示在合作服務供給中地方政府選擇的農民合作社i 一次性上繳的部分收益。因此,合作社B1選擇x1,y1,得到效用最大化水平。同理可得,合作社B2選擇x2,y2,得到效用最大化水平。

當“一次性上繳部分收益”成立,那么,上述結果是最優的,而“仁慈的”地方政府的制度設計也會使其獲得的收益水平最優。在這個假設條件下,即便是地方政府不守信,也就是地方政府在農民合作社創造收益之后選擇上繳比例,但也不會像在“平均主義的”地方政府情形下導致對農民合作社創造更多收益激勵不足時出現的問題。因此,在對農戶提供合作服務供給中,地方政府應該更多地考慮農民合作社的整體收益水平而不僅僅糾結于地方政府與合作社在收益分享的分配問題。在未來的制度設計中,尋求繳后盈余收益的平均化的制度設計(在模型中,假設兩個合作社繳后的收益相等)應減弱,相反,制定更寬泛的上繳標準將有利于獲得更多收益。

(三)打破合作服務供給“平均主義”思維,形成差別化合作社收益激勵規則

若地方政府任命的供銷社主管官員選擇α1和α2的上繳比例,尋求自身目標效用函數最優解:

而滿足條件為:

進而可以推導得出:

求偏導又可得:

因此:

當a1<a2,b1<b2,δ>1,較易可得:Re<Rne。

因此,與“平均主義的地方政府”相比,在任命一個“平均主義不太強烈”的主管官員情形下農民合作社會創造更高的收益水平。在“平均主義的地方政府”情形下,賦予農民合作社1(效率水平較高)和農民合作社2(效率水平較低)相同的上繳比例,且給予兩個合作社相同的政策優惠,“大鍋飯”式的思維往往造成效率高的合作社沒有動力創造更多收益,同時,如果上繳比例設置不合理,對效率低的合作社也會造成不良影響。在“平均主義不太強烈”的情形下,農民合作社1將有動力創造更多收益,因為政策將為其提供更好的有利條件,從而合作社1創造的總收益將會增加,雖然合作社2的收益會減少,但總的來看,增加量會超過減少量。在“平均主義不太強烈”的主管官員情形下,農民合作社1的收益L1會高于合作社2的收益L2。但是也發現,任命一個“平均主義不太強烈”的主管官員并不能從根本上解決前文所述的“政策的動態非一致性”問題,但這樣的制度設計(亦即L1≠L2)可以減少“地方政府不守信”對農民合作社創造更高收益水平所產生的消極作用??傊?,該種制度(L1≠L2)會使地方政府獲得更高的上繳收益。

猜你喜歡
效用函數情形收益
不定方程x3+1=4 781y2解的討論
關于丟番圖方程x3+1=413y2*
螃蟹爬上“網” 收益落進兜
探究一道課本習題的一般情形
怎么設定你的年化收益目標
供給側改革的微觀基礎
從特殊走向一般
其他綜合收益的幾個重要邏輯關系解析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合