?

考慮配送交通風險的新零售平臺、騎手及消費者三方演化博弈分析

2024-02-05 07:11李秀暉雒興剛
系統管理學報 2024年1期
關鍵詞:高風險騎手效用

汪 翼,李秀暉,雒興剛

(杭州電子科技大學 管理學院,杭州 310018)

近年來,我國新零售行業隨著電子商務、IT 技術、物流行業的發展而飛速增長。新零售行業的物流末端主要依賴于騎手的配送,其中,綠色生鮮電商、外賣等行業對于末端配送的及時性要求極高。與此同時,騎手配送過程中發生交通事故屢見報端。例如:2017 年上半年,上海平均每2.5 天就有約1名外賣騎手傷亡[1];廣州僅2021年10月中的半個月就查獲外賣車輛交通違法7 667 宗[2];上海市2020年1~9月份查處快遞外賣騎手各類交通違法行為4.3萬余起[3]。當消費者在平臺下單后,平臺會給出配送時間承諾,而騎手則需要在該時間范圍內按訂單送達。騎手一旦配送超時,就會被平臺處以罰金,消費者也可能會投訴騎手;若消費者進行投訴,平臺則會進一步懲罰騎手。騎手為減少配送超時可能產生的懲罰,要盡可能快的將外賣送達,往往會提高配送騎行的速度,甚至對交通規則視若無睹,因而導致交通事故的發生。這就是近年來公眾廣泛討論的“騎手困境”的重要背景。一般情況下,服務提供方對服務失敗和消費者投訴會采取一定的反應和行動,即服務補救措施[4]。針對訂單配送超時和消費者投訴的情況,目前外賣平臺的服務補救措施主要是建立補償機制,即通過贈送禮物、小額紅包或代金券等方式來消除消費者的不滿。例如:福州“永輝生活”線上自營平臺提供“慢必賠”服務,如果配送超時,系統將自動給用戶發放現金券[5];美團平臺也對部分商家的用戶提供了類似服務協議,一旦訂單實際送達時間超出協議中規定的范圍,平臺就會向用戶支付一定金額的紅包券作為補償。騎手困境背景下,企業建立平臺超時補償機制引發了下列問題:平臺從自身利益出發,建立補償機制是否更加有利?補償額度的多少對平臺、騎手及消費者的決策又有哪些影響? 此外,補償機制如果能夠減少消費者的投訴,能否進一步降低騎手對于超時的擔心,進而采取更安全的配送行為,最終幫助社會緩解“騎手困境”? 針對上述問題,本文通過構建演化博弈模型分析外賣平臺、騎手及消費者3個參與主體在配送服務過程中的行為策略,分析演化博弈的穩定策略選擇,并對演化過程與結果進行仿真分析。通過對各種系統演化結果的對比分析,發現促使平臺推出超時補償機制最主要的動因是其給企業帶來的直接效用提升,其次才是消費者增長的投訴比率和騎手配送風險的增長。影響騎手配送策略最關鍵的因素是平臺對其配送超時的直接懲罰。另外,平臺、消費者對騎手的同理心也是影響騎手配送行為的重要因素。在一定條件下,三方演化策略均衡可以達到理想狀態:平臺建立主動補償機制、騎手低風險配送、消費者對于訂單超時選擇不投訴。

1 文獻綜述

本文相關的參考文獻可以分為外賣配送交通風險、平臺型企業補償機制以及演化博弈模型在運營管理中的運用相關研究3類。一系列文獻通過實證方法對外賣配送交通事故的歸因進行研究,發現其主要原因包括:騎手自身的交通違法行為[6]、平臺派單系統的算法缺陷[7]、平臺對騎手配送超時的獎懲及管理規定等[8]。這些實證研究結論也揭示了騎手困境背后存在復雜的機制。

在平臺型企業補償機制研究方面,余海燕等[9]從配送平臺的角度出發,以配送員為激勵對象,以最大化訂單提前完成率為目標函數,對比分析不同的激勵機制。還有部分實證研究分析補償機制對用戶的影響。Harris等[10]以餐飲服務平臺為例,通過實驗發現,服務補救水平對滿意度和購后意愿有影響。Zhang等[11]也發現,在投訴數量較多的在線交易環境中,有效實施在線服務補救對于減少客戶投訴和保持客戶忠誠度至關重要。李宇昕[12]的研究表明,在整個服務補救流程中,商家恰當合理地實施服務補救能夠產生積極有利的后續結果。上述研究都沒有考慮配送員作為博弈主體的策略選擇背后的影響機制,以及配送交通風險在各方決策中的影響機制,而這正是本文重點考慮的因素。經典博弈理論往往假設博弈主體為完全理性,在現實生活中,這種假設通常是很難實現的。演化博弈理論認為博弈中的主體并不能對外部環境立即做出完美判斷,而是在一個動態的調整過程中逐漸達到均衡狀態?;谶@一原因,很多運營管理研究構建演化博弈模型分析博弈決策的動態調整過程。張國興等[13]研究包含第三方監督下食品企業的食品安全生產與政府部門的監管決策如何相互影響、動態調整。汪旭暉等[14]研究了平臺賣家、平臺電商和政府對平臺電商信用監管機制決策的演化過程,剖析平臺電商信用“監管困局”的內在形成機理。張子鳴等[15]對包含決策者成本-收益感知偏差下共享制造多主體決策的演化過程進行分析。呂樂琳等[16]研究了數字建造情境下重大工程交易行為監管系統中,工程發包方、工程監理方和工程承包方3個主體的策略形成及行為演化過程。雷麗彩等[17]研究了政府監管下電商平臺“殺熟”定價行為及用戶消費渠道選擇的演化博弈模型。針對外賣服務進行演化博弈分析的文獻中,部分研究聚焦于平臺監管,如互聯網訂餐監管[18]、外賣食品安全監管[19]、政府懲罰機制[20]等。此外,Liu等[21]和Zhang等[22]利用演化博弈分別對騎手物流模式以及外賣食品衛生等方面進行了分析。相比于本文,上述研究都沒有考慮配送騎手決策及其對自身交通風險、平臺和消費者效用的影響??紤]到新零售平臺、騎手與消費者之間的博弈行為也是在不斷地探索、調整各自的決策,本文沿用演化博弈模型分析三方決策的演化過程。

2 模型假設與構建

2.1 模型假設

考慮新零售平臺(例如外賣平臺)、配送騎手及消費者組成的三方演化博弈模型,且由于環境以及問題的復雜性、信息不完全性等因素的限制[13],博弈三方均為有限理性。首先,平臺是規則的制定者,在給出配送時間的情況下,一方面設定了超時與投訴發生時對騎手的懲罰,另一方面決定著對消費者的補償。騎手接單后會根據平臺給出的配送時間以及自身可能承擔的懲罰,以此來決定自己的配送行為。騎手的配送行為既決定了訂單超時的概率,同時也對其交通風險大小產生影響。消費者一方面期待自己獲得更優質的服務,希望騎手盡快送達;另一方面,消費者出于同理心[23]等因素,也不希望騎手發生交通事故。如果平臺建立主動補償機制,在訂單延誤時給予消費者一定的補償,既可以抵消消費者的部分不滿情緒,又可以幫助平臺建立良好的企業社會形象。因此,假設在配送時間和成本因素給定的背景下,平臺策略空間為{建立補償機制,不建立補償機制},并假定其選擇建立補償機制的概率為x(0≤x≤1),不建立補償機制的概率為1-x;騎手的策略空間為{高風險配送,低風險配送},騎手選擇高風險配送的概率為y(0≤y≤1),選擇低風險配送的概率為1-y;在配送超時情況下,消費者選擇是否進行投訴,因此,其策略空間是{投訴,不投訴},并假定其選擇投訴的概率為z(0≤z≤1),選擇不投訴的概率為1-z。

模型的其他相關假設及參數、符號設定如下:

(1) 當消費者支付訂單且配送成功后,平臺、騎手及消費者都會得到相應的收益或正效應,分別為pp、pq和U。若訂單配送延誤,消費者會產生負效用u2。由于消費者對平臺的滿意度影響其再次消費的意愿,故配送超時會使平臺和騎手產生延誤損失,而根據業界實踐,此時平臺會對騎手進行處罰。因此,本文假設配送超時對平臺、騎手分別產生成本cp和cq。

(2) 若騎手在配送過程中發生交通事故等問題,不僅騎手自身利益受損,平臺也會承擔部分責任。此外,消費者的同情情緒會影響其親社會行為,即當人們看到他人受難時會被困擾,故假設當騎手發生意外時,消費者也會對此產生負效用。本文假設發生交通事故時,平臺、騎手及消費者分別產生成本(負效應)rp、rq和rc。

(3) 平臺企業若建立超時補償機制,不僅可以吸引更多消費者、擴大市場需求,而且可以提升企業承擔社會責任的形象[24]。本文假設平臺建立主動補償機制,可以產生相應的固定正效益u1。

(4) 如果消費者在訂單配送超時情況下堅持投訴,平臺需要耗費資源來處理消費者投訴,則假設c s為平臺處理消費者投訴的成本。根據對業界實踐的調研,消費者投訴的情況下,平臺也會對騎手進行追加罰款等措施以彌補投訴帶來的損失。本文假設c t為消費者投訴后平臺對騎手的罰款。

(5) 在補償機制下,消費者若選擇不投訴,將得到補償c b,該補償由平臺與騎手共同承擔,θ與1-θ分別為兩者對補償金的承擔份額。此外,若消費者選擇投訴,本文假設消費者依舊可以得到φ比例的超時補償。顯然,當φ=0時,意味著平臺不愿意為選擇投訴的消費者給予補償;當φ=1時,表示即使消費者選擇投訴也會得到全部的補償金。

(6) 根據申躍等[25]的研究,消費者對服務感到不滿意而向平臺企業進行抱怨是一種很好的發泄方式,無論消費者的抱怨是否得到解決,不滿情緒的直接表達可以使其得到一定程度的釋放。因此,本文假設消費者投訴后自身可獲得正效用u t。

(7) 假設α和β分別為低風險配送下訂單超時的概率與騎手在配送過程中發生交通意外的概率,k1α和k2β為高風險配送下訂單超時的概率與騎手在配送過程中發生交通意外的概率。由于高風險配送往往意味著更短的配送時間以及更高的事故率,故假設0<k1<1,k2>1。

2.2 模型分析

根據上述假設及參數設置,可以得到在平臺建立補償機制和不建立補償機制的情況下,平臺、騎手和消費者三方的支付矩陣,如表1、2所示。

表1 平臺建立補償機制下的三方支付矩陣 (x)Tab.1 Tripartite payoff matrix under compensation mechanism(x)

表2 平臺不建立補償機制下的三方支付矩陣 (1-x)Tab.2 Tripartite payoff matrix without compensation mechanism(1-x)

支付矩陣中每一決策組合的第1~3行公式分別表示相應各方決策下平臺、騎手和消費者的期望收益(效用)。平臺不同決策的收益包括每單所得收益、超時成本、投訴成本、風險成本、超時補償以及品牌形象提升效用,騎手不同的決策相關效用包括每單所得收益、超時成本、超時補償、投訴成本和風險成本,消費者的相關效用包括每單所獲效用、超時負效用、投訴所獲效用、所獲補償以及騎手發生交通事故帶來的負效用。以平臺建立補償機制、騎手高風險配送、消費者進行投訴的情況為例,其中,平臺的利益為訂單支付成功后的收益pp減去超時概率k1α下的各項成本以及風險成本k2βrp,騎手的利益為配送完成后的收益pq減去超時情況下的各成本及風險成本k2βrq,消費者效用則由獲得服務的總效用U減去配送超時情況下選擇投訴的各項效用以及騎手發生交通意外時的負效用k2βrc表示。

3 模型分析

3.1 平臺的策略穩定性分析

通過前述支付矩陣,可以得到平臺建立補償機制的期望收益為

不建立補償機制的期望收益為

平均期望收益為

通過構建平臺策略的復制動態方程并分析其性質,可以得到平臺的穩定策略。定理1對此進行了刻畫。

定理1

(2) 當u1-αθc b[1-y(1-k1)][1-z(1-?)]<0時,平臺的演化穩定策略為x=0,即不建立補償機制。

(3) 當u1-αθc b[1-y(1-k1)][1-z(1-?)]>0時,平臺的演化穩定策略為x=1,即建立補償機制。

證明由平臺兩種決策(建立、不建立補償機制)下的收益函數可得平臺策略的復制動態方程為

一階導數為

顯然,若

則有F x(x)=0恒成立,因此,任意x取值均為穩定策略。若

則F x(x)≤0,且F'x(0)<0,F'x(1)>0,此時x=0為穩定策略;若

則F x(x)≥0,且F'x(0)>0,F'x(1)<0,此時x=1為穩定策略。證畢

根據定理1,當騎手與消費者策略滿足某一特定的平衡條件時,平臺不會改變其現有策略。當騎手與消費者策略滿足條件

時,平臺向建立補償機制演化;反之,則平臺向不建立補償機制策略演化。顯然,若建立補償機制給企業的直接效用提升u1足夠大,平臺總是傾向于建立補償機制。當u1并不是足夠大時,平臺的策略選擇受到騎手和消費者兩方策略(y,z取值)的影響。由于1-y(1-k1)>0,1-z(1-?)>0,可以看到,u1-αθc b[1-y(1-k1)][1-z(1-?)]為y、z增函數。這意味著當騎手偏向于高風險配送、消費者傾向于投訴時,平臺可能向建立補償機制演化。上述分析不僅符合企業的運作實踐,也提供了重要的管理啟示。首先,企業建立補償機制的一個重要動因就是為了在營銷上提升企業的形象,吸引更多消費者;其次,當騎手偏向于高風險配送、消費者傾向于投訴,即“騎手困境”的情況較為嚴重時,平臺有更大動機去建立補償機制。

3.2 騎手的策略穩定性分析

同樣,騎手高風險配送的期望收益可表示為

低風險配送的期望收益為

騎手的平均收益為

通過構建騎手策略的復制動態方程并分析其性質,可以得到騎手的穩定策略。定理2對此進行了刻畫。

定理2

(1) 當

所有y都為騎手的演化穩定策略。

(2) 當

y=0為騎手的演化穩定策略,即低風險配送。

(3) 當

y=1為騎手的演化穩定策略,即高風險配送。

證明由騎手兩種決策(高、低風險配送)下的收益函數可得騎手的復制動態方程,即

一階導數為

注意到α(k1-1)(1-θ)c b<0,考慮以下3種情況:

(1) 當

時,顯然,F y(y)=0。

(2) 當

(3) 當

在平臺建立補償機制的情況下,騎手需要權衡配送安全、超時補償及投訴成本,以決定自己的配送策略。定理2(1)表明,當平臺與消費者之間的策略滿足某一特定關系時,騎手不會改變其配送策略。但由于平臺和消費者的策略都在不斷地演化,因而這一特殊條件隨時都會改變。定理2(2)和2(3)表明,騎手調整其配送策略的方向取決于

的大小關系??梢钥吹?若騎手的超時直接懲罰成本cq足夠大,無論平臺、消費者的策略怎樣,騎手都會傾向于高風險配送。而當消費者投訴給騎手帶來的懲罰成本c t足夠大時,只有平臺進一步傾向于提供補償機制、消費者傾向于不投訴,騎手才會向低風險配送策略演化。上述分析揭示了騎手策略選擇的主要動因是平臺對其超時的直接懲罰成本,當懲罰成本足夠大時,平臺、消費者的其他策略選擇都難以改變“騎手困境”;當懲罰成本在一定水平下時,平臺進一步向消費者提供補償機制演化,而消費者向不投訴策略演化,才能讓騎手選擇向低風險配送策略演化。

3.3 消費者的策略穩定性分析

消費者投訴的期望收益為

不投訴的期望收益為

消費者的平均期望收益為

通過構建消費者策略的復制動態方程并分析其性質,可以得到消費者的穩定策略。定理3對此進行了刻畫。

定理3

(1) 當x=u t/[c b(1-?)]時,任意z取值都為消費者的演化穩定策略。

(2) 當x<u t/[c b(1-?)]時,消費者的演化穩定策略為z=1,即對配送超時投訴。

(3) 當x>u t/[c b(1-?)]時,消費者的演化穩定策略為z=0,即對配送超時不投訴。

證明根據消費者兩種策略下的期望收益,可以得到其復制動態方程,即

一階導數為

定理3表明,消費者的策略選擇主要取決于平臺的策略選擇。如果平臺傾向于不建立補償機制(x較小時),則消費者傾向于對配送超時投訴;如果平臺愿意建立補償機制(x較大時),消費者選擇不投訴可以獲得一些收益,則消費者傾向于選擇不投訴。騎手決策雖然不會直接影響消費者策略選擇,但是由于其影響了平臺的策略選擇,所以也會在三方博弈演化過程中間接影響消費者的策略選擇。

3.4 博弈三方演化穩定策略分析

根據前述章節博弈三方的復制動態方程,可以進一步得到三方演化博弈系統的雅可比矩陣,即

其中:

令F(x)=0,F(y)=0,F(z)=0,可以得到8個局部均衡點:E1(0,0,0),E2(0,0,1),E3(0,1,0),E4(1,0,0),E5(1,1,0),E6(1,0,1),E7(0,1,1),E8(1,1,1),其中括號內元素分別對應該均衡點中平臺、騎手及消費者三方應采取的策略(x,y,z)的取值。由Lyapunov[26]法則可知,當Jacobian 矩陣的特征值都為負數時,局部均衡點即為演化穩定策略(ESS)。計算每一個均衡點所對應的Jacobian矩陣的特征值,如表3所示。

表3 均衡點穩定性分析Tab.3 Stability analysis of equilibrium points

通過對表3的觀察分析,可以得到6種情景下演化博弈的穩定策略組合(見定理4)。

定理4

(1) 當

時,復制動態系統存在穩定點E2(0,0,1)。

(2) 當

時,復制動態系統存在穩定點E4(1,0,0)。

(3) 當

時,復制動態系統存在穩定點E5(1,1,0)。

(4) 當

時,復制動態系統存在穩定點E6(1,0,1)。

(5) 當

時,復制動態系統存在穩定點E7(0,1,1)。

(6) 當

時,復制動態系統存在穩定點E8(1,1,1)。

證明由表3 可見,8 個潛在的均衡點中,E1(0,0,0)、E1(0,1,0)所對應Jacobian 矩陣的特征值λ3實部恒為正值,這兩個點不可能為局部均衡點。對于剩余6種情況,分析相應特征值全部為負的條件,即可得到6 種穩定策略組合所需相應的條件。證畢

定理4 表明,演化博弈的穩定策略包含6 種情景:

定理4(1)對應的情景為平臺不建立補償機制,騎手低風險配送,消費者投訴(情景1)。當企業建立補償機制獲得的正效用小于超時投訴情況下給予消費者的補貼(u1<α?θc b),且騎手因加速所導致的風險成本的增加(下文均稱為風險成本差額)大于因加速所得到的超時成本、投訴成本以及補償支出之和的減少(下文均稱為超時成本差額),即α(cq+c t)(1-k1)<βrq(k2-1),企業若建立補償機制需要支出的補償較多,并且騎手高風險配送使得風險成本過高,因此,企業選擇不建立補償機制,騎手選擇低風險配送。

定理4(2)對應的情景為平臺建立補償機制,騎手低風險配送,消費者不投訴(情景2)。當企業建立補償機制獲得的正效用高于超時投訴情況下給予消費者的補貼(u1>αθc b),騎手的超時成本差額小于風險成本差額(α[cq+(1-θ)c b](1-k1)<βrq(k2-1)),且消費者投訴效用低于補償差額(不投訴時得到的補償與投訴時得到的賠償的差額),即u t<c b(1-?),平臺建立補償機制可以極大提升自身的社會形象,而騎手選擇高風險配送會導致風險成本過高,同時,消費者選擇不投訴可以獲得更多利益。

定理4(3)對應的情景為平臺建立補償機制,騎手高風險配送,消費者不投訴(情景3)。其條件u1>k1αθc b,u t<c b(1-?),意味著企業建立補償機制獲得的正效用高于超時投訴情況下給予消費者的補貼,消費者投訴效用低于補償差額;而條件

α[cq+(1-θ)c b](1-k1)>βrq(k2-1)

與定理4(2)的情景相反,騎手的超時成本差額大于風險成本差額。此時,由于平臺建立補償機制可以獲得極高的正效用,騎手需要為超時付出極高的成本,而消費者投訴獲得的效用較低,故復制動態系統存在穩定點E5(1,1,0)。通過與定理4(2)情景的比較可以看出,超時成本差額與風險成本差額的比較結果是騎手決策的關鍵因素。

定理4(4)對應的情景為平臺建立補償機制,騎手低風險配送,消費者投訴(情景4)。其條件

意味著騎手的超時成本差額小于風險成本差額,消費者投訴效用高于可獲得的補貼差額(u t>c b(1-?)),且企業建立補償機制獲得的正效用高于企業給予消費者的補貼(u1>α?θc b)。此時,建立補償機制可以極大提升平臺社會形象。同時,騎手選擇低風險配送可以獲得更好的收益,消費者投訴的效用也較高。通過與定理4(1)條件的比較可得出,企業形象提升是平臺建立補償機制的重要動力。

定理4(5)對應的情景為平臺不建立補償機制,騎手高風險配送,消費者投訴(情景5)。這一穩定策略需要的條件u1<k1αθ?c b為平臺建立補償機制獲得的正效用低于企業給予消費者的補貼,而α(cq+c t)(1-k1)>βrq(k2-1)意味著騎手的超時成本差額大于風險成本差額。此時,建立補償機制無法給平臺帶來更好的效益,而騎手選擇高風險配送的收益更高。

定理4(6)對應的情景為平臺建立補償機制,騎手高風險配送,消費者投訴(情景6)。該情況是穩定策略的條件為u1>k1αθ?c b,意味著該企業建立補償機制獲得的正效用高于企業給予消費者的補貼,

意味著騎手的超時成本差額大于風險成本差額,u t>c b(1-?)意味著消費者投訴獲得的效用高于補貼差額。此時,建立補償機制可以很好地提升平臺的正面形象,騎手選擇低風險配送會使自己的收入降低,而消費者選擇不投訴獲得的補貼相對較少。

定理4對緩解“騎手困境”提供了相應的管理啟示:

(1) 平臺不建立補償機制,當對騎手超時配送的懲罰較小時,即便更多的消費者會選擇對超時投訴,但也可以讓更多的騎手選擇低風險配送策略。

(2) 若建立補償機制可以給平臺企業帶來足夠的直接效用,且對騎手超時配送的懲罰并不是充分大的情況下,消費者對騎手的同理心較強(即投訴效用不高)時,可以達到理想狀態:平臺通過建立補償機制,促使消費者傾向于不投訴,進而使得騎手更廣泛地選擇低風險配送策略。顯然,若平臺企業、公眾都對騎手抱有更高的同理心(更低的超時懲罰以及更低的投訴比率),騎手自然會更多地選擇低風險配送策略。

(3) 即便是消費者普遍傾向于投訴,若平臺建立補償機制的直接效用足夠大,且對騎手的超時懲罰足夠小的情況下,也可以達到另一種緩解“騎手困境”的均衡:平臺建立補償機制、騎手選擇低風險配送、消費者更多地選擇投訴。

值得注意的是,在2020年“騎手困境”引發公眾關注之時,美團、餓了么等外賣平臺采取了一系列降低騎手超時配送的懲罰、喚起公眾對騎手的同理心的做法,如對歷史信用好的騎手部分訂單超時將不再實施懲罰,在結算付款頁面增加“我愿意多等5分鐘/10分鐘”的選項[27]。這與上述研究結論(2)、(3)相應證。

4 仿真分析

上述分析給出了平臺、騎手、消費者三方演化博弈模型的最終穩定策略,但是無法展示演化博弈的演化過程。為了更直觀地分析不同情景下系統演化的過程、參與者初始策略的選擇以及不同參數變動對演化穩定策略的影響,本節用MATLAB 對三方演化博弈模型進行仿真分析。仿真實驗基礎標桿的參數設置為:α=0.5,k1=0.2,u1=1,c b=10,θ=0.5,c t=10,cq=8,rq=50,β=0.3,k2=2,u t=12,?=0.1,x=0.6,y=0.7,z=0.4。初始狀態設置為(0.6,0.7,0.4)。此外,由于參數設置決定了最終的穩定策略組合,為了分析不同情景的演化過程,后續的實驗在標桿參數設置基礎上調整某些參數。

4.1 不同情景的演化過程分析

4.1.1情景1與情景5(平臺穩定策略為不建立補償機制)的演化過程 在標桿參數設置的基礎上,調整u1=0.1(平臺建立主動補償機制可獲得的正效應),c b=21(超時機制下的補償總額),且令c t分別取值10和30,此時穩定策略組合分別為情景1與情景5,決策結果為E2(0,0,1)和E7(0,1,1),即(平臺不建立補償機制,騎手低風險配送,消費者投訴)與(平臺不建立補償機制,騎手高風險配送,消費者投訴)。圖1(a)給出了兩種情景下的演化過程??梢钥闯?兩種情景下,騎手策略最初均向低風險配送策略演化。但是,在情景5中,當y即將接近于0時,驟然轉向y=1,即高風險配送決策。這是因為在騎手投訴成本c t足夠大的情況下,騎手可能考慮到配送安全,自身加速意愿并不強烈,選擇高風險配送的概率不斷降低。但是由于平臺選擇建立補償機制,而一旦超時消費者更傾向于投訴,如果騎手不加速,自身將產生過高的損失,所以騎手被迫轉向高風險配送決策。

圖1 不同情景的演化過程Fig.1 Evolution process of different scenarios

4.1.2情景2與情景3(消費者穩定策略為不投訴)的演化過程在標桿參數設置的基礎上,調整c t=16(消費者投訴對騎手的懲罰額),u t=5(消費者投訴效用),并令騎手交通風險成本rq分別取值為17.9和10,此時穩定策略組合分別對應情景2與情景3,三方決策結果為E2(1,0,0)和E5(1,1,0),即(平臺建立補償機制,騎手低風險配送,消費者不投訴)與(平臺建立補償機制,騎手高風險配送,消費者不投訴)。相應的演化過程見圖1(b)??梢钥闯?騎手最初的決策都朝著高風險配送演化。然而,在情景2中,當y接近于1時,騎手又轉向低風險配送策略。由于投訴成本c t較高,且平臺選擇建立補償機制,騎手配送一旦超時需要負擔的代價過多,所以騎手更傾向于選擇高風險配送決策。但考慮到風險成本rq太大,且消費者投訴效應u t較少,消費者決策逐漸向不投訴策略演化,緩解了騎手對訂單超時的緊張,因而又轉向低風險配送。

4.1.3情景4與情景6(消費者穩定策略為投訴)的演化過程 在標桿參數設置的基礎上,令rq分別取值10和50,符合情景6與情景4的條件,對應的穩定策略組合為E8(1,1,1)和E6(1,0,1),即(平臺建立補償機制,騎手低風險配送,消費者投訴)與(平臺建立補償機制,騎手高風險配送,消費者投訴)。相應的演化過程見圖1(c)??梢园l現,當rq=50時,y加速向y=0的方向演化;同時,z也快速向z=1的方向演化,在z=0.8 處演化速度逐漸放緩,直至z=1。這意味著,當風險成本極高時,騎手傾向于選擇低風險配送,從而導致配送超時的概率極大增加。此時,平臺向建立補償機制決策演化,消費者為了自身效用,又改為向投訴策略演化。

4.2 不同初始狀態下情景2的系統演化路徑

情景2(平臺建立補償機制,騎手低風險配送,消費者不投訴)是一個理想的均衡狀況,也是本文所研究關鍵問題所在。本節重點考慮不同初始狀態下情景2的系統演化路徑,分別假設系統初始的策略選擇狀態為(0.8,0.7,0.4)、(0.6,0.5,0.4)和(0.6,0.7,0.2),進而與基礎標桿(0.6,0.7,0.4)進行對比分析。

圖2(a)呈現了平臺初始意愿變化對系統內演化策略的影響以及各主體在兩種初始狀態下的演化路徑??梢钥闯?當初始狀態由(0.6,0.7,0.4)改為(0.8,0.7,0.4)時,系統演化策略仍穩定于(平臺建立補償機制,騎手低風險配送,消費者不投訴)。隨著平臺初始意愿x的增加,初始騎手決策向高風險配送策略演化的速度以及消費者向不投訴演化的速度均加快。當z=1時,即消費者完全選擇不投訴的情況下,騎手開始關注交通風險,逐漸傾向于以更加安全的速度進行配送。當騎手策略演化至y=1,即低風險配送時,平臺需要承擔過多的超時賠償,故平臺立即由建立補償機制策略轉為不建立補償機制。由于在訂單超時情況下,消費者沒有任何補償,故逐漸向投訴策略演化,騎手也隨之加速。騎手高風險配送且消費者必然投訴會導致平臺承擔的投訴成本與風險成本過高,所以平臺又選擇建立補償機制,而騎手與消費者的策略也逐漸改變。隨著不斷地演化,最終穩定于(平臺建立補償機制,騎手低風險配送,消費者不投訴)的狀態。

圖2 不同初始狀態對演化策略的影響Fig.2 Impact of different initial states on evolutionary strategies

圖2(b)為騎手初始意愿變化對系統內演化策略的影響以及各主體在兩種初始狀態下的演化路徑。顯然,當初始狀態由(0.6,0.7,0.4)改為(0.6,0.5,0.4)時,系統演化策略仍然不變。隨著騎手初始意愿y的降低,即騎手越發不愿冒著高風險進行配送,平臺向建立補償機制策略演化的速度降低,同時,消費者選擇不投訴的概率也略有減緩。與上述演化過程相似,最終三方策略穩定于(平臺建立補償機制,騎手低風險配送,消費者不投訴)。

消費者初始意愿對演化策略的影響見圖2(c)??梢园l現,當初始狀態由(0.6,0.7,0.4)改為(0.6,0.7,0.2)時,系統演化策略仍為理想狀態。隨著消費者初始意愿的降低,在一定階段內,平臺向建立補償機制策略演化的速度以及騎手向高風險配送演化的速度均減緩??梢园l現,在演化前期,由于消費者初始意愿的降低,系統策略在一段時間內穩定于(平臺建立補償機制,騎手高風險配送,消費者不投訴)。當消費者選擇投訴的初始意愿較低時,平臺決策向不建立補償機制演化,由于不再擔憂消費者投訴,騎手也更傾向于低風險配送。然而,當平臺不給予補貼,騎手也不加速配送,消費者的服務體驗很可能會顯著下降,轉而選擇投訴,進而促使平臺建立補償機制,騎手高風險配送。不過當平臺和消費者的決策分別穩定于建立補償機制與不投訴時,騎手便不愿再高風險配送,因而逐漸演化至低風險配送。騎手低風險配送導致超時情況過多,平臺利益受損,從而取消對消費者的補償。騎手開始提速,消費者在訂單超時也選擇投訴。當系統策略處于(平臺建立補償機制,騎手高風險配送)時,消費者的策略又開始變化,經過不斷地演化,最終穩定于(平臺建立補償機制,騎手低風險配送,消費者不投訴)。

4.3 不同參數對演化策略的影響

平臺對被消費者投訴的騎手懲罰過高,被認為是“騎手困境”的重要原因之一。此外,平臺考慮建立補償機制以及消費者是否接受補償,很大程度上取決于補償額度的大小?;谶@些原因,本節重點分析騎手投訴成本、補償額度對于三方策略演化的影響。

4.3.1騎手投訴成本對演化策略的影響 圖3(a)顯示了騎手投訴成本c t對演化策略的影響。隨著c t的增加,騎手逐漸傾向于高風險配送。在騎手投訴成本c t足夠大的情況下,騎手可能考慮到配送安全,選擇高風險配送的概率不斷降低,說明騎手本身加速意愿并不強烈。但是由于平臺選擇了建立補償機制,而一旦超時消費者必然選擇投訴,如果騎手不加速,自身將產生過高的損失,所以騎手被迫轉向高風險配送決策。同時,當騎手投訴成本c t不斷增加,消費者決策向“投訴”策略演化的速度逐漸減緩,即當消費者知道騎手被投訴后的懲罰過高時,出于對騎手的關懷等原因,消費者投訴的概率逐漸降低。

圖3 投訴成本、補償額對演化策略的影響Fig.3 Impact of complaint costs and compensation value on evolutionary strategies

4.3.2補償總額對演化策略的影響 圖3(b)顯示了補償總額c b對演化策略的影響??梢钥闯?隨著c b的增加,消費者投訴的意愿和平臺建立機制的意愿越來越弱,而騎手選擇高風險配送的概率逐漸升高。當c b=5時,平臺雖然建立了主動補償機制,但是由于賠償額度較低,消費者面對配送超時的情況,仍然有極大的可能選擇投訴;當c b=30時,由于賠償金額較大,消費者傾向于不投訴,但是平臺不愿建立補償機制,導致消費者的投訴意愿再次提升。因此,為了達到平臺建立補償機制、騎手低風險配送、消費者不投訴的理想狀態,c b的取值應當在適當的范圍之內。

5 結論

本文通過構建平臺、騎手、消費者三方演化博弈模型,分析各方策略選擇的穩定性以及一些因素對各方演化策略的影響,并對此進行數值仿真。得出以下結論及管理啟示:

(1) 影響平臺是否選擇建立補償機制的重要動因是通過建立補償機制給企業帶來的直接效用,如品牌競爭力的提升、市場份額的擴大。

(2) 一定條件下,當消費者向投訴策略演化、騎手向高風險配送策略演化時,平臺企業向建立超時補償機制策略演化。

(3) 影響騎手的策略最關鍵的影響因素是平臺對于騎手超時的直接懲罰額度。當懲罰額度較大時,平臺、消費者的任何策略選擇都無法改變騎手普遍向高風險配送策略演化的“騎手困境”情況。

(4) 當建立補償機制給企業帶來的直接效用較大且對騎手超時的直接懲罰額度較小時,三方演化策略均衡可能達到理想狀態:平臺建立主動補償機制、騎手低風險配送、消費者對于訂單超時選擇不投訴。

本文有幾個潛在的拓展研究方向。首先,本文基于演化博弈模型分析,以揭示三方決策背后的機制與動因為主,未來可以通過問卷、訪談等實證研究方法進一步研究影響三方決策的其他因素;其次,本文主要從平臺、騎手、消費者三方角度出發,沒有考慮到政府這一政策制定者及監管者角色在配送服務供應鏈中的作用與責任,引入政府監管決策可以作為下一步的研究方向;最后,不同行業產品(例如食品、工業品、綠色農產品等)配送有各自不同的特點,未來進一步研究可以結合具體的行業特色。

猜你喜歡
高風險騎手效用
騎手和星星
上海市高風險移動放射源在線監控系統設計及應用
上班在“狂奔”,保障似“裸奔”——“搶單”的騎手們常常要面對“拖單”的社保
睿岐喘咳靈治療高風險慢性阻塞性肺疾病臨證經驗
小學美術課堂板書的四種效用
暑期近萬名大學生兼職送外賣
女騎手
納米硫酸鋇及其對聚合物的改性效用
高風險英語考試作文評分員社會心理因素研究
幾種常見葉面肥在大蒜田效用試驗
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合