?

“一帶一路”下中國企業戰略聯盟信任機制設計

2017-03-03 18:05潘水洋黃昊
現代管理科學 2017年3期
關鍵詞:戰略聯盟博弈論一帶一路

潘水洋++黃昊

摘要:“一帶一路”戰略背景下,中國企業紛紛組建企業戰略聯盟共同開拓國際市場,戰略聯盟的存在是以內部企業相互信任為基礎,合理的機制設計將保證戰略聯盟的穩定與持久。文章采用演化博弈論對戰略聯盟中各個企業的行為建模,研究了聯盟內部采取合作策略企業數量與采取投機策略企業數量的動態演化過程。結果表明:采用合理的懲罰機制,戰略聯盟中采取投機策略行為的企業數目維持將較低比例,戰略聯盟主要成員將會采取合作策略實現共贏,有利于維持戰略聯盟的穩定與持久。

關鍵詞:一帶一路;戰略聯盟;博弈論;多主體

一、 引言

國家級頂層戰略“一帶一路”通過積極發展與沿線國家的經濟合作伙伴關系,共同打造政治互信、經濟融合、文化包容的利益共同體、命運共同體和責任共同體。徐梁(2016)文獻數據表明截止2015年底,我國企業共對“一帶一路”相關的49個國家進行了直接投資,投資額同比增長18.2%。2015年,我國承接“一帶一路”相關國家服務外包合同金額178.3億美元,執行金額121.5億美元,同比分別增長42.6%和23.45%。在“一帶一路”戰略引導下,國內有實力的企業面臨著必須走出去進行全球化經營的挑戰,如何更加安全、有效地實施跨國經營戰略是每一個計劃在海外進行投資的企業所必須解決的課題??茖W技術發展導致社會分工越來越細,單個國內企業在競爭激烈的國際市場將面臨眾多挑戰。為應對復雜的國際市場,國內企業通過組建戰略聯盟,在優勢互補、利益共享的前提下共同開拓國際市場,這種戰略聯盟已經成為國內企業對外投資戰略的一種常見模式(楊震寧,2016)。對于戰略聯盟的定義,李欣(2004)指出戰略聯盟是由兩個或兩個以上有著相同實力或者互補優勢的企業共同組建而成。通過建立戰略聯盟,聯盟內部企業能夠形成利益共同體,達到共同開拓國際市場、共擔經營風險、降低企業成本、提升競爭實力的目的。然而不論企業采用何種形式的協議組建戰略聯盟,企業戰略聯盟仍然只是一個松散型合作競爭組織,并沒有一個中央集權的管理機構去控制聯盟內部成員的自私逐利行為,一旦聯盟內部大部份企業采取短期投機行為互相欺騙時,戰略聯盟將會瓦解。因此聯盟內部成員相互信任是戰略聯盟存在的基礎。

當聯盟內部企業存在投機行為導致彼此不信任時,最終會導致聯盟瓦解。內部企業的不信任導致聯盟存在的壽命非常短暫。何靜(2002)調查研究表明,聯盟的壽命周期平均值為7年左右。如何設計合理的激勵制度,使得聯盟內部企業能夠建立長久的信任關系,進而提高聯盟的生存周期成為戰略聯盟機制設計這一領域的研究重點,有不少學者對此進行了系統的研究。范琳琳(2016)、王丹(2003)等提出對合作伙伴的信譽、風險偏好、行為進行評級,選擇評級較高的企業作為合作對象;馬永遠(2014)、昊海濱(2004)指出聯盟應當建立一套約束機制,防止欺騙和機會主義行為產生;魏光興(2003)、江旭(2014)提出可以通過構建企業緩沖池,當約束機制無法制裁投機行為時,強制投機企業退出聯盟,從企業緩沖池中選擇新的企業加入,這樣便降低了企業退出對聯盟造成的損失成本。本文從演化博弈論的視角出發,通過對戰略聯盟中各個企業的行為特征進行建模,采用孫建(2004)、楊敏(2013)文獻涉及的主體仿真建模軟件Swarm來研究企業戰略聯盟內在結構的動態演化過程。研究結果表明:采用合理的懲罰機制,戰略聯盟中采取投機策略行為的企業數目維持將較低比例,戰略聯盟主要成員將會采取合作策略實現共贏,有利于維持戰略聯盟的穩定與持久。研究結果對如何通過合理的懲罰機制設計保持戰略聯盟的長久性提供了一個新的思考角度。

二、 演化博弈模型構建

戰略聯盟是由相互作用、相互影響的多個個體企業所組成的進化系統。在戰略聯盟中不存在集中控制,企業成員僅僅關注自身的利益;企業成員個體行為是有限理性的;企業成員之間、企業成員與聯盟制度環境之間存在相互作用相互影響的非線性關系;為了適應環境,企業成員個體能夠通過實踐學習并實時調整自己的行為,使得自己的利益最大化。因此戰略聯盟內在結構的動態演化過程是微觀個體相互作用的結果。在本部分,我們采用演化博弈論對此過程進行建模分析。

1. 戰略聯盟內部企業策略行為描述。假設在一個企業戰略聯盟中,存在4種類型成員企業,這4類企業具有如下行為特征。(1)采取TFT策略的企業。采取TFT策略的企業具有以下特征:如果該企業觀測到聯盟其它企業在上一期采取合作,遵從聯盟規則,則該企業在本期也采取合作,遵守聯盟規則。如果該企業觀測到聯盟其它企業在上一期采取不合作,則該企業在本期也采取不合作,不再遵守聯盟規則。(2)采取ATFT策略的企業。采取ATFT策略的企業具有以下特征:如果該企業觀測到聯盟其它企業在上一期采用合作,則該企業在本期采用不合作;如果聯盟其它企業在上一期采用不合作,則該企業在本期采用合作。(3)采取用ALL_C策略的企業。采取ALL_C策略的企業具有以下特征:不管其它聯盟成員是否合作,該企業均采用完全合作策略,始終遵從聯盟規則。(4)采取用ALL_D策略的企業。采取ALL_D策略的企業具有以下特征:不管其它聯盟成員是否合作,均采用完全不合作策略,始終不遵守聯盟規則。

上述4個策略保存著博弈的一步記憶。由于聯盟中沒有集權的中央管理機構,所有的參與企業不可能都選擇ALL_C策略。任何聯盟規范的實施都依賴于聯盟成員的自覺參與,聯盟內部的每一個企業都基于自身利益以一定的概率選擇這4個策略的某一個作為初始策略。

兩個企業之間的博弈收益矩陣如表l所示。如果兩個企業都采取合作策略(用C表示合作),則每個企業都可獲得3單位的收益;如果一個企業采取合作策略,另一個企業采取不合作策略(用D表示不合作),則采取合作策略企業得到0單位收益,采取不合作策略企業得到5單位收益;如果雙方都采取不合作策略,則每個企業各獲得1單位收益。

2. 企業進化學習行為描述。表1只展示了兩個企業相互之間的一次博弈關系,顯然完全信息條件下表1的均衡是(不合作,不合作)。若對表1的博弈結構進行多次重復博弈,并且每次博弈結束后,企業通過比較自己與博弈對手的收益,動態更新策略,實現收益最大化。企業策略動態更新過程如下:初始階段,企業i在4類策略TFT、ATFT、ALL_C、ALL_D中隨機選取一個策略開始博弈。企業i與其它企業博弈結束后,該企業會從所有的博弈對手中,找出獲得最高盈利的企業j。如果企業j的盈利大于企業i的盈利,那么企業i會將企業j的策略作為自己的新策略,實現策略更新。這個假設也是合理的,因為現實中的企業都是活生生的實體,它能夠不斷的學習和積累經驗最大化自己的利益,與現實生活中的決策機制是一致的。

3. 博弈過程中的懲罰機制。模型中,聯盟的信息足夠完全,以至于聯盟成員能夠順利監督另一個成員。這個假設是合理的。一旦某個企業采取不合作策略,則與該企業博弈時,采取合作策略的對手將會產生損失,對手馬上會把不合作的企業報告給聯盟。聯盟既可能懲罰不合作者,也可能不采取懲罰措施(采取懲罰措施,聯盟自己也會產生損失)。本模型中,懲罰采用“驅逐機制”,一旦聯盟決定懲罰不合作企業,不合作企業將會被驅逐出聯盟,并且在相當一段時間內聯盟將不再接受該成員企業。

三、 模型仿真

為了研究企業戰略聯盟內在結構的動態演化過程,我們采用Swarm主體仿真建模軟件對本文所描述的企業戰略聯盟進行仿真。建模過程如下:步驟1:定義環境,即設定企業的位置。本模型在40*40的方格上產生1 600個聯盟企業成員。步驟2:博弈進行前,每個聯盟成員按照一定的概率預先在設定的4種策略中隨機選擇一個策略。然后該企業與處于自己東南西北四個毗鄰位置的企業分別進行三階段重復博弈。步驟3:每個企業與所有的鄰居企業博弈結束后,找出獲得最高盈利的鄰居,如果該鄰居的盈利大于自己原有策略獲得的收益,該企業便將鄰居的策略作為自己的新策略,實現策略更新。步驟4:不斷重復步驟3,直到聯盟中4類策略企業數量保持穩定。

1. 不采取懲罰機制下的企業戰略聯盟結構演化。不采取懲罰機制條件下,無論企業是否合作,都不會受到聯盟懲罰。博弈開始前,每個聯盟成員按照相等的概率預先在設定的4種策略中隨機選擇一個策略。隨著重復博弈次數的增加,采取ALL_C、ATFT、TFT策略的企業將會發現他們在博弈中收益不如采取ALL_D策略的企業收益,于是他們要動態更新自己策略,選取ALL_D策略最大化自己收益。當重復博弈進行到第4輪時,采取ALL_D策略的企業數目達到最大,緊張接著隨著博弈的繼續進行,采取ALL_D策略企業逐漸減少,采取TFT策略的企業逐漸增多,博弈進行到第15輪時,產生均衡,全部企業采用TFT策略,此時戰略聯盟瓦解,因為采取ALL_C策略的企業數為0,每個企業將根據對手的策略進行決策,如果對手合作,則企業采取合作,對手不合作,企業也采取不合作策略,戰略聯盟協議約束無效,聯盟瓦解。以上是初始階段采取4類策略的企業比例相等(采取每個策略的企業數目相等)時的結果,模型仿真結果如圖1所示。如果改變初始階段采取4類策略的企業比例,如選擇ALL_C、TFT、ATFT、ALL_D策略的企業占比分別為30%,10%,30%,30%時,博弈最終也將在TFT策略獲得均衡。但達到均衡時將花費更多的時間和進行更多次的重復博弈。這表明:即使初始階段采用TFT策略的企業比例(10%)遠低于選擇其它策略的企業比例,重復博弈次數的增加也能促使TFT策略成為最終的博弈均衡策略,模型仿真結果如圖2所示。

TFT策略之所以會成為最終均衡的結果,可能的原因如下:當對手采取合作時,這時采取TFT策略的人也會選擇合作,這樣采取TFT策略的聯盟成員偽裝成了合作者;當對手采取不合作時,這時采取TFT策略的人也會選擇不合作,由于彼此之間均采取不合作策略,他們會保持一種默契,都不會向聯盟報告對方不遵守聯盟契約的行為,這樣聯盟被這種采取TFT策略并偽裝成合作者的企業控制,聯盟實際上已經瓦解。

2. 采取懲罰機制下的企業戰略聯盟結構演化。與上一節類似,初始時每個聯盟成員按照相等的概率預先在設定的4種策略中隨機選擇一個策略。不同之處在于:一旦某個企業采取不合作策略,則在下一輪的博弈中不合作企業將會被驅逐出聯盟。聯盟對不合作企業采取終身禁入準則,聯盟其他成員不會與這個企業采取任何貿易往來,這種大的懲罰力度有可能導致不合作企業破產。此后聯盟會引入一個新的企業加入,以維持聯盟的企業數量不變。懲罰的威懾力將導致新進入的企業采取ALL_C策略。仿真結果表明經過5輪博弈,最終達到均衡,均衡結果為采取ALL_C策略的企業數為1 590,采取TFT策略的企業數為10個,采取其他策略的企業個數為0。最終的均衡仍然存在采取TFT策略的投機者,可能的原因是由于采取了嚴厲的懲罰機制,采取TFT策略的聯盟成員在接受其它企業監督后,意識到聯盟內部存在大量采取ALL_C策略的企業成員,一旦其采取不合作策略,其投機行為被發現的概率大大增加,于是采取TFT策略的投機者偽裝成了合作者,模型仿真結果如圖3所示。

四、 結論與政策建議

本文通過對戰略聯盟中各個企業的行為進行建模,采用重復博弈理論研究在不同的懲罰機制約束下,企業戰略聯盟結構是如何動態演化的,為一帶一路戰略下我國企業戰略聯盟的機制設計提供了有意義的參考:(1)當不采取懲罰機制時,企業戰略聯盟最終會演化成采取TFT策略的投機企業控制的聯盟。原因在于采取TFT策略的聯盟成員偽裝成了合作者;當TFT策略投機者與對手均采取不合作策略時,他們會保持一種默契,都不會向聯盟報告對方不遵守聯盟契約的行為,這樣聯盟被這種采取TFT策略并偽裝成合作者的企業控制。(2)當聯盟對不合作企業采取終身禁入準則,實行嚴厲的懲罰,使不合作企業產生破產預期時,企業戰略聯盟最終會演化成大部分企業采取ALL_C策略,剩下小部分企業采取TFT策略,由于不存在其他策略,大量采用ALL_C策略的企業將迫使采取TFT投機策略的小部分企業永遠偽裝成合作者。聯盟將持續較長時間。(3)一帶一路戰略背景下,國內企業形成戰略聯盟共同開拓國際市場時,應當設計合理的懲罰機制來約束聯盟內部企業短期投機行為,防止聯盟名存實亡。如果懲罰過于嚴厲,將短期投機行為企業終生剔除聯盟,也會導致聯盟自身損失;如果懲罰過輕,將加大聯盟瓦解的概率。一個可行的辦法是構建企業緩沖池,強制短期投機行為企業退出聯盟,從企業緩沖池中選擇新的企業加入,這樣便降低了企業退出對聯盟造成的損失成本。

參考文獻:

[1] 徐梁.基于中國與“一帶一路”國家比較優勢的動態分析[J].管理世界,2016,(2):170-173.

[2] 馬永遠,江旭.戰略聯盟伙伴間特征與聯盟管理實踐轉移[J].管理科學,2014,(5):1-11.

[3] 楊震寧,李東紅,曾麗華.跨國技術戰略聯盟合作、動機與聯盟穩定:跨案例研究[J].經濟管理,2016,(7):48-59.

[4] 李欽.戰略聯盟的形成及其演變[J].現代管理科學,2004,(2):62-64.

[5] 江旭,姜飛飛.企業家導向與戰略聯盟形成決策:聯盟經驗的調節效應研究[J].管理科學學報,2014,(7):22-34.

基金項目:國家社科基金重大項目“改革開放以來我國經濟增長理論與實踐研究”(項目號:15ZDA007)。

作者簡介:潘水洋(1986-),男,漢族,湖南省岳陽市人,北京大學經濟學院博士生,研究方向為計算演化博弈論與機制設計;黃昊(1985-),男,漢族,湖南省永州市人,北京大學經濟學院博士生,研究方向為區域經濟與產業結構。

收稿日期:2017-01-16。

猜你喜歡
戰略聯盟博弈論一帶一路
PBL教學法在博弈論與信息經濟學課程改革中的應用初探
博弈論下電動汽車充電站的產量規劃模型
博弈論下電動汽車充電站的產量規劃模型
基于博弈論視角的山陜商人合作分析
基于博弈論視角的山陜商人合作分析
產業創新戰略聯盟伙伴競爭與合作關系研究
電子商務供應鏈集成與戰略聯盟采購模式運行研究
戰略聯盟中環境不確定性與關系風險分析
集成化供應鏈管理環境下戰略性合作伙伴關系研究
評博弈論在反壟斷中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合