?

第三方懲罰行為的認知神經機制

2024-02-18 16:28鄭好陳榮榮買曉琴
心理科學進展 2024年2期

鄭好 陳榮榮 買曉琴

摘? 要? 第三方懲罰(third-party punishment, TPP)指個體作為第三方或者觀察者為維護社會規范對違規者所實施的懲罰行為。大量研究為揭示TPP行為的神經機制提供了啟示, 但鮮有研究關注不同功能性腦網絡在其中發揮的整體作用。本文綜述了近10年來TPP相關的研究, 對相關理論模型和腦網絡進行總結, 并在此基礎上提出TPP的認知神經網絡模型, 系統地對TPP行為背后的神經機制進行解釋和整合。在該模型中, 情緒系統和獎賞系統是TPP的動力來源, 認知系統主要負責責任評估以及懲罰的選擇; 獎賞網絡、突顯網絡、默認模式網絡和中央執行網絡分別參與不同認知加工階段。該模型建立了TPP相關研究在心理層面和認知神經層面上的聯系, 對TPP行為的發生和發展機制進行了更加整體、全面的解釋。未來可以引入元分析或基于機器學習的分析方法, 在不同的背景信息和更加復雜的社交情境下探討第三方干預偏好以及背后的認知神經機制。

關鍵詞? 第三方懲罰, 認知神經機制, 腦網絡, fMRI

分類號 ?B845; B849: C91

1? 前言

社會規范的建立與執行是人類區別于其他動物的顯著特征之一(K?ster et al., 2022), 但日常生活中違規行為仍然普遍存在。增加制度約束可以提高人們遵守規范的可能性(Fehr & Schurtenberger, 2018)。社會懲罰是一種常見的道德和制度約束行為(Fehr & Fischbacher, 2004b), 分為第二方懲罰和第三方懲罰(third-party punishment, TPP)。不同于“以惡制惡、以牙還牙”的第二方懲罰行為, TPP指個體作為第三方或者觀察者為維護社會規范對違規者所實施的懲罰行為(Fehr & Fischbacher, 2004a; Kanakogi et al., 2022)。一般而言, 這種懲罰不會給個體帶來直接利益, 且需要付出一定代價, 因此常被看作一種利他懲罰(Fehr & Fischbacher, 2003)。TPP約束和規范了人類行為, 進一步維系并促進了社會公平和社會合作, 因而受到研究者們廣泛的關注(Fehr & G?chter, 2002; Kim et al., 2021; Martin et al., 2021; Yang et al., 2022)。

上個世紀以來, 人們針對經濟決策與分配行為開展了大量研究。行為經濟學家最早在最后通牒博弈任務(Ultimatum Game, UG)中發現了利他懲罰(Thaler, 1988)。在該任務中存在提議者和響應者兩方, 他們需要就一定數量的資金如何分配達成一致。首先由提議者提出分配方案, 若響應者接受提議者提出的分配方案, 則兩人按照這一方式進行分配, 反之, 兩人都不能獲得任何資金。在這種情況下, 拒絕可以看作是響應者對提議者的有代價的第二方懲罰。然而, 在現實世界中, 第二方往往是被動接受的角色。并且, 如果僅存在第二方懲罰, 能夠維護的社會規范數量有限, 因此, 引入第三方懲罰能夠擴大懲罰違規者的比例, 更好地維護社會規范。以Fehr為代表的學者在實驗室條件下證明了第三方懲罰的存在。Fehr和Fischbacher (2004a)在獨裁者博弈任務(Dictator Game, DG)中引入第三方, DG與UG的區別在于響應者不能拒絕獨裁者(提議者)提出的分配方法, 只能被動地接受, 作為第三方觀察者的被試在看到獨裁者的分配方案后, 可以通過付出一定代價(減少自己的錢數)來懲罰獨裁者。隨后, 該范式成為TPP的重要研究方法之一, 為在實驗室條件下研究社會規范行為提供了一種新的思路。研究者在該范式基礎上操縱獨裁者和響應者的社會地位(Cui et al., 2019; Ouyang et al., 2021)、分配不公平的程度(Sun et al., 2015)、懲罰代價的高低(Cheng et al., 2022)以及第三方個體與任務雙方之間的社會距離和群體關系(Bernhard et al., 2006; Liu et al., 2018)等變量來進一步探究TPP行為是否受到社交情境或背景信息的影響。除了DG, 常用在TPP研究中的范式還包括公共物品博弈(Zhou et al., 2017; 唐捷 等, 2022)、信任博弈(Konishi & Ohtsubo, 2015)、囚徒困境(Lergetporer et al., 2014)、正義游戲(Civai et al., 2019)和芝加哥道德敏感任務(Kim et al., 2021; Meidenbauer et al., 2018)等, 通常研究者關注第三方是否會對違規行為作出干預以及哪些因素會影響這種干預行為。

隨著研究的深入, 研究者開始從電生理和功能成像層面的證據推測TPP行為背后的認知神經機制。但是由于研究方法的局限性, 這些證據大多局限于某單一成分或者僅僅關注獨立腦區激活的結果。并且, 目前尚未形成對TPP行為背后認知過程與腦功能網絡之間聯系的整體認識。因此, 本文對近10年來與TPP相關的研究進行梳理。首先進行文獻檢索。英文文獻檢索使用Web of Science、PubMed、ScienceDirect數據庫, TPP的關鍵詞為“third-party punishment”或“altruistic punishment”或“social punishment”, 認知神經機制的關鍵詞為“cognitive”或“neural bias”或“neural correlates”或“neuroimaging”或“fMRI”。中文文獻檢索使用知網、萬方、維普數據庫, TPP的關鍵詞為“第三方懲罰”或“利他懲罰”或“社會懲罰”, 認知神經機制的關鍵詞為“認知”或“神經機制”或“神經基礎”或“腦成像”。同時, 在閱讀文后參考文獻時利用滾雪球的方法檢索文獻進行查漏補缺。截止2023年4月, 共檢索到文獻1149篇, 文獻檢索的時間范圍為2013年4月到2023年4月。經初篩、審查等階段后, 最終納入文獻數量為60, 其中涉及神經機制的文獻39篇。文獻納入與排除標準及PRISMA流程圖見網絡版附錄圖S1。在總結前人研究的基礎上, 本文首先介紹TPP行為相關的理論模型, 從理論層面對TPP行為進行解讀; 其次, 總結參與TPP行為的腦網絡相關證據, 尤其關注腦區之間的協同作用; 最后, 基于已有的理論和研究構建TPP的認知神經網絡模型, 為理解TPP行為提供一個新的動態視角。

2? 第三方懲罰相關理論模型

TPP作為一種復雜的利他行為, 揭示背后的認知機制能夠更好地理解其發生和發展規律。前人研究發現情緒、認知控制以及情境等因素會對TPP行為產生影響。然而, 目前對TPP理論層面的認識仍有不足, 大多數研究結果的解釋以社會價值決策相關的理論模型為基礎。因此, 我們首先對能夠解釋TPP行為的理論進行總結, 以形成對TPP行為理論層面的理解。這些理論模型包括反映個體合作與公平偏好的互惠模型、直覺式加工的情緒模型以及在強化學習視角下, 將情緒和認知因素融合起來的雙系統模型。

2.1? 互惠模型

“你幫助我, 我幫助你”, 互惠指以一種類似的方式回報他人的行為, 對促進人類合作具有重要意義(Guala, 2012)。TPP行為的產生包含兩種互惠原則:弱互惠和強互惠(Fehr & Fischbacher, 2003)。在TPP中, 弱互惠一般指間接互惠, 個體將TPP這一高成本利他行為作為一個“可信”的信號來向他人暗示自己擁有公平公正的高尚品質, 藉此在群體中建立聲譽, 以便于在今后的人際交往中獲得更多的機會和合作, 進而實現間接獲益(Jordan, Hoffman, et al., 2016; Rai, 2022)。與期望獲益的弱互惠不同, 強互惠認為個體是出于維護公平的動機來懲罰不公平的行為(Ciaramidaro et al., 2018), 即使實施懲罰需要付出代價, 且這些代價不一定能夠得到補償。強互惠者的存在保證了群體利益, 也使得人和人之間的廣泛合作成為可能, 符合進化原則(Buckholtz & Marois, 2012)。

互惠模型從宏觀的視角解釋了TPP的發生機制, 指出個體是在基于合作與公平的情況下做出的懲罰行為。然而, 該模型也有不足之處。首先, 間接互惠強調個體第三方懲罰的目的是獲取間接利益。在單試次或者匿名情況下, 由于個體幾乎不存在未來的合作機會, 或者無法辨識身份, 因此并不存在聲譽動機。以往研究揭示即使在這種情況下, 個體依舊會執行TPP, 并且發生概率高于1/2。例如, Piazza和Bering (2008)發現在第三方完全匿名的條件下, 71.4%的參與者選擇犧牲1/3的資金去懲罰違規者; Feng等人(2022)也發現在單次匿名實驗中個體的平均懲罰率大于50%。國內研究者楊莎莎和陳思靜(2022)同樣發現在單次匿名博弈中不懲罰或低懲罰的情況并不常見(3.15%)。此外, 最近的研究發現即使是未涉足社會的僅8個月大的嬰兒就已經能夠使用目光來懲罰違規者(Kanakogi et al., 2022)。以上研究發現都無法用間接互惠來解釋。其次, 強互惠沒有考慮到懲罰所帶來的報復性行為, 這并不利于群體的發展和穩定。最后, 強互惠懲罰是一種自愿的懲罰行為, 其強度對懲罰成本十分敏感。若懲罰成本過高, 第三方作為利益無關者在理性的考慮下對需要自己承擔成本來實施懲罰的需求便會降低??梢?, 僅從公平、合作的互惠角度來理解TPP行為存在一定的局限性。

2.2? 情緒模型

“情感即信息”模型(affect-as-information)指出, 情感是一種簡化判斷的啟發式工具, 可以作為決策過程中的信息來源指導決策(Bright & Goodman- Delahunty, 2006), 進而影響個體的后續決策(Zhao et al., 2022)。負性情緒產生是TPP的動機來源之一(Fehr & Fischbacher, 2004a; Fehr & G?chter, 2002; Xiao & Houser, 2005)。個體觀察到違規行為發生時會產生一系列的負性情緒, 包括對違規者的憤怒(Jordan, McAuliffe, & Rand, 2016)以及對自私意圖(McAuliffe et al., 2015)和不公平(Raihani & McAuliffe, 2012; Sun et al., 2015)的厭惡。此時個體的初衷可能是想通過懲罰違規者的方式來緩解自己的負性情緒, 而維護社會規范只是一種“額外獲益” (de Quervain et al., 2004)。

但也有研究學者發現, 負性情緒并不一定導致懲罰行為。例如, Qu等人(2014)采用第三方懲罰的DG任務發現, 在負性情緒與懲罰成本導致的經濟損失沖突之下, 個體選擇“不懲罰”的情況也會發生。另外, 在個體情緒激活相同的情況下, 懲罰程度仍然存在差異。研究發現, 即使個體對分配不公平程度的感知相同, 即不公平厭惡程度相同, 最終的懲罰程度還是會因懲罰成本的不同而發生改變(Cheng et al., 2022)。以上研究表明, 情緒可能影響了反應判斷的某個階段, 最終的懲罰決策是結合各方面因素綜合考量的結果, 包括情緒、公平和自利的權衡。

2.3? 強化學習視角下的雙系統模型

強化學習(reinforcement learning, RL)指個體通過接收環境的反饋信息進行學習并不斷調整行為策略, 是一種獎勵學習的方法(K?ster et al., 2022; Morris et al., 2017)。雙系統理論認為, 社會決策受到自動加工和控制加工兩個系統的影響(Chung et al., 2023)。前者屬于自下而上的啟發式加工過程, 負性情緒的產生促使懲罰成為自動化優勢反應(Mussel et al., 2018), 對應著RL中無模型(model-free, MF)的策略; 后者屬于自上而下的加工, 個體會在理性、經驗的引導下選擇最優的行為方式(Zhou et al., 2014), 對應著RL中基于模型(model-based, MB)的策略。以往研究表明, 個體的最終決策屬于雙系統之間的動態平衡(張慧 等, 2018)。其中, MF以直覺沖動的方式(最少成本)進行決策, 同時又會受到MB的影響和控制, 體現了個體在不同系統的互動中探索適應性的行為(Gershman et al., 2014; Lee et al., 2014)。

在TPP中, 當違規行為發生時, 個體的自動化情感評價激活了懲罰行為, 體現了情緒對懲罰的驅動(Qu et al., 2014); 當直覺反應和經濟利益產生沖突時, MB對MF進行認知控制, 最終的懲罰決定是個體“深思熟慮”后的結果(殷西樂 等, 2019)。懲罰行為發生后, 其帶來的滿足感和權力的體驗感(Delgado et al., 2003; Strobel et al., 2011; Yamagishi et al., 2017)幫助個體建立了較高的自尊水平, 并聯合負性情緒的消解以及對未來回報的期待共同作為獎勵信號進行內部強化, 促使個體做出下一次懲罰行為。

該模型將傳統的雙系統理論以強化學習的視角展現出來, 從一個全新的角度探討了TPP行為的發生和發展過程。具體來說, 該模型不僅將情緒和認知因素結合起來, 還指出TPP應是一個有反饋和強化參與的動態過程, 個體會在每一次的反饋中進行學習, 最終形成穩定的行為模式。然而, 該模型并未涉及個體對違規行為原因的推測。有研究指出, 對非故意違規者的意圖評估可能會抑制杏仁核的活動, 減少因情緒沖動產生的懲罰(Treadway et al., 2014)。這啟示我們未來在利用該模型對TPP行為的產生機制進行解釋時, 還應考慮對違規者心理狀態的評估這一重要因素。

以上理論模型從不同的角度闡述了TPP行為產生的機制。然而, 現有理論模型對TPP行為的解釋存在一定的局限性。越來越多的研究者將TPP看作一個有反饋參與的動態性過程。所謂動態性, 指需要滿足多系統性和時間性兩個特征(Kozlowski & Ilgen, 2006)。TPP作為一種復雜的社會行為, 其產生可能是個體情緒、認知和獎賞等多個系統交互作用的結果, 符合多系統性; 另外, 獎賞反饋的存在使得個體可以在每一次強化中對TPP行為進行調整, 事件相關電位(event-related potential, ERP)研究也發現在不同的階段會有不同的腦電成分出現, 如分別在刺激后200~350 ms和300~ 900?ms左右達到峰值的內側額葉負波(medial frontal negativity, MFN)和晚期正成分(late positive component, LPC), 其波幅大小與后續的懲罰程度相關(Cui et al., 2019; Qu et al., 2014), 符合時間性的特征。

早在2011年, Strobel等人就提出了在強互惠行為背后, 認知?情感?動機網絡作為利他懲罰驅動力的觀點, 但由于在實驗中缺乏情緒評分, 無法直接得出到底是哪種情緒影響了TPP行為的結論; 隨后, Buckholtz和Marois (2012)指出TPP的成功執行需要責任評估和懲罰選擇兩個獨立認知機制的支撐, 一定程度上將認知與行為決策結合起來, 但沒有納入情緒因素的影響。目前, 許多研究致力于證明情感和認知塑造了人類的親社會行為, 但對決策的具體過程以及情緒和認知相互作用的機制仍不了解(Rahal & Fiedler, 2022), 且相關研究證據分布零散, 缺乏整體認識。借助神經層面上的證據有助于對決策者做出決定時的復雜認知和情感過程進行更細致的理解。因此, 我們回顧與TPP相關的功能神經成像和電生理相關的證據, 尤其關注腦網絡內部和腦網絡之間的聯系, 為理解TPP行為奠定神經層面的基礎。

3? 參與第三方懲罰的腦網絡

以往研究表明TPP包含情緒產生、意圖和傷害程度評估以及選擇懲罰階段。結合前人研究中相關腦網絡的功能與激活模式(Bellucci et al., 2020; Krueger & Hoffman, 2016; Lo Gerfo et al., 2019), 本文認為TPP行為的產生分為“情緒產生”、“責任評估”和“懲罰選擇”三個階段, 與之相對應的腦網絡為突顯網絡(salient network)、默認模式網絡(default mode network)和中央執行網絡(central executive network)。此外, 獎賞網絡協作TPP加工過程, 主要起價值表征、預期獎賞的作用。相關腦網絡所包含的腦區及其位置見圖1。

3.1? 突顯網絡

公平是一種默認的社會規范(Civai, 2013), 當違規行為發生時, 個體會產生憤怒、不公平厭惡等負性情緒, 這種憤怒和厭惡屬于以他人為中心的道德情緒(Pedersen et al., 2018)。此外, 當個體預期自己應當懲罰違規者以維護正義卻沒有這樣做時, 會產生以自我為中心的內疚感(Nelissen & Zeelenberg, 2009), 這種內疚感在一定程度上促進憤怒情緒的產生(Rothschild & Keefer, 2018)。因此, 突顯網絡負責檢測沖突并產生憤怒、厭惡、內疚等負性情緒(Bellucci et al., 2020; Buckholtz & Marois, 2012; Feng et al., 2016; Mclatchie et al., 2016), 主要腦區包括背側前扣帶皮層(dorsal anterior cingulate cortex, dACC)、前腦島皮層(anterior insula cortex, AIC)和杏仁核。

前人研究指出, dACC在監測認知沖突中發揮著重要作用(Wang et al., 2017), AIC與負性情緒表征相關(Shenhav et al., 2016; Singer et al., 2009)。Craig (2009)將這兩者整合到腦島功能模型中, 認為它們共同參與情緒加工。當個體觀察到不公平行為時, dACC和AIC負責監測違反規范的情況或威脅(Feng et al., 2016), 并由AIC標記違規信號和產生不公平厭惡反應(Civai et al., 2012; Hu, Blue et al., 2016)。研究發現AIC激活程度與分配不公平程度呈正相關(Zhong et al., 2016)。相關ERP研究也發現在該過程中源定位在前扣帶皮層(anterior cingulate cortex, ACC)附近的MFN波幅增大, 該成分對社會期望和社會規范的違反敏感(Mothes et al., 2016; Sun et al., 2015; van der Helden et al., 2010; Wu et al., 2011)。這些研究結果體現了dACC和AIC可能對應結果的早期評價加工過程。另外, 杏仁核作為社會與情感的重要腦區之一, 在TPP中負責根據受害者的受傷害程度產生情感喚醒信號(Buckholtz & Marois, 2012; Krueger & Hoffman, 2016), 并參與決定了懲罰的嚴重程度(Stallen et al., 2018)。簡單來說, AIC和杏仁核體現了對不公平行為反應決策的兩個不同方面, 前者反映了個體的社會偏好與懲罰意愿; 后者反映了個體的情感體驗并且影響懲罰程度(Civai et al., 2019)。綜上, 突顯網絡在TPP中負責對違規行為進行檢測, 參與情緒加工并指導后續決策, 為情緒模型提供了證據支持。然而, 有研究者指出, 以AIC為核心的突顯網絡啟動并調節了大腦其他區域參與的認知?情感?動機過程(Menon & Uddin, 2010)。因此我們推測, 突顯網絡在TPP過程中起到重要作用。

3.2? 默認模式網絡

個體在做出懲罰決策之前, 需要對違規行為的傷害程度和傷害意圖進行評估, 并將其整合到責任的評估, 從而形成“懲罰信號”。該過程所涉及的網絡稱為默認模式網絡, 主要包括內側前額葉皮層(medial prefrontal cortex, mPFC)和顳頂聯合區(temporoparietal junction, TPJ)。其中, 腹內側前額葉皮層(ventromedial prefrontal cortex, vmPFC)負責對受傷害的程度進行評估(Bellucci et al., 2017), 與杏仁核的功能連接增強表明這兩個區域可能共同負責傷害程度的情感編碼(Treadway et?al., 2014)。背內側前額葉皮層(dorsomedial prefrontal cortex, dmPFC)和TPJ與推斷他人心理狀態有關(Jamali et al., 2021; Morese et al., 2016; Xie et al., 2020; Yang, Shao, et al., 2019)。dmPFC與TPJ在TPP中負責對傷害者的意圖進行評估, 并且其激活程度及兩者的功能連接強度與懲罰程度呈負相關(Baumgartner et al., 2012, 2014; Moll et al., 2018; Zinchenko et al., 2019)。這可能是個體對違規行為進行了合理的推測與解釋。當傷害是無意發生時, TPJ-mPFC環路會抑制杏仁核的活動, 使得懲罰程度降低(Treadway et al., 2014)。這體現了對違規者心理狀態評估在TPP行為實施過程中起到的重要作用。

前人研究發現, 在與TPP相關的大腦區域之間存在一種獨特的連接方式, dmPFC是TPP激活模式的中樞(Bellucci et al., 2017; Feng et al., 2016)。中樞(hub)是指在格蘭杰因果分析(Granger causality analysis)中與其他節點有最大數量因果聯系的大腦區域, 是信息交流的中心節點(Yang et?al., 2023), 在這里體現為dmPFC與其他腦區之間有更多數量的功能連接。結合不同腦區的功能, 我們對默認模式網絡作用方式做出如下推測(圖2):顳極(temporal pole, TP)負責理解違規行為, 并向dmPFC提供傷害信息。dmPFC在接收到傷害信息之后對傷害意圖進行評估, 并向其他區域傳遞信息, 包括后扣帶皮層(posterior cingulate cortex, PCC)、vmPFC和TPJ。其中, PCC負責整合與違規行為相關的背景信息, vmPFC負責編碼傷害程度, TPJ負責推斷意圖, 最后由mPFC整合傷害與意圖兩部分信息, 形成“懲罰信號” (謝東杰, 蘇彥捷, 2019)。

值得注意的是, dmPFC和TPJ都有著推斷意圖的作用, 是認知心智化的關鍵腦區(Feng et al., 2022)。此外, vmPFC和杏仁核與情感心智化相關(Anne et al., 2012), 有人提出這4個腦區共同組成心智化網絡(mentalizing network) (Feng et al., 2016; Glass et al., 2016)。心智化網絡能夠推斷他人心理狀態, 減弱對違規行為的監測, 降低社會規范的價值計算水平。實際上, Bellucci等人(2017)認為默認模式網絡和心智化網絡在本質上屬于同一網絡, 而另一些研究者則認為默認模式網絡和心智化網絡在TPP中應各司其職, 共同影響TPP行為(Lo Gerfo et al., 2019)。兩者雖在關系上存在不一致的說法, 但不可否認的是二者不管是在結構上還是功能上都存在相似性, 默認模式網絡更加側重于對違規行為整體的責任評估, 而心智化網絡強調對他人心理狀態的推斷。換言之, 默認模式網絡可能是通過心智化網絡起到責任評估的作用, 兩者間是相輔相成、共同作用的。

3.3? 中央執行網絡

Buckholtz等人(2015)認為, 責任評估和懲罰選擇屬于兩個獨立的認知機制, 后者所對應的腦網絡是中央執行網絡。中央執行網絡在TPP中負責將默認模式網絡發出的“懲罰信號”轉變為“懲罰行為” (Lo Gerfo et al., 2019; Zinchenko & Klucharev, 2017)。相關腦區包括背外側前額葉皮層(dorsolateral prefrontal cortex, dlPFC)、后頂葉皮層(posterior parietal cortex, PPC)和頂葉內溝(intraparietal sulcus, IPS)。

當中央執行網絡接收到默認模式網絡傳來的“懲罰信號”時, IPS負責將場景與懲罰行為聯系起來, PPC負責構建懲罰類型等級表, 最后由dlPFC在等級表中選擇特定懲罰, 代表最終輸出(Buckholtz et al., 2008; Glass et al., 2016; Krueger & Hoffman, 2016)。大量研究指出dlPFC在認知控制即抑制負性情緒和自利傾向中起著重要作用(Knoch et al., 2006, 2008; Sanfey et al., 2003; 羅藝 等, 2013), 該結論在TPP中也得到了驗證(Feng et al., 2016; 殷西樂 等, 2019)。相關ERP研究發現, 晚期成分LPC波幅與認知努力程度相關(Cui et al., 2018; Johnson et al., 2008), 表明最終的懲罰決策是負性情緒和自利機制權衡的結果。此外, dlPFC還與目標導向行為的整合與選擇相關(羅藝 等, 2013), 若利用重復經顱磁刺激(repeated transcranial magnetic stimulation, rTMS)抑制dlPFC活動會干擾最終的懲罰決定(Buckholtz et al., 2015)。由上我們推測, dlPFC作為中央執行網絡的核心腦區, 其激活體現了認知控制在反應判斷后期所起到的重要作用, 也為雙系統模型下控制系統的存在提供了神經層面上的證據支持。

此外, 在中央執行網絡中還存在另一個重要腦區——腹外側前額葉皮層(ventrolateral prefrontal cortex, vlPFC)。Glass等人(2016)指出vlPFC雖然對TPP的順利實施很重要, 但卻與其沒有內在聯系, 然而Bellucci等人(2020)的一項元分析發現TPP會持續激活vlPFC。令人遺憾的是, 目前沒有研究直接關注vlPFC與TPP行為的關系。前人研究已證實vlPFC是親社會行為調控中的一個關鍵腦區(Yang, Zheng, et al., 2019), 因此我們推測vlPFC可能在抑制以傷害為目的的懲罰沖動、促進更加公平的制裁中發揮重要作用。未來的研究需要進一步將vlPFC作為目標區域來探究其在TPP中的功能。

3.4? 獎賞網絡

TPP行為的產生涉及獎賞加工, 特別是內部獎賞。根據RL理論, 個體對違規者進行懲罰而獲得滿足感和權力體驗感會作為內部獎賞促使個體做出下一次懲罰行為, 這也是TPP行為得以進化的近端機制(張耀華 等, 2013)。Brüne等人(2021)發現亨廷頓病患者能夠理解不公平行為本身, 卻可能因為缺乏獎賞體驗能力而導致TPP行為減少, 體現了獎賞加工在TPP中發揮的重要作用。在神經層面上, 不少研究發現TPP會激活獎賞加工相關的腦區, 主要包括腹側紋狀體(ventral striatum, VS)和vmPFC (Hu et al., 2015), 兩者與中腦腹側被蓋區(ventral tegmental area, VTA)相連, 分別構成中腦邊緣通路和中腦皮質通路(Ikemoto, 2010)。中腦邊緣通路中的VS在預期未來獎賞中發揮重要作用(ODoherty et al., 2004), 在TPP中其激活程度及其與vmPFC的功能連接增強(Hu et al., 2015)。中腦皮質通路中的vmPFC是情感和認知處理的關鍵腦區(Naqvi et al., 2006; 劉映杰 等, 2022)。前文所提到的vmPFC對傷害程度的評估體現了其將情緒整合到TPP中的功能(Asp et al., 2019)。在認知加工上, vmPFC負責決策中的主觀價值評估(Ruff & Fehr, 2014), 其激活會正向強化社會獎賞(Zhong et al., 2016)。以上證據說明, 獎賞網絡在TPP中主要負責價值表征、預期獎賞的作用。

此外, VTA富含神經遞質多巴胺, 其在中腦邊緣通路和中腦皮質通路神經傳導過程中起到重要作用(Wise & Rompre, 1989)。具體來說, 多巴胺負責編碼獎賞預測偏差(Schultz, 2007, 2013)。當大腦監測到結果比預期更差時, 由ACC和多巴胺系統對該信號進行編碼, 這可能是在腦電研究中發現MFN在違反預期條件下出現的原因(Enge et?al., 2017; 吳燕, 羅躍嘉, 2011), 這可以解釋在個體觀察到不公平分配后MFN波幅增大的現象(Ouyang et al., 2021)。大量研究發現, dlPFC和dACC等腦區在TPP中的活動會受到來自中腦多巴胺能神經元信號輸入的調節(Lockwood et al., 2016)。多巴胺功能分子的遺傳變異可用于解釋個體間在TPP中神經激活的差異。COMT Met等位基因與體驗獎賞的能力有關, 該基因攜帶者在TPP中VS有更強的激活(Strobel et al., 2011)。由此可以說明, 多巴胺水平在TPP決策中有著重要影響, 且該過程與獎賞加工密切相關。

4? 第三方懲罰的認知神經網絡模型

前人在TPP相關神經機制上開展了大量研究, 但大多僅僅關注了TPP行為出現時大腦各部位的獨立激活。近年來有學者對TPP持續激活的神經網絡進行了元分析(Bellucci et al., 2020), 但依舊對大腦區域和網絡之間的相互作用缺乏理解。此外, 獎賞網絡作為TPP中與動機關系最為密切的一個區域, 與其他腦網絡之間的關系還不明確。TPP作為一種復雜的社會決策行為, 其激活的腦區廣泛而復雜。因此, 有必要將心理和神經層面上的證據整合起來, 形成更加系統的理解。為了從更全面的視角解釋TPP行為的發生機制, 本文整合了以往研究結果, 總結梳理個體在TPP中的情緒喚醒、認知過程以及腦區激活模式(文獻詳細信息見網絡版附錄表S1), 提出TPP的認知神經網絡模型(圖3)。在該模型中, 情緒系統和獎賞系統共同作為TPP的動機系統, 負責為TPP行為產生動力, 對應的腦網絡分別為突顯網絡和獎賞網絡。社會認知系統和執行控制系統作為認知系統的兩個子系統, 參與TPP“責任評估”和“懲罰選擇”兩個階段, 對應的腦網絡分別為默認模式網絡和中央執行網絡。模型中各個成分互相配合、相互作用, 最終由執行控制系統做出是否懲罰以及懲罰強度的決策, 由此產生的反饋信息又進一步作用于內部環路, 個體在每一次的反饋中進行學習并形成最優行為決策。對該模型的理解包括以下4個方面:(1)動機系統下的情緒系統和獎賞系統; (2)認知系統內部關系及其對第三方懲罰行為的影響; (3)自動加工與控制加工通路; (4)獎賞網絡參與的反饋通路。

4.1? 動機系統下的情緒系統和獎賞系統

情緒模型指出, 負性情緒的產生是TPP的動力來源之一(Fehr & G?chter, 2002; Xiao & Houser, 2005), 而互惠模型認為對未來回報的期待(如聲譽建立)以及懲罰后的權力體驗感、滿足感可以作為獎賞信號對個體進行內部強化, 促使個體做出下一次懲罰行為。因此, 情緒和獎賞系統都參與到TPP的動機產生過程中, 并共同組成TPP的動機系統。情緒系統涉及情緒的產生、處理和調節過程(Etkin et al., 2015; Pessoa, 2017)。以往研究發現, 突顯網絡在TPP中參與情緒加工并指導后續決策(Bellucci et al., 2020; Feng et al., 2016; Mclatchie et al., 2016), 獎賞網絡的價值表征和預期獎賞的功能使得其與獎賞系統密切相關(Hu et al., 2015)。因此, 情緒系統和獎賞系統對應的腦網絡分別為突顯網絡和獎賞網絡。值得注意的是, 情緒系統和獎賞系統也并非完全獨立(箭頭5)。情緒系統將負性情緒的產生等情緒信息傳遞給獎賞系統, 使得個體更傾向于去尋求獎賞性刺激來緩解因負性情緒帶來的不適感; 同時, 獎賞系統將以往的獎賞體驗(如權力感和滿足感)傳遞給情緒系統, 以此引發積極的情緒體驗, 這種相互促進的關系為個體做出懲罰決策提供了動力。

4.2? 認知系統內部關系及其對第三方懲罰行為的影響

認知系統包括社會認知系統和執行控制系統。在TPP中, 個體需要根據違規行為信息來評估傷害程度以及推斷違規者的心理狀態(Ginther et al., 2016; Treadway et al., 2014), 而默認模式網絡中與心智化相關的腦區如TPJ和dmPFC在意圖推斷方面起著重要作用(Feng et al., 2022), 且中央執行網絡的核心腦區dlPFC的激活體現了認知控制在TPP中的重要性(殷西樂 等, 2019)。因此, 社會認知系統和執行控制系統與默認模式網絡和中央執行網絡這兩個腦網絡相對應, 分別參與“責任評估”和“懲罰選擇”兩個階段。有研究者指出, 不同于更多的由情緒驅動的第二方懲罰, TPP者更著重于對違規者的意圖推斷, 其重要性可能超過情緒(Ginther et al., 2016; Treadway et al., 2014), 這體現了TPP過程中社會認知系統的重要作用。另外, 個體最后是否做出懲罰行為以及懲罰的強度, 又受到執行控制系統的影響。因此, 社會認知系統和執行控制系統對TPP行為的作用是遞進式的, 而非相互獨立。在神經層面上, Buckholtz等人(2008)首次發現TPJ和dlPFC的活動存在“拮抗”關系:當TPJ活動增加時, dlPFC表現失活, 而當個體決定懲罰時, 其活躍度又增加, 體現了dlPFC的雙相神經活動; 此外, Zinchenko等人(2021)的研究也發現, 右側dlPFC和右側TPJ之間的整體靜息狀態連接與TPP水平負相關。任務態和靜息態的研究均表明, 默認模式網絡(TPJ)和中央執行網絡(dlPFC)之間存在“拮抗”關系(箭頭6), 更具體地說, dlPFC的這種雙相神經活動可能是中央執行網絡對默認模式網絡抑制作用的基礎(Zinchenko & Klucharev, 2017)。同時, 兩者間也存在互補性(陳瀛 等, 2020):默認模式網絡代表“感性”的社會認知, 反映了由認知和情緒所主導的責任評估; 而中央執行網絡通常代表“理性”的邏輯思維, 在認知控制方面的作用體現了大腦中的理性思考與權衡?!案行浴迸c“理性”的結合體現了默認模式網絡和中央執行網絡在功能上的互補。

4.3? 自動加工與控制加工通路

結合上文所提到的雙系統模型, 在該模型中存在自動加工和控制加工兩條通路(在下文稱通路1和通路2)。兩條通路均以情緒系統作為起點, 由執行控制系統輸出最終的TPP行為。不同的是, 個體觀察到違規行為后(箭頭1), 通路1中情緒系統直接將整合后的負性情緒傳遞給認知系統(箭頭2), 由執行控制系統執行懲罰決定, 此時個體進行懲罰可能是為了消解負性情緒(箭頭4); 而通路2中加入了大腦理性控制的因素, 情緒系統的信息先由社會認知系統進行傷害程度和意圖的評估, 再由執行控制系統相關腦區進行情緒和自利的權衡(箭頭3), 最終執行懲罰決定(箭頭4), 對應著TPP“情緒產生”、“責任評估”和“懲罰選擇”三個階段。

4.4? 獎賞網絡參與的反饋通路

在TPP決策過程中, 個體需要時刻收集和評估環境信息, 以此來調整行為策略, 這依賴于反饋機制得以實現。具體來說, 當第三方做出懲罰決定之后(箭頭4), 負性情緒的消解以及權力的體驗感和滿足感作為相應的獎勵信號正反饋于獎賞系統(箭頭7), 為下一次懲罰提供了動力。根據RL理論, 個體從反饋提供的獎勵信息中不斷學習, 綜合考慮各項因素來預估獎賞的最大值, 并最終形成穩定的懲罰模式。由上可知, 反饋機制的存在使TPP行為的發生發展得以順利進行, 當反饋機制遭到破壞, 個體可能會面臨異常的行為, 可見反饋機制在TPP認知神經網絡模型中起著關鍵的作用。

5? 總結與展望

本文綜述了近10年來的TPP相關研究, 從理論模型和神經網絡兩個層面對TPP行為的認知神經機制進行總結, 并在前人研究的基礎上提出TPP的認知神經網絡模型, 從更加宏觀的角度展現了TPP行為的發生發展過程和神經關聯。在該模型中, 情緒系統和獎賞系統是TPP的動力來源, 認知系統主要負責責任評估以及懲罰的選擇, 獎賞網絡、突顯網絡、默認模式網絡和中央執行網絡分別參與不同認知加工階段。與此同時, TPP行為反饋機制的存在使得個體會在每一次反饋學習中優化行為策略, 最終形成穩定的行為模式。然而, 目前對于TPP的研究還存在一些不足和尚未解決的問題。

5.1? 神經遞質和激素對第三方懲罰行為的影響

認知神經系統受到神經遞質和激素的影響(Hu, Scheele, et al., 2016)。探究TPP行為、神經遞質、激素三者間的關系, 有助于我們從更微觀的角度理解TPP行為。本文僅從多巴胺水平及其遺傳變異的角度對個體懲罰行為背后的遺傳學機理進行了簡單剖析, 為揭示TPP行為發生的神經生化基礎提供了啟示。除多巴胺以外, 一些研究發現5-羥色胺水平低的個體表現出了更多的利他懲罰行為(Emanuele et al., 2008), 且5-HTTLPR L/L基因攜帶者TPP強度更大(Enge et al., 2017)。然而, Enge等人的研究并未排除多巴胺和5-羥色胺之間相互作用的影響, 對5-羥色胺如何影響TPP行為的機制也尚不明確。在激素水平上, 已有研究證明肽類激素催產素(oxytocin, OXT)與人類的親社會行為相關(Marsh et al., 2021)。然而目前少有研究探討外源性OXT與TPP行為的關系。Krueger等人(2012)發現OXT僅僅影響對傷害程度的感知而不影響TPP的強度??偟膩碚f, 目前對神經遞質和激素及其基因多態性如何影響TPP行為的研究尚處在初步階段, 未來從該角度入手有助于從更微觀的角度揭示TPP行為的神經生理機制。

5.2? 第三方懲罰行為的個體差異

以往的研究大多將樣本進行整體性的分析, 忽略了個體之間的差異。例如, 共情作為一種理解和感受他人情緒的能力, 是親社會行為的動機來源之一, 對TPP行為有著重要影響(Ferguson et?al., 2019), 個體在面對更加貧窮的違規者時共情水平更高, 對其寬容度更高, 因此懲罰強度更低(Ouyang et al., 2021)。然而, 共情也存在著巨大的個體差異, 且該差異可能會進一步體現在神經生理反應上(van Baar et al., 2021; Wang et al., 2022)。此外, 由于傳統的ERP分析對所有的被試數據進行了組平均處理, 最終的結果可能無法反映個體間的差異, 導致人們做出錯誤的解釋(陳新文 等, 2023)。因此, 未來有必要將個體差異如共情、社會價值取向、心智化能力等納入TPP行為的認知神經機制的研究, 進一步探討TPP行為的神經生理表征與人格特質變量的關系。

5.3? 對第三方懲罰行為做出定量的解釋和預測

本文提出的TPP的認知神經網絡模型能夠在一定程度上預測TPP行為, 但尚停留在定性的層面, 實際TPP行為的產生是否遵循該模式還需要進一步的檢驗。近年來, 越來越多的研究者將機器學習的方法應用到認知加工領域。以多變量解碼分析(multivariate decoding analysis)為例, 該方法可以量化單個神經信號所代表的信息, 并用于訓練和測試分類器, 將特定事件所對應的大腦活動信號進行區分(Contini et al., 2017)。這里的神經信號可以來自神經影像學信號如功能磁共振成像(functional magnetic resonance imaging, fMRI), 也可以來自神經生理學信號如腦電圖(electroencephalogram, EEG)和腦磁圖(magnetoencephalogram, MEG)??紤]到TPP是一個由多個子階段組成的復雜社交行為, 利用該方法可以進一步探究與TPP行為相關的復雜神經活動模式。因此, 未來需要進一步優化和發展相關模型, 引入基于機器學習分析方法如多變量解碼分析來構建數學模型, 探究個體在不同情況下如不同懲罰代價高低、不同程度的不公平分配方案等的神經信號差異, 以此對TPP行為做出定量的解釋和預測。

5.4? 第三方懲罰和補償行為認知神經機制的異同

從建立聲譽的角度來看, 第三方個體對違規者做出懲罰表明了他們的合作意圖。然而, 當個體有其他更為積極的方式來表達自己合作傾向的時候, 這種通過懲罰而建立的聲譽可能是有害的(Raihani & Bshary, 2015a)。具體來講, 當第三方個體不僅有“懲罰”和“不作為”兩個選項, 還引入了“幫助受害者”這一條件時, TPP的利他強度會減弱, 因為此時懲罰會被視為一種競爭性的、“損人不利己”的信號(Jordan, Hoffman, et al., 2016), 而幫助會得到更加積極的評價(Raihani & Bshary, 2015b; Li et al., 2018)。在這種復雜的社交情境下, 引入“第三方干預”就顯得尤為重要, 包括第三方懲罰和第三方補償(幫助)。與懲罰所面對的對象不同, 第三方補償關注的焦點在受害者, 即第三方個體犧牲自己的利益來補償受害者, 使其真正受益。已有研究表明, 共情水平越高的個體更容易做出幫助他人的決定, 且幫助和懲罰背后的神經機制也存在異同(Hu et al., 2015; Xie et al., 2022; 蘇彥捷 等, 2019)。由于這兩種干預形式所關注的焦點不同, 未來的研究可以關注在不同社交情境下個體的第三方干預偏好及其背后的神經機制。

5.5? 利用元分析為認知神經網絡模型提供統計支撐

本文提出的認知神經網絡模型能夠在理論上對TPP行為的發生發展做出更加整體、全面的解釋, 但還缺乏一定的統計支撐。元分析在定性分析的基礎上引入了定量的分析方法, 經該方法得出的結論更具有概括性和普遍性。一方面, TPP的產生包括不同的階段, 每個階段所涉及的腦區和網絡激活模式也各不相同, 利用元分析能夠處理分析大量的單個研究數據, 做到有效的綜合(董奇, 2004); 另一方面, 前人在探究TPP的神經心理機制時所采用的實驗范式和因變量測量方式各有不同, 這些方法上的變異可能會帶來實驗結果的不一致, 而元分析能夠進一步探索研究中特征變量的異質性來源, 較好地解決這一問題。因此, 未來在理論模型的完善過程中, 可以利用元分析對已有研究結果進行綜合分析以及再評價, 為模型提供定量的數據支撐以增加模型的可靠性。

參考文獻

陳新文, 李鴻杰, 丁玉瓏. (2023). 探究事件相關腦電/腦磁信號中的神經表征模式:基于分類解碼和表征相似性分析的方法. 心理科學進展, 31(2), 173?195.

陳瀛, 徐敏霞, 汪新建. (2020). 信任的認知神經網絡模型. 心理科學進展, 28(5), 800?809.

董奇. (2004). 心理與教育研究方法 (修訂版). 北京師范大學出版社.

劉映杰, 段亞妮, 劉昊馨, 劉佳, 王赫. (2022). 得失情境下第三方懲罰決策差異的神經機制:基于rTMS的研究. 心理科學, 45(4), 942?952.

羅藝, 封春亮, 古若雷, 吳婷婷, 羅躍嘉. (2013). 社會決策中的公平準則及其神經機制. 心理科學進展, 21(2), 300?308.

蘇彥捷, 謝東杰, 王笑楠. (2019). 認知控制在第三方懲罰中的作用. 心理科學進展, 27(8), 1331?1343.

唐捷, 黃曉璇, 吳嵩, 崔芳. (2022). 財富越多, 責任越大:資金數量和來源對公共物品困境中第三方懲罰的影響. 心理科學, 45(3), 665?671.

吳燕, 羅躍嘉. (2011). 利他懲罰中的結果評價——ERP研究. 心理學報, 43(6), 661?673.

謝東杰, 蘇彥捷. (2019). 第三方懲罰的演化與認知機制. 心理科學, 42(1), 216?222.

楊莎莎, 陳思靜. (2022). 第三方懲罰中的規范錯覺:基于公正世界信念的解釋. 心理學報, 54(3), 281?299.

殷西樂, 李建標, 陳思宇, 劉曉麗, 郝潔. (2019). 第三方懲罰的神經機制:來自經顱直流電刺激的證據. 心理學報, 51(5), 571?583.

張慧, 馬紅宇, 徐富明, 劉燕君, 史燕偉. (2018). 最后通牒博弈中的公平偏好:基于雙系統理論的視角. 心理科學進展, 26(2), 319?330.

張耀華, 林珠梅, 朱莉琪. (2013). 人類的利他性懲罰:認知神經科學的視角. 生物化學與生物物理進展, 40(9), 796?803.

Anne, L., Frank, K., Olga, D. M., Matteo, P., Sarah, J. P., Jeffrey, S., & Jordan, G. (2012). Damage to the left ventromedial prefrontal cortex impacts affective theory of mind. Social Cognitive and Affective Neuroscience, 7(8), 871?880.

Asp, E. W., Gullickson, J. T., Warner, K. A., Koscik, T. R., Denburg, N. L., & Tranel, D. (2019). Soft on crime: Patients with ventromedial prefrontal cortex damage allocate reduced third-party punishment to violent criminals. Cortex, 119, 33?45.

Baumgartner, T., G?tte, L., R Gügler, & Fehr, E. (2012). The mentalizing network orchestrates the impact of parochial altruism on social norm enforcement. Human Brain Mapping, 33(6), 1452?1469.

Baumgartner, T., Schiller, B., Rieskamp, J., Gianotti, L. R. R., & Knoch, D. (2014). Diminishing parochialism in intergroup conflict by disrupting the right temporo-parietal junction. Social Cognitive and Affective Neuroscience, 9(5), 653?660.

Bellucci, G., Camilleri, J. A., Iyengar, V., Eickhoff, S. B., & Krueger, F. (2020). The emerging neuroscience of social punishment: Meta-analytic evidence. Neuroscience and Biobehavioral Reviews, 113, 426?439.

Bellucci, G., Chernyak, S., Hoffman, M., Deshpande, G., Monte, O. D., Knutson, K., Grafman, J., & Krueger, F. (2017). Effective connectivity of brain regions underlying third-party punishment: Functional MRI and Granger causality evidence. Social Neuroscience, 12(2), 124?134.

Bernhard, H., Fehr, E., & Fischbacher, U. (2006). Group affiliation and altruistic norm enforcement. American Economic Review, 96(2), 217?221.

Bright, D. A., & Goodman-Delahunty, J. (2006). Gruesome evidence and emotion: Anger, blame, and jury decision- making. Law and Human Behavior, 30(2), 183?202.

Brüne, M., von Hein, S. M., Claassen, C., Hoffmann, R., & Saft, C. (2021). Altered third-party punishment in Huntington's disease: A study using neuroeconomic games. Brain and Behavior, 11(1), Article e01908.

Buckholtz, J. W., Asplund, C. L., Dux, P. E., Zald, D. H., Gore, J. C., Jones, O. D., & Marois, R. (2008). The neural correlates of third-party punishment. Neuron, 60(5), 930?940.

Buckholtz, J. W., & Marois, R. (2012). The roots of modern justice: Cognitive and neural foundations of social norms and their enforcement. Nature Neuroscience, 15(5), 655? 661.

Buckholtz, J. W., Martin, J. W., Treadway, M. T., Jan, K., Zald, D. H., Jones, O., & Marois, R. (2015). From blame to punishment: Disrupting prefrontal cortex activity reveals norm enforcement mechanisms. Neuron, 87(6), 1369?1380.

Cheng, X., Zheng, L., Liu, Z., Ling, X., Wang, X., Ouyang, H., Chen, X., Huang, D., & Guo, X. (2022). Punishment cost affects third-parties behavioral and neural responses to unfairness. International Journal of Psychophysiology, 177, 27?33.

Chung, J. C. Y., Bhatoa, R. S., Kirkpatrick, R., & Woodcock, K. A. (2023). The role of emotion regulation and choice repetition bias in the ultimatum game. Emotion, 23(4), 925?936

Ciaramidaro, A., Toppi, J., Casper, C., Freitag, C. M., Siniatchkin, M., & Astolfi, L. (2018). Multiple-brain connectivity during third party punishment: An EEG hyperscanning study. Scientific Reports, 8(1), Article 6822.

Civai, C. (2013). Rejecting unfairness: Emotion-driven reaction or cognitive heuristic? Frontiers in Human Neuroscience, 7, Article 126.

Civai, C., Crescentini, C., Rustichini, A., & Rumiati, R. I. (2012). Equality versus self-interest in the brain: Differential roles of anterior insula and medial prefrontal cortex. Neuroimage, 62(1), 102?112.

Civai, C., Huijsmans, I., & Sanfey, A. G. (2019). Neurocognitive mechanisms of reactions to second- and third-party justice violations. Scientific Reports, 9(1), Article 9271.

Contini, E. W., Wardle, S. G., & Carlson, T. A. (2017). Decoding the time-course of object recognition in the human brain: From visual features to categorical decisions. Neuropsychologia, 105, 165?176.

Craig, A. D. B. (2009). How do you feel—now? The anterior insula and human awareness. Nature Reviews Neuroscience, 10(1), 59?70.

Cui, F., Wang, C., Cao, Q., & Jiao, C. (2019). Social hierarchies in third-party punishment: A behavioral and ERP study. Biological Psychology, 146, Article 107722.

Cui, F., Wu, S., Wu, H., Wang, C., Jiao, C., & Luo, Y. (2018). Altruistic and self-serving goals modulate behavioral and neural responses in deception. Social Cognitive and Affective Neuroscience, 13(1), 63?71.

de Quervain, D. J., Fischbacher, U., Treyer, V., Schellhammer, M., Schnyder, U., Buck, A., & Fehr, E. (2004). The neural basis of altruistic punishment. Science, 305(5688), 1254? 1258.

Delgado, M. R., Locke, H. M., Stenger, V. A., & Fiez, J. A. (2003). Dorsal striatum responses to reward and punishment: Effects of valence and magnitude manipulations. Cognitive, Affective, & Behavioral Neuroscience, 3(1), 27?38.

Emanuele, E., Brondino, N., Bertona, M., Re, S., & Geroldi, D. (2008). Relationship between platelet serotonin content and rejections of unfair offers in the ultimatum game. Neuroscience Letters, 437(2), 158?161.

Enge, S., Mothes, H., Fleischhauer, M., Reif, A., & Strobel, A. (2017). Genetic variation of dopamine and serotonin function modulates the feedback-related negativity during altruistic punishment. Scientific Reports, 7(1), Article 2996.

Etkin, A., Büchel, C., & Gross, J. J. (2015). The neural bases of emotion regulation. Nature Reviews Neuroscience, 16(11), 693?700.

Fehr, E., & Fischbacher, U. (2003). The nature of human altruism. Nature, 425(6960), 785?791.

Fehr, E., & Fischbacher, U. (2004a). Third-party punishment and social norms. Evolution and Human Behavior, 25(2), 63?87.

Fehr, E., & Fischbacher, U. (2004b). Social norms and human cooperation. Trends in Cognitive Sciences, 8(4), 185?190.

Fehr, E., & G?chter, S. (2002). Altruistic punishment in humans. Nature, 415(6868), 137?140.

Fehr, E., & Schurtenberger, I. (2018). Normative foundations of human cooperation. Nature Human Behaviour, 2(7), 458?468.

Feng, C., Deshpande, G., Liu, C., Gu, R., Luo, Y. J., & Krueger, F. (2016). Diffusion of responsibility attenuates altruistic punishment: A functional magnetic resonance imaging effective connectivity study. Human Brain Mapping, 37(2), 663?677.

Feng, C., Yang, Q., Azem, L., Atanasova, K. M., Gu, R., Luo, W., Hoffman, M., Lis, S., & Krueger, F. (2022). An fMRI investigation of the intention-outcome interactions in second- and third-party punishment. Brain Imaging and Behavior, 16(2), 715?727.

Ferguson, E., Quigley, E., Powell, G., Stewart, L., Harrison, F., & Tallentire, H. (2019). To help or punish in the face of unfairness: Men and women prefer mutually-beneficial strategies over punishment in a sexual selection context. Royal Society Open Science, 6(9), Article 181441.

Gershman, S. J., Markman, A. B., & Otto, A. R. (2014). Retrospective revaluation in sequential decision making: A tale of two systems. Journal of Experimental Psychology: General, 143(1), 182?194.

Ginther, M. R., Bonnie, R. J., Hoffman, M. B., Shen, F. X., Simons, K. W., Jones, O. D., & Marois, R. (2016). Parsing the behavioral and brain mechanisms of third-party punishment. Journal of Neuroscience, 36(36), 9420?9434.

Glass, L., Moody, L., Grafman, J., & Krueger, F. (2016). Neural signatures of third-party punishment: Evidence from penetrating traumatic brain injury. Social Cognitive and Affective Neuroscience, 11(2), 253?262.

Guala, F. (2012). Reciprocity: Weak or strong? What punishment experiments do (and do not) demonstrate. Behavioral and Brain Sciences, 35(1), 1?15.

Hu, J., Blue, P. R., Yu, H., Gong, X., Xiang, Y., Jiang, C., & Zhou, X. (2016). Social status modulates the neural response to unfairness. Social Cognitive and Affective Neuroscience, 11(1), 1?10.

Hu, Y., Scheele, D., Becker, B., Voos, G., David, B., Hurlemann, R., & Weber, B. (2016). The effect of oxytocin on third-party altruistic decisions in unfair situations: An fMRI study. Scientific Reports, 6, Article 20236.

Hu, Y., Strang, S., & Weber, B. (2015). Helping or punishing strangers: Neural correlates of altruistic decisions as third- party and of its relation to empathic concern. Frontiers in Behavioral Neuroscience, 9, Article 24.

Ikemoto, S. (2010). Brain reward circuitry beyond the mesolimbic dopamine system: A neurobiological theory. Neuroscience and Biobehavioral Reviews, 35(2), 129?150.

Jamali, M., Grannan, B. L., Fedorenko, E., Saxe, R., Báez- Mendoza, R., & Williams, Z. M. (2021). Single-neuronal predictions of others' beliefs in humans. Nature, 591(7851), 610?614.

Johnson, R., Henkell, H., Simon, E., & Zhu, J. (2008). The self in conflict: The role of executive processes during truthful and deceptive responses about attitudes. NeuroImage, 39(1), 469?482.

Jordan, J. J., Hoffman, M., Bloom, P., & Rand, D. G. (2016). Third-party punishment as a costly signal of trustworthiness. Nature, 530(7591), 473?476.

Jordan, J., McAuliffe, K., & Rand, D. (2016). The effects of endowment size and strategy method on third party punishment. Experimental Economics, 19(4), 741?763.

Kanakogi, Y., Miyazaki, M., Takahashi, H., Yamamoto, H., Kobayashi, T., & Hiraki, K. (2022). Third-party punishment by preverbal infants. Nature Human Behaviour, 6(9), 1234?1242.

Kim, M., Decety, J., Wu, L., Baek, S., & Sankey, D. (2021). Neural computations in childrens third-party interventions are modulated by their parents moral values. NPJ Science of Learning, 6(1), Article 38.

Knoch, D., Nitsche, M. A., Fischbacher, U., Eisenegger, C., Pascual-Leone, A., & Fehr, E. (2008). Studying the neurobiology of social interaction with transcranial direct current stimulation—The example of punishing unfairness. Cerebral Cortex, 18(9), 1987?1990.

Knoch, D., Pascual-Leone, A., Meyer, K., Treyer, V., & Fehr, E. (2006). Diminishing reciprocal fairness by disrupting the right prefrontal cortex. Science, 314(5800), 829?832.

Konishi, N., & Ohtsubo, Y. (2015). Does dishonesty really invite third-party punishment? Results of a more stringent test. Biology Letters, 11(5), Article 20150172.

K?ster, R., Hadfield-Menell, D., Everett, R., Weidinger, L., Hadfield, G. K., & Leibo, J. Z. (2022). Spurious normativity enhances learning of compliance and enforcement behavior in artificial agents. Proceedings of the National Academy of Sciences, 119(3), Article e2106028118.

Kozlowski, S. W. J., & Ilgen, D. R. (2006). Enhancing the effectiveness of work groups and teams. Psychological Science in the Public Interest, 7(3), 77?124.

Krueger, F., & Hoffman, M. (2016). The emerging neuroscience of third-party punishment. Trends in Neurosciences, 39(8), 499?501.

Krueger, F., Parasuraman, R., Moody, L., Twieg, P., de Visser, E., Mccabe, K., OHara, M., & Lee, M. (2012). Oxytocin selectively increases perceptions of harm for victims but not the desire to punish offenders of criminal offenses. Social Cognitive and Affective Neuroscience, 8(5), 494?498.

Lee, S. W., Shimojo, S., & ODoherty, J. P. (2014). Neural computations underlying arbitration between model-based and model-free learning. Neuron, 81(3), 687?699.

Lergetporer, P., Angerer, S., Gl?tzle-Rützler, D., & Sutter, M. (2014). Third-party punishment increases cooperation in children through (misaligned) expectations and conditional cooperation. Proceedings of the National Academy of Sciences of the United States of America, 111(19), 6916? 6921.

Li, J., Li, S., Wang, P., Liu, X., Zhu, C., Niu, X., Wang, G., & Yin, X. (2018). Fourth-party evaluation of third-party pro-social help and punishment: An ERP study. Frontiers in Psychology, 9, Article 932.

Liu, Y., Bian, X., Hu, Y., Chen, Y.-T., Li, X., & Di Fabrizio, B. (2018). Intergroup bias influences third-party punishment and compensation: In-group relationships attenuate altruistic punishment. Social Behavior and Personality: An International Journal, 46(8), 1397?1408.

Lo Gerfo, E., Gallucci, A., Morese, R., Vergallito, A., Ottone, S., Ponzano, F., Locatelli, G., Bosco, F., & Romero Lauro, L. J. (2019). The role of ventromedial prefrontal cortex and temporo-parietal junction in third-party punishment behavior. NeuroImage, 200, 501?510.

Lockwood, P. L., Apps, M. A. J., Valton, V., Viding, E., & Roiser, J. P. (2016). Neurocomputational mechanisms of prosocial learning and links to empathy. Proceedings of the National Academy of Sciences of the United States of America, 113(35), 9763?9768.

Marsh, N., Marsh, A. A., Lee, M. R., & Hurlemann, R. (2021). Oxytocin and the neurobiology of prosocial behavior. The Neuroscientist, 27(6), 604?619.

Martin, J. W., Martin, S., & McAuliffe, K. (2021). Third-party punishment promotes fairness in children. Developmental psychology, 57(6), 927?939.

McAuliffe, K., Jordan, J. J., & Warneken, F. (2015). Costly third-party punishment in young children. Cognition, 134, 1?10.

Mclatchie, N., Giner-Sorolla, R., & Derbyshire, S. W. G. (2016). ‘Imagined guilt vs ‘recollected guilt: Implications for fMRI. Social Cognitive and Affective Neuroscience, 11(5), 703?711.

Meidenbauer, K. L., Cowell, J. M., & Decety, J. (2018). Childrens neural processing of moral scenarios provides insight into the formation and reduction of in‐group biases. Developmental Science, 21(6), Article e12676.

Menon, V., & Uddin, L. Q. (2010). Saliency, switching, attention and control: A network model of insula function. Brain Structure and Function, 214(5?6), 655?667.

Moll, J., de Oliveira-Souza, R., Basilio, R., Bramati, I. E., Gordon, B., Rodríguez-Nieto, G., ... Grafman, J. (2018). Altruistic decisions following penetrating traumatic brain injury. Brain, 141(5), 1558?1569.

Morese, R., Rabellino, D., Sambataro, F., Perussia, F., Valentini, M. C., Bara, B. G., & Bosco, F. M. (2016). Group membership modulates the neural circuitry underlying third party punishment. PLoS One, 11(11), Article e0166357.

Morris, A., MacGlashan, J., Littman, M. L., & Cushman, F. (2017). Evolution of flexibility and rigidity in retaliatory punishment. Proceedings of the National Academy of Sciences, 114(39), 10396?10401.

Mothes, H., Enge, S., & Strobel, A. (2016). The interplay between feedback-related negativity and individual differences in altruistic punishment: An EEG study. Cognitive, Affective, & Behavioral Neuroscience, 16(2), 276?288.

Mussel, P., Hewig, J., & Wei?, M. (2018). The reward-like nature of social cues that indicate successful altruistic punishment. Psychophysiology, 55(9), Article e13093.

Naqvi, N., Shiv, B., & Bechara, A. (2006). The role of emotion in decision making: A cognitive neuroscience perspective. Current Directions in Psychological Science, 15(5), 260?264.

Nelissen, R. M. A., & Zeelenberg, M. (2009). Moral emotions as determinants of third-party punishment: Anger, guilt, and the functions of altruistic sanctions. Judgment and Decision Making, 4(7), 543?553.

ODoherty, J., Dayan, P., Schultz, J., Deichmann, R., Friston, K., & Dolan, R. J. (2004). Dissociable roles of ventral and dorsal striatum in instrumental conditioning. Science, 304(5669), 452?454.

Ouyang, H., Yu, J., Duan, J., Zheng, L., Li, L., & Guo, X. (2021). Empathy-based tolerance towards poor norm violators in third-party punishment. Experimental Brain Research, 239(7), 2171?2180.

Pedersen, E. J., McAuliffe, W. H. B., & McCullough, M. E. (2018). The unresponsive avenger: More evidence that disinterested third parties do not punish altruistically. Journal of Experimental Psychology: General, 147(4), 514?544.

Pessoa, L. (2017). A network model of the emotional brain. Trends in Cognitive Sciences, 21(5), 357?371.

Piazza, J., & Bering, J. M. (2008). The effects of perceived anonymity on altruistic punishment. Evolutionary Psychology, 6(3), 487?501.

Qu, L., Dou, W., You, C., & Qu, C. (2014). The processing course of conflicts in third-party punishment: An event-related potential study. Psychology Journal, 3(3), 214?221.

Rahal, R.-M., & Fiedler, S. (2022). Cognitive and affective processes of prosociality. Current Opinion in Psychology, 44, 309?314.

Rai, T. S. (2022). Material benefits crowd out moralistic punishment. Psychological Science, 33(5), 789?797.

Raihani, N. J., & Bshary, R. (2015a). The reputation of punishers. Trends in Ecology & Evolution, 30(2), 98?103.

Raihani, N. J., & Bshary, R. (2015b). Third-party punishers are rewarded, but third-party helpers even more so. Evolution, 69(4), 993?1003.

Raihani, N. J., & McAuliffe, K. (2012). Human punishment is motivated by inequity aversion, not a desire for reciprocity. Biology Letters, 8(5), 802?804.

Rothschild, Z. K., & Keefer, L. A. (2018). Righteous or self- righteous anger? Justice sensitivity moderates defensive outrage at a third-party harm-doer. European Journal of Social Psychology, 48(4), 507?522.

Ruff, C. C., & Fehr, E. (2014). The neurobiology of rewards and values in social decision making. Nature Reviews Neuroscience, 15(8), 549?562.

Sanfey, A. G., Rilling, J. K., Aronson, J. A., Nystrom, L. E., & Cohen, J. D. (2003). The neural basis of economic decision-making in the ultimatum game. Science, 300(5626), 1755?1758.

Schultz, W. (2007). Behavioral dopamine signals. Trends in Neurosciences, 30(5), 203?210.

Schultz, W. (2013). Updating dopamine reward signals. Current Opinion in Neurobiology, 23(2), 229?238.

Shenhav, A., Cohen, J. D., & Botvinick, M. M. (2016). Dorsal anterior cingulate cortex and the value of control. Nature Neuroscience, 19(10), 1286?1291.

Singer, T., Critchley, H. D., & Preuschoff, K. (2009). A common role of insula in feelings, empathy and uncertainty. Trends in Cognitive Sciences, 13(8), 334?340.

Stallen, M., Rossi, F., Heijne, A., Smidts, A., De Dreu, C. K. W., & Sanfey, A. G. (2018). Neurobiological mechanisms of responding to injustice. The Journal of Neuroscience, 38(12), 2944?2954.

Strobel, A., Zimmermann, J., Schmitz, A., Reuter, M., Lis, S., Windmann, S., & Kirsch, P. (2011). Beyond revenge: Neural and genetic bases of altruistic punishment. NeuroImage, 54(1), 671?680.

Sun, L., Tan, P., Cheng, Y., Chen, J., & Qu, C. (2015). The effect of altruistic tendency on fairness in third-party punishment. Frontiers in Psychology, 6, Article 820.

Thaler, R. H. (1988). Anomalies: The ultimatum game. Journal of Economic Perspectives, 2(4), 195?206.

Treadway, M. T., Buckholtz, J. W., Martin, J. W., Jan, K., Asplund, C. L., Ginther, M. R., Jones, O. D., & Marois, R. (2014). Corticolimbic gating of emotion-driven punishment. Nature Neuroscience, 17(9), 1270?1275.

van Baar, J. M., Halpern, D. J., & FeldmanHall, O. (2021). Intolerance of uncertainty modulates brain-to-brain synchrony during politically polarized perception. Proceedings of the National Academy of Sciences of the United States of America, 118(20), Article e2022491118.

van der Helden, J., Boksem, M. A. S., & Blom, J. H. G. (2010). The importance of failure: Feedback-related negativity predicts motor learning efficiency. Cerebral Cortex, 20(7), 1596?1603.

Wang, L., Lu, X., Gu, R., Zhu, R., Xu, R., Broster, L. S., & Feng, C. (2017). Neural substrates of context- and person- dependent altruistic punishment. Human Brain Mapping, 38(11), 5535?5550.

Wang, R., Yu, R., Tian, Y., & Wu, H. (2022). Individual variation in the neurophysiological representation of negative emotions in virtual reality is shaped by sociability. NeuroImage, 263, Article 119596.

Wise, R. A., & Rompre, P.-P. (1989). Brain dopamine and reward. Annual Review of Psychology, 40(1), 191?225.

Wu, Y., Leliveld, M. C., & Zhou, X. (2011). Social distance modulates recipients fairness consideration in the dictator game: An ERP study. Biological Psychology, 88(2), 253? 262.

Xiao, E., & Houser, D. (2005). Emotion expression in human punishment behavior. Proceedings of the National Academy of Sciences of the United States of America, 102(20), 7398?7401.

Xie, E., Liu, M., Liu, J., Gao, X., & Li, X. (2022). Neural mechanisms of the mood effects on third‐party responses to injustice after unfair experiences. Human Brain Mapping, 43(12), 3646?3661.

Xie, H., Karipidis, I. I., Howell, A., Schreier, M., Sheau, K. E., Manchanda, M. K., ... Saggar, M. (2020). Finding the neural correlates of collaboration using a three-person fMRI hyperscanning paradigm. Proceedings of the National Academy of Sciences of the United States of America, 117(37), 23066?23072.

Yamagishi, T., Li, Y., Fermin, A. S. R., Kanai, R., Takagishi, H., Matsumoto, Y., Kiyonari, T., & Sakagami, M. (2017). Behavioural differences and neural substrates of altruistic and spiteful punishment. Scientific Reports, 7(1), Article 14654.

Yang, C., Xiao, K., Ao, Y., Cui, Q., Jing, X., & Wang, Y. (2023). The thalamus is the causal hub of intervention in patients with major depressive disorder: Evidence from the Granger causality analysis. NeuroImage: Clinical, 37, Article 103295.

Yang, J., Gu, R., Liu, J., Deng, K., Huang, X., Luo, Y. J., & Cui, F. (2022). To blame or not? Modulating third-party punishment with the framing effect. Neuroscience Bulletin, 38(5), 533?547.

Yang, Q., Shao, R., Zhang, Q., Li, C., Li, Y., Li, H., & Lee, T. (2019). When morality opposes the law: An fMRI investigation into punishment judgments for crimes with good intentions. Neuropsychologia, 127, 195?203.

Yang, Z., Zheng, Y., Yang, G., Li, Q., & Liu, X. (2019). Neural signatures of cooperation enforcement and violation: A coordinate-based meta-analysis. Social Cognitive and Affective Neuroscience, 14(9), 919?931.

Zhao, Y., Wang, D., Wang, X., & Chiu, S. C. (2022). Brain mechanisms underlying the influence of emotions on spatial decision-making: An EEG study. Frontiers in Neuroscience, 16, Article 989988.

Zhong, S., Chark, R., Hsu, M., & Chew, S. H. (2016). Computational substrates of social norm enforcement by unaffected third parties. NeuroImage, 129, 95?104.

Zhou, Y., Jiao, P., & Zhang, Q. (2017). Second-party and third-party punishment in a public goods experiment. Applied Economics Letters, 24(1), 54?57.

Zhou, Y., Wang, Y., Rao, L. L., Yang, L. Q., & Li, S. (2014). Money talks: Neural substrate of modulation of fairness by monetary incentives. Frontiers in Behavioral Neuroscience, 8, Article 150.

Zinchenko, O., Belianin, A., & Klucharev, V. (2019). The role of the temporoparietal and prefrontal cortices in a third-party punishment: A tDCS study. Psychology: Journal of the Higher School of Economics, 16(3), 529?550.

Zinchenko, O., & Klucharev, V. (2017). Commentary: The emerging neuroscience of third-party punishment. Frontiers in Human Neuroscience, 11, Article 512.

Zinchenko, O., Nikulin, V., & Klucharev, V. (2021). Wired to punish? Electroencephalographic study of the resting- state neuronal oscillations underlying third-party punishment. Neuroscience, 471, 1?10.

The cognitive and neural mechanism of third-party punishment

Abstract: Third-party punishment (TPP) refers to the punitive behaviors that individuals impose on violators as third parties or observers in order to uphold social norms. Many studies have provided insight into the neural mechanisms underlying TPP behavior. However, few studies have focused on the overall role of functional brain networks. This paper reviews the researches related to TPP in the past decade and summarizes the relevant theoretical models and brain networks. Based on the previous studies, we propose a cognitive neural network model of TPP, which could systematically explain and integrate the neural mechanisms behind TPP behavior. In this model, the affective and reward systems are the TPP power sources, and the cognitive system is mainly responsible for responsibility assessment as well as punishment selection. The reward network, the salient network, the default mode network and the central executive network are involved in different cognitive processing stages, respectively. The model establishes the connection between TPP behavior-related research at the psychological and the cognitive-neural level and provides a more holistic and comprehensive explanation of the mechanisms of TPP behavior. In the future, it is necessary to use meta-analysis or machine learning algorisms in order to explore third-party intervention preferences and the underlying cognitive neural mechanisms in different contextual information and more complex social contexts.

Keywords: third-party punishment, cognitive neural mechanisms, brain network, fMRI

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合