?

漢語同形同音詞的心理詞匯表征
——基于EEG 的語義啟動效應研究①

2023-11-16 16:22靳洪剛

華文教學與研究 2023年4期

關鍵詞：波幅詞義語義

曹慧，靳洪剛

（1.澳門大學人文學院，澳門 519000；2.美國漢明頓大學東亞系，美國，紐約 13323）

語言中一詞多義的現象普遍存在（Taylor，2001），不同詞義稱為詞的義項，義項是詞理性意義的分項說明（黃伯榮、廖序東，2007：274）。在書寫及語音形式上相同，在詞義層面上有兩個或以上意義的詞稱為模糊詞。模糊詞又可分為兩類：多義詞和同音詞②多義詞（Polysemy）是指具有兩個或兩個以上相關詞義的模糊詞，例如，英語單詞“paper”可以指代“報紙（newspaper）”，也可以指代“書寫工具（written paper）”。多義詞通常具有一個基本義（basic meaning），其他意義是根據這個基本義衍生而來，意義間存在一定的關聯性和互補性，也叫互補歧義。同音詞（Homonymy）是指攜帶兩個或兩個以上無關詞義的模糊詞，例如，英語單詞“bank”有兩個含義：“河堤（river bank）”和“金融機構（savings bank）”。Weinreich （1964）指出，同音詞一般產生于歷史的偶然性，需要根據具體語境選擇適當意義，各意義相互排斥，也叫對比歧義。（Weinreich，1964）。本文重點討論其中的同音詞，特別是同形同音詞。同音詞在語言中具有重要的地位，不僅在于其廣泛性，更在于其溝通中的重要地位，即成功的交流必須建立在說話者和聽話者從多種可能的詞義中正確傳達或選取符合情境的意義。同音詞的研究近年頗為興盛，從理論語言學的定義、分類到心理表征模型的建立，逐步發展到結合腦神經手段的實證研究。目前同音詞的心理表征模型主要采用模糊詞的兩種心理表征模型：獨立詞義表征觀和核心詞義表征觀。

盡管目前同音詞的研究不斷涌現，仍有三個方面的不足：其一是同音詞究竟適用哪種心理表征模型，尚未有明確的結論；其二是涉及到心理表征的研究多以拼音文字語言為主，對作為意音文字代表的漢語同音詞的研究則為數甚少；其三是漢語研究的實驗設計仍有待提升，尤其是在語境控制上。

為彌補以上不足，本研究采用認知心理語言學的實證研究方法，以語義啟動為研究范式，結合行為實驗和ERP 腦神經認知研究，對漢語同形同音詞的心理表征進行以下幾個方面的探討：漢語同形同音詞的心理詞匯表征與拼音文字語言的同音詞表征特點是否相同？漢語同形同音詞的主要意義和次要意義的加工速度是否存在差異？漢語同形同音詞的多個意義間是促進還是競爭關系？漢語同形同音詞會遵循哪一種心理表征模型？

1. 現有的同音詞心理表征模型及實證研究范式

1.1 同音詞心理表征模型

心理表征假設主要研究大腦中所儲存的詞義表征、數量、詞義間的連接方式及其連接方式所呈現的強弱差異（趙翠蓮，2006）?；谄匆粑淖盅芯康慕Y果，理論語言學家對多義詞和同音詞在心理詞典中的表征建立了兩種不同心理模型假設：一是核心詞義表征觀（coresense representation），持這種觀點的學者有Nunberg、Caramaza、Grober Rhul 等（趙翠蓮、李紹山， 2006）。核心詞義表征觀認為：同音詞的相關詞義在同一詞條下儲存，心理詞典中只儲存一個基本義（core meaning），其他詞義是通過神經連接及上下文在線啟動獲取的，選取詞義時，各詞義間存在促進加工的作用。在儲存方式上，核心詞義表征觀所代表的是單一詞條模型（single lexicon entry），更加節省儲存空間。二是獨立詞義表征觀（separate-meaning representation），獨立詞義表征觀認為：同音詞的每個詞義都在心理詞典中單獨儲存，選取詞義時根據語境從心理詞典中選擇正確的意義，一次只有一個詞義得到啟動，詞義間存在競爭關系。在儲存方式上，獨立詞義表征觀所代表的獨立詞條模型（separate lexicon entry）需要更多的儲存空間。

近年來，認知語言學研究者對多義詞和同音詞的認知加工及心理表征假設展開了實證調查，以探究這些假設是否存在心理現實性（psychological reality），本研究的目的之一也在于此。

1.2 同音詞心理表征的實證研究范式

對于同音詞心理加工和表征的實證研究，過去主要采用詞匯命名任務、聽覺或視覺化詞匯判斷任務等行為實驗研究方法。語義啟動范式①詞匯間的啟動作用依靠啟動詞和目標詞之間的語義聯系。該范式可以比較不同類型和使用頻率模糊詞的啟動情況，也可以檢驗模糊詞的某個具體意義是否被啟動以及啟動量的多少。（semantic priming paradigm）是調查模糊詞加工的常用范式（王曉平，2011），結合詞匯判斷任務，可以用來觀察不同的啟動詞及目標詞組合的加工速度和正確率的差異，從而判斷語義聯系（McNamara，2005）。正確率和反應時是詞匯判斷任務中兩項重要的指標，反映詞匯啟動的快慢和加工程度。但兩者都是單維指標，僅反映語言加工的綜合結果，無法直觀地證明詞匯的心理加工差異。

因此，越來越多的學者開始結合腦神經實時在線等技術來彌補以上不足，如事件相關電位ERP 技術、fMRI 技術、fNIRS 技術等。

2. 對同音詞的行為及腦神經認知實證研究

本研究關注同音詞中的同形同音詞。同形同音詞按其不同意義的使用頻率可以分為兩種類型：各詞義使用頻率大致相同的同音詞稱為詞義平衡同音詞（以下簡稱“平衡同音詞”）；各詞義使用頻率顯著不同的同音詞稱為詞義不平衡同音詞（以下簡稱“不平衡同音詞”）。使用頻率較高的詞義稱為“主要意義”，使用頻率較低的詞義稱為“次要意義”。同音詞不同詞義的使用頻率影響相應詞義的加工和選擇（Pexman，2004）。

現有的行為實驗和神經語言實驗就下面兩個問題進行了探索，一是同音詞的各意義之間究竟是競爭關系還是促進關系？二是不同頻率詞義之間是否確實存在加工快慢的差異？

2.1 行為實驗研究證據

早期的研究大多致力于模糊詞與非模糊詞之間的比較，Rubenstein et al.（1970）發現當詞頻匹配時，多義詞及同音詞的識別比非模糊詞更快，由此提出了“模糊詞優勢效應”（the ambiguous effect），之后的行為研究結果也大都與這個推測相符合（Hino&Lupker，1996；Pexman et al.，2004）。

上個世紀七十年代、九十年代到二十一世紀的研究（Rubenstein，1970；Hino & Lupker，1996；Klein & Murphy，2001、2012；Pexman et al.，2004）均發現同音詞的加工比非模糊詞更快，同時還證實同音詞和多義詞的加工儲存相似。然而Frost & Bentin（1992）、Rodd et al.（2002、2004）為代表的行為研究則發現同音詞的加工受到詞形（同形、異形），SOA①Stimulus Onset Asynchrony，指從啟動刺激（Prime）呈現起到目標刺激（Probe）呈現出之間的時間。等因素影響，比非模糊詞更慢，為此推論同音詞的詞義間存在競爭關系。

此外，舒華、唐映紅、張亞旭（2000）在不同ISI②Inter Stimulus Interval，刺激間時間間隔，啟動刺激結束到目標刺激開始的時間間隔。條件下，分別考察了漢語孤立狀態和句子語境下的同音詞詞匯判斷，結果發現：（1）孤立狀態下，ISI 無論是0 ms 或-150 ms，與同音詞主要或次要意義有關的探測詞都受到了促進；（2）句子語境下，當ISI 為0 ms 時，在語境一致的條件下，與同音詞主要或次要意義有關的探測詞均受到了促進，在語境不一致的條件下，則未發現任何促進效應；（3）句子語境下，當ISI 為-150 ms 時，只是在語境一致并且探測詞與同音詞的主要意義有關的條件下才觀察到促進效應。該結果說明：漢語同音詞主要意義的啟動比次要意義更快，語境一致時，同音詞的啟動加快，語境不一致時，同音詞的啟動受到抑制。

除了語境作用外，主要意義和次要意義的加工還隨著詞頻、詞匯難度發生變化。如陳寶國、寧愛華（2005）考察了漢字識別中的同音詞效應，發現在低頻詞中存在同音詞劣勢效應，在高頻詞中同音詞比非模糊詞加工更快，表明在低頻同音詞中，存在詞義競爭關系。Armstrong & Plaut（2008）將Rodd et al.（2002）的實驗材料按難易度分成簡單、中等、困難三個等級進行詞匯判斷任務。結果發現，中等和困難等級同音詞的判斷比非模糊詞和多義詞更慢，表明同音詞各意義間的加工關系隨著詞匯難易程度發生變化。

上述行為實驗不但證實同音詞具備“模糊詞優勢效應”，而且還發現同音詞不同意義間的加工差異受到加工條件、語境、詞頻、詞匯難度的影響；進而豐富了語義加工研究上的一些重要細節。但是從心理現實性角度考慮，行為實驗研究的數據不能直接、完全反映大腦對同音詞的實時加工、存儲過程，只能提供一些推測性的行為數據，尤其是反應時可能受到多種因素的影響。因此，需要尋求神經語言學研究范式，來為模糊詞心理表征假設提供更為直觀的證據。

2.2 EEG 神經語言學實驗研究證據

隨著技術的日臻完善，EEG 等新型腦神經科技研究方法被引入語言認知加工研究。ERP技術采用EEG 設備進行測量，這種方法對被試的實驗過程不產生干擾，可以連續、實時地記錄被試的腦電活動，反映被試對于語言項目的加工過程，揭示語言加工的時間進程③使用ERP 研究語言加工有兩種途徑：一種是關注不同腦電成分的屬性、發生源和心理意義等；一種是關注不同實驗刺激的加工過程中，同一種腦電成分的波形差異。。與詞義加工相關的研究主要關注EEG 數據中反映詞義加工的N400 成分和反映后詞匯加工的LPC成分（Kutas&Federmeier，2011）。

目前大多同音詞研究均采用EEG 設備，通過觀察不同語言的詞匯加工過程中的腦電波變化，來推斷同音詞的加工過程，尤其是被認為反映詞匯表征和語義加工的N400 腦波成分。這是因為N400 腦波不僅可以用來比較不同類型同音詞（同形、異形）之間的加工差異，還可以對比同音詞詞不同意義之間的加工速度。在數據分析時，主要關注N400 腦波出現的時間、波幅、區域。

首先，EEG 等腦神經實驗不但證實“模糊詞優勢效應”，還探索了加工速度的不同。如Pexman et al.（2017）發現詞義更豐富的詞語具有更快的加工速度。Kounios et al.（2009）發現詞語的詞義豐富性可以降低激活的N400波幅。與之相反，Rabovsky et al.（2012）發現在大腦中央區域的電極點，語義較豐富的詞語具有更大的N400 波幅。

其次，更多的實驗調查了同音及多義詞的主要和次要意義間的加工差異。如在ERP 研究中，Klepousniotou et al.（2012）通過詞匯判斷任務發現：在腦中部電極分析中，相關目標詞比無關目標詞N400 波幅有所減低，顯示了語義啟動作用。在腦兩側電極點分析中，不平衡同音詞的主要意義比次要意義具有更強的啟動作用，在左右半腦其N400 波幅都更??；次要意義也有一定的啟動作用，主要出現在左腦，因此推斷不平衡同音詞的主要意義和次要意義之間存在語義加工差異和左右半腦差異。MacGregor et al. （2015）采用Klepousniotou et al.（2012）的實驗材料，發現在750 ms 的ISI之后，多義詞的主要意義和次要意義都顯示出啟動效應，表明多義詞的各意義間相互促進，使其啟動狀態得到了保持；但是該實驗并沒有觀察到同音詞的主要意義和次要意義的啟動。

再次，一些不同語言（俄語、英語、西班牙語、漢語）的ERP 研究證實了同音詞不同意義的加工差異。如Yurchenko et al.（2018）以俄語作為研究目標，發現了與MacGregor et al.（2015）相似的實驗結果，推斷同音詞詞義間的競爭關系導致了同音詞各意義的衰退。Meade & Coch（2017）以英語不平衡同音詞作為研究目標，結果發現：不平衡同音詞的主要意義和次要意義相關目標詞都產生了比意義無關目標詞更小的N400 波幅，反映了語義啟動促進作用。同時，在左半腦，主要意義比次要意義目標詞的啟動效應更強，右半腦則沒有顯著差異。LPC 波幅反應了后詞匯加工效應，即主要意義和次要意義詞之間沒有顯著差異，但二者都產生了比意義無關詞更小的LPC 波幅。據此推斷同音詞意義之間存在競爭關系。Haro et al.（2017）以西班牙語為實驗材料，首次比較了單獨呈現的同音詞和多義詞加工過程。實驗發現，同音詞和多義詞在反應時、正確率和N400 波幅上都沒有表現出顯著差異。Huang &Lee（2018）對漢語雙字詞進行了研究，將一個漢字的多個意義分為兩種類型：相關詞義和不相關詞義。結果顯示：擁有多個相關詞義的詞匯，其加工受到促進，體現為更快更準確的詞匯判斷，更小的N400 波幅和更大的LPC 波幅；而詞匯擁有的不相關詞義數量越多，其加工越慢，體現為更低的詞匯判斷正確率、更大的N400 波幅。表明同音詞的不相關詞義之間存在競爭關系，相關詞義則具有相互促進關系。

上述對同音多義詞的EEG 腦神經實驗從不同角度證實了“模糊詞優勢效應”，并確定了不同意義的相對加工速度及其影響因素，但是對于同音詞語義的心理加工方式仍無定論（詳見下節討論）。

2.3 漢語同音詞研究不足和本實驗研究問題

總結上述實驗可知，對同音詞的研究仍存在爭議和不足，需要更多的實證數據來進一步確立心理表征模型，調整、完善實驗材料及實驗設計。

就心理表征模型而言，盡管ERP 研究的結果可證實同音多義詞比非模糊詞具有更強的語義啟動作用，表現為更快、更準確的詞匯判斷和不同的N400 波幅，支持“模糊詞優勢效應”假說，但不同的實驗結果使得學者們對同音詞詞義之間的關系存在兩種不同的解釋。一些實驗表明（Cottrell & Small，1983；Seidenberg et al.，1982），同音多義詞具有相似的存儲特征，各詞義間也存在促進關系，因此遵循“核心詞義表征模型”。但另一些實驗則認為同音詞和多義詞的儲存方式遵循“獨立詞義表征模型”，即同音詞的多個不相關詞義在心理詞典中是分開儲存的，在加工具體詞義前需要從不同詞條中選取詞義，詞義間是競爭關系，選取過程會造成加工時間上的延遲。此外，還有一些研究證實同音詞的主要意義和次要意義的加工存在差異，主要意義的啟動時間更早，加工速度更快，加工范圍更廣，存在左右半腦差異（Pylkk?nen et al.，2006；Klepousniotou et al.，2012；Meade&Coch，2017）。顯而易見，以上不同推論仍需進行進一步的實驗探索，尤其是非拼音語言（如漢語）的數據的進一步證實。

從實驗材料來看，以上研究主要集中在拼音文字語言。例如：英語（Klein & Murphy，2001；Klein & Murphy，2002）、西班牙語（Haro et al.，2017）、希伯來語（Bentin et al.，1984；Frost & Bentin，1987；Frost & Bentin，1992）、俄羅斯語（Yurchenko et al.，2018），以漢語為實驗材料的研究相對較少。漢語屬意音文字系統，與其他印歐語系語言在書寫形式上存在巨大的差異。目前漢字數量已超過8 萬字，但漢語音節數量十分有限①盧偓（2001）以《現代漢語規范字典》為依據，統計出現代漢語基本音節1265 個。。大量的漢字采用相同的語音形式，使得漢語中有豐富的同音字詞。漢語同音詞分為同形同音詞（如“大氣污染”與“大氣磅礴”中的“大氣”dàqì”）和異形同音詞（如“利益lìyì”-“立意lìyì”）兩種類型（符淮青，1985）。本研究采用視覺化詞匯判斷任務，首次針對漢語同形同音詞進行其心理表征及加工的探索。

從實驗設計來看，漢語同形同音詞的實證研究通常是在句子語境中呈現（封嬌媛，2013；任桂琴等，2007、2009、2012），或以同音單字作為實驗材料，以獨立形式呈現（Huang&Lee，2018）。句子語境可以為模糊詞消歧過程提供一定的作用，但對于同音詞具體詞義的選擇，有時候句子語境的作用會超過詞義使用頻率，進而無法判斷句子語境下同音詞不同詞義的加工過程。

針對以上研究的不足，本研究將聚焦在漢語同形同音詞，采用經典語義啟動范式，以最小語境-詞對形式作為實驗材料，消解句子語境的影響。結合高時間分辨率的ERP 技術，更加直觀地觀測具體意義的大腦啟動情況和語義加工的時間進程。實驗重點回答以下三個研究問題：

（1）漢語不平衡同音詞的主要意義和次要意義的儲存和加工是否存在差異？如存在差異，反映在行為與ERP 數據上具體是什么差異？

（2）其差異反映在大腦何處？是否存在大腦中線和兩側區域差異？是否存在腦左右半球差異？是否存在腦前中后區域差異？

（3）漢語同音詞的不同詞義遵循哪種心理表征模型？

3. 漢語同形同音詞研究方法

3.1 被試

26 名（12 男、14 女）澳門大學碩士、博士研究生參與本實驗。被試均為從小使用漢語的母語者，在大陸漢語環境接受基礎教育及本科教育。被試語言功能正常，視力或矯正視力正常，無認知障礙，無腦外傷和神經系統疾病史，此前未參加過此類實驗。平均年齡25.81歲（范圍22.48-31.71，SD=2.84），平均受教育年限18.57 年（范圍17-23，SD=1.90），均為右利手。②由愛丁堡利手清單評估Edinburgh Inventory，Oldfield，1971。每位被試均簽署知情同意書，實驗完成后獲得80 澳門幣作為報酬。被試基本情況見表1。

表1：被試基本情況

3.2 實驗材料

本研究以漢語雙字詞作為實驗材料，每組材料由一個啟動詞和一個目標詞組成。

3.2.1 啟動詞的選取

36 個不平衡同音詞被選為啟動詞。本實驗中的不平衡同音詞選用《現代漢語詞典》（第7版）中列為兩個詞條的詞匯，即所有同音詞被認為有且只有兩個不同意義。同音詞每個詞義的使用頻率來自對國家語委標注語料庫③國家語委標注語料庫是目前規模最大的現代漢語平衡語料庫，總計約1 億字符。的“現代漢語語料庫”（www.cncorpus.org），并對其中的語料進行分析統計。不平衡同音詞使用頻率更高的詞義在本研究中作為“主要意義”，詞義在語料庫中的平均使用頻率為81.36%（范圍60-99.6%）；使用頻率較低的詞義在本研究中作為“次要意義”，詞義在語料庫中的平均使用頻率為17.51%（范圍0.2-40%）。

3.2.2 目標詞的選取

實驗選取四種類型的目標詞：（1）與啟動詞主要意義相關的雙字詞；（2）與啟動詞次要意義相關的雙字詞；（3）與啟動詞意義無關的雙字詞。目標詞（1）和（2），通過詞林（cilin.org）、漢辭網（hydcd.com）等網站在線搜索啟動詞的同義詞或近義詞獲得，或由3 名中文專業的母語者根據語言經驗提供，并查詢詞典驗證語義相關性。

28 名漢語母語者（不參加正式實驗）對啟動詞與選取的各組目標詞之間的語義相關度進行在線評定。①采用6 分萊克特量表在線問卷調查，將語義相關度標注為0-5 分。0 分表示意義無關，1-5 分表示意義相關，相關程度越高，則分值越高。如1 分表示“詞義有微弱聯系”，2 分表示“詞義有一定聯系”，3 分表示“詞義有較大聯系”，4 分表示“詞義近似”，5 分表示“詞義相等”。評分高于1 分的詞語作為意義相關目標詞，評分低于1 分的詞語作為意義不相關目標詞。

另有根據評分結果，實驗從45 個同音詞中，排除4 個意義較難理解的低頻詞，5 個目標詞相關度評分不合用的同音詞，剩余36 個同音詞作為實驗啟動詞。分值高于1 的目標詞選作詞義相關目標詞（1）和（2），二者中語義相關度和使用頻率較高的作為（1），語義相關度和使用頻率較低的詞作為（2）。分值低于1 并趨近于0 的目標詞選作詞義無關目標詞。將（1）（2）（3）組目標詞在語料庫中的使用頻率進行匹配，組間無顯著差異，F（2，36）=0.128，p=0.880，三組目標詞平均使用頻率為153.06 次（范圍：0-975）；將（1）（2）（3）組目標詞目標詞的雙字筆畫數和進行匹配，組間無顯著差異，F（2，36）=0.006，p=0.995，平均雙字筆畫數和為15.14 畫（范圍：7-27）。主要意義相關目標詞的語義相關度平均值為3.53（范圍：2.14-4.71），次要意義相關目標詞的語義相關度平均值為2.30（范圍：1.43-3.71），無關目標詞的平均相關度分值為0.41（范圍0-0.86）。見表2。

表2：啟動詞各意義使用頻率、目標詞類型、目標詞詞頻、筆畫數和、語義相關度平均值

除108 組啟動詞—目標詞作為實驗材料外，108 組啟動詞—填充詞作為填充材料。填充詞為文字合法的假詞②由兩個真字組成的字符串，不存在于詞典及語料庫，也不具備與真詞近似的讀音，例如：傳千，訊一。。216 組實驗材料采用拉丁方的方式分成三個實驗節（block），每個實驗節包含72 組刺激材料，使用E-prime 2.0隨機呈現。

3.3 實驗程序

采用E-prime 2.0 呈現實驗任務，并收集被試完成任務時的反應時和正確率。ERP 數據采用BP 公司生產的32 導10-20 標準電極帽（Acti-Cap，Brain Products，Germany）采樣，PyCorder V1.0.9 軟件（Brain Products，Germany）收集數據。放大器為ActiCHamp Amplifier （Brain Products，Germany）。

26 個被試獨立參加實驗，準備時間約20-30 分鐘，主要是佩戴電極帽及注射導電膏并等待電阻下降，正式實驗時長約30 分鐘。實驗室保持安靜及較暗環境，溫度適宜（24℃），被試坐在高度合適的椅子上，雙眼平行注視屏幕，視距約70 cm。

實驗任務為詞匯判斷。刺激呈現方式為黑底白字的文字圖片（宋體，字號23）。每個trail開始前在屏幕中央呈現一個“+”號注視點，提示被試注意進入實驗?！?”號呈現時間為500 ms，之后呈現200 ms 空屏，空屏后在屏幕中央呈現啟動詞，啟動詞呈現時間為500 ms，之后經過1200 ms 的空屏延遲后呈現目標詞。目標詞呈現時間為500 ms，500 ms 后屏幕中央呈現“？？？”界面，要求被試在看到“？？？”呈現后既快又準確地判斷“？？？”前呈現的目標詞是否為真實的漢語詞匯。如果目標詞為真詞，被試需要使用左手食指按下鍵盤上貼有“√”標簽的“F”鍵；如果目標詞為假詞，被試需要使用右手食指按下鍵盤上貼有“×”標簽的“J”鍵?！?？？？”停留在屏幕上，直到被試做出按鍵反應或超時（最長呈現時間為1300 ms）直接進入下一個trial。具體實驗流程見圖1。

圖1：實驗流程圖-刺激呈現時間表

E-prime 第一個界面為實驗任務說明和操作的指導語，被試閱讀完成后，可以點擊空格鍵進入練習階段。練習階段包含8 個試次，每個試次后，被試將得到詞匯判斷結果反饋。主試確認被試充分理解實驗任務和操作后進入正式實驗階段，正式實驗分為三個實驗節，每個實驗節間設置休息時間。正式實驗階段無詞匯判斷結果反饋。

3.4 腦電記錄和數據處理

本實驗使用德國Brain Products 公司生產的32 導腦電記錄系統收集腦電數據，左側乳突電極TP9 作為參考電極，設置水平眼電（HEOG）和垂直眼電（VEOG）電極。ERP 數據使用ERPLAB Toolbox V 7.0.0 （Matlab R2017a 安裝包）進行脫機處理，數據分析和波形圖繪制以目標詞呈現前100 ms 作為基線，分析從目標詞呈現前100 ms 至目標詞呈現后900 ms 的腦電數據并繪制波形圖。實驗數據分為主要意義相關目標詞、次要意義相關目標詞、意義無關目標詞三個對照組。

4. 漢語同形同音詞實驗結果

結果應用SPSS 21 進行數據分析，使用Greenhouse-Geisser 進行校正。

為保證數據質量，僅保留正確率高于70%的被試數據。1 名被試正確率低于70%，其行為數據和腦電數據被排除，最終行為數據分析樣本數為25。1 名被試在實驗過程中有過多頭部動作和眨眼，1 名被試在腦電記錄過程中電阻過大（＞25kΩ）被排除，最終腦電數據分析樣本數為23。

4.1 行為數據

反應時和正確率兩項行為數據被用作分析。反應時從“？？？”呈現開始記錄，如果被試在“？？？”呈現前按鍵，或在“？？？”呈現后1300 ms 內未能做出按鍵反應，該試次的反應時將不被記錄。因反應時從“？？？”呈現開始記錄，統計的反應時數據均加上500 ms后進行分析。

4.1.1 詞匯判斷正確率

主要意義相關目標詞平均正確率為92.7%（SD=0.9%），次要意義相關目標詞平均正確率為90.4%（SD=1.2%），意義無關目標詞平均正確率為90.9%（SD=1.0%）。采用重復測量方差檢驗，三種類型目標詞組間主效應差異不顯著，F（2，422）=1.355，p=0.259（表3，圖2A）。

圖2：詞匯判斷正確率（%）及反應時（ms）

表3：行為數據：正確率（%）和反應時平均值（標準差）

4.1.2 詞匯判斷反應時（僅正確試次）

反應時分析只針對正確試次。為避免極端值的影響，以每個被試為單位，將每個被試反應時數值中高于或低于2 個標準偏差（± 2SD）的數值去除。去除極值后，主要意義相關目標詞的平均反應時為758.41 ms，次要意義相關目標詞平均反應時為754.65 ms，意義無關目標詞平均反應時為760.21 ms。三種類型目標詞反應時無顯著差異，F（2，215）=0.276，p=0.760（表3，圖2B）。

4.2 ERP 數據

根據矢狀軸和冠狀軸選取9 個興趣區（Region of Interest，ROI）：左-前（F3），中-前（Fz），右-前（F4），左-中（C3），中-中（Cz），右-中（C4），左-后（P3，O1），中-后（Pz，Oz），右-后（P4，O2）區域。每個ROI 的電壓值是興趣區內各電極點的平均波幅。

圖3 呈現了興趣區各電極點在-100-900 ms的ERP 波形圖對比，從大致波形來看，在目標詞呈現后200 ms 內，三種類型的目標詞沒有呈現出明顯的波形差異。

圖3：平均波形圖

本研究對兩種ERP 數據進行了分析：N400成分和LPC 成分。因漢語N400 成分出現略早于其他語言（Huang&Lee，2018），本研究以250-450 ms 為時間窗分析N400 成分，以450-600 ms 為時間窗分析LPC 成分。

以N400 和LPC 兩個時段的平均電壓值為因變量，進行四組ANOVA 重復測量方差分析：3（目標詞類型：主要意義相關、次要意義相關、意義無關）*1（全部電極點）；3（目標詞類型：主要意義相關、次要意義相關、意義無關）*2（腦區：中線、兩側）； 3（目標詞類型：主要意義相關、次要意義相關、意義無關）*2（半腦：左半腦、右半腦）；3（目標詞類型：主要意義相關、次要意義相關、意義無關）*3（腦區：額區、中央區、頂區）。中線考察四個電極點（Fz，Cz，Oz，Pz），兩側考察八個電極點（F3/4，C3/4，P3/4，O1/2），左半腦考察左側四個電極點（F3，C3，P3，O1），右半腦考察右側四個電極點（F4，C4，P4，O2）。大腦前部額區考察三個電極點（F3，Fz，F4），中部中央區考察三個電極點（C3，Cz，C4），后部頂區考察6 個電極點（P3，O1，Pz，Oz，P4，O2）。

4.2.1 N400（平均波幅：250-450 ms）

分析9 個興趣區全部電極的平均波幅，目標詞類型主效應顯著，F（2，44）= 8.449，p=0.001，p＜0.05。成對檢驗發現，主要意義相關目標詞和次要意義相關目標詞間存在顯著差異，p=0.002，p＜0.05；主要意義相關目標詞和意義無關目標詞間存在顯著差異，p=0.016，p＜0.05。主要意義相關目標詞比次要意義相關目標詞和意義無關目標詞激發了更大的N400 波幅。

中線電極點不同語義相關度目標詞之間存在顯著差異，F（2，44）= 5.268，p= 0.009，p＜0.05。成對檢驗發現，主要意義相關目標詞和次要意義相關目標詞差異顯著，p=0.015，p＜0.05。主要意義相關目標詞比次要意義相關目標詞激發了更大的N400 波幅。

兩側電極點不同語義相關度目標詞之間存在顯著差異，F（2，44）=6.894，p=0.002，p＜0.05。成對檢驗發現，主要意義相關目標詞和次要意義相關目標詞差異顯著，p=0.005，p＜0.05；主要意義相關目標詞與意義無關目標詞存在顯著差異，p=0.026，p＜0.05。主要意義相關目標詞比次要意義相關目標詞和意義無關目標詞激發了更大的N400 波幅。

比較中線及兩側電極N400 波幅存在顯著效應，F（1，22）=8.429，p=0.008，p＜0.05；中線電極比兩側電極激發了更大的N400 波幅，這與N400 一般出現在中線電極的特點相符合。觀察中線/兩側區域*目標詞類型的交互作用，存在顯著差異，F（2，44）= 4.795，p= 0.013，p＜0.05。主要意義相關目標詞比次要意義相關目標詞和意義無關目標詞激發了更大的N400波幅。

在左半腦電極點，三種不同語義相關度目標詞之間存在顯著差異，F（2，44）=4.572，p=0.031，p＜0.05。兩兩比較發現，主要意義相關目標詞和次要意義相關目標詞之間存在顯著差異，p=0.023，p＜0.05。在左半腦，主要意義相關目標詞比次要意義相關目標詞激發了更大的N400 波幅。在右半腦電極點，三種不同語義相關度目標詞之間也存在顯著差異，F（2，44）=7.891，p=0.001，p＜0.05。兩兩比較發現，主要意義相關目標詞和次要意義相關目標詞之間存在顯著差異，p=0.004，p＜0.05；主要意義相關目標詞和意義無關目標詞之間存在顯著差異，p=0.008，p＜0.05。主要意義相關目標詞在右半球比次要意義相關目標詞、意義無關目標詞激發了更大的N400 波幅；比較左右半腦N400 波幅，存在顯著差異，p=0.001，p＜0.05。左半腦比右半腦具有更大的N400 波幅，表現出左側化效應。觀察目標詞類型和左右半腦的交互作用發現，不存在顯著差異。

分析大腦前中后部區域，主要意義相關目標詞比次要意義相關目標詞激發了更大的N400 波幅。以前中后三個區域電極點為變量，三種類型目標詞N400 波幅存在主體內顯著效應，F（2，44）=8.914，p=0.004，p＜0.05。成對檢驗發現，前部區域和后部區域間存在顯著差異，p=0.028，p＜0.05；中部區域和后部區域間存在顯著差異，p=0.008，p＜0.05。大腦后部區域比中部區域和前部區域激發了更大的N400 波幅。不同語義相關度和大腦前中后區域不存在交互作用。

4.2.2 LPC（平均波幅：450-600 ms）

分析9 個興趣區全部電極的平均波幅，不同類型目標詞間存在主體內效應，F（2，44）=3.273，p=0.047，p＜0.05。成對檢驗發現，三者間兩兩沒有顯著差異。

中線電極點不同語義相關度目標詞之間不存在主體內顯著差異，F（2，44）= 1.852，p=0.169。兩側電極點不同語義相關度目標詞之間存在主體內顯著差異，F（2，44）=4.106，p=0.023，p＜0.05。成對檢驗發現，三者間兩兩沒有顯著差異。比較中線及兩側電極LPC 波幅不存在顯著差異。觀察中線/兩側區域*目標詞類型的交互作用，不存在顯著差異。

分析左半腦電極點，三種不同語義相關度目標詞之間不存在顯著差異。分析右半腦電極點，三種不同語義相關度目標詞之間不存在顯著差異。觀察目標詞類型和左右半腦的交互作用發現，不存在顯著差異。

分析大腦前部額區電極點，不同語義相關度目標詞之間存在顯著差異，F（2，44）=4.528，p=0.030，p＜0.05。成對檢驗發現，三者間兩兩不存在顯著差異。分析大腦中部中央區電極點，不同語義相關度目標詞之間不存在顯著差異。分析大腦前部額區電極點，不同語義相關度目標詞之間不存在顯著差異。

三個不同腦部前中后區域激發的LPC 波幅存在顯著差異，F（2，44）=12.454，p=0.001，p＜0.05。成對檢驗發現，前部區域和后部區域間存在顯著差異，p=0.015，p＜0.05；中部區域和后部區域間存在顯著差異，p=0.001，p＜0.05。大腦后部區域比中部區域和前部區域激發了更負的波形，即更小的LPC 波幅。

不同語義相關度和大腦前中后區域在LPC 波幅上不存在交互作用，F（2，44）=1.393，p=0.258。

5. 結論及余論

本研究使用事件相關電位技術，以視覺化詞匯判斷為任務，對漢語不平衡同音詞各意義的加工差異（行為、腦電波）進行調查，實驗結果為不平衡同音詞各意義加工的時間進程和啟動程度提供了證據。

5.1 行為實驗結果

在與實驗關鍵刺激同音啟動詞有關的三種目標詞類型（主要意義相關、次要意義相關、意義無關）中，反應時和正確率均無顯著差異，因此無法對三者進行比較。在強調速度和準確度的詞匯判斷任務中，很可能由于同音詞語義間的競爭關系，導致了啟動詞的啟動優勢消失，從而使得目標詞的判斷速度和正確率并無差別。分析實驗任務的原因，對漢語母語者來說，詞匯判斷是一種相對自動化，對認知負荷要求較低的任務，因此被試可以快速而準確地對所有刺激材料做出判斷，其加工難度還不足以讓被試在正確率和反應速度上產生顯著差異。

在實驗設計上，由于本實驗采取的是延遲的詞匯判斷任務，目標詞呈現后500 ms 才出現“？？？”，要求被試做出判斷。也就是說，當被試可以進行詞匯判斷時，已經距離目標詞的呈現500 ms，對于母語水平的被試來說，詞匯判斷也許不一定需要500 ms 以上，被試很有可能在目標詞呈現的過程中就已經完成了詞匯判斷，因此反應時的參考價值有待考證。同理，在很多類似的延遲詞匯判斷實驗中，反應時并不作為結果進行數據分析。此外，以上行為數據結果還說明，單純使用行為實驗研究很可能無法觀察到大腦實時加工的細節過程及語義表征之間的差異。

5.2 腦電實驗結果

本實驗腦電數據發現，在目標詞呈現后的450-600 ms 內，三種類型目標詞均觀察到了LPC 成分。通過分析9 個興趣區電極點和4組重復測量方差分析，只在大腦前中后部區域發現了顯著差異。后部區域比前部和中部區域則具有更大的LPC 波幅，這與之前研究中發現的LPC 成分主要出現在后部區域的結論一致。

本實驗N400 成分數據結果與以往研究的結論不盡相同。在大腦的各個區域，主要意義的N400 波幅都大于次要意義。同時，大腦的中線、左半腦和后部頂區均具有更大的N400 波幅。這一結果顯示，主要意義相關目標詞激發了最大的N400 波幅，次要意義相關目標詞和意義無關目標詞則沒有顯著差異，對這一結果出現，我們認為可以從以下三方面進行解釋：

第一，本實驗所獲的N400 波幅反映意義啟動的一般進程，即主要意義相關目標詞相對于次要意義獲得更大的語義啟動量。如同所有N400 一樣，不只是出現在語義期待違反一項，一切具有意義的內容，即使是非語言刺激都可以誘發N400。此外，本實驗發現的主要意義N400 波幅與Macgregor et al.（2015）的實驗一致，反映“語義保持效應”，即同音詞和語義相關目標詞之間的語義聯系使得主要意義相關目標詞的詞義獲得了最大波幅，進而有更長的保持時間；而次要意義的保持程度較低，意義無關目標詞則不具備語義聯系帶來的意義保持。這一結果也支持了Rabovsky et al.（2012）的推論，即語義豐富的詞具有更大的N400 波幅，啟動詞和目標詞之間的語義相關性或語義重復激發更多的意義加工，啟動詞和目標詞的意義相互促進，因此主要意義相關目標詞誘發的大腦皮層活躍程度更高，具有了比次要意義相關目標詞、意義無關目標詞更大的N400波幅。相反，次要詞義相關目標詞與啟動詞之間的聯系較弱，在較長的ISI 和SOA 后，次要意義的啟動隨時間開始衰退。意義無關目標詞因為和啟動詞沒有構成語義關系，作為孤立的詞匯，啟動量較小，其結果為弱小的N400波幅。

第二，本實驗呈現的主要意義相關目標詞和次要意義相關目標詞之間的波幅差異為前人提出的“詞義競爭模型”提供了腦神經證據（Beretta et al.，2005；Pylkk?nen et al.，2006；Klepousniotou et al.，2012；MacGregor et al.，2015；Meade & Coch，2017）。波幅差異說明同音詞的主要意義和次要意義之間存在競爭關系，主要意義較其他意義激活程度更高，較易競爭出勝。次要意義的競爭能力相對較弱，因此競爭關系和啟動作用相互抵消，降低了同音詞的啟動優勢效應，使次要意義相關目標詞和意義無關目標詞沒有呈現出顯著腦波差異。

第三，本實驗結果顯示了“詞性效應”，即詞匯識別與詞性有關。詞匯識別時，動詞和名詞在ERP 的N200、N400 和P600 波幅上也存在差異，這一結果與Frazier & Rayner，1987；張欽等，2003；易保樹、倪傳斌，2018的研究等結果一致，相對于之前的漢語實驗以模糊詞為詞匯判斷對象，本實驗使用目標詞作為詞匯判斷對象，判斷難度較低，可能難以體現出組別間的差異。此外，“詞性效應”還表現在在本實驗選取的材料中，意義無關目標詞主要選取為名詞，意義相關詞則跟啟動詞保持一致，存在不同的類型。由于大腦對于不同詞性詞語的儲存和加工存在差異，其行為數據和腦電數據也可能隨之受到影響。雖然本實驗選取的材料均為漢語雙字詞，匹配了目標詞的使用頻率和雙字筆畫數和，但雙字詞匯還可能受到字頻，字形（如左右結構、上下結構等）等因素影響（Pexman，2001、2002），都可能造成由詞性引起的加工差異。

第四，關于左右半腦的差異，本實驗結果顯示，在同音詞加工的初期階段，左半腦的啟動更加明顯一些，而到了后期整合加工階段，兩個半腦的啟動沒有顯著差異。這一結果支持大量已有研究的結果，即對于大多數右利手而言，左半腦主要負責語義的加工（夏全勝等，2014）。這表明，在模糊詞加工如同其他語義加工一樣，在整個過程中，各個半腦都發揮了各自的功能。對于腦皮前后區域的分布，兩種ERP 數據都發現后部啟動量比前部和中部啟動量更大，這與以往的實驗結果一致。

為此，針對本研究擬探討的三個問題，本實驗ERP 數據結果可以做出以下回答：

（1）漢語不平衡同音詞的主要意義和次要意義的儲存和加工存在競爭關系及加工差異。這一差異盡管無法在行為數據上得到明確的體現，但在腦電波數據上得到證實，主要反映N400 和LPC 波幅上的差異。

（2）在N400 波幅上，主要意義和次要意義的激活區域雖然大致相同，即在大腦的中線、兩側、左半腦、前中后區域，但在激活度及保持時間上都存在顯著差異，主要意義具有更顯著、更高的激活量和意義保持。在LPC 波幅上，也可以發現大腦后部區域比前、中部區域呈現出更大的激活量。

（3）盡管本實驗證實漢語不平衡同音詞的不同詞義在大腦中的激活程度有所不同，但本實驗結果還無法證實，漢語不平衡同音詞最終遵循哪一種心理表征觀，是促進作用的核心詞義表征觀還是競爭作用的獨立詞義表征觀？這是由于次要意義相關目標詞和意義無關目標詞之間始終沒有呈現出顯著差異，因此，目前尚無法做出推論，有待于更多的ERP 實證研究的設計，以便進一步考證。

5.3 研究意義

本研究從以下幾方面推進了學界對于同音多義詞心理表征問題的研究。

從實驗材料來看，相比以往研究，本研究的材料選取具有科學性和可信度。本實驗的同音詞選取自最新最權威的《現代漢語詞典》（第7 版）。林進展（2012）指出，詞典是詞義標注和消歧的重要資源。在漢字認知中，筆畫數、部件、結構特征、頻率等均會影響加工過程，其中詞頻是影響漢語詞匯加工的重要因素（陳寶國、王立新、彭聃齡，2003），本研究使用權威的網站和細致的評分標準，匹配了目標詞詞頻、語義相關度、筆畫數。

從研究方法來看，漢語同音詞研究不但為數不多，而且停留在句末呈現語境和單獨呈現范式。本實驗打破這一常規，采用經典語義啟動范式，以最小語境-詞對形式作為實驗材料，結合高時間分辨率的ERP 技術，可以更加直觀地判斷具體意義啟動情況，消解句子語境帶來的影響，并清晰地觀測到大腦語義加工的時間進程和大腦活躍程度。本研究的結果部分支持了以往的研究，表明同音詞的不同意義間主要存在競爭關系，同時與以往研究在行為和ERP 數據上存在差異，為心理表征假設提供了一些新的思考。在時間窗的選取上，本實驗結合了現有的漢語實驗結果，即漢語的N400效應相對其他語言提早出現（王小潞，2007；Huang & Lee，2018），本實驗設計與Huang &Lee（2018）相同，將N400 時間窗選取為250-450 ms，LPC 的時間窗口選取為450-600 ms，保證了對模糊詞加工的全程觀察。

從詞匯本體研究的角度來看，本實驗研究的同形同音詞是現代漢語詞匯的重要組成部分，尤其是同義詞的語義競爭關系、主要意義與次要意義的波幅差異等對同形同音詞的研究，現代漢語詞匯體系的研究，漢語詞匯學研究等提供了重要的腦神經數據基礎。此外，詞匯研究與詞典編撰有著緊密的聯系，以ERP 技術為主導的詞匯實證研究可以為詞典編撰系統提供原始的依據，特別是對心理詞典的研究，為語言用戶提供具有說服力的模糊詞儲存和加工模型，有助于顯示詞義在心理詞匯中的儲存狀況和提取途徑，驗證理論語言學的假設。

在教學方面，本文證實漢語同音詞的部分心理表征特征，如主要意義與次要意義之間的競爭關系、詞性效應等都可以直接或間接應用到實際詞義教學中，特別是根據科學數據形成的主要意義與次要意義的區別。肖二平等（2012）提到，對于漢語同音詞心理表征的研究有助于揭示產生同音錯別字的原因和機制，規范人們的語言運用，并為語文教學提供指導。此外，漢語存在的大量同音不同形的語素（同音字）和同形不同義的語素（多義字），給第二語言學習者學習漢字、詞匯造成了很大困難（張琦、江新，2015），模糊詞研究雖然為數不多，但值得大力推廣，可以為漢語字詞教學提供一些參考和幫助。

5.4 研究局限

本研究對于漢語不平衡同音詞各意義的加工，提出了一些新的材料選取方法，得出了一些全新的實驗結果，但本實驗也存在一些問題和局限。

由于之前沒有標準化的不平衡同音詞表，本研究對語料的選取都基于詞典條目和語料庫，很有可能在以下方面存在不足。首先，漢語同音詞各意義的使用頻率沒有現存的數據，依賴人工核算難免有失偏頗。其次，語料庫中的文獻數據主要來自于文學作品，時間跨度為1919—2002 年，以近20 年的語料為主，文學作品中詞匯的使用頻率和真實的語言使用頻率存在一定的差距，該差距亦不能進行量化。第三，本研究選取的啟動詞和目標詞之間的語義關系為近義關系，未有考慮反義關系和搭配關系，林進展（2012）指出，不同的語義關系可能影響詞匯間的關聯程度。另外，部分同音詞啟動詞和目標詞之間存在相同的漢字，正字法效應可能對加工過程產生一定的影響。

本實驗的詞匯判斷任務，不需要做出與啟動詞相關的語義關聯判斷，對于認知的負荷量較小，無關目標詞無需與啟動詞進行關聯，其啟動量相應也較小。今后實驗可以考慮采取判斷啟動詞與目標詞之間是否存在語義關聯的任務，會更加直觀地展示意義啟動差異。

本研究只探討了N400 和LPC 這兩種公認的與詞匯加工相關的ERP 成分，對于可能存在的其他腦電成分，沒有進行更多的觀測。此外，ERP 的空間分辨率較低，對此問題的探討還需要結合其他空間分辨率更高的神經語言學技術，如fMRI 等進一步探究同音詞語義加工的神經心理機制。

5.5 未來的研究方向

對于未來的研究方向，不論從理論建設還是實際應用角度，同音詞的心理表征的研究價值都不容忽視。特別是漢語同音詞的實證研究還處在初步探索階段，今后的研究尚需從多種角度進行重復驗證和深入拓展。

漢語同音詞是漢語詞匯重要的組成部分，未來的研究可以增加其他類型，如多義詞，并對比漢語同音詞和多義詞的加工。此外，還可以對模糊詞的兩種類型，同音詞和多義詞進一步細化，比如將同音詞分為語法同音詞和非語法同音詞，多義詞分為隱喻多義詞和轉喻多義詞，對各個具體類型進行研究對比。

此外，學界對同音詞的研究主要服務于漢語詞匯本體的理論基礎建設和詞典的編纂，而較少關注漢語作為第二語言的同音詞研究。由于不同文字系統的語言存在較大差異，未來還可以研究二語者對于漢語同音詞的詞加工與母語者的異同。漢語中的同音詞不僅給母語者帶來理解障礙，還有可能增加二語學習者的學習難度，今后可以探討漢語同音詞對于二語學習者詞匯學習的影響，為漢語教學者和將漢語作為第二語言的學習者提供一些教與學方法上的指引。

未來的研究需要繼續結合理論語言學和神經語言學，用理論語言學指導神經語言學研究，同時用神經語言學為理論語言學提供證據支持。

猜你喜歡

波幅詞義語義

開封市健康人群面神經分支復合肌肉動作電位波幅分布范圍研究

癲癇與神經電生理學雜志(2022年6期)2022-02-10

西夏語“頭項”詞義考

西夏研究(2020年1期)2020-04-01

語言與語義

開放教育研究(2020年2期)2020-03-31

開不同位置方形洞口波紋鋼板剪力墻抗側性能

價值工程(2018年25期)2018-09-26

詞義辨別小妙招——看圖辨詞

新高考(英語進階)(2018年3期)2018-05-14

考慮傳輸函數特性的行波幅值比較式縱聯保護原理

西南交通大學學報(2016年4期)2016-06-15

“上”與“下”語義的不對稱性及其認知闡釋

現代語文(2016年21期)2016-05-25

頻率偏移時基波幅值計算誤差對保護的影響及其改進算法

華北電力大學學報(自然科學版)(2016年3期)2016-04-25

認知范疇模糊與語義模糊

大連民族大學學報(2015年2期)2015-02-27

字意與詞義

語言與翻譯(2014年3期)2014-07-12

華文教學與研究2023年4期

華文教學與研究的其它文章: 國際中文教師專業發展的基本路徑; 協商與順應：語氣詞“啊”與語境的互動; “假設—評述”義構式“S（，）該多（么）X”的構式特征及其生成機制①《華文教學與研究》匿名評審專家對本文提出了寶貴的修改意見，謹致謝忱。; 漢語二語口語韻律能力評估維度的任務類型效應①; 基于認知診斷理論的國際中文閱讀測驗Q 矩陣的構建; 從解放軍文化教員到著名語言學家
——我所認識的黎運漢先生

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合