?

副詞語義指向自動識別的路徑探討和個案分析

2009-09-05 09:56
武漢大學學報(人文科學版) 2009年4期
關鍵詞:副詞

赫 琳 吳 迪

[摘要]研究現代漢語副詞語義指向的計算機識別,是從語義入手探索句處理的一個嘗試。我們提出的基本思路是:充分地利用海量語料,詳盡考察現代漢語副詞語義指向的不同情況,探尋不同語義指向的約束條件和機制,并對其進行形式化的描述,然后構建計算機自動處理策略和流程模型,編寫程序,使之在計算機上得以實現。據此,我們以否定副詞“不”為樣本,全面探討了其語義指向的各種情況,構建了計算機自動識別的流程圖。

[關鍵詞]副詞;語義指向;計算機識別;不

[中圖分類號]H08[文獻標識碼]A[文章編號]1671—881X(2009)04—0459—05

一、要研究的問題

在自然語言信息處理中,當前遇到的瓶頸是句處理的問題。所謂“句處理”,就是怎么讓計算機處理、理解自然語言中一個句子的意義-怎么讓計算機生成一個符合自然語言規則的句子。制約句處理的最大難題就是要解決語義問題,這也是自然語言處理的關鍵。句子的語義問題涉及兩個層面:一是句子各成分本身的意義,另一個是句子各成分組合所產生的意義。句處理必須對句子的語義問題進行分層處理。既要弄清各成分本身的意義,又要弄清成分與成分組合所產生的種種意義。一般來說,成分本身的意義相對簡單、明確,成分的組合意義十分復雜,而且成分組合意義的復雜性更導致了句處理的復雜性和艱難性。本文擬探討的語義指向問題就是句子成分組合中的復雜問題,是句處理不可回避的重要問題。

語義指向是指句中某個成分在語義上跟哪個成分直接相關。某成分語義指向的不同,直接影響句子的意義。例如:

飯我們都吃了。

例子中的“都”在意義上既可能指向“飯”,也可能指向“我們”。如果指向“飯”,句義是:飯被我們吃光了;如果指向“我們”,句義是:我們都吃了飯了。顯然,同一成分的語義指向不同,句義完全不同。如果不能正確判斷語義指向,就會誤解句義。而語義指向在句法上往往沒有明顯的形式標記,這就給語言理解帶來一定的困難,尤其是給計算機的自動識別帶來障礙。要解決自然語言的句處理問題,必須突破語義指向的自動識別問題。

自從20世紀80年代語義指向分析進入語言研究領域以來,我國語法學者從不同角度對語義指向進行了研究??偟膩碚f,主要包括兩個方面:其一,運用語義指向分析法對語言事實做具體的分析,探尋其句法和語義上的對應規律。有的著眼于句子成分,考察了補語、狀語、定語等句法成分的語義指向問題,有的從詞類出發,考察了副詞、形容詞、代詞、名詞、動詞以及介詞結構等的語義指向問題。其二,從理論上對語義指向本身進行探討,說明其產生的背景、性質、內涵、范圍、表現形式以及在語法分析中的作用等??偟膩砜?,語義指向研究雖然涉及的內容較為廣泛,但較多的是現象分析,較少歸納規律;較多的是個別分析,較少系統考察;面向應用的更少,幾乎還沒有見到針對自然語言計算機處理的語義指向研究??傊?,我們對語義指向問題的認識還十分有限,尤其是對語義指向的規律缺乏把握,對語義指向的形式標記捕捉不多,加上已有的研究立足點大都不在應用,沒有為計算機處理語義指向儲備好充足的知識,所取得的成果與語言信息處理的要求之間存在著很大的距離。因此,要想實現計算機對語義指向的自動識別,還有大量工作要做。

我們擬在語義指向研究既有成果的基礎上,緊緊圍繞“為語言信息處理所用”這一目標,進一步深化、細化語義指向研究,以現代漢語副詞語義指向為樣本來解剖麻雀,具體探討現代漢語副詞不同語義指向出現的條件和可以捕捉的形式標記,描繪現代漢語副詞語義指向網,建構副詞語義指向的流程圖,從而為副詞語義指向計算機自動識別策略的制定和程序編寫,提供依據甚至藍本。這無疑對于實現語義指向的計算機自動處理乃至整個基于語義的自然語言處理都具有重要意義。

二、研究思路

要實現現代漢語副詞語義指向的計算機自動識別,必須摸清現代漢語副詞不同語義指向出現的條件和可以捕捉的形式標記,并把它們形式化。因此,我們首先要做的工作,就是最充分地利用海量語料,詳盡考察現代漢語副詞語義指向的不同情況,探尋現代漢語副詞不同語義指向的約束條件和機制,并對其進行形式化的描述,然后構建計算機自動處理策略和流程模型。

我們知道,現代漢語中副詞主要做狀語,在語義上可能前指,也可能后指;既可以指向相鄰成分,也可以指向間隔成分,在不同的情況下具體指向不同。本研究就是要找出不同指向出現的條件,并在此基礎上編制流程圖,使計算機根據有關的條件執行相應的命令,做出相應的判斷,從而使整個系統成為一個可以自動運作的過程。

現代漢語副詞可分為程度副詞、時間副詞、范圍副詞、否定副詞、語氣副詞、頻率副詞等。其中,時間副詞語義指向單一,流程簡單;范圍副詞、否定副詞、程度副詞、頻率副詞情況較復雜,編制流程圖需要具體詳盡的條件限制。即使是同類副詞,不同的詞具體運行情況也不相同,所以我們擬對副詞進行分類討論,對同類中的特殊副詞進行個別討論。具體包括程度副詞和時間副詞語義指向的計算機識別,范圍副詞“都”、“只”語義指向的計算機識別,否定副詞“不”、“沒(有)”、“別”語義指向的計算機識別和頻率副詞“又”、“也”語義指向的計算機識別,等等。

確定了副詞的類別之后,我們將從具體的副詞入手,以具體副詞為關鍵詞,利用大型語料庫和巨量生語料查找全部用例,考察其上下文,確定其語義指向,探索其語義指向的條件和標記,然后將這些條件和標記系統化,抽象其規律,找出其相互制約的因素,根據這些因素起作用的程度和先后順序編制流程圖。

三、個案分析

下面我們以否定副詞“不”為樣本,全面探討其語義指向的各種情況,構建計算機自動識別的流程圖。

現代漢語研究中,關于否定的成果頗豐。有的是從否定轄域的角度進行,有的是從否定焦點的方面著手。但不管是否定轄域還是否定焦點,研究的都是否定詞到底否定的是什么成分,其實也就是否定副詞的語義指向問題。

在否定副詞“不”指向的方向性這一問題上,學者們的研究結論基本一致,即指后。但是,“不”否定的究竟是其后哪一個或哪幾個成分,各家看法不一,歸納起來有三種觀點。

第一種,指向“不”后的全部成分。持此種觀點的是呂叔湘先生。

第二種,指向焦點。持此種觀點的有徐杰、李英哲、沈家煊、劉順等。

第三種,指向毗鄰成分,即緊鄰的成分。持此種觀點的有錢敏汝、李寶倫、潘海華等。

由上述可知,關于副詞“不”的語義指向還有一些問題需要進一步研究。為了弄清副詞“不,,的語義指向的全面情況,我們利用北京大學現代漢語語料庫,詳盡考察了“不”的語義指向狀況。根據我們的考察和研究,含有否定副詞“不”的句子分為兩種情況:一種是“不”后出現帶有“的,或“地,,的修飾語,另一種是“不”后沒有出現帶“的”或“地”的修飾語。我們發現,“不的語義指向與“的”、“地,,的有不具有明顯

的相關性。這條規律為我們解決副詞“不”語義指向的計算機自動識別問題提供了重要線索。為此,我們對“不”的語義指向與“的”、“地”的具體相關性進行了詳細的考察,現分述于下。

(一)“不”后有帶“的”或“地”的修飾語

據我們考察,“不”后有帶“的”或“地”的修飾語時,“不”就否定緊隨其后的修飾語。究其原因,主要是因為定語帶“的”、狀語帶“地”就表明定語和狀語與被修飾語之間結合不甚緊密,‘‘的”、“地”起到了間隔修飾語與被修飾語的作用,所以“不”只能否定緊隨其后的成分,而不能否定被“的”、“地”隔開的成分。

1、“不”后出現帶“的”的修飾語,也就是“不”出現在定語中,這時“不”指向緊鄰其后的成分。例如:他喝了不新鮮的牛奶。不”否定的是“新鮮”。誠如錢敏汝所說,定中結構中否定載體的否定范圍不會超過定語。

2、“不”后出現帶“地”的修飾語,這時“不”指向緊鄰其后的成分。例如:她不高興地瞪了他一眼。

這一類修飾語往往是對施動者的情態進行描寫。其后的動詞一般不是單純形式,而是“動+了”、動結式、動趨式、動詞重疊式(“VV”和“V了V”)、“動+著”等。例如:鮑里斯@別爾曼在與她談話時,不高興地提到了格利戈里·阿爾庫斯。(動+了+賓)我很不高興地走開了。(動結式)

不高興地走了出去。(動趨式)

不高興地故意清清喉嚨。(vV)

騎兵們不高興地抿了抿嘴。(V了V)

他不高興地嘀咕著。(動+著)

這些動詞代表的動作往往都是有終結點的,也就是說,意義上是有界的。在“不,和“沒,,的否定分工上,“不”否定的是無界成分,“沒”否定的是有界成分。因此,上述各動詞是無法用“不來否定的,所以“不”在這里否定的只能是修飾語。

(二)“不”后沒有帶“的”或“地”的修飾語

“不”可以出現在狀語、補語、主謂謂語句的謂語中,“不”后面可以是一個成分,也可以有多個成分。根據我們的考察,只要“不”后未出現帶“的”或“地”的修飾語,“不就能否定其后所有的成分。究其原因,主要是因為在這類格式中,“不”后的所有成分結合緊密,構成一個整體,所以“不只能否定其整體,而不能只否定其部分成分。

1、“不”后只有一個成分。

這咖啡不香。

小明跑得不快。

2、“不”后有兩個成分。

(1)“不”+狀語+動/形

這句話不太懂。

小明跑得不很快。

(2)“不”+動+賓

爺爺不吃面食。

張老師不是我們的數學老師。

3、“不”后有三個成分。

(1)“不”+狀語+動+賓

我不在學校讀小說。

她不天天吃食堂。

(2)“不”+動+賓1+賓2

張老師不教我們數學。我就不告訴你那件事。

(3)“不”+動1+兼語+動2

大家不選老王當組長。

4.“不”后有四個成分。

“不”十狀語+動+賓1+賓2

張老師不只教我們數學。

上面討論的例子的謂語一般只有一個動詞或形容詞。連動句中能用“不”否定的有三種情況:

(1)后一個動詞/短語表示的動作行為是前一動詞/短語表示的動作的目的。例如:

她不去開門。

(2)前一個動詞/短語表示后一個動詞/短語所表示的動作的方式(或手段、工具)。例如:

他不騎車上班。

(3)前一個部分表示肯定的意思,后一個部分表示否定的意思,但前后兩個部分表示的意思一樣,其中后一個部分用“不”來構成否定。

孩子緊緊抓著她的手不放。

顯然,當“不”后沒有帶“的”或“地”的修飾語時,“不”指向其后所有的成分。

綜上所述,當“不”后有帶“的”或“地”的修飾語時,“不”指向修飾語,也就是其后毗鄰成分;“不”后沒有帶“的”或“地”的修飾語時,“不”指向其后全部成分?!暗摹焙汀暗亍背蔀閰^分“不”語義指向的標志詞。計算機識別就可以以“的”和“地”為切入點,首先看“不”后是否有助詞“的”,如果有,“不”指向其后毗鄰成分;如果沒有,再看“不”后是否有助詞“地”,如果有,“不”同樣指向毗鄰成分;如果沒有,“不”指向其后所有成分。依據這個順序,我們可以畫出否定副詞“不”的語義指向流程圖(如圖1)。

本文探討了現代漢語副詞語義指向的計算機識別問題,重點討論了副詞“不”的語義指向。語義指向的計算機識別研究,為我們提供了一個新的視角來反觀現代漢語中的一些語言現象。所以卒文的研究成果可以直接用于語言學領域,以利用副詞語義指向的研究思路和方法來研究其他詞類,從計算機識別這一新的角度重新探討各種詞類的語義指向,從而對語義指向的性質、內涵、對象和范圍等有一個全新的思考和定位。同時,我們的研究成果也可以直接用于語言信息處理領域,計算語言學家們可以將我們已經形式化的條件表示為算法,使之在計算上形式化,根據流程圖編寫程序,使我們的研究成果最終在計算機上得以實現。

注釋:

①我們在北京大學現代漢語語料庫中輸入關鍵詞“不”,得到語料約10萬條,人工刪除不合格語料,獲得可用語料約1萬條。

②我們在北京大學語料庫中搜到的帶“不高興地”和“不滿意地”的語料共301條,我們對其后出現的動詞及動詞詞組進行了,窮盡性考察,尚未發現例外。

[參考文獻]

[1]陸儉明:《關于句處理中所要考慮的語義問題》,載《語言研究}2001年第1期。

[2]稅昌錫;《語義指向分析的發展歷程與研究展望》,載《語言教學與研究}2004年第1期。

[3]呂叔湘:《疑問否定肯定》,載《中國語文}1985年第4期。

[4]徐杰、李英哲:《焦點和兩個非線性語法范疇:“否定”“疑問”》,載《中國語文>)1993年第2期。

[5]沈家煊:《不對稱和標記論》,南昌:江西教育出版社1999年版。

[6]劉順:《現代漢語的否定焦點和疑問焦點》,載《齊齊哈爾大學學報(哲社版)))2003年第2期。

[7]錢敏汝:《否定載體“不”的語義——語法考察》,載《中國語文))1990年第1期。

[8]胡建華:《否定、焦點與轄域》,載《中國語文》200F年第2期。

[9]石毓智:《肯定和否定的對稱與不對稱》,北京:北京語言文化大學出版社2001年版。

(責任編輯何坤翁)

猜你喜歡
副詞
疑問副詞how小練
形容詞和副詞比較等級專練
短句—副詞+謂語
漢泰程度副詞對比研究
中考英語形容詞與副詞專項練習
如何復習副詞?
副詞和副詞詞組
詞類學習之副詞
hardly是hard的派生詞嗎?
形容詞、副詞專練
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合