?

韓禮德談機器翻譯

2023-04-01 11:50胡壯麟
天津外國語大學學報 2023年1期
關鍵詞:韓禮德語言學語法

胡壯麟

(北京大學 外國語學院)

1 引言

系統功能語言學的創始人韓禮德1955 年在劍橋大學獲得博士學位后曾在劍橋語言研究中心工作,任劍橋大學助理講師,從事有關機器翻譯的研究。隨著計算語言學的發展,20 世紀60 年代他先在美國伯克利大學,后在耶魯大學與Sydney Lamb合作研究。80 年代在南加州大學信息科學院與Willian Mann 及其團隊合作,從事計算語言學與機器翻譯結合的研究。到20 世紀末,他開始關注智能機器翻譯。本文主要介紹韓禮德在上述不同時期對機器翻譯所持的一些觀點①。

2 機械翻譯(1956)

韓禮德最早接觸的是機械翻譯(mechanical translation)。1956 年10 月他參加美國麻省理工學院召開的“國際機械翻譯大會”,并宣讀了論文《機械翻譯的語言學基礎》②。會議的中心議題為機械翻譯,涉及三個過程:(1)翻譯對等;(2)決定性特征的對等;(3)某一決定性特征在目標語中的操作(Halliday,1957)。

20 世紀50 年代的翻譯對等著眼語法和詞法的對比。前者在當時稱為轉移語法(transfer grammar),內容是對兩個語言的語法進行對比,但不太成功。因為在研究中發現語法不能決定詞法,研究工作還停留在對每一種語法進行描寫分析,并尋找源語和譯語對比的最佳點,同時詞法不能依靠音系學和正字法,比較關注語言語境的研究,這包括詞語搭配,一些詞與另一些詞同時出現,特別是在特定語境下出現,在語境中不能搭配的一些特征不應該出現在篇章中。

相較于語法,從詞法進行翻譯研究有兩個優勢:(1)詞匯能更直接反映語言語境;(2)即使沒有對等詞,至少有相同的系統或排列。這是翻譯對等研究的第一步。每個系統有若干關鍵詞,一對一的翻譯對等有高度可能性,特別是科學詞匯。所謂同義詞典(thesaurus)便是根據語言語境編出來的。例如,英語的railway station 在漢語中可根據不同的語境翻譯成“火車站”“車站”或“站”。漢語中的“火車站”可翻譯成英語的railway station 或station。盡管如此,同義詞典所收詞語以實義詞或中性詞為主,沒有數和語法的區別,因為英語和漢語的動詞是不對等的。因此,所有機械翻譯都應考慮包括一些非詞語的范疇,如詞的曲折變化。

對上述情況韓禮德曾作過如下總結,始于1950 年的機器翻譯,即機械翻譯,是采用數學的方法,用計算機將一種語言翻譯成另一種語言,從一系列的形式對等物尋找可能的對等形式,是一個工程項目(Halliday,1995)。

3 邏輯學引導的機器翻譯(1960-1970 年代)

1960 年之后,學術界更多地使用“機器翻譯”(machine translation)這一術語,從普通語言學的視角描述不同語言的對比和翻譯。對于各種語言范疇的具體要求是能為機器所識別(Delawanay,1960)。韓禮德(Halliday,1960)則從邏輯學的視角提出以下三個階段:(1)語言X 內每一個單位項目(語素、詞等)在語言Y 中都有一個最接近的對等詞,在一定條件下其他對等詞也有可能出現,因此,譯者在大腦中具有概率的概念,即語言Y 中哪一個詞更為對等;(2)參照語言環境進行對等單位的選擇;(3)應當深入考慮語言Y 內在的語法和詞匯特征,如性和數的語法和諧、動詞時態對等、固定的詞語搭配、成語等。機器翻譯是這三個階段的最后成果,是對不同語言的共同點和不同點進行對比的結果,但它不關注不同語言的歷史關系,也無需為相似點和不同點尋找理據,因此,機器翻譯的對比研究不同于語言類型學。

韓禮德認為,當時的研究主要關注兩種不同的依據:翻譯對等與形式對比。翻譯對等實際上與語法單位的范疇有關,因而我們可以將語法Y 的某個項目或單位與語法X 的項目或單位進行比較。值得注意的是,研究者對語境有進一步的認識,即語境不僅包括語言內的語境,也包括語言外的情景語境。形式對比指譯者在兩種語言的形式結構中進行同樣操作,具有同樣的形式意義和語言學意義。這就需要在單位、結構、詞類和系統的語法范疇中比較。當然,兩種語言的比較要以語境對等為前提,同時有效的比較也決定著對語言的描述。

兩年后韓禮德(Halliday,1962)對機器翻譯有了進一步的認識。第一個觀點為語言學是語言的科學,不同于哲學、邏輯學、心理學、人類學、數學或交際理論。這就是說語言學家的視角應當是通過科學研究了解語言的本質和特征,而不是通過語言研究解決其他學科的問題。例如,心理學和哲學領域對意義的研究只是把語言視為代碼。這無助于機器翻譯研究,因為這種看法誤解了語言的功能、內在關系以及與非語言的外部關系。而信息和編碼之間的關系是兩種不同的實體,信息獨立存在于代碼之外,不能決定代碼的類型??梢?,語言不存在這種二分法,不存在兩個實體之間的關系。他認為這只能強行稱之為類比(analogy)。韓禮德認為,其他學科的理論觀點只是研究代碼和信息的范疇,而語言學研究的是內容或概念的范疇。概念不是獨立于物質之外的,它需要通過語言形式才能具象化,如語言學家需要處理的篇章。

韓禮德的第二個觀點是語言模式是否按二分法對立運作。雖然語法系統如同所有封閉系統可規定二分操作,便于進行統計語言學和電子語言學操作,但這不是語言的一般真理。語言學系統更為復雜,要達到嚴格的定義和應用的要求,應當更嚴格地區分。二分法是邏輯學的概念,不完全適合語言學。從韓禮德下面所舉實例不難看出未標記的漢語“學生”在實際應用時既可以是單數,也可以是復數,并不是所有系統都具有標記性。

韓禮德贊同描寫一種語言不可能沒有理論,但有的描寫方法難以適用于計算機。就語言學而言,翻譯涉及多個方面。例如,語言范疇的概念通常涉及層次(level)、單位(unit)、形式(form)、級別(rank)。情況的復雜性在于我們需要同時解決一些問題,如兩個層次的形式:語法和詞法,一些詞與另一些詞同時出現;兩個層次的物質:語音的和書面的;兩個層次將物質以形式體現的模式:語音學和字音學,這兩者可以用二分法處理。

計算科學和語言學對機器翻譯的問題都有各自的看法。機器翻譯工作者否定語言的統計理論,認為除非基于合理的、科學的理論,從定性描寫到定量描寫便毫無意義。語言學者認為機器翻譯沒有理論意義而加以拒絕。有些機器翻譯并非“要么全部,要么一無所有”的活動。因此,韓禮德建議可以把語音學和字音學暫時擱置一邊,因為它們僅僅涉及語言的口語和文字的形式。翻譯主要關注語法、詞匯與語境。

韓禮德還認為,統計描寫有助于推動語言理論和方法的研究,也有助于應用,如語言教學中常見的短語動詞。翻譯畢竟是更像/不太像的關系。計算機不能完全靠非此即彼的操作。兩個語言之間的語法對等能更好地顯示語義。翻譯與級別有關,詞不僅僅是具體的詞,而且是抽象的語法范疇,如詞類與結構和范疇的關系。詞項是對這些范疇的說明??偟膩碚f,為了對比,我們首先要弄清兩種語言的單位在翻譯對等上的概率。

由于上述不同認識,至20 世紀60 年代中期,學術界普遍認為語言翻譯是自成一格的特殊轉換,以語言學理論代替邏輯學。這導致在北美和歐洲產生一場災難,那就是美國空軍宣布不再為機器翻譯提供經費。美國研究者隨之改用“人工智能”的名稱,如配對、提要、問答、專家系統等(Winograd,1972)。

系統功能語言學者Alick Henrici 在倫敦大學學院完成他的系統研究,采用形成范例(forming paradigms)、充實的體現(implementing realizations)等手段(Halliday& Martin,1981)。

4 計算機與機器翻譯(1980-1995)

韓禮德所說的機器翻譯的第三次轉折始于1980 年。由于新一代計算機的出現,其系統能處理復雜的自然語言。計算語言學家能處理更為現實的目標。計算不僅是語言學研究的工具,也是發現有關語言特征的新方法,一方面測定語法描寫,另一方面建立大型語料庫(Halliday,1995)。

在此期間系統功能語言學家提出了兩個闡述英語語篇生成的系統語法:一個是澳大利亞悉尼大學信息科學研究所William Manner 指導Christian Mathiessen 以日語和英語為語料所進行的語篇生成研究(Matthiessen & Bateman,1992),另一個是英國威爾斯大學的Robin Fawcett 所研究的社團語法(Communal Grammar)(Fawcet,Tucker & Lin,1993)。

在1980-1995 年這段時間中是否有過轉折?韓禮德說有。最初學術界把語言看作信息交換,因而關注貨物和服務的本質。此后,才深入認識到語言才是計算研究的中心對象,計算語言學應當計算意義。

總的來說,計算語言學采用描寫的方式。研究者試圖發展整體的形式,指出對計算的需要。這就需要發展既有細節又復雜的語法。措辭的價值首次稱為系源關系(agnation),它的軌跡存在于語言的整個意義潛勢中。計算語言學的操作應當是對意義的操作。這在學術界已被認為是正確的觀點。

5 智能計算與機器翻譯(1995-)

進入新世紀前夕,學術界普遍認為可通過智能計算(intelligent computing)來解決機器翻譯的矛盾,使計算成為計算意義的同義詞。韓禮德(Halliday,1995)認為,對此要分兩步重新表述:一是對詞語的表述需要結合措辭和語法結構,即任何范圍的詞匯語法背景;二是對措辭的表述,即任何范圍的語義序列。這說明計算操作要進行語義操作,但進入智能計算要解決兩個脫節之處:(1)知識基礎重新概念化為意義基礎,應該將兩個系統合二為一;(2)實例及其系統。自然語言的語法被認為是一系列的結構,或按照系統功能語法,選擇網絡或符號潛勢,即任何有意義的實例都存在于系統潛勢之中,但在計算推理過程中實例不一定與整個語言系統掛鉤,而是屬于話語(discourse),意味著它是過程,還不是系統。但如果把話語看作篇章,對任何底層系統的一個實例進行推理就較為容易了。

韓禮德指出,上面提到的兩個脫節反映了西方思維中的二元化:(1)語言和思維的二分,如當代語言學和認知科學;(2)語言(langue)和言語(parole)的二分,如語言學和語用學(Ellis,1993;Matthiesssen,1993,1998)。上述成果供計算語言學參考時可考慮如下策略:(1)語言內(語法)和語言外(概念的、認知的)可作為一個系統的兩個層次:(詞匯)語法學和語義學;(2)除語言和話語兩種現象外,語言和言語二者中可以只考慮語言這一個現象。實例化(instantiation)可以有兩個度:系統和語篇。從知識基礎(knowledge base)演變的意義基礎(meaning base)便可以采用語法描寫。反之,每一個措辭和意義的實例都可以用整個系統描寫??梢?,語言和認知之間的邊界成為語法和語義學、措辭和意義之間的界限。語言和言語的界限是系統(語法或語義學)和實例(措辭或意義)之間的界限(Halliday,1995)。

韓禮德還指出,智能計算對自然語言復雜性的所有方面提出嚴格的要求。它要求語法學把語法作為底層語言的邏輯,而不僅僅是Zadek(1995)曾經批評的數字計算。人類文明正在從硬計算(hard computing)進入軟計算(soft computing)時代。新時代中人類思維被視為“一組具有模糊界限的顆?!?。換言之,智能計算是智能系統的分析和設計,像人類那樣大致推理。在信息革命時期,機器智能進一步擴展,改變了人的大腦力量。Terano(1995)也觀察到同樣語境下微小的信息處理不再是數學模式。韓禮德指出應該換之以語法。語言不僅僅是計算的對象,也是計算的工具。智能的基礎從數學邏輯改變為語法邏輯。數學和語法都是符號系統,構建不同,但互補,數字的邏輯對比與措辭和意義的邏輯(語言學邏輯)互補(Sugeno,1993)。

韓禮德(1995)指出,語法學(grammatics)能幫我們解決語言的復雜性。過去人們只談數學的美感,很少談語法的美感,即對各個工作系統語言的理論化,如數據融合(data fusion)和語境模擬(contextual simulation)。我們不僅找到它們的復雜性,也能找到它們的排序和操作方法。

韓禮德同時指出,語言的復雜性常體現在以下七個方面:(1)詞,能進入措辭的成分,屬詞法;(2)措辭,能構成語義或意義的類型;(3)意義,系統構成語境的成分;(4)特定措辭/意義實例,它們在系統中所處位置的價值(在系統網絡內部的歸屬關系);(5)次系統(sub-system),語域的變異;(6)系統,由多個功能組成,進入語義空間時可決定語法形式和語境的關系;(7)意義,包括三個歷史維度:系統的演變(phylogenesis)、個別語篇的展開(logenesis)、自兒童至成人的語言發展(ontogenesis)。

韓禮德在前六點的基礎上提出語言學模塊的構建,可用于智能計算。詞匯語法有時簡稱為語法。這是抽象的符號構建,成為內容和表達之間的層次,獲得給定的、構建語境的價值,是抽象的,而物質現象沒有抽象界面。韓禮德還進一步解釋了層次有高低之分。低層次指口語和書面語的表達與人體為界面的結合點,高層次指語義學的結合點為人類經驗和人類社會活動過程。不同于簡單的符號系統(具有給定的意義),一個分層次的系統(包括語法在內)具有特定的性質,能構建分層次的系統,創建意義,特別是在功能語境中創建意義。語言的功能語境分兩類,相應的功能也分兩類:一方面語言被看作人類的經驗,其功能是構建,使我們周圍的世界有序化,另一方面語言被看作具有指定人際關系的功能。不同于簡單的具有給定意義的符號系統,語法的元功能是將兩者合成,既寫也說,既看也聽。系統是從遠處把語言看作語義潛勢,而語篇是從近處看,是語言潛勢中出現的實例,也就是說只有一個現象,不是兩個。語言和言語只是不同視角的說法,但我們也可以在這個變體群中持中間立場,采用語域(register)的概念。它有助于我們處理語境變異,是相似語境的語篇類型。從系統的視角看,語域是次系統。層次是不同類的關系。語義學和語法的關系區分明確,有不同的層次。在自然語言的內容方面,每個系源有不同的領域,同樣語法空間的組成不同于語義空間的組成(Martin & Matthiessen,1991)??梢詫⑼瑯拥母拍钌舷聰U展,稱為體現,如情景語境,將語境作為符號系統。

上述觀點如何和智能計算聯系?這就要求將自然語言作為計算機語言,但人們有時忘記每種語言的拼寫系統涉及大量有關意義的復雜問題,有些意義需要辨認或識別,如you can go 與can you go。又如,韻律和語調可表示不同的強調,這里情態(modality)計算過程很重要。因此,智能計算對自然語言復雜性的所有方面提出嚴格要求,要求把語法作為底層語言的邏輯。

對任何知識的知曉在于把有關知識轉換成意義,因而所謂理解便是這個符號轉換過程,這兩者構成語篇元功能。意義的流動在于對有關成分的激活,其成品就是話語。

語言的語法系統是對矩陣中每個成分在聚合體中的選擇,如肯定/否定、過去/現在/將來、敘述/命令等在聚合體中的最后體現。因此,概括地說,語法是資源。意義便是在不同矩陣中進行選擇,知道越多,掌握越深入、越細致。

韓禮德認為,計算機如能像幼兒學語言那樣工作才能使操作有效。到目前為止,計算機是通過各種系統的中介和根據語言派生的邏輯進行操作的,在此過程中要丟失好多信息,因此,提出語言本身將成為主要的計算資源。這能保持信息水平,也能探索自然語言的正面特征、功能的多元性、系統的轉換等。韓禮德認為,這與Sugeno(1993)的研究有關,如數據的融合(將來自語言的信息與數字、符號、圖像和非語言聲響進行整合)。結合篇章對情景語境進行構建,即使從自然語言直接獲取這些元語言觀點,還要解決各種不同的體現范式。使用語言計算意味著使用意義計算,因此某些語義表達形式至關重要。

6 結語

韓禮德在有生之年除倡導系統功能語言學外,也關心與語言有關的其他學科的研究和發展,如比較語言學和翻譯學。由于篇幅所限,本文重點介紹韓禮德在不同時期對機器翻譯所持理論的演變過程,試圖說明人類對任何事物本質的認知和探索過程是在實踐中不斷發現問題、解決問題的過程。即使機器翻譯在本世紀已經進入智能計算的高水平時期,許多問題仍有待我們進一步發現、討論和解決。我們要讓機器翻譯在構建人類語言共同體和人類命運共同體方面發揮更多的作用。

注釋:

① 本文為2022 年10 月22-23 日國際韓禮德語言學研究會上的發言稿。

② 本文有關韓禮德的論著均引自J. J. Webster 編《韓禮德文集》,請參見參考文獻的有關條目。

猜你喜歡
韓禮德語言學語法
跟蹤導練(二)4
Book 5 Unit 1~Unit 3語法鞏固練習
系統功能語言學視角下的日語聽力語料庫建設研究
系統功能語法在語言教學中的應用
認知語言學與對外漢語教學
從人際功能的角度來研究《伊芙琳》和《死者》
Halliday and Systemic—Functional Grammar
社會語言學名詞
語料庫語言學未來發展趨勢
基于認知語言學的“認知修辭學”——從認知語言學與修辭學的兼容、互補看認知修辭學的可行性
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合