?

基于詞間關系的敘詞表術語翻譯

2019-09-11 10:44
中華醫學圖書情報雜志 2019年5期
關鍵詞:詞表多語種術語

多語種敘詞表是信息組織與信息服務中一種重要的知識組織工具。多語種敘詞表的建設實現了不同語種信息資源的集成,是實現跨語言檢索的基礎,但目前常用的方法是將單語種敘詞表通過術語翻譯編制成多語種敘詞表。詞間關系是敘詞表中重要的組成部分,主要包括等同關系、等級關系和相關關系3種,在敘詞表的構建與維護中也極其重要。在詞表更新時,編制者可以通過詞間關系判斷其更新術語是否屬于某一詞族,是否分類正確;在對單語種詞表翻譯時,編制者可以根據詞間關系判斷其術語翻譯是否正確。在實踐過程中發現,對于單義術語,網絡翻譯軟件一般給出一個對應術語翻譯,其翻譯含義也多數都是正確的。但對于多義術語,其給出的中文翻譯一般都有多個,且術語之間的含義大相徑庭,或者給出的術語翻譯是短句而非術語。敘詞表中要求術語一詞一義,其中文翻譯也應該是術語而不是歧義術語,所以需要在給出的中文翻譯中選取最適合的術語翻譯。在一般的翻譯中,術語都存在于句子中,有具體的語境。在詞表中,術語的語境指的是術語所在的詞族以及所擁有的詞間關系。

本文結合敘詞表更新維護項目實踐,在敘詞表術語翻譯過程中,探討基于詞間關系的敘詞表術語翻譯方法。

1 敘詞表術語翻譯的調研與分析

隨著世界的多元化發展,敘詞表也呈現出多元化的形式,多語種敘詞表成為了研究熱點,國家標準GB/T1390.1-2015中認為多語種敘詞表的編制可以通過翻譯單語種敘詞表實現[1]。國際上存在大量的多語種敘詞表,并且每部多語種敘詞表都具有豐富的詞間關系。如農學類多語種敘詞表AGROVOC在2010年時語言種類為22種,而目前其語言種類達33種[2],其中主要包含等同、等級和相關關系,并將相關關系進行細化;“Commonwealth Agriculture Bureau Thesaurus”(以下簡稱“CAB Thesaurus”)有11種語言,其中以英語為主,其詞間關系除了等級關系、等同關系和相關關系之外,還有其他關系,如與其他詞表的精確匹配和近義匹配等[3]。醫學領域的“Medical Subject Headings”(簡稱“MeSH”)語言版本多達15種,其中主要有等同、等級和相關關系[4]?!癠MDNS: product category thesaurus”的語言種類主要有英語、德語等,主要包含等同、等級和相關關系等詞間關系;理學類敘詞表中的“UNESCO Thesaurus”,其語言種類有英語、西班牙語、法語和俄語4種,主要包含注釋、等同、等級和相關關系等詞間關系,并將等級關系細化為上位和下位關系[5];工學類詞表中的“GEneral Multilingual Environmental Thesaurus”,其語言種類有20多種[6]。中文敘詞表中,多語種敘詞表多以英漢兩種語言為主。如《漢語主題詞表(工程技術卷)》[7]和《農業科學敘詞表》[8],主要包含等同、等級和相關關系,同時為優選詞賦予英文翻譯;《中文醫學主題詞表》(Chinese Medical Subject Headings,簡稱“CmeSH”)[9]是美國國立醫學圖書館MeSH詞表的中譯本,同時也收錄了中醫學和中醫藥學相關術語,包括主題詞、副主題詞,其主題詞還通過一定的樹狀結構和參照系統顯示主題詞之間的關系;“十二五”科技支撐計劃所建的“英文超級科技詞表”(以下簡稱“英表”)實際上也是一種以英漢兩種語言為主的多語種敘詞表,填補了我國外文大型集成詞表的空白,為外文信息自動處理的科學研究提供研究基礎,提升我國對外文海量信息資源組織的能力和效率[10]。每個多語種敘詞表中都包含等同、等級關系、相關關系,其中一些多語種敘詞表還根據具體情況將等級關系、相關關系進行細化,為與其他詞表或者知識組織系統之間的互操作奠定基礎。多語種敘詞表中術語的不同語種的表現形式,實際上也是一種等同關系的表現。

無論敘詞表的概念翻譯還是概念映射,或者涉及術語翻譯的詞表研究,都可以借助詞間關系進行細化和優化。常春在研究多語種敘詞表的漢語翻譯和維護方法中,提出了基于概念、詞間關系、詞頻、概念范疇及漢語敘詞優先的漢語翻譯原則[11];石澤順等對LISTA敘詞表進行SKOS格式轉化,并以此構建圖書情報學敘詞表檢索系統,實現了其領域內知識概念的中英文瀏覽和檢索[12];王劉安在基于敘詞表用代關系的概念語義研究中發現對同形異義詞進行翻譯時,結合來源詞表中的等級和相關關系進行分析翻譯,從而提高其翻譯準確度[13];宋培彥等通過英漢等值翻譯詞對進行跨語言術語同義關系的識別[14];鄧盼盼等在基于精確匹配的中英文概念映射關系規則研究中,認為可以通過詞間關系來進行等級映射和相關映射的探索[15];陳白雪認為詞間關系可以幫助學者識別同形異義詞[16];劉麗斌等從本體構建的角度,將敘詞表中的詞間關系進行細化,為以后不同領域的敘詞表與本體間的映射提供便利[17]。

綜上所述,詞間關系是敘詞表中特有的術語關系,雖然在各個多語種敘詞表中其表現形式不同,但每一部詞表中都含有豐富的詞間關系,且無論從理論上還是實踐中,詞間關系在敘詞表的研究中都得到了不同的應用。所以利用詞間關系可以對敘詞表中的術語翻譯進行優化,使敘詞表中術語的翻譯更加準確,同時也為多語種敘詞表的建設與維護提供一定的參考。

2 詞間關系術語的翻譯研究

“英表”在編制結束時,已有概念61萬,其中醫學領域26.4萬(交叉概念5.3萬),醫學領域概念數量所占比例最大;“英表”中總概念的入口率(入口詞/優選詞)為2.13,相應的入口詞大約為130萬?!坝⒈怼本幹瞥跗?,對優選詞進行了翻譯,但由于入口詞數量龐大,大多數入口詞是沒有中文翻譯的。為了完善“英表”,對“英表”進行了更新維護,一方面對未翻譯的入口詞進行翻譯,另一方面對更新添加的新術語進行翻譯,其中包括優選詞和入口詞。對于術語的翻譯,本文不僅探討了入口詞的翻譯,同時也探討了優選詞的翻譯。

對“英表”中的術語翻譯,首先借助網絡翻譯軟件對術語進行翻譯,然后人工輔助判斷。通過翻譯實踐,最終選取Norm原形化工具作為原形化軟件。網絡翻譯軟件主要有Bing翻譯和百度翻譯,當兩種翻譯軟件給出的翻譯相同時,任選其中的一種翻譯軟件給出的中文翻譯作為候選翻譯;當兩個翻譯軟件給出的翻譯結果有差別時,則根據術語之間的詞間關系選取其中最合適的中文翻譯;當兩種翻譯軟件給出結果相同,但候選翻譯是多個時,可根據詞間關系對這幾個術語翻譯進行擇優選擇,選擇最合適的候選翻譯作為術語的中文翻譯。

2.1 基于等同關系的翻譯研究

等同關系在敘詞表中主要表現為用代關系,指一組概念相同或相近的術語,選取其中的一個術語為優選詞,其他為入口詞,優選詞與入口詞之間的關系就是等同關系[18]。而基于等同關系的術語輔助翻譯指的是術語中的用項或代項已經有了中文翻譯,或其含義是我們熟知的,則可以借助其代項或用項對術語進行翻譯。

在“英表”中,若優選詞已經有了中文翻譯,在對入口詞進行翻譯時,就可以借助其用項進行翻譯;若入口詞被原形化工具處理之后,其原形與優選詞的原形相同,則入口詞可以直接采取優選詞的中文翻譯。如優選詞“handcrafts”,其中文翻譯為“手工藝”,而入口詞是“handcraft”,因此入口詞可以直接選取“手工藝”作為入口詞“handcraft”的中文翻譯。

若在“英表”中,其優選詞的中文翻譯有歧義,而其代項即入口詞無歧義,則可以借鑒其入口詞的中文翻譯,選擇優選詞的中文翻譯。如優選詞“academic gifted”,網絡翻譯軟件給出的中文翻譯為“學業天賦”“資優生”,其代項為“gifted students”“superior students”“gifted person”,指的都是“優等生”“天才”。根據其含義可知,其主要是形容學生中的一類,因此可根據其代項,將“academic gifted”譯為“資優生”。

若在“英表”中,其優選詞包含入口詞,則其入口詞可以直接選取優選詞中相對應的中文翻譯為其翻譯。如優選詞“yeast one/two-hybrid system”的中文翻譯為“酵母單/雙雜交系統”,而其入口詞分別為“two hybrid”和“yeast one hybrid system”,則入口詞“two hybrid”的中文翻譯為“雙雜交”,入口詞“yeast one hybrid system”的中文翻譯為“酵母單雜交系統”。

2.2 基于等級關系的翻譯研究

等級關系在敘詞表中指不同專指度的上位優選詞與下位優選詞之間的關系[18],在詞表中是比較常見的詞間關系,主要分為屬項和分項?;诘燃夑P系的術語輔助翻譯指當術語中的中文翻譯無法確定時,可以向上追溯其屬項或者向下借鑒其分項,進行中文翻譯的確定與選擇。

根據屬項進行判斷。如“natural”,其一般翻譯為“自然”,在百度翻譯和Bing翻譯中,發現還有“還原音”的中文翻譯?!皀atural”在“Schools Online Thesaurus[19]”中屬項為“accidentals”和“musical notation”,其含義為“變音記號”和“音樂符號”,所以根據其屬項可以將其意譯為“還原記號”。如“wall of uterine body”的屬項為“body of uterus”,即“子宮”?!皐all”一般含義為“城墻”“圍墻”,則此時可以意譯為“壁”,即“wall of uterine body”可翻譯為“子宮壁”;如術語“warmers”,一般情況下會理解為“warm”的比較級,原形化后可能會取“warm”的中文翻譯,但“warmers”的屬項是“biomedical equipment”,此時根據屬項可知,“warmers”表達的應該是一種儀器,則可以將其譯為“取暖器”。

若屬項的顆粒度較大,根據其屬項無法判斷其術語含義,此時可以向下追溯其分項,根據其分項進行術語的翻譯。如“person(grammar)”的屬項為“inflection(grammar)”,中文翻譯為“屈折(語法)”;但其分項為“first person”“second person”“third person”,表達的是敘述人稱的分類,則“person(grammar)”表達的含義應為“人稱”,因此應該將其譯為“人稱(語法)”。

若術語同時擁有等同關系和等級關系,而等同關系無法判斷其含義時,可以考慮利用等級關系進行輔助翻譯。如“large diameter hose”的一般翻譯為“大口徑軟管”,但“大口徑軟管”既可以用在醫學上,也可以用在消防上,因此直接翻譯為“大口徑軟管”概念范圍太大,不合適;而其代項為“large diameter hoses”,根據其代項是無法確定其含義的,而其屬項為“firefighting equipment”,則可以根據此屬項進行判斷,翻譯為“消防饋線軟管”。

綜合考慮術語的屬項和分項,如果是部分和整體的關系,則可根據其屬項及屬項的其他分類進行判斷。如“left falling strokes”的屬項是“character strokes”,其中文翻譯為“漢字筆畫”。漢字筆畫其實也是一個詞族,由此可以推斷“left falling strokes”是筆畫中的一項,且“character strokes”的分項有“dot strokes”“horizontal strokes”“vertical strokes”,每一個分項應該是筆畫中的一種類型,因此可以簡單地將其做一個映射。如“dot strokes”的重點是“dot”,其含義為圓點,可以由此推斷出它應指“筆畫”的“點”;而“left falling strokes”在網絡翻譯軟件中給出的是“左落桿”和“左落中風”,明顯不屬于漢字筆畫,但由其含義可知,“left falling strokes”主要表達的是“左落下”,而在漢字筆畫中具有“左落下”之意的筆畫是“丿”,即“撇”,所以可以將“left falling strokes”意譯為“撇”。其他分項的中文翻譯具體如表1所示。

表1 英漢筆畫映射表

2.3 基于相關關系的翻譯研究

相關關系指概念間除等級關系以外的、具有強烈語義關聯的關系,在詞表中主要表現為參(C)[18]。根據其相關關系進行術語的輔助翻譯,主要分為兩類:一類是術語關系單薄,只有相關關系參考,沒有等同關系和等級關系;另一類是雖然有豐富的等同或等級關系,但等級關系顆粒度較粗,僅依靠這兩種關系無法準確判斷其含義,因此可以參考其相關關系進行判斷。

若術語沒有上下位關系,只有相關關系,則此時只能依靠相關關系判斷,尤其是多義詞的判斷。如“tempo”的中文翻譯有“速度”“節拍”,而這兩個中文翻譯表達的含義是不同的,因此要依靠詞間關系進行判斷。而其來源詞表“Thesaurus of Psychological Index Terms[20]”中“tempo”的詞間關系只有相關關系,其相關術語有“music”“rhythm”等,可以由此判斷出“tempo”的中文翻譯應為“節拍”。如“weight observation”,網絡翻譯軟件給出的翻譯是“加權觀測”“體重觀察”,其相關詞為“weight finding”,指“體重測定”,則“weight observation”的中文翻譯為“體重觀測”。

若術語中有上下位關系,但因為其顆粒度較粗,根據其上下位關系無法準確判斷其中文翻譯,而其相關關系卻有明確的指示,可根據其相關關系進行判斷。如“beads”一般翻譯為“珠”,此翻譯所指太廣泛,不適合作為術語的中文翻譯。而其上位詞是“objects”,其中文翻譯為“物”,并不能判斷出其中文翻譯,但“beads”的參項為“jewelry”,因此“beads”的中文翻譯可以為“串珠”。如“watery”,網絡翻譯軟件給出的翻譯是“多水的,無力的”,將其視為“water”的形容詞形式,而術語一般是名詞,因此可以推斷其翻譯是不準確的,此時可以參考其詞間關系進行判斷。而“watery”的屬項為“consistency finding”,與其翻譯無關,而參項為“evaluation procedure”,其含義為“評估程序”,而在有關實驗的“評估程序”中一般都有“提取水樣”的程序,由此可以推斷“watery”的中文翻譯為“水樣”。

3 結論

隨著敘詞表應用環境的變化,多語種敘詞表的編制與維護成為敘詞表的重要研究方向。在編制與維護過程中,不僅需要發現新術語,還應該重視術語翻譯問題。本文從詞間關系的角度出發,針對敘詞表術語翻譯過程中遇到的問題,借助敘詞表特有的等同、等級和相關3種詞間關系,輔助敘詞表的術語進行翻譯。若敘詞表中術語具有用代關系,其中用項已經有了中文翻譯,而入口詞和優選詞只是詞形不同,或代項是熟知的術語,則可以依據等同關系進行輔助翻譯;若敘詞表中的術語無法直接譯出中文翻譯,而其中的等級關系可以輔助術語進行翻譯,則依據其屬項和分項進行翻譯;若根據等級關系無法進行判斷或者其詞間關系比較單薄,無等級、等同關系,則可借助相關關系進行輔助翻譯;若術語擁有豐富的詞間關系,即同時擁有等同關系、等級關系和相關關系時,由于具有等同關系的術語一般都是同義詞,因此可以首先考慮根據等同關系進行輔助翻譯,等級關系和相關關系作為參考;當等同關系無法判斷而等級關系可以進行判斷時,可以考慮利用等級關系進行輔助翻譯,最后考慮相關關系。

猜你喜歡
詞表多語種術語
青島市多語種應急語言服務現狀與需求調查研究
語聯世界,言通天下
基于VOLT的藏漢雙向機器翻譯
藏語稱謂在多語種史料中的行用路徑與語義演變
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會項目名稱漢英對照詞表
近十年國內外專業學術詞表建立文獻綜述*
從英語碩士到法國博士——我的留學規劃和多語種學習之路
有感于幾個術語的定名與應用
從術語學基本模型的演變看術語學的發展趨勢
常用聯綿詞表
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合