?

漢英機器翻譯中的譯前編輯研究

2023-06-24 14:20韓欣雨王非
中國新通信 2023年2期
關鍵詞:原文譯文機器

韓欣雨?王非

摘要:在人工智能廣泛運用的時代,以“機器翻譯+譯后編輯”(MTPE)為代表的人機合譯模式已成為機器翻譯的主流運行方式。但對于一些特殊文體、或者文本差異較大的情況,機譯效果往往不佳,增加譯后編輯工作量,降低整體翻譯效率。本文提出:機器譯文質量的提升可以借助譯前編輯來進行控制。以漢英翻譯為例,譯前編輯包括文體編輯、語法編輯及語義編輯。經過譯前處理后的機器譯文在語義上更加貼合漢語原文的意義內涵,在語言形式上也更符合英語的表達習慣。

關鍵詞:漢英翻譯;機器翻譯;譯前編輯+機器翻譯漢英機器翻譯研究現狀

一、漢英機器翻譯研究現狀

隨著基于神經網絡技術的機器翻譯在各個領域得到了日益廣泛的應用。有些原本因人工翻譯低效且費用高而被忽視甚至拋棄的語言服務細分業務,比如出國旅行的翻譯服務和信息量龐大的電商網站的本地化、社交媒體信息即時翻譯等業務也在機器翻譯技術不斷成熟的情況下業務量得到快速增長。然而目前,即使機器翻譯可以較好實現內容翻譯的目的,但所生成的譯文質量仍然無法媲美高水平的人工翻譯。尤其是對于一些特定文體以及長難句翻譯時,機器翻譯甚至可能出現理解錯誤、表達生硬等問題。因此機器翻譯的應用始終需要人工干預來保證其質量[1-2]。

就漢英機器翻譯而言,目前人機合譯的研究重點主要放在譯后編輯上,集中于對特定文本譯后編輯的錯誤分析以及編輯策略研究。同時,譯后編輯在全球語言服務行業中被廣泛應用,如Microsoft和SDL International這些頭部企業均有各自的譯后編輯隊伍。但實際操作中譯后編輯由于耗時長、成本高,限制了整體的翻譯效率。另一方面,針對譯前編輯的研究則相對匱乏。譯前編輯是在機器翻譯之前進行的人工干預,譯者通過比較源語與目標語之間的內在差異,對原文的語言形式進行編輯,使其更容易被機翻引擎所理解,從而預先保證了機譯文本的質量,也大幅度減輕了譯后編輯的工作量[2]。

二、譯前編輯的內容與方法

譯前編輯的工作指的是譯者為了凸顯原作的內容和意圖、實現原文作者的交際目的,按照譯入語的語言、文化習慣,對原文所包含的信息和表達形式進行調整甚至刪改。機器翻譯的譯前編輯則要求譯者對源語文本中機器不易理解和識別的詞、句等進行人工處理。譯前編輯是人機交互翻譯的重要表現,也是提高機器翻譯質量的重要途徑之一,能夠在一定程度上減少譯后編輯的工作量,使譯后編輯的效率大幅提升[3-4]。

國際譯聯在《翻譯工作者章程》中指出“忠實于原文并不等于一字不差的直譯。譯文的忠實性不能排除為了讓原作在形式、氛圍和深層意義等方面都能在其他語言中重現,并進行恰當調整”。漢語與英語在語法結構和語義構成上存在很大差異,英語是形合語言,句與句之間的連接詞較多,需要更完整的曲折形式。而中文是意合語言,句間連接詞較少,在表達上更簡潔,其理解更依賴于上下文。缺少譯前編輯的機譯文本經常存在信息理解錯誤、表達生硬等問題。譯者需要調整不同的文本使其適應受控語言寫作指南,用來實現原語寫作的連貫性以及提高這些文本的可譯性。而譯前編輯可以使源語文本變成更加適合機翻引擎識別的語言結構,使機器譯文的準確性和可讀性得到一定提升[4-5]。

目前,市面上的翻譯軟件中,由德國公司DeepL研發的DeepL翻譯器利用人工智能技術和神經網絡來不斷訓練和提升翻譯能力。而且神經網絡翻譯模型能夠模擬人腦,進行高級別的“思維與學習”,以及更加詳細地切分與精細的計算,使譯文質量得到很大提高。這種翻譯方法最大的優點是翻譯流暢,語法規范性較強,易于理解。在DeepL公司的盲測中,專業譯員在對譯文出處不知情的情況下選擇最準確的翻譯結果,其中包括了DeepL、谷歌翻譯、亞馬遜翻譯、微軟翻譯。DeepL以3:1的系數優勢優于競爭對手[6-7]。

在本研究中,研究者按照“語篇-句法-詞匯”三個層面的劃分,將譯前編輯分為文體類編輯、語法類編輯和語義類編輯三類,以機器翻譯平臺DeepL的產出文本為研究對象。探討如何通過譯前編輯過程達到改善機譯文本的效果,并采用官方譯文或名家譯本作為參考,對譯前編輯的效果進行驗證。

(一)文體類編輯

文體類編輯的典型代表是將文言文預處理為現代漢語,或將地方方言闡釋為標準普通話。以文言文為例,機器譯文通常是字對字的生硬譯法。所以,做譯前編輯時,通常需要將文言文解釋為結構清晰、語義明確的現代漢語。如例1所示:

例1

原文:固知一死生為虛誕,齊彭殤為妄作。

未經譯前編輯的DeepL譯文:I am sure I know that a death and a life are imaginary, and the death of Qi Peng is a delusion.

原文節選自王羲之的《蘭亭集序》,“一死生,齊彭殤”則來自莊子的《齊彭殤》一書。機器譯文中對于“一”、“齊”的理解是錯誤的。所以,研究者對文言文原文用現代漢語進行解釋:“把生與死等同,把長壽和短命等同”。

經譯前編輯后的原文:(我)已經意識到把生與死等同的說法是荒謬的,把長壽和短命等同起來的說法是妄造的。

經譯前編輯后的DeepL譯文:I have realized that it is absurd to equate life and death, and that it is a delusion to equate long life with short life.

林語堂譯文:Now I come to realize that it has been ridiculous for me to equate death with life, long life with short life. [8]

經譯前編輯后的譯文內容在句意的理解上更為清晰,語言表達更加貼合英文的使用習慣,更加準確地展現了原文用典的修辭手法,尤其在一些詞匯的運用上更加精確。同時,與著名翻譯家林語堂先生的譯文相比較,也可以發現,該譯文在結構和用詞上也與林語堂譯文有較高的一致性。

(二)語法類的編輯

漢語和英語在語法結構上存在顯著差別,在翻譯中譯者有時不得不對原文的句子結構增補必要的成分,使其易于被機翻引擎處理,機譯文本的語法結構也更加貼合目標語的表達,從而提升整體的譯文質量。

1.對無主句的編輯

漢語句子中經常省略主語,而英語以主語作為句子信息的出發點,主語是必不可少的語法成分。機翻引擎有時難以識別句子的隱含主語,對無主句的處理質量始終不夠穩定。因此,譯員需要在譯前編輯時根據語境上下文適當地增添主語,以幫助機器更好地理解識別原文。如例2所示[9]:

例2

原文:文學、戲劇、電影、電視、音樂、舞蹈、美術、攝影、書法、曲藝、雜技以及民間文藝、群眾文藝等各領域都要跟上時代發展、把握人民需求,以充沛的激情、生動的筆觸、優美的旋律、感人的形象創作生產出人民喜聞樂見的優秀作品,讓人民精神文化生活不斷邁上新臺階。

未經譯前編輯的DeepL譯文:Literature, theatre, film, television, music, dance, art, photography, calligraphy, opera, acrobatics, folk art, mass art and other fields should keep up with the development of the times and grasp the needs of the people, so as to create and produce excellent works with passion, vivid strokes, beautiful melodies and touching images that are pleasing to the people, so that the spiritual and cultural life of the people will continue to reach a new level.

經譯前編輯后的原文:(文化部門的各個領域,包括)文學、戲劇、電影、電視、音樂、舞蹈、美術、攝影、書法、曲藝、雜技以及民間文藝等,都要跟上時代發展、把握人民需求。(文藝工作者們)以充沛的激情、生動的筆觸、優美的旋律、感人的形象創作生產出人民喜聞樂見的優秀作品,讓人民精神文化生活不斷邁上新臺階。

經譯前編輯后的DeepL譯文:All fields of the cultural sector, including literature, drama, film, television, music, dance, art, photography, calligraphy, opera and acrobatics, and folk arts, must keep up with the development of the times and grasp the needs of the people. With passion, vivid brushstrokes, beautiful melodies and touching images, artists and writers create and produce excellent works that are pleasing to the people, so that their spiritual and cultural life can continue to reach new heights.

官方譯文:All fields in the cultural sector, including literature, drama, film, TV, music, dancing, fine arts, photography, calligraphy, acrobatics, ballad singing, storytelling and folk arts, should keep pace with the times, and cater to the current needs of the people. Their practitioners should commit themselves to creating passionate, moving works with touching images and superb lyrics that the people love, so that the public can enjoy a better cultural life.

經譯前編輯后,機器譯文準確地添加了句子的主語及相關內容,并實現了小句間的合理銜接,使得其句法結構也與官方譯文更加接近。

2.無賓語句的編輯

中文句子的意義往往依賴于語境傳達,賓語經常被省略。而英語中及物代詞后都要帶賓語,因此漢譯英時需要增添作為賓語的代詞,如例3所示:

例3

原文:口服, 一次4片, 一日2-3次。溫開水或溫牛奶沖服。(雙歧桿菌乳桿菌三聯活菌片)

未經譯前編輯的DeepL譯文:Take 4 tablets orally, 2-3 times a day. Take with warm water or warm milk.

原文為無賓語句,未經譯前編輯的機器譯文中同樣缺失賓語,造成語法錯誤。因此在譯前編輯環節中需要添加賓語“藥”。

經譯前編輯后的原文:口服,一次4片,一日2-3次。溫開水或溫牛奶沖服(藥品)。

經譯前編輯后的DeepL譯文:Take 4 tablets orally, 2-3 times a day. Take the medicine with warm water or warm milk.

參考譯文:Orally, four tablets each time, two or three times daily. Take medicine with warm water or warm milk.

與譯前編輯前譯文相比,經過譯前編輯后的機器譯文句子語法結構和內容更加完整,同時也更加清晰地表達了句意。

3.連接詞缺省句的編輯

中文語篇中一般不使用明顯的銜接手段,讀者主要通過上下文語境來領會句子之間的關聯。而英文則通過句與句之間的連接詞來體現句子之間的邏輯關系。

由于中文的句子較英文更短,因此對于一些高度濃縮、但內涵豐富的句子,研究者首先應該識別其內在的邏輯關系,將其拆分為獨立小句,并在小句間標注出合適的連接詞。如例4所示:

例4

原文:地方小邀請不了那么多人。

未經譯前編輯的機器譯文:The place is too small to invite so many people.

仔細分析原文可以發現,句子中隱含了因果關系。但是未經譯前編輯的機譯文并未顯示出句中所隱含的因果關系?!暗胤叫 睒嫵闪恕把埐涣四敲炊嗳恕钡脑?,因此,譯者將小短劇拆分為兩個獨立的小句,并在句中添加表達因果關系的連接詞。此外,研究者基于前文中對于無主語句的譯前編輯方法,在短句中增加了主語“我”。

經譯前編輯后的原文:(因為)地方小,(所以)(我)邀請不了那么多人。

經譯前編輯后的DeepL譯文:I couldn't invite that many people because the place was small.

顯然,經過譯前編輯后的譯文,短句的語法結構更加完整,句間關系也更加清晰,準確地傳達了原文所表達的邏輯含義。

(三)語義類編輯

1.未語法化詞匯的編輯

現代漢語的有些詞匯已經被語法化,如“工業化、現代化”,它們在英語中有相應的對等詞匯(industrialization, modernization),但仍然存在未被語法化的表達,在進行譯前編輯時仍需要進行轉化。如例5所示:

例5

原文:天寶村現代特色農業示范園的先行先試,為白河縣乃至陜西省以園區化推動地區農業現代化提供了經驗借鑒。

未經譯前編輯的DeepL譯文:The early and pilot implementation of the modern special agricultural demonstration park in Tianbao Village has provided experience for Baihe County and even Shaanxi Province to promote the modernization of regional agriculture with the park.

“園區化”一詞尚未語法化,在英語中也無固定的對應詞匯,機器譯文在理解上出現較大偏差,“with the park”未能正確表達出原文的真正含義。因此,研究者在譯前編輯中將“園區化”闡釋為“發展工業園區”,同時將“以園區化”這一方式狀語更詳細地表述為“通過發展工業園區來...”,從而便于機器的理解。

經譯前編輯后原文:天寶村現代特色農業示范園的先行先試,為白河縣乃至陜西省通過發展工業園區來推動地區農業現代化提供了經驗借鑒。

經譯前編輯后DeepL譯文:The early trial of modern special agricultural demonstration park in Tianbao Village has provided experience for Baihe County and even Shaanxi Province to promote regional agricultural modernization through the development of industrial parks.

2.對修辭性話語的譯前編輯

漢語文本中的模糊特質無處不在,即便基于語料庫的機器翻譯也很難及時得到足夠語料支持,導致機譯文本與譯前編輯后文本差距巨大。修辭的使用使不同文化背景下的人在閱讀文本時出現理解的偏差,從而導致整句的理解錯誤。這就需要在譯前編輯時,將原文本使用修辭的部分進行人工釋義編輯,再使用機器翻譯。如下例6所示[10]:

例6

原文:能源安全的飯碗必須端在自己手里

未經譯前編輯前DeepL譯文:The rice bowl of energy security must be in your own hands.

研究者在進行譯前編輯時發現,句子中出現的“飯碗”一詞使用了隱喻的修辭手法。而機器譯文直接將“飯碗”直譯了出來,使句意出現了極大的偏差。因此,研究者對“飯碗”一詞進行解釋,將其理解為“能源安全必須靠我們自己來保障”。

經譯前編輯后原文:我們必須靠自己的力量保障能源安全。

經譯前編輯后DeepL譯文:We must ensure energy security on our own.

官方譯文:We must hold energy security in our own hands./We must ensure energy supply secure.

經譯前編輯后的原文還原了“飯碗”的指代意義,譯前編輯后的機譯文與官方譯文貼合度基本一致,句意表達清晰完整,便于理解。

三、綜合對比研究

以下材料節選自外交部翻譯司副司長張璐在第二屆“全國外交口譯大賽”上的致辭,譯文以官方譯文作為參考。為便于分析,使用上標數字為每個句子作出標記。

原文:①也希望我們注意積累,厚積薄發,勤思敏學,在日常的學習過程中需要打好中文和外文的語言基礎,還要鍛煉好各項基本功。②在日常學習中大家應該保持好奇心,培養責任心,提高進取心。③相信在這方面通過不斷的積累,進一步深入了解在中外歷史文化發展階段、思維方式等各方面的差異,④還有就是符合一定的傳播規律基礎上,我們能夠有能力努力朝著“聽得懂、 聽得進、聽得明白”,就說讓外國受眾實現“三聽”方面做出自己的努力,并且也取得更大的進步。

官方譯文:①First, we need to attach importance to accumulating the knowledge of Chinese and English, as well as improving language skills and to develop good habits of thinking. ②Second, we need to maintain curiosity, cultivate a sense of responsibility, and boost motivation to make more progress. ③Third, we need to figure out the differences in the historical and cultural development stages and mindsets of the people between China and other countries.④ Fourth, we need to follow related communication rules, enabling China's stories to be better understood by foreign friends.

未經譯前編輯DeepL譯文:①We also hope that we will pay attention to accumulate, think and learn diligently, and build a good foundation of Chinese and foreign languages in our daily study process, as well as exercise all basic skills. ②In our daily study, we should keep curiosity, cultivate responsibility, and improve our aggressiveness. ③It is believed that through continuous accumulation in this area and further understanding of the differences between Chinese and foreign history and culture, thinking, and other aspects, ④as well as on the basis of certain communication laws, we can make efforts to “ listen to, and understand”, so that foreign audiences can achieve listen to, and understand, and make more progress in the area of “three listening”.

與官方譯文相比,機器翻譯的譯文都或多或少存在一些問題。尤其是在句間邏輯的處理上還是無法與人工翻譯相提并論。從語篇層面看,分析句間邏輯關系不難發現,句與句之間存在并列關系。而機譯文未能準確地識別出隱含的邏輯關系,未能進行很好的意群劃分。從語義層面看,機器譯文未能正確處理文中的表達。將“聽得懂、聽得進、聽得明白”等表示強調的詞句重復翻譯,使得句子冗長。譯文意義出現偏差。

經譯前編輯后原文:①(第一,)我們要在日常的學習過程中打好中文和外文的語言基礎,還要注意積累,勤思敏學。②(第二,我們)要保持好奇心,培養責任心,提高進取心。③(第三,我們要)進一步深入了解在中外歷史文化發展階段、思維方式等各方面的差異,④(第四,)在傳播規律基礎上,讓外國受眾更好地了解中國故事。

經譯前編輯后DeepL譯文:①First, we need to build a good language foundation in Chinese and foreign languages in the daily learning process, and pay attention to accumulation, diligent thinking and keen learning; ②Second, we need to maintain curiosity, cultivate responsibility and improve enterprise; ③Third, we need to further deepen our understanding of the differences between Chinese and foreign historical and cultural development stages, ways of thinking and other aspects; ④Fourth, we are in line with the law of communication based on the foreign audience to better understand the Chinese story.

在譯前編輯中,研究者對其中的長句進行意群的劃分,斷句,增加主語,進行適當的釋義,使經譯前編輯后的機譯文與官方譯文更加符合,句意表達準確。研究者對原文的編輯,目的是適應機器的識別,提高機器譯文的質量。在譯前編輯后,兩個機器翻譯的譯文質量都有了一定的提升,這也彰顯了譯前編輯對于機器翻譯譯文質量的重要性。

四、結束語

本文較為全面地探討了譯前編輯對于提高人機交互翻譯效率的作用,以及譯前編輯在應用中的具體操作路徑。通過對語篇、句法、詞法的研究,不難發現在使用機器翻譯時,加入譯前編輯這一步驟會使人機合作的效率更高,經過譯前處理后的機器譯文在語義上更加貼合漢語原文的意義內涵,在語言形式上也更符合英語的表達習慣。同時,譯前編輯所需的時間往往少于譯后編輯的時間,因為在譯前編輯過程中,譯員只需要對機器未能識別的表達方式進行增添或解釋,從而極大地減輕譯后編輯的工作量。加入譯前編輯環節,對于減輕譯后編輯工作量,提升人機交互翻譯效率具有較強的應用價值。

作者單位:韓欣雨 王非 西安交通大學

參? 考? 文? 獻

[1] 王清然,徐珺. 技術進步視域下機器翻譯技術對語言服務行業的影響分析[J]. 中國外語,2022,19(01):21-29.

[2] 彭石玉,周丹. 新聞導語翻譯的譯前編輯模式研究[J]. 湖北師范大學學報(哲學社會科學版),2022,42(01):92.

[3] 徐勤,吳穎. 經貿外宣資料的翻譯探索[J].中國翻譯,2003(03):80-82.

[4] 馮全功,高琳. 基于受控語言的譯前編輯對機器翻譯的影響[J].當代外語研究,2017,(02):63-68.

[5] 賈文波. 原作意圖與翻譯策略[J].中國翻譯,2002(04):30.

[6] 閆欣,陳瑞哲,張井. 翻譯技術云平臺的發展現狀與趨勢[J]. 中國科技翻譯,2019,32(01):22-25.

[7] Li, C. A Study on Chinese-English Machine Translation Based on Transfer Learning and Neural Networks[J]. Wireless Communications and Mobile Computing,2022:1-2.

[8] 林語堂. 古文小品譯英[M].北京:外語教學與研究出版社,2009.

[9] Yip, P., Rimmington D. Chinese: A Comprehensive Grammar[M]. London: Taylor and Francis, 2016:589.

[10] 仲文明,徐佳敏,李蕓昕. 機譯中漢語科技文本的模糊特質與譯前編輯[J]. 中國科技翻譯,2021,34(04):36-39,42.

猜你喜歡
原文譯文機器
Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
機器狗
機器狗
譯文摘要
未來機器城
I Like Thinking
Performance of a double-layer BAF using zeolite and ceramic as media under ammonium shock load condition
譯文
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合