阿里翻譯Alynx平臺機器翻譯及譯后編輯:問題、成因與對策
——以“Country Reports on Terrorism 2014”等文本的機譯為例①

2023-02-06 23:42余靜良

語言與文化論壇 2023年2期

余靜良

1. 引言

自20世紀40年代W. 韋弗(W. Weaver)提出機器翻譯構想以來,機器翻譯歷經挫折與挑戰,取得了顯著的成績與進步。尤其是21世紀以來,計算機技術與互聯網發展進入快車道,同樣促使機器翻譯技術不斷更迭。

近年來,隨著人工智能(AI)、大數據與5G技術的發展,機器翻譯又迎來了新的機遇與挑戰。2014年,神經網絡機器翻譯(Neural Machine Translation,簡稱NMT)模型成功問世,標志著機器翻譯的譯文質量又得到了進一步提升。機器翻譯及譯后編輯模式的運用極大地提高了翻譯速度與質量,翻譯生產力得以迅猛增長?，F如今,機器翻譯及譯后編輯在語言服務行業所占比重越來越大,發揮著至關重要的作用。例如,阿里翻譯及譯后編輯在商品名稱與簡介翻譯方面表現卓越、成績斐然,為中外貿易往來提供了技術支持。

Alynx是阿里翻譯旗下智能協同翻譯平臺,致力于為有自主人工翻譯需求的用戶提供高效管理翻譯項目的平臺,賦能用戶快速完成翻譯需求。隨著神經網絡翻譯技術、大數據、人工智能以及5G技術的不斷更新迭代,現如今,阿里翻譯已擁有先進的技術、穩定的系統、源源不斷的客戶以及良好的口碑。

本研究依托南京策馬集團譯后編輯在線實習項目,借助Alynx翻譯平臺,通過選取“Country Reports on Terrorism 2014”(《2014年全球恐怖主義形勢報告》)等文本中近20萬字語料進行機器翻譯,再利用Alynx平臺進行譯后編輯。通過對機器翻譯與人工譯后編輯文本進行對比分析發現,機器翻譯譯文正確率雖已大幅提升,但仍存在類似詞匯、句法和符號等層面的翻譯錯誤。此外,通過反思此次機器翻譯及譯后編輯,發現機器翻譯與譯后編輯等人機交互模式中仍存在機器翻譯語料來源不明、機器翻譯及譯后編輯譯文版權歸屬問題、“忠實原文與否”以及責權不清等倫理問題。

基于此,本文將對機器翻譯平臺譯文翻譯的錯誤類型與翻譯倫理問題進行深入剖析,以期廓清Alynx平臺機器翻譯的錯誤類型,并對相關錯誤進行修改,總結譯后編輯原則。此外,本研究還將針對機器翻譯及譯后編輯出現的翻譯倫理問題進行歸納,探索機器翻譯錯誤和翻譯倫理問題的成因,并提出相應對策,從而為今后機器翻譯及譯后編輯提供學理參考,為機器翻譯平臺技術研發提供鏡鑒,以期提高機器翻譯譯文的質量與效率,實現人機協作的合理、健康發展。

2. 機器翻譯及譯后編輯

2.1 機器翻譯

計算機翻譯通常被稱為機器翻譯,即全自動高質量機器翻譯(Fully Automatic High Quality Machine Translation,簡稱 FAHQMT或MT)(張政,2004)。機器翻譯即為:利用計算機系統將一種自然語言(源語言)轉化成另一種自然語言(目標語)。

機器翻譯是計算語言學的一個分支,具有重要的科學研究價值。1946年,人類制造出世界上第一臺電子計算機。1949年,美國科學家韋弗在《翻譯備忘錄》中首次正式提出“機器翻譯”的概念與構想,標志著機器翻譯的誕生。通過梳理機器翻譯與計算機發展史可知,機譯系統可劃分為基于規則(rule-based)與基于語料庫(corpus-based)2個種類。機器翻譯目前是語料庫翻譯學應用較為成功的領域之一,翻譯平行語料庫使得機器翻譯如虎添翼(張繼光,2016)。而基于語料庫的機譯方法又可分為基于統計(statistics-based)的方法和基于實例(example-based)的方法。

2013年以來,隨著深度學習的研究取得顯著進步,基于人工神經網絡的機器翻譯逐漸興起和繁榮。2016年谷歌宣布人工水平英漢翻譯后,神經機器翻譯以井噴式的發展將翻譯行業從人力驅動帶入數據驅動(楊玉婉,2020)。

然而,雖然各在線翻譯平臺技術日趨成熟,但機器翻譯始終無法達到專業譯員的翻譯水準,仍存在翻譯譯文質量層次不齊、翻譯質量與效率之間的不平衡以及相關術語庫、記憶庫仍待加強與更新等問題。由是觀之,需要采用人機交互模式,通過人工對機器翻譯的譯文進行譯后編輯,從而達到相應的翻譯標準,進而實現翻譯效率與翻譯質量的動態平衡。

2.2 譯后編輯

業界不同學者對譯后編輯曾有不同的定義。魏長宏和張春柏(2007)認為,譯后編輯(post-editing,簡稱PE)是對機器翻譯系統把源語言轉化為目標語后生成的譯文進行的編輯操作。崔啟亮(2014)表示,譯后編輯是“檢查和修正機器翻譯的輸出”。而筆者認為,馮全功和張慧玉(2015)對譯后編輯所作的定義更為全面、詳細與精準,即“所謂譯后編輯是指根據一定的目的對機器翻譯的原始產出進行加工與修改的過程,包括更改翻譯(語言)錯誤、提高機譯產出的準確性與可讀性等。其中,編輯加工的程度由多種因素而定,如翻譯目的、客戶需求、客戶報價、文檔類型、機譯產出質量、文檔使用壽命等”。一般情況下,可將譯后編輯分為輕度譯后編輯和完全譯后編輯。由是觀之,譯后編輯即為根據(客戶)特定需求對機器翻譯原始譯文進行加工處理,以期提高譯文的準確性和可讀性,從而大幅提升翻譯速度與質量的過程。

美國卡門森斯咨詢公司(Common Sense Advisory)的《2016全球語言服務市場報告》顯示,2016年譯后編輯業務占整個語言服務行業市場的3.94%,有25.39%的語言服務供應商提供譯后編輯服務,并認為該項服務前景光明(馮全功等,2018)?？梢?基于機器翻譯的譯后編輯仍大有可為。

3. 翻譯倫理

《現代漢語詞典》(第七版)對“倫理”一詞的定義為“人與人相處的各種道德準則”。漢語中“倫理”一詞在英語中對應的詞為ethics。而《牛津高階英漢雙解詞典》(第九版)對ethics一詞的解釋為motivation based on ideas of right and wrong以及the philosophical study of moral values and rules。由此可見,倫理學重點聚焦人與人之間的道德準則與是非觀。

翻譯倫理(ethics of translation)一詞始于1895年美國學者約翰·S. 諾倫(John S. Nollen)于《當代語言論叢》發表的署名文章“The ethics of translation”。中外學者都曾對“翻譯倫理”或“翻譯倫理學”給予過定義。例如,王大智(2009)認為:“翻譯倫理就是翻譯行為事實該如何規律以及翻譯行為該如何規范,它既面向翻譯行為也面向翻譯行為的主體?！痹摱x并未將中間人,即除譯者以外的翻譯需求方、出版商和贊助商等因素考慮在內。因此,彭萍(2013)將“翻譯倫理學”定義為:“翻譯倫理學就是關于翻譯活動、翻譯理論研究、翻譯批評、翻譯教學等的道德或倫理規范研究,即從倫理的視角來審視翻譯的方方面面?！?/p>

于是,翻譯倫理學不僅是有關譯者本身的倫理規約,還涉及語言服務供應商、出版商和贊助人,甚至還關乎翻譯項目管理、機器翻譯及譯后編輯與本地化和國際化等多方面。翻譯活動不再僅囿于切斯特曼(Chesterman)總結的再現倫理、服務倫理、交際倫理、基于規范的倫理與承諾倫理5種倫理模式,還延伸至約納斯(Jonas)所提出的“責任倫理”。翻譯活動不僅聚焦“怎么譯”的問題,還要關注“譯不譯”“為誰譯”“誰來譯”“譯后結果如何”及“譯文責任主體”等問題。

隨著翻譯技術時代的來臨,在譯后編輯等人機耦合的過程中,勢必會碰撞出翻譯倫理問題的“火花”。2019年,中國翻譯協會正式發布國內首部《譯員職業道德準則與行為規范》。該文件的發布表明,中國翻譯職業化得到進一步推進,職業譯員道德倫理規范、倫理選擇、信任危機及責權不清等倫理問題日益凸顯,翻譯倫理已成為機器翻譯及譯后編輯等人類與翻譯技術深度交融過程中不可回避的問題,亟待擴充翻譯倫理模式,拓展翻譯倫理應用場景,從而更好地促進人機交互的健康與可持續發展。

4. 機器翻譯及譯后編輯的研究現狀

通過在中國知網按主題搜索“機器翻譯”發現,機器翻譯研究成果達13696項(1)本文所有源自中國知網的數據檢索時間均為2022年7月7日。。搜索“譯后編輯”可知,譯后編輯研究成果達641項。同時搜索“機器翻譯、譯后編輯”發現,該詞條下研究成果達389項?？梢?國內學界對機器翻譯研究較為深入,研究成果不勝枚舉,對譯后編輯的研究成果也相對較多。如劉群(2003)對統計機器翻譯方法進行了總結,并對自然語言處理原則進行了歸納整理。然而,對機器翻譯及譯后編輯進行研究的相關成果卻相對較少。例如,崔啟亮(2014)對機器翻譯及譯后編輯的應用與研究、發展動力、應用領域與實踐準則進行了深度剖析,為機器翻譯發展前景提供了有價值的參考。

此外,在中國知網按主題搜索“機器翻譯、倫理”,顯示國內對機器翻譯中倫理問題進行研究的相關成果只有51項,尚顯匱乏,與機器翻譯及譯后編輯相關研究成果數量形成鮮明對比。其中,任文(2019)對翻譯倫理、機器翻譯倫理與翻譯技術倫理等概念加以廓清,提出將責任倫理原則與其他翻譯倫理五原則相結合,從而應對機器翻譯中所產生的新的翻譯倫理問題與挑戰。

5. 機器翻譯及譯后編輯:問題、成因與對策

本文依托南京策馬集團譯后編輯實習項目,借助阿里翻譯Alynx翻譯平臺對“Country Reports on Terrorism 2014”等文本進行機器翻譯,再利用該平臺對機器翻譯譯文進行人工譯后編輯。通過比對機器翻譯與譯后編輯譯文發現,雖然神經網絡機器翻譯正確率已顯著提升,效率與便捷性大大提高,但仍不可避免存在諸多不同類型的翻譯錯誤。同時,譯員在進行譯后編輯過程中,由于不同客戶需求、原文與機器翻譯譯文對譯員的影響以及翻譯技術的更新優化,難免會觸發翻譯倫理問題。譯者不僅面臨“怎么譯”的問題,且還需面對“譯不譯”“為誰譯”“誰來譯”“忠實與否”以及“譯后結果如何”等問題。鑒于此,本研究將利用上述平臺,借助翻譯文本總結相關機器翻譯錯誤類型與翻譯倫理問題,分析其背后成因,并提出相應對策,以期為機器翻譯技術研發人員、機器翻譯研究學者提供相應參考。

5.1 機器翻譯錯誤類型

5.1.1 詞匯層面

例①:詞義誤譯。

原文:Location/Area of Operation。

機器譯文:操作位置/區域。

譯后編輯:行動位置或區域。

分析:operation在英語中既意為“操作;經營;手術”,又意為“行動”。而在上述文本中,重點是為了強調各恐怖組織行動或活動的位置或區域。因此,這里機器顯然是對英語中operation一詞的詞義進行了錯誤匹配,誤將該語境下的詞義理解為了“操作”。因此,該譯文將使得讀者對此疑惑不解。而事實上,原文是為了引出下文,從而對恐怖組織的活動區域與范圍進行更為詳細的介紹。所以,這里應當譯為“行動”。同樣,這也反映出機器翻譯,特別是在線翻譯平臺在詞義辨析、術語庫以及語料庫的更新完善與發展方面還亟待提高。

例②:增詞減詞(主語指代不明)。

原文:Ansar al-Dine (AAD) was designated as a Foreign Terrorist Organization on March 22, 2013．

機器翻譯:安薩爾·丁 (AAD) 于2013年3月22日被指定為外國恐怖組織。

譯后編輯:2013年3月22日,美國將安薩爾·丁組織確認為境外恐怖組織。

分析:本文所有案例均選自“Country Reports on Terrorism 2014”,該報告是由美國國務院發布的。因此,該報告中各組織的名稱均由美國國務院等組織機構認定,原文中的主語應為美國或美國國務院。而機器翻譯譯文將原文中的被動語態直接原封不動地譯為漢語中的被動語態。翻譯中由于受到源語的影響和省力原則的操縱,英語被動句多被翻譯為“被”字句(朱一凡等,2014)。而在未受英語語法與句法所影響的漢語中,被動語態的使用頻率遠遠小于英語中被動語態的使用頻次。由是觀之,若欲將原文譯為地道的漢語表達法,則需增加主語,將原文譯為主動語態。因此,譯后編輯譯文增加了主語“美國”,從而讓句意更加直觀清晰,也不會引起句意的模糊與歧義。

5.1.2 句法層面

例①:句子語序問題。

原文:AAD has fractured and its members have been largely scattered by the French intervention in Mali．

機器翻譯:AAD已經破裂,其成員在很大程度上被法國對馬里的干預所分散。

譯后編輯:安薩爾·丁組織已支離破碎,法國對馬里實施干預,該組織成員很大程度上因此而“軍心渙散”。

分析:對比分析機器譯文與譯后編輯譯文發現,機器翻譯譯文語內邏輯結構混亂,組織名稱即術語翻譯前后不一致,被動語態翻譯僵化。更為重要的是,機器譯文也并未將原因前置,結果后置,很可能導致譯入語讀者對原文所要傳達的信息和內涵一頭霧水,感到不知所云。因此,在譯后編輯譯文中,將“軍心渙散”的原因前置,把被動語態翻譯為主動語態,從而增強譯文的可讀性,使得譯文語序合理清晰。

例②:從句翻譯錯誤。

原文:The first attack took place when a bomber blew himself up outside a hotel in Sousse, Tunisia, resulting in no other fatalities．

機器翻譯:第一次襲擊發生在一名炸彈襲擊者在突尼斯蘇塞的一家旅館外炸死自己,沒有造成其他死亡。

譯后編輯:第一次襲擊中,一名炸彈襲擊者在突尼斯蘇塞的一家旅館外引燃炸彈,自己被炸死,所幸沒有造成其他人員死亡。

分析:通過對比分析原文、機器譯文與譯后編輯譯文不難發現,機器譯文邏輯混亂,含義模糊,讓人不知所云。與此同時,機器譯文也并未正確地將when引導的時間狀語從句譯出。而譯后編輯譯文則就較為準確地傳遞出原文中“自己被炸死”的含義,且與原文語序保持了一致,通過增詞的增譯手段,使得原文信息實現了較好的傳遞。

5.1.3 符號層面

例①:術語符號錯誤。

機器翻譯:2006年12月,ETC爆炸了一枚巨大的汽車炸彈,炸毀了馬德里巴拉哈斯國際機場的大部分有蓋停車場。

譯后編輯:2006年12月,巴斯克祖國與自由組織引爆了一枚巨型汽車炸彈,導致馬德里巴拉哈斯國際機場有蓬停車場的大部分區域被毀。

分析:通過深入分析機器譯文與譯后編輯譯文可以發現,機器翻譯譯文將ETA組織誤譯為了我們日常生活中常見的ETC(電子不停車收費系統)。因此,筆者認為,譯員在進行譯后編輯時,需格外注意術語翻譯的準確性與一致性。不能因為一個字母之差而造成翻譯上的重大失誤。

例②:標點符號格式錯誤。

原文:It was a moment ago, and I didn’t get a chance to—when he was describing Chinese investments and so forth...

機器譯文:就在剛才,當他描述中國投資等等的時候,我沒機會……

譯后編輯:剛剛,他談及中國投資等話題時,我并沒機會……

分析:英漢語標點符號既有相似性,又有差異性。例如,漢語中的逗號、分號、問號、感嘆號及破折號都與英語中的該類符號類似,但也并不完全一致。尤其是漢語中擁有某些英語中并未有的標點符號,例如書名號(《》)與頓號(、)。對比分析原文、機器譯文與譯后編輯譯文可知,原文中的“-”在機器譯文中被誤譯為了“-”,原因就在于漢語中的破折號應為“——”,而非“-”。而譯后編輯譯文中則對其進行了刪除,并在括號內對原文缺失語義進行補充說明,從而使得譯文更加符合譯入語的語法規范,進而體現出該報告的嚴謹與正式。

不要惹水瓶座，敏感的水瓶座最害怕受傷；水瓶很敏感，幾句話就能感覺出他人對自己是討厭還是喜歡。水瓶很浪漫，但有時也不善于表達，很多事悶在心里，自己研究透徹然后做出行動。作為別人眼中的“開心果”，水瓶似乎很堅強，然而內心只有自己知道……

5.2 機器翻譯錯誤成因

5.2.1 機器一詞多義辨析能力尚待提升

無論英語還是漢語,都存在眾多一詞多義的現象。例如,上述例子中operation一詞,既可指“操作”,同樣還有“行動”的含義;再如英語中的brother,既有“哥哥”的含義,同樣又可指“弟弟”。又如interest一詞既含有“興趣”之意,又包含“利益、利息”的含義。因此,機器翻譯研發人員應當著重訓練與提升機器翻譯系統根據特定語境,辨析可能出現的一詞多義現象的能力。

5.2.2 機器自動分詞技術有待完善

漢語語句是以字為單位,且字與字之間沒有空格。因此,在進行漢譯英(或漢語譯為其他語言)時,必須根據詞匯或意群對漢語語句進行切分。然而,近年來,雖機器自動分詞技術取得了較為顯著的進步,但各類主流機器翻譯軟件或在線翻譯平臺仍會時常出現相應自動分詞錯誤導致的機器誤譯。如此前谷歌、必應、有道翻譯等機器翻譯引擎無法進行精準自動分詞,錯誤地將“請在一米線外等候”譯為“Please wait outside rice-flour noodle.”,將“救生衣柜”誤譯為Life-saving Wardrobe,以及將“上車票”誤譯為Get on the Ticket。

5.2.3 機器學習算法技術亟待提高

相較于統計機器翻譯,神經網絡機器翻譯的語言模型較為簡單,即“端到端”式。其主要包含2個部分,編碼器和解碼器。同時,神經網絡機器翻譯主要依賴于機器學習和機器算法,基于特定的神經語言模型,利用龐大的數據庫以獲取較為精確的詞向量,從而進行編碼與解碼。因此,神經網絡機器翻譯對機器學習與算法技術的要求較高。如今,機器學習,尤其是深度學習技術仍需不斷革新,以滿足機器翻譯引擎開發和語言服務行業發展的需要。

5.2.4 語料庫、數據庫內容尚待更新與拓展

作為神經網絡機器翻譯不可或缺的組成部分之一,神經語言模型和詞向量的訓練與獲取在某種程度上都依賴于最新的海量數據庫。此外,翻譯語料的新舊與否,同樣可能決定著機器翻譯與譯后編輯產出結果的準確度和流暢度,如近年來出現的“內卷”“躺平”“元宇宙”等新詞的翻譯。因此,倘若使用尚未更新的語料庫和數據庫進行機器翻譯及譯后編輯,很可能造成某些領域的重大且不可逆轉的損失。

5.3 機器翻譯錯誤的應對策略與原則

針對機器翻譯出現的不同類型錯誤,作為機器翻譯引擎研發人員與專業譯后編輯人員,應當采取相應的對策,加快翻譯技術的研發,以期降低機器翻譯譯文錯誤率,切實提升機器翻譯與譯后編輯譯文水平。

首先,研發人員應基于特定的應用場景,從4個方面加強翻譯技術的研發與應用:第一,加強產學研融合發展;第二,加強多流程與多渠道整合;第三,提高兼容性、拓寬適用性;第四,提高協作化,提升翻譯效率(余靜良,2022)。同時,應著力提升機器一詞多義甄別能力,優化機器自動分詞技術、機器學習與算法技術,從而真正實現包括機器翻譯在內的翻譯技術的跨越式發展。此外,各大高校、科研院所及語言服務提供商應不斷更新、拓展和完善自身語料庫、數據庫內容,做到與時俱進,從而確保機器翻譯及譯后編輯產出結果的準確性和先進性。

其次,譯后編輯人員可利用劉重德倡導的“信、達、切”原則(劉重德,1979),對機器翻譯譯文進行適當修改與調整,以期滿足不同客戶群體的需求。第一,遵循“信”的原則,對原文中術語內涵精準傳遞。例如,在對“In December 2006, ETA...”例句中的ETA進行翻譯時,不能在對該術語毫無查證的情況下將該術語錯誤譯為ETC。第二,可利用“達”的翻譯原則,如對機器翻譯譯文中的“其成員在很大程度上被法國對馬里的干預所分散”進行處理,將其修改為“法國對馬里實施干預,該組織成員很大程度上因此而‘支離破碎’”,從而讓譯文做到“語序連貫、邏輯嚴謹”,較好地傳遞出原文語義內容。第三,還可在做到“信、達”的基礎上,利用“切”的原則對機器翻譯譯文進行恰當處理,使得譯文風格簡約、格式無誤。如在對“...I didn’t get a chance to—when he was describing Chinese investments and so forth...”該例句進行翻譯時,譯文無需對原文英文格式進行完全保留,可根據漢語標點符號使用規則對機器翻譯譯文進行處理。因此,該例句可譯為“剛剛,他談及中國投資等話題時,我并無機會……”。

5.4 機器翻譯及譯后編輯倫理問題

翻譯是一種跨語言、跨文化的交際活動,是一項在人類意識支配下為了達到某種目的或意圖的主觀能動性的活動。許鈞(1998)曾指出:“任何翻譯標準的確立,任何翻譯方法的采用,無不受到道德層面的約束?！笨梢?翻譯實際上就是一種倫理活動,必然會受到道德層面的限制和約束。

進入21世紀以來,計算機與互聯網技術飛速發展,造就了機器翻譯的興旺繁榮。尤其是近年來,隨著人工智能、深度學習、大數據及5G技術不斷取得新的突破,機器翻譯也出現了神經網絡機器翻譯新模式。然而,伴隨翻譯技術的迭代更新,翻譯倫理問題也在人機交互過程中層出不窮。鑒于此,筆者總結出以下機器翻譯及譯后編輯倫理問題:

機器使用記憶庫、術語庫等版權不明的語料翻譯出的譯文,經由人工譯后編輯,最終產出的譯文版權到底歸誰?

如若經由機器翻譯及譯后編輯得出的譯文出現錯誤,該錯誤應由機器承擔還是譯后編輯人員承擔?

譯后編輯人員在修改譯文時,是選擇忠實于原文還是忠實于機器翻譯譯文?需不需要參考原文?

某些機器翻譯公司為提高公司效益,刻意夸大宣傳機器翻譯效能,甚至將人工譯文當作機器譯文進行宣傳,嚴重損害譯員權利,造成信任危機,這種情況該如何應對?

可能還會出現客戶要求與譯員本身職業道德相違背,亦或與國家、民族利益或宗教習俗相背的問題。在這種情況下,譯員應如何選擇?

此外,某些語言服務企業可能會出現泄露客戶或譯員隱私數據甚至販賣其隱私數據的行為和現象。

上述問題應當引起所有機器翻譯及譯后編輯研究人員的反思。

5.5 機器翻譯及譯后編輯倫理問題成因

5.5.1 意識不強

近年來,機器翻譯與譯后編輯倫理問題層出不窮,如某些翻譯公司公開宣稱其公司產出譯文可以與人工譯文相媲美;又如某些譯員錯將機器翻譯譯文當作人工譯文交付用戶;再如某些語言服務提供商存在翻譯數據和用戶數據泄露的現象與問題等。以上所述案例多數由翻譯倫理意識薄弱所致。

5.5.2 責任不清

大部分語言服務企業的譯員均接受過專業培訓。因此,其對相關翻譯業務、譯員職業道德及應承擔的責任較為熟知。然而,某些語言服務提供商的譯員并未經過專業培訓和教育,因而缺乏相應的責任意識,對相關翻譯緊急情況的處理能力較弱,無法理清責任主體和履行專業譯員應盡義務,可能會出現“責權不清”“互相推諉”的問題,最終可能導致某些語言服務企業與譯員個體“聲名狼藉”。

5.5.3 版權不明

機器翻譯與譯后編輯倫理問題的另一大成因即為版權不明。由于記憶庫、術語庫等語料的開放使用和二度傳播,倘若機器使用版權來源不明的語料內容進行翻譯,將很可能產生譯文(或譯著)署名權糾紛等版權問題。

5.5.4 規則不從

首先,國際標準化組織(ISO)已于2017年4月發布ISO 18587—2017“Translation services—Post-editing of machine translation output—Requirements”;其次,2019年,中國翻譯協會發布了《譯員職業道德準則與行為規范》;最后,國家標準GB/T 40036—2021《翻譯服務機器翻譯結果的譯后編輯要求》于2021年4月30日由國家標準化管理委員會正式批準發布(劉智洋等,2021),已于2021年11月1日實施。在第一份標準發布之前,很長一段時間內,國內外機器翻譯譯后編輯的發展速度與其缺乏標準規范的發展狀態極不相匹配。因此,該段時間內,各類問題層出不窮,諸如譯文質量層次不齊、版權糾紛、數據泄露、定價不合理等等。雖然在一系列標準與規范出臺后,譯員素質和責權意識得以顯著提升,但仍有部分譯員規則意識淡薄,不遵守相應行業規范,導致在譯文交付過程中,各類問題仍有出現。

5.5.5 誠信不足

誠信是立身之本。然而,某些翻譯公司為了凸顯機器翻譯引擎的效果,有意夸大宣傳,甚至將專業譯員的人工譯文當作機器翻譯產出的譯文進行宣傳。不僅違反相關法律法規,更是對語言服務提供商、譯員與客戶間信任關系的嚴重損害。此外,某些非專業譯員還可能出現延期交付譯文、錯誤交付譯文亦或交付譯文質量無法滿足客戶的期待等問題,從而產生“信任危機”等翻譯倫理問題。

5.6 機器翻譯及譯后編輯倫理問題的應對策略

首先,在宏觀層面上,國家相關部門和行業協會應當制定與出臺相應法律法規和行業規范。例如,中國翻譯協會已于2019年正式發布國內首部《譯員職業道德準則與行為規范》(中國翻譯協會,2019)。該規范理應引起每位譯員的高度重視。譯員應當恪守相關道德準則與行為規范,提升自身職業道德水平,確保翻譯行業的積極、健康、有序、和諧發展。

其次,在理論創新層面上,應當探索翻譯倫理新模式。約納斯于1979年出版的《責任原理》一書被認為是技術時代一種新倫理學的發端。因此,有必要將約納斯提出的“責任倫理”引入翻譯倫理學領域。切斯特曼提出的再現倫理、服務倫理、交際倫理、基于規范的倫理與承諾倫理5種倫理模式屬于微觀層面,關注的是譯中行為,對譯前與譯后行為則關注較少。鑒于此,我們應當提出新的翻譯倫理模式,做到“將客戶的眼前利益與人類的高遠目標結合,將職業操守的近距離責任與技術倫理的遠距離責任結合,讓約納斯的責任倫理成為新時代語境下一個新的翻譯倫理模式”(任文,2020)。

再者,相關語言類高校與應用型大學應當開設翻譯倫理相關課程,將翻譯倫理知識貫穿于教學實踐中。2021年,北京語言大學國際語言服務博士點開始招生。該博士點的設立與招生可謂高校語言服務發展和研究的重大進步。其他高校,尤其是語言類和綜合應用型大學應趁勢而上,完善翻譯倫理教育體系,設立翻譯倫理教育和研究專項基金,組織專業人員編寫翻譯倫理理論與實踐相關教材,開展對翻譯倫理課程教師的專業培訓,逐步開設翻譯倫理相關課程。同時,也應強化校企合作,建立語言服務和翻譯倫理實習基地,培養熟練掌握和運用翻譯倫理知識的高素質、復合型語言服務人才。

另外,語言服務企業應當積極開展內部人員培訓和教育。語言服務提供商應強化責任意識,樹立翻譯倫理底線思維,定期開展翻譯倫理培訓和召開相關會議,制定機器翻譯譯后編輯操作規范,建立翻譯倫理獎懲制度,規范企業服務與產品的宣傳手段、內容,進而促進語言服務行業的健康和可持續發展。

最后,個體譯員應當樹立清晰的翻譯倫理責任意識。譯者應恪守行業規范,遵守道德準則,將翻譯倫理要求貫穿整個翻譯流程。充分利用最新翻譯技術,在不違背國家與民族利益等前提下,盡量滿足客戶的合理需求。不斷更新完善翻譯倫理內涵,在翻譯倫理約束下,將翻譯技術應用到翻譯研究、翻譯教學、口筆譯實踐與語言服務行業等更廣闊的領域。

6. 結語

本文摘選“Country Reports on Terrorism 2014”等文本內容,利用阿里翻譯Alynx平臺對文本進行機器翻譯,再由人工對機器翻譯譯文進行譯后編輯。通過對比分析機器翻譯與譯后編輯譯文發現,機器翻譯譯文的確存在各類錯誤,這仍然是機器翻譯平臺與軟件的“通病”。再對上述文本中具體案例進行歸納發現,機器翻譯時常出現類似詞匯層面、句法層面及符號層面的錯誤。因此,上述各類機器翻譯錯誤應當引起機器翻譯及譯后編輯研究人員的高度重視。

此外,針對不同的機器翻譯錯誤類型,筆者總結出錯誤產生的原因,如機器一詞多義辨析能力尚待提升、機器自動分詞技術有待完善、機器學習算法技術亟待提高、語料庫、數據庫內容尚待更新與拓展。同時,基于機器翻譯及譯后編輯倫理問題,本文還理清了倫理問題的成因,即意識不強、責任不清、版權不明、規則不從和誠信不足。

依據機器翻譯錯誤成因,筆者提出:首先,研發人員應加大翻譯技術研發與應用的力度,不斷順應人工智能時代語言服務行業的發展需求;其次,譯后編輯人員可利用劉重德提出的“信、達、切”翻譯原則,對機器翻譯譯文錯誤進行修改,確保譯文通順流暢、邏輯連貫,以期滿足不同客戶群體的需求。

同時,為解決機器翻譯及譯后編輯倫理問題,筆者認為:第一,相關部門與行業協會應當出臺相應法律法規及行業規范,切實約束譯員主體及規范譯者行為,努力營造和諧共生的行業環境;第二,應當將約納斯的“責任倫理”引入翻譯倫理學領域,從而不斷豐富翻譯倫理理論和模式;第三,相關高校應當創新性地開設翻譯倫理相關課程,培養具備扎實翻譯倫理知識的新型翻譯人才;第四,語言服務提供商應適時開展企業內部翻譯倫理培訓,強化譯員翻譯倫理意識和思維,制定譯后編輯操作準則,規范宣傳手段;第五,個體譯員應樹立基本翻譯倫理責任意識,恪守道德準則,遵守行業規范,化解客戶利益關切與自身道德底線之間的矛盾,妥善處理好個人、客戶、語言服務提供商、出版商及贊助人等各方之間的關系,以實現語言服務產業的健康和可持續發展。

希望本文能為機器翻譯及譯后編輯的研發與翻譯倫理學在機器翻譯領域的應用提供學理參考,為人機交互的良性、健康發展貢獻微薄之力。

阿里翻譯Alynx平臺機器翻譯及譯后編輯:問題、成因與對策——以“Country Reports on Terrorism 2014”等文本的機譯為例①