?

全球化背景下地方外宣翻譯的平行語料庫構建研究

2024-01-19 09:01張傳鈺?劉玉澄
校園英語·月末 2023年7期
關鍵詞:外宣翻譯

張傳鈺?劉玉澄

摘 要:本文以江蘇省連云港市為例,研究平行語料庫的構建過程,主要包括資料收集和整理、語料清洗和對齊、建立平行語料庫以及語料庫的維護和更新。在資料收集和整理階段,需要確定語料庫的主題和目標語言,并收集和整理相關的文本數據。在語料清洗和對齊階段,需要進行數據清洗、預處理和對齊操作,以確保語料庫的質量和可用性。在建立平行語料庫階段,需要使用自動或人工方法進行文本對齊,并對對齊結果進行校驗和評估。在維護和更新階段,需要定期更新和維護語料庫,并對新增文本進行對齊和校驗。本文還探討了平行語料庫在機器翻譯和自然語言處理中的應用和作用,認為平行語料庫可以提高機器翻譯和自然語言處理的精度和效率,促進跨語言和跨文化交流和合作。本文研究對于平行語料庫的建設和利用具有一定的理論和實踐意義。

關鍵詞:平行語料庫;外宣翻譯;語料庫構建;語料處理

作者簡介:張傳鈺(1990.08-),男,江蘇連云港人,南京醫科大學康達學院,講師,研究生,研究方向:翻譯,翻譯學,教學法;劉玉澄(2002.01-),女,山東煙臺人,南京醫科大學康達學院英語專業本科在讀,研究方向:翻譯;翻譯技術。

地方外宣翻譯平行語料庫是促進城市對外交流、文化交流和經濟發展的重要工具。近年來,隨著中國綜合國力的進一步增強和“一帶一路”倡議的實施,外宣翻譯發生了新的變化, 呈現出新的特點。以連云港為例,連云港外宣翻譯平行語料庫可以為城市的發展提供重要的支持,包括推廣和宣傳城市資源、促進文化交流、跨語言交流和推動經濟發展等。

首先,外宣翻譯平行語料庫可以為連云港的對外交流提供重要支持。連云港是一個重要的沿海城市,擁有豐富的經濟、文化和旅游資源。通過建立外宣翻譯平行語料庫,可以將這些資源向國內外更好地推廣和宣傳。通過語料庫中的雙語數據,可以更方便地進行翻譯和傳播,從而擴大連云港的知名度和影響力,吸引更多的投資和人才進入連云港。

其次,外宣翻譯平行語料庫還可以促進文化交流和跨語言交流。業界認為,對于外宣翻譯質量問題的討論不應僅停留于對拼寫、語法等“低級錯誤”糾錯層面,而要從更為寬廣的層面探索優化外宣翻譯的途徑增強外宣效果。語言是文化交流的重要媒介,通過翻譯平行語料庫,可以更方便地將連云港的文化資源進行傳播,吸引更多的外國友人了解和體驗連云港文化。同時,通過與外國文化進行交流,可以促進連云港的文化創新和發展,打造更具特色的城市文化。

最后,外宣翻譯平行語料庫還可以為連云港的經濟發展提供支持。在全球化的背景下,跨國經濟交流和合作越來越頻繁,而語言交流是其中不可或缺的環節。通過建立外宣翻譯平行語料庫,可以更方便地進行商務翻譯和跨語言交流,促進連云港與外國企業的合作和交流,推動連云港的經濟發展。

一、平行語料庫構建——資料收集和整理

語料庫, 從字面上看, 就是語言的倉庫, 專業的定義是“為語言研究和應用而收集的, 在計算機中存儲的語言材料, 由自然出現的書面語或口語樣本匯集而成, 用來代表特定的語言或語言變體?!钡胤酵庑g平行語料庫是指由地方政府或機構發布的外宣資料,通過翻譯變成了其他語言版本,這些語料可以用于機器翻譯等領域的研究。構建這樣的平行語料庫需要以下幾個步驟:

第一步是收集和整理資料。需要找到地方政府或機構發布的宣傳資料,如新聞稿、政策文件、宣傳視頻等。然后將這些資料翻譯成需要的語言,例如英語、法語等。最好能夠保持翻譯的一致性和準確性,可以請專業人士或專業翻譯人員進行翻譯。

地方外宣翻譯平行語料庫的資料收集和整理是構建平行語料庫的第一步。這一步驟的關鍵是找到適合的宣傳資料和合適的翻譯人員。

首先,需要確定需要收集的宣傳資料類型。一般來說,地方政府或機構發布的宣傳資料包括新聞稿、政策文件、宣傳視頻等。為了收集到全面、準確的資料,可以定期瀏覽地方政府或機構的官方網站,關注官方媒體發布的宣傳信息,或者通過社交媒體等渠道獲取信息。以下列舉了連云港市的部分官方外宣渠道及對外交流交往資源:

連云港港口:連云港港口是中國東海岸最重要的港口之一,是中國“21世紀海上絲綢之路”的重要樞紐港口,擁有良好的航運網絡和港口設施,是中國對外貿易的重要通道之一。

連云港市人民政府外事與僑務辦公室:該辦公室是連云港市政府機構,負責處理涉外事務和僑務工作,為外籍人士和華僑提供服務和支持。

連云港市文化廣電旅游局:連云港市文化廣電旅游局是連云港市政府機構,負責推廣連云港的旅游資源和文化,吸引國內外游客前來旅游觀光,為城市的對外交流交往提供渠道和平臺。

其次,需要確定翻譯人員的選擇標準。翻譯人員需要具備一定的語言能力和專業背景,能夠準確理解原文并將其翻譯成目標語言。為了保證翻譯質量,最好選擇有翻譯經驗、能夠熟練使用翻譯工具和技術的專業翻譯人員進行翻譯。

在資料收集和整理的過程中,還需要注意以下幾點:

保持原文的一致性和準確性。對于原文中的錯別字、語法錯誤、不準確的用詞等進行修改和補充,確保原文質量。

翻譯人員需要準確理解原文的意思,并根據目標語言的語言特點和習慣進行翻譯。同時,還需要注意翻譯的一致性和準確性,避免出現歧義和錯誤。

對于部分專業性很強的宣傳資料,可以邀請相關領域的專業人士或者翻譯公司進行翻譯,以確保翻譯的準確性和專業性。

資料收集和整理是構建地方外宣翻譯平行語料庫的關鍵步驟。需要通過科學、規范的方式來收集和整理宣傳資料,并選擇合適的翻譯人員進行翻譯,以保證平行語料庫的質量和可用性。

二、平行語料庫構建——語料清洗和對齊

第二步是清洗和對齊語料。對于翻譯資料中的重復部分、錯誤信息、無關內容等進行清理,保證語料的質量和準確性。然后需要對原文和翻譯文本進行對齊,即將原文和翻譯文本一一對應,這一步可以借助一些工具來輔助完成。

地方外宣翻譯平行語料庫的語料清洗和對齊是構建平行語料庫的重要步驟。語料清洗是指在語料庫中剔除掉無效的數據,而語料對齊則是將源語言和目標語言的句子進行一一對應。

語料清洗的過程中,需要注意以下幾點:

剔除無效數據。例如,一些翻譯錯誤、缺失信息、格式不規范的數據可以進行剔除。

統一格式。將語料庫中的數據的格式統一化,方便后續的處理和使用。

進行去重。由于宣傳資料的發布可能會重復,導致語料庫中存在相同的數據,因此需要進行去重處理。

在進行語料對齊的過程中,需要注意以下幾點:

1.對齊的精度。需要確保對齊的精度盡可能高,避免出現誤差。語料對齊是指將兩個或多個文本之間的相應部分進行匹配和對齊。它是許多自然語言處理任務的基礎,例如機器翻譯、文本對齊和文本比較。提高語料對齊的精度可以提高這些任務的完成質量和效率。下面是幾個提高語料對齊精度的方法:①使用更好的算法。語料對齊可以使用不同的算法,例如基于字符串匹配的算法、基于短語匹配的算法和基于神經網絡的算法。不同算法的優缺點不同,選擇適合數據的算法可以提高語料對齊的精度。②清洗數據。清洗數據可以去除文本中的噪聲和錯誤,例如拼寫錯誤和語法錯誤。這可以使文本更加規范,從而提高語料對齊的精度。③使用更多的訓練數據。語料對齊的精度通常隨著訓練數據的增加而提高。使用更多的訓練數據可以提高模型的泛化能力,從而提高語料對齊的精度。④使用詞級別的對齊。在語料對齊時,可以使用詞級別的對齊來更準確地匹配文本。詞級別的對齊可以考慮到單詞的含義和上下文,從而提高語料對齊的精度。⑤人工校對。在對齊的過程中,可以進行人工校對以糾正錯誤。人工校對可以提高對齊的準確性,但需要耗費大量的時間和人力資源。

2.處理語言差異。由于中英文語言存在差異,例如語序、句式等方面,可能會導致翻譯不準確或不完整,需要進行適當的處理。在處理跨語言語料庫時,語言差異是一個常見的問題。為了正確地處理跨語言數據,需要考慮以下幾個方面:①語言學差異。不同的語言在語法結構、詞匯、語義和文化背景等方面可能存在差異。了解和理解這些差異是處理跨語言數據的重要前提。②翻譯。對于跨語言數據,可能需要進行翻譯。這可以通過機器翻譯模型或人工翻譯來完成。但是需要注意的是,翻譯可能會引起誤譯,尤其是在涉及多義詞、語言的隱含含義、文化背景等方面的時候。③對齊。語言差異可能導致跨語言數據中的文本不對齊。對齊是指將兩個或多個文本之間的相應部分進行匹配。它是許多自然語言處理任務的基礎。對齊可以通過使用基于字符串匹配、基于短語匹配或基于神經網絡的算法來完成。④數據清理。在處理跨語言數據時,需要清理數據以去除不必要的信息和錯誤。這可以通過自動或手動方法來完成。⑤語言模型的訓練。處理跨語言數據的語言模型需要進行跨語言訓練。這可以通過使用跨語言的預訓練模型或從頭開始訓練一個跨語言模型來完成。

3.使用專業工具??梢允褂脤I的語料對齊工具,例如Trados、MemoQ等,來提高對齊的精度和效率。

三、平行語料庫構建——建立平行語料庫

第三步是建立平行語料庫。將清洗和對齊的語料按照一定的格式和標準組織起來,建立平行語料庫。語料庫應該包括原文、翻譯文本和元數據等信息,如文本來源、發布時間、翻譯人員等。平行語料庫的格式和標準需要根據具體的應用場景進行調整。

地方外宣翻譯平行語料庫的格式和標準是平行語料庫的重要組成部分,它們決定了平行語料庫的結構和使用方式。下面,筆者將從以下幾個方面進行闡述。

格式:地方外宣翻譯平行語料庫可以采用多種格式,例如TMX、XLIFF、PO等格式。其中,TMX是一種行業標準的平行語料庫格式,支持多種語言和工具之間的互操作性,因此較為常用。而XLIFF和PO等格式則適用于特定的翻譯軟件和場景。

標準:為了確保平行語料庫的質量和可用性,需要遵循一定的標準。例如,對于平行語料庫的命名和存儲路徑應該進行規范,以便于管理和維護。同時,平行語料庫中的元數據、句子對齊等信息也需要進行規范化處理,以便于后續的信息處理和利用。

元數據:平行語料庫中的元數據包括源語言、目標語言、創建時間、更新時間、創建者、描述信息等,可以通過這些元數據對平行語料庫進行檢索、分類和管理。

句子對齊:平行語料庫的句子對齊是平行語料庫的核心內容之一。需要進行精確的句子對齊,以確保源語言和目標語言的句子一一對應,沒有遺漏或重復。

地方外宣翻譯平行語料庫的格式和標準對于平行語料庫的構建、管理和使用都具有重要的作用,需要根據實際需求和情況進行選擇和制定,以保證平行語料庫的質量和可用性。

四、平行語料庫構建——維護和更新

最后一步是語料庫的維護和更新。平行語料庫需要進行定期的維護和更新,包括對新發布的宣傳資料進行翻譯和對齊,對已有語料進行清理和更新等,以保證語料庫的構建質量和可用性。

地方外宣翻譯平行語料庫的維護和更新是確保平行語料庫長期可用和保持高質量的重要步驟。以下將從幾個方面進行闡述。

監測和修復錯誤:在平行語料庫的使用過程中,可能會出現一些錯誤,例如句子對齊錯誤、譯文錯誤等。因此,需要對平行語料庫進行監測和修復,以保證平行語料庫的準確性和可用性。

添加新的數據:隨著時間的推移,地方外宣翻譯平行語料庫需要不斷地更新和添加新的數據,以滿足新的翻譯需求和語言變化。因此,需要建立定期添加新數據的機制,以確保平行語料庫的時效性和覆蓋范圍。

統計和分析:平行語料庫的統計和分析可以幫助用戶了解平行語料庫的內容和特點,以便于更好地利用平行語料庫進行翻譯和研究。因此,需要對平行語料庫進行統計和分析,并提供相應的工具和接口,以便于用戶進行數據挖掘和分析。

標準和規范的更新:隨著翻譯和語言技術的不斷發展,平行語料庫的標準和規范也需要不斷更新和完善。因此,需要建立標準和規范的更新機制,以確保平行語料庫的格式和標準與最新的技術和需求保持一致。

雖然地方外宣翻譯平行語料庫的構建包含多個步驟,需要耗費大量的時間和精力。但是,建立這樣的平行語料庫可以為機器翻譯等領域的研究提供有價值的資源。

參考文獻:

[1]黃友義.中國站到了國際舞臺中央,我們如何翻譯[J].中國翻譯,2015(5):5-7.

[2]胡興文,張健.外宣翻譯的名與實:張健教授訪談錄[J].中國外語,2013(3):100-104.

[3]王杭.茶文化外宣翻譯中的語料庫技術應用[J].福建茶葉,2018(2):449.

基金項目:本文系2022年度 “江蘇省社科應用研究精品工程”外語類課題立項項目:《“一帶一路”背景下的地方外宣翻譯的平行語料庫構建研究——以連云港為例》(立項號:22SWC-33)、2022年度 “江蘇省社科應用研究精品工程”外語類課題立項項目(立項號:22SWC-33)、2022年度江蘇省社科應用研究課題成果。

猜你喜歡
外宣翻譯
生態翻譯視閾下非物質文化遺產外宣翻譯
國際傳播視閾下的外宣翻譯特點探析
淺析高校簡介英譯中“認同”的建構
江西省高校門戶網站外宣翻譯現狀研究
英語實用翻譯研究
順應論視閾下的中國政府網外宣翻譯研究
外宣翻譯中中國特色詞匯的翻譯
跨文化意識下河北省非物質文化遺產外宣翻譯的研究
漢英外宣翻譯中的本土化順應策略
外宣翻譯“三貼近原則”指導下的河南省旅游翻譯研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合