?

大數據百科條目多語種翻譯的工作理念和方法

2023-09-26 00:37杜家利于屏方黃建華牛子牧
中國科技術語 2023年4期
關鍵詞:多語種百科詞條

杜家利 于屏方 黃建華 楊 可 吳 凡 牛子牧

(1. 廣東外語外貿大學外國語言學及應用語言學研究中心,廣東廣州 510420;2. 廣東外語外貿大學中國語言文化學院廣東廣州 510420;3.廣東外語外貿大學西方語言文化學院,廣東廣州 510420;4. 廣東外語外貿大學亞非語言文化學院,廣東廣州 510420)

0 引言

與時俱進地推動科技名詞規范化工作具有重要意義[1]。大數據發展的特殊性決定了其研究的高標準性。全國科學技術名詞審定委員會(以下簡稱“名詞委”)作為代表國家審定和公布科技名詞的權威性機構,與北京國際城市發展研究院合作,及時審定公布了國內權威的大數據百科條目,并制定了相關的大數據研究標準。大數據百科條目框架包括大數據理論、大數據戰略、大數據技術、數字經濟、數字金融、數據治理、大數據安全、數權法、大數據史九個部分。

大數據研究具有促進科技發展的重要性。作為術語研究的新興領域,大數據研究是在蒸汽技術革命、電力技術革命和計算機信息技術革命之后的第四次革命。新興的大數據百科條目往往承載著特定領域的專業概念,并具有高度濃縮的膠囊化特點。作為全球第二大經濟體的中國,大數據條目的中國元素也得到越來越廣泛的關注。大數據領域的深入研究可進一步完善我國相關領域的學科知識體系建設,更好地實現大數據技術在各領域的應用。因其具有新興科技領域的前沿性和前瞻性,可為我國在科技應用方面趕超或保持國際前沿奠定基礎。

人工智能方面,得語言者得天下[2]。大數據研究的目標在于推動人工智能發展,并在國際化進程中爭奪我國在大數據領域的國際話語權。名詞委積極推動大數據百科條目的多語化進程,并在“十三五”階段實現了大數據百科條目的英語翻譯、法語翻譯、俄語翻譯、西班牙語翻譯和阿拉伯語翻譯,相關研究已經納入“術語在線”知識庫體系中。我們團隊受名詞委的委托,完成了大數據百科條目聯合國工作語言的翻譯實踐,形成了較為有效的多語種翻譯工作理念和研究方法。本研究將分析這些工作理念和方法的得失,增強其在指導實踐方面的價值。

1 百科條目研究現狀

大數據百科條目多語種翻譯是跨學科研究,屬于術語和翻譯相交叉的范疇。百科條目的詞條審定、釋義、示例等均具有明顯的術語學特點。從漢語條目到英語、法語、俄語、西班牙語和阿拉伯語的平行翻譯則屬于翻譯學范疇。我們的研究主要關注的是大數據百科條目的多語種翻譯。

大數據百科條目分類是在條目分類目錄下采用簡注方式展開的。專業百科全書設置條目分類目錄,是編纂者導引讀者打開百科全書知識寶庫的鎖鑰[3]。大數據發展的新興特點決定了很多條目雖未發展到術語命名的嚴格程度,但與普通名詞有顯著區別。

百科條目通常分為自然科學條目(習稱科技條目)和社會科學條目(習稱哲社條目)兩部分[4]。名詞委審定的大數據百科條目涉及這兩部分內容。自然科學條目和社會科學條目在同一框架中出現,是一個事物的兩個方面,而不是對立的。就像語文詞典可能收錄一些百科條目或百科詞典可能收錄一些語詞條目一樣[5]。在立目方面,名詞委根據大數據復雜詞匯單位的自身特點采取了適當的立目策略,將詞目與釋文的左右項關系較好地融合在一起[6-7]。更為重要的是,名詞委在大數據百科條目審定中既關注了國際性,又融入了民族性,將大數據中國元素納入大數據百科條目分類框架,較好地平衡了大數據百科條目的國際性和民族性,為研究者提供了研究大數據條目的社會和歷史線索[8-11]。

新興領域的百科條目需要給予關注。大數據等新興領域的百科條目對國內知識文化將產生強烈沖擊[12]。這些新興百科知識提升了讀者的認知,推動了語言發展的增詞和增義[13],提高了新興領域百科條目在詞典中的收詞概率,進而推動詞典編纂與時俱進[14]。新增大數據百科條目體現了術語審定和辭書編撰的前沿性,在百科條目研究中占據前沿地位。

我們對中國知網(CNKI)中的“百科條目”主題進行了綜述性回顧。在系統提供的265條檢索項中,“百科條目”的討論主要分為兩大類:定量類和定性類。

定量類集中在信息工程領域,從量化視角對百科條目的收詞、評價、描述、聚類等給予關注。例如,季一木等[15]基于百度百科數據驗證了多決策模型的質量評價方法,為百科詞條的可行性、合理性和有效性進行了質量評價,取得了較好的效果。李明澤等[16]在“線索利用理論”框架下驗證了詞條內容質量和詞條描述質量均可正向影響詞條感知質量的判斷;用戶對百科詞條的知識熟悉度比較高的時候,詞條內容質量將顯著影響詞條感知質量。溫田田[17]從網絡百科詞條編輯沖突角度入手,分析了百科詞條編纂者的價值期望,討論了主觀傾向對合作動機的影響。黃令賀等[18]對百科詞條質量評價進行了信息分析。于娟和曹曉[19]驗證了本體概念聚類方法,進一步探討了百科詞條的領域概念之間的語義關系。尹坤等[20]利用SimRank算法計算了百科詞條的語義相似度,并借此準確地反映詞語之間的語義關系。

定性類集中在詞典編纂、圖書出版、百科收詞、條目審查等領域。例如,中國百科條目“老子”在維基百科全書的協同編纂中實現了跨文化的域外傳播和視域融合[21]?!队h大詞典》(第2版)的百科條目從微觀結構、語義與概念的關聯、宏觀結構三個層面實現了增補修訂[22]。在詞條編撰的著作權認定方面,網絡百科詞條在編纂模式、獨創性判定、著作權歸屬及侵權規則方面呈現了不同于傳統模式的特點,其中,作者認為獨創性編輯者而非平臺擁有著作權[23],平臺對百科詞條要履行“中等程度”的審查義務[24]。

我們對1980年以來國內“百科條目”的265篇論文進行了可視化分析,包括發表年度統計、主題分布、學科分布、文獻來源、作者分布、作者機構分布、關鍵詞聚類等(如圖1和圖2)。

圖1 CNKI中“百科條目”主題的發文量趨勢

圖2 CNKI中“百科條目”下的發文主題分布

從圖1可以看出,“百科條目”的研究趨勢具有兩個增長期。在改革開放初期的20世紀80年代初,經濟發展需要百科知識的支撐,百科研究出現了第一次高潮。隨著我國經濟的快速發展,2010年我國超過日本成為全球第二大經濟體,這個時期百科研究出現了第二次熱潮。經濟發展與百科研究具有一定的關聯性,其主要原因在于很多科技領域涉及百科知識??萍及l展需要全領域知識的支撐,并最終推動經濟前行。

從圖2可以看出,“百科條目”的研究主題集中在維基百科、百科全書、海洋測繪、中國大百科全書、中文維基百科等方面。主題的集中性體現出國內研究者關注的焦點。研究的廣度和深度在各主題中都得到了很好的展現。

從圖3、圖4可以看出,“百科條目”研究涉及學科較為廣泛,排在前列的是計算機軟件及計算機應用、出版、中國語言文字、圖書情報與數字圖書館、新聞與傳播、自然地理學和測繪學等?!掇o書研究》是發表百科條目相關研究最多的刊物。很多計算機領域的學者充分利用自己的學科所長,對百科條目的自動提取、質量評估、文本聚類等進行了深度研究。出版業在“百科條目”方面的研究集中在大百科全書的編纂方面,推動了我國大百科全書的發展。中國語言文字領域的研究則從本體角度對百科條目的收詞、釋義、示例等進行了討論。華中師范大學、西南交通大學的學位論文中,百科條目的研究占有較高比例。

圖3 CNKI中“百科條目”研究的學科分布

圖4 CNKI中“百科條目”研究的文獻來源

在圖5中,排在前面的作者分別是甘蒞豪(華東師范大學)、賈真(西南交通大學)、付巧(陜西師范大學)、尹紅風(西南交通大學)、楊宇飛(西南交通大學)、關泠(解放軍軍事科學院)和王錦(東北大學)。其中,西南交通大學的三位作者在“百科條目”主題研究中具有高顯示度。從圖6可以看出,排在前六位的研究機構是中國大百科全書出版社、武漢大學、西南交通大學、華中師范大學、華東師范大學、蘇州大學。中國大百科全書出版社的學者發文量占到總發文量的15.74%。

圖5 CNKI“百科條目”研究的作者分布

圖6 CNKI中“百科條目”研究的機構分布

使用CiteSpace進行關鍵詞聚類研究(結果如下圖7),可見與“百科條目”關聯度最大的是維基百科,其后是百科全書、百度百科、條目、網絡百科、眾源方式、知識傳播、知識庫、檢索系統、知識獲取、關系抽取、協同編輯、數字社區等。

圖7 “百科條目”CNKI研究的CiteSpace關鍵詞聚類

從以上對中國知網265篇論文的封閉域研究可以發現:(1)“百科條目”是文理兼容的研究領域,體現了定量和定性的特點。定量研究集中在對“百科條目”的計算機處理和統計分析等方面,定性研究則更多關注命名實體、知識獲取、概念特征分析等方面。(2)在條目翻譯研究方面,發表了4篇文章,分別討論了外國文學條目的翻譯[25]、埃博拉病毒條目的漢譯[26]、機械條目的中日翻譯與傳播[27]、百科全書條目的翻譯策略[28]。大數據百科條目多語種外譯的研究鮮有學者涉及。(3)在整個“百科條目”研究封閉域中,尚沒有對大數據相關條目的研究。

2 大數據百科條目多語種翻譯的工作理念和方法

在大數據百科條目的多語種翻譯中,漢語是源語,以其為放射原點的特性決定了漢語的錨定屬性;英語是漢語之外與其他語種關聯最為緊密的語種,顯著的國際性特征和語系特征也決定了英語的錨定屬性。

2.1 百科條目的范疇化

條目分類處理可提高多語種翻譯的效率。多語種團隊需要全面了解漢語詞條釋義,并參照條目分類進行各語種的預處理。漢語分析和英語翻譯,對其他語種翻譯有指導性作用。大數據百科條目具有詞源的差異性,不同類別的條目應采用不同的翻譯模式。我們將條目分為3類,并通過特殊字符標識進行區分,以便在6個語種的平行翻譯中達到最大限度的對應。在實踐中,這種大數據百科條目的范疇化為多語種翻譯提供了便利。

2.1.1 一級標記

一級標記“*”為專有名詞符號。大數據百科條目中的專有名詞在多語種翻譯時需保持原譯,不進行修改。這種星號標記的目的是在多語種平行翻譯時保持體例的一致性。例如,區塊鏈(block chain,chane de bloc,цепочка блоков,Cadena de bloques,)。又如,大數據百科條目中的書名,在多語種翻譯中就屬于一級標記,其他語種平行翻譯時需要找到對等的書名,如《零邊際成本社會》在英語中的書名是TheZeroMarginalCostSociety,而在俄語中書名是Обществе с нулевыми предельными издержками。其他語種在各自語言中找尋對應的書名,如果有約定俗成的翻譯則直接借來使用,如果沒有實現各語種的本土化翻譯,則需要進行對應翻譯,如法語Société à cot marginal zéro,西班牙語La sociedad de coste marginal cero,阿拉伯語()。除了常規的專名和書名可認定為本系統的專有名詞外,為保證多語種翻譯的一致性,以下兩種情況也認定為專有名詞:

2.1.2 二級標記

二級標記“#”為有限翻譯符號。在大數據百科條目中,如果條目構件是組合形式的,一部分是確定的翻譯構件,而另一部分是不確定的構件,為保證翻譯的準確性,把此類條目進行“#”二級標記標注,目的是將我們的譯文向人們更為熟悉和可接受的譯文靠攏。

例如,“天使匯”是確定的專有名詞,而“運作模式”是相對而言不確定的構件,這樣就形成了二級標記符號條目。

2.1.3 三級標記

從以上大數據百科條目范疇化可以看出,一級條目是專有名詞,翻譯模式是約定俗成的;二級條目是有限的約定俗成,翻譯模式通常采用組合模式;三級條目是一級和二級之外的自主翻譯條目,需要綜合考慮頻率、語域、語體等指標。

2.2 百科條目多語翻譯的系統性

大數據百科條目多語種翻譯是系統性的翻譯實踐。在漢語條目外譯到英語、法語、俄語、西班牙語、阿拉伯語的過程中,我們總結了“以錨為準、軸為兩翼;規范為主、兼顧描寫”的系統性翻譯工作理念,采用了獨特的多語種翻譯方法。

2.2.1 以錨為準

翻譯錨的選定至關重要。術語的溯源錨應該是一個恒定的知識庫。由于大數據百科條目多具有不同于普通詞匯的知識集約性,而漢語術語這種濃縮的膠囊化特征在多語種翻譯時必須進行顯性化,因此,能否找到一個能將術語的集約性轉變成外顯性且具有權威穩定釋義的知識庫是成功翻譯的關鍵。這個知識庫應具有權威性、百科性、詳釋性、單一性、國際性、便利性等特征。

(1)權威性: 知識庫要具有能使人信服的權威性地位,讓受眾對術語的溯源結果不產生懷疑,而且知識庫內收錄詞條的準確性要符合國家標準。

(2)百科性:知識庫要涵括術語翻譯過程中所需的天文地理、自然人文、宗教信仰等學科知識,以便給譯者提供充足的釋義和名詞溯源信息,為準確有效的翻譯提供知識保障。

(3)詳釋性:知識庫應對所收錄的詞條分類闡釋,分類項包括中文名、英文名、術語起源、術語命名、術語歷史、術語特征等模塊。而且知識庫提供的術語條目要達到一定的規模。也就是說,知識庫要實現質和量的雙合。

(4)單一性:知識庫中對術語有明確的指稱,不存在歧義且有清晰的區分度。單一術語對應多個指稱的情況較少出現。這種單一性為術語的有效傳播提供了可能。

(5)國際性:知識庫中的術語最好能提供多語種翻譯,如果無法實現多語種,至少要有英語對應詞,跨語種模塊的存在體現了知識庫的國際性。

(6)便利性:知識庫最好具有網絡檢索的便利性和可復制性,這樣可以加快研究的速度和驗證審校的效率。

“術語在線”可作為知識庫的錨?!靶g語在線”是全國科學技術名詞審定委員會的術語查詢平臺,涵括了大量的規范名詞、名詞對照、工具書資源等?!翱倲祿拷偃f條,術語在線已成為全球中文術語資源最全、數據質量最高、功能系統性最強的一站式知識服務平臺?!雹佟靶g語在線”的學科覆蓋也很廣泛,自然科學、人文社會科學、工程技術、醫學、生命科學、軍事等學科術語均有涉及。從權威性來說,“術語在線”是規范術語的“數據中心”,具有絕對的權威性。從國際性來說,“術語在線”實現了盡可能多的中英文對譯,具有很好的國際性。從便利性來說,“術語在線”查詢方便,更新速度快,具有熱詞榜、術語標注、新詞征集、微信小程序等網絡模塊,豐富了查詢內容,提高了查詢速度。同時,該平臺審定的詞條數量在不斷增加。所以,“術語在線”是我們確定的最重要的錨。

百科類網站可作為錨的補充。除了“術語在線”知識庫之外,百度百科、搜狗百科、互動百科、好搜百科、MBA智庫百科、百科在線等網絡百科可作為翻譯錨的補充。例如,從權威性來說,百度百科與中國科協、最高人民法院,全國知名博物館、書法家協會、衛計委、藝術院校、學術期刊、全國所有本科和??圃盒5冗M行合作,具有較好的權威性。從百科性來說,百度百科是百度公司推出的一部內容開放、自由的網絡百科全書,涵括了知識檢索的各個領域。從詳釋性來說,百度百科收詞量達到1700萬條,每個詞條均提供了詳細的釋義模塊,具有較好的釋義特征。從單一性來說,百度百科提供的英語翻譯多數情況下符合單義特征,鮮有多義情況出現。從國際性來說,2007年4月19日,百度百科詞條頁面改版,在詞條頁面的底部增加了漢英詞典解釋,為百科詞條的國際性傳播鋪平了道路。從便利性來說,百度百科依托百度搜索引擎,具有網絡檢索的便利性。所以,百度百科適合作為“術語在線”翻譯錨的補充。

以上分析可以看出,國務院授權、代表國家審定和公布科技名詞的權威性機構推出的“術語在線”適合作為大數據百科條目多語種翻譯的錨,百度百科等百科類網站可對其進行補充。

2.2.2 軸為兩翼

大數據百科條目的多語種翻譯需要確定漢語為第一標準軸。我們的研究是漢外翻譯,即將漢語內容對應翻譯為英語、法語、俄語、西班牙語和阿拉伯語。原始的大數據名詞也是通過漢語的形式提供的。這就要求譯者對漢語的語言體系和特征有較為深入的了解,同時對漢語的文字系統和語義具有較為敏銳的分析能力。譯者必須在漢語使用方面沒有障礙,對漢語的理解保持順暢性。因此,邀請的外國專家都是在國內專家的引領下進行多語種翻譯的,國內專家要保持與外國專家的有效溝通,這樣翻譯出來的名詞才能更好地實現“信達雅”的初衷。

例如,“脫貧攻堅”是漢語獨有的詞條,也只有母語是漢語的專家才能明白這個詞的意義。在對“《脫貧攻堅大數據平臺建設實施方案》(廣西)”的翻譯過程中,每個語種團隊都需要對詞條進行切分,形成翻譯模塊,即形成“脫貧攻堅”“大數據”“平臺建設”“實施方案”等關鍵詞?!懊撠毠浴庇忻鞔_的英語翻譯。在《中國日報》(ChinaDaily)中“脫貧攻堅”作為一個統一的語義模塊,翻譯為“poverty alleviation”,準確表達了“脫貧攻堅”的漢語語義,所以,我們在后續的術語翻譯中以此為準。

從圖8可以看出,“脫貧攻堅”在2016年之前搜索量接近零,從2016年5月某個時點開始不斷攀升,目前達到了搜索指數的高位。說明該名詞的使用不斷得到群體認可。因此,處理此類名詞時,要找到具有規范表達的權威機構的翻譯用法(采用的是ChinaDaily的權威翻譯),避免出現杜撰和強譯。

圖8 “脫貧攻堅”的百度搜索指數

“《脫貧攻堅大數據平臺建設實施方案》(廣西)”的名詞翻譯還需要處理好其他模塊的翻譯?!按髷祿脚_建設”多采用名詞“construction of big data platform”,“實施方案”譯為“implementation program”。經過漢語語義分析,可知核心成分“實施方案”需要在英譯時提前到詞首,后續的關鍵詞需要通過不同的介詞進行引領。這樣,“《脫貧攻堅大數據平臺建設實施方案》(廣西)”可英譯為“ImplementationProgramforConstructionofBigDataPlatformforPovertyAlleviation(Guangxi) ”,其他語種對應性翻譯為:

法語:Programmed’implémentationpourlaconstructiond’uneplate-formedeBigDatavisantà éradiquerlapauvreté (Guangxi)。

西班牙語:Programa de Implementación para la Construcción de la Plataforma de Macrodatos para el Alivio de la Pobreza (Guangxi)。

在漢語作為第一標準軸外,多語種翻譯標準軸的另一翼為英語。作為聯合國工作語言之一,英語在國際交流中充當了非常重要的角色。英語不僅與歐洲的法語、西班牙語具有語系親緣關系,而且與俄語和阿拉伯語有著較為密切的語言接觸。這種全景式的語言特點,決定了英語可以作為漢語之外的第二標準軸。這樣,在法語、俄語、西班牙語、阿拉伯語翻譯時,需要同時參照漢語和英語這兩個軸,為多語種翻譯提供更為準確的參照系。尤其對源自英語且譯入中國的大數據名詞,再次譯出時,需要搜尋原來的英語表達并搜尋英語對應的其他語種表達,以求得多語種之間的翻譯對應性,減少語際偏差。

為了提高英語翻譯的準確度,我們在英語翻譯中引入回譯制度,并通過國內外成熟的翻譯軟件進行重復驗證,提高術語翻譯的可重復性,減少不同譯者對詞條翻譯的負影響。鑒于存在漢英兩個標準軸,我們選擇國內外各兩個翻譯軟件,以平衡兩個軸的翻譯結果。國外選定的翻譯軟件為Google翻譯(https://translate.google.cn)和DeepL翻譯(https://www.deepl.com/translator),國內選定的翻譯軟件為百度翻譯(https://fanyi.baidu.com/translate)及有道翻譯(http://fanyi.youdao.com)。如此,具有英語知識庫背景的國外翻譯軟件與具有漢語知識庫背景的國內翻譯軟件相互結合,形成較為堅實有效的漢英翻譯標準軸回譯體系,為高質量翻譯術語奠定了基礎。漢語和英語作為標準軸的兩翼,為法語、俄語、西班牙語、阿拉伯語的順利翻譯提供了漢英雙語的結構性和系統性,為其他語種提供借鑒功能和預處理功能,最大程度地減少了術語的內生歧義,并將語際誤差率控制在較小范圍。

2.2.3 規范為主

術語的規范是科學技術發展所要遵循的基本要求。在科學研究過程中,術語的產生過程是隨科學工作者的認知不斷提升而不斷完善的動態過程,這個過程是符合科學發展觀的。術語規范是學術規范的重要一環,對形成和完善良好的學術氛圍具有重要意義。

加強規范,既要貫徹國家相關語言文字規范,也要遵從國家的科技術語規范[29]。術語應用的時代特征為我國術語規范化工作帶來更多挑戰,術語翻譯規范化的重要性愈加凸顯。條目的設定,既要使讀者能正確理解,還要使讀者能正確地運用,這是規范性詞典的兩項重要任務,缺一不可[30-31]。

大數據領域的名詞需要進行規范化研究。雖然該領域的術語多為新興詞匯,但其數量增長卻是爆發性的。不同的譯者從不同角度對大數據名詞表達了不同的觀點,這就形成了對同一事物的不同翻譯模式。這對術語的發展是不利的,容易產生語內歧義和語際偏差,也不利于科技健康發展和相關術語的知識普及。所以,在漢外翻譯大數據百科條目時,也需要進行規范性研究。

例如,我們在系統中對“大綱/綱要”的翻譯就進行了規范。從圖9可以看出,“大綱”和“綱要”的搜索量比較接近,“大綱”略高于“綱要”,但尚未達到區別特征的程度,這說明兩個名詞是同義詞。在翻譯處理時,我們既要關注兩個名詞的同義特征,也要在譯詞的選擇上保持一定的區分度。

圖9 “綱要”和“大綱”近10年的百度搜索指數趨勢

英語翻譯時需要盡量區分“大綱”和“綱要”。通過廣泛的網絡查詢以及翻譯軟件的對比分析,我們發現“大綱”和“綱要”的主流翻譯都是“outline”。這個結果與百度搜索指數提供的搜索量比較接近的描述是一致的。為區別這兩者,我們把單復數形式作為區別性特征,即“綱要”多側重不可數狀態,譯為“outline”單數模式;“大綱”多強調可數狀態,采用“outlines”的復數模式。這樣,我們就可以在保留兩者同義關系的基礎上,通過單復數形態變化對它們進行區分。

“大綱”和“綱要”的翻譯體現了“如無必要,勿增實體”的翻譯原則。根據前面的分析,“《個人數據保護基本法制大綱》”翻譯為“OutlinesofBasicLegalSystemforPersonalDataProtection”?!啊洞龠M大數據發展行動綱要》”翻譯為“*ActionOutlineonPromotingtheDevelopmentofBigData”。前面的條目沒有約定俗成,所以確定為三級標記,后一個條目是由相關部門提供的確切英語翻譯,所以確定為一級標記。這樣,通過采用單復數形式區分“大綱”(outlines)和“綱要”(outline),我們在系統內對同義關鍵詞進行了規范性研究。各語種的語義顆粒度不同,可通過具體分析漢英兩種語言的表述來確定自己的翻譯模式。形成的多語種對應性翻譯如下:

從以上分析可以看出,規范性研究是術語研究的主流,這種區別性的排他研究確保了術語語義傳遞的非歧義性。

2.2.4 兼顧描寫

大數據名詞的漢外翻譯是術語的跨語言再次命名,具有明顯的語言特征,這一特點也決定了在研究方法上,將無可避免地出現語言的描寫特性。

科學的研究方法可以產生科學的研究結果。研究方法的應用水平和綜合程度會產生不同的研究效果和效能。從某種程度上說,術語理論的研究很多是依托研究方法展開,堅實有效的研究方法會推進術語學的發展。因此,在對大數據百科條目進行漢外翻譯時,需要在關注“規范為主”的研究方法同時,也關注“兼顧描寫”的語言特征,使我們對大數據術語的描述更加清晰,翻譯更加準確,邏輯分析更加嚴密,最終讓術語研究的內容更廣泛,研究視角更新穎,研究思想更有深度。

術語翻譯的描寫特性通常是對約定俗成的語言特例的尊重。這種描寫性研究方法是對現有語言現象的描述和敘述,具有從語言特例中解釋語言共時和歷時變化的特點,能更好地為語言系統服務。

綜上分析可以看出,研究方法的創新與否及創新綜合程度高低,都會影響研究的效果、效率和效能。我們提出的“以錨為準、軸為兩翼;規范為主、兼顧描寫”的翻譯理念和方法,是大數據百科條目漢外翻譯的一種創新。這種方法既關注了釋義錨的選定,也關注了標準軸的規劃;既強調了術語規范的重要性,也強調了規范之外描寫特性的合理性。從對“以錨為準、軸為兩翼;規范為主、兼顧描寫”研究方法的分析可知:術語研究是兼跨自然科學和人文科學的研究;充分釋義是準確翻譯的前提;漢英雙軸對應可避免語際偏差。在術語單義性的主流規范模式之下,我們也難以避免語言描寫特性的存在。期待這種研究方法能夠推動大數據領域的發展,為科技進步和學術規范做出貢獻。

3 不足和展望

翻譯錨、大數據百科條目、多語種翻譯均存在提升的空間。(1)“術語在線”(及補充信息的百度百科等)作為我們多語種翻譯的錨具有溯源清晰、知識豐富、英語自附等特點,很好地實現了翻譯錨所需的權威性、百科性、詳釋性、單一性、國際性和便利性。但是,翻譯錨隨著新知識的涌入還有提升的空間。(2)在大數據百科條目的遴選中,大數據百科條目由于源自新興領域,條目的數量與傳統研究領域的條目相比還處于弱勢階段,后續還需要深化對大數據領域的研究,編寫和審定更多的大數據百科條目[32]。(3)因為各語種間語義顆粒度的大小不均,6個語種的平行翻譯會出現語義不對等的情況。例如,“中華人民共和國國家互聯網信息辦公室”作為專有名詞,約定俗成翻譯為“*Cyberspace Administration of China”,這種既定模式的漢英對應有時本身就是不對稱的,但已經約定俗成。這種語義顆粒度不均勻導致的多語種翻譯的不對稱問題為后續提高條目的多語種翻譯質量預留了空間。

4 結語

大數據百科條目多語種翻譯是對大數據新興領域的研究。大數據研究被稱為繼蒸汽技術革命、電力技術革命和信息技術革命之后的第四次革命。在大數據百科條目聯合國工作語言的多語種翻譯中,我們形成了獨有的工作理念和方法。

首先,大數據百科條目具有范疇化特征。約定俗成的漢語專有名詞條目可作為一級標記條目(*標注),提示我們在多語種翻譯時關注其約定俗成的特性。同時具有約定俗成和組合構件特點的條目可作為二級標記條目(#標注),提示我們在多語種平行翻譯時聚焦條目的組合性。其他類條目為三級標記條目(默認無標注),此為團隊的創新性翻譯。

其次,大數據百科條目翻譯具有系統性?!耙藻^為準、軸為兩翼、規范為主、兼顧描寫”是我們在大數據百科條目多語種翻譯中總結形成的工作理念和方法?!耙藻^為準”指作為新興領域的大數據研究,其百科條目的翻譯首先要確定權威的知識庫作為翻譯錨,全國科學技術名詞審定委員會推出的“術語在線”適合作為翻譯錨,百度百科等百科類知識庫適合作為翻譯錨的補充?!拜S為兩翼”指在多語種翻譯中,漢語因其源語特點適合作為第一標準軸,英語因其國際性特點適合作為第二標準軸,其他語種平行翻譯時將參照漢英標準軸進行翻譯?!耙幏稙橹鳌敝复髷祿倏茥l目多語種翻譯時,要強調規范的重要性,以國際標準、國家標準、部委標準、省市標準等規范為主,相關條目需要遵守規范?!凹骖櫭鑼憽敝刚Z言的描寫特性及語際的語義顆粒度不均衡等原因會影響多語種翻譯理想狀態的實現,各語種在平行翻譯過程中存在一定的語言描寫空間。

由于我們團隊的大數據百科條目多語種翻譯涉及英語、法語、俄語、西班牙語、阿拉伯語等聯合國工作語言,譯者的翻譯素養和大數據素養難以保持一致,一定程度上制約了多語種翻譯的質量。而且,新興大數據百科條目的語言認知還在發展中,命名規則的不斷調整、語言共同體的深度認可以及社會約定的深入變化都可能帶來大數據百科條目多語種翻譯結果的變化。所以,我們的研究更多是“拋磚引玉”,希望成為大數據研究領域、術語審定領域、辭書編撰領域和翻譯領域研究的基石,為后續發展奠定基礎。

注釋

① https://www.termonline.cn/about

② http://language.chinadaily.com.cn/a/201907/04/WS5d1d4f5ca3105895c2e7b94f.html

猜你喜歡
多語種百科詞條
語聯世界,言通天下
樂樂“畫”百科
多語種《中級軍事漢語》教材的編寫思路與指導思想
2016年4月中國直銷網絡熱門詞條榜
2016年3月中國直銷網絡熱門詞條榜
2016年9月中國直銷網絡熱門詞條榜
大數據相關詞條
探索百科
北美“新清史”研究的基石何在——是多語種史料考辨互證的實證學術還是意識形態化的應時之學?(上)
從英語碩士到法國博士——我的留學規劃和多語種學習之路
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合