?

基于語料庫的白睿文譯者風格探究

2024-01-04 14:22韓江洪陸詩卉
關鍵詞:譯作語料庫譯者

韓江洪,陸詩卉

(1.合肥工業大學 國際教育學院,安徽 合肥 230000;2.合肥工業大學 外國語學院,安徽 合肥 230000)

白睿文(Michael Berry)是當代美國著名漢學家,現就職于加州大學洛杉磯分校(UCLA),同時也是中國現當代文學的杰出翻譯家。截至2021 年,白睿文翻譯了五部中國文學作品。作為一名譯者,白睿文的譯作在英語世界受到了很大的關注,既在一定程度上給中國文學走出去指明了方向,又為國外讀者提供了了解中國優秀文學作品的機會。

白睿文曾表示:“身為譯者,我希望讀者看不到Michael Berry 的風格。我希望我扮演一個透明人的角色……譯者不應該讓讀者在譯本中感覺作品有共同點,不應該讓讀者通過譯者的文字風格把作家聯想在一起?!盵1]他認為每部原創作品都有自己的特點,他在翻譯時會著力突出這些屬于作品本身的東西,并且努力隱去自己的存在。然而,譯者真的能做到完全在譯作中隱形嗎?胡開寶教授認為:“無論是目的語詞匯和句式結構的選擇或語篇結構的重構,還是翻譯策略和翻譯方法的應用,都必然會打下譯者的烙印,從而形成譯者風格?!盵2]這與白睿文的觀點相矛盾。

學界關于白睿文譯者風格的研究較少,大多集中在余華作品《活著》的英譯本解讀,如《活著》英譯本文化意象研究、文化負載詞研究、文本中的“假象等值”現象等等,極少涉及白睿文的其他譯作。有研究認為,白睿文譯作做到了他自己所說的“透明的翻譯”[3],但是 “透明的翻譯”就意味著沒有譯者風格嗎?張美芳教授指出:“利用語料庫進行研究,對一些難以捉摸的和不引人注目的語言習慣進行描述、分析、比較和闡釋,能比較令人信服地說明譯者的烙印確實存在?!盵4]

本研究基于劉宓慶的風格標記理論,自建白睿文譯作的中英平行語料庫,通過與英國國家語料庫(British National Corpus,BNC)中的小說語料庫對比,從形式標記和非形式標記兩個方面對白睿文譯本進行量性分析,探討白睿文多部譯著是否具有風格上的相似性,是否體現出個人鮮明的翻譯風格。

一、研究設計

(一)研究語料

筆者自建小型白睿文譯本中英文平行語料庫。中文語料包括INK 印刻文學生活雜志出版社2014年出版的張大春《我妹妹》,作家出版社2012 年8 月出版的余華《活著》,人民文學出版社2018 年出版的葉兆言《1937 年的愛情》(以下簡稱《愛情》),人民文學出版社2005 年出版的王安憶《長恨歌》。英文語料包括哥倫比亞大學出版社2000 年出版的Kid Sister (Wild Kids: Two Novels About Growing Up),Anchor 出版社2003 年出版的To Live,哥倫比亞大學出版社2003 年出版的Nanjing 1937: A Love Story,哥倫比亞大學出版社2007 年出版的The Song of Everlasting Sorrow。

本研究選取BNC 小說語料庫作為對應的參考語料庫。BNC 是目前最大的在線語料庫之一,也是目前世界上最具代表性的當代英語語料庫之一。BNC 語料庫的語料來自英國的各大報刊、論文、小說、學術文章等,涵蓋各個年齡段和社會階層的人們的語言,具有權威性。本研究選取BNC 小說語料庫與白睿文譯作進行對比,能從一定程度上反映出白睿文譯本與目標語國家流行小說的異同之處,能更直觀地體現出白睿文譯作的特點,進一步加深人們對白睿文譯作的認識。

(二)研究工具

建庫過程中,使用文本編輯器Emeditor 對中英文語料進行去噪,運用語料庫平行軟件Paraconc 做到中英文語料的句級對應平行。英文文本使用自動詞性標注軟件Tree Tagger 進行分詞賦碼處理,中文語料運用漢語分詞工具Corpus Word Parser 進行分詞賦碼處理。在語域標記研究中,使用了Laurence Anthony 開發的用于檢測網頁易讀性的軟件Ant Word Profiler[5](以下簡稱AWP)。AWP 自帶三個對比文本語料詞表(level lists),前兩個詞表為英語常用的2000 個詞族(general service list),每個詞表1 000 個詞族,第三個詞表為學術用語詞表(academic word list),包含570 個詞族。這三個語料詞表的難度依次遞增。通過AWP 軟件可以將待研究語料導入,與上述三個詞表進行詞族覆蓋,得到待研究文本中各級詞匯所占比例。在詞語標記研究中,運用語料庫檢索軟件WordSmith 計算標準類型比、詞頻和高頻詞。

表1 白睿文英譯文音節數統計表S/W(syllables per word)Tab.1 Statistics of syllables in Michael Berry’s translation

二、研究方法

劉宓慶是我國著名的翻譯理論家,他經過大量翻譯實踐和研究得出翻譯風格具有可知性的結論。譯者只有對原文進行結構分析并與非形式標志模糊集合的審美活動相結合,原文的風格才能顯現,并使風格意義成為可知[6]。他把風格標記分為兩個大類:形式標記和非形式標記。

形式標記是用來識別風格的最重要的方法。由于語言是一種符號系統,因此風格不可避免地被語言符號化。形式標記一共由六個部分組成,分別是音系標記、語域標記、句法標記、詞語標記、章法標記、修辭標記[6]。音系標記用來反映某種語言的音系特征。劉宓慶指出人類的語言首先訴諸于聽覺,因此語言文字系統的音系特征就成了語體最基本的特征[6]。音系標記通過考察譯文中平均每詞的元音數,可以大體推斷出該譯文文本的可讀性和詞匯使用偏好。語域標記(或使用域)指詞語的使用范圍,在某一特定的使用范圍中流通的詞語常常具有共同的特色[6]。白睿文所翻譯的作品多為中國現當代小說,在用詞方面不存在特殊的方言,專有詞匯較少??疾熳g文的語域標記,通過一級詞匯的比例可以直觀地反映文本中詞匯是否常見以及文本的閱讀難易程度。詞語標記顯示作者的用詞傾向。用詞傾向與語域不同,主要指個人的用詞傾向(idiolect)[6]。從語料庫的方法入手,通過類型比等較為成熟的語料庫考察項來具體分析譯文的用詞傾向。章法標記指章句組織程式,又指思維、概念的表現法。章法標記具體體現在句子長度、句子與段落之間的連貫性、敘述的時間順序和特殊語序、直接和間接引語等方面。句法標記表現為各種有特色的句法型式[6]。修辭標記指譯文中出現的修辭方法的使用特點或趨勢。

要全面、準確地認識原作的風格,單憑直觀的形式符號是不夠的。因此,除了形式標記之外,劉宓慶還歸納了非形式標記,同樣傳遞重要的風格意義。

非形式標記風格符號系統表現在以下四個方面并使之具有風格意義。第一,表現法,即作家對題材的選擇、處理方式和處理技法。第二,作品的內在素質,包括思想和感情兩個方面,也就是作品的格調,情思的高低決定作品格調的高低。第三,作家的精神氣質,這是最高層次的風格分析工作。第四,接受美學所強調的接受者(即審美主體)因素[7]。

劉宓慶還指出頻度(frequency)對風格具有特殊的意義。就對形式標記而言,對常規的變異只有在適度的反復出現時,才獲得風格的意義,偶然的變異不能形成一種傾向性[7]。也就是說,四個譯本中出現頻度高的共同點就是白睿文的翻譯特點。本研究依照劉宓慶的風格標記理論,通過語料庫的方法對頻度進行統計,基于四個譯本所呈現的共同點來探究白睿文譯本是否具有個人的翻譯風格。

三、結果與討論

(一)形式標記

本研究沒有涵蓋前文提到的全部六種形式標記,只選擇了其中的四種,即音系標記、語域標記、詞語標記和章法標記。因為這四個方面的語言形式特征更為明顯,更適合語料庫的統計方法,可以更好地再現小說的風格。

1.音系標記(phonological markers)

漢語音節通常是聲母和韻母組合的拼讀音節,也有兩個韻母組合的拼讀音節,還有單個韻母的音節。而在英語中,音節是讀音的基本單位,任何單詞的讀音,都可分解為一個個音節朗讀。英語語音的中心是單位單詞內的元音,元音數決定了單個單詞的音節數以及長度與難度[8]。因此,文本中單詞的平均音節數越多,文本越復雜,閱讀難度越高。

表1 顯示,白睿文的四部譯本平均每詞音節數為1.41,且四部譯作的S/W 值差距在0.1 左右浮動,可見除了受到原文的影響外,白睿文的翻譯在音系層面逐漸形成較為穩定的風格標記。據計算,BNC 小說語料庫的平均音節數為1.41,與白睿文語料庫的平均值相似,這說明白睿文的譯文在音系層面難度與普通英文母語小說相近,符合英語讀者的閱讀習慣。其中,《活著》的單詞平均音節數最少(1.34),單詞的發音最簡單,閱讀難度最低。

2.語域標記(registerial markers)

白睿文翻譯的四部作品都屬于中國現代小說,選詞主要為現代常用詞匯。常用詞的比例越高,文本越容易閱讀。因此,通過語料庫軟件Ant Word Profiler 統計白睿文英譯作品中一級詞匯所占比例,可以反映出白譯文的易讀程度。

如表2 所示,白睿文英譯本的一級詞匯占比普遍較高?!段颐妹谩贰稅矍椤贰堕L恨歌》這三部作品的一級詞匯占比大體相近,《活著》的一級詞匯占比(85.2%)最高。據計算,BNC 小說語料庫的一級詞匯占比80.6%。與BNC 小說語料庫對比,白睿文譯作中《我妹妹》和《活著》的一級詞匯占比高于BNC 小說語料庫,而《愛情》和《長恨歌》略低于BNC 小說語料庫。數據表明,前兩篇譯文在選詞方面更加簡單常見,生僻詞使用更少,閱讀難度更低。而后兩篇雖然在比例上略低于BNC 小說語料庫,但是差距較小,并且譯文中存在某些人名、地名等詞匯,對讀者來說無障礙的詞并沒有涵蓋在APW 的詞族1 中,故在統計過程中一定程度上造成后兩部作品的一級詞匯比例被降低??紤]到這些因素,《愛情》和《長恨歌》的一級詞匯占比實際上會比數據體現出來的更加靠近BNC 小說語料庫。因此,語域標記方面,白睿文譯文總體上使用的詞匯較為常見,閱讀難度較低。

表2 白睿文英譯文一級詞匯所占比例統計表Tab.2 Proportion of the first-level vocabulary in Michael Berry’s translation

3.詞語標記(lexical markers)

(1)類型比。在語料庫研究中通常使用類符/形符比來衡量文本的語言豐富程度,比值越高,詞匯越豐富多變,但是容易受到文本容量的影響。標準類/形符比以文本中1 000 個形符為單位,更加精確地體現詞匯多樣性,具有更高的可信度[9]。表3顯示,白睿文四部譯作的標準類形比均低于BNC小說語料庫的標準類型比,說明白睿文的英譯作品詞匯豐富程度不及目的語國家的非翻譯英文小說文本,使用的詞匯量較BNC 小說語料庫小。其中,《愛情》(43.77)、《長恨歌》(44.16)、《我妹妹》(43.64)三部譯作的標準類形比較為相近,并且與BNC 小說語料庫(45.15)的差距較小,而《活著》(37.33)的標準類形比明顯低于其他三部譯作,與BNC 小說語料庫的差距也較大,說明《活著》的語言豐富程度最低,這部作品中使用的詞匯不及其他三部作品靈活多變。

表3 白睿文英譯文標準類型比數據統計表Tab.3 Standard type ratio in Michael Berry’s translation

(2)詞頻。實詞使用情況體現譯者的語言使用偏好,根據胡壯麟的分類,英語中的實義詞主要包括動詞、名詞、形容詞和副詞四類,且具有穩定的詞匯意義[10]。如表4 所示,白睿文譯作在實詞的使用上較為穩定,與BNC 小說語料庫數據相近,每部作品之間橫向比較差異都很小,四部作品均為名詞比例最大,其次是動詞,副詞、形容詞比例最小。

表4 白睿文英譯文中四類實詞的頻率統計表Tab.4 Frequency of four kinds of notional words in Michael Berry’s translation

(3)高頻詞。高頻詞是指文本中出現頻率較高的詞語,對高頻詞的考察有利于把握文本詞匯使用特征[11]。本研究選取每部譯作中出現頻率前十的高頻詞,繪制表5??梢园l現,前十高頻詞幾乎全是虛詞,主要有冠詞、代詞、介詞、連詞等。

表5 白睿文語料庫中四部譯作前十高頻詞統計表Tab.5 Statistics of top ten high frequency words in Michael Berry’s translation

根據英語語料庫(Bank of English) 1998 年的統計,英語作為母語位于前五位的高頻詞是the,of,to,and 和a[12],而英語翻譯語料庫中位于前五位的高頻詞是 the,and,to,of 和a[13]。由表5 所示,白睿文的四個譯本高頻詞順序更符合英語母語者的習慣,這點與白睿文本人身份相符,符合他作為英語母語者的行文習慣。英譯文傾向于英語母語作品也更易于英語讀者閱讀。

4.章法標記(textual markers)

如表6 所示,在平均句長方面,白睿文譯作中《愛情》《長恨歌》《我妹妹》均超過16 字/句,其中《愛情》《我妹妹》超過17 字/句,《活著》的平均句長只有13.68 字/句,平均句長在四部作品中最短。Laviosa 通過比較英語源語和英語譯語,發現英語譯語平均句長為24.10 字/句,明顯高于英語源語平均句長[14]。本研究采用的對比語料庫BNC 小說語料庫為英語源語語料庫,經過計算,平均句長為12.21 字/句。白睿文的四部譯作的平均句長明顯低于英語譯語,略微高于英語源語,從數據方面來看更加靠近英語源語的平均句長。為了排除中文原文對翻譯的影響,本研究計算中文原文的平均句長。在中文原文中,《愛情》的平均句長(35.89)最長,其次是《活著》(29.73),再次是《我妹妹》(29.2),最短的是《長恨歌》(26.85)。該次序與白睿文四個譯本的平均句長并不一致,說明白睿文譯作不受中文原文的決定性影響。從章法標記來看,白睿文在翻譯過程中充分發揮譯者的主觀能動性,有意將長句拆分為更簡短的小句,降低四部作品的閱讀難度,更符合英語讀者的閱讀習慣。

表6 白睿文英譯文和對應中文原文平均句長統計表Tab.6 Statistics of average sentence length in Michael Berry’s translation

(二)非形式標記

根據劉宓慶的風格標記理論,僅僅依靠形式標記這樣直觀性的基礎分析還不夠具有說服力,還需要進一步分析文學作品的非形式標記。非形式標記是一種抽象的、“無形”的特征。在翻譯研究過程中,研究者不僅要抓住形式標記,還要抓住非形式標記。本章主要從表現手法、作品因素這兩個方面對白睿文譯作進行風格再現。原文和譯文的句級對應情況可以體現譯者的句級翻譯表現手法。譯者的翻譯傾向可以通過譯者所選擇原文的題材體現出來。

第一,表現手法。在建庫和對齊中英文本的過程中,發現白睿文的譯文極少出現整句增添或刪除的現象,基本上原文的句子能在英譯本中一一對應,并且句子與句子之間的順序幾乎沒有改變。如表7所示(存在誤差),根據統計,中英文的句級對應情況多集中在一對一、一對二、一對多,這三種情況占到全文的90%以上。其余的情況為多對一和多對多,但是除了在《長恨歌》譯文里情況較為明顯之外,其他譯文中極少發生。說明白睿文在翻譯過程中沒有對原文進行大范圍的改寫,較為忠實于原文,傳達原文精神。在句句對應的情況中,一對一的情況發生最多,一對二和一對多的情況次之。說明白睿文在翻譯過程中習慣于直接拆分中文句子,將原作的長句譯為兩句或多句稍短的短句。

表7 白睿文譯作的中文原文與英譯本句級對應統計表Tab.7 Statistics of sentence level correspondence in Michael Berry’s translation

第二,作品題材選擇。通過閱讀白睿文翻譯的中文原著,發現四部小說(《活著》《愛情》《長恨歌》《我妹妹》)在主題方面相似。四部作品的主題都圍繞著人生之苦,并且都是悲劇結尾?!痘钪分v述了從抗日戰爭結束到文化大革命期間福貴從地主小少爺變成普通佃戶,拼盡全力養家糊口卻最終沒有贏過命運的故事。小說中福貴一家人除了福貴以外,爸爸、媽媽、老婆、兩個孩子、女婿、孫子全都相繼去世,只留下孤苦伶仃的福貴和一頭牛?!稅矍椤分v述了南京大屠殺發生之前學者丁問漁與國民黨軍界元老的女兒雨媛糾纏不清的愛情故事,隨著日本入侵和南京淪陷,丁問漁和雨媛的愛情注定是一場沒有結局的悲劇,在故事的結尾,丁問漁為了找尋雨媛中彈身亡?!堕L恨歌》則講述了民國時期(上海解放前后)一位普通的女孩王琦瑤為了步入上層社會,與多名男性產生糾葛,命運完全被男人掌控,在名利場中浮沉身不由己,最后因為金錢問題被女兒同學的男朋友殺害的故事。而《我妹妹》是這四部中唯一沒有涉及到家仇國恨的作品,但是文章基調低沉,充滿了悲劇色彩?!拔摇钡募彝タ此泼罎M,但是背地里,爸爸出軌,媽媽患有精神疾病,最終他們兩人離婚,“我”妹妹未婚先孕,而“我”悲慘的童年對“我”一生影響甚大。結局是媽媽被送去精神病院,“我”和妹妹當眾揭發了爸爸的惡行。

白睿文接受采訪時曾說過,選擇這幾部作品來翻譯的原因,第一是自己喜歡,第二是考慮英語世界的讀者會不會對作品感興趣。比如翻譯《1937 年的愛情》是受到張純如《南京大屠殺》的啟發,當時《南京大屠殺》在美國出版并且引起了轟動,于是白睿文抓住這個機會,翻譯關于這個題材的《1937 年的愛情》。翻譯《活著》是因為看到張藝謀導演拍攝的電影版《活著》,對其產生了極大的興趣之后,才下定決心翻譯。白睿文也提到一部翻譯作品在國外出版會受到很多阻礙,例如商業出版社為了銷量會大幅度改動作品,調整為英文讀者適應或者說偏好的風格。白睿文覺得這樣的改動雖然更符合國外讀者的口味,但是會使原作失去其原來的風格。所以白睿文選擇與大學出版社合作,因為大學出版社更尊重譯者和原著[1]。

綜上所述,白睿文的四部譯作在形式標記和非形式標記方面的呈現頻度較高,存在較為顯著的相同點,有助于確定譯者風格。形式標記方面,白睿文在翻譯過程中,音系標記為偏向于使用音節數較小,與英語源語小說的音節數相近的詞匯。語域標記方面,白睿文傾向于使用通俗常見的一級詞匯。詞語標記方面,通過語料庫數據分析可見,白睿文的譯文詞匯豐富程度略低于BNC 小說語料庫,實詞詞頻順序與BNC 小說語料庫一致。高頻詞多為虛詞,并且高頻詞的排列順序反映出白睿文翻譯小說符合英語母語者的習慣。章法標記上,白睿文譯作的平均句長長于英語源語小說,短于英語譯語小說,但是更靠近英語源語小說。非形式標記方面,從表現法考慮,白睿文將長句拆分為短句,沒有大范圍改寫譯文,幾乎不出現整句的增添和刪除。從作品題材因素考慮,白睿文所選取的中文原著都有共同的主題,他本人選擇這些作品一是出于自己的興趣,二是考慮市場情況。

四、結語

正如胡開寶教授和張美芳教授所說,譯者風格通過語料庫手段能得到更為清晰的闡釋[2,4]。譯者在譯作中必然會留下自己的印記,白睿文也不例外。通過上述一系列統計和研究,可以歸納出白睿文的翻譯風格如下:白譯文用詞簡單常見,詞匯豐富程度低;相比于英語譯語文本,譯本的遣詞造句更接近英語源語文本的特點;基本上做到句句對應,習慣于拆分長句;白譯文主題相似,集中于家愁國難。

白睿文作為一位致力于中國現當代文學翻譯的漢學家,其本身具有的譯者風格乃至譯介模式對于推動中國文學對外譯介和海外傳播都具有重要的現實意義[15]。因此,白睿文的譯者風格也具有一定的研究意義,除了語料庫方法之外,還可以對其進行更深度的研究。

猜你喜歡
譯作語料庫譯者
例析初中文言文中常見虛詞的用法
生態翻譯學視角下譯者的適應與選擇
what用法大搜索
《語料庫翻譯文體學》評介
論新聞翻譯中的譯者主體性
基于JAVAEE的維吾爾中介語語料庫開發與實現
元話語翻譯中的譯者主體性研究
SOME漢譯初探
英語中“吃”的表達方法
語料庫語言學未來發展趨勢
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合