?

基于BNC和自建語料庫的that從句使用對比研究

2021-07-28 18:33王茜茜
速讀·下旬 2021年5期
關鍵詞:比較分析

◆摘? 要:That從句的使用是英語語法必不可少的分支,因此對于其正確使用方法的掌握顯得尤為重要。本篇文章將比較分析BNC語料庫與自建《中國日報》語料庫中that從句的使用情況,從而得出中國人對于that從句的使用情況以及該從句的正確使用頻率。

◆關鍵詞:that從句;比較分析;BNC;自建語料庫

眾所周知,that從句在中國英語教學的過程中占有非常重要的地位。作為名詞性從句,定語從句和狀語從句,它廣泛應用于等各種文本,比如新聞報道,CET寫作、學術寫作等。然而,使用太多that從句是地道的英語寫作表達嗎?以英語為母語的人又是怎樣使用that從句呢?

在中國,《中國日報》是發行量最大、公信力最高、影響力最大的官方英文報紙。因此,通過對最具代表性的《中國日報》中that從句使用的分析,筆者認為可以直觀地展示that從句在中國的使用情況。

在這篇文章中,我將比較BNC語料庫和自建的《中國日報》語料庫中that從句的使用情況。原因有兩個方面。首先,這個從句在中文寫作中出現的頻率很高,而筆者對于它的正確用法卻了解很少。其次,當筆者做一個英語寫作的時候,發現會更頻繁地使用定語從句,所以計算出that從句的分布情況有利于未來英語寫作的準確性。

1方法

本文使用兩個語料庫:BNC、自建語料庫。1995年,LowBurnard和Leech, G創立了BNC,其詞匯量約為1億,其中90%的數據是書面語言,主要來自報紙、期刊、學術書籍和小說,10%的數據是口語,主要來自正式會議和非正式對話。本文選擇國家新聞作為分析對象。新聞的單詞總數為668613,that的總數為6822。由于時間的限制,本文僅隨機抽取其400個為分析目標,粗略計算出抽樣中的單詞總數約為39203。在400個目標中,that的數量是355個,所占比例約為0.95%。

其次筆者計劃建立一個關于新聞報道美國的語料庫。首先,進入中國日報官網:http://www.chinadaily.com.cn/。由于時間關系,筆者選擇發表新聞時間區間為:2019/11/11/- 2019/11/24/。其中一個網站為:http://www.chinadaily.com.cn/a/201912/19/WS5dfblca6a310cf3e3557f486.thml。最后我們收集到70新聞文本,單詞總數30177,其中that數量為317。這里我們只選擇了一個被認為是超級國家之一的國家——美國作為分析對象,因為我們推測在《中國日報》報道外國新聞時,該從句的使用能更加代表中國人的使用水平。

2使用參數

AntConc3.5.8是Dr. Laurence Anthony開發的一款免費的語料庫檢索工具,是最新版本,操作簡單,具有檢索等多種功能。在本文中,我們使用AntConc3.5.8對自建語料庫進行分析。本文將采用索引法來觀察that從句的周圍語境,采用聚類法來觀察詞塊,采用詞表法來觀察頻率。這篇文章選擇AntConc和BNC中的頻率,百分比和對數似然函數來統計數據。

3分析

需要說明的是that可以用作其他語法功能,例如可以作為指示和關系代詞(Hyland, Tse, 2000)為了確保that的大小寫形式都會被分析,首先要做的第一步是在BNC中將節點詞設置為{that},并在AntConc中取消所有僅為小寫的標準。其次,我們將文本類型設置為新聞報道,以去除不必要的數據。第三,我們將做一個篩除以保證完全沒有不必要的數據。最后,為了使我們的分析有意義,我們將詞簇范圍大小為:min3-max5,范圍:1L-3R。

4結果

從圖1中可以看出,當詞簇范圍設置為1L至3R時,前10個單詞是:the, is, adding, will, it, would,had,we,he和not。其對數似然值分別為139.54666、97.95767、80.85221、67.91757、58.12338、54.99854、46.11049、45.01602、44.25627、37.66820、35.30126、32.57448、32.37081。我們可以做一個結論:定語或名詞性從句可能更廣泛應用于中國日報的新聞報道.同樣,在這十個單詞中,兩個詞通常用作句子的主語:we,he。所以我們可以認為這兩個詞更多是用在名詞性從句和定語從句。因此,從圖1可以看出,中國人使用名詞性從句的頻率要高于其他分句。同時在新聞寫作中,中國人傾向于使用“would”、“should”等虛詞。

從圖2中我們很容易知道,當詞簇范圍設置為1L至3R時,采樣中的前10個單詞分別是:would,should,will,was,is,had,administration,he和said。其對數似然值分別為36.2006、27.0159、26、1478、25.8604、23.9618、21.6567、21.1248、19.2315、15.2019、13.1906。在這10個單詞中,我們發現了一個有趣的現象:這里有8個動詞。在這8個動詞中,would,should,will是情態動詞,added, had, said是被動語態,was, is是同一個單詞,但形式不同。因此,我們可以猜測,母語人士傾向于使用名詞性從句或定語從句。從圖1和圖2中可以看出,兩個語料庫都傾向于使用名詞性從句或定語從句。

我們從圖1-2中做出了第一個推測。在這一步中,我們選擇使用詞簇來進一步分析that從句。在圖3中,當詞簇范圍設置為min3至 Max5時,前十個短語分別是:that the US, that the law, that the provision, that the United, that the United States, that this is, that we can, that Deutsche Bank, that effectively import, that effectively import weapons。由于體裁的特殊性,關于美國的詞匯更加頻繁。由此我們可以推測,《中國日報》更多使用地是名詞性從句或定語從句。

從表1可以看出,在兩個語料庫中,名詞性從句的使用頻率最高,其次是定語從句,最后是狀語從句。由表2可知,自建語料庫中定語從句的使用頻率遠高于樣本,分別為4.8%和36&。但是,在BNC中,名詞性從句的使用頻率高于自建語料庫,分別為89%和64%。與自建語料庫相比,該樣本中狀語從句的使用頻率較低。因此,我們可以得出這樣的結論:在本土新聞報道中可以很容易地找到名詞性從句,而在漢語新聞報道中更容易找到定語從句和名詞性從句。兩個語料庫狀語從句使用頻率都較低。

5結論

本文旨在比較《中國日報》新聞寫作與本土新聞寫作中“that-clause”的使用情況。通過對并列關系的分析,我們發現,定語從句和名詞性從句在中國新聞寫作中使用較多,尤其是作為賓語和主語使用較多,而狀語從句使用較少。這樣做的原因可能是狀語從句可以和其他詞一起使用,比如when、while等。主語和賓語是句子中最重要的部分,所以人們總是很重視它們。然而,我們發現,定語從句的使用頻率低于名詞性從句。即,在本土新聞報道中,名詞性從句頻繁出現。

參考文獻

[1]Ken Hyland,Polly Tse.Hooking the reader: a corpus study of evaluative that in abstracts[J].English for Specific Purposes,2005:123-139.

作者簡介

王茜茜(1996.09—),女,漢族,四川宣漢人,碩士研究生,西南財經大學,經貿外語學院;研究方向:認知語言學、語料庫語言學。

猜你喜歡
比較分析
高校圖書館與互聯網知識服務的比較及發展策略
安徽省區域經濟競爭力研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合