?

理工科學生英漢專業語塊采集微案研究

2018-06-13 10:02
廈門理工學院學報 2018年2期
關鍵詞:語塊類別英文

張 鸰

(廈門理工學院外國語學院,福建 廈門 361024)

國內外學術界對語塊的定義有很多,得到廣泛認同的是Wray[1]提出的“具有一定結構,表達一定意義的預制的多詞單位,它以整體形式被記憶存儲,在交際時被整體提取,不需要使用語法規則來加工分析的連續或不連續詞匯構成的語串”。在她統計的50多個語塊術語中,“formula/formulaic language程式化或公式的語言”最能體現出語塊對于交流的“省力”優勢。Altenberg & Granger[2]指出,英語自然話語約70%由語塊構成。周健[3]抽樣統計顯示,漢語文本中平均每句有 1.4 個語塊。陳紅[4]認為漢語中存在較之英語還要豐富、在語言交際使用中更為活躍的語言板塊。近十多年來,國內學者普遍認同西方的語塊理論價值和應用價值,在語塊的界定和功能、語塊使用、語塊能力的測量、語塊教學、語塊與辭典編撰、研究綜述等6個方面展開了研究[5]。但語塊研究文本大多是局限在學術文本或一般性文本,對特殊用途領域的文本研究較少[6]。在學習實踐中,學生語塊能力的訓練局限在大學英語課堂上,很少在專業英語學習或雙語結合的語境下運用這個技能。為利于融合“大學英語教學課外實踐”“專業英語應用”“中英文技術文檔學習”3個元素,本文以認知英文的專業語塊為目標,通過選取理工科學生采集本專業技術文檔的中英文語塊,分析他們在本專業領域識別和采集語塊的能力與特點,促進學生積累技術寫作語料的意識。

一、 研究對象和內容

研究對象是來自廈門某普通高校大二和大四的車輛、電氣、計算機3個專業的12位學生,每個專業4人;其中男生8位,女生4位。他們英語水平接近且都通過了大學英語六級,在大學英語課堂上接受過語塊識別的訓練,明確知道語塊的特征,如多詞結構、程式化表達形式、慣用程度、出現的頻率等要素,他們也知道語塊分為詞級層次類別和句級層次類別,但都從未在本專業的技術文檔中運用過語塊知識。

研究針對下列2個問題進行探討性分析:

(1)研究對象采集專業語塊的能力,即采集語塊的有效性如何?

(2)研究對象采集專業語塊呈現的特點是什么,語塊類型與采集者專業和性別是否有關聯?

研究中,讓研究對象用半年時間采集行業中常用的中英文專業(技術)語塊各300個。

根據語塊所屬的語法單位層次,漢語語塊可以分為3類: 詞級語塊、句級語塊和語篇語塊[7]??紤]到研究對象的水平和實踐操作的簡便性,案例僅采集詞級層次類別的語塊,不包括句級和語篇層次的語塊,語塊的分類均以中文語塊為采集標準,即中文部分必須是語塊結構方可被采集。

因研究涉及的專業、人員、語料樣本均較少,故定位為探索性的微案研究。

二、 研究過程

(一)分組

將同專業研究對象每2人分為一組,小組成員共同判斷所采集的語塊是否合適,每個專業安排1人協調組間采集的方向,避免重復采集。

(二)培訓

對研究對象進行采集前培訓,以明確采集標準、格式、方法、步驟和語塊編碼、自檢方法。具體內容如下:

1.學習語塊采集樣本

項目組用3個專業的模擬短文(見表1)對參與學生進行實踐前語塊知識溫習,并以其中車輛專業的短文做了語塊采集樣表(見表2)供參與學生參考模仿。表2中,編碼包含了專業名稱和語塊類別,專業名稱以拼音的首字母標識,如CL=車輛, DQ=電氣, JSJ=計算機,而語塊類別代碼以英文詞性首字母標識,如NN=名詞搭配,NV=名詞動詞(主謂)搭配, VN=動詞名詞(動賓)搭配,AdjN=形容詞名詞搭配,AdvV=副詞動詞搭配 。如CL-AdvV指的是車輛專業采集的副詞動詞搭配語塊。

表1 模擬采集的短文Table1 Texts for sample chunk Collection

表2 語塊采集樣表Table 2 Sample chunk for collection form

2.明確采集方法和步驟

根據研究設計,英文語塊必須與中文語塊意義完全對應,但中英文例句的句義可以各自獨立,只要含有目標語塊即可。采集前參與學生普遍對如何采集英文語塊和英文例句感到畏難。項目組教師為學生演示了以中文語塊為向導獲取英文語塊和英文例句的三步法,步驟如下:

(1) 確定中文語塊。采集本行業高頻使用,外行人也略有所知的程式化語言。如在車輛技術文檔中,“車輪抱死”是一個常用的表達式,會駕駛的外行也不會完全陌生,在產品說明、用戶手冊、網頁資訊等文檔中可經??吹?,容易獲取中文例句,這樣的語塊具有采集價值。

圖1 專業語塊采集流程圖Fig.1 Flowchart of technical Chunks collection

(2) 確定相對應的英文語塊。在百度中輸入目標語塊“車輪抱死,英文”,從檢索條目中可得到tire lock, wheel lock,wheel lock up等英文選項,然后需要在英文網頁中逆查驗證其正確性和地道性。高頻使用的語言通常會優先顯示在滾動的備選詞條中,根據“車輪抱死”的主謂結構成分,可以判斷“wheel lock up”比較適合作為對應語塊,汽車專業的學生憑借對汽車品牌的了解也可以從“wheel lock up on 97 dodge 2500”的詞條下獲得確認。

(3) 確定英文例句。當點擊查找時,網頁會出現許多與“wheel lock up”相關的英文網站,從中摘選一含有該語塊的例句即可。

上述采集方法可以用Baigent[8]所說的語塊學習3階段進行歸納,即辨認—探索—鞏固 (identify-explore-consolidate)階段。專業語塊采集流程如圖1所示。

(三)語塊采集

研究對象進行為期半年左右(2016年12月至2017年6月)的專業語塊采集實踐。語料采集源來自產品說明、安裝維護文檔及其他用戶手冊(尤其是非專業用戶需要閱讀的文檔)、專業科普書籍網頁、行業代表性企業官網、專業產品說明書、中英文教科書等。

(四)篩選、審核語塊

研究對象定期(大約6~8周)提交階段采集的語塊并舉行跨專業組間討論、研判、反饋和修正。項目組為研究對象提供了自我核查語塊的問題清單和咨詢他人反饋清單,研究對象可以借助清單自行核查或求助于他人的反饋對所采集的專業語塊進行修正(見表3)。

表3 語塊審核問題清單Table 3 Technical chunk check list

研究對象采集的語塊分為3個批次提交供相關人員審核。采集語塊須經過3個審核環節:本專業學伴、專業老師審核—大學英語老師審核—英語外教審核,被2個審核環節否定的語塊被認定為無效。每一批次審核結果均以書面形式反饋給學生,以避免下批次出現類似問題。

三、結果和討論

(一)采集結果

采集結束后,研究對象累計采集1 012個語塊,剔除無效語塊后得到856個有效語塊。

1.專業語塊采集的有效性

圖2 不同專業學生采集語塊有效性Fig.2 Validity of technical chunks by collectors’ majors

“研究問題1:研究對象采集專業語塊的能力,既采集來的語塊有效性如何?”的統計結果如圖2所示。從圖2可見,各專業學生采集的有效性分別為車輛83.8%,電氣84.2%, 計算機85.7%,平均有效性為84.6%。由于車輛專業2名男生因故中途退出項目,車輛采集的語塊總數比電氣和計算機少,但從有效性看,各專業研究對象的采集質量比較一致,反映了參與學生彼此的專業語塊采集能力相近的事實。

2.專業語塊采集類別的分布

856個有效語塊中有7個語塊屬于副詞動詞搭配類別,因其樣本太小忽略不計入統計,其他849個有效語塊集中分布在形名搭配、名名搭配、名動(主謂)搭配,動名(動賓)搭配4種類別上,用SPSS軟件統計得到這4個類別語塊的采集頻率分布(見表4)。

表4 語塊類別分布頻率Table 4 Technical chunk distribution by type

針對研究問題2,對語塊類別和專業數據、語塊類別和性別數據分別做了交叉表(見表5~6)和卡方獨立性檢驗(見表7)。

表5 語塊類別*專業交叉表Table 5 Type & major cross-tabulation table

表6 語塊類別*性別交叉表 Table 6 Type & gender cross-tabulation table性別

表 7 語塊類別*專業和語塊類別*性別卡方檢驗表Table 7 Type & major and Type & gender chi-square test

注:a.0 單元格(.0%) 的期望計數少于 5,最小期望計數為 7.44。b.0單元格(.0%) 的期望計數少于 5,最小期望計數為 17.06。

由表7卡方獨立性檢驗結果顯示可知,研究對象的專業和他們采集的專業語塊類別存在顯著相關(χ2=101.012,df=6,P<0.05)。具體地說,電氣專業的學生采集的語塊中形名搭配類別的占多數(169/279=60.6%),名名搭配類別的占49%(192/390=49%),車輛專業的學生采集的語塊中名動(主謂)搭配類別占42.5%(17/40=42.5%),高于電氣和計算機專業,計算機專業的學生采集的語塊中動名(動賓)搭配類別占比55.7%(78/140=55.7%),高于車輛和電氣專業。研究對象的性別和他們采集的專業語塊類別也存在顯著相關(χ2=34.031,df=3,P<0.05)。具體地說,女生采集名名搭配類別的語塊明顯多于男生,占66.2%(258/390=66.2%),男生采集的名動(主謂)搭配類別的語塊明顯多于女生,占72.5%(29/40=72.5%),女生采集的動名(動賓)搭配類別占57.1%(80/140=57.1%),略多于男生占比42.8%(60/140=42.8%),男女生采集的形名搭配類別的語塊比例相近,分別是50.5%(141/279=50.5%)和49.5%(138/279=49.5%)。

(二)結果討論

1.語塊采集類別和專業、性別相關性的討論

梁穎紅等[9]歸納的7種漢語語塊中,名詞短語和動詞短語為前2大類。在研究對象所采集語塊中絕大多數(72%)是名詞性語塊(其中名詞和名詞的搭配占了40.6%,形容詞名詞搭配占了31.4%),其余的28%是帶有動詞的語塊,這也印證了詞義在語言單位的組合中,“名詞和動詞往往擔任句子結構中最基本的成分”[10],理論概念類名詞類語塊會占多數的情形還反映出學生偏重于從學術文檔采集語料的特點。雖然,在實踐前強調查找語料的來源要取自應用性的技術文檔,但學生采集的語塊和例句仍有不少來自國內出版的專業英語教材以及中文論文的英文摘要,因此,產生過度明顯摘錄專業術語的問題,如:鏈路層幀、擴散退火、星拓撲結構,風洞收縮段、鄰接矩陣等,這些中文語塊普識度不高,在技術文檔中也難以被一般產品用戶所理解,這樣的語塊往往在審核時會被刪除。

從專業來看,電氣專業學生采集的形名搭配語塊和名名搭配語塊多于另外兩個專業,這有可能是因為電氣專業對大多數普通人來說,比車輛和計算機專業更抽象,電氣所涉及的概念性詞組多,容易引起電氣學生的采集注意力。采集的語塊中28%是帶有動詞的語塊,其中動名(動賓)搭配的語塊占20.2%,而且一半以上是計算機專業采集的,這或許是因為計算機專業更加關注操作步驟、操作對象以及操作結果的緣故。而名動(主謂)搭配的語塊僅僅占6%,主要集中在車輛學生采集的語塊中,電氣和計算機專業采集得很少,這原因或許與車輛專業的駕馭操縱性質相關,其語言關注焦點在于操縱動作的主體和動作本身。

從性別來看,研究對象中電氣和計算機女生共有4名女生,但她們采集名名搭配類別的語塊占66.2%,人均采集數明顯多于男生,男生采集的名動(主謂)搭配類別的語塊占72.5%,人均采集數也明顯多于女生。雖然目前沒有查證到直接的文獻和證據可以解釋性別差異在語言成分選擇傾向的差異,但從性別差異的角度來看,女生采集較多的名名搭配類別的語塊是句子中的從屬成分,不能構建完整的句意,男生采集較多的名動(主謂)搭配語塊是句子中的主要成分,這或許與男女性別的社會角色有潛在的關系,因為男性語言策略上傾向于主宰性、邏輯性,女性傾向于從屬性、不確定性[11]。

2.其他采集問題討論

根據李玲[12]的提示,英漢兩種語言中的語塊形式上不是完全對應的,有些在漢語中是單詞,在英語卻是語塊,反之也存在同樣情形。雖然,語塊采集要求是中文部分是語塊才能被采集,在第一批次語塊中學生將虛部、實部、壓盤、電勢、電能等詞納入采集對象,原因就在于這些詞對應的英文是語塊,他們誤認為英文是語塊,中文也應該是語塊。除了這些個別的兩字詞的“偽語塊”,學生采集的“四字格”中文形式的語塊占采集語塊一半以上,絕大部分是連續成分的語塊,極少有非連續成分的語塊,這反映學生語塊識別能力局限在連續的語言單位,識別非連續成分的語塊的敏感度不夠。

審核中還發現一部分過易或湊數的語塊,如:電氣事故、電力轉型、下載軟件、前排座位等,這些語塊的專業典型性不足,且結構凝固性弱,采集價值低。表面上看,這是研究對象隨意采集的結果,但實際上這間接反映出學生受眾意識的不足或缺失。在采集例句遇到需要摘錄的中英文例句冗長繁瑣時,多數學生是全盤照搬句子,不知道摒棄無關信息,摘取目標語塊所在的核心句段,或通過適當的改寫來凸顯目標語塊,這說明了學生缺少靈活運用語言的意識。

為了了解研究對象對采集實踐的體會,采集結束后,項目組用開放式問題就實踐受益程度及學生自我反思兩方面和研究對象進行了QQ線上訪談。研究對象比較一致的留言反饋:一是掌握了如何有效檢索驗證英文信息;二是參與采集后才比較深刻體會到受眾這個概念所包含的內涵。

四、結語

本研究以車輛、電氣和計算機3個專業作為試驗性的專業語塊采集領域,數據表明,3個專業研究對象所采集的專業語塊有效性比較接近,電氣專業的學生采集的形名搭配和名名搭配類別的語塊均高于車輛和計算機專業,車輛專業的學生采集的名動(主謂)搭配類別語塊高于電氣和計算機,計算機專業的學生采集的動名(動賓)搭配類別高于電氣和車輛。男女生采集的形名搭配類別的語塊比例相近,女生采集名名搭配類別的語塊明顯多于男生,男生采集的名動(主謂)搭配類別的語塊明顯多于女生,在動名(動賓)搭配類別的語塊上,女生略多于男生。采集語塊的類別與學生專業和性別均存在相關。

由于采集的語塊僅是詞級層次的嘗試,語料代表性也僅限于3個專業,研究存在一定局限,期望后期研究能從細化專業大類的角度涉及更多專業領域,更深入地采集句級層次的中英語塊,如此,所建設的專業語塊庫對于計算機輔助翻譯、技術寫作領域將更具有實用價值。

[參考文獻]

[1]WRAY A. Formulaic sequences in second language teaching: principle and practice[J]. Applied Linguistics, 2000,21(4):463-489.

[2]ALTENBERG B , GRANGER S. The grammatical and lexical patterning of MAKE in native and non-native student writing[J]. Applied Linguistics,2001 ,22(2): 173-194.

[3]周健.語塊教學在培養漢語語感中的作用[C]∥第八屆國際漢語教學討論會文選.北京:高等教育出版社,2007:142-150.

[4]陳紅.漢語語塊研究[J].社會科學家,2009(6):152-155.

[5]黃燕,王海嘯.二語語塊研究的“中國圖景”: 語塊研究的現狀與前瞻[J],外語界,2011(3):74-81.

[6]李繼民.國內外語塊研究述評[J].山東外語教學,2011(5):17-23.

[7]錢旭菁.漢語語塊研究初探[J].北京大學學報(哲學社會科學版) ,2008 (9):139-146.

[8]BAIGENT M.Teaching in chunks: integrating a lexical approach[J].MET,1999(2):51-54.

[9]梁穎紅,趙鐵軍,于潔,等.基于改進K-均值聚類的漢語語塊識別[J].哈爾濱工業大學學報,2007(7):1 106-1 109.

[10]沈陽.漢語動名語義關系的分析與教學[C]∥第五屆國際漢語教學討論會論文選.北京:北京大學出版社,1999:411.

[11]劉彬.簡析性別差異在語言中的體現及原因[J].河南理工大學學報(社會科學版),2008(1):49-52.

[12]李玲.英漢語塊對比研究[J].山東農業大學學報(社會科學版),2011(2):109-112.

猜你喜歡
語塊類別英文
科技漢語語塊的類型和特征
信息化環境下英語語塊教學模式在小學英語教學中的運用
信息化環境下英語語塊教學模式在小學英語教學中的運用
壯字喃字同形字的三種類別及簡要分析
英文摘要
英文摘要
西夏刻本中小裝飾的類別及流變
英文摘要
英文摘要
多類別復合資源的空間匹配
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合