?

中亞留學生漢語有標因果類復句習得難度考察

2022-06-09 02:47張恒君
焦作大學學報 2022年2期
關鍵詞:復句中亞語料

張恒君 黃 清

(1.河南師范大學文學院,河南 新鄉 453007;2.信陽學院文學院,河南 信陽 464000)

復句下連小句、上及篇章,在漢語語法系統中居于重要地位,因果復句作為現代漢語復句系統的重要成員,一直是國際中文教學的重點,但又因其句法語義的復雜性、句式結構的多樣性,也是國際中文教學的難點。關于留學生復句習得難度的考察,余敏(2012)、張利蕊(2018)的研究較有代表性,前者以韓國為研究對象,后者以歐美國家為研究對象。中亞5國均為“一帶一路”沿線國家,漢語學習者的數量與日俱增,本文對中亞留學生漢語有標因果類復句習得難度的考察,不僅可以豐富漢語習得理論,而且具有較強的實踐意義,可以用于指導漢語復句的教學。

1.句式范圍及語料來源

1.1 句式范圍界定

本文主要采用邢福義(2001)關于復句的分類原則和標準,研究“廣義因果關系”中的因果類復句,且限定于對有標復句的研究?!皬年P系出發,用標志控制”,各類有標因果類復句有:因果句(“因為……,所以……”“由于……,……”);推斷句(“既然……,就……”);假設句(“如果……,就……”“要是……,就……”);條件句(“只有……,才……”“只要……,就……”);目的句(“……,以便……”“……,以免……”“……,免得……”)[1]。

為了更好地服務于國際中文教學,本文著重考察了《漢語水平等級標準與語法等級大綱》[2]《國際漢語教學通用課程大綱》[3]中的相關因果類復句句式的情況,同時參考《對外漢語教學語法大綱》《高等學校外國留學生漢語長期進修教學大綱》《HSK大綱》等大綱,將重合4次及以上的句式作為本文的研究對象,最終確定了16個因果類復句標志,具體見表1(為了方便描述,將各類句式進行了編號)。

表1 有標因果類復句句式

1.2 語料來源

本文的語料來源有4種路徑:一是來自河南師范大學國際教育學院語言班學生的書面作業;二是來自全球漢語中介語語料庫;三是來自HSK動態作文語料庫;四是來自其他高校(暨南大學、福建師范大學)的中介語語料庫和留學生書面作業。語料共計180萬字,獲取相關有標因果類復句共2171條。

2.選定句式使用頻次考察分析

句式的使用頻率與習得難度是有關聯的。余敏(2012)指出,“不同復句句式使用數量的多少、使用頻率的高低,可以從一定程度上反映句式習得的難度。容易習得的復句句式自然使用率高,相反,難度大的復句句式使用頻率就會相對較低”[4]。本文考察的句式種類較多,使用頻次有高有低,各類句式使用量多至上千條,少則沒有?,F將因果類復句下位的16種句式在中亞留學生的自然語料中分別進行窮盡搜索,然后對其進行數量統計,結果如表2。

因果句的構成較為復雜,其前后分句之間的關系既可以是“由因溯果”,又可以是“由果溯因”,而且關聯詞的省略現象較普遍,因此,我們將Y1句式又細分為三種變換句式分別進行統計。由表2可知,中亞留學生在使用因果類復句時,他們使用各小類的頻次由高到低依次是:因果句(1124)、假設句(709)、條件句(298)、目的句(29)、推斷句(11);使用各下位句式的頻次由高到底依次是Y1(964)、J1(660)、T4(92)、T1(86)、Y3(83)、Y2(77)、T2(64)、T3(56)、J3(47)、M1(14)、TD(11)、M3(8)、M2(7)、J2(2)、Y4(0)、Y5(0)。不可否認,句式使用頻次的高低只能在一定程度上反映中亞留學生有標因果類復句的習得難度,句式使用數量的差異跟作文體裁也有很大關系,在本文考察的語料中,議論文篇數最多,占4/5以上,應用文與記敘文篇數很少,這也會讓某些復句句式的使用受到一定的限制,因此,我們還需要從別的角度去考察。

表2 因果類復句句式及使用頻次統計

3.選定句式正確使用相對頻率考察分析

句式的正確使用相對頻率某種程度上能夠反映習得難度。正確使用相對頻率法是指某一句式或詞語在整個這一類句式或相關詞語中的正確使用率。具體的計算方法為:某一句式的正確使用相對頻率=該句式的正確使用頻次/該類句式中所有句式的使用總頻次。例如,“由于……,……”句式的正確使用相對頻率=“由于……,……”句式正確使用頻次/因果類復句16個句式的使用總頻次。施家煒(1998)認為,“在語料庫出現的語料中,句式的正確使用頻次或正確使用相對頻率越高,就越容易,越早習得”[5]。據此,我們對自然語料中16種句式的正確使用率和正確使用相對頻率進行了計算,具體數據見表3。

由表3可知,16種句式共出現2171次,根據表3中因果類復句句式的正確使用相對頻率,可以概括出16個句式的習得難度順序(由易到難)為:Y1(32.8%)、Y3(27.18%)、J1(21.83%)、Y2(2.95%)、T4(2.90%)、T1(2.35%)、T3(1.70%)、T2(1.57%)、J3(1.29%)、TD(0.32%)、M2(0.32%)、M1(0.23%)、M3(0.23%)、J2(0.09%)、Y4(0.00%)、Y5(0.00%)。句式的使用頻次與句式的正確使用頻率具有相關關系,通常是句式使用頻次越高,相應的正確使用頻次也越高,從而影響到該句式的正確使用相對頻率。結合本文語料的實際情況,收集到的因果類復句句式多則近千條,少則沒有,如果僅僅依靠正確使用相對頻率法得出有標因果類復句各句式的習得難度,這也是不科學的。

表3 因果類復句句式正確使用相對頻率統計

4.選定句式蘊含量表考察分析

“蘊含量表法是建立在各類句式在不同學時水平等級的正確使用頻率上的,描述了個體或群體在語言要素的使用和習得過程中分層級的共現模式,得到X蘊含Y,而不是相反”[5]。這里,我們的基本思路為:首先,計算出16種復句句式在每一水平層級上的正確使用頻率,其次,將各句式各層級的正確使用率轉換為二分變量,以0.70為標準分界,大于或等于0.70記為“1”,表明該句式在該水平等級已被習得,小于0.70記為“0”(某句式在自然語料中使用次數小于30次以下的,為“缺失語料”,也記為0),表示該句式未被習得,接著,將這些轉換為二分變量的數據根據“1”的總數量按照由小到大的順序從左往右依次排列,則左端表示“較難習得”,右端表示“較易習得”,再次計算各等級群體“1”的數量,根據數量總和由大到小的順序從上到下依次排列,從而形成蘊含量表矩陣;最后根據每一行“1”的數量,從右往左數出等量的列數畫出每行分界線,將每行分界線連接起來從而形成整個量表的分界線。

根據蘊含量表的理想模型假設,折線左下區域的項目都應為“0”,折線右上區域的項目都應為“1”,若折線左下區域出現了“1”,說明該項目本不該習得而被習得,反之,若折線右上區域出現了“0”,說明該項目本該習得而未被習得。量表下方“正確”和“錯誤”的數量則根據以上假設得出,符合假設的視為“正確”,不符合假設的視為“錯誤”。量表最后一行根據每一列“0”和“1”的數量列出邊緣值,第一個數字表示的是每一列中“0”的數量,第二個數字表示的是每一列中“1”的數量。

基于上述討論,我們首先對收集到的語料進行分級處理,我們將HSK動態作文語料庫中證書等級A和B定為“高級”,證書等級C定為“中級”,無級定為“初級”。自建語料庫和全球漢語中介語語料庫樣本中已通過HSK漢語水平考試五級和六級的定為“高級”,四級和三級定為“中級”,二級以下及未考取證書(零基礎)的定為“初級”。然后按照高級、中級、初級三個等級來計算特定句式在某一階段水平上的正確使用頻率。最后得到因果類復句句式蘊含量表,如下所示。

蘊含量表創建好后,并不能直接進行說明語法項目習得的等級差異,還需要通過再生系數(Coefficient of Reproducibility)①、最小邊緣再生系數(Minimum Marginal Reproducibility)②、再生提高百分比(PercentReproducibility③以及可測量性系數(Coefficient of Scalability)④等這些數據來檢驗蘊含量表的有效性。計算結果得到Crep=1、MMrep=0.875、%improvement=0.125、,由此說明表1-3的蘊含量表是有效的,而且可預測性高(Crep=1>0.9)。因此,根據上述蘊含量表,可以得出以下結論:

表4 因果類復句句式蘊含量

最易掌握的句式有:Y1、Y2、Y3;

較易掌握的句式有:J1、T4、T3;

較難掌握的句式有:T1、T2、J3;

最難掌握的句式有:TD、M2、M1、M3、J2、Y4、Y5。

與任何研究測量工具一樣,蘊含量表法也有其局限性,只能在一定程度上反映中亞留學生有標因果類復句的習得情況。語料分級的準確性、一些因回避策略而造成的語料缺失等因素都會影響到蘊含量表的效度。

5.結語

前文中通過使用頻次法、正確使用相對頻率法和蘊含量表法分別考察了中亞留學生有標因果類復句習得難度,為了方便最終考察,現將以上研究結果歸納如下:

句式使用頻次排序:Y1、J1、T4、T1、Y3、Y2、T2、T3、J3、M1、TD、M3、M2、J2、Y4、Y5;

句式正確使用相對頻率排序:Y1、Y3、J1、Y2、T4、T1、T3、T2、J3、TD、M2、M1、M3、J2、Y4、Y5;

句式蘊含量表排序:Y1、Y2、Y3、J1、T4、T3、T1、T2、J3、TD、M2、M1、M3、J2、Y4、Y5。

我們可以發現,通過使用頻次法、正確使用相對頻率法和蘊含量表法得出的結果存在著差異性,無論是使用頻次法、正確使用相對頻率法還是蘊含量表法都有其不足之處,因此,單純使用上述的某一方法去判定因果類復句句式的習得難度是不科學的,得出的結論也必將有悖于事實。彭淑莉(2008)認為,“各句式使用率和正確率兩項排名之和越小,表明該句式的習得情況越好”[6]。據此,為了盡可能得到客觀、有效的研究結果,現將各個句式在以上統計分析中出現的次序依次相加,認為得出的和越小,則說明該句式的習得難度越低,具體結果見表5。

表5 因果類復句句式使用排序

通過綜合使用頻次分析法、正確使用相對頻率法以及蘊含量表分析法分析所得出的結果,根據“總分之和越小,習得難度越低”,可以概括出16個句式的習得難度順序(由易到難)為:Y1(3)、J1(9)、Y3(10)、Y2(12)、T4(13)、T1(17)、T3(21)、T2(23)、J3(27)、TD(31)、M1(34)、M2(35)、M3(38)、J2(42)、Y5(45)、Y4(48)。具體結論如下:

最易掌握的句式:Y1(因為式)、J1(如果式)、Y3(由于式);

較易掌握的句式:Y2(因此式)、T4(不管式)、T1(只有式)、T3(無論式)、T2(只要式)、J3(要是式);

較難掌握的句式:TD(既然式)、M1(以便式)、M2(以免式)、M3(免得式);

最難掌握的句式:J2(倘若式)、Y5(以至式)、Y4(以致式)。

注釋:

① Crep=1-錯誤的數量/等級數量X句式數量,系數大于0.90,越接近1, 則預測的把握越大。

② MMrep=最大邊緣值(邊緣值中每列最大數值相加)/等級數量X句 式數量,此值小于再生系數,可預測性大。

③%improvement=Crep-MMrep.

④ Cscal=%improvement/1-MMrep,此值超過0.60時,則具有可測量性。

猜你喜歡
復句中亞語料
習近平主席在中亞
連動結構“VP1來VP2”的復句化及新興小句連接詞“來”的形成
漢語復句學說的源流
基于語料調查的“連……都(也)……”出現的語義背景分析
中亞速覽
華語電影作為真實語料在翻譯教學中的應用
略論復句分類與對外漢語教學
民營油企的中亞并購潮
《苗防備覽》中的湘西語料
復句內部不應當用句號
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合