?

國內基于語料庫的兒童語言研究綜述

2020-09-10 07:22劉夢
新教育論壇 2020年7期
關鍵詞:語料庫

劉夢

摘要:本文對2002年至2019年這17年間刊發于國內核心期刊的語料庫兒童語言方面的研究文獻進行分析發現:很多此類研究方法上,材料性研究多于非材料性研究;研究內容上,語料庫被廣泛應用于教學、翻譯、詞匯、語義、詞典和語法等語言研究領域。本文主要通過回顧語料庫和語料庫語言學的由來,分析了兒童語料庫的應用與研究現狀,肯定了兒童語料庫語言學在學齡前兒童的語言描述、語言理論發展和語言學研究方法等方面的貢獻。特別就語料庫語言學研究在語料庫標注技術、研究層次、與其它學科的交叉研究和語料庫建庫等方面出現了平臺期這一現狀做了闡述。

關鍵詞:語料庫;語料庫語言學;學齡前兒童語言

1.引言

20世紀80年代以來,全世界對于兒童語言教育都密切的關注,畢竟學習是需要通過語言來進行的語言能力是兒童認識這個世界基本能力,并且在實習的過程當中也可以發展兒童的創造力同感。提高對語言的興趣,一旦產生了想要學習語言的興趣時,兒童就會去主動去尋找機會來練習,聽和說。并且使自己表達能力越來越完整和準確。這種興趣不僅僅可以影響兒童入學后再寫作與表達和溝通等方面,而且會影響他未來的工作職位,如政治家、外交官員、教師、律師、管理人員和文學藝術創作者等。為了更好地了解兒童語料庫研究成果,本人對當目前所收集的大量語料庫語言學文獻研究進行了系統的總結分析,希望可以為今后有關兒童語料庫語言學的發展提供借鑒和參考。

所以在兒童語言研究方面,同樣擁有語料庫所帶來的好處和意義是不可忽視的。如果能把有關于兒童語言的語料轉寫成電子文本,賦以語言(語音、語法、語義或語用)信息,并通過相對應檢索和分析工具,建立起一個兒童口語語料庫系統。這樣的語料庫是可以將大量所收集的文本和語言特征資料按照一定順序或格式整合起來的,因為每個兒童在不同年齡段的語言特征有一定差異,如果能建立起這樣的兒童語言研究的語料庫,再想找類似資料就能更加方便更加全面,既省時間又省力。

但是通過對知網等相關所提供的文獻,可以得知國內基于兒童語言的語料庫建設方面介紹至今還不多見,本文試圖對國內外這17年來的兒童口語語料庫建設文獻,進行介紹和研究分析,希望能為兒童語言的研究帶來一些比較充分的總結,也是為口語語料庫的建設提供一些借鑒之處。

2.文獻數量

本文通過在中國知網(CNKI)中輸入關鍵詞“兒童語料庫”檢索出2002年至 2019年發表于核心期刊精確匹配的相關論文37篇,按時間順序統計如圖1所示:

通過該圖可以得知這十八年間,兒童語料庫語言學的相關研究是呈逐漸上升趨勢的,這些文獻可以為后來以“兒童語料庫語言學”為主題的研究者給予了一些知識基礎。

為了能夠更好的進行這次研究,我們將用到的文獻利用餅圖的形式完美的呈現出來方便大家看。關于兒童語言的研究文獻主要是通過五個方向來進行的:其中基礎研究占到68.57%,總共有24篇文獻?;诨A教育與中等職業教育占14.29%,總共有五篇文獻。再就是通過政策方面的研究占8.57%,只有三篇文獻。通過職業指導的方向進行研究占5.71%,只有兩篇文獻。最后是通過高等教育來為基礎來進行研究的占2.86%,只有一篇文獻。以下是本文對近十八年的國內語料庫語言學研究文獻按研究方法統計如圖2所示:

在中國知網(CNKI)“中國期刊全文數據庫”中輸入關鍵詞“語料庫”檢索出近十年語料庫語言學材料性研究716篇,非材料性研究583篇,材料性研究多于非材料性研究,符合語料庫語言學定量科學研究語言的實質,但是在中國知網(CNKI)“中國期刊全文數據庫”中輸入關鍵詞“兒童語料庫”檢索出的相關論文比較少,只有37篇。根據統計數據,十八年期間我國語料庫語言學和兒童語言語料庫研究方法呈現出四個明顯分水嶺:2001年的語言學和兒童語言研究大部分以非材料性研究來進行分析,材料性研究為少部分;2002-2006年材料性研究和非材料性研究不分上下,有匹敵之意;2007 -2010年語言學和兒童語言語料庫研究則與2001年時相反;2011-2020年的語言學和兒童語言研究主要是通過材料性研究與非材料性研究相結合進行的。

本人就不同研究領域對當前語料庫語言學研究進行了分類檢索。根據語言學家Biber (2000), Kennedy (2000)和Aijmer (2009)對語料庫研究領域的分類方法,并考慮到我國語料庫研究目前的實際情況,在此將語料庫語言學研究分為詞匯、語法、語義等十三個方面。采用“關鍵詞+主題”的搭配檢索方式,以“兒童語言語料庫”為關鍵詞,以研究領域為主題對期刊全文數據庫進一步檢索(含非核心期刊論文)結果如圖3所示:

上述數據顯示:由于研究的關鍵詞為“兒童語料庫研究”所以關于語料庫就有(13篇);接下來的是:語料庫應用于兒童研究(10篇)、語法(2篇)、語義(3篇)、詞典(2篇)、詞匯研究(7篇)。

本人將這37篇以“兒童語言語料庫”為主題進行研究的刊發論文,進一步檢索,其檢索結果按分類分布如圖4 所示:

據上述餅圖所示,兒童語料庫在中國語言文學、學前教育、外國語言文字、成人教育與特殊教育、文藝理論以及心理學等六個方面迅速發展。各領域在2002-2020年均取得近十八年論文刊發數量的一定值。

3.研究內容(考慮從哪幾個方面來介紹“研究內容”,比如研究領域、研究主題、研究方法等,分別論述。)

(1)研究理論和指導

我們大量閱讀了當前國內外最新的兒童口語語料庫的相關研究報告,一些作者的觀點引發我們思考與共鳴。

徐凱俐(2018)最早對漢語幼童語用技能的調查中他是以利用軟件工具輔助來進行分析的,且用了語料庫研究法,主要介紹了選擇語料、文本轉寫、語料處理與校對的過程。他在研究中利用當前比較熱門的app對3至6歲的兒童有聲故事言語作為主要研究對象。利用語料庫的研究方法,有聲讀物是通過聽的方式來進行閱讀的,畢竟現在互聯網時代大家使用智能化手機或平板電腦的次數越來越多。所以像這種利用移動電子終端的有聲讀物市場也漸漸擴大,目前使用有聲讀物的一部分顧客是兒童,在眾多的有聲讀物當中,故事類的有聲讀物更受到兒童們的喜愛。但是畢竟像這樣的軟件良莠不齊,且缺乏了一定的規范和標準性,畢竟3至6歲的兒童語言發展優勢比較至關重要的,且這個年齡段也是很關鍵的,所以他在研究的過程當中認為兒童可以跟隨語境變化調節語言表達方式。但是3至6歲的兒童僅僅只是憑借有聲讀物達到語用技能還不夠完善,只能夠進行比較簡單的語境來進行調節。而且兒童在言語表述中根據不同的環境情況都會造成顯著性的差異。只有到了七歲左右,兒童才能夠根據畫者反應調節話語來進行表達。并且在幼童調節語言表達方式這項技能中,性別因素不發生影響。

專門研究學齡前兒童語言發展的兩大基礎理論:一是行為主義理論,它主要是強調人類行為的變化是因為條件反射,而社會環境對于學齡前兒童關于語言方面的學習有一定的影響,并且突出了交互概念。另外一種便是認知理論,它主要是認為大腦才是掌握所有言語行為的源泉,只有了解大腦機制才能夠理解學齡前兒童是怎么從小開始掌握和學習語言的能力。直到60年代出現了關于學齡前兒童語言能力發展的第三個理論,即皮亞杰的建構主義理論。該理論事實上是將以上兩種理論進行相結合,也就是行為主義和認知理論的結合。學齡前兒童在使學習語言的過程當中,不僅會利用到天賦的大腦機制,也會因為所處的社會環境而進行一定的運作。學習本身就是學習者利用自己不斷儲備的知識和經驗來進行構造思想和概念的一個過程,只有通過將這些知識和經驗進行構造和組合,再隨著年齡的增加、所處的環境所提供的信息越來越多,搭配大腦機制控制,學齡前兒童則會學到更多的東西,其中包括語言。

姜新新(2019)在平行語料庫建設日益發展,借助這一工具研究兒童文學翻譯的文獻屈指可數。本文利用構建主義理論為核心、梳理了相關概念及研究成果指出現階段研究的問題所在,并且鼓勵更多的研究者進行研究這一領域重視兒童語言的發展與教育,使兒童文學翻譯市場的關范性得到重視。該文獻是專門針對3至6歲兒童的跟蹤調查,并且對于這個年齡段的兒童言語特點做出了總結。三歲左右的兒童其實已經懂得利用簡單的字面意義和言外之意來表達自己的想法,只是因為年齡太小,達到交際目的的效果不夠充分。但在4至5歲之間學齡前兒童會根據實際情況來進行更多方面的言語行為,比如批評反對,讓步等來達到自己想要的交際意圖。六歲兒童則會出現協商的行為,為了可以達到目的,他們會通過各種言語行為,如陳述或許諾。所以總的來說根據兒童年齡的增長這些言語行為往往通過特定句式表達,其次3、4歲的兒童對于隱喻和否定有一定的直觀了解,但仍具有較大的局限性,無法理解在對話過程中抽象隱喻的真實意圖,到了學齡前的兒童卻可以利用在交際過程中多以陳述句為核心句式,直接語言和間接語言交替運用。

馬曉雷、陳穎芳(2016)在《基于共詞分析的語料庫語言學研究現狀分析》中認為兒童語言中的詞義泛化是通過擴充詞語的編碼概念來進行的語用過程。在研究中之所以使用共詞分析是因為學齡前兒童通常會選擇他們容易得到的詞匯,或者針對自己的意圖有非常直接關聯的詞匯??偟膩碚f兒童思維理解和語用能力隨著社會經驗和閱歷的成長而增加。

謝楠和張笛(2017)中提出語料庫研究法是兒童語言獲得的研究方法之一,而我國的兒童語言語料庫暫時不能滿足要求,因此更需要建立一個比較系統性的兒童語言口語語料庫。利用大學認知科學與語言學能研究基地所主導的語料庫建設。包括目的、方案以及語料庫的規模都為此文獻的研究成果。期望該語料庫的建設能為兒童語言研究提供有利的研究工具。

蘇晴(2017)在研究中提到近幾年來,關于幼兒語料的研究越來越炙熱,但利用幼兒語料來致力于語言教育的研究還是少之又少。學前階段的兒童又處在剛開始溝通發展的關鍵期,自然情境下的言語活動對幼兒語言能力的習得是其他途徑無法達到的。本研究是對幼兒語料研究的豐富,在有效促進幼兒語言發展的研究中更是一種新的突破。本研究主要采取的是兒童語料庫的研究方法。通過觀察中班幼兒在角色游戲情境下發生的語言,進而將收集到的幼兒口語語料建成幼兒口語語料庫,與以往相關研究幼兒在日?;顒又械挠迷~情況進行比較來對幼兒口語語料的整體詞匯、不同區域的詞匯以及幼兒語句進行分析。本研究的研究結果是:兒童通過游戲進行口語語料的特點為口語語料總量掌握不夠;名詞多被代詞替代;動詞使用頻度較高;形容詞使用量偏少;數量詞種類多但集中在少數詞上;多使用簡單句和錯序句。針對以上特點,提出的教育建議是教師要創設多種游戲情境的語言交流環境;鼓勵幼兒多使用有關物體的名稱詞;以豐富游戲內容引發幼兒使用更多種類的動詞;讓幼兒在社會實踐體驗中積累和運用形容詞;引導幼兒在與材料互動中正確使用量詞等。

4.國內基于語料庫的兒童語言研究的局限性

可以說目前國內關于兒童語料庫語言學的研究雖然在各方面都取得了一定的研究成果,并且也建立了不少兒童語料庫,但是還存在著一些問題,比如說建設有待提高、研究領域發展不平衡、基于語料庫的語言現象研究不夠深入等等。

4.1兒童語料庫領域的建設有待提高

兒童語料庫建設方面主要存在兩個問題:首先是現存兒童語料庫規模不大,語料內容不豐富;其次即是兒童語料庫軟件處理技術還不成熟,仍需進一步提高。

根據現已知所建立的兒童語料庫的規模都不是特別的大,雖已有百萬庫容的語料庫(如中國英語學習者語料庫、英漢雙語平行語料庫),但是較之國外以億詞計數的語料庫(英語國家語料庫、美國當代英語語料庫),仍需擴大規模。并且我國現有的兒童語料庫語料比較單一,沒有全面性地整理出各類語料,缺乏豐富性。我們與國外相對比還是比較欠缺,并且關于語言群體方面的語料還沒有被系統性的收集和整理??梢园l現這個問題目前還比較嚴峻,但是如果能夠得到解決對于我國未來關于語料庫的進一步發展和完善都有著一定的優勢。

語料庫軟件處理方法包括語料庫語法標注、分詞、雙語平行語料庫的字句對齊以及各種研究需要的檢索工具等。對語料庫進行詳細的語法標注可以為語料庫研究提供豐富的信息,有助于語料庫語言學研究的進一步發展。雖然現在是網絡信息時代,但是由于技術問題目前我國關于語料庫語法標準還不能夠完全利用機器,很多時候依然需要人工來進行標注,自動化普及不是很高,而人工標注很容易會出現問題并且速度也慢。同時而現有的軟件自動分詞準確率不高,也需要人工加以糾正。操作復雜、價格昂貴的語料庫軟件也成為語料庫研究的又一個問題。因此,語料庫軟件處理技術的開發的問題也需要得到解決才行。

4.2研究領域發展不平衡

關于語料庫語言學的研究領域非常多,并且涉及到了方方面面,關于兒童語料庫方面的研究領域卻不多。反觀國外關于語料庫語言學研究和兒童語料庫研究已經逐漸成熟并且所概括的方面也要比我國更多,這就是差距。國外的研究通常會從言語和書面語共同研究,而我國的研究通常是基于書面語來進行的,關于口語方面的語料庫并不是很多。但是關于兒童的語料庫,口語研究應該是該語言研究的一大重點。畢竟言語首先是出現于口頭交流,慢慢才會延續成文字記載,由此可以看出來我國語料庫方面的研究領域發展極不平衡。

國外語料庫語言學發展已經從對語言現象本身的研究上升至與其他有關領域的跨學科研究,特別是與社會語言學(Beaugrande, 2008 ; Ander?son, 2008 )、認知語言學(Vukovic, 2007 )、計算機語言學(Orasanet al , 2007 )等學科的交叉研究。同時,在語料庫語言研究相對成熟之后,國外諸多學者已開始轉向語料庫的實用研究,即將語料庫應用于專業領域信息檢索(Braschler, 2004 ; Miangah & Nez- arat ,2010 )、評估語言作品(Deane & Quinlan ,2010 ; Shams ,2010; Islam & Rajon, 2010 )等這些前沿發展也是我國語料庫語言學研究之后將繼續的途徑。

4.3語言現象研究不夠深入

雖然目前國內關于語料庫語言學相關研究論文數量和期刊數量比較可觀。但是針對兒童語料庫的研究數量是比較的少。并且雖然國內語料庫語言學的研究數量也不是很多,只是他們通過利用語料庫所展現的一個語言現象來進行客觀的記錄,并沒有更深入去分析這種現象所產生的原因,以及會造成未來的影響,更不用說會對這些語言現象進行評價。大部分的文章所研究的都是比較常見的語言現象,而面對少見和罕見的語言現象卻幾乎沒有人去研究。那就更不用說關于兒童語料庫方面的分析了。所以我國語料庫目前發展的質量并非如同像利用“語料庫”為關鍵詞所搜索到的數量那樣龐大。關于語料庫方面的深入研究還需要進一步加大,并且關于其他方面的語料庫研究都需要進行分析和評價,這樣才能夠挖掘出其中的精髓。

5.結語

經過2002年到2020年這么多年的發展和研究,我國在兒童語料庫建設方面雖然取得了相當豐碩的研究成果,但是問題也隨之而來,如建立的語料庫還太少,語料庫涉及的研究領域發展不平衡,很多研究還不夠深入等。今后兒童語料庫語言學還需要語料庫軟件開發者和研究者不懈努力來進一步發展,開發出符合互聯網時代的語料庫處理軟件,這樣才使研究者地進行更細致、更方便、更深入的研究。

參考文獻:

[1]Leech, G. N. The state of the art in corpus linguistics [A ]. In K. Aijmer &B. Altenberg (eds. ). English Cor?pus Linguistics · Studies in Honor of Jan Svartvik [ C ]. Lon?don: Longman, 1991.8 - 19.

[2]Aijmer, K. &B. Altenberg. Advances in Corpus Linguistics [M ].北京:世界圖書出版公司,2009.

[3]Anderson, W. Corpus Linguistics in the UK: Resources for Sociolinguistic Research [ J ]. Language and Linguistics Compass, 2008,(2):113 - 125.

[4]Beaugrande R. Linguistics, Sociolinguistics, and Corpus Linguistics: Ideal Language versus Real Language [ J ]. Journal of Sociolinguistics, 2008 , (1 ) : 128 - 139.

[5]Braschler, M. &P. Schauble. Using Corpus-Based Ap?proaches in a System for Multilingual Information Retrieval [j ]. Information Retrieval, 2004, (3 ) :27 -39.

[6]Deane, P. &T. Quinlan. What automated analyses of cor?pora can tell us about students, writing skills [ J ]. Journal of Writing Research, 2010, (2 ) :151 - 177.

[7]Miangah, T. M. &A. Nezarat. A method for cross-lan?gua ge retrieval of chunks using monolingual and bilingual corpora [ J ]. International Journal of Computer Applica?tions, 2010.

[8]Orason, C. et al. Corpora for computational linguistics [J ]. Ilha Do Desterro: A Journal of English Language, Literature in English and Cultural Studies, 2007,52 (1 ): 65 - 102.

[9]Shams, R. et al. A corpus-based evaluation of a domain?specific text to knowledge mapping prototype [ J ]. Journal of Computers, 2010, (1): 69 - 80.

[10]蔣忠心. 新疆伊犁地區學前兒童學業語言發展研究[D].華東師范大學,2019.

[11]張義賓. 基于漢語兒童語料庫的語言障礙診斷系統研究[D].華東師范大學,2019.

[12]徐凱俐. 基于語料庫的3-6歲兒童有聲故事語言研究[D].上海師范大學,2018.

[13]顧萌萌. 基于語料庫的兒童動畫片詞匯研究[D].上海師范大學,2018.

[14]職路遙. 基于漢語兒童讀物編寫的漢語語料庫建設[D].廣東外語外貿大學,2018.

[15]石靜. 視覺學習在語言障礙兒童二語習得過程中的作用——以語料庫應用為例[J]. 英語教師,2017,17(20): 44-48.

[16]謝楠,張笛. 漢語兒童多模態口語語料庫建設研究[J]. 外語電化教學,2017(05):53-60.

[17]蘇晴. 中班角色游戲情境下幼兒口語語料的研究[D].鞍山師范學院,2017.

[18]姜新新. 平行語料庫在兒童文學翻譯研究中的應用[J]. 文教資料, 2019(26).

[19]冉吉意. 基于平行語料庫的中國兒童文學語言特征及其英譯研究[D].北京外國語大學,2017.

[20]古麗夏·阿克巴爾. 新疆哈薩克族兒童母語語言發展研究[D].陜西師范大學,2016.

[21]馬曉雷,陳穎芳. 基于共詞分析的語料庫語言學研究現狀分析(1971-2015)[J]. 語料庫語言學,2016,3(01):41 -54+116.

[22]杜昌. 從原型構式看詞類在句法結構中的分布[D].上海師范大學,2016.

[23]馬瀅穎,樊寧. 3-4歲兒童語言性別差異的研究——一項基于語料庫的研究[J]. 遵義師范學院學報,2015,17 (05):142-146.

[24]管瑋. 漢語自然會話中的轉述現象研究[D].浙江大學,2014.

[25]于洋. 基于語料庫的3-6歲兒童繪本翻譯語言研究[D].吉林大學,2014.

[26]付丹丹. 幼兒日常會話主題和場景研究[D].南京師范大學,2014.

[27]姚寒露. 五歲段漢語幼兒常用詞研究[D].南京師范大學,2014.

[28]張廷香. 基于語料庫的3-6歲漢語兒童詞匯研究[D].山東大學,2010.

[29]臧光亞. 基于語料庫的兒童文學翻譯語言研究[D].曲阜師范大學,2010.

[30]臧光亞. 基于語料庫的英譯漢兒童文學語言的歐化現象微探[J]. 語文學刊(外語教育與教學),2009(12):82- 84.

[31]劉穎. 漢語兒童早期語言發展個案研究[D].山東大學,2009.

[32]崔榮輝. 5-6歲兒童語言習得狀況的考察與研究[D].山東大學,2009.

注:此文章為2019年大學生創新創業訓練計劃項目——《重慶市學齡前兒童口語語料庫》(201910618006)階段性成果。

猜你喜歡
語料庫
語料庫輔助英美文學教學模式初探
可比語料庫的建立及翻譯教學研究
基于語料庫翻譯學的廣告翻譯平行語料庫問題研究
護理英語語料庫建設探索
如何利用語料庫語言學提高英語教學
淺談語料庫分類及用途
近5年語料庫應用于外語教學的研究綜述
國內外語料庫建設研究簡述
運用語料庫輔助高中英語寫作
關于“nothing succeeds without a strong will”的語料庫研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合