?

國際職場漢語口語能力測試體系的構建

2023-11-14 12:48吳偉平
語言戰略研究 2023年6期
關鍵詞:職場口語語境

吳偉平

(廣東外語外貿大學 外國語言學及應用語言學研究中心 廣東 廣州 510420)

提 要 “國際職場漢語口語能力測試體系”是“中文+職業”熱潮下國際中文教育界和產業界攜手研發的測試工具,是漢語二語教學中語用為綱教學與測試模式在產業界的落地成果。之所以研發這一測試,是因為職場中的語言能力最終只能在具體的語境中體現,而該測試正是在職場語境中直接評估語言能力?,F階段該測試體系以口語測試中的開放型題目為題庫基礎,包括試用中的通用題庫和建設中的專用題庫兩部分。該測試體系將職場漢語口語能力分為6 級,前3 級為職場通用,后3 級為職場專用。評核員根據考生口語產出,對其口語能力的評判直接影響該測試的效度和信度,評核員培訓的最終目的是把評核標準內化,并根據這些標準對每一位考生的口語水平做出一致和穩定的判斷。該體系有語別化測試版本,用考生的母語解釋考試要求,要求考生根據測試要求用漢語回答,以此保證測試效度。該測試對語境、功能和內容這3 個維度的關注,可以引導中文二語學習者注重語境在人際交流中的關鍵作用,培養漢語語感,使其漢語口語產出在“結構正確”的基礎上,盡快過渡到中文母語者認同的“文化得體”。

近年來,“中文①從“對外漢語教學”到“國際中文教育”,這一領域因為學科名稱本身的變化,給相關研究和討論帶來了諸多困惑和不便。本文根據目前的趨勢,用“中文”統指書面語和口語,但在提及原有名稱、具體成果,或需要強調口語的時候用“漢語”。+職業”成為國際中文教育的研究熱點,并從理論探討轉而付諸實踐,包括各種職業漢語課程和不同類型的大型測試,比如國家職業漢語能力測試和醫學漢語水平考試(MCT)。本文介紹的職場漢語口語能力測試體系,是學界(國際中文教育)和業界(科技產業園)攜手開發的階段性科研成果之一。文中以該成果研發過程中的問題為導向,探討如何通過職場語言能力測試的引導,幫助職場漢語二語使用者更好地關注語境、功能和內容這3 個維度在人際交流中的不同作用,更自覺地在漢語使用的過程中培養語感,使其口語產出在“結構正確”的基礎上,盡快過渡到母語者所認同的“文化得體”。人際交流是否得體是語用學研究領域一直關注的問題。如何讓“得體性”成為語言測試體系的一部分并納入評核框架,是所有大型測試工具研發的難點。鑒于漢語二語學習者口語產出的語用能力測試并無先例可循,本文的討論以實例為基礎,聚焦測試體系構建的理念、題目的分類和題庫的建設、評核的等級系統、評核員的培訓和標準的落實,以及語別化測試的利弊。因為項目仍在研發試用階段,文中的觀點和建議主要目的是開拓思路,為這一領域的發展添磚加瓦,或許也可以成為同一方向研發團隊的他山之石。

一、引言:國際中文教育的新天地

國際中文教育近年來圍繞“中文+職業”這一理念有很多不同的探討。不同的學者從不同的層面和角度討論如何讓語言學習走出校門、走進職場,探索語言技能和職業技能的獲得之間到底如何互補。有學者從“推動國際中文教育和職業教育融合發展”及“促進中外民心相通”的角度解讀這一問題(教育項目研究組2021)。有學者認為,我們要立足國際中文教育和職業教育基本屬性,以海外需求為前提、以中文教學為基礎,推進“中文+職業技能”課程標準、教學標準、職業中文水平考試研發等方面的創新發展。②該內容引用自于天琪2021 年9 月26 日中外語言交流合作中心“國際職業課程建設研討會”主旨發言。有學者開始研究語言的經濟屬性,呼吁“中文+職業教育標準”走出去,認為中文可以借中國走向世界的大勢“跟著中國產品或工程走出去”,也可以“帶著中國產品或工程走出去”。③該內容引用自李宇明2021 年9 月27 日國際中文教育勵學大講堂第一講“語言的經濟屬性與國際中文教育”主題講座。

新的領域往往帶來新的問題和挑戰,如何評估職場漢語二語使用者的語言能力就是其中之一。本文介紹的測試體系,是探索漢語二語教學中語用為綱教學與測試模式(吳偉平,馮勝利2020)如何在業界落地的嘗試。語用能力測試涉及對語言能力的定位,對語言與文化之間關系的深入研究,對語言任務的分類分級以及對交際能力的量化,歷來是測試領域十分關注的問題(Hymes 1972;Bachman &Palmer 1996)。國際職場漢語口語能力測試體系的研發,首要的是必須厘清“職場漢語”這一概念。

首先,職場漢語是漢語的一部分。跟日常漢語相比,它在內容上或許有某些專屬特征,但在語言形式上并沒有本質上的不同。沿用多年來大家耳熟能詳的ESP(特定領域英語),我們可以把職場漢語歸入CSP(特定領域漢語)一類。其次,在CSP 這把大傘之下,我們還必須區分職場漢語和職業漢語。雖然有人覺得這兩者是一回事,而且常?;煊?,但從測試研發的角度看,它們之間有很大的不同。前者的重點是“漢語”,側重在工作場景中常見的語言交流;后者的重點是“職業”,關注的是某一特定的職業所需要用到的某些特別的語言。在構建語用為綱測試體系時,我們采用了“職場”,因為“職業”太多太細①《中華人民共和國職業分類大典》對職業進行了分類,包含8 大類、75 中類、434 小類,共計1481 種不同的職業。,把測試與具體職業掛鉤的話,在實際生活中很難落到實處。

我們可以舉一個例子來說明這一問題。高鐵走出國門,相關的語言服務必須包括這一行業的口語能力測試。用“職場漢語”的話,我們的重點是了解從事軌道交通行業的工程人員能否聽懂一些科普性的高鐵知識,能否根據需要用漢語進行一些跟工作相關的溝通交流。用“職業漢語”的話,這個重點就會發生變化,我們的目標就會包括用漢語進行與某個具體職業相關的技術性探討,需要用到與職業相關的專業知識。比如跟列車空氣動力學相關的職業,跟機車車輛震動有關的專業詞語可細分為橫向震動、垂向震動、擺滾震動、浮沉震動等,這些詞語和相關專業知識可以在高鐵“職業漢語”的教學和測試中出現,但并不是“職場漢語”的目標。

在研發過程中,另一個必須厘清的問題是考語言還是考專業。雖然研發團隊從一開始就有了職場漢語測試考的是“語言能力”,而不是專業知識和業務能力的共識,但一碰到具體問題,就發現事情沒有那么簡單。因為在不同領域中,什么算“專業知識”有時候是一個很難說清楚的問題。世界上有很多為某種特定目標而設計的語言測試(Test for Specific Purposes)(Douglas 2000),比如不同地區的教師、導游、醫護人員,各個特定行業從業人員(會計、廚師、律師……)的語言資格考試。這些測試當然會涉及一定程度的專業知識,比起一般的語言測試,這些語言能力測試可能“專業”了一點,但這種考試絕對不是該行業的專業資格考試。簡單地說,任何只通過“中醫漢語”考試的人,顯然是沒有資格當中醫的,因為我們不知道這個人是否擁有中醫的專業資格;然而一個通過了“中醫資格考試”的外國人,假如沒有通過“中醫漢語”的考試,恐怕也很難在中國掛牌行醫。

上面的這種理解,可以在測試研發的過程中幫助我們排除干擾,在每一個具體題目上為測試內容守好底線。在職場漢語口語能力測試中,一個題目在內容上是否合適,我們可以把“語言知識”和“專業知識”看成一條連線的兩端,通過題目所涉及的內容在這條連線上的位置來判斷。問一個考生“皮草加工過程中要注意哪些問題”,或“什么是核電站的安全防護措施”,這種話題涉及專業知識,就算是沒有語言問題的母語者也難以回答,在“語言知識—專業知識”的連線上,顯然太靠近專業知識的一端,所以不適合作為職場漢語測試的題目。

二、國際職場漢語口語能力測試體系構建的理念

構建國際職場漢語口語能力測試體系,是國際中文教育“產品化思維”(崔希亮2023)的落地嘗試之一,可以從必要性和科學性兩個方面討論。在國際中文教育領域,我們對外已經有了漢語水平考試(HSK),對內有普通話水平測試(PSC),還有以海外華人為服務對象的華文測試(王漢衛,等2023),為什么還要研發為職場服務的語言能力測試呢?從必要性上來看,是因為在職場我們更需要用直接考試來評估語言能力,而不是用間接考試來推斷語言能力。舉例來講,我們想了解的是一個人能用不同的建筑材料建成什么樣的房子,而不是看他的倉庫里有什么材料。沒有材料就沒有房子,但有材料卻不一定就有房子,這就是直接考試和間接考試的區別。職場漢語口語能力測試體系要求考生在測試中完成職場常見的語言任務,全卷都是直接考試的題型,直接對應試者的口語產出進行評估,并根據評核標準判斷其口語能力,而不是通過應試者對語言知識的理解來推斷其口語能力。必要性的另一方面,源于職場言語行為對具體語境的要求。一個人在實際工作中的語言能力,特別是言語行為的得體性,最終只能在具體的語境中體現。語用為綱教學模式最重要的理念之一,就是交際中的口語產出離不開語境,把這一理念用于測試,意味著語境因素在試卷構成和評核機制中都必須有一席之地,而這恰恰是目前所有大型測試所欠缺的。為了與時俱進,我們在研發面向語言教育測試產品的基礎上,有必要盡快研發面向市場的國際中文教育資源(趙楊,萬眾2021)。

這種做法是否科學呢?我們可以結合具體的題型回答這一問題。測試中,常用的題型源于我們的日常生活,是我們每天都可能碰到的語言任務。例1 中的問題對職場中的每一個人來說都不陌生:

例1

(1)你為什么對這個工作感興趣?

(2)跟其他申請人相比,你有什么優勢?

(3)假如你成功應聘,你會如何開展工作?

在實際生活中,例1 的每一個問題都有與之相關的語境?;卮鹑魏我粋€問題,都是在特定的語境中完成特定的語言任務。測試的科學性可以從語言任務本身的真實程度和完成程度兩個方面討論。

先看真實程度。測試中的一切語境雖然都在求真,但世界上一切“真實”都是相對而言。實際上,在所有的測試中,任何人能做到的最多只能是“仿真”,而不是絕對的“真實”(Wu & Stansfield 2001)。假如我們考慮心理因素,則所有仿真模擬口語考試中的語境都是假的。最明顯的就是考試中為了“仿真”而生造出來的“角色扮演”??荚囍?,幾十分鐘內讓考生又當游客(抱怨某種現象),又當導游(介紹某個景點),又當經理(處理某個投訴);上一刻還對老板懇求,下一刻就對下屬做指示;才當了市民給市長提建議,轉眼就成了市長給市民描述城市規劃遠景。在按照語境要求做這一切的同時,考生心里其實很清楚自己就是一個考生,除非是專業演員,幾乎沒有考生能在幾秒鐘內真正進入狀態,按照測試要求演好自己的角色。在角色轉換如此頻繁,心理負擔如此沉重的情形下,考生所提供的語料有多“真實”,的確很難說。說到底,我們通過考試所得到的也只是一個參照系數,我們所做的一切努力,包括在口語測試中帶入語境,只不過是想縮小這個參照系數與現實的距離而已。用于測試的語言任務的真實程度與測試本身的科學性成正比,必須指出的是,假如連模擬語境都沒有,那就回到了“裸考”年代(吳偉平2014),測試的評核標準也就無法包容語境因素。

再看完成程度。怎樣才算“完成任務”涉及人的主觀判斷,對主觀判斷的質疑往往帶來對科學性的懷疑。職場口語能力測試由源于生活和工作中的語言任務組成,評核員必須做出的第一個判斷就是該考生“是否完成任務”。每個考生都有自己說話的風格和習慣,有人說話深而窄,有人淺而寬,可以說千人千面,各有千秋。實際上這是一個點與面的問題,在評核中不能簡單粗暴地用一個“正確答案”排除其他可能。以旅游行業的測試為例,一個講香港旅游景點的題目,有的考生只講一點,但力求講深講透;也有考生喜歡包羅萬象,但點到即止或一句帶過。這兩種不同的風格會給不少評核者帶來困擾,使其難以進行判斷。其實,題目的設計目的,是提供一個說話的平臺讓學習者充分表現自己的語言才能,只要考生言之有物,不管走的是“窄道”還是“寬道”,都可以殊途同歸。充分理解測試的設計目的,不要把完成任務變成非此即彼的“對錯”選擇,是理解和接受測試體系科學性的關鍵。

三、國際職場漢語口語能力測試體系的題目系統和題庫建設

職場漢語口語能力的試題側重語言在實際場景中的應用,其題目跟普通的語言考試有所不同。測試題目是完成測試目標的手段之一,所有不同的題型,從測試學的角度可以粗分為側重能力的直接考試(比如廚藝考試中讓廚師直接做菜)和側重知識的間接考試(比如讓廚師寫出菜譜)。在語言能力測試中,前者以開放性問答題和演講題為代表,最能考出學生的實際說話能力,是直接考試的典型題型;后者的典型題型是多項選擇題。從實用的角度看,考試的方法無所謂好壞,能達到目的就是好方法??谡Z測試中的開放型題目留給考生自由發揮的空間,要求考生根據實際(或模擬)語境回答問題或完成語言任務,是評估考生語言交際能力的高效度題型(吳偉平2008)。所有開放性題目從語言功能的難度、語境的分類和內容深廣度這3 方面可以自成體系,研發團隊根據這一共識,把這種聚焦產出的題型(類似于書面測試的作文題)作為職場漢語口語能力測試體系的題庫基礎。

職場漢語口語能力測試體系的題庫建設,按設計藍圖,在職場通用部分把所有題目分成3 個級別,結合語用為綱的原則和職場的特點,用三維理念(語境、功能、內容)把每個題目打造成類似于生活中常見的語言任務。在語境和功能相對穩定的前提下,通過內容的變化,創建了涵蓋職場語言運用代表性場景的職場通用大題庫。跟特定專業有比較密切聯系的題目,則按照職場本身的分類分別構建職場專用小題庫。每一個題目其實就是生活中可能出現的語言任務,或者說,題庫就是職場中的“語言任務庫”?,F階段職場漢語口語能力測試體系題庫包括試用中的通用題庫和建設中的專用題庫,簡單介紹如下。

(一)職場通用大題庫

低端的中級題目:本級題目包括圖片題和非圖片題,后者即文字題。圖片題有3 個相對簡單的語言功能,30 個與職場相關的語言任務和圖片;文字題有7 個常見的語言功能,70 個職場通用、相對簡單的語言任務。兩部分題目的共同點是語境屬于非正式場合。

高端的優級題目:本級題目包括10 個高端語言使用者常見的語言功能,由這些功能衍生而來的100 個職場相關的語言任務,包括正式場合的會議發言、業績報告、遠景規劃、介紹或致謝。其內容在不同的職場中可以有所不同,考生在回答這一類問題時往往會用到一些常見的、科普性的專門詞語。

居中的高級題目:這一部分的題目在難度上處于低端和高端之間,是功能最多、數量最大、日常生活中最常用的語言任務。在正常情況下,這是職場語言使用者最經常碰到的任務(整個題庫呈中間大、兩頭小的橄欖型分布),包括15 個常見的語言功能和由這些功能衍生而來的300 個職場相關的語言任務。這些語言功能與不同的內容和語境相結合,產生了職場中常見的語言任務,其場景相對正式,多見于工作或商業來往之中,見例2。

例2

中文題目介紹(在語別化測試模式中,這一部分只供研發人員和評核人員參考,考生看不到):網絡直播賣貨是當下流行的市場銷售手段,你們公司決定采用這種新方式推廣銷售產品。今天公司領導層召開部門領導會議,討論如何進行網絡直播賣貨,會議上大家圍繞著“請網紅做直播好還是公司高層領導親自直播好”這一問題展開了討論。作為市場部的負責人,請你談談這兩種做法的利弊。

測試中考生聽到和看到的題目(以英語背景學生為例):Selling goods via live webcast is a popular marketing method at the moment, and your company has decided to use this new method to promote and sell products. Today, the company senior members are having a meeting attended by department heads to discuss how to conduct live webcast sales. At the meeting, the discussion centers around a key question: “Is it better for the Internet celebrities to do the live webcast, or the company’s senior leaders to do it in person?” As the person in charge of the marketing department, please explain to meeting participants the advantages and disadvantages of the two respectively.

(二)職場專用題庫

這一部分的題目因行業而異,按設計藍圖,每個行業(比如軌道交通)有一個題庫,庫中的題目按功能分15 小類,每類有10 個不同的任務,每次組卷只隨機從這一題庫中抽取2 題。為了減少隨機抽樣時某道題目重復出現的概率,我們按技術部門的建議把每個專用題庫中的題目總數保持在150 個左右。在內容上,這些題目與該行業知識和技能的聯系較為密切,這是職場語言考試的特點之一,因為許多題目在普通口語考試中一般不會出現??忌诨卮饡r往往需要用到一些常見的、科普性的專門詞語和該行業的專用詞語。從語言功能和語境這兩個維度看,這一部分與通用題庫的優級題目類似。

四、國際職場漢語口語能力測試體系的等級系統

關于語言等級的劃分,不同的測試有不同的標準和側重。先說等級的多寡。普通話水平測試有三級六等,香港考試評核局的教師語文能力評核有5 級,美國政府機構語言等級通用的有6 級(0 ~5),美國學術界多用美國外語教學委員會(ACTFL)的4 級劃分,《歐洲語言共同參考框架》(CEFR)從A1 到C2,由低到高分6 級。再說側重點。普通話水平測試和其他類似的水平測試都是知識和能力并重,但以交際為目的,屬于直接考試的題型(如開放型問答題),在整個測試中權重較低。相比之下,口語面試(OPI)、模擬口語面試(SOPI),還有在模擬口語面試基礎上研發的計算機電腦化口語測試(COPA)(吳偉平2008),這類測試的側重點都是考生實際運用語言的能力。試卷中,形式上沒有多項選擇題,內容上也沒有專門以語法、語音或特定詞匯為“考點”的題目。

必須說明的是,標準參照測試的等級設定或修改必須注重考生的群體特征和所在地區的特點。比如ACTFL 以前的四級九等其實源于美國政府機構通用的6 級,但因為考試的主要對象是美國的大學生,比起政府根據外交和軍事需要專門培養的語言人才,這些人的語言水平明顯偏低,所以就把政府級別的低等級(0 ~3)拉長細化,分成初、中、高、優4 級,在初級和中級這兩級中又分別細分出低、中、高3 等,這樣就可再次甄別這一龐大人群的語言水平。

如前文所說,職場漢語能力測試本質上是用于專門用途的測試工具,強調語用為綱,主要的服務對象是在國內外不同的職場中需要用漢語進行溝通的專業人員,所以在制定標準時參考了北美(ACTFL)和歐洲(CEFR)的兩個測試框架等級分類背后的基本概念,并結合國內普通話水平測試的等級進行了劃分。整個體系一共分為6 級,前3 級為職場通用,每級再分甲、乙兩等,后3 級為職場專用,不再細分。表1 對各級能力和語言特征進行了綱領性的描述。其中,N、I、A、S 分別代表北美體系中的4 個能力等級:Novice /初級、Intermediate /中級、Advanced/高級、Superior /優級。2021年開始實施的《國際中文教育中文水平等級標準》(GF 0025—2021)是所有漢語測試包括本測試體系的重要參照,已運作多年的兩個大型普通話水平測試(普通話水平測試和漢語水平考試)雖然并非專門用途測試,但其口語能力標準關注的語言特征實際上囊括了漢語口語的特點,也是本測試體系在制定標準時的重要參照。既然本測試是國內學界和業界根據職場人士需要而合作研發,我們在制定標準的時候也參照了這方面的相關教材,比如各種零散的“商務漢語”教材和比較成體系的“國際職場漢語課程體系”(6 + N①這里6 指職場通用的教材1 ~6 冊,N 指任意行業的職場,代指旅游、家政、高鐵、烹飪或其他任何一個需要職場語言培訓的行業(張博2021)。)。目前處于試用階段的測試體系等級中,用T(通用)代表職場通用等級,用Z(專用)代表職場專用等級。

表1 職場漢語能力測試等級與語言能力描述(口語)

五、國際職場漢語口語能力測試的標準把握與評核員培訓

如何根據考生口語產出準確判斷其口語能力,關系到國際職場漢語口語能力測試體系的效度和信度,在測試的具體運作中,包括了兩個方面的內容。一是該測試體系的評核標準本身;二是如何運用標準進行評核的評核團隊素質,評核員培訓的主要目標就是提高評核團隊的素質,包括個體穩定性和準確性,還有團隊成員之間的配合默契程度。在培訓手段和方法方面,我們參照題型相同的COPA 的培訓經驗,制定了如下指引。

首先,評核員培訓的最終目的,是讓他們把評核標準內化,并根據這些標準對每一位考生的口語水平做出一致和穩定的判斷?!耙恢隆敝傅氖侨魏螘r候都用同一把尺子(評核標準)來衡量不同考生的語料,而不是像一般科目考試那樣,用不同考生的語料互為參照,這也是“標準參照”測試模式的原則;“穩定”的重點是把握不同等級之間的特征,評核員的個人風格或許有“嚴”“寬”之分,但在同樣的標準下務必一嚴皆嚴,一寬皆寬,這樣才能保證測試的信度。

其次,評核員的資格來自實踐。培訓只是通過講解、舉例、練習和現場點評讓評核員了解操作方法,最后是否真正做到嚴格把關和客觀公正,靠的是他們自己的不斷練習和經驗積累。在評核員培訓過程中,需要強調的是“語言觀、測試理念和具體操作”的重要性,培養他們在這3 方面的共識(吳偉平2008)。每個評核員都會碰到自己獨特的問題,但在多年的培訓實踐中我們發現,有一些共性的問題可以提出來給參加培訓的學員參考。評核員對重點把握不到位的現象,最突出的表現是有時前后不一、不夠一致,有時寬嚴交替、不夠穩定,其具體原因有以下幾種。

第一,拘泥個體,忘記整體。參加評核培訓的老師,除極個別外,往往都沒有參與過類似口語水平測試研發的全過程。因為對全卷中每道題所起的作用并不是十分了解,所以看到有考生明明在個別題目中表現不好,可最后總成績還是不錯時,就會對題目甚至測試本身產生疑問。代表性的問題是:“這個考生這道題答得這么差,怎么還有可能是高級?”其實大部分模擬口語能力測試的理念(包括OPI,SOPI,COPA 和職場漢語口語能力測試體系)是總體大于個體。一個水平再好的人,包括母語者,在說話時也不可能每句話都說得又正確又得體。這也是為什么考生最后得到的能力等級是來自總分統計公式①總分統計公式源于20 世紀80 年代的SOPI 研發,是多年來通過實踐總結出來的一套比較嚴謹的程序,其理念、運作方式和利弊需專文另論。,而不是所有題目成績的總和。

第二,忽略考生做得好的地方。評核員隊伍的主體是一線教師,老師的本能之一是改錯,但培訓中有人常常會抓住一個錯誤不放,這是水平測試評核的大忌??匆粋€人的語言能力,重點是看這個人能做什么,而不是不能做什么,這一點測試界雖早有共識,到了老師這里就因為平時的習慣性做法而難以落實。評核員應該關注的重點不是學生的錯誤,而是學習者“能做的”事情。深入了解CEFR 的“Can-do list”和相關研究(方緒軍,等2011),有助于提醒大家時刻注意這一水平測試的根本理念。

第三,不知道怎樣處理語言形式和內容之間的矛盾。負責口語測試評核的老師大部分來自語言教學第一線,對語音語法的準確性把握非常到位。相比之下,對考生回答中的內容和信息量就不夠敏感,在聆聽的過程中不善于主動、積極、準確地判斷語言形式之外的重要因素。在日常的人際交流中,內容的權重遠高于形式,學習者口語產出中內容的多樣性,信息量的大小,篇章結構是否與該題的語言功能相匹配(比如同是語段,描述與勸說顯然有不同的篇章結構,包括開頭、中間和結尾),所用語言是否得體(按照人物之間的關系、場合的正式程度和內容的特點,以及這三者之間的相互制約,使用恰當的詞語和語體表達意思),等等,都是評核員應該注意的問題。

最后必須提到的,是來自評核員自身習慣和理念的干擾。多年的能力測試評核員培訓經驗證明,不少教師仍然堅信當面對話是測試考生口語能力的唯一法寶,對人機對話或其他測試模式的信度、效度和可行性所知甚少或知而不信。多年來,測試界判斷測試好壞的3 個標準之一就是“可行性”(practicality)(Harrison 1983),任何一對一、二對一,甚至三對一的口語測試模式恐怕都比較難達到這一標準。為了探索口語測試的不同模式,不少學者一直在從不同的方面做不同的研究和嘗試。其實在測試領域早已有了專門比較面試和人機對話模式的模擬面試之間關系的研究,其中也論及單向取樣與對話之間的區別,研究結果都說明這兩種測試模式有著極高的相關系數(Clark 1988;Ke 1994;Kuo & Jiang 1997;熊敦禮,等2002),評核員在認識上如果更開放一些,來自內心的干擾就會少一些,培訓的效果也就會好一些。

六、國際職場漢語口語能力測試的語別化版本

語別化有時候也稱國別化,指專門為某一個特定的語言文化群體(或國家)設計的測試體系。每種語言都有自己的特點,針對特定群體而設計的測試必須有的放矢,考慮到其母語的特點和使用語言的習慣。對學習者和應試者來說,這種測試因為針對來自母語的正負遷移,少了來自“通用測試”常見的困擾,往往會起到事半功倍的效果。語別化測試的特點之一是考試的雙語模式,以人機對話模式的漢語口語測試為例,為考生解釋考試要求的工作語言是考生的母語(比如英美地區的考生用英語,泰國的考生用泰語),要求考生根據測試要求用漢語回答。這種雙語模式的應用有以下幾個理由。

其一,測試領域本身的發展和變化。不同學者對語言測試的發展有不同的分類法,20 世紀80 年代開始逐漸形成的共識,是測試本身的理念和重點已經產生了明顯的變化(李筱菊2001)。以前人們認為語言考試就是考知識(語音、語法、詞匯等語言結構),后來認為是考技能(聽說讀寫),現在則越來越傾向于是考能力(語言在不同語境中的綜合運用)。比起結構為綱的考題,語用為綱的題目和任務往往必須提供語境(人物和場合)、語言功能(從簡單到復雜)和內容(從具體到抽象)3 個維度的信息??忌仨毘浞掷斫鉁y試的要求,按要求完成語言任務是測試效度的保證。由于題目本身的要求無法用幾個簡單的詞組或一兩句簡單的話表達清楚,只能用考生的母語作為測試的工作語言。

其二,語言水平測試所覆蓋的水平等級。假如用同一試卷涵蓋從初級到高級的所有考生,以不同國別學生的母語為工作語言才能有效地避免初級學生聽不懂題目、看不懂題意的情形。在不考慮資源和研發成本等因素的情況下,也可以針對不同水平的考生開發不同的試卷,比如用3 個(初級、中級和高級)或更多的水平測試取代一個涵蓋全部水平等級的試卷。在這種情形下,高級的試卷不用學生的母語很自然,初級的試卷用學生的母語也很合理。

其三,漢字本身的難度。為了讓考生充分理解題目要求,聽說方面的水平測試除了語音指令還有書面指引。大部分漢語二語學習者的讀寫水平,一般來說遠低于其聽說水平。以聽力測試為例,假如題目要求不用學生的母語,初級考生出錯的原因可能并不是題目本身,而是聽不懂題目要求??谡Z也一樣,考生說不好的原因可能是口語水平低,也可能是聽不懂或看不懂題目,不知道自己要做什么,如何做。為了保證測試效度,不用考生母語解釋題意時,設計者只能盡量使用簡單的詞語和語法。這種做法在結構為綱、特別是多項選擇題的標準化測試時代或許還問題不大,但顯然無法滿足能力測試的要求。

下面舉例說明職場漢語能力測試語別化版本中的具體操作和相關問題,見例3。

例3

不同語別化版本中的同一題目

P4C /粵語版本

你有一個廈門來的朋友很愛看書。他想知道你的喜好,請告訴他你喜歡看哪類書,有哪些書是你覺得值得看的。請你想一想,聽完普通話提示后才開始回答。

P4E /英語版本

You have a friend from Xiamen who likes reading a lot. He is curious about what you like to read in general. Please tell him what types of book you like and what books are worth reading. Please think about it and answer after listening to the prompt in Mandarin.

P4J /日語版本

あなたのアモイから來た友人は読書がとても好きです。彼はあなたの好みを知りたいと思っています。あなたの好きな本のタイプ、おすすめの本について彼に話してください。北京語のヒントを聞き終えてから回答を始めてください。

P4K /韓語版本

?? ???? ? ??? ??? ?? ???. ?? ??? ??? ?? ?????.??? ??? ?? ??? ????,??? ?? ?? ???? ??? ???. ?????? ??? ? ?? ??? ????? ????.

普通話提示(所有版本通用):

你呢?你喜歡看些什么書呢?

這一類題目在不同的語別化版本中,其內容和語境因素方面并沒有什么不同,在不同的題庫中也擁有類似的代碼,只不過不同語種的考生看到和聽到的都是用自己的母語呈現的題目。不管用的是什么版本,每次測試都由隨機組卷程序,按照題目的代碼和測試要求為每一位考生生成試卷,所以不同母語背景的考生所面對的試卷在形式和難度上完全一致。必須注意的是,這種語言不同、形式和內容一致的題目只是語別化版本的一種題型,另一種題型是保持語境和功能的一致性,又允許內容上有所不同。也就是說,3 個因素中有兩個定量一個變量,既保證了內容這個變量的多樣性,又避免因為變量太多而失控。

七、結 語

語言生活研究“是中國社會語言學的特色”(郭熙,祝曉宏2016),語用為綱的測試理念,就是社會語言學在測試領域的應用。語用為綱職場漢語口語能力測試體系的研發,其初心是關注生活中的語言問題,其焦點是在職場得體使用中文的相關問題。語言生活的3 個維度中,第一個就是“運用”(李宇明2016)。不管是學習還是研究,主要目的之一還是為了在生活中更好地運用語言。當今世界上使用中文的龐大人群中,除了母語者,還有大量漢語二語學習者,他們也需要在不同的領域用中文解決工作上和生活上的問題,包括職場中的人際交流問題。這些人在中文運用中所面對的很多問題,都是我們必須關注的問題(胡建剛,賈益民2022)。

在測試體系的構建和研發過程中,我們發現漢語二語學習者面對的很多問題尚未進入研究者的視野,比如語言運用本身作為一個“語用體系”該如何分類,這一體系有幾個層次;什么是可以用于教學和測試的基本單位,職場的口語能力和一般的漢語口語能力有什么異同;得體性的關鍵因素是語體,但語體本身如何分類分級;等等。我們相信,在中國經濟引領世界經濟的時代,漢語的語言產業也將蓄勢待發。面對“人工語言智能+語言產業”的時代(陳鵬2017),我們需要更多為語言產業護航的應用研究,但在上述很多基礎研究沒有到位的情況下,任何應用研究都將步履蹣跚。從這個角度看,筆者認同我們的語言研究還“遠遠跟不上時代和科技發展的需要”(陸儉明2021)。職場漢語口語能力評估是測試領域關于語言能力測試研究的一部分,雖然這一研究的關注點已經從“被試者對語言本體結構知識的掌握”轉移到“對在特定場景中實際交際能力的強調”(楊旸,趙守輝2016),但如何把這種“強調”變成可操作的測試手段,我們仍在探索之中?,F在要做的,是告別“強調”,認認真真地嘗試把關注點變成可操作的“落地”產品。

“職場漢語口語能力測試體系”是學界和業界攜手開發的成果,在合作中,我們發現雙方必須在不斷磨合中增進彼此的了解,在合作中找出彼此的底線,才能順利前行。學界的長處是關心原理和原則、追求嚴謹體系和對科研本身的執著,業界的特點是關注成本和效益、注重時間效應和對立竿見影成果的期待,這兩者之間的矛盾常常成為合作過程中的道道溝坎。我們知道從階段性成果到整個體系的落地和運作還有相當長的一段路,但堅信學界和業界攜手同行,將為國際中文教育的研究走出一條新路。

猜你喜歡
職場口語語境
職場Z世代為何這么跩
職場劇需要去除虛偽與虛榮
職場充電,停還是行?
酒中的口語詩
提高口語Level 讓你語出驚人
口語對對碰
語言學習中語境化的輸入與輸出
跟蹤導練(三)2
論幽默語境中的預設觸發語
BUM-A-RIDE GUIDE 自助游必備搭車口語
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合