?

LISREL結構方程模型在語言研究中的應用?

2023-01-30 02:47劉文慧
外語與翻譯 2022年4期
關鍵詞:英語口語外語方程

劉文慧

中南林業科技大學

周世界

大連海事大學

【提 要】結構方程模型是融合路徑分析、多元回歸分析和因素分析的多元統計方法,廣泛用于心理學、社會學、教育學等多學科領域,但在國內語言研究領域應用不足。LISREL是一款主流結構方程建模分析軟件,具有功能強、精確度高的特征。本文在介紹結構方程建模原理和特征基礎上,通過LISREL9.2分析語言測試實例,介紹LISREL結構方程模型在語言研究驗證性因子分析、全模型分析、高階因子分析和多組驗證性因子分析中的具體應用,證明LISREL結構方程模型能夠為語言研究中不能直接測量的潛變量提供更精確的分析。

1 引言

在很多情況下,對教育、心理、社會等學科的研究涉及的變量(如自信、個性等)關系比較復雜,屬于不能直接測量(候杰泰、溫忠麟、成子娟2004)的潛在變量。對于這類變量的多元統計,結構方程模型(structural equationmodel,簡稱SEM)是一種方興未艾的統計方法(Kline2005)。結構方程模型可以同時處理多個潛變量及其相互關系,并把變量測量誤差計算在內,逐漸成為公認的分析潛變量間關系最強有力的現代統計方法,是行為心理學和教育學等領域常用的分析方法之一(Song&Lee2012;吳瑞林2013)。

目前,結構方程模型在語言研究中的應用主要涉及對語言能力、學習動機、學習態度等抽象概念和多個因素之間關系的研究。國外基于結構方程模型在二語習得等語言研究方面已經取得長足發展,如對語言能力測量(如Schoonen2005;Phakiti2008;Wallace&Lee2020)、語言習得個體差異(如Lee2005;Woodrow2006;Lee2020)和母語遷移影響(如Zhang2016;Maier,Bohlann&Palacios2016;Kimetal.2020)等研究。國內外語學界有關結構方程模型的研究雖然已經起步,但尚未充分展開。根據范勁松、任偉(2017)的調查結果,1999—2015年,國內12種外語類核心期刊發表的有關結構方程模型的論文只有52篇,其中實證性論文占90.4%(秦曉晴、文秋芳2002;彭劍娥2015);2016—2022年間,國內12種外語類核心期刊發表的有關結構方程模型的論文36篇,其中實證性論文占95%(如鄭春萍、王麗麗2020;董連棋、劉梅華2022)。呈現上升趨勢的數據說明國內語言學界越來越認識到結構方程模型的優勢,但較小的數據量表明結構方程模型在語言研究中的應用仍然滯后。

LISREL(Linear Structural Relations)是 由J?reskog(1979)開發并一直流行至今的專業結構方程建模分析軟件,該軟件在操作上很好地詮釋了結構方程模型原理,分析結果精確度高,適用于處理語言教學中常見的基于連續變量的復雜調查數據及基于序數和連續變量的簡單隨機樣本數據。但截至目前,國內語言學界只有王立非、鮑貴(2003)、王立非(2007)和韓寶成(2006)介紹了LISREL結構方程模型三種建模功能及其在語言測試領域的應用,但基本沒有涉及具體應用方法?;诋斍暗难芯楷F狀,本文在闡述結構方程模型原理基礎上,采用LISREL9.2軟件,通過語言測試實例解析結構方程模型驗證性因子分析、全模型分析、高階因子分析和多組驗證性因子分析的在語言研究中的具體應用,證明LISREL結構方程模型能夠為語言研究提供更精確的統計分析。

2 結構方程模型原理

結構方程模型是根據變量的協方差矩陣或相關矩陣,通過多輪迭代計算樣本矩陣與假設再生矩陣間的擬合指數,分析變量之間的關系。結構方程模型由測量模型(measurementmodel)和結構模型(structuremodel)兩部分構成,測量模型處理觀測變量(如測驗分數、學習時間等)與潛變量(如語言能力、學習興趣等)間的關系,結構模型主要處理潛變量間的關系。測量模型通常如公式(1)、(2)所示:

x和y分別表示外源變量和內生變量的觀測變量,ξ和η表示外源潛變量和內生潛變量,Λx和Λy表示x和y的因子負荷矩陣,δ和ε表示x和y的誤差項。結構模型的因果關系通常如公式(3)所示:

B表示內生潛變量間的關系,Γ表示外源潛變量對內生潛變量的影響,ζ表示結構方程的殘差項。

結構方程模型分析一般包括模型建構、模型擬合、模型評估和模型修正四個過程:模型構建是根據相關專業理論和研究構建一個或幾個結構方程模型,設定觀測變量與潛變量間關系、潛變量間關系或限定因子參數值;模型擬合是用已構建的模型分析樣本數據,找到樣本協方差矩陣與模型隱含的協方差矩陣間的最小差距值;模型評估是通過檢查結構方程的解是收斂、參數值與預測值是否相符、各擬合指數與界值差距等方法衡量模型擬合情況;模型修正是根據相關專業理論和參數值,以循序漸近的方式修改并確立最終模型。結構方程模型整合了路徑分析、多元回歸分析和因素分析,與傳統統計分析方法相比有以下優勢:(1)同時處理多個觀測變量和潛變量,而傳統統計方法每次只分析一對變量間的效應;(2)允許觀測變量和潛變量含有測量誤差,避免了傳統回歸分析默認誤差為零而產生的實際相關系數被低估的錯誤;(3)同時估計因子結構和因子關系,克服了傳統統計分析方法先分析因子負荷,再分析因子結構產生的不靈活問題;(4)允許包含更大彈性復雜測量模型,打破了傳統因子分析難以處理一個測量指標從屬多個因子的限制;(5)可以檢驗整個模型的擬合程度,而傳統統計方法每次只估計一個路徑關系的方式無法計算整個模型與觀測數據的擬合程度(邱皓政、林碧芳2019)。LISREL結構方程模型默認采用極大似然法估計模型參數,找到樣本協方差矩陣與結構方程再生矩陣間差距最小的參數(即擬合函數),在探討多變量因果關系上優勢顯著。

盡管LISREL結構方程建模相比傳統統計方法有諸多優勢,可以更好地處理復雜模型的數據分析,但遺憾的是,由于諸多語言研究者對數據統計存在畏懼感,加上LISREL軟件語法界面相對復雜,LISREL在我國語言研究領域的應用還比較欠缺。因此,本文通過外語測試實例,詳細介紹LISREL結構方程模型在語言研究中的具體應用,為更多語言研究者了解和掌握這種功能強大的數據建模分析方法提供參考。

3 LISREL結構方程模型的語言研究應用

3.1 驗證性性因子分析

因子分析(factoranalysis,又稱因素分析)指從一組觀測變量中提取具有代表性的共性因子(即潛變量)的統計方法,在社會科學研究中有廣泛的應用。例如,通過外語學習者課堂發言次數、作業完成情況及課外學習時間等觀測變量抽取是否存在學習積極性這一潛在變量。因子分析方法包括探索性因子分析(exploratory factor analyses,簡稱CFA)和驗證性因子分析(confirmatory factor analysis,簡稱EFA)。探索性因子分析通過對觀測變量的旋轉和抽取,探索出未知的公共因子,旨在分析觀測變量所內涵的潛在因子;驗證性因子分析則是事先假設出觀測變量所內涵的公共因子,通過統計分析結果驗證假設與潛在因子從屬關系的合理性。筆者以湖南省某高校大一年級學生的三次英語測試為例,介紹LISREL驗證性因子分析在語言研究中的應用。

為了探索外語學習者英語口語、寫作和閱讀能力之間的聯系,筆者選取高校一年級非英語專業6個自然班的164名學生為受試對象,剔除無效數據,最后收集了155名學生不同時段的三次英語口語、寫作和閱讀成績(使用雅思測試題,每次測試時長、題型、題量和難度等同),根據研究目的和二語習得理論,建立結構方程模型如圖1左圖所示:

圖1 驗證性因子分析假設模型圖及其路徑系數

LISREL結構方程模型中,圓形代表潛變量或因子,方形代表觀測變量或指標,單向箭頭代表單向效應,雙箭頭弧形代表相關,單向箭頭指向圓形或方形表示殘差和測量誤差。圖1中,長方形內的SPK1,SPK2,SPK3分別代表三次口語成績,WRT1,WRT2,WRT3分別代表三次寫作成績,RD1,RD2,RD3分別代表三次閱讀成績;橢圓形內的SPK代表口語能力,WRT代表寫作能力,RD代表閱讀能力。該模型包含以下假設:外語學習者英語測試成績反映其口語、寫作和閱讀能力;外語學習者英語口語、寫作和閱讀能力間存在顯著性相關。LISREL默認采用極大似然法估計模型參數,前提條件是變量數據服從正態分布。用SPSS20.0檢查樣本數據正態分布情況顯示,9個變量的偏度絕對值小于3(在0.124-0.867之間),峰度絕對值小于8(在0.035-3.356之間),表明數據基本呈正態分布,滿足LISREL數據分析條件。用SPSS20.0獲得相關系數矩陣如表1所示:

表1 三次測試成績相關系數矩陣(N=155)

表1中,9個觀測變量之間均存在顯著性相關(p<0.01),表明原始觀察值適合做結構方程模型驗證性因子分析。在LISREL9.2程序窗口輸入相應程序并運行,迭代9次后輸出分析擬合指數結果如表2所示:

表2 驗證性因子分析擬合指數

表2中,擬合指數是表示樣本數據與假設模型擬合是否妥當的指數值。LISREL輸出的擬合優度指數比較多,選取哪些擬合指數作參考是一個復雜的課題,至今沒有絕對定論(侯杰泰等2004),一般認為如果至少有兩個主要擬合指數在界值內,其它擬合指數接近界值就可以接受假設模型。根據前人的研究結果和本文實際情況,筆者選擇X2(chi-square,卡方)、X2/DF(相對卡方)、RMSEA(rootmean squareerror of approximation,近似誤差均方根)、NNFI(on-normedfitindex,非范擬合指數)、CFI(comparative fitindex,比較擬合指數)和SRMR(standardized rootmeans quareresidual,標準化殘差均方根)作為參考擬合指數。本例樣本數接近150,根據溫忠麟、侯杰泰和馬什赫伯特(2004)提出的X2準則,X2P值臨界值為0.01。表2中,X2P(0.031〉0.01)、X2/DF(1.60<3)、RMSEA(0.072<0.08)、NNFI(0.97〉0.09)、CFI(0.98〉0.09)和SRMR(0.047<0.05)6個擬合指數都在建議界值范圍內。此外,LISREL輸出結果中各項修正指數均無異常顯著值,說明假設的結構方程模型合理,不需要進行模型修正。綜合各項擬合指數表現,可以認為圖1假設的方程模型與樣本數據擬合較好。LISREL輸出的模型各路徑系數如圖1右圖所示。根據Cohen(1988)的研究,相關系數大于0.5為高度相關,0.3-0.5為中等相關,小于0.3則是較低相關,模型中全部12個路徑系數均大于0.5,說明各變量間相關度較高。由此,通過LISREL因子分析結果可以驗證前面設立的英語能力關系假設成立,即外語學習者的測試成績反映其口語、寫作和閱讀能力;外語學習者英語口語、寫作和閱讀能力相互之間存在顯著性相關。該結果與前人的研究(文秋芳2006;劉文慧、陽志清2009)和實踐教學經驗相符,即在我國高等教育階段,因為寫作和閱讀教學更傾向于書面語,所以閱讀和寫作呈現高度相關(0.89);但口語與寫作和閱讀之間的高度相關(0.83,0.89)表明外語學習者對英語口語和書面語之間的區分不敏感,導致口語有較嚴重的書面語傾向。

3.2 全模型

全模型(fullmodel,又稱飽和模型)是指同時包含外源變量和內生變量的模型。筆者仍以上述實例中的樣本觀察值為例,介紹LISREL全模型分析在語言研究中的應用。

本例研究目的是在了解外語學習者英語口語、寫作和閱讀能力相關基礎上,進一步探索英語閱讀能力對口語和寫作能力的影響。根據研究目的和二語習得理論,首先建立結構方程模型如圖2左圖所示。

圖2 全模型假設模型及其路徑系數

該模型基于以下假設:外語學習者的三次測試成績反映其英語口語、寫作和閱讀能力;外語學習者英語閱讀能力對口語和寫作能力有顯著性影響。在LISREL9.2程序窗口輸入相應程序并運行,迭代15次后輸出分析擬合指數結果如表3所示:

表3 全模型分析擬合指數

表3中,X2P值(0.03〉0.01)、X2/DF(1.59<3)、RMSEA(0.071<0.08)、NNFI(0.97〉0.9)、CFI(0.98〉0.9)和SRMR(0.047<0.05)6個擬合指數都在界值范圍內。綜合各擬合指數表現,可以認為圖2所示方程模型與樣本數據擬合較好。另外輸出的分析結果中各項修正指數無異常顯著值,說明假設的結構方程模型合理,無需進行模型修正。LISREL輸出的模型各路徑系數如圖2右圖所示,模型中全部11個路徑系數都大于0.5,說明各變量間相關度較高。由此,通過LISREL全模型分析結果可以驗證之前設定的英語能力關系假設的正確性,即外語學習者的測試成績反映了其英語口語、寫作和閱讀能力;外語學習者英語閱讀能力對口語和寫作能力有顯著性影響。其中,閱讀對寫作的影響大于口語(0.93〉0.85),該結果進一步證明外語學習者的閱讀和寫作能力呈現高度相關性。同時,閱讀和口語的高度相關(0.85)也證明外語學習者不能很好地區分英語口語和書面語之間的差異。在未來外語教學中,教師應注意幫助學生意識到英語口語的書面語之間存在差異,在實際語言應用中應注意避免混淆這兩種不同的語體。

3.3 高階因子分析

高階因子分析(higher-order factoranalysis)是將分析觀測變量得到的因子作為觀測變量進一步進行因子分析的統計方法,是全模型分析的一種特殊形式。高階因子分析過程在理論上可連續進行,但由于三階因子模型已經非常龐大和復雜,在現實研究中使用三階因子及以上模型的情況比較少。需要注意的是,一階因子數量在四個或以上時建立二階因子才有簡化模型的作用。另外,在建立二階因子模型前要先檢驗變量的一階因子模型,只有一階因子間相關較強時,建立的二階模型才有意義。筆者以湖南某高校大一年級學生的三次英語測試為例,介紹LISREL二階因子分析在語言研究中的具體應用。

為了探索外語學習者英語綜合能力的具體構成情況,筆者選取高校一年級非英語專業9個自然班的293名學生為受試對象,剔除無效數據,最后收集了281名學生不同時段的三次英語口語、寫作成績和二次聽力、閱讀成績(使用雅思測試題,每次測試時長、題型、題量和難度等同)。用SPSS 20.0檢查數據正態分布情況顯示,10個變量的偏度絕對值小于3(在0.110-0.887之間),峰度絕對值小于8(在0.120-3.453之間),表明數據滿足基本呈正態分布的分析條件。首先對樣本數據進行類似圖1模型的一階驗證性因子分析,輸出結果顯示一階因子模型中各變量間呈顯著性相關(相關負荷分別為0.83,0.90,0.82,0.83,0.86,0.93),表明原始觀察值適合進行二階因子模型分析。根據研究目的和二語習得理論,建立二階因子方程模型如圖3左圖所示。

圖3 二階因子假設模型及其路徑系數

圖3中,SPK、WRT、LIS和RD分別代表外語學習者口語能力、寫作能力、聽力能力和閱讀能力,ENG代表外語學習者的英語綜合能力。該模型基于以下假設:外語學習者的考試成績反映其英語口語、寫作、聽力和閱讀能力;外語學習者英語口語、寫作、聽力和閱讀能力構成其英語綜合能力。在LISREL9.2程序窗口輸入相關程序并運行,迭代24次后輸出分析結果如表4所示:

表4 二階因子擬合指數

表4中,NNFI(0.94〉0.9)、CFI(0.96〉0.9)和SRMR(0.05=0.05)3個擬合指數均在建議界值范圍內,X2/DF=3.25略大于界值3,RMSEA=0.09接近界值0.08。本例樣本數281大于250,根據溫忠麟等(2004)的X2準則,X2P值的臨界值應為0.0005,表3中的X2P值0.00接近臨界值0.0005。第四大列中有3個擬合指數在界值內,其他指數接近界值。綜合各擬合指數表現,可以認為圖3假設的方程模型與樣本數據擬合較好。另外輸出的分析結果中各項修正指數無異常顯著值,說明假設的模型無需修正。LISREL輸出的模型各路徑系數如圖3右圖所示,模型中有13個路徑系數大于0.5,有1個介于0.3-0.5之間,說明各變量間相關度較顯著,尤其是ENG對SPK、WRT、LIS和RD的系數值都在0.8以上,說明相關性非常強。由此,通過LISREL二階因子分析結果可證明原假設成立,即外語學習者的測試成績反映了其英語口語、寫作、聽力和閱讀能力;外語學習者英語口語、寫作、聽力和閱讀能力構成其英語綜合能力。其中,聽力和閱讀作為輸入性語言能力,其相關性大于口語和寫作兩種輸出性語言能力(0.97+0.95〉0.91+0.87),這一發現與語言教學實際經驗一致。例如在雅思測試中,中國考生在寫作和口語兩項失分比較嚴重,尤其寫作部分失分現象更加突出。數據分析結果表明,在未來外語教學中,教師需兼顧語言輸入與輸出能力均衡發展,在注重聽力和閱讀兩種語言能力培養的同時,更需要加強對學生口語和寫作能力的培養。

3.4 多組驗證性因子分析

多組驗證性分析(multiplegroup sconfirmatory factoranalysis)用來驗證不同樣本的是否來自同一個總體、是否有等同的因子結構。在多組驗證性因子分析中,首先根據相關研究理論和相同測量工具(試卷、問卷等)確定一個大致可以適用于各組樣本的模型,再檢驗各組樣本間模型形態和因子負荷(LX)是否等同,在此基礎上再依次檢驗各組樣本的因子方差—協方差(PH)、測量誤差方差—協方差(TD)、指標截距(TX)、因子均值(KA)等是否等同。在檢驗過程中,如果有一組樣本或者某個步驟擬合欠佳,再做后面的檢驗就失去意義。如果各組擬合指標表現良好,并依次通過檢驗,則可以認為各組樣本擁有相同的因子結構(侯杰泰等2004)。下面以湖南某高校兩屆大一學生的三次英語測試為例,介紹LISREL多組驗證性分析在語言研究中的應用。

本例研究目的是驗證不同級別外語學習者英語口語、寫作和閱讀能力間的關系是否等同。首先選取兩屆共272名非英語專業大一學生為受試對象(人數分別為155和117),收集不同時段的三次英語口語、寫作和閱讀成績(使用雅思測試題,每次測試時長、題型、題量和難度等同)。根據研究目的和二語習得理論,建立如圖1所示驗證性因子結構方程模型。用SPSS20.0檢查兩組數據正態分布情況發現,9個變量的偏度絕對值均小于3(在0.110-0.887之間),峰度絕對值均小于8(在0.120-3.453之間),表明觀測數據基本呈正態分布。通過SPSS20.0獲得兩組樣本相關矩陣,發現除了第二組WRT2樣本有個別數據沒有呈現顯著性相關(p〉0.01),兩個樣本組的9個觀測變量之間均存在顯著性相關(p<0.01),表明原始觀測值適合做結構方程模型驗證性因子分析。

首先分析兩組模型形態是否等同。用LISREL多組設定的方法分組設定,LISREL9.2輸出的擬合指數整理結果如表5形態項所示,X2P值(0.09〉0.01)、X2/DF(1.29<3)、RMSEA(0.05<0.08)、NNFI(0.98〉0.9)和CFI(0.99〉0.9)這5項擬合指數均在界值范圍內,SRMR=0.05接近臨界值,表明兩個樣本組的模型擬合良好,兩樣本組模型形態等同,可以繼續下一步檢驗兩組模型因子負荷是否等同。

在LISREL9.2中輸入程序并運行,輸出的擬合指數如表5形態、負荷項所示,X2/DF(1.61<3)、RMSEA(0.07<0.08)、NNFI(0.96〉0.9)、CFI(0.97〉0.9)和SRMR(0.04<0.05)這5個擬合指數都在界值范圍內,只有X2P值0.002稍小于0.01。綜合各項指數表現,支持兩樣本組模型形態和因子負荷等同假設,具備進行繼續下一步檢驗條件。

在LISREL9.2中輸入程序并運行,輸出的擬合指數整理結果如表5形態、負荷、因子協方差項所示,除了X2/DF(2.5<3)、NNFI(0.91〉0.9)和CFI(0.93〉0.9)在建議值范圍內,X2P值(0.00<0.01)、RMSEA(0.096〉0.08)和SRMR(0.18〉0.05)都不太理想,但因為有3個主要擬合指數在界值范圍內,仍可以認為兩樣本組模型形態、因子負荷和部分因子相關等同,可以進一步驗證兩組樣本模型因子協方差和誤方差等同情況。

在LISREL9.2中輸入程序并運行,輸出的擬合指數整理結果如表5形態、負荷、因子協方差、誤方差項所示,可以看到檢驗結果與預期相符,兩個樣本組的模型擬合程度大幅度惡化,其中X2值增大了318.18,X2P值(0.0)、X2/DF(6.71)、RMSEA(0.219)、NNFI(0.65)、CFI(0.66)和SRMR(0.22)都遠離界值,檢驗結果不支持等同假設成立。

表5 多組驗證性因子分析擬合指數

綜上,LISREL多組驗證性因子分析結果表明,兩屆大一學生樣本組只在模型形態、因子負荷和部分因子間相關上存在等同關系。這個結果說明在外語學習中,在教學環境等基本等同條件下,不同屆的學生語言能力在總體上呈現共性特征,但在測量誤差方差—協方差、指標截距、因子均值等方面存在差異。研究表明不同屆學生之間存在共性和個性差異,教師在教學過程中要從學生的實際情況出發,根據教學環境和學生認知學習特征調整教學方式。

4 結語

基于結構方程模型的統計原理,本文采用LISREL9.2軟件,通過教學實例證實了結構方程模型在語言教學驗證性因子分析、全模型分析、高階因子分析和多組驗證性分析中的具體應用,證實LISREL結構方程模型在探索語言研究多變量關系方面具有應用優勢,為結構方程模型在語言研究中的應用提供實證依據。而本研究的局限在于僅考察了結構方程模型在課堂環境下語言習得中的應用,后續研究可加入課外環境下和諸如學習動機、學習時間、家庭影響等因素,為結構方程模型在語言研究領域更大范圍內的應用提供參考。

雖然LISREL結構方程模型比傳統統計方法有諸多優勢,但結構方程模型在語言研究中的應用首先要基于堅實的理論基礎和詳實的前期研究成果才有意義,如果結構方程模型應用不當,不僅影響數據分析的信度和效度,而且可能產生錯誤結果誤導理論構建或研究結果的實踐應用(Ockey&Choi2015)。此外,進行結構方程模型數據分析要先審查樣本數據質量是否達到數據分析標準,并根據檢驗結果和相關理論決定是否進行模型修正。相信隨著量化研究在語言學領域的不斷深入發展,LISREL結構方程模型統計分析會在我國語言研究中得到越來越廣泛的應用。

猜你喜歡
英語口語外語方程
方程的再認識
方程(組)的由來
英語口語課中“以學生為中心”教學模式的應用
圓的方程
小學英語口語教學研究
外語教育:“高大上”+“接地氣”
大山教你學外語
大山教你學外語
淺談加強高中英語口語教學
多變的我
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合